202 116 6MB
German Pages VII, 488 [494] Year 2020
Grundstudium Mathematik
Christoph Luchsinger Hans Heiner Storrer
Einführung in die mathematische Behandlung der Naturwissenschaften I Analysis 4. Auflage
Grundstudium Mathematik
Christoph Luchsinger • Hans Heiner Storrer
Einführung in die mathematische Behandlung der Naturwissenschaften I Analysis 4. Auflage
Christoph Luchsinger Institut für Mathematik Universität Zürich Zürich, Schweiz
Hans Heiner Storrer Zürich, Schweiz
ISSN 2504-3641 ISSN 2504-3668 (electronic) Grundstudium Mathematik ISBN 978-3-030-40157-3 ISBN 978-3-030-40158-0 (eBook) https://doi.org/10.1007/978-3-030-40158-0 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Birkhäuser © Springer Nature Switzerland AG 1986, 1989, 1992, 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Birkhäuser ist ein Imprint der eingetragenen Gesellschaft Springer Nature Switzerland AG und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Gewerbestrasse 11, 6330 Cham, Switzerland
VORWORT Das Lehrbuch “Einf¨ uhrung in die mathematische Behandlung der Naturwissenschaften I - Analysis” ist das erste von zwei B¨ uchern, welche seit Jahrzehnten an der Universit¨ at Z¨ urich zur Ausbildung von Naturwissenschaftlern eingesetzt werden. Inhaltlich deckt es die notwendigen Themen der Analysis f¨ ur die Naturwissenschaften und mehr ab: Vektoren, Ableitung, Integral, Differentialgleichungen, Ausbau der Infinitesimalrechnung, Funktionen von mehreren Variablen. Das Buch hilft, die schwierige ¨ Ubergangsphase vom Gymnasium zum Studium zu meistern: Studierende, die erst nach einer l¨angeren Pause das Studium beginnen, k¨onnen sich hier individuell auf das Stuuckendium vorbereiten. Das Buch dient in dieser Phase auch als Grundlage f¨ ur Br¨ und Vorbereitungskurse. Weiter schafft das Buch im ersten Jahr des Studiums eine gemeinsame Basis von notwendigem Wissen, auf dem dann weitere Vorlesungen aufbauen. Im Anhang werden zudem die wichtigsten Grundbegriffe aus dem Gymnasium nochmals repetiert. Das Buch hat den Anspruch, mathematisch exakt zu sein. Auf formal-mathematische Beweise wurde aber meist verzichtet. Dem Verst¨ andnis dienen viele Erl¨ uhrlich vorgerechnete Beispiele aus vielen auterungen und anschauliche, ausf¨ Anwendungsbereichen und Aufgaben mit L¨osungen hinten im Buch. Das Buch wurde ¨ undige Vorlesung (etwa 56 Vorlesungsstunden plus Ubungsf¨ ur eine einsemestrige, 4 st¨ lektionen) konzipiert. Es l¨asst Raum f¨ ur eine eigene Schwerpunktbildung und weitere Themen aus einem speziellen Anwendungsgebiet. Geplant ist auch eine englische Version, womit international ausgerichtete Univer¨ anbieten k¨onnen. Auf aten den internationalen Studierenden eine 1:1 Ubersetzung sit¨ ur die der Website www.storrer.org findet man zur kostenlosen Verwendung ein Skript f¨ ¨ Vorlesung mit L¨ ullt f¨ ucken (ausgef¨ ur Dozierende anforderbar), ein Ubungsskript f¨ ur ¨ ur diesen ersten Band und die Fortsetzung und weiteres Material f¨ die Ubungsstunde “Einf¨ uhrung in die mathematische Behandlung der Naturwissenschaften II - Wahrscheinlichkeitsrechnung und Statistik, mit R”. Der gr¨osste Teil des jetzt vorliegenden Buches wurde von Professor H.H. Storrer ahriger Professor an der Universit¨at Z¨ urich, verfasst. Wir danken der (1939-2017), langj¨ Familie von Professor Storrer, dass sie uns erlauben, dieses Buch weiter herauszugeben. at Z¨ Christoph Luchsinger studierte und doktorierte an der Universit¨ urich, gr¨ undete die Stellenb¨ orsen www.math-jobs.com und www.acad.jobs und liest seit Jahren diese urich. Frau Abigail Sutton danken wir f¨ ur die Erstellung Vorlesung an der Universit¨at Z¨ der Graphiken. urich, im Juli 2019 Z¨
Christoph Luchsinger
INHALTSVERZEICHNIS A. VEKTORRECHNUNG 1. Vektoren und ihre geometrische Bedeutung 2. Vektorrechnung mit Koordinaten
1 24
B. DIFFERENTIALRECHNUNG 3. 4. 5. 6. 7. 8.
Beispiele zum Begriff der Ableitung Die Ableitung Technik des Differenzierens Anwendungen der Ableitung Linearisierung und das Differential Die Ableitung einer Vektorfunktion
42 52 66 79 101 116
C. INTEGRALRECHNUNG 9. 10. 11. 12. 13. 14.
Einleitende Beispiele zum Begriff des Integrals Das bestimmte Integral Der Hauptsatz der Differential- und Integralrechnung Stammfunktionen und das unbestimmte Integral Weitere Integrationsmethoden Integration von Vektorfunktionen
133 141 154 162 175 190
D. DIFFERENTIALGLEICHUNGEN 15. Der Begriff der Differentialgleichung 16. Einige L¨osungsmethoden
207 222
E. AUSBAU DER INFINITESIMALRECHNUNG 17. 18. 19. 20. 21.
Umkehrfunktionen Einige wichtige Funktionen und ihre Anwendungen Potenzreihen Uneigentliche Integrale Numerische Methoden
249 264 287 314 322
F. FUNKTIONEN VON MEHREREN VARIABLEN 22. 23. 24. 25.
Allgemeines u ¨ber Funktionen von mehreren Variablen Differentialrechnung von Funktionen von mehreren Variablen Das totale Differential Mehrdimensionale Integrale
334 349 377 392
G. ANHANG 26. Zusammenstellung einiger Grundbegriffe 27. Einige Erg¨anzungen 28. L¨osungen der Aufgaben Sachverzeichnis
401 422 434 484
1
A. VEKTORRECHNUNG 1. VEKTOREN UND IHRE GEOMETRISCHE BEDEUTUNG ¨ (1.1) Uberblick Vektoren dienen dazu, Merkmale zu beschreiben, bei denen es nicht nur auf die Gr¨ osse (dargestellt durch eine Zahl), sondern auch auf die Richtung ankommt. Sie lassen sich anschaulich als “gerichtete Strecken” im Raum auffassen. Man unterscheidet dabei • Ortsvektoren, welche Merkmale beschreiben, bei denen Gr¨osse, Richtung und Anfangspunkt von Belang sind, und • freie Vektoren, welche Merkmale darstellen, bei denen nur Gr¨osse und Richtung eine Rolle spielen. Vektoren werden erst dann richtig n¨ utzlich, wenn man mit ihnen rechnen kann. In diesem Kapitel definieren wir deshalb unter anderem • Addition von Vektoren, • Skalarprodukt von Vektoren, • Vektorprodukt von Vektoren und geben jeweils die zugeh¨ origen Rechenregeln an.
(1.3.a) (1.3.b)
(1.6) (1.8) (1.9)
Diese Rechenoperationen erm¨oglichen es, viele Aussagen aus der Mathematik und aus den Naturwissenschaften (vor allem aus der Physik) in pr¨ agnanter Weise mit Vektoren formelm¨ assig zu beschreiben. Vektoren und Rechenoperationen werden in diesem Kapitel rein geometrisch definiert. Erst im Kapitel 2 wird dann gezeigt, wie sich Vektoren und Rechenoperationen auch durch Zahlen darstellen lassen. Zweck dieser Trennung in zwei Teile ist es, Ihnen die eigenst¨andige Bedeutung der geometrischen Definitionen vor Augen zu f¨ uhren.
(1.2) Einleitende Beispiele Sowohl im wissenschaftlichen Bereich als auch im t¨ aglichen Leben hat man es h¨aufig mit Gr¨ossen zu tun, die durch die Angabe einer Zahl (sowie der zugeh¨ origen Masseinheit) vollst¨andig beschrieben werden. Wir nennen einige willk¨ urliche Beispiele:
© Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0_1
1. Vektoren und ihre geometrische Bedeutung
2
• • • • •
Preis einer Ware (in Fr.), L¨ange einer Strecke (in cm), K¨orpertemperatur (in ◦ C), Frequenz eines Radiosenders (in MHz), Einwohnerzahl einer Stadt (reine Zahl, ohne Masseinheit).
ossen, die durch die Angabe einer einzigen Zahl noch Daneben gibt es aber auch Gr¨ andig bestimmt sind. Dazu geh¨oren alle jene Merkmale, bei denen es auch nicht vollst¨ auf die Richtung ankommt. Auch hier geben wir einige Beispiele, die wir aber etwas uhrlicher diskutieren wollen: ausf¨ a) In der Alltagssprache wird die Geschwindigkeit eines Fahrzeugs in einem bestimmten Zeitpunkt einfach als eine Zahl (zusammen mit einer Masseinheit, wie etwa km/h) angegeben. Die Richtung, in der sich das Fahrzeug bewegt, geht aus dieser Angabe nicht hervor; sie wird als gegeben angenommen. andigen Angabe der Bewegung des Fahrzeugs ist indessen auch seine BeZur vollst¨ wegungsrichtung wichtig; man muss etwa sagen: Das Fahrzeug bewegt sich zur Zeit mit 60 km/h Richtung Nordosten. (Genau genommen ist auch diese Angabe usste zus¨ atzlich erw¨ ahnt werden, welches die Abweinoch nicht vollst¨andig. Es m¨ chung von der Horizontalen ist. Bei einem Flugzeug w¨ are dies offensichtlich von Bedeutung.) Man kann nun diesen Sachverhalt veranschaulichen, indem man die Geschwindigange keit durch eine gerichtete Strecke (einen “Pfeil”) im Raum beschreibt, deren L¨ osse der Geschwindigkeit ist und deren Richtung mit der Beweur die Gr¨ ein Mass f¨ gungsrichtung des Fahrzeugs u ¨bereinstimmt. Die nachstehende Skizze verdeutlicht die Situation*. Richtung
Mass f¨ ur Schnelligkeit
Eine solche gerichtete Strecke nennt man einen Vektor, in diesem konkreten Fall den Geschwindigkeitsvektordes Fahrzeugs im betrachteten Zeitpunkt. Die Geschwindigkeit ist also in der Physik — in Abweichung vom allt¨ aglichen Sprachgebrauch — nicht eine Zahl, sondern ein Vektor. Ihr Betrag (die “Geschwindigkeit” der Alltagssprache, z.B. 60 km/h) wird zur Unterscheidung oft “Schnelligkeit” genannt.
* Hier und im folgenden sind die Skizzen naturgem¨ass zweidimensional; in Wirklichkeit m¨ussen Sie sich die Vektoren im dreidimensionalen Raum denken.
1.2 Einleitende Beispiele
3
b) Die an einem Massenpunkt angreifende Kraft wird ebenfalls durch einen Vektor, den Kraftvektor, beschrieben. Seine L¨ osse der Kraft, ange ist ein Mass f¨ ur die Gr¨ allt mit der Richtung der Kraft die in Newton (N) gemessen wird, seine Richtung f¨ zusammen:
c) Auch die Angabe der Lage eines Punkts im Raum in Bezug auf einen festen Ausgangspunkt kann durch einen Vektor geschehen: W¨ ahlen wir als Nullpunkt — wie im Koordinatensystem der Landestopographie u ¨blich — die Sternwarte Bern, so ist (als willk¨ urliches Beispiel) Zizers GR 162 km ¨ostlich von diesem Punkt gelegen (dazu kommt ein H¨ohenunterschied von einigen Metern, der f¨ ur unsere Skizze vernachl¨assigt sei):
B
Z
d) Als letztes Beispiel geben wir noch eine innermathematische Anwendung an: Unter einer Translation versteht man eine Abbildung des Raumes in sich, bei der jeder Punkt um eine feste Distanz in einer gegebenen Richtung verschoben wird:
Eine solche Translation wird ebenfalls durch einen Vektor, den Translationsvektor, beschrieben. Bevor wir zur allgemeinen Definition kommen, sehen wir uns die obigen Beispiele nochmals an. Wir stellen dabei fest, dass je nach der gew¨ unschten Anwendung zwei
1. Vektoren und ihre geometrische Bedeutung
4
Varianten des Vektorbegriffs auftreten: (i) Will man mit einem Vektor eine Kraft (1.2.b) oder die Lage eines Punktes im Raum (1.2.c) beschreiben, so ist neben Richtung und L¨ange auch der Anfangspunkt des Vektors wichtig: Bei einer Kraft kommt es darauf an, wo sie angreift, und es ist urich liegt. auch nicht dasselbe, ob ein Ort 162 km o¨stlich von Bern oder von Z¨ Immer wenn der Anfangspunkt eines Vektors von Bedeutung ist, spricht man von einem “Ortsvektor” (oder von einem “gebundenen Vektor”). Das zweitgenannte Beispiel macht den Namen “Ortsvektor” besonders plausibel. (ii) In den beiden andern Beispielen dagegen ist der Anfangspunkt des Vektors irrelevant: • Die Geschwindigkeit eines Fahrzeugs (1.2.a) ist durch ihren Betrag (60 km/h) und ihre Richtung (NE) vollst¨andig festgelegt. ur eine Translation des Raumes oder der Ebene: In (1.2.d) • Entsprechendes gilt f¨ stellt jeder der vier eingezeichneten Pfeile dieselbe Verschiebung dar. osse durch Richtung und L¨ In diesen beiden F¨allen ist die zu beschreibende Gr¨ ange vollst¨ andig bestimmt, der Anfangspunkt spielt keine Rolle. Man spricht hier von einem “freien Vektor”. (1.3) Der Begriff des Vektors Gest¨ utzt auf die obigen Beispiele definieren wir Ortsvektoren und freie Vektoren allgemein: a) Ortsvektoren Unter einem Ortsvektor v versteht man eine gerichtete Strecke im dreidimensionalen Raum. “Gerichtet” bedeutet dabei, dass der eine der beiden Begrenzungspunkte der Strecke als Anfangspunkt P , der andere als Endpunkt Q festgelegt ist. Q P Da diese beiden Punkte den Ortsvektor v vollst¨ andig beschreiben, kann man v auch als geordnetes Paar von Punkten interpretieren. Will man Anfangs- und Endpunkt effektiv angeben, so schreibt man −−→ v = P Q . −−→ Die L¨ ange der Strecke P Q heisst Betrag (oder L¨ ange) des Ortsvektors v = P Q. Dieser Betrag wird mit |v |
1.3 Der Begriff des Vektors
5
bezeichnet. Da eine L¨ ange nie negativ sein kann, gilt stets |v | ≥ 0. Wenn beispielsweise v eine Geschwindigkeit darstellt, dann ist |v | die “Schnelligkeit” (vgl. den Schluss von (1.2.a)). b) Freie Vektoren Da es bei einem freien Vektor (z.B. bei einer Translation) nicht auf den Anfangspunkt ankommt, ist der “Pfeil”, der den gew¨ unschten Sachverhalt darstellt, nicht eindeutig festgelegt. Vielmehr beschreiben alle Ortsvektoren, welche dieselbe Richtung und denselben Betrag haben, unabh¨angig von ihrem Anfangspunkt dieselbe Situation. Beispielsweise stellen alle folgenden Pfeile dieselbe Translation dar.
Um dieser “Gleichberechtigung” Ausdruck zu verleihen, versteht man nun unter einem freien Vektor die Menge aller Ortsvektoren, die zueinander parallel und gleichgerichtet sind und gleichen Betrag haben. Anders ausgedr¨ uckt: Zwei Ortsvektoren geh¨oren genau dann zum selben freien Vektor, wenn sie durch Parallelverschiebung auseinander hervorgehen. Aus praktischen Gr¨ unden stellt man einen freien Vektor nicht dadurch dar, dass man (wie etwa in der obigen Skizze) viele zueinander parallele Pfeile zeichnet. Man beschr¨ankt sich vielmehr darauf, einen beliebigen dieser Pfeile anzugeben, der gewissermassen alle u ¨brigen vertritt. Welchen Vertreter man ausw¨ahlt, ist unwesentlich; man passt die Auswahl dem Problem an. Unter dem Betrag eines freien Vektors versteht man selbstverst¨andlich den Betrag eines Vertreters dieses freien Vektors. Von nun an wollen wir Ortsvektoren stets als solche bezeichnen (wobei der Anfangspunkt P angegeben werden oder aus dem Zusammenhang ersichtlich sein muss). Unter einem Vektor (ohne weitere Pr¨azisierung) werden wir stets einen freien Vektor, bzw. in der Praxis immer irgendeinen Vertreter dieses freien Vektors verstehen. Es ist dann ohne weiteres gestattet, im Verlauf einer Rechnung einen andern Vertreter desselben (freien) Vektors zu w¨ahlen. Diese beiden Vertreter gehen durch Parallelverschiebung auseinander hervor. Man sagt dann kurz, aber ungenau, dass diese beiden Vektoren gleich seien. Die genaue Aussage w¨are: Die beiden vertreten denselben freien Vektor. (In diesem Sinn sind also alle in der obigen Skizze eingezeichneten Vektoren gleich.) Mit anderen Worten: Vektoren (es sei wiederholt: als Vertreter von freien Vektoren) d¨ urfen beliebig parallel verschoben werden, Ortsvektoren dagegen nicht, da deren Anfangspunkt fest gegeben ist.
1. Vektoren und ihre geometrische Bedeutung
6
c) Zusammenfassung Ortsvektor:
Freier Vektor:
einzelner “Pfeil”
Menge von “Pfeilen”
Symbolisiert – Richtung – Betrag – Anfangspunkt
Symbolisiert – Richtung – Betrag
Schliesslich sei noch erw¨ahnt, dass die Bezeichung v sowohl f¨ ur Orts- als auch f¨ ur freie Vektoren gebraucht wird; der Zusammenhang wird stets klarstellen, was gemeint ist. In der kurzen Notation v geht zwar der Bezug zum Anfangspunkt verloren, aber dieser ist im haupts¨achlich betrachteten Fall der freien Vektoren ohnehin irrelevant. (1.4) Der Nullvektor Ein Ortsvektor, dessen Anfangs- und Endpunkt zusammenfallen, heisst Nullvektor. Er hat den Betrag 0 und keine Richtung, ist also gewissermassen ein zu einem Punkt zusammengeschrumpfter Vektor. Der “freie Nullvektor” besteht in diesem Sinne aus allen Punkten des Raumes: P Q −−→ −−→ Die verschiedenen Vertreter (P P , QQ) etc. werden wie oben erl¨autert als gleich aufgefasst und mit dem einheitlichen Symbol 0 bezeichnet. (1.5) Allgemeines zum Rechnen mit Vektoren Wie wir gesehen haben, k¨ onnen Vektoren dazu verwendet werden, naturwissenschaftliche Begriffe wie “Geschwindigkeit” oder “Kraft” zu beschreiben. Um aber die Gesetze formulieren zu k¨onnen, welchen diese Begriffe gehorchen, muss man mit Vektoren rechnen k¨ onnen. Wir werden deshalb in den n¨achsten Abschnitten Rechenoperationen f¨ ur Vektoren einf¨ uhren und in sp¨ ateren Kapiteln (8 und 14) auch einiges u ¨ber die Differential- und Integralrechnung f¨ ur Vektoren sagen.
1.6 Addition und Subtraktion von Vektoren
7
Als erstes werden wir erkl¨ aren, wie man Vektoren addiert. Entsprechend unserer geometrischen Definition des Vektorbegriffs wird auch die Addition mittels einer uhrt. geometrischen Konstruktion durchgef¨ ussen Sie sich zum vorneherein im Klaren Um falsche Vorstellungen zu vermeiden, m¨ sein, dass die Addition von Vektoren wenigstens zun¨achst nichts mit der allt¨aglichen Addition von Zahlen zu tun hat, obwohl derselbe Name (“Addition”) und dasselbe Zeichen (+) verwendet werden. Es handelt sich vielmehr um eine neuartige Rechenoperation f¨ ur neuartige, von Zahlen verschiedene mathematische Objekte, eben f¨ ur Vektoren. Allerdings werden wir bald Parallelen und Analogien feststellen, welche die Verwendung des Namens “Addition” rechtfertigen. So gelten dieselben Grundregeln wie ur die Addition gew¨ohnlicher Zahlen (vgl. (1.6.d)), und in (2.4) werden wir sehen, dass f¨ man rechnerisch die Addition von Vektoren auf die Addition von Zahlen zur¨ uckf¨ uhren kann. Was das Produkt anbelangt, so werden wir zwei verschiedene Produkte von Vektouhren. Auch diese Definitionen sind von geometrischer Natur. ren einf¨ Alle diese geometrischen Konstruktionen und Definitionen sind von grosser anur die schaulicher Bedeutung, sind sie doch Vorg¨ angen aus der Natur nachgebildet. F¨ uhrung von Rechnungen ist es aber wesentlich, dass man nicht nur praktische Durchf¨ assig mit Vektoren umgehen kann. Wie dies vor geometrisch, sondern auch zahlenm¨ sich geht, wird in Kapitel 2 gezeigt. Diese Aufteilung auf zwei Kapitel hat zum Zweck, den anschaulich-naturwissenschaftlichen Gehalt der Vektorrechnung deutlich vom rein rechnerischen Teil abzutrennen. (1.6) Addition und Subtraktion von Vektoren a) Motivation Experimente ergeben, dass sich Kr¨afte und Geschwindigkeiten nach dem sogenannten “Parallelogrammgesetz” “addieren”. (i) Parallelogramm der Kr¨ afte:
1. Kraft
2. Kraft
Resultierende (ii) Ein Flugzeug habe relativ zur Luft die Geschwindigkeit v (true airspeed TAS), die Luft habe relativ zum Boden die Geschwindigkeit w. Die Geschwindigkeit r des
1. Vektoren und ihre geometrische Bedeutung
8
Flugzeugs relativ zum Boden l¨asst sich dann aus der folgenden Zeichnung ablesen: v w r (iii) Aehnliches gilt in der Geometrie f¨ ur Translationen: Eine Verschiebung um u, gefolgt von einer Verschiebung um v ist gleichbedeutend mit einer Verschiebung um w, gem¨ ass folgender Skizze: u v w b) Definition der Addition Gest¨ utzt auf die obigen Beispiele (zun¨achst auf (ii) und (iii), der Fall (i) wird anschliessend auch noch zu seinem Recht kommen) definiert man die Addition von Vektoren wie folgt: Es seien a und b zwei (freie) Vektoren. Man w¨ahlt einen beliebigen Vertreter von a aus und schliesst an seinen Endpunkt P jenen Vertreter von b an, dessen Anfangspunkt gleich P ist.
a + b
b P
a Unter dem Summenvektor a + b von a und b versteht man nun den Vektor, der in dieser Situation vom Anfangspunkt von a zum Endpunkt von b f¨ uhrt, bzw. (da es sich um freie Vektoren handelt) jeden dazu parallelen (und gleichgerichteten) Vektor. In der obigen Konstruktion haben a und a + b denselben Anfangspunkt, b dagegen ist verschoben. Die folgende Variante, die dem Kr¨afteparallelogramm abgeguckt ist und
9
1.6 Addition und Subtraktion von Vektoren
nat¨ urlich dasselbe Resultat liefert, verwendet nur Ortsvektoren mit Anfangspunkt O. −−→ −−→ Es seien a = OP , b = OQ zwei Vektoren. Dann ist −−→ a + b = OR, wo R der 4. Eckpunkt des Parallelogramms* mit den weiteren Ecken O, P, Q ist: R Q a + b b P a O c) Der entgegengesetzte Vektor Ein Fahrzeug habe eine bestimmte Geschwindigkeit v ; beispielsweise soll es sich mit 60 km/h in Richtung Nordosten bewegen. Es ist nun anschaulich klar, wann ein anderes Fahrzeug die “entgegengesetzte Geschwindigkeit” haben wird. Dies ist dann der Fall, wenn es sich mit 60 km/h in Richtung S¨ udwesten bewegt. Diese entgegengesetzte Geschwindigkeit bezeichnet man mit −v . Analog kann man von der zu F entgegengesetzten Kraft −F sprechen. Wenn F den Betrag von 10 N hat und vertikal nach unten gerichtet ist, dann hat −F denselben Betrag und ist vertikal nach oben gerichtet. Allgemein definiert man den zu a entgegengesetzten Vektor −a als den Vektor, der dieselbe L¨ange wie a, aber die entgegengesetzte Richtung hat: −−→ Q a = P Q P −−→ −a = QP Q P (Bei freien Vektoren ist noch eine beliebige Parallelverschiebung gestattet.) Aufgrund der Definition der Vektoraddition ist dann sofort klar, dass a + (−a) = 0
und
(−a) + a = 0
ist. * Dieses Parallelogramm kann auch “ausgeartet” sein, n¨amlich dann, wenn a und b gleiche oder entgegengesetzte Richtung haben. In diesem Fall ist sinngem¨ ass vorzugehen.
1. Vektoren und ihre geometrische Bedeutung
10
allen eine ganz anschauliche Bedeutung: Diese Beziehung hat in konkreten F¨ • Zwei entgegengesetzte Kr¨ afte heben sich auf (vgl. Beispiel (i), der Nullvektor ist dahingehend zu interpretieren, dass keine Kraft wirkt). • Aehnlich kann Beispiel (ii) interpretiert werden: Ist die Geschwindigkeit w der Luft relativ zum ur r, die Boden gleich −v , wo v die Geschwindigkeit des Flugzeugs relativ zur Luft ist, so gilt f¨ Geschwindigkeit des Flugzeugs relativ zum Boden r = v + (−v ) = 0, was bedeutet, dass das Flugzeug sich relativ zum Boden gar nicht bewegt (unangenehm f¨ ur die Passagiere).
d) Rechenregeln f¨ ur die Addition von Vektoren Die so definierte Addition von Vektoren erf¨ ullt nun genau die gleichen Grundregeln wie die Addition von Zahlen, n¨amlich: (1) a + b = b + a, f¨ ur alle Vektoren a, b. (2) (a + b) + c = a + (b + c), f¨ ur alle Vektoren a, b, c. (3) Es gibt ein Neutralelement bez¨ uglich der Addition, n¨amlich den Nullvektor 0, der die folgende Eigenschaft hat: a + 0 = 0 + a = a, f¨ ur alle Vektoren a. (4) Zu jedem Vektor a gibt es den entgegengesetzten Vektor −a, der die folgende Eigenschaft hat: a + (−a) = 0 (und analog (−a) + a = 0). Kommentare 1) Regel (1) ist das Kommutativ-, Regel (2) das Assoziativgesetz. 2) Weil diese Regeln v¨ ollig analog zu den Rechenregeln f¨ ur die Addition von gew¨ohnlichen Zahlen sind, darf man mit Vektoren in Bezug auf die Addition (und auch auf die weiter unten in e) definierte Subtraktion) genauso rechnen, wie man es f¨ ur Zahlen gewohnt ist. ¨ 3) Die Ubereinstimmung der Regeln f¨ ur Vektoren mit jenen f¨ ur Zahlen ist nat¨ urlich noch kein Beweis f¨ ur deren Richtigkeit. Vielmehr m¨ ussen sie unter Verwendung der geometrischen Definition begr¨ undet werden. Die Regeln (1) und (2) entnimmt man den beiden folgenden Skizzen (jene f¨ ur (2) m¨ ussen Sie sich r¨ aumlich — dreidimensional — vorstellen). (3) ergibt sich sofort aus der Definition des Nullvektors (1.4), w¨ ahrend (4) bereits weiter oben erw¨ ahnt wurde. 4) Schliesslich sei noch darauf hingewiesen, dass im allgemeinen der Betrag einer Summe von Vektoren verschieden von der Summe der Betr¨ age ist: |a + b| = |a| + |b|. Wie man der geometrischen Definition sofort entnimmt, gilt aber die sogenannte Dreiecksungleichung |a + b| ≤ |a| + |b|, vgl. auch (26.8).
11
1.6 Addition und Subtraktion von Vektoren
c
) b + c ( a + c b) + + a =(
b +
a c
b
a a +
b+
a + b
=
b
b
b
a a e) Subtraktion von Vektoren Die Differenz von Vektoren wird unter Verwendung bereits bekannter Begriffe definiert. Wir setzen n¨amlich in Analogie zum Rechnen mit Zahlen a − b := a + (−b) . In der folgenden Skizze ist diese Definition mit Ortsvektoren (Anfangspunkt O) nachvollzogen worden: a − b a b
−b
Etwas einfacher sieht die geometrische Interpretation f¨ ur freie Vektoren aus, wo wir a −b parallel verschieben d¨ urfen. Wir bringen a −b im Endpunkt von b an und erhalten folgendes Bild: a − b
a
b Es lohnt sich, den Sachverhalt in einem S¨atzchen festzuhalten: a − b ist der Vektor, der vom Endpunkt von b zum Endpunkt von a geht (beachten Sie die Reihenfolge!), wobei a und b denselben Anfangspunkt haben m¨ ussen.
1. Vektoren und ihre geometrische Bedeutung
12
(1.7) Multiplikation eines Vektors mit einem Skalar Wir geben zuerst ein Motivation f¨ ur die nachstehende Definition. Wenn der Vektor v eine Geschwindigkeit eines K¨ orpers K darstellt, so wird die doppelte Geschwindigkeit 2v durch einen Vektor beschrieben, der dieselbe Richtung wie v , aber die doppelte L¨ange hat. Auch die Multiplikation eines Geschwindigkeitsvektors mit einer negativen Zahl macht Sinn, wenn man das Minuszeichen als Richtungsumkehr auffasst: Der Vektor −0.5v stellt die Geschwindigkeit eines K¨orpers dar, der sich entgegengesetzt zu K und mit halber “Schnelligkeit” bewegt. Nun zur allgemeinen Beschreibung: Es sei also r ∈ R (diese Bezeichnungen werden in (26.2) und (26.3) erl¨ autert) ein Skalar* , a sei ein Vektor. Wir definieren jetzt den Vektor ra und unterscheiden dazu drei F¨alle: • r > 0 : Hier ist ra der Vektor, welcher dieselbe Richtung wie a hat und dessen Betrag das r–fache des Betrags von a ist: |ra| = r|a| . • r = 0 : ra = 0a wird als Nullvektor definiert: 0a := 0 . • r < 0 : Hier ist ra der Vektor, welcher die entgegengesetzte Richtung von a hat und dessen Betrag das |r|–fache des Betrags von a ist: |ra| = |r||a| = (−r)|a| . Der Betrag |r| wird in (26.8) erl¨ autert.
b
a 2a
− 13b
Der Vektor ra heisst auch Vielfaches von a. Die eben festgelegte Multiplikation eines Vektors mit einer Zahl gen¨ ugt den folgenden Rechenregeln, die sich ohne grosse M¨ uhe geometrisch beweisen liessen. Die erste Formel beispielsweise folgt sofort aus dem Strahlensatz, wie Sie anhand einer Skizze feststellen k¨ onnen.
* Reelle Zahlen, die im Zusammenhang mit Vektoren auftreten, werden zur Verdeutlichung oft Skalare genannt.
13
1.8 Das Skalarprodukt (englisch: dot product, scalar product, inner product)
r(a + b) = ra + rb (r + s)a = ra + sa r(sa) = (rs)a 1a = a (−1)a = −a f¨ ur alle Vektoren a, b und alle Skalare r, s. Ein Vektor wird Einheitsvektor genannt, wenn er den Betrag 1 hat. Jeder Vektor a = 0 kann mittels Division durch |a| (d.h. durch Multiplikation mit dem Inversen der Zahl |a|) zu einem Einheitsvektor a1 gemacht werden: a1 :=
1 a |a|
ist ein Einheitsvektor, denn
1 1 |a1 | = a = |a| = 1 . |a| |a|
(1.8) Das Skalarprodukt (englisch: dot product, scalar product, inner product) a) Eine Motivation aus der Physik L¨ angs einer Geraden bewegt sich ein Massenpunkt, auf den eine zur Fortbewegungsrichtung parallele konstante Kraft wirkt. Weg Kraft Die geleistete Arbeit wird in diesem Fall durch die Formel Arbeit := Kraft mal zur¨ uckgelegter Weg definiert. Vom gymnasialen Physikunterricht ist hierzu die Formel W = F s bekannt, wobei allenfalls korrekterweise Vektoren zum Einsatz kommen sollten. Diese Formel gilt aber nicht mehr im allgemeineren Fall, wenn die Kraft nicht parallel zur Fortbewegungsrichtung wirkt. Um dies formelm¨assig korrekt zu erfassen, betrachten wir zuerst das folgende rechtwinklige Dreieck. Es gilt cos ϕ = Fu , also u = F cos ϕ. Damit sind wir vorbereitet, die allgemeinere Formel herzuleiten:
F ·
ϕ u
F = Kraft. F ϕ
s
s = gerichtete Strecke, welche der Massenpunkt zur¨ uckgelegt hat.
1. Vektoren und ihre geometrische Bedeutung
14
Hier wirkt nicht mehr der volle Betrag |F | der Kraft, sondern nur noch der Betrag ihrer Projektion auf die Richtung des Vektors s. Da diese Projektion den Betrag |F | cos ϕ hat, gilt f¨ ur die geleistete Arbeit W : W = Weg mal “projizierte Kraft” = |s| |F | cos ϕ . Beachten Sie dabei, dass s und F Vektoren sind, dass aber die Arbeit W ein Skalar ist. Es sei ferner darauf hingewiesen, dass cos ϕ f¨ ur π2 < ϕ < 3π 2 negativ ist. Dies hat zur Folge, dass W positiv oder negativ wird, je nachdem, ob die Projektion von F in die Richtung von s oder in die entgegengesetzte Richtung zeigt. Die Grundeigenschaften der trigonometrischen Funktionen sowie Angaben u ¨ ber das eben verwendete Bogenmass finden Sie in (26.15).
b) Definition des Skalarprodukts Ausgehend von der obigen Motivation definieren wir das Skalarprodukt von zwei beliebigen Vektoren a und b durch die Formel ab := |a| |b| cos ϕ , wo ϕ der Winkel zwischen a und b ist. Manchmal schreibt man auch a · b statt ab. Obige Definition ist die geometrische, die Definition mit Hilfe von Zahlen und Koordinaten folgt in Kapitel 2. c) Bemerkungen 1) Es sei betont, dass das Skalarprodukt von zwei Vektoren eine Zahl (d.h. ein Skalar) ist. 2) Wenn a oder b der Nullvektor ist, dann ist der Winkel ϕ nicht bestimmt. In diesem Fall setzt man nat¨ urlich ab = 0. 3) Der Zwischenwinkel ϕ ist nicht eindeutig festgelegt:
2π − ϕ
ϕ
Zum Gl¨ uck ist aber cos ϕ = cos(2π −ϕ), sodass der Wert des Skalarprodukts nicht davon abh¨ angt, welcher Zwischenwinkel gew¨ ahlt wird.
4) F¨ ur 0 ≤ ϕ ≤ 2π ist cos ϕ genau dann gleich Null, wenn ϕ = Daher gilt f¨ ur a = 0 und b = 0:
π 2
oder ϕ =
3π 2
ist.
Das Skalarprodukt ab ist genau dann gleich Null, wenn a und b senkrecht aufeinander stehen.
1.8 Das Skalarprodukt (englisch: dot product, scalar product, inner product)
15
5) Da cos 0 = 1 ist, gilt f¨ ur das Skalarprodukt eines Vektors mit sich selbst die Formel aa = |a|2
oder kurz
a2 = |a|2 . 6) Es sei noch ausdr¨ ucklich darauf hingewiesen, dass man im Skalarprodukt nicht “k¨ urzen” oder “dividieren” darf: Aus ab = ac folgt im allgemeinen nicht, dass b = c ist. (Beispielsweise gibt es viele verschiedene Vektoren v , die auf a senkrecht stehen; f¨ ur alle diese gilt av = 0.) 7) Unsere Definition f¨ ur das Skalarprodukt entstammt zwar der Physik, es gibt aber auch viele innermathematische Anwendungen f¨ ur diese Operation; wegen Bemerkung 4) wird das Skalarprodukt sicher u ¨berall dort eine Rolle spielen, wo zueinander senkrechte Vektoren betrachtet werden. Wegen Bemerkung 5) kann es zur L¨ angenbestimmung verwendet werden und in Kapitel 2 werden wir auch sehen, wie das Skalarprodukt zur Winkelberechnung eingesetzt werden kann. 8) Um nochmals auf die Physik zur¨ uckzukommen: Die geleistete Arbeit wird durch die Formel s definiert. Diese Formel ist aber noch nicht die allgemeinste Definition: Sie gilt nur bei W = F geradliniger Bewegung und bei konstanter Kraft. Wir werden sp¨ ater sehen, wie die Formel im Fall lautet, wo die Kraft variabel ist, aber in der Bewegungsrichtung wirkt (9.3) und schliesslich in (14.4) den allgemeinsten Fall (beliebige Bewegung, beliebig variable Kraft) behandeln. 9) Die Wahl der Bezeichnung Skalarprodukt wird dadurch begr¨ undet, dass ¨ ahnliche Regeln wie f¨ ur das Produkt von Zahlen gelten, wie wir nun sehen werden.
d) Rechenregeln f¨ ur das Skalarprodukt F¨ ur das Skalarprodukt gelten die folgenden Rechenregeln: (1) ab = ba, f¨ ur alle a, b (Kommutativgesetz). (2) (ra)b = r(ab), f¨ ur alle a, b und alle r ∈ R. (3a) (a + b)c = ac + bc, (3b) a(b + c) = ab + ac,
f¨ ur alle a, b, c (Distributivgesetze).
Die Regeln lassen sich wie folgt begr¨ unden: (1) Dies folgt sofort aus der Definition. (2) Hier muss man eine Fallunterscheidung treffen. F¨ ur r ≥ 0 ist (ra)b = |ra| |b| cos ϕ = r|a| |b| cos ϕ = r(ab). F¨ ur r < 0 hat ra die zu a entgegengesetzte Richtung. Die Winkel verhalten sich gem¨ ass der folgenden Figur:
a ϕ −a
b
π−ϕ
Es ist dann (ra)b = |ra| |b| cos(π−ϕ) = |r| |a| |b| cos(π−ϕ) = (−r)|a| |b| cos(π−ϕ) = r|a| |b| cos ϕ = r(ab), wobei die Beziehung cos(π − ϕ) = − cos ϕ ben¨ utzt wurde. (3) Die Begr¨ undung f¨ ur die Distributivgesetze ist etwas komplizierter. Sie finden sie im Anhang (27.2).
1. Vektoren und ihre geometrische Bedeutung
16
e) Eine Anwendung Unter Benutzung der Rechenregeln f¨ ur das Skalarprodukt und der Definition der Differenz (a − b = a + (−b)) kann man sich u ¨berlegen, dass die Formel (a + b)(a − b) = a2 − b2 auch f¨ ur Vektoren gilt, was wohl nicht sehr u ¨berrascht, denn die Rechenregeln f¨ ur Vektoren (Addition und Skalarprodukt) sind ja dieselben wie f¨ ur Zahlen. Beachten wir noch die Bemerkung 5) von oben, wonach a2 = |a|2 ist, so erhalten wir
(a + b)(a − b) = a2 − b2 = |a|2 − |b|2 .
Diese Beziehung hat eine h¨ ubsche Anwendung: Die Vektoren a und b spannen ein Parallelogramm auf. Dessen Diagonalen sind durch die Vektoren a +b und a −b gegeben. Wenn nun a und b gleich lang sind, dann handelt es sich beim Parallelogramm um einen Rhombus. Wegen |a| = |b| folgt aus der obigen Formel, dass
a a − b
a + b
(a + b)(a − b) = 0 ist. Nach Bemerkung 4) in c) oben stehen dann a + b und a − b senkrecht aufeinander. Dies best¨atigt die aus der elementaren Geometrie bekannte Tatsache, dass die Diagonalen in einem Rhombus einen rechten Winkel bilden.
b
(1.9) Das Vektorprodukt (Kreuzprodukt, vektorielles Produkt oder a¨usseres Produkt) englisch cross product or vector product a) Definition des Vektorprodukts Neben dem eben besprochenen Skalarprodukt zweier Vektoren, welches eine reelle Zahl ist, existiert noch eine weitere Verkn¨ upfungsm¨ oglichkeit, n¨ amlich das Vektorprodukt, welches zu zwei Vektoren a und b einen neuen Vektor a×b liefert. Die nachstehende Definition mag auf den ersten Blick etwas willk¨ urlich erscheinen, es zeigt sich aber, dass sie in vielen F¨allen gut angewendet werden kann. Wir geben nun die Definition des Vektorprodukts.
¨usseres Produkt) 1.9 Das Vektorprodukt (Kreuzprodukt, vektorielles Produkt oder a
17
Es seien a und b Vektoren. Der Zwischenwinkel ϕ sei so festgelegt, dass 0 ≤ ϕ ≤ π gilt. Unter dem Vektorprodukt a × b versteht man nun den Vektor, der die folgenden drei Eigenschaften hat: (A) Richtung: a × b steht senkrecht (normal) auf der von a und b aufgespannten Ebene. (B) Orientierung: Die Vektoren a, b und a ×b bilden in dieser Reihenfolge ein Rechtssystem. Damit ist folgendes gemeint: Man streckt Daumen und Zeigefinger der rechten Hand flach aus und den Mittelfinger nach oben. Wenn der Daumen in Richtung a und der Zeigefinger in Richtung b zeigt, so zeigt der Mittelfinger in Richtung a × b. (C) Betrag: F¨ ur den Betrag von a × b gilt |a × b| = |a| |b| sin ϕ .
a × b
b ·
· a
Diese drei Forderungen legen a × b eindeutig fest. Die Bedeutung des Vektorprodukts liegt prim¨ar darin, dass es erlaubt, formelm¨assig einen zu zwei gegebenen Vektoren normalen Vektor darzustellen. Dies ist sehr praktisch, wenn man gewisse Vorg¨ ange aus der Physik beschreiben will. Es seien an dieser Stelle etwa der Drall, das Drehmoment und die Lorentzkraft erw¨ ahnt. b) Kommentare Zu (A): Wenn (mindestens) einer der beiden Vektoren a und b der Nullvektor ist oder wenn a und b gleiche oder entgegengesetzte Richtung haben, dann spannen a und b gar keine Ebene auf. Die Forderung (A) ist dann sinnlos. In diesem Fall setzt man a × b = 0 (dies steht wegen sin 0 = sin π = 0 im Einklang mit (C)). Speziell ist a × a = 0. Zu (B): Die Orientierung kann auch mit einer (normalen) Schraube (oder mit einem Zapfenzieher, wenn Ihnen das besser gef¨allt) beschrieben werden: Das Vektorprodukt a × b zeigt in die Richtung, in der sich eine in der Achse von a × b liegende Schraube bewegt, wenn man sie so dreht, dass a auf dem k¨ urzesten Weg in b u ¨bergef¨ uhrt wird.
1. Vektoren und ihre geometrische Bedeutung
18
acheninhalt des von a und b aufgespannten ParalleloZu (C): |a × b| ist gerade der Fl¨ ohe |b| sin ϕ. gramms mit der Seite |a| und der H¨ b |b| · sin ϕ ϕ a c) Rechenregeln f¨ ur das Vektorprodukt F¨ ur das Vektorprodukt gelten die folgenden Formeln: (1) b × a = −(a × b), f¨ ur alle Vektoren a, b. (2) (ra) × b = a × (rb) = r(a × b), f¨ ur alle a, b und alle r ∈ R. (3) (a + b) × c = a × c + b × c, a × (b + c) = a × b + a × c, f¨ ur alle Vektoren a, b, c. Ungewohnt ist, dass wegen (1) das Kommutativgesetz nicht gilt (man spricht hier von “Antikommutativit¨at”). Dies bedingt eine gewisse Vorsicht im Umgang mit dem Vektorprodukt. Die Formeln (3) sind die Distributivgesetze. d) Begr¨ undung der Rechenregeln Die Formel (1) gilt wegen der “Rechte-Hand-Regel”. Beim Vertauschen von a und b (Daumen und Zeigefinger) wird der Mittelfinger in die entgegengesetzte Richtung gestreckt. Die Formel (2) wird ¨ ahnlich wie jene f¨ ur das Skalarprodukt bewiesen, wobei man f¨ ur negative r etwas aufpassen muss. F¨ ur Details sei auf den Anhang (27.2) verwiesen, wo Sie auch die Begr¨ undung f¨ ur (3) finden. Es sei noch erw¨ ahnt, dass beim Vektorprodukt — genau wie beim Skalarprodukt — nicht gek¨ urzt werden darf.
(1.10) Anwendungen in der Geometrie Der Vektorbegriff ist, wie bereits mehrfach erw¨ahnt, in den Naturwissenschaften, insbesondere in der Physik, unentbehrlich. Vektoren werden aber auch in der Geometrie verwendet. In diesem Abschnitt werden einige Beispiele hierzu gegeben. Es geht dabei aber keineswegs um eine systematische Behandlung der Vektorgeometrie, vielmehr soll anhand einiger Grundaufgaben ein kleiner Einblick in dieses Gebiet gegeben und der Nutzen der Vektorrechnung aufgezeigt werden. Einige dieser Aufgaben werden in Kapitel 2 wieder aufgenommen und unter Verwendung von Koordinaten durchgerechnet. Vorl¨aufig werden wir die Vektoren aber als geometrische Objekte auffassen, mit denen ja im weiter oben dargelegten Sinne ebenfalls
1.10 Anwendungen in der Geometrie
19
gerechnet werden kann. Es geht darum zu zeigen, wie gewisse geometrische Sachverhalte mit Vektoren elegant und knapp formuliert und so einer mathematischen Behandlung zug¨anglich gemacht werden k¨onnen. a) Parameterdarstellung einer Geraden Es seien zwei Punkte A, B im Raum (A = B) gegeben. Das Ziel ist es, die Gerade g durch A und B vektoriell darzustellen. Dies geschieht grunds¨ atzlich dadurch, dass man eine Bedingung daf¨ ur angibt, dass ein Punkt R auf der Geraden liegt. Wir w¨ahlen zun¨ achst irgendeinen Punkt O als Nullpunkt und betrachten die Ortsvektoren −→ −−→ −−→ a = OA, b = OB, r = OR . −−→ Dann ist b −a = AB, und dieser (freie) Vektor gibt die Richtung der gesuchten Geraden g an. Tr¨agt man nun von A aus ein beliebiges Vielfaches t(b − a), t ∈ R ab, so erh¨ alt man einen Punkt auf der Geraden g und umgekehrt wird jeder Punkt auf g so erhalten. R b − a B A g b
a
r
O Damit haben wir gezeigt, dass der Punkt R genau dann auf g liegt, wenn f¨ ur den −−→ Ortsvektor r = OR gilt: (∗)
r = a + t(b − a) ,
wo t eine reelle Zahl ist. Man nennt t einen Parameter und die Formel (∗) heisst eine Parameterdarstellung von g. Der unbestimmte Artikel ist insofern gerechtfertigt, als eine Gerade g unendlich viele verschiedene Parameterdarstellungen besitzt: Man braucht ja nur anstelle von A und B zwei andere Punkte von g zu w¨ahlen; dann a¨ndern sich die Gr¨ ossen a und b in (∗). Eine “dynamische” Interpretation von (∗) erhalten wir, wenn wir t als Zeit auffassen. Da r von t abh¨ angt, schreiben wir daf¨ ur auch r(t): r(t) = a + t(b − a) . Diese Formel kann zur Beschreibung einer geradlinigen Bewegung im Raum verwendet werden: Zum Zeitpunkt t befindet sich das bewegte Objekt im Endpunkt des Ortsvektors r(t). Speziell ist r(0) = a, r(1) = b, d.h. zur Zeit t = 0 befindet sich das Objekt im
1. Vektoren und ihre geometrische Bedeutung
20
Punkt A, zur Zeit t = 1 im Punkt B. In (8.3) werden wir u ¨brigens sehen, wie man die Bewegung entlang beliebiger Kurven mit Hilfe von passenden Parameterdarstellungen beschreiben kann. Schliesslich sei noch darauf hingewiesen, dass man die Gerade g auch durch die Vorgabe eines Punktes A und eines Richtungsvektors q (q = 0) beschreiben kann. Dazu ersetzt man in der Formel (∗) einfach b − a durch q: r = a + tq . b) Normalebene zu einem Vektor durch einen Punkt Gegeben ist ein Punkt A und eine Richtung, dargestellt durch den (freien) Vektor n. Gesucht ist die zu n normale Ebene durch A. Zur L¨ osung dieser Aufgabe w¨ ahlen wir wieder einen Nullpunkt O. Wie Sie der −−→ nachstehenden Skizze entnehmen k¨onnen, liegt der Endpunkt R des Vektors r = OR −→ genau dann in der gesuchten Ebene, wenn r − a (mit a = OA) senkrecht auf n steht. Nach Bemerkung 4) von (1.8.c) ist dies aber genau dann der Fall, wenn gilt: n(r − a) = 0 . Die Punkte R der Ebene sind damit beschrieben. n A
·
r − a R
a r O c) Ebene durch drei Punkte Drei nicht auf einer Geraden liegende Punkte A, B, C bestimmen eine Ebene, die wir vektoriell beschreiben m¨ ochten. Wir f¨ uhren wie gewohnt einen Nullpunkt O ein und betrachten die drei Ortsvektoren −→ −−→ −−→ a = OA, b = OB, c = OC . Der untenstehenden Skizze entnimmt man, dass die Differenzvektoren b − a und c − a in der gesuchten Ebene liegen. Im Hinblick auf die L¨ osung von Aufgabe b) bestimmen
1.10 Anwendungen in der Geometrie
21
wir zun¨ achst einen Normalenvektor n zur Ebene. Da dieser sowohl zu b − a als auch zu c − a senkrecht stehen muss, setzen wir n = (b − a) × (c − a) . Damit sind wir aber in der Situation von Aufgabe b): Der Punkt R liegt genau dann −−→ in der Ebene, wenn f¨ ur r = OR gilt:
n(r − a) = 0
oder ausgeschrieben
(b − a) × (c − a) (r − a) = 0 . C
c − a A
b − a B
c a
b
O Unsere Aufgabe ist somit gel¨ ost. d) Parameterdarstellung einer Ebene Die Aufgabe c) kann noch auf eine andere Weise angegangen werden. Wir f¨ uhren dazu die Abk¨ urzungen p = b − a, q = c − a ein. Wir stellen nun sofort fest, dass f¨ ur −−→ jeden Punkt R in der durch A, B, C bestimmten Ebene E der Ortsvektor r = OR in der Form (∗∗)
r = a + t p + uq mit
t, u ∈ R
geschrieben werden kann und dass umgekehrt jeder so dargestellte Punkt R in der Ebene E liegt. Damit haben wir eine weitere Art gefunden, eine Ebene vektoriell zu beschreiben. Im Unterschied zu b) und c) kommen in der beschreibenden Gleichung zwei reelle Zahlen vor, die man wie in a) Parameter nennt; die Beziehung (∗∗) heisst entsprechend Parameterdarstellung der Ebene. Da es sich bei einer Ebene um ein zweidimensionales Gebilde handelt, ist es ganz nat¨ urlich, dass hier — im Gegensatz zu a) — zwei Parameter auftreten.
1. Vektoren und ihre geometrische Bedeutung
22
C q
t p + uq
R
A p a
r
B
O (1.∞) Aufgaben 1−1 Die Vektoren a bzw. b haben die L¨ ange 3 cm bzw. 4 cm und schliessen einen Winkel von 60◦ ein. Der Vektor c steht senkrecht auf der von a und b aufgespannten Ebene und ist 5 cm lang. Bestimmen Sie mittels einer Konstruktion die L¨ ange von a + b + c. und G greifen in einem Punkt P an. Der Winkel zwischen den Richtungen 1−2 Zwei Kr¨ afte F hat den Betrag 5 N (Newton). Die Richtung der der Kr¨ afte betr¨ agt 110◦ und die Kraft F und G liegen und mit F einen Winkel von 80◦ bilden. resultierenden Kraft soll zwischen F und den Betrag der Resultierenden. Bestimmen Sie durch Konstruktion den Betrag von G 1−3 Gegeben sind der Nullpunkt O und zwei weitere Punkte P, Q. −−→ a) M sei der Mittelpunkt der Strecke P Q. Dr¨ ucken Sie den Vektor OM mit Hilfe der Vektoren − − → − − → OP und OQ aus. b) Dasselbe f¨ ur den Punkt N , der zwischen P und Q liegt und die Strecke P Q im Verh¨ altnis r : s teilt. 1−4 Zeichnen Sie ein Dreieck ABC sowie dessen Seitenmittelpunkte Ma , Mb , Mc . −−−→ −−−→ −−−→ a) Addieren Sie zeichnerisch die drei Vektoren AMa , BMb , CMc . Was k¨ ame wohl bei einer ganz exakten Zeichnung heraus? b) K¨ onnen Sie Ihre Vermutung vektoriell beweisen? M 1−5 Die drei Vektoren u, v , w stehen paarweise senkrecht aufeinanP der und spannen einen Quader auf. Der Punkt M ist der MitU telpunkt der Deckfl¨ ache und P ist die Mitte der Strecke Y M . w Y − − → Bestimmen Sie die Zahlen a, b, c so, dass OP = au + bv + c w u v ist. O 1−6 Gegeben sind zwei Vektoren a und b, deren Zwischenwinkel = 0, π ist. Gesucht sind die Richtungsvektoren der beiden Winkelhalbierenden. L¨ osen Sie die Aufgabe zuerst im Spezialfall, wo a und b denselben Betrag haben. 1−7 Die vier Punkte A, B, C, D, welche nicht in einer Ebene liegen m¨ ussen, bilden ein r¨ aumliches Viereck. Mit W, X, Y bzw. Z bezeichnen wir die Mittelpunkte der Strecken AB, BC, CD bzw. −−→ −→ −−→ −−→ DA. Vergleichen Sie die Vektoren W X und Y Z sowie XY und ZW . Was k¨ onnen Sie u ¨ ber das Viereck W XY Z sagen? B 1−8 Die Vektoren a, b,c spannen ein (nicht notwendigerweise regub l¨ ares) Tetraeder auf. Die Gerade g (bzw. h) geht durch die Mittelpunkte der Kanten OA und BC (bzw. OB und AC). Geben Sie je eine Parameterdarstellung (in Bezug auf O) von g und von h an. Schneiden sich die beiden Geraden?
A c
a O
C
23
1.∞ Aufgaben
agt. Be1−9 Gegeben sind zwei Vektoren a, b mit |a| = 1, |b| = 2, deren Zwischenwinkel 45◦ betr¨ rechnen Sie das Skalarprodukt (a − b)(a + 2b). angen a und b. Mit d und e bezeichnen wir 1−10 Gegeben ist ein Parallelogramm mit den Seitenl¨ angen der beiden Diagonalen. Zeigen Sie unter Verwendung des Skalarproduktes, dass die die L¨ Beziehung 2a2 + 2b2 = d2 + e2 gilt. 1−11 Ein Parallelogramm hat Seiten der L¨ ange 2 und 3 und eine 2 4 Diagonale der L¨ ange 4 (siehe Skizze). Berechnen Sie mittels β des Skalarprodukts die Winkel α und β sowie die L¨ ange der α andern Diagonale. 3 1−12 Die Vektoren a, b,c haben der Reihe nach die L¨ ange 1, 2, 3 Q und stehen paarweise senkrecht aufeinander. Sie spannen einen Quader auf. −→ − − → a) Dr¨ ucken Sie die Raumdiagonalen AP und OQ durch a, b,c aus. B b) Wie lang sind die Raumdiagonalen? b A c) Wie gross ist der spitze Winkel zwischen den Raumdiagonalen? c a d) Berechnen Sie den Winkel zwischen den Strecken AB und BC. O −→ − − → 1−13 Der Vektor a = OA hat die L¨ ange 21 cm. Der Vektor b = OB A steht senkrecht auf a. Ferner sei M der Mittelpunkt von OB. a) Wie lang muss b sein, damit die Strecken OC und AM senkrecht aufeinander stehen? b) Wo trifft man das Rechteck OACB im t¨ aglichen Leben an? O M
P
C
C
B 1−14 Der Vektor c sei die Normalprojektion von b auf a. Stellen Sie b eine Formel f¨ ur c auf, in der nur a und b (und die Rechenoperationen mit Vektoren) vorkommen. Gilt Ihre Formel f¨ ur spitze a c und f¨ ur stumpfe Zwischenwinkel? −→ 1−15 Der Vektor a = OA hat die L¨ ange 2. Beschreiben Sie die Menge aller Punkte R mit der −→ Eigenschaft, dass ar = |r| (r = OR) ist.
¨ 1−16 Der Vektor a (bzw. b) zeigt vom Erdmittelpunkt zum Punkt auf dem Aquator mit der geo+graphischen L¨ ange 60◦ E (bzw. 60◦ W). In welche Richtung (ausgedr¨ uckt in geographischen Koordinaten) zeigen die Vektoren a) a × b, b) b × a, c) a × (b × a), d) a × (a × b), e) (a × a) × b? Was f¨ allt beim Vergleich von d) und e) auf? 1−17 In der nebenstehenden Skizze haben beide W¨ urfel die Kantenl¨ ange 1. Zeichnen Sie die beiden Vektoren u = b × c und v = 12 c × (a × b) ein. 1−18 Es sei P ein Punkt im Raum, a = 0 ein Vektor. Wo liegen die −−→ −−→ − − → Endpunkte der Ortsvektoren OX mit a × (OX − OP ) = 0?
c
b
a 1−19 Der Vektor g zeige (in Richtung der Schwerkraft) nach unten. Ein ebener Abhang E hat den Normalenvektor n, der so gew¨ ahlt ist, dass der Winkel zwischen g und n stumpf ist. a) Ich m¨ ochte auf E in horizontaler Richtung spazieren. Welche beiden Richtungen h1 , h2 kann ich einschlagen? b) Ich lasse einen kugelrunden Apfel fallen. In welche Richtung r rollt er? oglich. 1−20 Vereinfachen Sie den Ausdruck |a × b|2 + (ab)2 so weit als m¨
24
2. VEKTORRECHNUNG MIT KOORDINATEN ¨ (2.1) Uberblick In Kapitel 1 haben wir Vektoren im Raum und die zugeh¨origen Rechenoperationen geometrisch definiert. F¨ ur den praktischen Umgang mit Vektoren und f¨ ur das effektive Rechnen ist es aber notwendig, auch eine zahlenm¨assige Darstellung zur Verf¨ ugung zu haben. Dazu f¨ uhrt man ein Koordinatensystem im Raum ein. Jeder Vektor r ist dann durch seine Koordinaten ⎛ ⎞ x r = ⎝ y ⎠ z bestimmt. Die in Kapitel 1 definierten Rechenoperationen f¨ ur Vektoren (Addition, Skalarprodukt, Vektorprodukt etc.) lassen sich nun alle mit Hilfe von Formeln f¨ ur die Koordinaten ausdr¨ ucken. ¨ Eine Tabelle am Schluss des Kapitels gibt einen Uberblick u ¨ber die
(2.2) (2.3)
(2.4) (2.7)
“geometrische” und die “analytische” Erscheinungsform der Vektoren und der Rechenoperationen.
(2.2) Das kartesische Koordinatensystem Wir w¨ahlen im Raum einen Nullpunkt O und ein rechtwinkliges* Koordinatensystem mit x–Achse, y–Achse und z–Achse, die wie u ¨blich angeordnet sein sollen: z K
y
k j · O
J
· i I x
* Statt “rechtwinklig” sagt man auch “kartesisch”, nach R. DESCARTES (latinisiert CARTESIUS) (1596–1650).
2.3 Die Koordinaten eines Vektors
25
Die “¨ ubliche” Anordnung der Koordinatenachsen (Orientierung des Koordinatensystems als “Rechtssystem”) kann mit der “Rechte-Hand-Regel” (vgl. (1.9)) beschrieben werden: Zeigt der Daumen der rechten Hand in Richtung der positiven x–Achse und der Zeigefinger in Richtung der positiven y–Achse, so zeigt der Mittelfinger in Richtung der positiven z–Achse. (Wie schon beim Vektorprodukt kann man diesen Sachverhalt auch mit einer “Schraubenregel” beschreiben.) Auf den drei Achsen w¨ ahlen wir die Einheitspunkte I, J, K; das sind die Punkte, die im positiven Teil ihrer Achse liegen und vom Nullpunkt den Abstand 1 haben. Nun f¨ amlich uhren wir drei Vektoren ein, n¨ −→ ı = OI,
−→ j = OJ,
−→ k = − OK .
Sie haben die L¨ange 1, d.h. sie sind Einheitsvektoren. Ferner stehen sie paarweise aufeinander senkrecht. Wegen (1.8.c.4,5) gilt also f¨ ur die Skalarprodukte (∗)
ı 2 = j 2 = k 2 = 1,
ı j = ı k = j k = 0 .
F¨ ur das Vektorprodukt hat man wegen der Orientierung des Koordinatensystems und der Definition dieses Produkts die folgenden Beziehungen:
(∗∗)
ı × j = k, j × k = ı, j ×ı = −k, k × j = −ı, ı ×ı = 0, j × j = 0,
k ×ı = j, ı × k = −j, k × k = 0 .
(2.3) Die Koordinaten eines Vektors Im folgenden beziehen wir uns auf ein fest gew¨ahltes kartesisches Koordinatensystem mit Nullpunkt O. In der untenstehenden Skizze 1 ist ein Vektor r eingetragen. Der Zeichnung entnimmt man sofort die Tatsache, dass r auf genau eine Weise als Summe von drei Vektoren geschrieben werden kann, von denen • der erste parallel zur x–Achse, also ein Vielfaches von ı, • der zweite parallel zur y–Achse, also ein Vielfaches von j, • der dritte parallel zur z–Achse, also ein Vielfaches von k ist. Wir sehen also, dass sich jeder Vektor r eindeutig in der Form r = xı + yj + zk
2. Vektorrechnung mit Koordinaten
26
darstellen l¨ asst. (Die Eindeutigkeit besagt, dass die drei Vektoren xı, yj, zk und damit die drei Zahlen x, y, z in dieser Reihenfolge eindeutig bestimmt sind.) Die Vektoren xı, yj, zk nennt man die Komponenten, die Zahlen x, y, z die Koorahlte Koordinatensystem)*. dinaten des Vektors r (in Bezug auf das gew¨ Da der Vektor r durch seine Koordinaten eindeutig festgelegt ist, schreibt man kurz ⎛ ⎞ x r = ⎝ y ⎠ . z Beachten Sie, dass jeder zu r parallele (und gleichgerichtete) Vektor dieselben Koordinaten hat und dass umgekehrt jeder Vektor mit denselben Koordinaten parallel (und gleichgerichtet) zu r ist, vgl. Skizze 2 . Dies stimmt mit unserer Abmachung von (1.3.b) u ¨berein, gem¨ass derer parallele Vektoren als gleich betrachtet werden. (Genauer: Sie vertreten denselben freien Vektor, der ja streng genommen eine Menge von einzelnen “Pfeilen” ist. Anders ausgedr¨ uckt: Jeder Vertreter eines festen freien Vektors hat dieselben Koordinaten.) z z z 1 3 2 R(x, y, z) r y y y r zk k j O i
· x
·
·
xi
yj
O
· x
O
x
Man kann insbesondere den Vektor r so verschieben, dass sein Anfangspunkt mit 3 entnimmt man sofort, dem Nullpunkt zusammenf¨allt. Der obenstehenden Skizze dass in diesem Fall die Zahlen x, y, z gerade die Koordinaten des Endpunkts X von −−→ r = OR sind: R(x, y, z) . Trotz dieser engen Beziehung darf man aber Punkte und Vektoren nicht durcheinander bringen, zumal ja der eben erw¨ahnte Zusammenhang ohnehin nur f¨ ur Ortsvektoren mit dem Anfangspunkt O gilt. Die einzelnen Koordinaten eines Vektors k¨ onnen selbstverst¨ andlich auch 0 sein. Ist die 3. (oder z–)Koordinate = 0, so bedeutet dies, dass der Vektor parallel zur x-y–Ebene ist. Sind sowohl die 2. (y–) als auch die 3. (z–)Koordinate gleich 0, so ist der Vektor parallel zur x–Achse. Schliesslich geben wir noch die (sehr offensichtlichen) Koordinaten einiger wichtiger Vektoren an: * In manchen B¨uchern wird das Wort “Komponenten” allerdings auch f¨ur das gebraucht, was hier “Koordinaten” heisst.
2.3 Die Koordinaten eines Vektors
⎛ ⎞ 0 0 = ⎝ 0 ⎠ , 0
27
⎛ ⎞ 0 j = ⎝ 1 ⎠ , 0
⎛ ⎞ 1 ı = ⎝ 0 ⎠ , 0
⎛ ⎞ 0 k = ⎝ 0 ⎠ . 1
Bemerkungen a) Wir identifizieren also den Vektor r mit dem Zahlentripel ⎛ ⎞ x ⎜ ⎟ ⎝y ⎠. z Dabei ist aber zu bedenken, dass diese Koordinaten von der Lage des gew¨ ahlten Koordinatensystems abh¨ angig sind. H¨ atten wir n¨ amlich die Koordinatenachsen anders gelegt, so h¨ atte derselbe Vektor andere Koordinaten bekommen. Man muss sich also im Verlauf einer Rechnung immer auf ein- und dasselbe Koordinatensystem beziehen. Beim L¨ osen von Aufgaben kann es zweckm¨ assig sein, die Lage des Koordinatensystems ans Problem anzupassen.
b) Manchmal werden wir auch eine Schreibweise mit Indizes benutzen, wie etwa ⎞ x1 r = ⎝ x2 ⎠ . x3 ⎛
Statt von der x–, y– und z–Achse spricht man dann nat¨ urlich von der x1 –, x2 – und x3 –Achse. Anstelle von ı, j, k schreibt man in diesem Fall e1 , e2 , e3 . c) Wie Sie gemerkt haben, treiben wir hier die Vektorrechnung generell im (dreidimensionalen) Raum. Nat¨ urlich kann man auch Probleme in der Ebene behandeln. In diesem Fall l¨asst man einfach die 3. Koordinate weg und schreibt r =
x1 x2
.
Bei dieser Gelegenheit sei darauf hingewiesen, dass man im zweidimensionalen Fall zwar Addition, Subtraktion, Vielfaches und das Skalarprodukt von Vektoren verwenden kann, nicht aber das Vektorprodukt, in dessen Definition zwingend die dritte Dimension steckt. d) Statt vom Raum in die Ebene zu gehen, kann man auch in h¨ ohere Dimensionen schweifen und anstelle von Zahlentripeln sogenannte “n–tupel” von Zahlen betrachten, welche dann den n–dimensionalen Raum beschreiben: ⎞ ⎛ x1 ⎜x ⎟ ⎜ 2⎟ ⎜ . ⎟. ⎜ . ⎟ ⎝ . ⎠ xn
2. Vektorrechnung mit Koordinaten
28
(2.4) Rechenoperationen mit Koordinaten
In Kapitel 1 haben wir die Rechenoperationen f¨ ur Vektoren geometrisch definiert. Wie kann man nun diese Operationen unter Verwendung der Koordinaten rechnerisch durchf¨ uhren? In der folgenden Tabelle stellen wir gleich die Antwort zusammen.
Gegeben seien die Vektoren ⎞ a1 a = ⎝ a2 ⎠ , a3
⎛
⎞ b1 b = ⎝ b2 ⎠ . b3
⎛
Dann ist ⎛
(1)
⎞ a 1 + b1 a + b = ⎝ a2 + b2 ⎠ , a 3 + b3
(2)
⎞ a 1 − b1 a − b = ⎝ a2 − b2 ⎠ , a 3 − b3
(3)
⎞ ra1 ra = ⎝ ra2 ⎠ , ra3
(4)
ab = a1 b1 + a2 b2 + a3 b3 ,
(5)
⎞ a 2 b3 − a 3 b2 a × b = ⎝ a3 b1 − a1 b3 ⎠ . a 1 b2 − a 2 b1
⎛
⎛
⎛
Weiter gelten folgende Formeln:
2.4 Rechenoperationen mit Koordinaten
29
(6) Die L¨ange eines Vektors a ist gegeben durch |a| =
a21 + a22 + a23 .
(7) Der Winkel ϕ zwischen den Vektoren a und b ist gegeben durch cos ϕ =
ab a 1 b1 + a 2 b 2 + a 3 b 3 = 2 . a1 + a22 + a23 b21 + b22 + b23 |a| |b|
Bemerkung Die obigen Formeln sind leicht zu behalten, abgesehen vielleicht von (5) (Vektorprodukt). F¨ ur diese Formel geben wir deshalb zwei Merkregeln an: 1. Variante Die 1. Koordinate beginnt mit den Indizes 2,3: a2 b3 − a3 b2 (die unterstrichenen Zahlen stehen in der nat¨ urlichen Reihenfolge!). Anschliessend werden die Indizes nach dem Schema 1
2
3
“zyklisch vertauscht”, d.h., aus 2,3 wird 3,1 und aus 3,1 wird 1,2. 2. Variante Diese Variante benutzt die Begriffe “Matrix” und “Determinante”, die hier aber sonst weiter nicht ben¨ otigt werden. Unter einer 2 × 2–Matrix versteht man ein Schema
a
b
c
d
von vier Zahlen, und ihre Determinante ist gegeben durch
a
c
b
= ad − bc . d
(Multiplikation u ¨ bers Kreuz.) Zur Berechnung des Vektorprodukt schreibt man nun die Vektoren a, b in Koordinaten nebeneinander, wiederholt die ersten beiden Koordinaten und streicht die erste Zeile: a1
b1
a2
b2
a3 a1
b3 b1
a2
b2
2. Vektorrechnung mit Koordinaten
30
Die Koordinaten von a × b sind dann durch die drei von oben nach unten gebildeten Determinanten gegeben:
a2
a 3
a3
a 1
a1
a 2
b2
= a2 b 3 − a3 b 2 b3
b3
= a3 b 1 − a1 b 3 b1
b1
= a1 b 2 − a2 b 1 . b2
Ein Zahlenbeispiel dazu: Mit ⎛
⎞ 1 ⎜ ⎟ a = ⎝ 2 ⎠ −2
⎛ ⎞ 2 ⎜ ⎟ und b = ⎝ 1 ⎠
bilden wir
3
1 2
2 1
−2 1
3 2
2
1
und erhalten f¨ ur die drei Determinanten ⎛
2 · 3 − (−2) · 1 = 8 (−2) · 2 − 1 · 3 = −7
also
8
⎞
⎟ ⎜ a × b = ⎝ −7 ⎠ . −3
1 · 1 − 2 · 2 = −3
(2.5) Beweise f¨ ur die Rechenregeln Die in Koordinaten gegebenen Vektoren ⎛
⎞ a1 ⎜ ⎟ a = ⎝ a2 ⎠ a3
⎛
⎞ b1 ⎜ ⎟ und b = ⎝ b2 ⎠ b3
schreiben sich in Komponenten wie folgt: a = a1ı + a2j + a3k,
b = b1ı + b2j + b3k .
(1) Aus diesen Beziehungen folgt durch Addition und durch einfache, nach den Regeln von (1.6.d) und (1.7) erlaubte Umformungen: a + b = (a1 + b1 )ı + (a2 + b2 )j + (a3 + b3 )k , woraus man gerade die Formel (1) abliest. (2) und (3) werden ganz analog hergeleitet.
2.6 L¨ ange eines Vektors in allen Dimensionen; Kreis-/Kugelgleichung
31
(4) Wir multiplizieren das Produkt gliedweise aus, was nach den Regeln von (1.8.d) erlaubt ist. Weiter benutzen wir noch die Beziehungen (∗) von (2.2). Wir erhalten dann ab = (a1ı + a2j + a3k)(b1ı + b2j + b3k) = a1 b1ı 2 + a1 b2ıj + a1 b3ık + a2 b1jı + a2 b2j 2 + a2 b3jk + a3 b1kı + a3 b2kj + a3 b3k 2 = a1 b 1 + a2 b 2 + a3 b 3 , denn die “gemischten” Terme ıj, ık etc. sind = 0, und f¨ ur die “Quadrate” gilt ı 2 = j 2 = k 2 = 1. urfen wir das Produkt unter Benutzung der Rechenregeln von (1.9.c), insbe(5) Genau wie in (4) d¨ sondere des Distributivgesetzes, ausmultiplizieren. Wir erhalten a × b = (a1ı + a2j + a3k) × (b1ı + b2j + b3k) = a1 b1 (ı ×ı) + a1 b2 (ı ×j) + a1 b3 (ı × k) + a2 b1 (j ×ı) + a2 b2 (j ×j) + a2 b3 (j × k) + a3 b1 (k ×ı) + a3 b2 (k ×j) + a3 b3 (k × k) . Verwendet man nun die Beziehungen (∗∗) von (2.2) und fasst man zusammen, so findet man die folgende Komponentenzerlegung des Vektorprodukts a × b = (a2 b3 − a3 b2 )ı + (a3 b1 − a1 b3 )j + (a1 b2 − a2 b1 )k . Liest man die Koordinaten als Koeffizienten von ı, j und k ab, so erh¨ alt man gerade die Formel (5): ⎛ ⎞ a2 b 3 − a3 b 2 ⎜ ⎟ a × b = ⎝ a3 b1 − a1 b3 ⎠ . a1 b 2 − a2 b 1 ass (1.8.c.5) a2 = |a|2 ist. (6) Man setzt in der Formel (4) a = b und beachtet, dass gem¨ (7) Dies folgt aus der Definition des Skalarprodukts sowie den Formeln (4) und (6).
(2.6) L¨ange eines Vektors in allen Dimensionen; Kreis-/Kugelgleichung Formel (6) gibt die L¨ ange eines Vektors a im R3 an: |a| = a21 + a22 + a23 . Zumindest in den ersten drei Dimensionen haben wir als Menschen eine praktische Vorstellung von der L¨ange eines Vektors und wir wollen jetzt u ¨berpr¨ ufen, ob obige Formel, angepasst, in allen Dimensionen unserer Alltagserfahrung entspricht. 1. Wenn wir uns im R1 befinden, also auf einer Geraden, dann ist die L¨ ange eines Vektors a = (a1 ), der im Ursprung ansetzt, einfach |a1 |. Wie man unterer Skizze entnimmt, haben die beiden Vektoren a und −a je L¨ ange |a1 |. Das ist aber
2. Vektorrechnung mit Koordinaten
32
gleich |a| = a21 = |a1 |. Diese Formel ist also kompatibel mit der Situation in 3 Dimensionen. −a
a
−a1
a1
0
2. Wenn wir
uns im R2 befinden, also in einer Ebene, dann ist die L¨ange eines Vektors a1 a = , der im Ursprung ansetzt, wegen des Satzes von Pythagoras (siehe a2 a21 + a22 . Diese Formel ist also auch kompatibel mit der unten) gleich |a| = Situation in 3 Dimensionen. y
a
a2 ·
x
a1
O
3. Wenn wir uns im R3 befinden, also im Raum, dann ist die L¨ ange des Vektors ⎛ ⎞ a1 a = ⎝ a2 ⎠ , a3 der im Ursprung ansetzt, tats¨achlich gleich |a| = a21 + a22 + a23 . Dies kann man durch zweifaches Anwenden des Satzes von Pythagoras beweisen, wie untere Skizze zeigt. Formel (6) kann also auch mit anschaulicher Geometrie nachvollziehbar begr¨ undet werden. z a3 a · O
a2
a1 · x
y
2.7 Beispiele
33
ur uns Menschen schwer 4. In vielen Anwendungen arbeiten wir im Rn . Es ist dann f¨ vorstellbar, was die L¨ange eines Vektors ⎛
⎞ a1 ⎜a ⎟ ⎜ 2⎟ ⎜ a = ⎜ a3 ⎟ ⎟ ⎝ ... ⎠ an u ¨berhaupt sein soll. Wir betrachten in dem Fall n |a| := a2i := a21 + a22 + a23 + . . . + a2n i=1
als Definition des Abstandes. 5. Die Gelegenheit ist g¨ unstig, hier en passant die Kreis- und Kugelgleichung mit Zentrum im Ursprung herzuleiten: die Punkte (x, y) eines solchen Kreises haben vom Ursprung alle die gleiche Entfernung, zum Beispiel r. Also gilt wegen Punkt 2, dass r = x2 + y 2 . Quadriert heisst das r 2 = x2 + y 2 . Das ist aber genau die Kreisgleichung mit Mittelpunkt (0, 0). Mit Mittelpunkt (a, b) haben wir r2 = (x − a)2 + (y − b)2 . Nun ist es nur noch ein kleiner Schritt zur Kugelgleichung: die Punkte (x, y, z) einer solchen Kugeloberfl¨ ache haben vom Ursprung alle die gleiche Entfernung, zum Beispiel r. Also gilt wegen Punkt 3, dass r = x2 + y 2 + z 2 . Quadriert heisst das r 2 = x2 + y 2 + z 2 . Das ist aber genau die Kugelgleichung mit Mittelpunkt (0, 0, 0). Mit Mittelpunkt (a, b, c) haben wir r2 = (x − a)2 + (y − b)2 + (z − c)2 .
(2.7) Beispiele 1. Gesucht ist der Abstand d der Punkte A(1, −4, 2) und B(−5, 2, −1).
2. Vektorrechnung mit Koordinaten
34
−→ −−→ Wir setzen a = OA, b = OB. Dann ist ⎛
⎞ 1 a = ⎝ −4 ⎠ , 2
A
⎛
⎞ −5 b = ⎝ 2 ⎠ . −1
a O
Der Skizze entnimmt man, dass der gesuchte Abstand d = |a − b| ist. Nach Regel (2) ist ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 −5 6 a − b = ⎝ −4 ⎠ − ⎝ 2 ⎠ = ⎝ −6 ⎠ . 2 −1 3
a − b b
B
Nach Regel (6) ergibt sich schliesslich d = 62 + (−6)2 + 32 = 9 .
2. Wir f¨ uhren das Beispiel weiter und bestimmen den Winkel ϕ zwischen den oben genannten Vektoren a und b. Dazu ben¨ utzen wir die Formel (7). Wir rechnen √ √ sofort aus, dass |a| = 21 und |b| = 30 ist. Ferner ist das Skalarprodukt ab = 1 · (−5) + (−4) · 2 + 2 · (−1) = −15. Wir erhalten cos ϕ =
ab 15 = −0.5976 = −√ 630 |a| |b|
und somit
ϕ = 126.7◦ .
3. Schliesslich berechnen wir noch den Fl¨ acheninhalt des Dreiecks OAB. Der Trick ist hier, dass man das Vektorprodukt verwena den kann. Gem¨ ass Definition (siehe (1.9.b)) ist ja der Betrag |a × b| gleich dem Inhalt des von a und b aufgespannten Parallelogramms. Der Inhalt des angegebenen O Dreiecks ist dann die H¨alfte davon. Ohne grosse M¨ uhe berechnet man mit Formel (5) dass ⎛ ⎞ b 0 a × b = ⎝ −9 ⎠ −18 B √ ist. Wegen |a ×b| = 405 = 20.12 hat das Dreieck OAB den Fl¨ acheninhalt 10.06.
A
4. Gesucht ist eine Parameterdarstellung der Geraden g durch die Punkte A und B von Beispiel 1. Nach (1.10.a) ist eine solche gegeben durch r = a + t(b − a) .
2.7 Beispiele
35
Aus 1. entnehmen wir die Koordinaten der Vektoren a und b − a = −(a − b) und erhalten ⎛ ⎞ ⎞ ⎛ ⎛ ⎞ 1 −6 1 − 6t r = r(t) = ⎝ −4 ⎠ + t ⎝ 6 ⎠ = ⎝ −4 + 6t ⎠ . 2 −3 2 − 3t Der Punkt R(x, y, z) liegt also genau dann auf g, wenn seine Koordinaten die Form x = 1 − 6t, y = −4 + 6t, z = 2 − 3t haben. are dem Wir fragen uns nun noch, ob der Nullpunkt auf dieser Geraden liege. W¨ usste dann gelten so, so g¨abe es einen Parameterwert t0 mit x(t0 ) = 0. Es m¨ 1 − 6t0 = 0 −4 + 6t0 = 0 2 − 3t0 = 0 . Die dritte Gleichung liefert t0 = 32 , dieser Wert erf¨ ullt auch die zweite Gleichung, nicht aber die erste. Dies bedeutet, dass r(t) niemals = 0 ist: Der Nullpunkt liegt nicht auf unserer Geraden. 5. Wir m¨ochten — aus was f¨ ur Gr¨ unden auch immer — nachweisen, dass das von den vier Punkten P (1, 0, −2), Q(3, 1, −4), R(7, −1, −1), S(5, −2, 1) gebildete (r¨aumliche) Viereck P QRS ein (ebenes) Rechteck ist. Wir betrachten zun¨achst die vier Ortsvektoren
O
S
R
P
Q
⎛
⎞ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ 1 3 7 5 −−→ −−→ −−→ −→ p = OP = ⎝ 0 ⎠ , q = OQ = ⎝ 1 ⎠ , r = OR = ⎝ −1 ⎠ , s = OS = ⎝ −2 ⎠ . −2 1 −4 −1 ⎛ ⎞ ⎛ ⎞ 2 2 −−→ − → P Q = q − p = ⎝ 1 ⎠ , SR = r − s = ⎝ 1 ⎠ . −2 −2 −−→ −→ −−→ −→ Somit ist P Q = SR, was nach (2.3) bedeutet, dass die Vektoren P Q und SR −→ −−→ parallel und gleich lang sind. Ebenso sind P S und QR parallel und gleich lang. Die Figur ist also schon mal ein Parallelogramm (und daher liegen P, Q, R und S in einer Ebene). Dann ist
Um noch nachzuweisen, dass es sich um ein Rechteck handelt, gen¨ ugt es zu zeigen, −−→ −−→ dass P Q und QR senkrecht aufeinander stehen, d.h., dass das Skalarprodukt der beiden Vektoren gleich Null ist (1.8.c.4). Dies trifft aber zu, denn es ist ⎛ ⎞⎛ ⎞ 2 4 −−→ −−→ ⎝ 1 ⎠ ⎝ −2 ⎠ = 0 . P Q QR = −2 3
2. Vektorrechnung mit Koordinaten
36
6. Wir suchen eine Gleichung der Ebene, die auf dem Vektor ⎞ ⎛ 2 n = ⎝ 1 ⎠ −1 senkrecht steht und die durch den Punkt A(1, 0, −2) geht. −−→ In (1.10.b) haben wir gesehen, dass der Endpunkt des Vektors r = OR genau dann −→ in der gesuchten Ebene liegt, wenn n(r − a) = 0 ist , mit a = OA. Wir brauchen daher bloss noch die richtigen Zahlen in diese Formel einzusetzen. ⎞ ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ ⎛ 2 x 1 x−1 ist r − a = ⎝ y ⎠ , Mit n = ⎝ 1 ⎠ , a = ⎝ 0 ⎠ , r = ⎝ y ⎠ z+2 z −1 −2 ur das Skalarprodukt liefert und die Formel f¨ n(r − a) = 2(x − 1) + y − (z + 2) , woraus sich durch Zusammenfassen die Ebenengleichung 2x + y − z = 4 ergibt. Beachten Sie, dass die Koeffizienten 2, 1, −1 von x, y, z gerade die Koordinaten des gegebenen Normalenvektors n sind. Allgemein hat die Ebenengleichung also die Form ax + by + cz = d , ⎛ ⎞ a n = ⎝ b ⎠ c
wo
ein Normalenvektor zur Ebene ist.
Wir h¨ atten daher die Ebenengleichung auch direkt in der Form 2x+y −z = d anschreiben k¨ onnen; die Gr¨ osse d h¨ atten wir dann durch Einsetzen der Koordinaten des in der Ebene liegenden Punktes A(1, 0, −2) gewonnen: d = 2 · 1 + 0 − (−2) = 4. Schliesslich sei noch bemerkt, dass die Ebenengleichung nicht eindeutig bestimmt ist. Man kann sie n¨ amlich noch mit einer beliebigen Zahl multiplizieren. So beschreibt etwa die Gleichung −4x − 2y + 2z = −8 ¨ mit der Tatsache, dass auch dieselbe Ebene; dies in Ubereinstimmung ⎛ ⎞ −4 ⎜ ⎟ n = ⎝ −2 ⎠ −2 2
37
2.7 Beispiele
ein Normalenvektor der Ebene ist.
Als Anschlussaufgabe bestimmen wir noch den Durchstosspunkt P der Geraden g aus 4. mit unserer Ebene. Seine Koordinaten x = 1 − 6t, y = −4 + 6t, z = 2 − 3t m¨ ussen auch die obige Ebenengleichung erf¨ ullen, d.h., es muss 2(1 − 6t) + (−4 + 6t) − (2 − 3t) = 4 sein. Dies trifft zu f¨ ur t = − 38 . Der Durchstosspunkt hat daher die Koordinaten P (17, −20, 10). 7. Als letzte Grundaufgabe bestimmen wir die Gleichung der Ebene, welche durch die ¨ drei Punkte A(2, 0, 1), B(1, 1, 2) und C(−1, 0, −1) geht. Wir f¨ uhren dazu die Uberlegungen von (1.10.c) zahlenm¨assig durch. Wir ben¨ otigen die drei Ortsvektoren ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 2 1 −1 −→ −−→ −−→ a = OA = ⎝ 0 ⎠ , b = OB = ⎝ 1 ⎠ , c = OC = ⎝ 0 ⎠ , 1 2 −1 sowie die Differenzen
⎛
⎞ −1 b − a = ⎝ 1 ⎠ 1
⎛
⎞ −3 und c − a = ⎝ 0 ⎠ . −2
Wir berechnen den Normalenvektor n = (b − a) × (c − a) und erhalten daf¨ ur nach der bekannten Formel ⎛ ⎞ −2 n = ⎝ −5 ⎠ . 3 −−→ Der Punkt R(x, y, z) liegt genau dann in der Ebene, wenn f¨ ur r = OR gilt: n(r − a) = 0 . F¨ ur dieses Skalarprodukt erhalten wir ⎛ ⎞⎛ ⎞ −2 x−2 ⎝ −5 ⎠ ⎝ y ⎠ = −2(x − 2) + (−5)y + 3(z − 1) = 0 3 z−1 oder umgeformt 2x + 5y − 3z = 1 . Zur Kontrolle k¨onnen Sie durch Einsetzen feststellen, dass die Koordinaten der drei Punkte A, B, C tats¨ achlich alle diese Gleichung erf¨ ullen. 8. Die obige Aufgabe kann auch unter Verwendung der Parameterdarstellung einer Ebene (1.10.d) gel¨ ost werden. Wir setzen die Werte f¨ ur a, b − a und c − a in die dort angegebene Formel ein und erhalten ⎛ ⎞ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ 2 −1 −3 2 − t − 3u ⎠, r = a + t(b − a) + u(c − a) = ⎝ 0 ⎠ + t ⎝ 1 ⎠ + u ⎝ 0 ⎠ = ⎝ t 1 + t − 2u 1 1 −2
2. Vektorrechnung mit Koordinaten
38
mit t, u ∈ R. In Koordinaten aufgeschrieben, sieht die obige Darstellung so aus: x = 2 − t − 3u y=t z = 1 + t − 2u .
¨blichen Weise. Wir eliminieren nun die Parameter t und u in der f¨ ur lineare Gleichungssysteme u Addition der ersten beiden Gleichungen einerseits und Subtraktion der zweiten von der dritten Gleichung anderseits liefert uns das Gleichungspaar x + y = 2 − 3u z − y = 1 − 2u . Nun multiplizieren wir noch die erste Gleichung mit 2, die zweite mit −3 und addieren erneut. Es folgt 2x + 5y − 3z = 1 , also gerade die in 7. gefundene Ebenengleichung. Auf diese Art kann man generell von der ¨bergehen. Parameterdarstellung zur Ebenengleichung u
2.8 Zusammenstellung
39
(2.8) Zusammenstellung In der untenstehenden Tabelle sind die wichtigsten Begriffe der Vektorrechnung in ihrer “geometrischen” (Kapitel 1) und ihrer “analytischen” (Kapitel 2) Erscheinungsform zusammengestellt. geometrisch
Vektoren
Summe a + b
b a
b a − b
a a
Vielfaches ra (r ∈ R) Skalarprodukt ab
ra (r > 0)
ra (r < 0)
a
L¨ ange von a mal L¨ ange von b mal Cosinus des Zwischenwinkels a × b
Vektorprodukt a × b
⎞ a 1 − b1 a − b = ⎝ a2 − b2 ⎠ a 3 − b3 ⎛
b Differenz a − b
⎞ a 1 + b1 a + b = ⎝ a2 + b2 ⎠ a 3 + b3 ⎛
a + b a
mit Koordinaten ⎛ ⎞ ⎛ ⎞ a1 b1 a = ⎝ a2 ⎠, b = ⎝ b2 ⎠ a3 b3
·
⎞ ra1 ra = ⎝ ra2 ⎠ ra3 ⎛
ab = a1 b1 + a2 b2 + a3 b3 ⎞ a 2 b3 − a 3 b2 a × b = ⎝ a3 b1 − a1 b3 ⎠ a 1 b2 − a 2 b1 ⎛
· b a
Betrag |a| Winkel ϕ zwischen a und b
L¨ ange des Vektors
ϕ
|a| =
a21 + a22 + a23
b cos ϕ = a
ab |a| · |b|
2. Vektorrechnung mit Koordinaten
40
(2.∞) Aufgaben 2−1 Die Punkte O(0, 0, 0), A(3, 2, −2), C(0, 2, −1) sind Ecken eines Parallelogramms, wobei sich A und C gegen¨ uberliegen. a) Bestimmen Sie die vierte Ecke B. b) Wie lang sind die Diagonalen OB und AC? c) Bestimmen Sie den spitzen Winkel zwischen den Diagonalen. d) Geben Sie die beiden Einheitsvektoren an, die normal zur Parallelogrammebene stehen. 2−2 Die Gerade g geht durch die Punkte A(1, 0, 1) und B(3, 2, −1). Die Gerade h geht durch P (5, 8, −1) und hat den Richtungsvektor ⎛
⎞ 3 ⎜ ⎟ q = ⎝ 1 ⎠ . −4 Schneiden sich die beiden Geraden? Wenn ja, in welchem Punkt? 2−3 Wie lautet die Gleichung der Ebene, welche durch die Punkte A(3, −1, 1), B(0, 2, 2), C(−2, 4, 0) geht? Skizzieren Sie die Ebene in einem kartesischen Koordinatensystem. 2−4 Die Ebene E geht durch den Punkt (0, 2, 0) und steht normal zu n, die Ebene F geht durch den Punkt (0, 1, 2) und steht normal zu m mit ⎛
⎞ ⎛ ⎞ 2 1 ⎜ ⎟ ⎜ ⎟ n = ⎝ 1 ⎠, m = ⎝3⎠. −1 1 a) Wie lauten die beiden Ebenengleichungen? b) Geben Sie eine Parameterdarstellung der Schnittgeraden von E und F an. ¨ 2−5 Gegeben sind die Punkte A(1, −2, 2), B(5, 2, 3), P (1, 3, 4) und Q(7, −1, 2). Uber welchem Punkt der x-y–Ebene kreuzen sich die Strecken AB und P Q? Welche liegt an dieser Stelle h¨ oher, und wie gross ist der H¨ ohenunterschied? 2−6 Zwei H¨ auser sind im rechten Winkel aneinandergebaut. Die Dachfl¨ achen des ersten Hauses haben einen Neigungswinkel von 25◦ , jene des zweiten Hauses einen solchen von 35◦ . Bestimmen Sie den Neigungswinkel der Schnittgeraden (alle Neigungswinkel beziehen sich auf die Horizontalebene).
1
2
2−7 Gegeben sind die Vektoren ⎞ −6 ⎜ ⎟ p = ⎝ 0 ⎠
⎛
⎛
12
und
⎞ 1 ⎜ ⎟ a = ⎝ −2 ⎠ . 2
Zerlegen Sie p in eine Summe p = q +r so, dass q parallel und r senkrecht zu a ist. (Verwenden Sie das Skalarprodukt, um die Projektion von p auf a zu bestimmen, vgl. Aufgabe 1−14.) 2−8 Von welchen Punkten der x-Achse aus sieht man die Punkte A(3, 2, 1) und B(−4, 4, 2) unter einem rechten Winkel?
2.∞ Aufgaben
41
Die Aufgaben 2−9 bis 2−11 gehen von der folgenden Situation aus: In den Punkten A0 (1, 3), B0 (4, 1) angeneinheit 1 m) sind vertikale Masten A, B, C errichtet worden, deren und C0 (6, 5) der x-y–Ebene (L¨ obere Enden mit A, B, C bezeichnet werden. Diese Masten haben der Reihe nach die H¨ ohe 6, 4, 5 m. angig voneinander gel¨ ost werden.) (Die drei Aufgaben k¨ onnen unabh¨ 2−9 Die Mastspitzen sollen die Ecken eines dreieckigen Daches sein. a) Berechnen Sie die Seitenl¨ angen dieses Dreiecks. b) Wie gross sind dessen Winkel? c) Wie gross ist der Fl¨ acheninhalt des Daches? 2−10 Wir denken uns das durch die Mastspitzen A, B, C gelegte Dach unbegrenzt ausgedehnt. a) Wo schneidet es die x-y–Ebene? b) Bestimmen Sie seinen Schnittwinkel mit der x-y–Ebene. c) Im Punkt D0 (4, 3) soll ein weiterer Mast errichtet werden, der genau bis unters Dach reicht. Wie hoch ist er? d) Auf das Dach wird eine Kugel gelegt. In welche Richtung q rollt sie? (Vgl. Aufgabe 1−19.) 2−11 Das Dach ist entfernt worden. Es sind aber noch die Dachlatten von der Spitze des Mastes A zu den Spitzen der Masten B und C u allt in Richtung ¨briggeblieben. Das Licht der Sonne f¨ (2, 1, −1) ein. a) Wo liegt der Schatten der Spitze von A? b) Wie lang sind die Schatten der beiden Dachlatten? A D c) Wie gross ist der Winkel, der diese beiden Schatten bilden? C 2−12 Die eingezeichneten W¨ urfel haben beide die Kantenl¨ ange 1 m. In den Punkten A, B, C, D befinden sich die folgenden Massen B (in kg): A: 2, B: 3, C: 4, D: 1. Bestimmen Sie die Koordinaten des Schwerpunktes des Systems ABCD. −→ − − → 2−13 In der Situation von Aufgabe 2−12 betrachten wir die Richtungsvektoren f = OA und g = OB (beachten Sie, dass dies keine Einheitsvektoren sind). In O greift eine Kraft F vom Betrag hat die Richtung g . 100 N (Newton) in Richtung f an; die Kraft G sein, damit die Resultierende R von F und G den Betrag a) Wie gross muss der Betrag von G 150 N hat? und R. b) Bestimmen Sie die Winkel zwischen F wirkt, so ist sein Drehmo2−14 Wenn auf einen im Punkt P befindlichen Massenpunkt die Kraft F − → , wo r = − r×F OP ist. Wir verwenden die Skizze ment (bzgl. O) M O gegeben durch MO = − → hat die Richtung − von Aufgabe 2−12. Der Massenpunkt befindet sich in C; die Kraft F CB und den Betrag 4 N (Newton). Berechnen Sie die Koordinaten des Vektors M O sowie seinen Betrag. 2−15 Im Erdmittelpunkt O bringen wir ein kartesisches Koordinatensystem an, in welchem die zAchse zum Nordpol und die x-Achse zum Nullmeridian zeigt. Die L¨ angeneinheit sei 1 km. Die ange und 47◦ 24 N Breite. Der Universit¨ at Z¨ urich Irchel (Punkt Z) liegt auf ca. 8◦ 33 E L¨ mittlere Erdradius betr¨ agt 6371 km. Der geostation¨ are Satellit Meteosat (M ) “steht” auf 0◦ ¨ L¨ ange u ¨ber dem Aquator. Sein Bahnradius betr¨ agt 42278 km. −→ −−→ a) Geben Sie die Koordinaten der Vektoren OZ und OM an (auf km genau). b) Unter welchem Winkel (sog. Elevation) gegen¨ uber der Horizontalebene muss man eine Empfangsantenne f¨ ur Meteosat in Z¨ urich ausrichten?
42
B. DIFFERENTIALRECHNUNG 3. BEISPIELE ZUM BEGRIFF DER ABLEITUNG ¨ (3.1) Uberblick Ich gehe davon aus, dass Sie schon fr¨ uher Kontakt mit der Differentialrechnung gehabt haben. Deshalb werden hier vor allem jene Gegenst¨ ande betont und teils auch repetiert, welche f¨ ur die Anwendungen in den Naturwissenschaften von Bedeutung sind. F¨ ur diese Anwendungen ist es zun¨ achst wichtig, zu erkennen, dass die Ableitung einer Funktion eine mathematische Begriffsbildung ist, welche zwingend ben¨ otigt wird, wenn man gewisse anschauliche Vorstellungen wie jene der Geschwindigkeit (und viele andere, zu denen als sehr bekannter Fall die Tangentensteigung geh¨ ort) in eine exakte Definition umsetzen will.
(3.5) (3.2) (3.4)
Allgemein (und deshalb etwas vage) kann man sagen, dass die Ableitung einer Funktion an einer Stelle Auskunft dar¨ uber gibt, wie sich die Funktion dort ¨andert. In Kapitel 7 werden wir allerdings noch eine etwas andere Anwendung der Ableitung kennenlernen: Sie liefert die bestm¨ogliche Approximation einer Funktion durch eine lineare Funktion. In diesem Kapitel werden zuerst einige Beispiele besprochen, in denen man von der Sache her automatisch auf die Ableitung gef¨ uhrt wird. Die pr¨ azisen Definitionen folgen in Kapitel 4. Als Vorbereitung dazu wird im vorliegenden Kapitel noch der Begriff des Grenzwerts einer Funktion behandelt.
(3.6)
(3.2) Geschwindigkeit Wenn man mit dem Auto eine Strecke von 150 km in zwei Stunden zur¨ uckgelegt hat, so betrug die Durchschnittsgeschwindigkeit in diesem Zeitraum offenbar 75 km/h gem¨ass der Formel Durchschnittsgeschwindigkeit =
zur¨ uckgelegte Strecke . ben¨otigte Zeit
F¨ ur den Fahrbetrieb ist aber neben der Durchschnittsgeschwindigkeit vor allem die Momentangeschwindigkeit, also die Geschwindigkeit in einem bestimmten Zeitpunkt, wichtig, so wie sie vom Tachometer angezeigt wird. Zwar hat man aus der Erfahrung ein recht genaues Gef¨ uhl daf¨ ur, was die Momentangeschwindigkeit bedeutet, doch ist es nicht ganz offensichtlich, wie diese Vorstellung
© Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0_2
3.2 Geschwindigkeit
43
mit einer Formel auszudr¨ ucken ist. Sicher kann die obenstehende Beziehung nicht verwendet werden, denn die Gr¨ ossen “zur¨ otigte Zeit” beziehen uckgelegte Strecke” und “ben¨ sich auf ein Zeitintervall und nicht auf einen Zeitpunkt. ¨ber einen Zeitraum von zwei Die oben berechnete Durchschnittsgeschwindigkeit u Stunden hat zweifellos nicht viel mit der Idee der Momentangeschwindigkeit zu tun. Betrachtet man aber eine viel k¨ urzere Zeitspanne, z.B. 1 Sekunde, so stimmt die Durchschnittsgeschwindigkeit in diesem Zeitraum schon sehr gut mit dem u ¨berein, was man ¨ intuitiv unter “Momentangeschwindigkeit” versteht, und die Ubereinstimmung wird offenbar um so besser, je kleiner die Zeitspanne wird. Die Momentangeschwindigkeit kann ur immer kleiner werdende Zeideshalb als Grenzfall der Durchschnittsgeschwindigkeit f¨ tintervalle aufgefasst werden. ucken. EinfachheitsDiesen Gedankengang wollen wir nun mathematisch ausdr¨ uhren daher ein halber nehmen wir an, dass sich das Auto geradlinig bewegt. Wir f¨ “eindimensionales” Koordinatensystem ein, dessen Achse mit der Bewegungsrichtung zusammenf¨allt. Zur Zeit t befinde sich das Auto im Punkt mit der Koordinate s(t). s(t) Wir betrachten nun zwei Zeitpunkte t0 und t1 mit t1 > t0 . Zu diesen Zeiten ist das Auto bei s(t0 ) bzw. s(t1 ): s(t0 )
s(t1 ) Δs
In der Zeit von t0 bis t1 , also im Zeitintervall der L¨ ange Δt = t1 − t0 , hat es eine Strecke der L¨ange Δs = s(t1 ) − s(t0 ) zur¨ uckgelegt. Somit ist v=
Δs s(t1 ) − s(t0 ) = Δt t 1 − t0
die Durchschnittsgeschwindigkeit des Autos im untersuchten Zeitintervall. Ist s(t1 ) < s(t0 ), so hat sich unser Auto von rechts nach links bewegt, also entgegen der Orientierung der Bewegungsachse. In diesem Fall wird Δs und damit v negativ (vgl. auch die Bemerkung weiter unten).
Wie schon erw¨ahnt, wird die intuitive Idee der Momentangeschwindigkeit im Zeitpunkt t0 um so besser realisiert, je kleiner man das Zeitintervall w¨ahlt, je n¨ aher also t1 an t0 heranr¨ uckt. Wir lassen daher t1 gegen t0 streben, d.h. wir betrachten den folgenden Grenzwert (vgl. (3.6)); statt t1 schreiben wir einfach t: lim
t→t0
s(t) − s(t0 ) Δs = lim . Δt→0 t − t0 Δt
3. Beispiele zum Begriff der Ableitung
44
Aufgrund der Herleitung dr¨ uckt nun dieser Grenzwert gerade unsere anschauliche Vorstellung von der “Momentangeschwindigkeit” aus. Wir haben also einen intuitiven ¨bersetzt: Begriff in eine exakte mathematische Definition u Die Momentangeschwindigkeit v0 = v(t0 ) zur Zeit t0 ist gegeben durch die Formel v0 = lim
t→t0
s(t) − s(t0 ) . t − t0
Dieser Ausdruck wirkt auf den ersten Blick vielleicht etwas kompliziert, weil er einen Grenz¨ ubergang enth¨ alt, er ist aber die einzige M¨ oglichkeit, den Begriff der Momentangeschwindigkeit u ¨berhaupt zu definieren. Bemerkung Es wurde schon in (1.2.a) erw¨ ahnt, dass die Geschwindigkeit eigentlich ein Vektor ist, denn es kommt sowohl auf die Gr¨ osse als auf die Richtung an. Da hier aber eine geradlinige Bewegung vorausgesetzt wird, ist die Richtung gegeben, und die Geschwindigkeit kann (als “eindimensionaler Vektor”) durch eine einzige Zahl beschrieben werden, welche je nach Bewegungsrichtung positiv oder negativ sein kann. Der Betrag dieser Zahl heisst auch “Schnelligkeit”. (Im t¨ aglichen Leben braucht man daf¨ ur bekanntlich meist das Wort “Geschwindigkeit”, was aber keine Verwirrung stiften sollte.) Der allgemeinste Fall wird in (8.4) besprochen. (3.3) Wachstumsgeschwindigkeit Es sei N = N (t) die von der Zeit t abh¨ angige Gr¨ osse einer Bakterienkultur. F¨ ur zwei Zeitpunkte t0 und t1 (t0 < t1 ) ist ΔN = N (t1 )−N (t0 ) der Zuwachs im Zeitintervall [t0 , t1 ]. (ΔN kann auch negativ sein, ein negativer Zuwachs entspricht einfach einer Abnahme). Um eine Vorstellung von der Schnelligkeit des Wachstums zu erhalten, muss man diesen Zuwachs ΔN nat¨ urlich auf die verflossene Zeit Δt = t1 − t0 , d.h. auf die L¨ ange des betrachteten Zeitintervalls, beziehen. Der Ausdruck ΔN N (t1 ) − N (t0 ) = Δt t1 − t 0 stellt den mittleren Zuwachs pro Zeiteinheit dar, der auch “mittlere Wachstumsgeschwindigkeit” genannt wird. Zur Terminologie: Die in solchen F¨ allen u ¨bliche Redewendung “pro Zeiteinheit” bezieht sich auf die Division durch Δt; das Adjektiv “mittlere” macht klar, dass nur Anfangs- und Endzustand (d.h. N (t0 ) und N (t1 )) ber¨ ucksichtigt werden, nicht aber der genaue Wachstumsverlauf dazwischen.
¨ Ahnlich wie im Beispiel (3.2) kann man sich f¨ ur die momentane Wachstumsgeschwindigkeit interessieren. Sie wird erhalten, indem man das betrachtete Zeitintervall immer mehr verkleinert, und ist formelm¨ assig durch
3.4 Tangente an eine Kurve
45
lim
Δt→0
ΔN N (t1 ) − N (t0 ) = lim t1 →t0 Δt t 1 − t0
definiert. Beachten Sie, dass der Grenzwert genau dieselbe Form wie jener in (3.2) hat. Noch etwas zu den Fachausdr¨ ucken. Statt von Wachstumsgeschwindigkeit sprechen manche Autoren von Wachstumsrate. In diesem Skript wird aber unter der Wachstumsrate etwas anderes verstanden, n¨ amlich der Quotient N (t)/N (t). N¨ ahere Informationen stehen in (15.3.b).
(3.4) Tangente an eine Kurve Wir betrachten den Graphen einer Funktion y = f (x) und w¨ahlen einen Wert x0 aus dem Definitionsbereich. (Die Kenntnis dieser Begriffe wird vorausgesetzt; sie sind in (26.9) zusammengestellt.) y f
y0
P x x0
Wir m¨ochten nun die Tangente an die Kurve im Punkt P (x0 , y0 ) bestimmen. Da diese jedenfalls durch P geht, gen¨ ugt es, ihre Steigung anzugeben. Zu diesem Zweck f¨ uhrt man die folgende, Ihnen wohl von fr¨ uher her bekannte, Betrachtung durch: Wir w¨ahlen einen von x0 verschiedenen Wert x1 auf der x–Achse und betrachten neben P (x0 , y0 ) noch P1 (x1 , y1 ). Dabei kann x1 sowohl > x0 als auch < x0 sein. y y1 f P1 y0
P ϕ1 x x0
x1
Die Steigung a = tan ϕ1 dieser Sekante ist gegeben durch a=
Δf f (x1 ) − f (x0 ) = . Δx x1 − x0
Lassen wir nun x1 gegen x0 streben, so wird sich die Sekante immer mehr jener Geraden n¨ ahern, die man vom Gef¨ uhl her die Tangente nennen wird.
3. Beispiele zum Begriff der Ableitung
46
F¨ ur die Steigung tan ϕ der Tangente wird man somit vern¨ unftigerweise die folgende Definition treffen: Δf f (x) − f (x0 ) tan ϕ = lim . = lim x→x0 Δx→0 Δx x − x0 y
Tangente
f P1 Sekante
P x Wiederum hat der Grenzwert dieselbe Form wie in (3.2). Es sei noch darauf hingewiesen, dass x sowohl von unten (von links) wie auch von oben (von rechts) gegen x0 streben kann. Damit man in sinnvoller Weise von der Tangentensteigung an der Stelle x0 sprechen darf, muss man in beiden F¨ allen denselben Wert tan ϕ f¨ ur die Steigung erhalten (vgl. auch (4.4.c)).
Wir geben noch ein einfaches Zahlenbeispiel f¨ ur die Funktion f (x) = x2 und die Stelle x0 = 1. Wichtig ist vor allem die letzte Kolonne, welche die Sekantensteigung angibt.
x
x0
Δx = x − x0
2 1.5 1.3 1.1 1.05 1.01 1.001
1 1 1 1 1 1 1
1 0.5 0.3 0.1 0.05 0.01 0.001
f (x) = x2
f (x0 ) = x20
4 2.25 1.69 1.21 1.1025 1.0201 1.002001
1 1 1 1 1 1 1
Δf = f (x) − f (x0 ) 3 1.25 0.69 0.21 0.1025 0.0201 0.002001
Δf Δx 3 2.5 2.3 2.1 2.05 2.01 2.001
y Wie Sie sehen (oder wenigstens erahnen), n¨ ahert sich die Sekantensteigung immer mehr dem Wert 2. Wenn Sie x von unten gegen 1 streben lassen (z.B. x = 0.5, 0.9, 0.99 . . .), so kommen Sie ebenfalls auf den Wert 2. Die Steigung der Tangente an die Parabel y = x2 im Punkt x0 = 1 ist deshalb gleich 2 zu setzen. (Dies k¨onnen Sie mit Hilfe der Ableitungsregeln auch direkt nachrechnen!)
x 0
1
3.6 Grenzwerte von Funktionen
47
(3.5) Zusammenfassung Der Versuch, einen anschaulich evidenten Sachverhalt formelm¨assig zu beschreiben, hat uns in drei ganz verschiedenen Situationen auf Grenzwerte derselben Art gef¨ uhrt, n¨ amlich auf lim
t→t0
s(t) − s(t0 ) N (t1 ) − N (t0 ) f (x) − f (x0 ) , lim , lim . t1 →t0 x→x0 t − t0 t1 − t0 x − x0
Es ist deshalb zweckm¨ assig, derartige Grenzwerte rein mathematisch und losgel¨ ost von der speziellen Problemstellung zu behandeln. Dies f¨ uhrt auf den wohlbekannten und wichtigen Begriff der Ableitung einer Funktion. Die drei Grenzwerte heissen dann der Reihe nach Ableitung von s(t) an der Stelle t0 ,
Ableitung von N (t) an der Stelle t0 ,
Ableitung von f (x) an der Stelle x0 .
Die Ableitung ist dabei als eine allgemeine mathematische Konstruktion aufzufassen, die es u ¨berhaupt erst erm¨ oglicht, Begriffe wie Geschwindigkeit oder Tangentensteigung zu definieren. Sie ist also unentbehrlich, wenn man mit diesen Begriffen arbeiten will. Es w¨ are indessen falsch, den Begriff der Ableitung nur gerade mit dem Tangentenproblem in Beziehung zu bringen. Allerdings ist diese Interpretation zur Veranschaulichung von gewissen Sachverhalten sehr geeignet, weil sich Graphen und Tangenten besser zeichnen lassen als z.B. Geschwindigkeiten. Noch ein letzter Punkt in diesem Zusammenhang. Man h¨ ort manchmal den Einwand: “Ja, was n¨ utzt mir eine Definition wie ‘Momentangeschwindigkeit = Ableitung der Funktion s(t)’, wenn ich die Funktion s(t) nicht kenne?” (wobei “kennen” gew¨ ohnlich heissen soll: “Eine h¨ ubsche Formel anschreiben k¨ onnen”). Die Entgegnung hierauf ist die folgende: Es geht zun¨ achst gar nicht darum, die Momentangeschwindigkeit zu berechnen, sondern vielmehr darum, sie u ¨ berhaupt erst einmal sauber zu definieren. Und eben hierzu ist der Begriff der Ableitung das richtige Werkzeug. (Beachten Sie auch ¨ die vektorielle Definition in Kapitel 8). Ubrigens wird dieses Werkzeug auch ben¨ otigt, wenn man die Tangente an eine Kurve exakt definieren will. Man ben¨ otigt dazu n¨ amlich ihre Steigung, und diese kann erst dann definiert werden, wenn man den allgemeinen Begriff der Ableitung kennt.
Die pr¨ azisen Definitionen folgen in Kapitel 4. Zuerst m¨ ussen wir aber noch Grenzwerte von Funktionen behandeln.
(3.6) Grenzwerte von Funktionen a) Beispiele In den obigen Beispielen wurde ohne weiteren Kommentar vom Grenzwert (oder Limes) einer Funktion gesprochen. Wir wollen diesen Begriff nun soweit n¨otig erl¨ autern.
3. Beispiele zum Begriff der Ableitung
48
Untersuchen wir noch einmal das Zahlenbeispiel am Schluss von (3.4). Wir haben dort den Ausdruck Δf f (x) − f (x0 ) x2 − x20 x2 − 1 = = = Δx x − x0 x − x0 x−1 aher an 1 herf¨ ur x0 = 1 betrachtet und uns gefragt, was passiert, wenn x immer n¨ ankommt. Man kann nun allerdings nicht direkt x = 1 setzen, denn dann k¨ ame der 2 −1 sinnlose Ausdruck 00 heraus. Ist jedoch x nahe bei 1, aber = 1, dann ist xx−1 nahe bei 2, wie man der Tabelle entnimmt, und die Ann¨ aherung an 2 wird offenbar immer besser, je n¨ aher x an 1 herankommt. Damit ist das Typische dieser Situation herausgesch¨ alt: Gegeben sei irgendeine Funktion g und eine Zahl x0 . Wir interessieren uns f¨ ur das Verhalten der Funktionswerte g(x), wenn x nahe bei x0 , aber = x0 ist. Dabei spielt es keine Rolle, ob die Funktion g an der Stelle x0 definiert ist oder nicht. Im obigen Beispiel ist g(x) = (x2 −1)/(x−1), x0 = 1 und g ist an der Stelle x0 = 1 nicht definiert. Wir erl¨ autern das Ganze an zwei weiteren Beispielen: y 1) Es sei g(x) = x + 2 und es sei x0 = 1. Anschaulich 3 ist unmittelbar klar: Wenn x nahe bei x0 , also nahe bei 1 ist, dann ist g(x) = x + 2 nahe bei g 1 + 2 = 3. (Das Wort nahe bezieht sich auf “beide Seiten von x0 ”, d.h., x kann < 1 und > 1 sein!) x 1 Man sagt, g habe an der Stelle 1 den Grenzwert 3 und schreibt lim g(x) = lim (x + 2) = 3 .
x→1
x→1
x2 −4 x−2
und es sei x0 = 2. Diese ra2) Es sei h(x) = tionale Funktion ist an der Stelle x0 = 2 nicht definiert (Z¨ahler und Nenner sind 0). Was geschieht nun in der N¨ ahe von x0 = 2? Wenn x nahe bei 2, aber = 2 ist, dann ist x−2 = 0, und wir d¨ urfen k¨ urzen: F¨ ur alle x = 2 (auch wenn sie noch so nahe bei 2 sind) ist
h(x) =
x2 − 4 (x − 2)(x + 2) = =x+2. x−2 x−2
y 4
h x 2
Damit l¨asst sich auch der Graph leicht zeichnen: F¨ ur alle x = 2 ist h(x) = x + 2, der Graph ist also eine Gerade. F¨ ur x = 2 ist h(x) nicht definiert, der Graph hat dort eine L¨ ucke.
3.6 Grenzwerte von Funktionen
49
Wenn also x immer n¨ aher an 2 herankommt, dabei aber stets = 2 bleibt, dann kommt h(x) = x + 2 immer n¨aher an 2 + 2 = 4 heran. Wir haben damit gezeigt: x2 − 4 =4. x→2 x − 2
lim h(x) = lim
x→2
b) Die Definition Gest¨ utzt auf die obigen anschaulichen Beispiele setzen wir folgendes fest: Die Zahl r heisst der Grenzwert (oder Limes) der Funktion g an der Stelle x0 , wenn g(x) beliebig nahe bei r liegt, f¨ ur alle x (x > x0 und x < x0 ), die gen¨ ugend nahe bei x0 sind, wobei aber stets x = x0 sein muss. Man schreibt f¨ ur diesen Sachverhalt: lim g(x) = r
x→x0
oder
g(x) → r f¨ u r x → x0 .
Beachtenswert ist, dass zur Bestimmung von lim g(x) nur die Funktionswerte x→x0
g(x) f¨ ur x = x0 eine Rolle spielen. Die Funktion g braucht an der Stelle x0 nicht einmal definiert zu sein. Der letztgenannte Sachverhalt tritt bei der Berechnung der Ableitung immer ein, siehe aber auch Beispiel 2) oben. In anderen F¨allen kann g(x0 ) zwar existieren, hat dann aber keinen Einfluss auf lim g(x). (Vgl. jedoch (4.6)). x→x0
Erg¨anzung: Pr¨ azise Definition des Grenzwertes F¨ ur das anschauliche Verst¨ andnis gen¨ ugt die obige Beschreibung des Grenzwerts. F¨ ur den Mathematiker ist sie allerdings zu wenig exakt, weil nicht genau gesagt wird, was “beliebig nahe” heissen soll. Die Tatsache, dass g(x) beliebig nahe bei r liegt, l¨ asst sich wie folgt umschreiben: Der Abstand |g(x) − r| (vgl. (26.8)) wird kleiner als jede beliebig vorgegebene, noch so kleine ur welche |x − x0 | kleiner positive Zahl ε, und zwar f¨ ur alle x = x0 , welche nahe genug bei x0 sind, d.h. f¨ als eine gewisse positive (und von ε abh¨ angige) Zahl δ ist. Damit ist die folgende Definition motiviert: Es sei g : D → R eine Funktion und es sei x0 ∈ R. Die Zahl r heisst der Grenzwert von g an ullt ist: der Stelle x0 , falls folgende Bedingung erf¨ Zu jedem ε > 0 existiert ein δ > 0, so dass |g(x) − r| < ε ist f¨ ur alle x ∈ D, x = x0 mit |x − x0 | < δ. (Zus¨ atzlich muss noch verlangt werden, dass es f¨ ur jedes δ > 0 u ¨berhaupt Zahlen x mit x ∈ D, x = x0 und |x − x0 | < δ gibt.) Man kann sich ε als “maximale zugelassene Abweichung” des Funktionswerts y = f (x) vom Grenzwert r denken. Zu diesem gegebenen ε sucht man sich eine “Toleranz” der x–Werte derart, dass f¨ ur jedes x, das um weniger als δ von x0 abweicht, der Wert f (x) innerhalb der maximalen zugelassenen Abweichung von r liegt, d.h. von r um weniger als ε abweicht. Die obige Bedingung besagt nun gerade, dass zu jeder (noch so kleinen) Maximalabweichung ε > 0 eine solche Toleranz δ > 0 gefunden werden ¨ kann. Ahnliche Betrachtungen finden Sie in (4.6.d) und (19.2.b). Wir werden diese etwas abstrakte Definition nur noch einmal — in (4.6.f) — verwenden. Sie ist aber unentbehrlich f¨ ur genauere Untersuchungen u ¨ber Grenzwerte. Aus ihr folgt z.B., dass der
3. Beispiele zum Begriff der Ableitung
50
Grenzwert, falls er existiert, eindeutig bestimmt ist (was erlaubt, den bestimmten Artikel zu verwenden!). Man benutzt sie auch, um die in (27.3.e) aufgelisteten, aber im vorliegenden Kapitel nicht weiter ur Grenzwerte zu beweisen. verwendeten, Rechenregeln f¨
c) Zur Existenz von Grenzwerten Es kann vorkommen, dass der Grenzwert gar nicht existiert. Betrachten wir z.B. die Funktion g(x) =
|x| = x
1
y x
−1 x < 0 1 x>0
-1
an der Stelle x0 = 0 (wo sie nicht definiert ist). N¨ahert man sich von links der “kritischen” Stelle 0, so strebt der Funktionswert nat¨ urlich gegen −1, n¨ ahert man sich dieser Stelle aber von rechts, so strebt er gegen 1. Es gibt also keine Zahl r derart, dass g(x) nahe bei r w¨are f¨ ur alle x in der N¨ ahe von 0: Der Limes von g an der Stelle 0 existiert nicht. d) Varianten des Grenzwertbegriffs Im Fall c) kann man von einseitigen Grenzwerten sprechen. Man sagt bzw. schreibt hier
– der Grenzwert von unten ist = −1 : lim g(x) = −1 oder lim g(x) = −1 x↑0
– der Grenzwert von oben ist = 1 : lim g(x) = 1 x↓0
x→0−
oder lim+ g(x) = 1 . x→0
Es ist leicht einzusehen, dass der (normale) Grenzwert genau dann existiert, wenn die beiden einseitigen Grenzwerte existieren und gleich sind. Zum Schluss erw¨ahnen wir noch einige weitere, ziemlich selbstevidente, Varianten von Grenzwerten: 1) Man schreibt lim g(x) = r, falls g(x) um so n¨aher an r herankommt, je gr¨ osser x x→∞
wird. (Analog f¨ ur x → −∞). 2) Man schreibt lim g(x) = ∞, falls g(x) beliebig gross (gr¨osser als jede vorgegebene x→∞
Zahl) wird, wenn nur x gen¨ ugend gross ist. (Analog f¨ ur −∞ statt ∞.) ur alle x, die gen¨ ugend 3) Man schreibt lim g(x) = ∞, falls g(x) beliebig gross wird, f¨ x→x0
nahe bei x0 liegen. Hievon gibt es auch einseitige Varianten, vgl. das dritte der untenstehenden Beispiele. Die folgenden Skizzen (mit je einem konkreten Beispiel) illustrieren die Situation besser als Worte.
51
3.∞ Aufgaben
y
y
1
y
2
3
x
x
lim
x→∞
1 =0 x
lim ex = ∞
x→∞
x
lim x↓0
1 =∞ x
e) Schlussbemerkung Im n¨ achsten Kapitel werden wir die Ableitung im Detail besprechen. Auch dort haben wir Grenzwerte zu betrachten, allerdings nicht von der eigentlich zur Diskussion stehenden Funktion f (x), sondern von der etwas komplizierteren Funktion x →
f (x) − f (x0 ) , x − x0
(x variabel, x0 fest) .
Diese Funktion ist an der Stelle x0 nicht definiert. Trotzdem kann man aber, wie wir gesehen haben, von ihrem Grenzwert an der Stelle x0 sprechen. (3.∞) Aufgaben Zu diesem Kapitel passen die Aufgaben 4−1 bis 4−8. In diesen Aufgaben werden aber einige Begriffe und Bezeichnungen verwendet, die erst in Kapitel 4 “offiziell” eingef¨ uhrt werden, weshalb sie erst dort erscheinen. Wahrscheinlich sind Ihnen diese Begriffe aber ohnehin vertraut, so dass Sie ohne weiteres etwas vorausgucken d¨ urfen.
52
4. DIE ABLEITUNG (ENGLISCH: DERIVATIVE)
¨ (4.1) Uberblick In diesem Kapitel geht es vor allem darum, den Begriff der Ableitung f (x0 ) in seiner allgemeinen Form zu definieren: f (x0 ) = lim
x→x0
f (x) − f (x0 ) . x − x0
(4.2)
F¨ ur die Ableitung ist eine ganze Reihe von weiteren Bezeichnungen gebr¨ auchlich, die Sie alle kennen sollten, wie z.B. df , y , x˙ dx
usw.
(4.3.c)
Durch Wiederholung des Vorgangs erh¨alt man die h¨oheren Ableitungen f (x),
d2 f , y , x ¨ dx2
usw.
Schliesslich werden noch die Begriffe “differenzierbar” und “stetig” eingef¨ uhrt und miteinander in Beziehung gebracht.
(4.5) (4.2), (4.6)
(4.2) Die Definition der Ableitung (englisch: derivative) Aufgrund der Beispiele (3.2) bis (3.4) und der Betrachtungen in (3.5) sollten die nachstehenden Definitionen hinl¨anglich motiviert sein. Zu den unten angef¨ uhrten f¨ unf Punkten ist folgendes zu sagen: Da die Ableitung als Grenzwert definiert ist und da ein solcher nicht unbedingt zu existieren braucht, f¨ uhrt man in 1), 2) und 3) den Begriff “differenzierbar” ein, um auszudr¨ ucken, dass der fragliche Grenzwert existiert. Man definiert dann in 4) die Ableitung an einer Stelle (dies ist eine Zahl) und schliesslich in 5) die abgeleitete Funktion (oft ebenfalls — und ohne grosse Verwechslungsgefahr — Ableitung genannt).
4.3 Bemerkungen zur Definition der Ableitung
53
Es sei f : D(f ) → R eine Funktion (einer Variablen) mit Definitionsbereich D(f ), und es sei x0 ∈ D(f ). 1) f heisst differenzierbar (englisch: differentiable) an der Stelle x0 , wenn der Grenzwert f (x) − f (x0 ) lim x→x0 x − x0 existiert. Unter anderem heisst das: er ist nicht ±∞. 0 ist erlaubt. 2) f heisst differenzierbar auf der Teilmenge X ⊂ D(f ), wenn f an jeder Stelle x0 ∈ X differenzierbar ist. 3) f heisst differenzierbar (ohne weitere Pr¨azisierung), falls diese Funktion auf ihrem ganzen Definitionsbereich differenzierbar ist. 4) Wenn f an der Stelle x0 differenzierbar ist, so heisst die Zahl f (x0 ) = lim
x→x0
f (x) − f (x0 ) x − x0
die Ableitung von f an der Stelle x0 . 5) Es sei D die Menge aller x, in denen f differenzierbar ist. Dann wird durch f : D → R,
x → f (x)
eine neue Funktion definiert. Sie heisst die abgeleitete Funktion (oder kurz Ableitung) von f .
(4.3) Bemerkungen zur Definition der Ableitung a) Allgemeines Die in dieser Definition verwendeten Begriffe “Funktion”, “Definitionsbereich” D(f ) sowie die beiden Pfeilsymbole (→ und →) werden als bekannt vorausgesetzt. Einige Erl¨auterungen finden Sie aber im Anhang (26.9). b) Zum Grenzwert Die Formel f¨ ur den Grenzwert kann auf viele verschiedene Arten geschrieben werden. Anstelle von x − x0 sind etwa die Bezeichnungen Δx oder h gebr¨auchlich. Es ist dann x = x0 + h, und x → x0 ist gleichbedeutend mit h → 0. Weiter setzt man oft y = f (x), y0 = f (x0 ). Ferner benutzt man f¨ ur die Differenz f (x) − f (x0 ) = y − y0 die Abk¨ urzungen Δf oder Δy.
54
4. Die Ableitung (englisch: derivative)
F¨ ur den Grenzwert lim
x→x0
f (x) − f (x0 ) x − x0
schreibt man daher auch je nach Situation lim
x→x0
y − y0 , x − x0
lim
h→0
f (x0 + h) − f (x0 ) , h
lim
Δx→0
Δf Δx
oder
lim
Δx→0
Δy . Δx
Der Ausdruck
Δf Δy = Δx Δx heisst aus naheliegenden Gr¨ unden “Differenzenquotient”. c) Bezeichnungen f¨ ur die Ableitung F¨ ur die Ableitung sind viele verschiedene Bezeichnungen im Gebrauch. Statt f (x0 ) schreibt man unter anderem (mit y = f (x)) df (x0 ) dx
oder
dy (x0 ) dx
y (x0 ) ,
oder
konkret z.B.
dx2 d sin x (x0 ) , (0) etc. dx dx Das Argument x0 wird oft weggelassen, und man setzt dann f (x) = y =
df dy = dx dx
etc.
Schliesslich sieht man manchmal auch noch Gebilde wie d d f (x) , ln(x2 + 1) dx dx
etc. ,
dies vor allem dann, wenn die Funktion f durch einen komplizierten Ausdruck gegeben ist. Das Zeichen
df dx (gesprochen “df nach dx”) ist dabei nicht etwa als Quotient zweier Gr¨ossen aufzufassen, sondern als ein Symbol als Ganzes. Die Ausdr¨ ucke df und dx haben f¨ ur sich df allein keine Bedeutung (wenigstens vorl¨aufig, vgl. (7.4)). Trotzdem nennt man dx den Δf Differentialquotienten, in Analogie zum Differenzenquotienten Δx . Die Ableitung kann dann in der Form df Δf lim = Δx→0 Δx dx geschrieben werden.
4.4 Beispiele zur Differenzierbarkeit
55
df ater allerdings zeigen, dass sich der Ausdruck dx Es wird sich sp¨ oft so benimmt, wie wenn er wirklich ein Bruch w¨ are (Kettenregel (5.5.c), Ableitung der Umkehrfunktion (17.4)), doch muss dieses Verhalten in jedem einzelnen Fall speziell begr¨ undet werden.
In den Anwendungen heisst die Variable nicht immer x; je nach der konkreten Situation werden auch andere Zeichen verwendet. Besonders h¨ aufig kommt die Zeit t als Variable vor, die Ableitung nach der Zeit wird dann etwa mit ds dv dQ , , dt dt dt
etc.
¨ bezeichnet. Ublich ist aber auch die Verwendung von Punkten statt Strichen: s˙ = s(t), ˙ v˙
etc.
Die Vielfalt der Bezeichnungen ist u.a. historisch bedingt; diese gehen bis auf die beiden Begr¨ under der Infinitesimalrechnung*, G.W. Leibniz, 1646–1716 (dy, dx) und I. Newton, 1643–1727 (x), ˙ zur¨ uck. Es ist wichtig, dass Sie mit diesen verschiedenen Notationen vertraut sind. (4.4) Beispiele zur Differenzierbarkeit In den folgenden Beispielen geht es darum, die Begriffe aus (4.2) zu illustrieren und zu zeigen, wie man — wenigstens in einfachen F¨ allen — die Ableitung als Grenzwert berechnen kann. a) Quadratfunktion f (x) = x2 ,
D(f ) = R .
Es sei x0 eine beliebige Zahl. Wir betrachten den Differenzenquotienten: Δf x2 − x20 (x − x0 )(x + x0 ) f (x) − f (x0 ) = = . = Δx x − x0 x − x0 x − x0 W¨ urde man hier x = x0 setzen, so k¨ame der undefinierte und sinnlose Quotient 00 heraus. Unsere Aufgabe ist aber eine andere. Wir m¨ ussen den Limes des Differenzenquotienten f¨ ur x → x0 bestimmen, und dabei ist definitionsgem¨ ass stets x = x0 zu w¨ ahlen (vgl. (3.6)). Deshalb d¨ urfen wir k¨ urzen und finden Δf = lim (x + x0 ) = 2x0 , x→x0 Δx→0 Δx
f (x0 ) = lim
denn wenn x sich der Zahl x0 immer mehr n¨ahert, so n¨ ahert sich x + x0 immer mehr der Zahl 2x0 , wie man wegen (x + x0 ) − 2x0 = x − x0 sieht. (Ein Zahlenbeispiel haben wir in der Tabelle aus (3.4) gesehen; f¨ ur x0 = 1 ist f (x0 ) = 2.) * Die Infinitesimalrechnung umfasst die Differential- und die Integralrechnung; h¨aufig wird auch die Bezeichnung “Analysis” verwendet.
56
4. Die Ableitung (englisch: derivative)
Es folgt: Die Funktion f (x) = x2 ist an der Stelle x0 differenzierbar, und ihre ur jedes x0 gilt, k¨onnen wir den Index 0 einfach Ableitung ist dort = 2x0 . Da dies f¨ weglassen und sagen, die Funktion f sei differenzierbar (d.h. differenzierbar f¨ ur jedes x ∈ D(f ) = R, vgl. (4.2.3)) und es gelte f (x) = 2x . Damit haben wir auch die abgeleitete Funktion f von f gefunden (vgl. (4.2.5)). b) Wurzelfunktion f (x) =
√
x,
D(f ) = {x | x ≥ 0} .
Wir w¨ ahlen ein x0 ∈ D(f ), also ein x0 ≥ 0. Es ist (Trick, wende den 3. binomischen Satz an): √ √ √ √ x − x0 x − x0 1 Δf √ =√ = √ = √ √ √ Δx x − x0 ( x − x0 )( x + x0 ) x + x0 f¨ ur alle x = x0 , x ≥ 0, ¨ahnlich wie in a). Somit ist 1 Δf 1 df = lim = lim √ √ = √ , dx Δx→0 Δx x→x0 x + x0 2 x0 ur x0 = 0 existiert der Limes nicht. (Der betrachtete Ausdruck aber nur f¨ ur x0 = 0. F¨ strebt zwar gegen ∞, aber so etwas wird nicht als Grenzwert im eigentlichen Sinne betrachtet, denn ∞ ist keine Zahl.) Die Wurzelfunktion ist also an der Stelle x0 = 0 zwar definiert, aber nicht differenzierbar. Geometrisch ¨aussert sich dies dadurch, dass der Graph im Nullpunkt eine senkrechte Tangente hat. (Wir haben hier somit den Ausnahmefall, wo die Tangente existiert, nicht aber die Ableitung!) y f (x) =
√
x
x D, und es gilt Mit den Bezeichnungen von (4.2) ist D = {x | x > 0} = f : D → R,
1 f (x) = √ . 2 x
4.4 Beispiele zur Differenzierbarkeit
57
c) Betragsfunktion f (x) = |x|,
D(f ) = R .
Wir w¨ ahlen x0 = 0. Dann ist Δf |x| − |0| |x| 1 = = = −1 Δx x−0 x
x>0 x 0 gibt es eine (von ε abh¨ ur alle x ∈ D mit |x − x0 | < δ. (Die Voraussetzungen x, x0 ∈ D Zahl δ > 0 mit |f (x) − f (x0 )| < ε f¨ verstehen sich von selbst.) Diese Bedingung f¨ ur die Stetigkeit von f in x0 l¨ asst sich anhand der folgenden Skizze veranschaulichen:
y
f
ε f (x0 ) ε
x δ x0 δ Zu jeder gegebenen “Maximalabweichung” ε > 0 l¨ asst sich also eine “Toleranz” δ > 0 angeben, so dass f¨ ur alle x im “Toleranzbereich” (|x − x0 | < δ) f (x) um weniger als die “Maximalabweichung” von f (x0 ) entfernt ist (|f (x) − f (x0 )| < ε).
¨ Ahnlich wie in (4.2) trifft man noch folgende Festsetzungen: 1) Die Funktion f : D → R heisst stetig auf der Teilmenge X ⊂ D, wenn sie an jeder Stelle x0 ∈ D stetig ist. 2) Die Funktion f : D → R heisst stetig (ohne weitere Pr¨ azisierung), wenn sie auf ihrem ganzen Definitionsbereich stetig ist. e) Wichtige stetige Funktionen Man kann nun (mit einigem Aufwand) unter Verwendung der obigen Definition die bekannten Funktionen auf ihre Stetigkeit untersuchen. Wir verzichten darauf, zumal die Stetigkeit aller gebr¨ auchlichen Funktionen anschaulich evident ist. Zudem werden wir in (4.6.g) lernen, dass jede differenzierbare Funktion automatisch stetig ist. Nun sind aber (wie wir in Kapitel 5 noch sehen werden) die u ¨blichen Funktionen wie Polynome, rationale Funktionen, trigonometrische Funktionen, Exponentialfunktionen, Logarithmus, alle differenzierbar und somit stetig, eventuell mit Ausnahme von einzelnen Punkten. f) Stetigkeit und Grenzwert Ein Vergleich der Definitionen des Grenzwerts (3.6.b) und der Stetigkeit (4.6.d) ¨ zeigt gewisse Ahnlichkeiten. In der Tat gilt folgendes:
62
4. Die Ableitung (englisch: derivative)
Die Funktion f ist genau dann an der Stelle x0 stetig, wenn lim f (x) = f (x0 ) ist. x→x0
Die Redewendung “genau dann” bedeutet, dass aus der einen Bedingung die andere folgt und aquivalent” sind (vgl. (26.6)). umgekehrt; mit anderen Worten, dass die beiden Bedingungen “¨ Wir nehmen u ¨brigens stillschweigend an, dass es zu jedem δ > 0 Zahlen x ∈ D mit |x − x0 | < δ gibt, vgl. (3.6.b). Die obige Behauptung beweist man so: ur alle x ∈ D 1) f sei stetig in x0 . Zu jedem ε > 0 gibt es dann ein δ > 0 mit |f (x) − f (x0 )| < ε f¨ mit |x − x0 | < δ. Damit ist aber gem¨ ass (3.6.b) f (x0 ) = limx→x0 f (x). 2) Es sei f (x0 ) = limx→x0 f (x) (diese Schreibweise beinhaltet nat¨ urlich automatisch die Existenz des Grenzwerts). Nach (3.6.b) existiert dann zu jedem ε > 0 ein δ > 0 mit |f (x) − f (x0 )| < ε f¨ ur alle x ∈ D mit |x − x0 | < δ und x = x0 . Damit ist die Bedingung f¨ ur die Stetigkeit fast ur x = x0 ist aber |f (x) − f (x0 )| = 0 < ε, so dass die erf¨ ullt, “fast” wegen der Klausel x = x0 . F¨ ur die Stetigkeit f¨ ur alle x ∈ D mit |x − x0 | < δ gilt. Dies war zu zeigen. Bedingung f¨
g) Stetigkeit und Differenzierbarkeit Die meisten Funktionen, mit denen wir uns befassen, sind in der Regel (allenfalls mit Ausnahme von einzelnen Stellen) differenzierbar.Es ist deshalb n¨ utzlich zu wissen, dass eine differenzierbare Funktion automatisch stetig ist. Wenn man sich (etwas naiv, weil nicht der vollen Wahrheit entsprechend) unter Differenzierbarkeit die Existenz der Tangente und unter Stetigkeit das Nichtvorhandensein einer Sprungstelle vorstellt, dann ist diese Behauptung klar, denn wenn der Graph von f in x0 eine Tangente hat, dann hat er dort sicher keine Sprungstelle. Der formale Beweis benutzt die Definition der Differenzierbarkeit (4.3) und die in (4.6.f) gegebene alternative Beschreibung der Stetigkeit: Zu zeigen ist: lim f (x) = f (x0 ) .
x→x0
Weil f in x0 differenzierbar ist, gilt f (x) − f (x0 ) → f (x0 ) x − x0
f¨ ur
x → x0 .
Dabei ist stets x = x0 . Durch Multiplikation mit x − x0 = 0 folgt f (x) − f (x0 ) → f (x0 )(x − x0 ) . Mit x → x0 strebt aber die rechte Seite gegen 0, somit auch die linke Seite, d.h., es ist wie gew¨ unscht lim f (x) = f (x0 ) .
x→x0
Hinweis Die Umkehrung der Behauptung gilt nicht, d.h., eine stetige Funktion braucht nicht differenzierbar zu sein. So ist etwa f (x) = |x| an der Stelle 0 stetig, aber nicht differenzierbar, vgl. (4.4.c). (Die Ecke des Graphen bewirkt zwar, dass die Tangente im Nullpunkt nicht existiert, sie verletzt aber die Stetigkeit √ ¨ nicht.) Ahnlich ist die Wurzelfunktion f (x) = x im Nullpunkt stetig, aber nicht differenzierbar.
4.6 Exkurs u ¨ber stetige Funktionen
63
h) Ersatz von unstetigen durch differenzierbare Funktionen Im Beispiel (3.3) haben wir die Funktion N (t) betrachtet, welche die Gr¨ osse einer Bakterienkultur beschreibt und die Wachstumsgeschwindigkeit durch N (t) = lim
Δt→0
ΔN Δt
definiert. Nun ist aber N (t) von Natur aus eine unstetige Funktion; denn sie kann ja nur ganzzahlige Werte annehmen: Zu jedem Zeitpunkt, wo eine Teilung stattfindet oder wo ein Bakterium verstirbt, macht sie einen Sprung. N (t) ist also nicht u ¨berall differenzierbar, die Wachstumsrate N (t) l¨asst sich streng genommen gar nicht definieren. Man behilft sich nun so, dass man nicht die wirkliche Funktion N (t) betrachtet, sondern sie durch eine “glatte ” (technisch gesprochen: differenzierbare) Funktion ersetzt, vgl. die Skizze unten. Der Fehler, den man dabei begeht, ist minim (ein Bakterium mehr oder weniger spielt hier sicher keine Rolle), und man hat den grossen Vorteil, dass man auf die neue Funktion die Methoden der Differentialrechnung anwenden darf. N
t Derartige Idealisierungen sind in den Naturwissenschaften h¨aufig. Man vernachl¨assigt gewisse Erscheinungen, damit das Wesentliche hervorgehoben und einer rechnerischen Behandlung zugef¨ uhrt werden kann. i) Einige Eigenschaften von stetigen Funktionen In (4.6.a) wurde erw¨ ahnt, dass stetige Funktionen verschiedene w¨ unschenswerte Eigenschaften haben. Im folgenden sind — etwas vorausblickend — drei davon aufgef¨ uhrt. • Die Funktion f sei stetig auf dem abgeschlossenen Intervall [a, b]. Wenn die Funktionswerte f (a) und f (b) verschiedene Vorzeichen haben (also f (a) < 0 und f (b) > 0 oder umgekehrt), dann gibt es mindestens eine Zahl c in [a, b] mit f (c) = 0. Diese Aussage heisst der “Zwischenwertsatz”. • Die Funktion f sei stetig auf dem abgeschlossenen Intervall [a, b]. Dann nimmt sie in diesem Intervall ein absolutes Maximum und ein absolutes Minimum an; vgl. (6.5.c). • Die Funktion f sei stetig auf dem abgeschlossenen Intervall [a, b]. Dann existiert das bestimmte Integral b f (x) dx , a
vgl. (10.3.a).
4. Die Ableitung (englisch: derivative)
64
Wir verzichten hier auf die Beweise dieser Behauptungen. Vielleicht wundern Sie sich, dass eine so anschauliche Aussage wie etwa die erste u ¨ berhaupt eines Beweises bedarf. Nun ist aber unsere anschauliche Vorstellung von Stetigkeit in eine doch etwas abstrakte Definition umgegossen worden, uhren. und die Beweise sind mit dieser Definition und nicht unter Verwendung der Anschauung zu f¨ Dies sei aber den Mathematikern u ¨ berlassen.
(4.∞) Aufgaben 4−1 Bei einem Ballonaufstieg wird in der H¨ ohe h (in Meter) u ¨ber dem Boden der Luftdruck p(h) (in Hektopascal) gemessen. Ordnen Sie den Formeln (a), (b), (c) eine der Beschreibungen (1), (2), (3) oder (4) zu. (a) p(h1 ) − p(h2 ), (1) (2) (3) (4)
(b)
p(h1 ) − p(h2 ) , h1 = h2 , h1 − h 2
(c)
lim
h1 →h2
p(h1 ) − p(h2 ) . h1 − h2
¨ Mittlere Anderung des Luftdrucks pro Meter H¨ ohendifferenz. Luftdruckdifferenz. ¨ Lokale Anderungsgeschwindigkeit des Luftdrucks in der H¨ ohe h1 . ¨ Lokale Anderungsgeschwindigkeit des Luftdrucks in der H¨ ohe h2 .
4−2 In einem offenen Gef¨ ass befindet sich eine Fl¨ ussigkeit, die im Verlauf der Zeit verdunstet. Zum Zeitpunkt t ist die Fl¨ ussigkeitsmenge F (t) vorhanden. Finden Sie passende (sprachliche) Bezeichnungen f¨ ur (a)
F (t) − F (t0 ) , t > t0 , t − t0
(b) lim
t→t0
F (t) − F (t0 ) . t − t0
Welches Vorzeichen hat der Ausdruck (a)? 4−3 Die Funktion K(s) gibt die Kosten f¨ ur die Herstellung von s St¨ uck eines Massenartikels an. Im Sinne einer Idealisierung nehmen wir an, dass sowohl s als auch K(s) beliebige positive Werte annehmen (obwohl es streng genommen sinnlos ist, von der Herstellung von 1000.1 B¨ uroklammern zu reden). K(s2 ) − K(s1 ) , s2 > s1 ? s2 − s1 K(s2 ) − K(s1 ) nennt man die Marginalkosten (Grenzb) Den Grenzwert K (s1 ) = lim s2 →s1 s 2 − s1 kosten). Was k¨ onnen Sie sich anschaulich darunter vorstellen? a) Welche Bedeutung hat der Quotient
4−4 In der Physik wird die elektrische Stromst¨ arke I definiert als die Ladungsmenge, die pro Zeiteinheit durch den Querschnitt des elektrischen Leiters fliesst. Wie kann man dies mit einer Formel ausdr¨ ucken? (Die Ladungsmenge wird mit Q = Q(t), t die Zeit, bezeichnet.) 4−5 Die L¨ ange L eines Metallstabs h¨ angt bekanntlich von seiner Temperatur T ab, es ist L = L(T ). Wird diese von T1 auf T2 erh¨ oht, so nimmt die L¨ ange von L1 = L(T1 ) auf L2 = L(T2 ) zu. Definieren Sie den mittleren Ausdehnungskoeffizienten f¨ ur das Temperaturintervall von T1 bis ur die Temperatur T1 . T2 sowie den Ausdehnungskoeffizienten f¨ 4−6 Bei einer chemischen Reaktion A+B −→ C entsteht aus zwei in einem L¨ osungsmittel gel¨ osten Stoffen A, B ein dritter Stoff C. Es sei x = x(t) die zum Zeitpunkt t vorhandene Konzentration des Stoffes C, die hier zweckm¨ assigerweise in Mol pro Liter gemessen wird. Unter der mittleren ¨ Reaktionsgeschwindigkeit versteht man die Anderung (in diesem Fall die Zunahme) der Konzentration pro Zeiteinheit. Dr¨ ucken Sie dies f¨ ur das Zeitintervall von t0 bis t0 + Δt (Δt > 0) formelm¨ assig aus. Wie k¨ onnen Sie die momentane Reaktionsgeschwindigkeit zum Zeitpunkt t0 definieren?
65
4.∞ Aufgaben
4−7 Ein Massenpunkt bewegt sich auf einer kreisf¨ ormigen Bahn. Zur Zeit t hat er, ausgehend uckgelegt. (Dabei wird eine von einer Nullrichtung, den Winkel ϕ(t) (im Bogenmass!) zur¨ Umlaufsrichtung positiv gerechnet; ϕ(t) kann auch > 2π oder < 0 sein.) Definieren Sie die Winkelgeschwindigkeit und die Winkelbeschleunigung. 4−8 Ortsabh¨ angige Konzentration. Wenn ein Salz gleichm¨ assig in Wasser aufgel¨ ost ist, so versteht man unter der Konzentration der L¨ osung die Menge des gel¨ osten Stoffes pro Volumeneinheit (z.B. pro Liter) Wasser. Nun geben wir aber das Salz auf den Boden eines Gef¨ asses und f¨ ullen dieses sorgf¨ altig mit Wasser. In diesem Fall ist das Salz (zumindest anf¨ anglich) nicht gleichm¨ assig verteilt. Wie soll man jetzt die Konzentration definieren? Wir betrachten dazu ein zylindrisches Wassergef¨ ass mit H¨ ohe H und Querschnittsfl¨ ache Q. Mit M (h) bezeichnen wir die Salzmenge, die (in einem festen Zeitpunkt) im Volumen bis zur H¨ ohe h gel¨ ost ist. a) Definieren Sie die mittlere Konzentration im Volumenst¨ uck zwischen h0 und h. b) Definieren Sie die Konzentration an der Stelle h0 . c) Nach fleissigem Umr¨ uhren ist das Salz gleichm¨ assig in der L¨ osung verteilt, mit der konstanten Konzentration c. Zeigen Sie, dass dann die gem¨ ass b) definierte “lokale Konzentration” in diesem Spezialfall u ¨berall gleich c ist.
H
h h0
4−9 “Experimentelle” Berechnung der Ableitung. Bestimmen Sie einen N¨ aherungswert der Ableitung f (x0 ), indem Sie den Differenzenquotienten f (x0 + h) − f (x) h f¨ ur einige gegen Null strebende Werte von h (z.B. h = 0.1, 0.01, 0.001 . . .) zahlenm¨ assig berechnen und die entstehende Zahlenfolge beobachten. Tun Sie dies f¨ ur a) f (x) = tan x, x0 = 0, b) f (x) = xx , x0 = 2. (In a) m¨ ussen Sie Ihren Rechner auf das Bogenmass einstellen.) 4−10 Berechnen Sie f (x), indem Sie direkt die Definition (4.2) (und nicht etwa die Ihnen wohl von fr¨ uher her bekannten Ableitungsformeln aus Kapitel 5) verwenden: 1 x , x = 1, c) f (x) = √ , x > 0. a) f (x) = x3 + x2 + 1, b) f (x) = 1−x x 4−11 Geben Sie jeweils an, ob die Funktion f an der Stelle x0 differenzierbar (D), stetig, aber nicht differenzierbar (S) oder unstetig (U) ist. a) f (x) = x|x|, x0 = 0. c) f (x) = x + |x|, x0 = 0. sin x f¨ ur x < 0 e) f (x) = , x0 = 0. cos x f¨ ur x ≥ 0
b) f (x) = | sin x|, x0 = 0. 1/(x − 1)2 f¨ ur x = 1 , x0 = 1. d) f (x) = 1 f¨ ur x = 1 0 f¨ ur x < 0 , x0 = 0. f) f (x) = ur x ≥ 0 x2 f¨
4−12 Bestimmen Sie die Zahl c so, dass die Funktion f an der Stelle x0 = 1 stetig ist.
2 x−1 x − 2x + 1 f¨ ur x = 1 √ f¨ ur x = 1 b) f (x) = a) f (x) = x−1 x−1 c f¨ ur x = 1. c f¨ ur x = 1. 2 2 x f¨ ur x ≤ 1 x f¨ ur x ≤ 1 c) f (x) = d) f (x) = c − x f¨ ur x > 1. cx + 1 f¨ ur x > 1.
66
5. TECHNIK DES DIFFERENZIERENS ¨ (5.1) Uberblick Die praktische Berechnung der Ableitung einer Funktion erfolgt durch Anwendung gewisser Formeln und Regeln: Man muss einerseits die Ableitung der wichtigsten Funktionen kennen (Ableitungsformeln) und anderseits wissen, wie eine Funktion abgeleitet wird, die aus einfacheren Bestandteilen (etwa durch Summen- oder Produktbildung) zusammengesetzt ist (Ableitungsregeln). Die folgenden Ausf¨ uhrungen richten sich an Leserinnen und Leser, welche diese Regeln (wenigstens zum Teil) bereits kennen und etwas Routine im Ableiten haben. Aus diesem Grund werden einerseits alle Formeln gesamthaft pr¨asentiert und anderseits nur relativ wenige Beispiele gege¨ ben. Wer keine oder wenig Ubung im Differenzieren hat, soll sich durch L¨ osen von zus¨ atzlichen Aufgaben die n¨ otige Sicherheit verschaffen. Im Sinne einer Auswahl werden schliesslich einige der Ableitungsregeln begr¨ undet.
(5.3)
(5.2)
(5.7)
(5.2) Die Ableitungsregeln
Funktion
Ableitung
Bezeichnung
f (x) + g(x)
f (x) + g (x)
Summenregel
f (x) − g(x)
f (x) − g (x)
Differenzenregel
Regel vom konstanten Faktor (c ∈ R)
cf (x)
cf (x)
f (x)g(x)
f (x)g(x) + f (x)g (x)
Produktregel
f (x) g(x)
f (x)g(x) − f (x)g (x) g(x)2
Quotientenregel
f (g(x))
f (g(x)) · g (x)
Kettenregel
Die Aussagen sind dabei so zu interpretieren: Wenn die Funktionen f und g an der Stelle x differenzierbar sind, dann ist auch f + g an der Stelle x differenzierbar, und die angegebene Formel gilt, analog f¨ ur die anderen Regeln.
5.3 Die Ableitung der wichtigsten Funktionen
67
(5.3) Die Ableitung der wichtigsten Funktionen
Funktion y = f (x)
Ableitung y = f (x)
c = const
0
xn
nxn−1
x 1 x √
1
Bemerkungen
Gilt f¨ ur alle n ∈ R, falls x > 0. Gilt f¨ ur alle n ∈ Z und beliebige x (f¨ ur n < 0 muss jedoch x = 0 sein).
1 x2 1 √ 2 x
− x
x = 0 x>0
ex
ex
ax
ax · ln a
a>0
ln x
1 x
x>0
loga x
1 x · ln a
x > 0, a > 0
sin x
cos x
cos x
− sin x
tan x
1 + tan2 x =
cot x
−(1 + cot2 x) = −
arcsin x arctan x arccos x arccot x
1 1 − x2 1 1 + x2 1 −√ 1 − x2 1 − 1 + x2 √
1 cos2 x 1 sin2 x
x =
π + kπ (k ∈ Z) 2
x = kπ (k ∈ Z) |x| < 1
|x| < 1
5. Technik des Differenzierens
68
Funktion y = f (x)
Ableitung y = f (x)
sinh x
cosh x
cosh x
sinh x
tanh x coth x arsinh x arcosh x artanh x arcoth x
1 cosh2 x 1 1 − coth2 x = − sinh2 x
Bemerkungen
1 − tanh2 x =
1 1 + x2 1 √ 2 x −1 1 1 − x2 1 1 − x2
x = 0
√
x>1 |x| < 1 |x| > 1
Bemerkungen a) Die am Rand mit einer dicken Linie versehenen Formeln sollten Sie zu jeder Zeit auswendig wissen. b) Exponentialfunktion, Logarithmus und die trigonometrischen Funktionen werden grunds¨ atzlich als bekannt vorausgesetzt. Eine kurze Zusammenfassung finden Sie im Anhang, (26.13) bis (26.15). Ferner kommen wir in Kapitel 18 auf einige praktische Anwendungen dieser Funktionen zu sprechen. c) Die Funktionen in den letzten drei K¨astchen werden nicht als bekannt vorausgesetzt. Sie werden erst sp¨ ater eingef¨ uhrt ((17.2), (18.6), (18.7)), ihre Ableitungen sind aber der Vollst¨ andigkeit halber schon hier tabelliert worden. d) Beachten Sie, dass die Formel f¨ ur die Ableitung von f (x) = xn auch Funktionen √ 1 3 wie 2 oder x miteinschliesst, wie man unter Verwendung von negativen und x √ 1 1 gebrochenen Exponenten einsieht: Es ist ja 2 = x−2 , 3 x = x 3 etc. (siehe (26.3.c) x und Beispiel (5.4.2)). Insbesondere sind die h¨aufig verwendeten Ableitungsformeln √ 1 urlich jene f¨ ur x) Spezialf¨ alle der Formel f¨ u r xn . f¨ ur und x (sowie nat¨ x (5.4) Beispiele Aus den in (5.1) erw¨ ahnten Gr¨ unden f¨ uhren wir hier nur wenige Beispiele an. Es sei ¨ aber betont, dass nur ausgiebiges Uben zur wirklichen Beherrschung der Regeln f¨ uhrt.
5.4 Beispiele
69
otig, sich daran zu gew¨ Es ist auch n¨ ohnen, dass in der Praxis die Funktion nicht immer f und die Variable nicht immer x heisst. 1. f (x) = x3 + 5x2 + 1. urfen wir die Ableitung der beiden Summanden einzeln beNach der Summenregel d¨ ur den ersten (x3 ) liefert die Tabelle f¨ rechnen. F¨ ur den zweiten ur die Ableitung 3x2 , f¨ brauchen wir zuerst die Regel vom konstanten Faktor: Die Ableitung von x2 ist 2x, jene von 5x2 also 5 · 2x = 10x. Schliesslich ist die Ableitung der Konstanten 1 gleich 0. Zusammen also: f (x) = 3x2 + 10x . Speziell ist z.B. f (2) = 32 die Ableitung an der Stelle 2. √ 2 3 3 2. G(t) = 2 + t − √ , (t > 0). 4 3 t t Wegen der Summen- bzw. Differenzenregel betrachten wir die drei Terme einzeln. F¨ ur 2 1 =2· 2 2 t t
und
3 1 √ =3· √ 4 3 4 3 t t
wenden wir die Regel vom konstanten Faktor an, so dass wir nur noch die Ableitungen von 1 √ 1 3 , t und √ 4 3 t2 t brauchen. Diese Funktionen stehen nicht direkt in der Tabelle, alle drei k¨ onnen aber als Potenzen von t geschrieben werden (vgl. die Bemerkung in (5.3.d)): √ 1 1 3 = t−2 , t = t1/3 , √ = t−3/4 . 4 3 2 t t Damit bestimmen sich die Ableitungen gem¨ ass der Formel (xn ) = nxn−1 : −2t−3 =
−2 1 −2/3 1 3 −3 , t = √ , − t−7/4 = √ . 3 4 t3 3 4 3 t2 4 t7
Mit einer (zur Abwechslung) andern Bezeichnung erhalten wir 1 9 −4 dG + √ . = 3 + √ 3 2 4 7 dt t 3 t 4 t
3. Φ(z) = z ln z, (z > 0). Dies ist ein Fall f¨ ur die Produktregel. Der Tabelle (5.3) entnehmen wir, dass x = 1 und 1 (ln x) = ist, und finden so x Φ (z) = 1 · ln z + z ·
1 = ln z + 1 . z
5. Technik des Differenzierens
70
sin α . 1 + cos α Hier brauchen wir die Quotientenregel. Die Ableitung des Z¨ ahlers ist cos α, jene des Nenners ist − sin α (wobei die Summenregel stillschweigend verwendet wurde). Wir erhalten 4. A(α) =
dA (1 + cos α) cos α − sin α(− sin α) cos α + cos2 α + sin2 α 1 = . = = 2 dα (1 + cos α) (1 + cos α)2 1 + cos α Dabei wurde die (hoffentlich) zum permanenten Wissen geh¨ orende Formel sin2 α + cos2 α = 1
benutzt (siehe (26.15)). (5.5) N¨aheres zur Kettenregel a) Zusammengesetzte Funktionen
Der Begriff der zusammengesetzten Funktion l¨asst sich besonders gut mit dem Taschenrechner erl¨autern. Beispiel 1 – Tippe eine Zahl x ein, z.B. x = 0.5. – Dr¨ ucke die Taste
x2
. In der Anzeige erscheint die Zahl y = x2 = 0.25.
– Dr¨ ucke die Taste sin . In der Anzeige erscheint jetzt z = sin y = sin x2 = 0.2474 . . . . Beachten Sie, dass wir hier das Bogenmass verwenden, wie es in der Analysis notwendig ist. Wir haben also zwei Funktionen zusammengesetzt, n¨ amlich g(x) = x2
und
f (y) = sin y .
Das Ergebnis ist die zusammengesetzte Funktion x → f (y) = f (g(x)) = sin x2 . unftig, die unabh¨ angige Da wir f nicht auf x, sondern auf y = x2 anwenden, ist es vern¨ Variable im zweiten Fall mit y zu bezeichnen. Beispiel 2 – Tippe x = 2 ein. – Dr¨ ucke die Taste genmass!)
cos
. In der Anzeige erscheint y = cos x = −0.4161 . . . (Bo-
5.5 N¨ aheres zur Kettenregel
71
√ ucke die Taste – Dr¨ . Nun zeigt der Rechner auf irgendeine Weise seine Un√ zufriedenheit (Fehler) an. Dies deshalb, weil y negativ und y nicht definiert ist. Man kann also zwei Funktionen nur dann zusammensetzen, wenn die Werte der zuerst angewandten Funktion im Definitionsbereich der zweiten liegen, d.h., f (g(x)) ist f¨ ur alle x definiert, f¨ ur welche g(x) definiert ist und im Definitionsbereich von f liegt. Nun definieren wir allgemein, was wir unter der Zusammensetzung von zwei Funktionen verstehen: Es seien f : D(f ) → R und g : D(g) → R zwei Funktionen. Dabei sei D(g) so gew¨ ahlt, dass y = g(x) ∈ D(f ) ist, f¨ ur alle x ∈ D(g). Dann l¨ asst sich f¨ ur jedes x ∈ D(g) die Zahl f (g(x))
(oder f (y)
mit
y = g(x))
bilden. Die so erhaltene Funktion h : D(g) → R, h(x) = f (g(x)) heisst die Zusammensetzung (oder Komposition oder Verkettung) von g und f . In Zeichen: h=f ◦g . Wir nennen g die innere, f die ¨aussere Funktion. In der Praxis ist es meistens so, dass eine gegebene Funktion als Zusammensetzung erkannt und “in ihre Bestandteile” zerlegt werden muss. Beispiel 3 Die Funktion h(x) = ex
2
ist zusammengesetzt aus y = g(x) = x2 und f (y) = ey : 2
h(x) = f (g(x)) = ex . Sie ist f¨ ur alle x ∈ R definiert.
Beispiel 4 Die Funktion k(x) =
x2 − 1
√ ist zusammengesetzt aus y = g(x) = x2 − 1 und f (y) = y : k(x) = f (g(x)) = f (y) = x2 − 1 .
5. Technik des Differenzierens
72
Sie ist f¨ ur alle x definiert, f¨ ur alle x mit |x| ≥ 1. ur welche x2 − 1 ≥ 0 ist, d.h. f¨
Beispiel 5 Selbstverst¨ andlich lassen sich auch mehr als zwei Funktionen zusammensetzen. So ist etwa p(x) = sin(ln(x2 + 1)) von der Form p(x) = f (g(h(x))) mit f (z) = sin z, g(y) = ln y und h(x) = x2 + 1.
b) Anwendung der Kettenregel Diese Regel sagt aus, wie die Ableitung der zusammengesetzten Funktion f ◦ g, also der Funktion x → f (g(x)), zu bilden ist. Die Formel lautet (vgl. (5.2)): f (g(x)) = f (g(x)) · g (x) oder in Worten: Man nimmt die Ableitung der Funktion f an der Stelle y = g(x) und multipliziert diese mit der Ableitung von g an der Stelle x. Man nennt f (y) = f (g(x)) die ¨aussere, g (x) die innere Ableitung. Die Regel lautet dann kurz: ¨ Aussere Ableitung mal innere Ableitung. (Vorausgesetzt nat¨ urlich, dass sowohl f (g(x)) wie auch g (x) u ¨ berhaupt existieren. F¨ ur die genaue Formulierung vergleiche man den Beweis in (27.3).)
Beispiel 6 h(x) = (2x + 1)1000 . Man k¨ onnte diesen Ausdruck mittels der binomischen Formel ausmultiplizieren und das entstehende Polynom vom Grad 1000 ableiten. Aus ersichtlichen Gr¨ unden ist von dieser Methode aber abzuraten. Die einzig vern¨ unftige L¨ osung ist die Anwendung der Kettenregel: h(x) = f (g(x))
mit
f (y) = y 1000
und
g(x) = 2x + 1 .
Dann ist f (y) = 1000y 999 , g (x) = 2 und somit h (x) = f (y) · g (x) = 1000(2x + 1)999 · 2 = 2000(2x + 1)999 .
Beispiel 7 Beispiel 6 ist ein Fall, wo die innere Funktion g(x) linear ist. Dies kommt recht h¨aufig vor. Im allgemeinen Fall ist g(x) = ax + b und die innere Ableitung ist g (x) = a.
5.5 N¨ aheres zur Kettenregel
73
Die zusammengesetzte Funktion h(x) = f (g(x)) hat die Form h(x) = f (ax + b), und f¨ alt man ur die Ableitung erh¨ h (x) = af (ax + b) . onnen. Diesen einfachen Fall sollten Sie routinem¨assig erledigen k¨ Zwei Musterbeispiele: d sin(πx) = π · cos(πx), dx
d ln( u2 − 1) 1 = du 2
Beispiel 8 √ x2 − 1.
k(x) =
Wie in Beispiel 4 bereits aufgezeigt wurde, ist f (y) = Es ist dann
und somit
√
u 2
1 1 = . −1 u−2
y mit y = g(x) = x2 − 1.
1 f (y) = √ , g (x) = 2x 2 y x 1 · 2x = √ . k (x) = f (y) · g (x) = √ 2 x2 − 1 x2 − 1
Mit zunehmender Routine wird man bei einfachen Aufgaben dieser Art nicht mehr alles anschreiben, sondern das meiste im Kopf rechnen: Beispiel 9 1
E(t) = e t . ¨ Kurze Uberlegung: Die Ableitung von ex ist ex , jene von E (t) = −
1 t
ist − t12 . Wir erhalten so
1 1 et . t2
Durch mehrfaches Anwenden der Kettenregel lassen sich auch Funktionen ableiten, die aus mehr als zwei Funktionen zusammengesetzt sind: Beispiel 10 p(x) = sin(ln(x2 + 1)), vgl. Beispiel 5. Man beginnt “von aussen”. Wir setzen zuerst f (z) = sin z
und
z = q(x) = ln(x2 + 1) .
Dann ist p(x) = f (z) = f (q(x)), und die Kettenregel liefert p (x) = f (z) · q (x) = f (q(x)) · q (x) = cos(ln(x2 + 1)) · q (x) .
5. Technik des Differenzierens
74
ussen wir aber noch q (x) berechnen. Dabei ist q selbst wieder eine zusammenNun m¨ gesetzte Funktion: q(x) = ln(x2 + 1) = g(h(x))
mit
g(y) = ln y
und
y = h(x) = x2 + 1 .
ur die Ableitung von q m¨ ussen wir noch einmal die Kettenregel bem¨ F¨ uhen: q (x) = g (y) · h (x) =
1 2x · 2x = 2 . y x +1
Setzen wir alles zusammen, so erhalten wir: p (x) = cos(ln(x2 + 1)) ·
2x . x2 + 1
Beispiel 11 1−x . f (x) = ln 1+x Hier muss man f¨ ur die innere Ableitung die Quotientenregel benutzen. 1 − x 1+x
=
(1 + x)(−1) − (1 − x) · 1 −2 = ... = . (1 + x)2 (1 + x)2
Man erh¨ alt so wegen (ln y) = f (x) =
1 1−x 1+x
1 : y ·
−2 −2 −2 = . = (1 + x)2 (1 − x)(1 + x) 1 − x2
Diese Aufgabe l¨asst sich aber eleganter l¨ osen, wenn man sich an die Rechenregeln f¨ ur den Logarithmus erinnert, die zum Grundwissen geh¨oren (vgl. (26.14)): f (x) = ln
1 − x 1+x
= ln(1 − x) − ln(1 + x) .
Die Ableitungen von ln(1 ∓ x) erh¨alt man durch eine ganz einfache Anwendung der Kettenregel (vgl. Beispiel 7). Es folgt f (x) = (−1) ·
1 −2 1 − = ... = . 1−x 1+x 1 − x2
Beispiel 12 Zum Schluss ein etwas anders geartetes Beispiel: f (x) = xx (x > 0).
75
5.7 Beweise einiger Ableitungsregeln und -formeln
Damit man das Problem u ¨berhaupt anpacken kann, muss man diese Potenz mittels der Exponentialfunktion ausdr¨ ucken: Es ist x = eln x und somit f (x) = xx = ex·ln x (vgl. (26.13) und (26.14) f¨ ur die Regeln u ¨ber Exponentialfunktion und Logarithmus). Damit wird f (x) = ex·ln x · (x · ln x) . F¨ ur die innere Ableitung benutzen wir die Produktregel (vgl. Beispiel 3. in (5.4)): (x · ln x) = 1 · ln x + x ·
1 = ln x + 1 . x
Es folgt f (x) = xx (ln x + 1).
c) Eine andere Schreibweise Setzt man z = f (g(x)) = f (y) mit y = g(x), so schreibt sich die gesuchte Ableitung dz dz dy der zusammengesetzten Funktion als , f (y) wird zu und g (x) zu . dx dy dx Die Kettenregel lautet dann dz dy dz = dx dy dx und hat die Form einer K¨ urzungsregel. Da dx, dy, dz aber keine selbst¨andige Bedeutung haben, ist dies nur als formale Regel aufzufassen. (5.6) Elementare Funktionen Ausgehend von den in der Tabelle (5.3) aufgef¨ uhrten Funktionen kann man nun mit den in (5.2) aufgef¨ uhrten Operationen (Addition, Subtraktion, Multiplikation und Division von Funktionen sowie Komposition) sehr viele neue Funktionen konstruieren, wie etwa √ x + 1 · (etan x ) · xx + log2 (x3 + 2x + ln(3x)) f (x) = 5 [sin(x · ex ) · ln(cot2 x)]2 oder (f¨ ur die Praxis) auch etwas weniger gesuchte Gebilde. Eine derart konstruierte Funktion heisst eine elementare Funktion. Unsere Regeln erlauben uns nun, jede solche elementare Funktion — eventuell allerdings unter grossem Aufwand — abzuleiten. Die Anwendung dieser Regeln ist durchaus mechanisch. Es gibt deshalb Taschenrechner und Programme f¨ ur Personal Computer, welche die Ableitung einer elementaren Funktion berechnen k¨onnen. (5.7) Beweise einiger Ableitungsregeln und -formeln In diesem Abschnitt sollen exemplarisch einige Regeln bzw. Formeln begr¨ undet werden. Die systematische Herleitung der u ¨brigen Regeln und Formeln ist etwas monoton und deshalb in den Anhang √ relegiert worden. Zwei einfache F¨ alle (f (x) = x2 , f (x) = x) wurden schon in (4.4.a) und (4.4.b) behandelt.
5. Technik des Differenzierens
76
a) Produktregel Es wird vorausgesetzt, dass f und g in x0 differenzierbar sind.. Wir setzen h(x) = f (x)g(x). Δh mit Gesucht ist h (x0 ) = lim x→x0 Δx Δh h(x) − h(x0 ) f (x)g(x) − f (x0 )g(x0 ) = = . Δx x − x0 x − x0 Wir formen um, indem wir den Term −f (x)g(x0 ) + f (x)g(x0 ) (= 0) einschieben und dann x gegen x0 streben lassen. f (x)g(x) − f (x)g(x0 ) + f (x)g(x0 ) − f (x0 )g(x0 ) Δh = Δx x − x0 g(x) − g(x0 ) f (x) − f (x0 ) = f (x) + g(x0 ) . x − x0 x − x0 1)
? f (x0 )
2)
?
g (x0 )
3)
? g(x0 )
4)
?
f (x0 )
uberg¨ ange, und zwar Mit x → x0 gelten die angegebenen Grenz¨ 1) weil f differenzierbar und somit stetig in x0 ist (vgl. (4.6.g), 2) und 4) nach Voraussetzung, 3) ist klar. Δh Damit existiert h (x0 ) = lim , und es ist x→x0 Δx h (x0 ) = f (x0 )g(x0 ) + f (x0 )g (x0 ) .
b) Kettenregel An dieser Stelle geben wir nur eine sogenannte Plausibilit¨ atsbetrachtung. Einen korrekten Beweis finden Sie im Anhang (27.3). Es sei g an der Stelle x0 , f an der Stelle y0 = g(x0 ) differenzierbar. Zu zeigen ist: h(x) = f (g(x)) ist in x0 differenzierbar, und es gilt h (x0 ) = f (g(x0 ))g (x0 ) . Der folgende naheliegende “Beweis” ist leider nicht ganz korrekt: F¨ ur x = x0 ist mit y = g(x), y0 = g(x0 ) f (g(x)) − f (g(x0 )) f (y) − f (y0 ) f (y) − f (y0 ) y − y0 = = · x − x0 x − x0 y − y0 x − x0 f (y) − f (y0 ) g(x) − g(x0 ) = · . y − y0 x − x0 Mit x → x0 strebt (wegen der Stetigkeit) auch y → y0 . Somit strebt der erste Faktor gegen f (y0 ) = are. f (g(x0 )) und der zweite gegen g (x0 ), womit die Behauptung bewiesen w¨ Wo steckt die Unkorrektheit? Wir haben zwar x = x0 vorausgesetzt, aber daraus braucht nicht zu folgen, dass stets y = y0 ist. Wenn aber y = y0 ist, so haben wir im Verlauf unserer Rechnung mit dem Bruch 00 erweitert, was nicht zul¨ assig ist.
77
5.7 Beweise einiger Ableitungsregeln und -formeln
c) Die Ableitung des nat¨ urlichen Logarithmus Der nat¨ urliche Logarithmus (d.h. der Logarithmus zur Basis e = 2.71828182 . . .) hat eine sehr einfache Ableitung: 1 (ln x) = , (x > 0) . x F¨ ur Logarithmen mit einer beliebigen Basis sieht die Formel etwas weniger sch¨ on aus: (loga x) =
1 . x · ln a
Diese Tatsache rechtfertigt die Bevorzugung des nat¨ urlichen Logarithmus f¨ ur theoretische Untersuchungen. Wir wollen nun sehen, wie eigentlich die Zahl e = lim (1 + n→∞
1 n ) n
bei der Bestimmung der Ableitung ins Spiel kommt. N¨ ahere Informationen u ¨ ber diese Zahl sowie u ¨ ber Exponentialfunktion und Logarithmus finden Sie im Anhang (26.13), (26.14). Wir m¨ ussen den Grenzwert des Differenzenquotienten ln(x + h) − ln x f (x + h) − f (x) = h h
f¨ ur
h→0
untersuchen. Die Ann¨ aherung “h → 0” f¨ uhren wir nun so durch, dass wir eine bestimmte Folge hn w¨ ahlen, welche f¨ ur n → ∞ gegen 0 konvergiert. Der Quotient ln(x + hn ) − ln x hn ist dann eine Sekantensteigung, welche f¨ ur n → ∞ (d.h. hn → 0) gegen die Tangentensteigung f (x) konvergiert. Zuerst formen wir etwas um. Es ist nach den Rechenregeln f¨ ur Logarithmen
(∗)
1 x + hn hn 1 ln(x + hn ) − ln x = ln ln 1 + = . hn hn x hn x
Wir w¨ ahlen nun die Folge hn so, dass f¨ ur n → ∞. Aus (∗) folgt weiter
hn x 1 = ist, d.h., wir setzen hn = . Dann gilt sicher hn → 0 x n n
1 1 n ln(x + hn ) − ln x n 1 = ln 1 + . = ln 1 + hn x n x n 1 n 1 n 1 F¨ ur die Tangentensteigung gilt somit f (x) = lim . Nun strebt aber 1 + gegen ln 1 + n→∞ x n n n 1 gegen ln e = 1. Es folgt die Zahl e, wenn n → ∞ geht, somit strebt ln 1 + n 1 1 n 1 = . ln 1 + n→∞ x n x
f (x) = lim
5. Technik des Differenzierens
78
Beachten Sie, dass hier die Zahl e in nat¨ urlicher Weise auftaucht. Die Ableitung der Logarithmusfunktion wird nur deshalb so einfach, weil ln e = 1 (d.h. weil e die Basis des nat¨ urlichen Logarithmus) ist. urlichen Logarithmen ist hierdurch gerechtfertigt. Die Wahl von e als Basis der nat¨
(5.∞) Aufgaben In den Routineaufgaben 5−1 bis 5−6 ist jeweils die Ableitung der gegebenen Funktion gesucht. Die Bezeichnungen werden etwas variiert, um Sie daran zu gew¨ ohnen, dass die Variable nicht immer x df heissen muss. Gelegentlich wird auch die Notation mit dem Differentialquotienten dx verwendet. 5−1 Summen, Differenzen und Vielfache von Grundfunktionen. 2 3 a) F (x) = − 2 x x d) Φ(ϕ) = tan(ϕ) + cos(ϕ)
√ 3
1 b) f (u) = 3 u + 4 √ u3 e) R(t) = 2t − 3t
c)
d
√ z4z dz
f) A(a) = ea + ln a
5−2 Produkt– und Quotientenregel. a) H(t) =
t−1 t+1
x2 + x + 1 x2 − x + 1 1 e) S(σ) = sin σ eρ + 1 h) f (ρ) = ρ2 b) g(x) =
d) F (ξ) = eξ (sin ξ − cos ξ) g) p(t) = t · et · cos t
c) f (α) = sin α − α · cos α ex − 1 f) h(x) = x e +1 du2 ln u i) du
5−3 Kettenregel; einfachster Fall (innere Funktion linear). a) f (x) = (2 + 3x)4 √ d 1 − 3r d) dr
b) g(y) = (a + by)n
g) T (τ ) = eατ · cos βτ
h) Ψ(γ) = sin(α+γ) cos(α−γ)
e)
c) g(X) = e2X−1
d ln(a + bc) da
d ln(a + bc) dc sin(β + α) i) B(β) = cos(β − α) f)
5−4 Kettenregel. a) f (x) = (x3 + x2 − 1)4 d) Λ(x) = ln(x + 1 + x2 ) g) S(T ) = ln(ln T )
b) H(δ) = e−2 sin δ d ln(tan θ) e) dθ 2 u −1 2 h) f (u) = 2 u +1
5−5 Kettenregel; Verkn¨ upfung von mehr als zwei Funktionen. 2 x b) f (ϕ) = ln(cos(ϕ2 )) a) F (x) = sin e
i) F (x) = (sin x)sin x c) G(u) =
5−6 Allerlei. a) f (x) = ln
1 + x2 1 − x2
b) g(α) =
1 tan2 α + ln(cos α) 2
√ c) g(u) =
5−7 H¨ ohere Ableitungen. a) x ¨ (t) f¨ ur x(t) = t2 +
1 1 +√ t2 t
c) (x · ln x) e) f (100) (α) f¨ ur f (α) = sin α + cos α
b)
u2 + 1 d2 g f¨ ur g(u) = 2 du 2u
d10 t10 dt10 f) f (n) (x) f¨ ur f (x) = xex d)
3
v3 + 1 γ f) F (γ) = cos γ+1
c) w(v) =
ln(u3 + 1)
u2 + 2u − 1 u−1
79
6. ANWENDUNGEN DER ABLEITUNG ¨ (6.1) Uberblick Die Ableitung ist ein wichtiges Hilfsmittel bei der Untersuchung von Funktionen. In diesem Kapitel werden die folgenden Punkte besprochen: • • • •
Wachstumsverhalten, Kr¨ ummung von Kurven, Extrema, Graphische Darstellung.
(6.3.b) (6.4) (6.5), (6.6) (6.7)
Diese Dinge geh¨oren normalerweise zum Mittelschulstoff; es geht hier haupts¨achlich darum, die wichtigsten Tatsachen in Erinnerung zu rufen und vielleicht das eine oder andere Detail zu pr¨azisieren. Die Hauptergebnisse sind, in knapper Form zusammengefasst (I bezeichnet ein Intervall): f (x) > 0 f¨ ur alle x ∈ I =⇒ f ist auf I wachsend. f (x) < 0 f¨ ur alle x ∈ I =⇒ f ist auf I fallend. f (x) = 0 f¨ ur alle x ∈ I ⇐⇒ f ist auf I konstant. f (x) < 0 f¨ ur alle x ∈ I =⇒ Der Graph von f beschreibt eine Rechtskurve. (5) f (x) > 0 f¨ ur alle x ∈ I =⇒ Der Graph von f beschreibt eine Linkskurve.
(1) (2) (3) (4)
(6.3)
(6.4)
Absolute Extrema einer Funktion bestimmt man, indem man relative Extrema aufsucht und vergleicht. Diese letzteren findet man durch Untersuchung der folgenden Kandidaten: 1. Innere Punkte x0 des Definitionsbereichs mit f (x0 ) = 0. 2. Randpunkte des Definitionsbereichs. 3. Stellen, wo f nicht differenzierbar ist. Wenn f (x0 ) = 0 ist, so liefert die zweite Ableitung eine Entscheidungshilfe f¨ ur die Art des Extremums: • Ist f (x0 ) < 0, so hat f in x0 ein relatives Maximum. • Ist f (x0 ) > 0, so hat f in x0 ein relatives Minimum.
(6.5.e)
(6.5.f)
(6.2) Einige Fachausdr¨ ucke In diesem Abschnitt stellen wir ein paar Fachausdr¨ ucke zusammen, die sich im folgenden als zweckm¨ assig erweisen.
6. Anwendungen der Ableitung
80
a) Intervalle Intervalle sind spezielle Teilmengen der Menge R der reellen Zahlen. Wenn a und b (a < b) reelle Zahlen sind, so benutzt man folgende Bezeichnungen: (a, b) = {x | a < x < b}
: offenes Intervall,
[a, b] = {x | a ≤ x ≤ b} (a, b] = {x | a < x ≤ b} [a, b) = {x | a ≤ x < b}
: abgeschlossenes Intervall, : halboffene Intervalle.
Ganz a¨hnlich schreibt man auch etwa (a, ∞) = {x | x > a}, (−∞, b] = {x | x ≤ b} (−∞, ∞) = R usw. In manchen B¨ uchern gebraucht man f¨ ur das offene Intervall auch das Zeichen ]a, b[ . b) ε–Umgebungen ε–Umgebungen sind spezielle offene Intervalle. Dabei ist ε eine positive Zahl (das heisst gr¨ osser 0), die in den Anwendungen gew¨ohnlich klein ist. Solche ε haben wir schon fr¨ uher angetroffen (3.6.b), (4.6.d). Es sei nun x0 ∈ R und ε ∈ R, ε > 0. Dann setzt man Uε (x0 ) = (x0 − ε, x0 + ε) = {x | x0 − ε < x < x0 + ε} .
x0 − ε
x0
x0 + ε
Dieses Intervall heisst die ε–Umgebung von x0 . Uε (x0 ) besteht somit aus allen Punkten, deren Abstand von x0 kleiner als ε ist. c) Randpunkte und innere Punkte Ein halboffenes oder abgeschlossenes Intervall hat Randpunkte: [a, b) : (a, b] : [a, b] :
Randpunkt a, Randpunkt b, Randpunkte a, b .
Die Punkte eines Intervalls I, welche keine Randpunkte sind, heissen innere Punkte von I. Offenbar ist x0 genau dann ein innerer Punkt von I, wenn es eine (wenn vielleicht auch kleine) ε–Umgebung Uε (x0 ) gibt, welche ganz in I liegt.
6.3 Wachstumsverhalten
81
d) Wachsende und fallende Funktionen Es sei f eine Funktion mit Definitionsbereich D(f ). Diese Funktion f heisst wachur alle x1 , x2 ∈ D(f ) mit x1 < x2 . Entsprechend heisst send, wenn gilt: f (x1 ) < f (x2 ) f¨ f fallend, wenn gilt: f (x1 ) > f (x2 ) f¨ ur alle x1 , x2 ∈ D(f ) mit x1 < x2 . f
y
y fallend
wachsend
f x
x x1
x2
x1
x2
Bemerkung In den obigen F¨ allen sagt man manchmal auch, f sei streng monoton wachsend (bzw. fallend). ur x1 < x2 ”; monoton fallend analog. Monoton wachsend (ohne “streng”) heisst dann “f (x1 ) ≤ f (x2 ) f¨ Schliesslich heisst f monoton, wenn f entweder monoton wachsend oder monoton fallend ist. Wir werden uns hier an den zuerst angegebenen einfacheren Sprachgebrauch halten.
(6.3) Wachstumsverhalten a) Einleitende Bemerkungen Wie wir in den Beispielen von Kapitel 3 gesehen haben, k¨ onnen wir mit Hilfe der Ableitung Begriffe beschreiben, die mit dem Verhalten einer Funktion an einer bestimmten Stelle zu tun haben, wie etwa die Geschwindigkeit zur Zeit t0 oder die Tangentensteigung im Punkt (x0 , f (x0 )). Man spricht in solchen F¨ allen auch vom “lokalen” Verhalten der Funktion. Wenn man nun aber die Eigenschaften der Ableitung einer Funktion auf einem ganzen Intervall I kennt, so kann man daraus R¨ uckschl¨ usse auf das “globale” Verhalten der Funktion in diesem Intervall ziehen. Ist beispielsweise die Wachstumsgeschwindigkeit N (t) f¨ ur ein ganzes Zeitintervall positiv, so w¨achst die Population in dieser Zeit dauernd. Wir werden in (6.3) und in (6.4) derartige Fragen n¨ aher untersuchen. Dabei bedienen wir uns vor allem der geometrischen Anschauung, indem wir die Ableitung als Tangentensteigung interpretieren, dabei aber andere M¨oglichkeiten (Geschwindigkeit etc.) nicht ganz vergessen. Es sei noch bemerkt, dass wir die in (6.3) und (6.4) stehenden Aussagen nicht streng beweisen, sondern nur anschaulich begr¨ unden werden. Exakte, rein rechnerische Beweise k¨ onnen selbstverst¨ andlich erbracht werden; dies ist Aufgabe der Mathematiker.
6. Anwendungen der Ableitung
82
b) Ableitung und Wachstum Die Funktion f sei auf dem Intervall I definiert (und differenzierbar). Das Intervall I kann offen, abgeschlossen etc. sein; auch der Fall I = R ist m¨ oglich. Das Intervall I muss aber nicht unbedingt der “nat¨ urliche Definitionsbereich” sein (d.h. die gr¨osste Teilmenge von R, auf der f u ¨berhaupt definiert werden kann). Gerade im Zusammenhang mit den hier besprochenen Fragen wird man sich beispielsweise auf ein Intervall beschr¨anken, in welchem die Ableitung stets positiv ist. Wenn nun die Ableitung f (x) > 0 ist, f¨ ur alle x aus I, dann ist im anschaulichen Bild die Tangentensteigung in jedem Punkt des Graphen positiv, und dies bedeutet, dass die Funktion auf I w¨achst: Aus x1 < x2 folgt f (x1 ) < f (x2 ). Entsprechendes gilt f¨ ur den Fall f (x) < 0, wo die Funktion f¨allt. Zusammenfassend finden wir: (1)
f (x) > 0 f¨ ur alle x ∈ I =⇒ f ist auf I wachsend.
(2)
f (x) < 0 f¨ ur alle x ∈ I =⇒ f ist auf I fallend.
x
(2)
(2)
(1)
(1)
y
y
y
y
x
x
x
Wie man sieht, kann die “Kr¨ ummung des Graphen” unterschiedlich sein, n¨ aheres dazu in (6.4). Hinweis Die obigen Aussagen (1) und (2) enthalten das Zeichen “=⇒” (Implikation), vgl. (26.6). In solchen F¨ allen kann man sich fragen, ob auch die Umkehrung gilt, im Fall (1) w¨ are dies die Aussage: ur alle x ∈ I. f auf I wachsend =⇒ f (x) > 0 f¨ Diese Aussage ist nun allerdings falsch: Wenn f wachsend ist, dann ist zwar die Ableitung “meistens” positiv; sie kann aber auch gelegentlich = 0 sein, wie folgendes Beispiel zeigt: Die Funktion f (x) = x3 ist auf ganz R wachsend, aber es ist f (0) = 0, denn f (x) = 3x2 . (Die Tatsache, dass f wachsend ist, ergibt sich durch Betrachtung des Graphen oder durch folgende ¨ Uberlegung: Sei x1 < x2 . Wenn beide Zahlen ≤ 0 sind, dann ist x31 < x32 , ebenso wenn beide ≥ 0 sind. Ist aber x1 < 0, x2 > 0, so ist x31 < 0 , x32 > 0, also auch hier x31 < x32 .) Man pflegt dies auch so zu formulieren: Die Bedingung “f (x) > 0 auf I” ist hinreichend, aber nicht notwendig daf¨ ur, dass f auf I w¨ achst.
6.3 Wachstumsverhalten
83
Beispiel Es sei f (x) = ecx und somit f (x) = c · ecx . Weil ecx stets positiv ist, gilt (i) F¨ ur c > 0 ist f (x) > 0 : f ist auf R wachsend. Wir werden sp¨ater sehen, dass wir damit wachsende Prozesse im Zeitablauf modellieren. H¨aufig wird dann x durch t ersetzt (vom englischen “time”). Beispiele sind eine wachsende Wirtschaft oder Population, Ausbreitung von Epidemien im Anfangsstadion, Anzahl Zellen bei der Zellteilung. (ii) F¨ ur c < 0 ist f (x) < 0 : f ist auf R fallend. Mit dieser Funktion modellieren wir sp¨ater die Abnahme von homogenem radioaktivem Material. y
y
(ii)
(i)
1
1
x
x
Die Aussagen (1) und (2) haben auch in anderen F¨ allen eine ganz konkrete Bedeutung: • Interpretieren wir die Ableitung wie in (3.2) als (“eindimensionale”) Geschwindigkeit, so bedeutet eine positive Geschwindigkeit, dass die Ortskoordinate s(t) mit zunehmender Zeit gr¨osser wird; das Objekt bewegt sich in der als positiv festgelegten Richtung, eine negative Geschwindigkeit beschreibt also “den R¨ uckw¨ arts¨ gang”. Ferner besagt ein grosser Betrag |s(t)| ˙ der Ableitung, dass die Anderung der zur¨ uckgelegten Strecke rasch erfolgt, also genau das, was man sich unter einer grossen Geschwindigkeit vorstellt. • In (3.3) wurde die Wachstumsgeschwindigkeit als Ableitung der Funktion N (t) definiert. Eine positive Wachstumsgeschwindigkeit bedeutet deshalb eine Zunahme, eine negative Wachstumsgeschwindigkeit eine Abnahme der Bakterienpopulation. c) Ableitung und konstante Funktionen Wichtig ist auch der Fall, wo f (x) = 0 ist, f¨ ur alle x aus dem Intervall I. Von der geometrischen Anschauung her ist es dann einleuchtend, dass f eine konstante Funktion sein muss, denn die Tangente ist u ¨berall horizontal. In Zeichen: f (x) = 0 =⇒ f
konstant.
Im Gegensatz zu b) (vgl. den dortigen Hinweis mit x3 ) gilt hier auch die Umkehrung: Eine der einfachsten Ableitungsregeln (5.3) besagt, dass die Ableitung einer konstanten Funktion immer Null ist. Also haben wir die Regel (3)
f (x) = 0 f¨ ur alle x ∈ I ⇐⇒ f konstant.
6. Anwendungen der Ableitung
84
d) Ein qualitatives Beispiel Illustrieren wir das Ganze noch an einem qualitativen Beispiel. Es wird kein Anspruch auf zahlenm¨ assige Genauigkeit erhoben!
y
f x y f b a
x
d c
e
g
Von a nach b steigt die Funktion zuerst gleichf¨ ormig, die Ableitung ist also zun¨ achst konstant, wird dann aber im Punkt b gleich 0 (horizontale Tangente!). Hierauf f¨ allt die Funktion bis c und ist von dort an horizontal. Zwischen b und c muss die Ableitung somit negativ sein, zwischen c und d aber gleich 0. Hierauf folgt ein Anstieg von d nach e (positive Ableitung), ein “station¨ arer Punkt” in e (Ableitung = 0) und schliesslich ein Abfall (negative Ableitung), wobei die Ableitung von g an konstant ist (der Graph ist eine fallende Gerade!).
(6.4) Die Bedeutung der zweiten Ableitung Wir setzen hier nicht nur voraus, dass f : I → R differenzierbar ist, sondern auch, dass auf I die zweite Ableitung f existiert. Da f die erste Ableitung von f ist, k¨ onnen wir die Betrachtungen von (6.3) auf f und f (statt wie dort auf f und f ) anwenden. Wenn auf dem ganzen Intervall I die zweite Ableitung f (x) < 0 ist, so f¨allt f (x) auf ganz I, d.h., die Steigung von f (x) nimmt (mit wachsendem x) ab – und wird in unterem Bild sogar negativ: y
f
x Anschaulich heisst dies, dass der Graph von f eine Rechtskurve beschreibt. (Man sagt manchmal auch, f sei konkav nach unten oder konvex nach oben, aber diese Bezeichnungen sind etwas verwirrend.) Ganz entsprechend behandelt man den Fall f (x) > 0.
6.4 Die Bedeutung der zweiten Ableitung
85
Somit finden wir: (4)
f (x) < 0 auf I =⇒ Der Graph von f beschreibt auf I eine Rechtskurve.
(5)
f (x) > 0 auf I =⇒ Der Graph von f beschreibt auf I eine Linkskurve.
In den folgenden Skizzen sind die Beziehungen (4) und (5) mit (1) und (2) zusammengefasst. Sie zeigen die verschiedenen Kombinationen von Wachstums- und Kr¨ ummungsverhalten. y
y
f (x) > 0 f (x) > 0
f (x) < 0 f (x) > 0
x
x y
y
f (x) < 0 f (x) < 0
f (x) > 0 f (x) < 0
x
x
Von einiger Bedeutung ist schliesslich noch der folgende Begriff: Wenn der Graph ¨bergeht, von f an der Stelle x0 von einer Links- zu einer Rechtskurve (oder umgekehrt) u dann spricht man von einem Wendepunkt. Er ist dadurch charakterisiert, dass f (x0 ) = 0 ist und dass f in x0 das Vorzeichen wechselt. y
y
f (x) > 0
f (x) < 0 f (x) < 0
f (x) > 0
x
x x0
x0
6. Anwendungen der Ableitung
86
y
Die Bedingung f (x0 ) = 0 allein gen¨ ugt nicht f¨ ur einen Wendepunkt. Nimmt man z.B. f (x) = x4 , so ist f (0) = 0, aber es liegt kein Wendepunkt vor, denn f wechselt in 0 das Vorzeichen nicht. Der Graph beschreibt durchgehend eine Linkskurve.
x
y Ein Wendepunkt mit horizontaler Tangente (also zus¨ atzlich mit f (x0 ) = 0) heisst Terrassenpunkt. So hat beispielsweise die Funktion f (x) = x3 an der Stelle 0 einen solchen Terrassenpunkt. Wir fassen auch diese beiden Aussagen noch zusammen.
x
(6)
f hat in x0 einen Wendepunkt ⇐⇒ f (x0 ) = 0 und f wechselt in x0 das Vorzeichen.
(7)
f hat in x0 einen Terrassenpunkt ⇐⇒ f (x0 ) = f (x0 ) = 0 und f wechselt in x0 das Vorzeichen.
Beispiel Wir illustrieren die in (6.3) und (6.4) gemachten Feststellungen am Beispiel der Funktion f (x) = 13 x3 − x. Es ist f (x) = x2 − 1, f (x) = 2x. Die Graphen dieser drei Funktionen sind nebenan dargestellt. Sie k¨ onnen daraus ersehen, wie das Vorzeichen von f (bzw. von f ) das Wachstum von f (bzw. das Kr¨ ummungsverhalten von f ) beeinflusst. Die ¨ folgende Tabelle gibt einen Uberblick:
y
f
x
y Intervall (−∞, −1) (−1, 1) (1, ∞) (−∞, 0) (0, ∞)
f
f
f > 0 f < 0 f > 0
f =⇒ =⇒ =⇒
f w¨achst f f¨allt f w¨achst
f
x -1
1
f < 0 =⇒ f f¨allt =⇒ Rechtskurve f > 0 =⇒ f w¨achst =⇒ Linkskurve
Der Nullpunkt ist ein Wendepunkt, denn dort ist die zweite Ableitung gleich Null und wechselt das Vorzeichen. F¨ ur x0 = ±1 ist f (x0 ) = 0, an diesen Stellen hat f relative Extrema, vgl. hierzu (6.5).
y x f
6.5 Extrema
87
(6.5) Extrema a) Einleitung Eine sehr bekannte Anwendung der Differentialrechnung ist die L¨osung von Extremalaufgaben (das Auffinden von Maxima und Minima einer Funktion). Das Vorgehen ist Ihnen vom Gymnasialunterricht her vertraut: Man setzt die erste Ableitung gleich Null und pr¨ uft allenfalls mit der zweiten Ableitung nach, ob ein Maximum oder ein Minimum vorliegt. Dieses einfache Rezept wollen wir hier etwas genauer ansehen. Zuerst pr¨ azisieren wir den Begriff des Extremums. b) Absolute und relative Extrema Es sei f eine auf einem gewissen Definitionsbereich D(f ) gegebene Funktion. Unter dem absoluten Maximum von f (auf D(f )) versteht man den gr¨ ossten Funktionswert in bezug auf den gegebenen Definitionsbereich. Das absolute Minimum ist nat¨ urlich entsprechend definiert. Maxima und Minima fasst man unter dem Begriff Extrema zusammen. Etwas formeller: Es sei f : D(f ) → R eine Funktion. Man sagt, f habe ein absolutes Maximum an der Stelle x0 oder f (x0 ) sei ein absolutes Maximum von f , wenn gilt f (x0 ) ≥ f (x)
f¨ ur alle
x ∈ D(f ) .
Das absolute Minimum wird entsprechend definiert (ersetze ≥ durch ≤). Die Zahl x0 selbst nennen wir gelegentlich Extremalstelle. Das absolute Maximum kann ohne weiteres an mehreren Stellen angenommen werden. So hat z.B. die Funktion f (x) = x2 im Intervall [−1, 1] je ein absolutes Maximum an den Stellen −1 und 1 (beide nat¨ urlich mit demselben maximalen Funktionswert 1) und ein absolutes Minimum an der Stelle 0. Schr¨ ankt man aber den Definitionsbereich auf [0, 1] ein, so gibt es nur noch je ein absolutes Maximum bzw. Minimum. Dies belegt einmal mehr, dass der gew¨ ahlte Definitionsbereich einen grossen Einfluss auf das Verhalten der Funktion haben kann. y
y
1
1
x −1
0
1
x 0
1
An dieser Stelle sei vorsorglich darauf hingewiesen, dass es durchaus vorkommen kann, dass eine Funktion keine absoluten Extrema hat, vgl. c) unten.
6. Anwendungen der Ableitung
88
Neben den absoluten Extrema sind auch die relativen Extrema* von Bedeutung. autert die Begriffe anschaulich. Die folgende Skizze erl¨ rel. und abs. Max.
rel. Max. rel. Min. rel. Max. rel. Min. rel. und abs. Min. D(f )
Man spricht also dann von einem relativen Maximum an der Stelle x0 , wenn f (x0 ) der gr¨ osste Funktionswert in bezug auf alle x in der N¨ ahe von x0 ist, unabh¨ angig davon, ob weiter weg eventuell noch ein gr¨osserer Wert angenommen wird. Ein bildhafter Vergleich: Ein Landesrekord entspricht einem relativen, ein Weltrekord einem absoluten Extremum. Ein absolutes Extremum ist nat¨ urlich automatisch stets auch ein relatives Extremum. Um auch hier eine exakte Definition geben zu k¨ onnen, ist es zweckm¨ assig, die Redewendung “in der N¨ahe von x0 ” durch den Begriff der ε–Umgebung Uε (x0 ) des Punktes x0 zu ersetzen (vgl. (6.2.b)). Die pr¨ azise Formulierung lautet dann so: Die Funktion f : D(f ) → R hat an der Stelle x0 ∈ D(f ) ein relatives Maximum, wenn es eine ε–Umgebung Uε (x0 ) gibt, so dass gilt f (x0 ) ≥ f (x)
f¨ ur alle
x ∈ D(f ) ∩ Uε (x0 ) .
Das relative Minimum wird entsprechend definiert.
x0 Uε (x0 )
* Absolute bzw. relative Extrema nennt man manchmal auch globale bzw. lokale Extrema.
6.5 Extrema
89
c) Zur Existenz von Extrema Man ist oft daran interessiert, die Extrema (vor allem die absoluten Extrema) einer gegebenen Funktion f : D(f ) → R aufzusuchen. Es kann dabei durchaus geschehen, dass man nicht f¨ undig wird, denn eine Funktion braucht nicht unbedingt Extrema zu haben, wie die folgenden Beispiele zeigen: 1 1) f : (0, 1] → R, f (x) = . x f hat ein absolutes Minimum an der Stelle x = 1, aber kein absolutes Maximum, denn die Funktionswerte f (x) werden f¨ ur x → 0 beliebig gross. 2) f : (0, 1) → R, f (x) = x . f hat weder ein absolutes Maximum noch ein absolutes Minimum. Es ist nicht etwa so, dass f Extrema bei 0 und 1 hat, denn diese beiden Punkte geh¨ oren nicht zum Definitionsbereich. Die hier getroffene Wahl des Definitionsbereichs darf nicht als willk¨ urlich angesehen werden. Stellt x z.B. eine L¨ange oder ein Gewicht eines Individuums dar, so ist die Voraussetzung x > 0 durchaus nat¨ urlich.
y
1 x 1 y 1
3) Die durch den nebenstehenden Graphen dargestellte, f¨ ur alle x > 0 definierte Funktion f mit f (x) → ∞ f¨ ur x → 0 und f (x) → 0 f¨ ur x → ∞ hat ein relatives Maximum und ein relatives Minimum, aber keine absoluten Extrema. Eine explizite Formel f¨ ur eine solche Funktion ist hier nicht sehr relevant. Der nebenstehende Graph geh¨ ort zu f (x) =
6x3
+
3x2
− 20x + 12 , (x > 0) . x4
x 1 y
1
x 1
4) Ein Beispiel in Worten: Gesucht ist die kleinste positive Zahl. Eine solche existiert offenbar nicht, denn zu jeder Zahl x > 0 gibt es eine kleinere positive Zahl, z.B. x/2. Die Nichtexistenz von Extrema ist also etwas ganz Nat¨ urliches. Sie bringt auch keine besonderen Probleme, denn die in d) angegebenen Methoden liefern von selbst alle u ¨berhaupt existierenden Extrema. Erg¨anzung Man kann versuchen, Voraussetzungen anzugeben, unter denen eine Funktion Extrema besitzt. Ohne den etwas subtilen Beweis sei folgendes Resultat erw¨ ahnt: Wenn der Definitionsbereich I ein abgeschlossenes Intervall und wenn f : I → R stetig ist, dann hat f in I (mindestens) ein absolutes Maximum und ein absolutes Minimum, vgl. (4.6.i).
6. Anwendungen der Ableitung
90
d) Wie findet man die Extremalstellen? Da ein absolutes Maximum stets auch ein relatives Maximum ist, kann man das absolute Maximum (sofern es u ¨berhaupt existiert, vgl. die Beispiele in c)) dadurch bestimmen, dass man alle relativen Maxima sucht und dann jenes mit dem gr¨ossten Funktionswert ausw¨ ahlt. F¨ ur das absolute Minimum geht man selbstverst¨andlich analog vor. Wie Sie wohl aus der Mittelschule noch wissen, liefert die Differentialrechnung eine Methode (“Ableiten und Nullsetzen”) zur Ermittlung von relativen Extrema. Dabei sind aber zwei Dinge zu beachten: • Aus f (x0 ) = 0 darf nicht ohne weiteres geschlossen werden, dass f in x0 ein relatives Extremum hat, vgl. hierzu f). • Es kann auch Extremalstellen geben, in welchen die Ableitung nicht Null ist, vgl. 1. und 3. auf der untenstehenden “Kandidatenliste”. Wir stellen nun die m¨ oglichen Kandidaten f¨ ur relative Extremalstellen zusammen. Ob diese Punkte tats¨achlich relative Extrema liefern und welches davon gegebenenfalls ab¨ solute Extrema sind, muss durch separate Uberlegungen entschieden werden. (i) Randpunkte Wenn der Definitionsbereich D(f ) ein halboffenes oder abgeschlossenes Intervall ist, dann hat er Randpunkte (6.2.b). Wie die Skizzen in (6.5.b) zeigen, kann es vorkommen, dass die Funktion ausgerechnet in den Randpunkten ein absolutes oder relatives Extremum hat. Diese Randpunkte werden mit den Methoden der Differentialrechnung im allgemeinen nicht erfasst (die Ableitung der Funktion f ist in einem Randpunkt i.a. nicht gleich Null), so dass sie, falls vorhanden, stets separat zu ber¨ ucksichtigen sind (vgl. die Beispiele in (6.6)). (ii) Innere Punkte, in denen f differenzierbar ist Nachdem die Randpunkte besprochen sind, betrachten wir nun einen inneren Punkt x0 des Definitionsbereichs D(f ) und setzen auch noch voraus, dass f in x0 differenzierbar sei. Dann gilt: Es sei x0 ein innerer Punkt von D(f ) und f sei in x0 differenzierbar. Wenn f an der Stelle x0 ein relatives Extremum hat, dann ist f (x0 ) = 0. Dieses Ergebnis ist anschaulich klar: Wenn z.B. ein relatives Maximum vorliegt, dann steigt die Tangente links von x0 und sie f¨allt rechts von dieser Stelle. Die (nach Voraussetzung existierende) Tangente in x0 muss deshalb horizontal sein: Es ist f (x0 ) = 0.
6.5 Extrema
91
y
horizontale Tangente f x x0
Wir verzichten auf einen strengen, rein rechnerischen Beweis. Obwohl wir in f) darauf zur¨ uckkommen werden, sei jetzt schon betont, dass die Umkehrung der obigen Tatsache nicht gilt: Aus f (x0 ) = 0 braucht noch nicht zu folgen, dass f in x0 ein relatives Extremum hat. (iii) Innere Punkte, in denen f nicht differenzierbar ist Wenn f in x0 nicht differenzierbar ist, so ist die Bedingung f (x0 ) = 0 sinnlos. Es kann aber vorkommen, dass ein Extremum gerade dort auftritt, wo f nicht differenzierbar ist. So hat die Funktion f (x) = |x| ihr relatives (und absolutes) Minimum an der Stelle x = 0, wo sie nicht differenzierbar ist! Ohne Anspruch auf Vollst¨ andigkeit ist dann Vorsicht geboten, wenn Absolutbetr¨ age in Funktionen vorkommen oder die Funktion auf verschiedenen Intervallen verschiedenen Gesetzen folgt (Schreibweise mit geschweifter Klammer). y f (x) = |x| x Ein weiteres Beispiel finden Sie in (6.6.2). e) Zusammenfassung ¨ Die oben gemachten Uberlegungen lassen sich (in ge¨ anderter Reihenfolge) wie folgt zusammenfassen: Ein relatives Extremum (wenn es u ¨berhaupt existiert) muss an einer der folgenden Stellen auftreten: 1. Innere Punkte x0 des Definitionsbereichs mit f (x0 ) = 0, 2. Randpunkte des Definitionsbereichs (falls vorhanden), 3. Stellen, wo f nicht differenzierbar ist (falls vorhanden). Die absoluten Extrema (falls sie existieren) findet man unter den relativen Extrema. Das gr¨ osste relative Maximum ist dann das absolute Maximum, das kleinste relative Minimum ist das absolute Minimum.
6. Anwendungen der Ableitung
92
f) Charakterisierung der Extrema y
Es ist bereits unter Punkt (ii) oben erw¨ ahnt worden, dass man aus der Beziehung f (x0 ) = 0 nicht unbesehen schliessen darf, dass f in x0 ein relatives Extremum hat. In der Tat gilt z.B. f¨ ur die Funktion f (x) = x3 zwar f (0) = 0, aber f hat kein Extremum im Nullpunkt (wohl aber einen Terrassenpunkt).
x
¨ Uberdies sagt die Bedingung f (x0 ) = 0 auch im Fall, wo tats¨ achlich ein relatives Extremum vorhanden ist, nichts dar¨ uber aus, ob es sich um ein Maximum oder ein Minimum handelt. (Geometrisch: Die Tangente ist sowohl beim relativen Maximum als auch beim Minimum horizontal.) Wie kann man nun entscheiden, welcher Fall vorliegt? Es sei also f (x0 ) = 0. Hat die Funktion in x0 ein relatives Maximum, ein relatives Minimum oder keins von beiden? 1) In manchen (angewandten) Beispielen ist es so, dass auf Grund der Problemstellung ein Extremum (ausserhalb eines Randpunkts) auftreten muss. Gibt es dann weiter nur gerade eine Stelle x0 mit f (x0 ) = 0, so ist man sicher, dass das gesuchte Extremum entweder in x0 oder am Rand auftritt. (Einmal abgesehen von Stellen, wo f nicht differenzierbar ist.) Vgl. hierzu die Beispiele aus (6.6). 2) Wenn die Funktion f zweimal differenzierbar ist, so kann das folgende Kriterium helfen: Wie oben sei x0 eine Stelle mit f (x0 ) = 0. • Ist f (x0 ) < 0, so hat f in x0 ein relatives Maximum. • Ist f (x0 ) > 0, so hat f in x0 ein relatives Minimum. Wenn aber f (x0 ) = 0 ist, so kann man nichts aussagen, und es m¨ ussen andere ¨ Uberlegungen gemacht werden, wie die folgenden Beispiele zeigen: In den nachstehenden F¨allen ist jedesmal f (0) = 0, f (0) = 0. y
y f (x) = −x4 y x
f (x) = x3
x
x Minimum f (x) = x4 Maximum
Die oben genannten Regeln werden plausibel, wenn man an die Betrachtungen in (6.4) denkt: Eine negative zweite Ableitung bedeutet eine Rechtskurve, also eine nach unten ge¨ offnete Kurve, was einem Maximum entspricht. Analog funktioniert
6.6 Beispiele zur Bestimmung von Extrema
93
¨blich u der Fall einer positiven zweiten Ableitung. Wie u ¨berlassen wir auch hier die strengen Beweise den Mathematikern. y rel. Max.
Rechtskurve
x 3) Das in 2) genannte Kriterium ist nicht immer praktisch, weil die zweite Ableitung schon recht kompliziert werden kann. Dieser Einwand gilt noch mehr f¨ ur das nachstehende Kriterium, das h¨ ohere Ableitungen verwendet und das ohne Begr¨ undung zitiert sei: Die Funktion f sei mindestens n–mal differenzierbar und x0 sei ein innerer Punkt von D(f ). Ferner sei f (x0 ) = f (x0 ) = . . . = f (n−1) (x0 ) = 0 und f (n) (x0 ) = 0. Ist nun n eine gerade Zahl, so hat f in x0 ein relatives Extremum, und zwar f¨ ur f (n) (x0 ) < 0 ein relatives Maximum und f¨ ur f (n) (x0 ) > 0 ein relatives Minimum. Ist aber n ungerade, so hat f in x0 kein relatives Extremum.
(6.6) Beispiele zur Bestimmung von Extrema Beispiel 1 Wir betrachten f (x) = xex a) auf dem Intervall [0,1] und b) auf dem Intervall [−2, 0]. Nach der Produktregel ist f (x) = (x + 1)ex . Da ex stets positiv ist, ist x = −1 die einzige Stelle mit f (x) = 0. a) D(f ) = [0, 1]. In diesem Intervall ist die Ableitung u ¨berhaupt nie gleich Null. Es w¨are aber falsch zu glauben, f habe kein Extremum. Gem¨ ass der Zusammenfassung in (6.5.e) sind auch noch die Randpunkte 0 und 1 zu ber¨ ucksichtigen. Wegen f (0) = 0 und f (1) = e sieht man sofort: • f nimmt f¨ ur x0 = 0 das absolute Minimum 0 an, • f nimmt f¨ ur x0 = 1 das absolute Maximum e an. b) D(f ) = [−2, 0]. Diesmal liegt die Zahl x0 = −1 mit f (x0 ) = 0 in D(f ). Die Randpunkte sind aber auch hier zu ber¨ ucksichtigen. Ein Vergleich der Werte f (−2) = −0.2707, f (−1) = −0.3679 und f (0) = 0 zeigt: • f nimmt f¨ ur x0 = −2 ein relatives Maximum −0.2707 an. • f nimmt f¨ ur x0 = −1 das absolute Minimum −0.3679 an. • f nimmt f¨ ur x0 = 0 das absolute Maximum 0 an.
6. Anwendungen der Ableitung
94
Wie Sie sehen, war es hier nicht n¨otig, die zweite Ableitung gem¨ass (6.5.f) zu bem¨ uhen, um den Charakter des Extremums an der Stelle x0 = −1 zu ermitteln. Als Best¨atigung tun wir dies doch noch. Es ist f (x) = ex (x+2) und somit f (−1) = 0.3679 > 0 : f hat in x0 = −1 ein relatives Minimum. Im Nachhinein erkl¨art ein Blick auf den Graphen von f die obigen Feststellungen erneut.
y
1 −1
x 1
Beispiel 2 Das folgende Beispiel wirkt wohl etwas k¨ unstlich (und ist es auch), hat aber den Vorteil, dass alle drei Punkte der Zusammenfassung von (6.5.e) gebraucht werden. Wir betrachten √ 3 f (x) = x2 + x auf dem Intervall [− 12 , 1]. Es ist* f (x) =
2 1 √ +1 , 3 3x
aber nur f¨ ur x = 0. Im Punkte x = 0 existiert f nicht: f ist an der Stelle 0 nicht differenzierbar. Weiter ist 2 1 f (x) == − √ (x = 0) . 9 3 x4 Wir suchen die Extrema gem¨ ass der oben erw¨ahnten Zusammenfassung. 1. Innere Punkte mit f (x0 ) = 0. f (x) =
√ 2 2 1 √ + 1 = 0 ⇐⇒ − = 3 x . 3 3x 3
8 = −0.296... . Die einzige Nullstelle von f ist x0 = − 27 Es ist 8 f (x0 ) = f (− ) = 0.148... . 27 2. Randpunkte (− 12 und 1). 1 f (− ) = 0.129... , 2
f (1) = 2.
* Die Formel f¨ur f (x) gilt auch f¨ur negative x. Beachten Sie, dass die Funktion
√ 3
x auch f¨ ur x ≤ 0
definiert ist, im Gegensatz zur “allgemeinen Potenzfunktion” xr , r ∈ R, wo x > 0 vorausgesetzt werden muss.
6.6 Beispiele zur Bestimmung von Extrema
95
y
3. f ist in x = 0 nicht differenzierbar, es ist f (0) = 0. 2
Ein Vergleich der unterstrichenen Funktionswerte ergibt: • f hat Stelle • f hat Stelle • f hat Stelle
ein absolutes Minimum an der 0: f (0) = 0, ein absolutes Maximum an der 1: f (1) = 2. zudem ein relatives Minimum an der −0.5: f (−0.5) = 0.129....
1
Wie Sie der Skizze entnehmen k¨ onnen, liegt f¨ ur x 0 = −8/27 (f (−8/27) = 0) ein relatives Maximum vor, was dadurch best¨atigt wird, dass die 2. Ableitung dort negativ ist.
x −1 − 8 27 2
1
Beispiel 3 Ein Mann befindet sich auf einem Ruderboot im Punkte A und will m¨ oglichst rasch den Punkt B am Ufer erreichen. Seine Geschwindigkeit zu Wasser sei v, jene zu Lande w. Wo muss er landen? (a, b, v, w > 0). Wir nehmen an, der Landepunkt habe den Abstand x von O. Von der Problemstellung her ist klar, dass wir 0 ≤ x ≤ b annehmen k¨ onnen. otigte Zeit √ Die ben¨ b−x a2 + x2 ist dann offenbar gleich f (x) = + mit v w D(f ) = [0, b].
A a B O b A
√
a2 + x2
Beachten Sie, dass b − x nur solange der Abstand zwischen B und X ist, als x ≤ b ist (f¨ ur x > b m¨ usste man |b − x| = x − b schreiben; dieser Fall interessiert uns aber nicht).
Mit Hilfe der Ableitungsregeln berechnet man
O
x 1 − , f (x) = √ 2 2 w v a +x a2 f (x) = >0 2 v(a + x2 )3/2
B
X x
b−x
f¨ ur alle x .
Wann ist f (x) = 0? Aus x 1 √ = 2 2 w v a +x
folgt
x = v
√
a2 + x2 , w
und durch Quadrieren (keine Probleme, weil alle vorkommenden Gr¨ossen positiv sind) erh¨ alt man x2 a2 + x2 a2 v 2 = und somit x2 = 2 . 2 2 v w w − v2
6. Anwendungen der Ableitung
96
av . − v2 Dies ist sicher nur sinnvoll f¨ ur w > v. Wenn w ≤ v ist, so hat f keine Nullstelle. Dies heisst aber nicht, dass es kein Extremum gibt. Es bedeutet bloss, dass dieses nicht im Innern des Definitionsbereichs liegt, sondern am Rand, also f¨ ur x = 0 oder x = b angenommen wird. Nun besagt w ≤ v aber, dass der Mann schneller rudert als geht. In diesem Fall ist es ohne Rechnung klar, dass er direkt von A nach B rudern muss: Das Minimum wird f¨ ur x = b angenommen.
Es ist also f (x0 ) = 0 f¨ ur x0 = √
w2
Es sei nun v < w. Als konkretes Beispiel setzen wir v = 3, w = 5 sowie a = 4. F¨ ur b w¨ahlen wir einmal 4 und einmal 2: a) a = b = 4. Dann wird nach der obigen Formel x0 = 3. Da 3 ∈ [0, b] = [0, 4] ist, haben wir einen Kandidaten f¨ ur das Extremum gewonnen. Andere Kandidaten sind nur noch die Randpunkte 0 und b = 4. √ Nun ist (setze ein) f (0) = 32/15 = 2.133, f (3) = 28/15 = 1.867 und f (4) = 4 2/3 = 1.886. Daraus sieht man, dass f (3) das absolute Minimum ist. (Die Verwendung der 2. Ableitung ist hier gar nicht n¨otig.) b) a = 4, b = 2. Wie oben wird x0 = 3. Nun ist aber x0 ∈ [0, b] = [0, 2]. Die Ableitung f hat also in [0, b] keine Nullstelle. onnen nur am Rand auftreten. Es √ Extrema k¨ ist f (0) = 26/15 = 1.733, f (2) = 20/3 = 1.491, woraus folgt, dass das absolute Minimum an der Stelle x = b = 2 liegt. Der Mann soll also direkt nach B rudern. Was bedeutet aber die Tatsache, dass f (3) = 0 ist? Wegen f (3) > 0 liegt dort ein relatives Minimum der Funktion f (x). Anderseits ist es sicher unlogisch, beim Punkt x = 3 zu landen und dann zum B (x = 2) zur¨ uckzukehren. Des R¨ atsels L¨ osung liegt darin, dass die Funktion Punkt f (x) = a2 + x2 /v + (b − x)/w nur solange den gew¨ unschten Sachverhalt (Zeitbedarf von A nach B) wiedergibt, als 0 ≤ x ≤ b = 2 ist. F¨ ur x > b ist b − x < 0 und die negative Zahl (b − x)/w stellt sicher nicht den Zeitbedarf von X nach B dar. Es ist daher einfach sinnlos, f (3) und f (3) u ¨berhaupt zu betrachten.
(6.7) Graphische Darstellung von Funktionen Gew¨ohnlich veranschaulicht man sich das Verhalten einer Funktion anhand ihres Graphen. Die einfachste Methode, diesen Graphen zu zeichnen, besteht darin, einige Punkte (x, f (x)) auszurechnen (“Wertetabelle”), in ein Koordinatensystem einzutragen und zu verbinden. Bei komplizierteren Funktionen braucht es aber schon recht viele ¨ Punkte f¨ ur einen guten Uberblick. Diese Aufgabe kann man auch einem Computerprogramm oder einem entsprechend ausger¨ usteten Taschenrechner u ¨bertragen. In vielen F¨allen interessiert man sich aber vor allem f¨ ur den generellen Verlauf des Graphen, z.B. in bezug auf Symmetrie, Wachstum, Verhalten f¨ ur grosse Werte von x ¨ usw. Dabei helfen allgemeine Uberlegungen, die auch Methoden der Differentialrechnung einschliessen und die Sie im Gymnasium unter dem Namen “Kurvendiskussion” kennengelernt haben. Wir werden hier diese Kurvendiskussion nicht als Selbstzweck betreiben; einige Anwendungen folgen bei passender Gelegenheit.
97
6.7 Graphische Darstellung von Funktionen
Im folgenden stellen wir die wichtigsten zu ber¨ ucksichtigenden Punkte mit einfachen illustrierenden Beispielen zusammen. Es wird aber nicht immer m¨oglich sein, bei einer vorgegebenen Funktion alle diese Punkte vollst¨ andig zu behandeln; man wird dann eine unftige Auswahl treffen m¨ vern¨ ussen. y
a) Bestimmung des Definitionsbereichs, sofern nicht durch die konkrete Problemstellung vorgegeben. Beispiel: Der maximale Definitionsbereich von f (x) = √ 1 − x2 ist {x | −1 ≤ x ≤ 1}, denn der Radikand 1−x2 muss stets ≥ 0 sein.
x −1
1 y
b) Symmetrien. Ist f (−x) = −f (x), so ist der Graph punktsymmetrisch in Bezug auf den Nullpunkt. Beispiel: f (x) = 13 x3 − x (6.4).
1
y
Ist f (−x) = f (x), so ist der Graph symmetrisch in Bezug auf die y–Achse. Beispiel: f (x) = x2 − 1 (6.4). Etwas allgemeiner ist die Symmetrie in Bezug auf die Gerade x = a. Sie tritt dann auf, wenn f (a − x) = f (a + x) ist. 2 Beispiel: f (x) = e−(x−2) . Mit a = 2 ist 2 2 2 f (a − x) = e−((2−x)−2) = e−(−x) = e−x . 2 2 f (a + x) = e−((2+x)−2) = e−x .
x
x 1
y x 2
c) Nullstellen und Vorzeichen. Wo ist f (x) > 0, = 0, < 0? d) Wachstum und Extrema. Hier benutzt man die 1. Ableitung; vgl. (6.3), (6.5). Wo ist f (x) > 0, = 0, < 0? Beispiel: f (x) = 13 x3 − x, vgl. die Skizzen am Schluss von (6.4).
y 1
e) Kr¨ ummung und Wendepunkte. Hier benutzt man die 2. Ableitung; vgl. (6.4). Wo ist f (x) > 0, = 0, < 0? Beispiel: f (x) = 13 x3 − x, vgl. die Skizzen am Ende von (6.4).
x
y
f) Asymptoten. 1 (x > 0). x F¨ ur x → ∞ n¨ahert sich der Graph immer mehr der x– Achse (“horizontale Asymptote”), f¨ ur x → 0 schmiegt Beispiel: f (x) =
1 1
x
6. Anwendungen der Ableitung
98
er sich der y–Achse an (“vertikale Asymptote”).*
y
Es gibt auch schr¨ age Asymptoten. 1 Beispiel: f (x) = x + 1 + (x > 0). x Hier n¨ ahert sich der Graph f¨ ur x → ∞ immer mehr der Geraden y = x + 1.
1
x
g) Berechnung der Funktionswerte f¨ ur einige ausgew¨ ahlte Punkte (z.B. Extrema).
Schliesslich kann es auch nicht schaden, wenn man den Verlauf der einfachsten Funktionen auswendig kennt; vgl. auch (26.11) bis (26.15). y
y b
a x
1
1 1x
y
y = x3
y 1
x
1
1x
y = x2
y = ax + b
1
y
y
1
y=
1 x √
y
y 1
x
x
x
1 y=
x
1
1 x
y = ecx , c > 0
y = ecx , c < 0
y = ln x y
1
y x π y = sin x
1 y
π
2π
x 2π
y = cos x
1
x π
2π
y = tan x
In (18.2) werden wir auf gewisse Modifikation von Funktionen und deren Auswirkungen auf den Graphen eingehen.
* Wenn in x0 eine vertikale Asymptote existiert, wenn also f (x) → ±∞ strebt f¨ur x → x0 , dann sagt man auch, f habe in x0 einen Pol.
99
6.∞ Aufgaben
(6.∞) Aufgaben 6−1 Von den vier skizzierten Funktionen ist eine die Ableitung einer andern. Finden Sie dieses P¨ archen. y
y f1
y f2
x
y f3
x
f4 x
6−2 Gegeben ist die Funktion f : R → R, f (x) = (x − 1)ex . a) Wo nimmt sie positive, wo negative Werte an? b) Wo w¨ achst sie, wo beschreibt der Graph eine Linkskurve, wo eine Rechtskurve? d) Skizzieren von f unter Verwendung der Erkenntnisse aus a), b) und c). x . 6−3 Gegeben ist die Funktion f : R → R, f (x) = 1 + x2 a) Wo nimmt sie positive, wo negative Werte an? b) Wo w¨ achst sie, wo beschreibt der Graph eine Linkskurve, wo eine Rechtskurve? d) Skizzieren von f unter Verwendung der Erkenntnisse aus a), b) und c).
x
f¨ allt sie? c) Wo Sie den Graphen
f¨ allt sie? c) Wo Sie den Graphen
6−4 Die Funktion g ist auf dem Intervall [−1, 1] definiert (und dort zweimal differenzierbar). Man ur alle x; ferner ist g (x) > 0 in [−1, 0), g (x) < 0 in (0, 1] und weiss, dass g (x) < 0 ist f¨ g (0) = 0. Schliesslich ist g(0) = 0. Skizzieren Sie einen m¨ oglichen Kurvenverlauf. 6−5 Bestimmen Sie – falls vorhanden – die absoluten Extrema der Funktion f (x) = x3 − 12x a) im Intervall [−3, 3], b) im Intervall (0, 1), c) im Intervall [0, 1]. 6−6 Bestimmen Sie – falls vorhanden – die absoluten Extrema der Funktion g(x) = x · ln x a) im Intervall [ 14 , 2], b) im Intervall [ 12 , 2], c) im Intervall ( 12 , 2). 6−7 Bestimmen Sie alle relativen Extrema der Funktion h(x) = |x2 − 1| im Intervall [−2, 2]. √ √x 6−8 Wo ist die erste Ableitung der Funktion F (x) = x (x > 0) gleich Null? Hat F an dieser Stelle ein relatives Maximum oder ein relatives Minimum? 6−9 Eine Aufgabe aus dem Kapitel “De maximis et minimis” des 1755 erschienenen Buchs “Institutiones calculi differentialis” von LEONHARD EULER (1707-1783): EXEMPLUM 2 2 − 3x + xx Invenire casus, quibus formula fit maximum vel minimum. 2 + 3x + xx 6−10 Zwei Korridore der Breite a bzw. b stossen rechtwinklig aufeinander. Bestimmen Sie die L¨ ange der l¨ angsten Stange, die (horizontal) um die Ecke getragen werde kann. (Tip: F¨ uhren Sie den Winkel α als Variable ein.) 6−11 Von einem St¨ uck Karton der Gr¨ osse DIN A4 ist eine Ecke abgeschnitten worden. Aus dem Rest soll ein Rechteck (in der Skizze schraffiert) mit maximalem Fl¨ acheninhalt ausgeschnitten werden. Wie lang und wie breit muss dieses Rechteck sein? a) Mit a = 60 mm, b = 40 mm; b) mit a = 40 mm, b = 60 mm.
a α b a b
100
6. Anwendungen der Ableitung
6−12 Auf einer Wiese soll ein rechteckiges St¨ uck Land eingez¨ aunt werden, wobei die 8 m lange Wand eines am Rand der Wiese stehenden Schopfs miteinbezogen wird. Wie muss dieses Rechteck dimensioniert werden, damit es m¨ oglichst grossen Fl¨ acheninhalt hat, wenn a) 12 m, b) 20 m, c) 28 m Zaun zur Verf¨ ugung stehen? Beachten Sie, dass es zwei grunds¨ atzlich verschiedene M¨ oglichkeiten gibt.
6−13 Im Zauberland gibt es einen kreisf¨ ormigen Wald. Im Schloss A wohnt der M¨ archenprinz, der seine im diametral gegen¨ uberliegenden Schloss B wohnende M¨ archenprinzessin besuchen m¨ ochte. Sein edles Ross entwickelt dem Waldrand entlang eine Geschwindigkeit, die gleich dem a–fachen jener im Waldesinnern ist. Welche Route muss unser Prinz w¨ ahlen, damit er so schnell als m¨ oglich bei seiner Prinzessin ist? (Ein prosaischer Tip: W¨ ahlen Sie den Winkel β als Variable.)
6−14 Ein rechteckiger Swimmingpool von 5 m Breite hat in der L¨ angsrichtung einen Querschnitt gem¨ ass Skizze. Der leere Pool wird mit Wasser gef¨ ullt, wobei pro Minute 200 Liter hineinfliessen. Berechnen Sie die Geschwindigkeit (in cm pro Minute), mit welcher der Wasserspiegel steigt.
β B
A
10 m 1m
2m 4m x
6−15 Ein Drehlicht mit scharf geb¨ undeltem Strahl rotiert alle 6 Sekunden einmal. Der Strahl trifft auf eine Mauer, die vom Licht 5 m Abstand hat. Bestimmen Sie die Geschwindigkeit des Lichtpunkts in Abh¨ angigkeit von x.
5
6−16 Ein Riesenrad von 10 m Durchmesser dreht sich gleichf¨ ormig alle zwei Minuten einmal. Zum Zeitpunkt t = 0 sind Sie ganz oben. Geben Sie eine Formel f¨ ur die vertikale Komponente der Geschwindigkeit in ms−1 und der Beschleunigung in ms−2 (nach unten positiv gerechnet) im Intervall 0 ≤ t ≤ 60 (Sekunden) an. 6−17 Der Schnittwinkel zweier Kurven ist als Schnittwinkel der Tangenten im Schnittpunkt definiert. Unter welchem Winkel schneiden sich die durch a) y = sin x und y = cos x (0 ≤ x ≤ π/2), √ b) y = x4 und y = 4 x (x > 0) gegebenen Kurven? x2 + 1 und skizzieren Sie ihren Graphen. x2 − 1 6−19 Diskutieren Sie die Funktion g(x) = e−x − e−2x und skizzieren Sie ihren Graphen. 6−18 Diskutieren Sie die Funktion f (x) =
101
7. LINEARISIERUNG UND DAS DIFFERENTIAL ¨ (7.1) Uberblick Manchmal ist es zur Vereinfachung eines Problems zweckm¨assig, eine gegebene Funktion in der N¨ahe einer Stelle x0 durch eine lineare Funktion anzun¨ahern. Geometrisch bedeutet dies, dass man den Graphen der Funktion durch seine Tangente an der Stelle x0 ersetzt.
(7.2)
Mit den u ¨blichen Abk¨ urzungen Δf = f (x) − f (x0 ), Δx = x − x0 gilt dann folgende N¨ aherung f¨ ur den Zuwachs Δf :
(7.3)
Δf ≈ f (x0 )Δx . Der Ausdruck auf der rechten Seite heisst das Differential von f und wird mit df bezeichnet.
(7.4)
Dieses Differential wird unter anderem dazu verwendet, die Fortpflanzung von Messfehlern abzusch¨ atzen. ¨ Uber die G¨ ute der verwendeten N¨aherungen werden in (7.3) und (7.6)
(7.5)
Aussagen gemacht.
(7.3), (7.6)
(7.2) Die Tangentengleichung Wir betrachten eine differenzierbare Funktion f und eine Stelle x0 aus ihrem Definitionsbereich. Wir bestimmen zun¨ achst die Gleichung der Tangente an den Graphen von f an der Stelle x0 . Dabei benutzen wir die Gleichung der Geraden, welche durch einen Punkt P (x0 , y0 ) geht und die Steigung m hat. Diese lautet bekanntlich y = y0 + m(x − x0 ) . Diese Gleichung sollte Ihnen aus der analytischen Geometrie vertraut sein. F¨ ur alle F¨ alle sei sie aber rasch hergeleitet. Wie Sie der Figur entnehmen k¨ onnen, liegt ein beliebiger Punkt (x, y) genau dann auf g, wenn y − y0 = m, also y = y0 + m(x − x0 ) x − x0 ist. Dabei wurde die u ¨bliche Definition der Steigung einer Geraden als Quotient “Vertikaldistanz dividiert durch Horizontaldistanz” benutzt, wie sie auch im t¨ aglichen Leben (Steigung einer Strasse) verwendet wird.
y g
y y0
y − y0
P x − x0
x x0
x
7. Linearisierung und das Differential
102
Da unsere gesuchte Tangente durch den Punkt (x0 , f (x0 )) geht und die Steigung orige Geradengleichung sofort angeben, indem wir in onnen wir die zugeh¨ f (x0 ) hat, k¨ der obigen Formel y0 = f (x0 ) und m = f (x0 ) setzen. Sie lautet dann y = p(x) = f (x0 ) + f (x0 )(x − x0 ) . Die folgende Figur zeigt den Sachverhalt auf: y f p
x x0
(7.3) Linearisierung einer Funktion Ein Blick auf die obige Skizze zeigt, dass die lineare Funktion (1)
p(x) = f (x0 ) + f (x0 )(x − x0 )
in der N¨ ahe von x0 eine gute Approximation der gegebenen Funktion f (x) ist. Die Funktionen f und p haben n¨ amlich an der Stelle x0 denselben Funktionswert und dieselbe Ableitung: f (x0 ) = p(x0 ) , f (x0 ) = p (x0 ) . Anders ausgedr¨ uckt: An der Stelle x0 stimmen die 0. und die 1. Ableitung von f und pu ¨berein. (Unter der 0. Ableitung versteht man bekanntlich die Funktion selbst, siehe (4.5).) In der N¨ahe von x0 gilt also: (2)
f (x) ≈ p(x)
(das Zeichen ≈ bedeutet “ungef¨ ahr gleich”). Nun ist eine lineare Funktion wie p nat¨ urlich einfacher zu handhaben als die beliebige Funktion f . Man macht sich dies manchmal zunutze, indem man f (x) durch p(x) ersetzt. Man nennt dann p eine “lineare Ersatzfunktion” oder man sagt, man habe f “linearisiert”. Die folgende Tabelle enth¨alt einige Beispiele:
7.3 Linearisierung einer Funktion
103
f (x)
f (x)
x0
f (x0 )
f (x0 )
p(x)
ex
ex
0
1
1
1+x
ln(x)
1 x
1
0
1
x−1
1+x
1 √ 2 1+x
0
1
1 2
1 1+ x 2
1+x
1 √ 2 1+x
3
2
1 4
1 2 + (x − 3) 4
1 1 + x2
−2x (1 + x2 )2
0
1
0
1
√ √
Beispiele und Hinweise 1. Setzen wir im 4. Beispiel der Tabelle x = 3.01 (nahe bei x0 = 3), so finden wir √ f (x) = 4.01 = 2.002498 . . . , 1 p(x) = 2 + · 0.01 = 2.0025 . 4
Die Approximation ist, wie man sieht, sehr gut.
angt. 2. Beachten Sie, dass die lineare Ersatzfunktion von der gew¨ ahlten Stelle x0 abh¨ Im 3. und 4. Beispiel aus der Tabelle linearisieren wir beide Male die Funktion √ f (x) = 1 + x, verwenden aber zwei verschiedene Werte von x0 . F¨ ur x0 = 0 1 1 1 erhalten wir p(x) = 2 x + 1, f¨ ur x0 = 3 aber p(x) = 2 + 4 (x − 3) = 4 x + 54 . 3. Wie das 5. Beispiel aus der Tabelle zeigt, kann es ohne weiteres vorkommen, dass p(x) eine konstante Funktion ist (dies tritt genau dann ein, wenn f (x0 ) = 0 ist). 4. (Ein Beispiel mit einer Moral.) Wir betrachten f (x) = cos x und w¨ahlen x0 = 60◦ . Dann ist wegen f (x) = − sin x √ 3 ◦ ◦ f (x0 ) = cos 60 = 0.5, f (x0 ) = − sin 60 = − = −0.866 . . . 2 Damit erhalten wir die Linearisierung √ cos x = f (x) ≈ p(x) = 0.5 −
3 (x − x0 ) . 2
W¨ ahlen wir nun weiter x = 59◦ , so ist x − x0 = −1, also √ 3 cos 59◦ ≈ p(59) = 0.5 + = 1.366 . . . 2
7. Linearisierung und das Differential
104
Dieses Ergebnis kann offensichtlich nicht stimmen, denn die Cosinusfunktion nimmt bekanntlich nur Werte zwischen −1 und 1 an. Zudem verr¨ at uns der Taschenrechner, dass cos 59◦ = 0.5150 . . . ist. Was ist schief gegangen? Wir haben hier (und das ist die Moral von der Geater auch beim schichte) die Grundregel verletzt, dass beim Differenzieren (und sp¨ Integrieren) von trigonometrischen Funktionen stets das Bogenmass zu gebrauchen ist, vgl. (5.3). Oben haben wir aber das Gradmass verwendet. Die korrekte Rechauft wie folgt: Im Bogenmass entspricht 60◦ dem Wert x0 = π/3 und 59◦ nung verl¨ entspricht x = 59π/180. Dann ist x − x0 = −π/180, und wir finden π π −π p(x) = f (x0 ) + f (x0 )(x − x0 ) = cos − sin · 3 3 180 √ 3 π · = 0.5151 . . . , = 0.5 + 2 180 also eine gute Ann¨ aherung.
√
◦
Nat¨ urlich wird man in der Praxis 4.01 oder cos 59 nicht auf diese Weise berechnen; die Zahlenbeispiele sollen vor allem den Prozess der Linearisierung beleuchten. Bemerkungen a) Diese Approximation von f durch die lineare Funktion p kann nur in der N¨ ahe von x0 benutzt werden. In den praktischen Anwendungen (vgl. z.B. (7.5)) ist diese Bedingung jeweils erf¨ ullt und der “Fehler” f (x) − p(x), den man beim Ersatz von f (x) durch p(x) begeht, ist dann sehr klein. In b) ist eine Absch¨ atzung dieses Fehlers angegeben; in (7.6) wird er noch auf eine andere Weise untersucht. b) Bei einer Approximation ist es oft n¨ utzlich zu wissen, wie gross der begangene Fehler h¨ ochstens sein kann. Ohne Beweis (siehe aber (27.6)) sei folgende Formel erw¨ ahnt: Es sei I das von x0 und x begrenzte abgeschlossene Intervall, d.h. I = [x0 , x] f¨ ur x0 < x, I = [x, x0 ] ur die Differenz f¨ ur x < x0 . Ferner sei M das Maximum des Betrags von f (x) in I. Dann gilt f¨ f (x) − p(x) die Absch¨ atzung M |f (x) − p(x)| ≤ (x − x0 )2 . 2 Ein einfaches Beispiel hierzu: Sei f (x) = sin x, x0 = 0. Dann ist f (x) = cos x, f (x0 ) = 1, und wir erhalten p(x) = x. (Achtung: x ist das Bogenmass!) Weiter ist f (x) = − sin x, und somit ist ganz sicher stets |f (x)| ≤ 1, d.h. aber, dass M ≤ 1 ist. Es folgt |f (x) − p(x)| ≤
M 1 (x − x0 )2 ≤ x2 . 2 2
Ist also z.B. |x| ≤ 0.01, so ist der Fehler, den man erh¨ alt, wenn man sin x durch x ersetzt, sicher bereits ≤ 0.00005. (In Wirklichkeit ist er noch viel kleiner; kontrollieren Sie es nach!) c) In Kapitel 19 werden wir sehen, dass man als Ersatzfunktionen nicht nur lineare Funktionen, sondern auch Polynome n–ten Grades nehmen kann.
7.3 Linearisierung einer Funktion
105
Absch¨atzung der Verdopplungszeit bei exponentiellem und geometrischem Wachstum Wir Menschen k¨onnen lineares Wachstum im Kopf meistern: wenn ein Auto ohne Pause 10 Stunden mit 100 km/h f¨ ahrt, kommt es 1’000 km weit. Wenn wir die Natur, Technik oder sozialwissenschaftliche Prozesse modellieren wollen, kommen wir aber alleine mit linearen Abh¨angigkeiten nicht sehr weit. Wir werden sp¨ ater in Kapitel 15 bei den Differentialgleichungen begr¨ unden, weshalb viele Prozesse im Zeitablauf sinnvollerweise mit exponentiellem oder geometrischem Wachstum modelliert werden. Exponentielles Wachstum in der Zeit t ≥ 0 bedeutet, dass die uns interessierende Gr¨ osse y(t) gem¨ass (exp)
y(t) = Keλt
w¨ achst. Dabei ist K > 0 der Wert bei t = 0: y(0) = Keλ0 = K. λ kann gr¨ osser oder kleiner 0 sein. W¨ahrend bei exponentiellem Wachstum die Zeit jeden Wert in R annehmen kann (man spricht von stetiger Zeitmessung), bedeutet geometrisches Wachstum, dass die Zeit n diskret (zum Beispiel nat¨ urliche Zahlen) angegeben wird. Die analoge Formel zu (exp) lautet dann (geom)
Z(n) = K(1 + r)n .
Auch hier kann r gr¨ osser oder kleiner 0 sein. Aus dem t¨aglichen Leben ist man sich eher das geometrische Wachstum gew¨ohnt. Formel (geom) wird benutzt, um den Stand eines Sparheftes auf der Bank zu modellieren; r ist dann der Jahreszins. Bei der Zellteilung ist r = 1; wir erhalten pro Generation n jeweils eine Verdoppelung: Z(n) = K(1+1)n = K2n . Eine kleine Warnung: wenn man den gleichen Prozess sowohl stetig wie auch diskret modellieren will, dann ist K gleich, aber λ = r. Eine kleine Rechnung zeigt, dass exakt gilt λ = ln(1 + r).
Verdopplungszeiten: In Beispiel 2 in der Tabelle haben wir gesehen, dass f¨ ur x nahe 1 gilt: (approx I)
ln(x) ≈ x − 1.
x nahe 1 k¨ onnen wir umformulieren mit x := 1+h mit h klein. Jetzt k¨onnen wir (approx I) umschreiben und erhalten stattdessen f¨ ur kleine h (approx II)
ln(1 + h) ≈ h.
Mit Hilfe von (approx II) k¨onnen wir jetzt f¨ ur kleine Wachstumsraten eine praktische Approximation “f¨ ur den Alltag herleiten”: Wie lange dauert es, bis das Sparheft auf der Bank sich verdoppelt? Dies ist nicht mehr eine lineare Angelegenheit, weil es Zins
7. Linearisierung und das Differential
106
auf dem Zins gibt (“Zinseszins”). Bei 2 % Zins dauert es also weniger als 50 Jahre. Um dieses Problem zu l¨osen, m¨ ussen wir folgende Gleichung (approximativ) nach n aufl¨ osen (1 + r)n = 2. r w¨are 0.02 im Beispiel mit dem Sparheft. Wir nehmen hierzu auf beiden Seiten den Logarithmus: ln(1 + r)n = ln 2. ur das ganze Studium Auf der linken Seite helfen uns jetzt die Logarithmenregeln und f¨ der Naturwissenschaften ist gut zu wissen, dass ln 2 ≈ 0.7. Wir erhalten: n ln(1 + r) ≈ 0.7. Dank (approx II) folgt jetzt nr ≈ 0.7. Damit gilt approximativ 0.7 . r Weil man im Alltag h¨aufig mit Prozenten arbeitet, wird das Ganze umgeschrieben auf Prozente: n≈
(Verdopplungszeit)
n≈
70 r[%]
Dabei ist jetzt also r in Prozenten anzugeben. Wenn man beispielsweise feststellt, dass ein Prozess (Bev¨olkerung) jedes Jahr um 1 % w¨ achst, so dauert es approximativ 70 Jahre bis zur Verdopplung; bei 2 % dauert es approximativ 35 Jahre. Die exakten Werte sind (rechnen Sie es nach) 69.661 und 35.003. Halbierungszeiten: Wenn ein Prozess pro Zeiteinheit einen konstanten Prozentsatz verliert, erh¨ alt man u ¨berraschend die gleiche Formel. Zu l¨ osen ist, mit Abnahmerate r > 0 formuliert: 1 (1 − r)n = . 2 ln(1 − r)n = ln 2−1 . n ln(1 − r) ≈ −0.7. nr ≈ 0.7. Damit gilt approximativ wieder (Halbierungszeit)
n≈
70 r[%]
7.4 Das Differential
107
Als kleine Erg¨ anzung zum Schluss noch eine Erweiterung auf 10 Verdopplungszeiten (oder Halbierungszeiten). Merken Sie sich (10 Verdopplungszeiten)
210 = 1024 ≈ 1000.
und damit auch
(10 Halbierungszeiten)
⎛ ⎞10 ⎝1⎠ = 1 ≈ 1 . 2 1024 1000
Wenn Sie jetzt also entweder exakt oder approximativ die Zeit bis zur Verdopplung (oder Halbierung) berechnet haben, so k¨ onnen Sie sich fragen, wie lange es dauert, bis Sie 1000 mal mehr haben als am Anfang (oder nur noch ein Tausendstel). Offenbar dauert es 10 Verdopplungszeiten, bis Sie 1000 mal den Anfangswert haben (genau 1024 mal den Anfangswert). Wenn Sie also feststellen, dass eine Bakterienkultur 1 Tag bis zur Verdopplung hat, so werden Sie nach etwa 10 Tagen 1000 mal mehr haben als am Anfang. Bei Plutonium 239 ist die sogenannte Halbwertszeit knapp 24’000 Jahre. Das heisst, dass nach 24’000 Jahren die H¨ alfte des urspr¨ unglichen Plutoniums zerfallen ist. Die Halbwertszeit ist also das, was wir bis jetzt als Halbierungszeit bezeichnet haben. Wir haben also nach 240’000 Jahren noch ein Tausendstel der urspr¨ unglichen Menge (wenn kein neues durch Zerfallsreihen entsteht).
(7.4) Das Differential In diesem Abschnitt f¨ uhren wir vor allem einige neue Bezeichnungen ein. Zur in (7.3) behandelten Idee der Linearisierung kommt eigentlich nichts Wesentliches hinzu. Dort haben wir gesehen, dass gilt f (x) ≈ p(x) d.h. f (x) ≈ f (x0 ) + f (x0 )(x − x0 ) . Wir schreiben dies nun etwas anders, n¨ amlich in der Form (3)
f (x) − f (x0 ) ≈ f (x0 )(x − x0 ) .
Wenn wir die von fr¨ uher bekannten Abk¨ urzungen Δf = f (x) − f (x0 ) und Δx = x − x0 verwenden, so hat diese Beziehung die Form (4)
Δf ≈ f (x0 )Δx .
Schliesslich f¨ uhren wir noch eine weitere Bezeichnung ein: Wir setzen (5)
df := f (x0 )Δx ,
7. Linearisierung und das Differential
108
und aus (4) wird Δf ≈ df .
(6)
Beachten Sie, dass (3), (4) und (6) genau dasselbe aussagen, wenn auch mit unterschiedlichen Bezeichnungen. In der folgenden Figur sind die Gr¨ossen Δf und df dargestellt. y f (x) f f (x0 )
Δf df p x x0
x = x0 + Δx Δx = dx
Sie haben folgende Bedeutung: • Δf gibt den Zuwachs der Funktion f wieder, wenn man von x0 nach x = x0 + Δx geht. • df stellt den entsprechenden Zuwachs der linearen Ersatzfunktion p (deren Graph die Tangente ist) dar. Die erste Aussage ist einfach die Definition von Δf ; die zweite ergibt sich so (vgl. auch die Figur): Die lineare Ersatzfunktion p ist gegeben durch p(x) = f (x0 )+f (x0 )(x− ¨ x0 ). F¨ ur ihren Zuwachs Δp = p(x) − p(x0 ) beim Ubergang von x0 zu x = x0 + Δx erhalten wir wegen p(x0 ) = f (x0 ) die behauptete Beziehung Δp = f (x0 ) + f (x0 )(x − x0 ) − f (x0 ) = f (x0 )(x − x0 ) = f (x0 )Δx = df . Weiter ist Δf − df der Fehler, den man beim Ersatz von Δf durch df begeht. Wie man sieht, wird dieser Fehler um so kleiner, je n¨aher x bei x0 ist. Die Ausdr¨ ucke Δx, Δf, df k¨ onnen ohne weiteres auch negativ sein. Ein negativer Zuwachs ist einfach eine Abnahme. Die Gr¨osse df heisst das Differential von f . Sie h¨ angt sowohl von der Stelle x0 als auch vom Zuwachs Δx ab und m¨ usste deshalb eigentlich genauer mit df (x0 , Δx) bezeichnet werden, was aber un¨ ublich ist (vgl. jedoch das folgende Beispiel 1.). Aus formalen Gr¨ unden pflegt man auch dx statt Δx zu schreiben (siehe auch die Bemerkung c) weiter unten). Auf diese Weise erh¨alt man die folgende Formel f¨ ur das Differential: (7)
df = f (x0 ) dx .
7.4 Das Differential
109
Hierbei ist dx nicht etwa eine “unendlich kleine Gr¨ osse” (was immer das sein soll), sondern eine beliebige (wenn auch meist dem Betrage nach kleine) Zahl. Beispiele
x x0 dx. Setzen wir x2 + 3. Wegen f (x) = √ ist df = 2 x2 + 3 x0 + 3 speziell x0 = 1, so erhalten wir 1 df = dx . 2 W¨ ahlen wir nun auch noch einen Wert f¨ ur dx, z.B. dx = 0.1, so folgt schliesslich
1. Es sei f (x) =
df = 0.05 , oder (genauer, aber gew¨ohnlich nicht so geschrieben) df (1, 0.1) = 0.05. √
2. Es sei f (x) = e x , x0 = 1. Wie gross ist ungef¨ ahr der Zuwachs Δf , wenn man das Argument x von x0 = 1 auf 0.95 verkleinert? √ √ Hier ist Δx = dx = −0.05. Wegen f (x) = e x /2 x (Kettenregel!) ist f (x0 ) = f (1) = e/2. Somit ist Δf ≈ df = f (x0 ) dx =
e · (−0.05) ≈ −0.068 . 2
3. Wir vergleichen nun noch Δf und df in einem einfachen Fall, in welchem man sowohl Δf als auch df formelm¨assig ausrechnen und alles mit einer Figur illustrieren kann. Dazu sei f (x) = x2 . Dann ist (wegen dx = Δx) Δf = f (x) − f (x0 ) = f (x0 + Δx) − f (x0 ) = (x0 + Δx) − 2
x20
= 2x0 Δx + (Δx)
x0 Δx
Δx
x0
x0 Δx
2
df = f (x0 )Δx = 2x0 Δx . Hier sieht man nun sofort den Unterschied zwischen den beiden Gr¨ossen: Es ist Δf − df = (Δx)2 . Allerdings sollte die Abweichung (Δx)2 nicht f¨ ur sich allein betrachtet, sondern mit dem Funktionswert f (x0 ) = x20 verglichen werden. (F¨ ur x0 = 1 w¨ urde beispielsweise die Abweichung Δf − df = 1 ins Gewicht fallen, f¨ ur x0 = 1000 w¨ are dieselbe Abweichung praktisch irrelevant.) Wir untersuchen daher (vgl. die Beschreibung des relativen Fehlers in (7.5)) den Quotienten Δx 2 Δf − df = . x20 x0
7. Linearisierung und das Differential
110
Ist nun Δx dem Betrage nach klein im Vergleich mit x0 , dann ist auch |Δx/x0 | klein und das Quadrat (Δx/x0 )2 ist noch viel kleiner, so dass der obige Ausdruck vernachl¨assigbar klein wird. Man darf also guten Gewissens Δf durch df ersetzen. uhrte Diskussion gilt auch allgemein. Die hier am konkreten Beispiel 3. durchgef¨ oherer Man kann zeigen (vgl. (19.9)), dass sich Δf und df bloss um sogenannte “Terme h¨ oheren ucke, in denen Δx nur im Quadrat und in h¨ Ordnung in Δx”, d.h., um Ausdr¨ Potenzen vorkommt, unterscheiden. Bemerkungen a) Beachten Sie, dass gilt (vgl. Formel (1)): Δf − df = f (x) − f (x0 ) − f (x0 )(x − x0 ) = f (x) − p(x) , so dass die in Bemerkung d) von (7.3) angegebene Absch¨ atzung von |f (x)−p(x)| auch f¨ ur |Δf −df | verwendet werden kann. dy df b) In (4.3.c) wurde ausdr¨ ucklich erw¨ ahnt, dass Ausdr¨ ucke wie und nicht als Quotient zweier dx dx Gr¨ ossen, sondern als einheitliches Symbol aufzufassen sind, n¨ amlich als Grenzwert des Differentialquotienten: Δf df = lim = f (x0 ) . x→x0 Δx dx Nun haben wir nachtr¨ aglich den Gr¨ ossen df und dx einen selbst¨ andigen Sinn gegeben. Dividiert man jetzt df = f (x0 )dx durch dx, so erh¨ alt man die Beziehung df = f (x0 ) dx (was absolut kein Wunder ist, denn f steckt ja in der Definition von df !) df kann also sowohl als Quotient der Differentiale (Zahlen) als auch als Differentialdx quotient (Grenzwert!) im Sinne von (4.3.c) aufgefasst werden, wobei aber die zweite Interpretation der Normalfall ist.
Der Ausdruck
c) Wenn f (x) eine einfache Form hat, z.B. f (x) = x2 , so schreibt man auch dx2 statt df , also z.B. dx2 = 2xΔx,
d sin x = cos xΔx .
Ist speziell f (x) = x, so erh¨ alt man wegen f (x) = 1 dx = 1 · Δx = Δx , was die oben zun¨ achst willk¨ urlich getroffene Gleichsetzung dx = Δx auf eine gewisse Weise motiviert.
(7.5) Anwendung auf die Fehlerfortpflanzung Wir betrachten das Problem der sogenannten Fehlerfortpflanzung. Eine gewisse Gr¨ osse sei zu messen, dabei sei x0 der wahre, naturgem¨ass nicht genau bekannte, und x
111
7.5 Anwendung auf die Fehlerfortpflanzung
sei der effektiv gemessene Wert. Die Differenz (wir schreiben in diesem Zusammenhang lieber Δx statt dx) Δx = x − x0 heisst absoluter Fehler. Auf diese Werte soll jetzt eine Funktion f angewendet werden. Dann ist f (x0 ) der urlich wahre Wert, f (x) der aus x berechnete Wert, und man interessiert sich nun nat¨ ur den absoluten Fehler des Funktionswerts, n¨ ur f¨ amlich f¨ Δf = f (x) − f (x0 ) . Da ja der Messfehler Δx gegen¨ uber dem wahren Wert x0 klein ist, ist es sinnvoll, den Rechenaufwand zu vereinfachen und Δf durch df zu ersetzen: Δf ≈ df = f (x0 )Δx . Da sich Δf nur geringf¨ ugig von df unterscheidet, ist diese Approximation des Fehlers Δf gerechtfertigt (die Differenz Δf − df ist der “Fehler des Fehlers”). Wir illustrieren das Problem an einem konkreten Beispiel: Die Seite x eines Quaacheninhalt f (x) = drats werde mit dem Fehler Δx gemessen, anschliessend werde der Fl¨ ahr der absolute Fehler Δf der Quadratfl¨ ache? Die x2 berechnet. Wie gross ist ungef¨ Antwort lautet: Δf ≈ df = f (x0 )Δx = 2x0 Δx. Die geometrische Bedeutung ist der Figur zu Beispiel 3. von (7.4) zu entnehmen. Der Unterschied zwischen Δf und df besteht in der Fl¨ ache des kleinen Quadrats. Von grosser Bedeutung ist auch der relative Fehler (die Frage, ob ein Messfehler von 1 mm gross oder klein sei, h¨ angt schliesslich wesentlich davon ab, wie lang die gemessene Strecke ist!). Man definiert: Relativer Fehler =
absoluter Fehler Δx . = wahrer Wert x0
Im obigen Beispiel des Quadrats finden wir dann f¨ ur den relativen Fehler der Fl¨ ache (∗)
Δf Δf 2x0 Δx Δx = 2 ≈ =2 . f x0 x20 x0
In Worten: Der relative Fehler von f ist (ungef¨ ahr) das Doppelte des relativen Fehlers von x. ¨ Die bisher angestellten Uberlegungen sind insofern theoretisch, als man ja x0 gar nicht kennt. In den Formeln f¨ ur das Differential und f¨ ur den relativen Fehler ersetzt man deshalb x0 gezwungenermasse durch den bekannten Messwert x. Dies ist aber nicht so
7. Linearisierung und das Differential
112
schlimm, da man ja ohnehin mit N¨ aherungen operiert. Ferner ist auch der absolute ugt urde man auch x0 kennen). Vielmehr verf¨ Fehler Δx nicht genau bekannt (sonst w¨ man neben dem gemessenen Wert x nur u ¨ber eine Absch¨ atzung von Δx (Messgenauigkeit): |Δx| ≤ a ur eine gewisse Zahl a. Weiss man also etwa, dass man auf einen Millimeter genau f¨ messen kann, so ist a = 1 mm zu w¨ahlen. Die Betragsstriche bei |Δx| kommen daher, osser oder kleiner als der wahre dass man nicht wissen kann, ob der gemessene Wert x gr¨ Wert x0 ist. Entsprechend wird man in der Praxis |Δf | und nicht Δf n¨ aherungsweise bestimmen. Beispiele 1. Von einer Kugel wird der Durchmesser d bestimmt; man erh¨alt d = 100 mm mit einem absoluten Fehler |Δd| ≤ 0.5 mm. Wir sch¨atzen den absoluten Fehler des mit d berechneten Kugelvolumens ab. Die Formel f¨ ur das Volumen einer Kugel vom 3 Radius r lautet bekanntlich V = 4πr /3, wegen d = 2r gebrauchen wir die Formel V = πd3 /6. Es folgt ΔV ≈
π 2 d Δd . 2 0
Ersetzen wir nun den unbekannten wahren Wert d0 durch den Messwert d = 100, so folgt unter Ber¨ ucksichtigung von |Δd| ≤ 0.5 f¨ ur den absoluten Fehler die Absch¨ atzung |ΔV | ≈
π < π 1002 |Δd| ≈ 1002 · 0.5 ≈ 7854 mm3 . 2 2
Zur Bestimmung des relativen Fehlers dividieren wir |ΔV | durch V = πd3 /6 = 523599 mm3 und erhalten als Maximalwert ungef¨ ahr 0.015 (oder 1.5%). Dies ist das Dreifache des (maximalen) relativen Fehlers |Δd/d| = 0.5/100 = 0.005 von d. Diese Tatsache l¨asst sich auch allgemein einsehen. Es ist n¨ amlich
ΔV ≈ V
π 2 2 d0 Δd π 3 6 d0
=3
Δd . d0
7.6 Eine Grenzwertbeziehung
113
2. Auf einer horizontalen Ebene steht ein Mast. Aus einer Distanz von 50 m wird dessen Spitze anvisiert, wobei sich das Auge des Beobachters 1.5 m u ¨ber dem Boden befindet. Der Winkel α wird zu 30◦ bestimmt, mit einer Genauigkeit von ±2◦ . Mit Hilfe von α wird dann die H¨ ohe h des Turmes berechnet. Wie gross ist der maximale absolute Fehler von h, wenn wir annehmen, der Messfehler bei der Horizontaldistanz sei vernachl¨assigbar klein?
α 50 m
Die Formel f¨ ur die H¨ ohe lautet h = 1.5 + 50 · tan α. Wir approximieren Δh durch dh: dh = 50 · (1 + tan2 α)Δα . Wie schon in Beispiel 4. von (7.3) m¨ ussen wir mit dem Bogenmass arbeiten: Die π π 30◦ ergeben dann α = , und die Genauigkeit ±2◦ entspricht dem Winkel ± . 6 90 √ π 3 π und |Δα| ≤ finden wir Mit tan = 6 3 90 1 1 π |dh| = 50 · (1 + )|Δα| ≤ 50 · (1 + ) · = 2.327 . . . . 3 3 90 Es folgt < |Δh| ≈ 2.33 m .
Hinweis Wir haben in diesem Abschnitt untersucht, wie sich der maximale Fehler einer Messung, gegeben durch die Absch¨ atzung |Δx| ≤ a, fortpflanzt. Diese Betrachtungsweise ist dann angebracht, wenn man den Wert der fraglichen Gr¨ osse nur einmal gemessen hat. Oft liegen aber mehrere Messungen derselben Gr¨ osse vor. In diesem Fall berechnet man den ¨ Durchschnitt aller Messungen sowie einen auf wahrscheinlichkeitstheoretischen Uberlegungen beruhenden mittleren Fehler. F¨ ur diesen mittleren Fehler gelten dann naturgem¨ ass andere Fortpflanzungsgesetze als f¨ ur den hier betrachteten maximalen Fehler, auf die wir hier aber nicht eingehen.
(7.6) Eine Grenzwertbeziehung In (7.3) haben wir den “Fehler” f (x) − p(x) diskutiert, der beim Ersatz der in x0 differenzierbaren Funktion f durch die lineare Funktion p entsteht, und in (7.4) haben wir gesehen, dass diese Differenz auch gleich Δf − df ist. Wir setzen r(x) = f (x) − p(x)
(= Δf − df ) .
Wir wissen schon, dass r(x) “klein” ist (sofern Δx = x − x0 klein ist) und wollen nun noch eine Grenzwertbeziehung aufstellen. Sicher gilt lim r(x) = 0,
x→x0
7. Linearisierung und das Differential
114
denn f (x0 ) = p(x0 ) (und f und p sind in x0 stetig). amlich at: Es gilt n¨ Die Approximation von f durch p ist aber sogar von einer besseren Qualit¨
lim
(∗)
r(x)
x→x0 |x − x0 |
=0.
Der Fehler, den man begeht, wenn man f durch p ersetzt, ist also nicht nur absolut, sondern auch relativ, d.h., im Verh¨ altnis zum Abstand |x − x0 | = |Δx| von x und x0 , klein. Die Formel (∗) beweist man wie folgt: Aus r(x) = f (x) − p(x) = f (x) − f (x0 ) − f (x0 )(x − x0 ) ergibt sich r(x) f (x) − f (x0 ) = − f (x0 ) x − x0 x − x0 und
f (x) − f (x0 ) r(x) =± − f (x0 ) |x − x0 | x − x0
(x = x0 )
(x = x0 ) .
f (x) − f (x0 ) → f (x0 ), und die Klammer rechts strebt gegen 0. Damit hat x − x0 auch die linke Seite den Grenzwert 0, was zu zeigen war. Mit x → x0 strebt aber
Man kann u ¨brigens, ausgehend von der Formel (∗), eine neue Definition der Begriffe “Ableitung” und “Differenzierbarkeit” geben, die f¨ ur den weiteren Ausbau der Differentialrechnung von Bedeutung ist. Daf¨ ur sei auf den Anhang verwiesen (27.4).
(7.∞) Aufgaben 7−1 Bestimmen Sie die Gleichung der “Wendetangente” (d.h., der Tangente im Wendepunkt) des Graphen der Funktion f (x) = x3 + 6x2 + 9x + 1. 7−2 Approximieren Sie f (x) an der Stelle x0 m¨ oglichst gut durch eine lineare Funktion p(x). Bestimmen Sie p(x) sowie f (x1 ) − p(x1 ). x x0 = −1, x1 = −0.95, a) f (x) = 1−x b) f (x) = e1−x
x0 = 1, x1 = 1.01. √ 7−3 Berechnen Sie n¨ aherungsweise a) 3 63, b) sin 29◦ , indem Sie die angegebene Funktion jeweils an einer passend gew¨ ahlten Stelle x0 durch eine lineare Funktion ersetzen. 7−4 Bestimmen Sie das Differential an der Stelle x0 bzw. t0 in den folgenden F¨ allen: √ a) f (x) = 3 x2 + 2x + 3 , x0 = 4, b) g(t) = sin t + cos t , t0 = π . 3 7−5 Bestimmen Sie den Wert von df an der Stelle x0 mit dem angegebenen dx. ex a) f (x) = x , x0 = 0, dx = 0.05, e +1 √ b) f (x) = ln x2 + 1, x0 = 2, dx = −0.1.
7.∞ Aufgaben
115
7−6 Das Volumen einer Hohlkugel kann als Differenz ΔV des Volumens zweier Vollkugeln dargestellt arke Δr = dr) kann ΔV durch dV ersetzt unnwandige Hohlkugeln (Wandst¨ ur d¨ werden. F¨ werden (Linearisierung). a) Geben Sie die entsprechende N¨ aherungsformel f¨ ur eine Hohlkugel vom Radius r und der arke Δr an. Wandst¨ b) Ein Trinkhalm vom 3 mm (innerem) Durchmesser wird am unteren Ende 4 mm hoch mit Seifenwasser gef¨ ullt. Daraus wird eine kugelf¨ ormige Seifenblase von 5 cm Durchmesser geaherungsformel von blasen. Wie dick ist die entstehende Seifenhaut? (Verwenden Sie die N¨ a).) ormigem Querschnitt wird der Umfang gemessen. Man erh¨ 7−7 Von einem Rohr mit kreisf¨ alt 30.5 agt. Anschliessend wird der Inhalt der cm, wobei der maximale absolute Fehler 1 mm betr¨ ache berechnet. Sch¨ Querschnittsfl¨ atzen Sie den Betrag des entstehenden absoluten Fehlers ab. ucke lasse ich einen Stein ins Wasser fallen und stoppe die Zeit (5 Sekunden), 7−8 Von einer hohen Br¨ wobei ich hoffe, dass ich diese auf eine Zehntelssekunde genau messen kann. Wie hoch liegt die Br¨ ucke u ¨ ber dem Wasserspiegel, und wie gross ist der absolute Fehler bei der H¨ ohenbestimmung im Maximum? Wie steht es mit dem relativen Fehler? 7−9 Eine Sch¨ ulerin muss ein Dreieck mit a = 8 cm, b = 6 cm, γ = 35◦ konstruieren. Die beiden Seiten kann sie mit einem zu vernachl¨ assigenden Fehler zeichnen, den Winkel aber nur auf ±2◦ genau. Berechnen Sie den maximalen absoluten Fehler der L¨ ange der so konstruierten Seite c. 7−10 Dicht am Ufer eines Flusses steht eine Statue, deren H¨ ohe (ab Sockel) gem¨ ass meinem Reisef¨ uhrer genau 4 m betr¨ agt. Aus hier nicht zur Diskussion stehenden Gr¨ unden gelingt es mir, den Winkel α zu messen: Er betr¨ agt 10◦ , mit einem Messfehler, der dem Betrage nach kleiner als 1◦ ist. Welchen Fehler begehe ich h¨ ochstens, wenn ich aus den mir bekannten Werten die Breite des Flusses errechne?
a c
γ b
α
7−11 Eine Gr¨ osse x ist mit einem relativen Fehler von ±1% gemessen worden. Anschliessend wird daraus y = xn berechnet. Wie gross ist der relative Fehler von y ungef¨ ahr ?
116
8. DIE ABLEITUNG EINER VEKTORFUNKTION
¨ (8.1) Uberblick Eine Vektorfunktion hat die Form
(8.2)
t → r(t) , d.h., jedem Wert des Arguments t wird ein Vektor r(t) zugeordnet. In Koordinatenschreibweise ist ⎛ ⎞ x1 (t) r(t) = ⎝ x2 (t) ⎠ , x3 (t) wobei die Koordinatenfunktionen x1 (t), x2 (t), x3 (t) gew¨ohnliche (reellwertige) Funktionen einer Variablen sind. Solche Vektorfunktionen k¨ onnen auf zwei Arten anschaulich interpretiert werden: • Bewegung eines Punktes im Raum, • Parameterdarstellung einer Kurve. Die erste Auffassung ist gewissermassen “dynamisch”, die zweite “statisch”. Zwischen den beiden bestehen enge Beziehungen, aber auch Unterschiede. So k¨onnen verschiedene Bewegungsvorg¨ ange durchaus dieselbe Bahnkurve liefern. Die Ableitung einer Vektorfunktion ist wie im Fall der gew¨ ohnlichen Funktionen als Grenzwert eines Differenzenquotienten definiert:
(8.2) (8.3)
(8.3), (8.5) (8.4)
r(t0 + Δt) − r(t0 ) r˙ (t0 ) = lim . Δt→0 Δt Man kann sie als Geschwindigkeitsvektor (“dynamisch”) oder als Tangentenvektor (“statisch”) interpretieren. Die praktische Berechnung von r(t) erfolgt koordinatenweise: ⎛ ⎞ x˙ 1 (t) r˙ (t) = ⎝ x˙ 2 (t) ⎠ . x˙ 3 (t) Die von fr¨ uher bekannten Ableitungsregeln gelten weiterhin, und man kann auch hier von h¨oheren Ableitungen und vom Differential sprechen.
(8.6) (8.7)
8.2 Vektorfunktionen
117
(8.2) Vektorfunktionen Zur Motivation betrachten wir ein Beispiel aus der Physik, n¨ amlich die Bewegung eines Massenpunktes. In (3.2) haben wir bei der Einf¨ uhrung der Ableitung eine etwas spezielle Situation behandelt, n¨ amlich den Fall, wo sich der Massenpunkt (dort: ein Auto) geradlinig bewegt. Seine Position zur Zeit t ist dann durch eine einzige Zahl s(t) gegeben, und seine Geschwindigkeit zur Zeit t ist die Ableitung s (t) (oder s(t)). ˙ Im allgemeinen Fall kann sich ein Massenpunkt beliebig im Raum bewegen. Zur Darstellung dieser Bewegung verwendet man nun Vektoren. Wir fixieren einen Nullpunkt O im Raum. Zur Zeit t befinde sich der Massenpunkt im Punkt R. Seine Lage wird also durch den Vektor −−→ r = OR festgelegt.
−−→ Da sich der Punkt R und damit der Vektor r = OR im Verlauf der Zeit a¨ndert, schreibt man statt r besser r(t) .
Der Vektor r wird also als Funktion einer Variablen (in unserem Beispiel der Zeit t) aufgefasst. Man spricht von einer vektorwertigen Funktion oder einer Vektorfunktion. Um mit diesen Vektorfunktionen rechnerisch umgehen zu k¨onnen, f¨ uhrt man wie in Kapitel 2 ein kartesisches Koordinatensystem ein. Bez¨ uglich dieses Systems hat r(t) dann die Koordinaten ⎛ ⎞ x1 (t) r(t) = ⎝ x2 (t) ⎠. x3 (t) Mit r(t) h¨angen auch die Koordinaten xi (t) (i = 1, 2, 3) von der Zeit t ab. Da xi (t) stets eine reelle Zahl ist, sind die Koordinatenfunktionen (auch Komponentenfunktionen genannt) x1 (t), x2 (t), x3 (t) gew¨ohnliche Funktionen einer Variablen. Eine Vektorfunktion r(t) wird also durch drei reellwertige Funktionen dargestellt. Statt x1 (t), x2 (t), x3 (t) kann man auch x(t), y(t), z(t) schreiben. Alles in diesem Kapitel Gesagte gilt u ¨brigens sinngem¨ ass auch f¨ ur den Fall, wo sich das Geschehen statt im Raum in der Ebene abspielt. Man braucht nur die dritte Koordinate x3 (t) = z(t) wegzulassen. Beispiele
−→ 1. Es seien a = OA und c beliebige Vektoren (c = 0). Wir setzen r(t) = a + tc .
8. Die Ableitung einer Vektorfunktion
118
R A
c
B tc
r(t) a O Wie die obenstehende Skizze zeigt, liegt der Endpunkt des Vektors r(t) auf der Geraden durch A in Richtung c (vgl. auch (1.10.a)). Physikalisch gesehen beschreibt also r(t) eine geradlinige Bewegung im Raum. 2. Wir betrachten die Vektorfunktion
⎛
⎞ cos t u(t) = ⎝ sin t ⎠ . 0
Da hier die z–Koordinate (3. Koordinate) gleich 0 ist, liegt der Vektor u(t) stets in der x-y–Ebene. (Man k¨ onnte die 3. Koordinate auch einfach weglassen; im Hinblick auf Beispiel 4. tun wir dies nicht!) y Wegen der bekannten Formel sin2 t + cos2 t = 1 liegen die Punkte mit den Koordinaten x = cos t, u(t) y = sin t auf dem Einheitskreis. Somit beschreibt t x der Vektor u(t) eine Kreisbewegung (im Gegenuhrzeigersinn) eines Massenpunktes in der x-y– Ebene. Zur Zeit t = 0 befindet er sich im Punkte (1,0), ebenso zur Zeit t = 2π, wo er einen Umlauf vollendet hat (und analog f¨ ur jeden Zeitpunkt t = 2nπ, n ∈ Z). 3. Ohne allzusehr auf Details einzugehen, erw¨ ahnen wir noch exemplarisch einige m¨ ogliche Modifikationen der obigen Kreisbewegung. a) Durch eine Massstabs¨ anderung kann man erreichen, dass die “Umlaufszeit” statt 2π eine beliebige Zahl T = 0 ist. Man setzt n¨ amlich einfach ⎞ ⎛ cos 2π t T ⎟ ⎜ v (t) = ⎝ sin 2π t ⎠ . T 0 b) Der Radius der Kreisbahn wird gleich r, wenn man x(t) mit r multipliziert (r > 0): ⎛ ⎞ r cos t ⎜ ⎟ w (t) = ru(t) = ⎝ r sin t ⎠ . 0
119
8.2 Vektorfunktionen
−→ c) Durch Addition eines Vektors a = OA zu u(t) erh¨ alt man die Darstellung eines Kreises mit Zentrum A. So beschreibt ⎛ ⎞ ⎛ ⎞ 2 2 + cos t ⎜ ⎟ ⎜ ⎟ s(t) = ⎝ 1 ⎠ + u(t) = ⎝ 1 + sin t ⎠ 0 0 eine Bewegung auf dem Einheitskreis mit Zentrum A(2, 1, 0). a)
c)
b)
y
y y
A
1 1x
rx
x 2
4. Schliesslich sei
⎛
⎞ cos t s(t) = ⎝ sin t ⎠ . t
Im Gegensatz zu 2. liegt hier der Vektor s(t) i.a. nicht in der x-y–Ebene, vielmehr hat sein Endpunkt zur Zeit t die “H¨ohe” (z–Koordinate) t. Die Projektion von s(t) auf die x-y–Ebene aber ist genau wie im Beispiel 2. der Einheitskreis. ⎛ ⎞ 2π 1 Zur Zeit t = 0 ist s(0) = ⎝ 0 ⎠ . 0⎛ ⎞ 1 2π Zur Zeit t = 2π ist s(2π) = ⎝ 0 ⎠ . 2π x 1 Hieraus erkennt man, dass s(t) eine Schraubenlinie mit “Gangh¨ ohe” 2π und “Umlaufszeit” 2π beschreibt.
z
1
y
¨ Ahnlich wie in 3. sind Modifikationen m¨ oglich. Zus¨ atzlich l¨ asst sich noch die Gangh¨ ohe variieren, indem man in der dritten Komponente t durch at ersetzt. Der Radius der Schraubenlinie wird gleich r, wenn man wie in 3. cos t (bzw. sin t) durch r cos t (bzw. r sin t) (r > 0) ersetzt. Es seien etwa ⎛ ⎞ ⎛ ⎞ 2 cos 2πt 1 + 2 cos 2πt 3 3 ⎜ ⎟ ⎜ ⎟ u(t) = ⎝ 2 sin 2πt , v (t) = ⎝ −1 + 2 sin 2πt . 3 ⎠ 3 ⎠ 4 4 t t 3 3
8. Die Ableitung einer Vektorfunktion
120
Dann hat die durch u(t) gegebene Schraubenlinie den Radius 2, die Umlaufszeit 3 und die Gangh¨ ohe 4. Die durch v (t) gegebene Schraubenlinie entsteht aus der ersten durch Parallel verschiebung: Ihre Achse ist parallel zur z–Achse und geht durch den Punkt (1, −1, 0).
Die Variable t wird oft auf ein bestimmtes Intervall eingeschr¨ankt. Auf diese Weise erh¨ uck der Bahn, entsprechend einer zeitlich eingeschr¨ankalt man nur ein bestimmtes St¨ ten Bewegung. Wir veranschaulichen dies an den obigen Beispielen: Zu 1. Durch r(t) = a + tc, t ∈ [0, 1] wird eine Bewegung zwischen dem Endpunkt A des Vektors a und dem Endpunkt B des Vektors a + c beschrieben, denn zur Zeit t = 0 ist r(t) = a und zur Zeit t = 1 ist r(t) = a + c. Zu 4. Durch
⎛
⎞ cos t r(t) = ⎝ sin t ⎠ , t
t ∈ [0, 2π]
wird ein Umlauf des Massenpunktes auf der Schraubenlinie dargestellt. L¨asst man t das Intervall [0, 4π] durchlaufen, so erh¨alt man zwei Uml¨ aufe etc.
(8.3) Parameterdarstellungen von Kurven Manchmal interessiert man sich weniger f¨ ur den Bewegungsvorgang als f¨ ur die Bahnkurve als geometrisches Gebilde. Die Variable t braucht in diesem Fall nicht als Zeit aufgefasst zu werden und wird “Parameter” genannt. Man sagt dann etwa, dass durch (∗)
u(t) = a + tc,
t ∈ [0, 1]
eine Parameterdarstellung der Strecke AB gegeben sei. (A ist wieder der Endpunkt von a, B jener von a + c.) Ebenso ist ⎛
⎞ cos t u(t) = ⎝ sin t ⎠ , t
t ∈ [0, 2π]
eine Parameterdarstellung eines Umlaufs der Schraubenlinie. Bei dieser Auffassung (welche wohlgemerkt auf denselben Formeln wie in (8.2) beruht) interessiert man sich also nicht f¨ ur die Bewegung an sich, sondern f¨ ur die durchlaufene Bahn, die “Spur” des Massenpunkts. Es handelt sich also um eine “statische” Interpretation, im Gegensatz zur “dynamischen” aus (8.2).
8.3 Parameterdarstellungen von Kurven
121
Im Beispiel 2. von (8.2) ist es f¨ ur den Ablauf der Bewegung sicher wesentlich, ob der Kreis ein- oder zweimal durchlaufen wird. Die Bahnkurve bleibt aber so oder so der Einheitskreis. Wir zeigen noch an einem zweiten Beispiel, dass verschiedene Bewegungen durchaus dasselbe Kurvenst¨ uck (als geometrisches Gebilde) hinterlassen k¨onnen. Durch die Parameterdarstellung (vgl. mit (∗)) v (t) = a + 2tc,
(∗∗)
1 t ∈ [0, ] 2
wird n¨ amlich ebenfalls die Strecke AB beschrieben. Die Parameterdarstellung eines Kurvenst¨ ucks ist also nicht eindeutig festgelegt. Die durch (∗) und (∗∗) beschriebenen Bewegungsvorg¨ange sind verschieden: Fassen wir n¨ amlich t jetzt wieder als Zeit auf, so beschreibt (∗∗) eine doppelt so schnelle Bewegung wie (∗), denn bei (∗∗) wird AB im Zeitintervall [0, 12 ] durchlaufen, bei (∗) im Intervall [0, 1]. Daneben ist aber auch noch der Durchlaufungssinn zu ber¨ ucksichtigen. Bei (∗) und (∗∗) wird die Strecke mit zunehmender Zeit von A nach B durchlaufen. Die folgende Darstellung beschreibt die Durchlaufung von B nach A: (∗∗∗)
w(t) = a + (1 − t)c,
t ∈ [0, 1] ,
−−→ −→ denn w(0) = a + c = OB und w(1) = a = OA. Wir kommen nun nochmals auf die graphische Darstellung von Kurvenst¨ ucken zu sprechen. Mit etwas Geschick l¨ asst sich ein durch eine Parameterdarstellung gegebenes Kurvenst¨ uck C skizzieren. Nat¨ urlich kann diese Aufgabe auch einem passenden Computerprogramm u ¨bertragen werden. Beispiele 1. Es sei
⎛
⎞ t r(t) = ⎝ t2 ⎠ , 1−t
t ∈ [0, 1] z
Wir betrachten zuerst die Projektion auf die x-y– Ebene. Es ist x = x1 (t) = t, y = x2 (t) = t2 , also y = x2 . Die Projektion von C auf die x-y–Ebene ist daher eine Parabel. Ferner ist die Projektion von C auf die x-z–Ebene wegen x = x1 (t) = t, z = x3 (t) = 1 − t eine Gerade. Zeichnet man die Parabel und die Gerade ein, so l¨ asst sich auch C skizzieren.
y
1 1
1 x
8. Die Ableitung einer Vektorfunktion
122
⎛
⎞ cos t r(t) = ⎝ sin t ⎠ , sin2 t
2. Wir setzen
t ∈ [0, 2π] .
Gem¨ass Beispiel 2. von (8.2) ist die Projektion dieser Kurve auf die x-y–Ebene der Einheitskreis. Der Parameter t kann als Winkel interpretiert werden. Die Funktion ohe des Kurvenpunktes in Abh¨ angigkeit vom Winkel t z(t) = sin2 t zeigt, wie die H¨ variiert. Damit kann die Raumkurve gezeichnet werden. z 1 z 1 t 0
π
2π x
1
1
y
Hinweis Kurven in der Ebene haben Sie in der Form y = f (x) h¨ aufig diskutiert. Man kann aus dieser Beziehung stets eine Parameterdarstellung machen, indem man x = x1 (t) = t und y = x2 (t) = f (t) setzt. So stellt etwa
t r(t) = t2 eine Parabel dar (vgl. Beispiel 1.), n¨amlich jene, die u ¨blicherweise in der Form y = x2 gegeben wird. Hierzu ist zu bemerken, dass jede ebene Kurve durch eine Parameterdarstellung beschrieben werden kann. In der Form y = f (x) dagegen k¨ onnen nur jene Kurven dargestellt werden, bei denen zu jedem Wert von x h¨ ochstens ein Kurvenpunkt geh¨ort. Eine Illustration hierzu: y y
x 1
Der Einheitskreis ist nicht der Graph einer Funktion.
x 1
Die obere H¨alfte des Einheitskreises ist der Graph einer Funktion (f (x) = 1 − x2 ).
8.4 Die Ableitung einer Vektorfunktion
123
Bemerkung Wir haben in den Abschnitten (8.2) und (8.3) die “dynamische” (Bewegung) und die “statische” (Raumkurve) Auffassung einer Vektorfunktion r(t) unterschieden. Diese Unterscheidung ist hier rein anschaulich zu verstehen. Ein sorgf¨ altigeres Vorgehen ist m¨ oglich und in der mathematischen Theorie u ¨blich. Wir deuten kurz an, wie dies vor sich geht, ohne aber Einzelheiten wie Fragen nach Stetigkeit oder Differenzierbarkeit anzusprechen. Unter einem Weg vom Punkt A zum Punkt B versteht man eine Vektorfunktion r : [a, b] → R3 −→ − − → mit r(a) = OA, r (b) = OB. (Dabei bezeichnet R3 den dreidimensionalen Raum). Ein solcher Weg kann als Bewegung im Raum gedeutet werden. Weiter will man der Tatsache Rechnung tragen, dass verschiedene Wege dasselbe geometrische Gebilde, die Bahnkurve, beschreiben k¨ onnen (vgl. (8.3)). Zwei Wege r : [a, b] → R3 , s : [c, d] → R3 heissen ¨ aquivalent, wenn es eine wachsende (genauer: streng monoton wachsende, vgl. (6.2.d)) Funktion ϕ : [c, d] → R gibt mit Wertemenge [a, b] (vgl. (17.3)), so dass r(ϕ(t)) = s(t) ist. So sind z.B. die obigen Wege (∗) und (∗∗) a ¨quivalent, denn wenn wir ϕ(t) = 2t setzen, so ist u(ϕ(t)) = a + 2tc = v (t). Unter einer Kurve versteht man nun eine Klasse von zueinander ¨ aquivalenten Wegen. Jeder Weg aus dieser Klasse kann dann zur Darstellung dieser Kurve dienen, die Wahl eines solchen Wegs entspricht unserer Parameterdarstellung. Die Bedingung, dass ϕ eine wachsende Funktion sein muss, dient dazu, den Durchlaufungssinn der Kurve (die sog. Orientierung) zu erhalten: Zum kleinsten Parameterwert muss der Punkt A, zum gr¨ ossten der Punkt B geh¨ oren. So sind z.B. die durch (∗∗∗) und (∗) gegebenen Wege nicht ¨ aquivalent ¨ (die Orientierung ist verschieden); in der Tat ist die Funktion, die den Ubergang liefert, n¨ amlich ϕ(t) = 1 − t fallend und nicht wachsend. Diese etwas pr¨ aziseren Begriffe von Weg und Kurve werden wir weiter nicht verwenden.
(8.4) Die Ableitung einer Vektorfunktion Wir motivieren die Definition am Beispiel der Bewegung eines Massenpunkts. Diese Bewegung sei durch die “Ortsfunktion” r(t) gegeben. Wir betrachten die Werte dieser Funktion zu zwei Zeitpunkten t0 und t0 + Δt: P r(t0 ) O
Δr r(t0 + Δt) Q
−−→ Die Differenz Δr = r(t0 + Δt) − r(t0 ) ist gleich dem Vektor P Q. In der Zeitspanne Δt hat sich der Massenpunkt von P nach Q bewegt (im allgemeinen nat¨ urlich nicht geradlinig l¨ angs des Vektors, sondern auf einer gekr¨ ummten Bahn). Beziehen wir die ¨ Anderung auf die Zeiteinheit, d.h., dividieren wir durch Δt, so erhalten wir Δr r(t0 + Δt) − r(t0 ) = . Δt Δt
8. Die Ableitung einer Vektorfunktion
124
Diese Gr¨osse heisst die mittlere Geschwindigkeit (im Zeitintervall [t0 , t0 + Δt]). Es handelt sich dabei um einen Vektor, der die Richtung der mittleren Geschwindigkeit anzeigt und dessen Betrag ein Mass f¨ ur die Schnelligkeit der Bewegung ist. r Der Ausdruck Δ
Δt ist nichts anderes als ein vektorieller Differenzenquotient (vgl. das Analogon in (4.3.b)).
Um nun die Momentangeschwindigkeit (kurz: Geschwindigkeit) zur Zeit t0 zu erhalten, lassen wir wie in (3.2) Δt gegen 0 streben, d.h., wir bilden
lim
Δt→0
r(t0 + Δt) − r(t0 ) . Δt
Dieser Vektor heisst nat¨ urlich die Ableitung des Vektors r(t) an der Stelle t0 . Mit anderen Worten: Die Geschwindigkeit ist als Ableitung der Ortsfunktion definiert. Losgel¨ ost von diesem speziellen physikalischen Beispiel definiert man allgemein: Die Vektorfunktion r(t) heisst an der Stelle t0 differenzierbar, wenn der Grenzwert lim
Δt→0
r(t0 + Δt) − r(t0 ) Δt
existiert. Dieser Grenzwert heisst die Ableitung von r(t) an der Stelle t0 und wird mit dr (t0 ) dt
oder r (t0 )
oder r˙ (t0 )
bezeichnet. Es sei nochmals betont, dass die Ableitung eines Vektors wieder ein Vektor ist. Die Bemerkungen in (4.3) u ¨bertragen sich sinngem¨ ass und sollen hier nicht wiederholt werden. Wird r(t) als Ortsvektor eines sich bewegenden Massenpunktes aufgefasst (“dynamische Interpretation”), so ist, wie bereits erw¨ ahnt, r˙ (t0 ) der Geschwindigkeitsvektor ˙ zur Zeit t0 . Sein Betrag |r(t0 )| ist das, was man landl¨aufig unter der “Geschwindigkeit” versteht und was in der Physik gerne mit “Schnelligkeit” bezeichnet wird. Der eindimensionale Spezialfall dieses Sachverhalts ist am Ende von (3.2) bereits erw¨ ahnt worden. Die Ableitung l¨asst sich auch geometrisch deuten: Wenn wir wie in (8.3) r(t) als Parameterdarstellung einer Kurve im Raum auffassen (“statische” Interpretation), so r sehen wir, dass Δr und damit auch Δ
Δt die Richtung einer Sekante der Raumkurve hat. r L¨ asst man nun Δt gegen 0 streben, d.h., geht man zu r˙ (t0 ) = d
¨ber, so wird aus dt u der Sekante die Tangente im Endpunkt von r(t0 ): Der Ableitungsvektor r˙ (t0 ) zeigt in
125
8.5 Berechnung der Ableitung
Richtung der Tangente an die Kurve. Man nennt ihn den Tangentialvektor. r˙ (t0 )
r(t0 ) O
Sekante
Tangente
r(t0 + Δt)
Im Gegensatz zum “dynamischen” Fall ist hier der Betrag |r˙ (t0 )| nicht von Belang, da wir uns bloss f¨ ur die Richtung der Tangente interessieren.
(8.5) Berechnung der Ableitung Zur praktischen Berechnung der Ableitung verwendet man die Koordinatenfunktionen. Es sei ⎞ ⎛ x1 (t) r(t) = ⎝ x2 (t) ⎠ . x3 (t) Dann ist
r˙ (t) = lim
Δt→0
⎛ x (t + Δt) − x (t) ⎞ 1 1 ⎞ ⎟ ⎛ ⎜ Δt x˙ 1 (t) ⎟ ⎜ ⎜ x2 (t + Δt) − x2 (t) ⎟ ⎝ ⎟ = x˙ 2 (t) ⎠ . ⎜ ⎟ ⎜ Δt x˙ 3 (t) ⎠ ⎝ x3 (t + Δt) − x3 (t) Δt
Wir haben gefunden: Die Vektorfunktion
⎛
⎞ x1 (t) r(t) = ⎝ x2 (t) ⎠ x3 (t)
wird koordinatenweise abgeleitet, d.h., es ist ⎞ x˙ 1 (t) r˙ (t) = ⎝ x˙ 2 (t) ⎠ . x˙ 3 (t) ⎛
8. Die Ableitung einer Vektorfunktion
126
Beispiele 1. Die Bewegung l¨angs einer Schraubenlinie ist gegeben durch ⎛ ⎞ cos t ( ) r(t) = ⎝ sin t ⎠ , t ∈ R t damit wird
⎛
⎞ − sin t r˙ (t) = ⎝ cos t ⎠ . 1
Geometrisch gesehen (“statische” Interpretation) zeigt r˙ (t) in Richtung des Tangentenvektors. Fassen wir r˙ (t) als Geschwindigkeit auf (“dynamische” Interpretation), so bestimmt sich ihr Betrag zu |r˙ (t)| = x˙ 1 (t)2 + x˙ 2 (t)2 + x˙ 3 (t)2 √ = sin2 t + cos2 t + 1 = 2 . Der Betrag der Geschwindigkeit (die Schnelligkeit) ist also konstant (nicht aber die Geschwindigkeit selbst, die ein Vektor mit ver¨anderlicher Richtung ist!). 2. Wir variieren dieses Beispiel noch etwas. Durch ⎛ ⎞ cos 2t ( ) s(t) = ⎝ sin 2t ⎠ , t ∈ R 2t wird dieselbe Schraubenlinie (als geometrisches Gebilde) beschrieben. Fasst man s(t) aber als Beschreibung der Bewegung eines Massenpunktes auf, so erfolgt diese Bewegung doppelt so schnell wie die durch r(t) gegebene. L¨auft n¨ amlich t etwa von 0 bis 2π, so beschreibt r(t) einen, s(t) aber zwei Uml¨aufe auf der Schraubenlinie. Dies l¨asst sich auch rechnerisch best¨ atigen. Es ist n¨ amlich ⎛ ⎞ −2 sin 2t √ s˙ (t) = ⎝ 2 cos 2t ⎠ = 2r˙ (2t) und |s˙ (t)| = 2 2 . 2 Der Geschwindigkeitsvektor bez¨ uglich ( ) ist also das Doppelte des Geschwindigkeitsvektors bez¨ uglich ( ), wie zu erwarten war. In der geometrischen Auffassung ergeben die Parameterdarstellungen ( ) und ( ) dieselbe Schraubenlinie, u˙ (t) und v˙ (t) sind hier als Tangentialvektoren aufzufassen. Sie zeigen beide in dieselbe Richtung, haben aber verschiedene L¨ angen. (Man k¨ onnte auch diesen Unterschied noch ausgleichen, indem man den Tangentialeinheitsvektor, d.h. den Einheitsvektor in dieser Richtung, betrachtet.)
127
8.5 Berechnung der Ableitung
ucks 3. Schon in (8.3) haben wir anhand der Parameterdarstellung eines Geradenst¨ gesehen, dass ein- und dieselbe Strecke AB auf verschiedene Arten durchlaufen werden kann:
(∗)
u(t) = a + tc ,
(∗∗)
v (t) = a + 2tc ,
(∗∗∗)
= a + (1 − t)c . w(t)
Wir untersuchen nun die Unterschiede unter Verwendung der Ableitung. F¨ ur die jeweiligen Geschwindigkeitvektoren finden wir
u˙ (t) = c,
v˙ (t) = 2c = 2u˙ (t),
˙ = −c = −u˙ (t) , w(t)
¨ in Ubereinstimmung mit den schon in (8.3) gemachten Feststellungen, dass in der “dynamischen” Auffassung die durch (∗∗) gegebene Bewegung doppelt so schnell ist wie die zu (∗) geh¨orige und dass (∗∗∗) den entgegengesetzten Durchlaufungssinn beschreibt. Betrachten wir nun noch
r(t) = a + t2c,
(∗∗∗∗)
t ∈ [0, 1] ,
so stellen wir fest, dass sowohl im Fall (∗) als auch im Fall (∗∗∗∗) die Strecke AB in einer Sekunde durchlaufen wird. Im Fall (∗∗∗∗) aber ist die Geschwindigkeit nicht konstant = c, sondern zeitabh¨angig: Es ist r˙ (t) = 2tc, d.h., sie nimmt mit zunehmender Zeit zu. In der folgenden Skizze sind entlang der Strecke AB die zu u(t) bzw. r(t) geh¨ origen Punkte eingezeichnet. Sie erkennen so nochmals, dass die beiden Bewegungsvorg¨ange innerhalb des Zeitintervalls [0, 1] verschieden ablaufen. u(0)
u(0.25)
A r(0) r(0.25)
r(0.5)
u(0.5) r(0.75)
u(0.75)
u(1) B r(1)
8. Die Ableitung einer Vektorfunktion
128
(8.6) Ableitungsregeln f¨ ur Vektorfunktionen In Analogie zu (5.2) gelten die folgenden Regeln f¨ ur die Ableitung: · ˙ ˙ (1) Summe: (u(t) + v (t)) = u(t) + v (t) (2) Differenz: (u(t) − v (t))· = u˙ (t) − v˙ (t) (3) Produkt mit (konstantem) Skalar: (ru(t))· = ru˙ (t)
(r ∈ R) ˙ u(t) + r(t)u˙ (t) (4) Produkt mit (skalarer) Funktion: (r(t)u(t))· = r(t) (5) Skalarprodukt von Vektoren: (u(t)v (t))· = u˙ (t)v (t) + u(t)v˙ (t)
(6) Vektorprodukt: (u(t) × v (t))· = u˙ (t) × v (t) + u(t) × v˙ (t) Beachten Sie, dass (4), (5) und (6) gerade die Form der u ¨blichen Produktregel f¨ ur reellwertige Funktionen haben. Wegen der Antikommutativit¨ at des Vektorprodukts ist in (6) speziell auf die Reihenfolge der Faktoren zu achten. Alle diese Formeln k¨ onnen durch direktes Nachrechnen bewiesen werden. Als Beispiel m¨ oge (5) gen¨ ugen: ⎛
x1 (t)
⎞
⎜ ⎟ u(t) = ⎝ x2 (t) ⎠ ,
⎛
⎞ y1 (t) ⎜ ⎟ v (t) = ⎝ y2 (t) ⎠ .
x3 (t)
y3 (t)
Zur Vereinfachung lassen wir das Argument (t) einfach weg. Aus uv = x1 y1 + x2 y2 + x3 y3 folgt
(uv )· = (x1 y1 + x2 y2 + x3 y3 )· = (x˙ 1 y1 + x1 y˙ 1 + x˙ 2 y2 + x2 y˙ 2 + x˙ 3 y3 + x3 y˙ 3 ) = (x˙ 1 y1 + x˙ 2 y2 + x˙ 3 y3 ) + (x1 y˙ 1 + x2 y˙ 2 + x3 y˙ 3 ) = u˙ v + uv˙ .
Dabei wurden Summen- und Produktregel f¨ ur die Ableitung reellwertiger Funktionen verwendet.
Als Anwendung dieser Formeln untersuchen wir die ebene Kreisbewegung. Ein Punkt P bewege sich auf einer Kreisbahn vom Radius r, seine Lage zum Zeitpunkt t ist dann durch den Winkel ϕ = ϕ(t) eindeutig festgelegt und es ist
r cos ϕ(t) −−→ OP = r(t) = . r sin ϕ(t) F¨ ur den Geschwindigkeitsvektor v (t) = r˙ (t) gilt dann v (t) =
−r sin ϕ(t) · ϕ(t) ˙ r cos ϕ(t) · ϕ(t) ˙
= rϕ(t) ˙
− sin ϕ(t) cos ϕ(t)
.
y n P r ϕ O
x r
8.7 Weitere Begriffe
129
Dabei ist ϕ(t) ˙ = ω(t) die sogenannte Winkelgeschwindigkeit. Ferner steht der Vektor
− sin ϕ(t) n(t) = cos ϕ(t) stets senkrecht auf r(t), denn das Skalarprodukt r(t)n(t) ist = 0. Somit steht auch v (t) = rϕ(t) ˙ n(t) senkrecht auf r(t), hat also die Richtung der Tangente. Da n(t) ein Einheitsvektor ist, gilt f¨ ur den Betrag der Geschwindigkeit: ˙ v(t) = |v (t)| = r|ϕ(t)| = r|ω(t)| . Nun berechnen wir noch die Beschleunigung a(t) = v˙ (t) = ¨r(t). Wegen Regel (4) erhalten wir
− sin ϕ(t) − cos ϕ(t) 2 ¨ + r(ϕ(t)) ˙ a(t) = rϕ(t) . cos ϕ(t) − sin ϕ(t) Die erste Komponente hat die Richtung von n(t), sie heisst die Tangentialkomponente der Beschleunigung, die zweite, die Normalkomponente, hat die zu r(t) entgegengesetzte Richtung, zeigt also stets zum Kreismittelpunkt.
− cos ϕ(t) Da ein Einheitsvektor ist, hat die Normalkomponente den Betrag − sin ϕ(t) 2 ˙ = rω(t)2 aN (t) = r(ϕ(t))
oder, wegen v(t) = r|ω(t)| : aN (t) =
v(t)2 . r
(8.7) Weitere Begriffe Viele Begriffe aus der Differentialrechnung von reellwertigen Funktionen lassen sich ohne weiteres auf die Differentialrechnung von Vektoren u ¨bertragen. Wir erw¨ahnen hier nur die folgenden: a) H¨ohere Ableitungen Genau wie in (4.5) definiert man ¨r(t) durch (r˙ (t))· , man schreibt auch d2r dt2
usw.
Dies wurde im obigen Beispiel bereits gebraucht.
8. Die Ableitung einer Vektorfunktion
130
b) Das Differential In Analogie zu (7.4) nennt man dr = r˙ (t0 )dt (auch dr = r˙ (t0 )Δt geschrieben) das vektorielle Differential . Diese Gr¨osse kann als Approximation von Δr = r(t0 + Δt) − r(t0 ) aufgefasst werden: Es ist Δr ≈ dr, denn wegen r(t0 + Δt) − r(t0 ) Δr = lim r˙ (t0 ) = lim Δt→0 Δt→0 Δt Δt ist f¨ ur betragsm¨assig kleine Δt Δr r˙ (t0 ) ≈ , Δt
dr
r(t0 )
Δr
O
woraus durch Multiplikation mit Δt = dt die gew¨ unschte Beziehung folgt. In Koordinaten ist ⎛
⎞ x˙ 1 (t0 )dt dr = ⎝ x˙ 2 (t0 )dt ⎠ . x˙ 3 (t0 )dt
(8.∞) Aufgaben 8−1 Der unten dargestellte Kreis liegt in der y-z–Ebene. Geben Sie eine m¨ oglichst einfache Parameterdarstellung an. 8−2 Der unten dargestellte Viertelkreis liegt in der Ebene mit der Gleichung x − y = 0. Geben Sie eine m¨ oglichst einfache Parameterdarstellung an. Zu 8−1 Zu 8−2 z z 1 y 2
x
2
x
y
8−3 Das Gel¨ ander einer Wendeltreppe soll eine gleichm¨ assig im Gegenuhrzeigersinn ansteigende Schraubenlinie mit Radius 1 und Gangh¨ ohe 3 sein. Ihre Achse ist parallel zur z–Achse und geht durch den Punkt (2,2,0). Ferner soll f¨ ur t = 0 der Punkt (3,2,0) und f¨ ur t = 1 der Punkt (3,2,3) erhalten werden. Suchen Sie eine passende Parameterdarstellung. 8−4 Die durch r(t) =
ct e · cos t ect · sin t
gegebene ebene Kurve heisst “logarithmische Spirale”. Zeichnen Sie die Kurve f¨ ur c = 21π und −2π ≤ t ≤ 2π.
131
8.∞ Aufgaben y 8−5 Ein Kreis mit Radius r rollt auf der x–Achse ab. Die Kurve, die dabei durch einen Punkt P auf dem Kreisumfang beschrieben wird, heisst Zykloide. Geben Sie eine Parameterdarstellung dieser Kurve an. W¨ ahlen Sie dazu den Drehwinkel des Kreises als Parameter (siehe Figur).
r t x
8−6 Die Bewegung eines Massenpunktes wird durch ⎞ ⎛ √ 1+t ⎟ ⎜√ 2 r(t) = ⎝ t + 7 ⎠ , t > 0 t2
beschrieben. Berechnen Sie den Geschwindigkeits- und den Beschleunigungsvektor zur Zeit t = 3. 8−7 Ein Kurvenst¨ uck C ist durch die Parameterdarstellung ⎛ ⎜ r(t) = ⎝
⎞ 1−t ⎟ 2t ⎠, 0 ≤ t ≤ 1 4t − 4t2
gegeben. a) Zeichnen Sie das Kurvenst¨ uck. b) Welches ist der “h¨ ochste” Punkt der Kurve (Parameterwert und Koordinaten)? c) Wo durchst¨ osst das Kurvenst¨ uck die Ebene mit der Gleichung −4x + 3y + 2z = 0? 8−8 Ein Kurvenst¨ uck C ist gegeben durch die Parameterdarstellung ⎛
⎞ 2−t ⎜ ⎟ r(t) = ⎝ 2 + t ⎠ , t ∈ [−2, 2]. 2 t a) Zeichnen Sie eine r¨ aumliche Skizze. b) P bzw. Q sei der Anfangs- bzw. Endpunkt von C. Berechnen Sie den Winkel zwischen OP und OQ. c) In welchen Kurvenpunkten bildet die Tangente mit der x-y–Ebene einen Winkel von 45◦ ? 8−9 Ein Kurvenst¨ uck hat die Parameterdarstellung ⎛
⎞ 1 + cos t ⎜ ⎟ r(t) = ⎝ 1 + sin t ⎠ , t ∈ [0, 2π]. t sin( 2 ) a) Geben Sie eine Parameterdarstellung der Tangente im Punkt, der zum Parameterwert t = 0 geh¨ ort, an. b) Dasselbe f¨ ur den Parameterwert t = 2π. c) Skizzieren Sie die Bahnkurve. d) Welcher Kurvenpunkt (Parameterwert und Koordinaten) liegt am n¨ achsten beim Nullpunkt?
8. Die Ableitung einer Vektorfunktion
132
8−10 Ein Massenpunkt bewegt sich gem¨ ass ⎛
t t2
⎜ r(t) = ⎝
(t −
1)2
⎞ ⎟ ⎠.
a) Skizzieren Sie die Bahnkurve f¨ ur t ∈ [0, 1]. b) Welchen Betrag hat die Geschwindigkeit zu den Zeitpunkten t = 0 und t = 1? c) Zu welchem Zeitpunkt ist die Schnelligkeit minimal? Wie gross ist sie dann? ass der Beziehung 8−11 Ein anderer Massenpunkt bewegt sich gem¨ ⎞ ⎛ sin(2πt) ⎜ ⎟ r(t) = ⎝ 2 sin(2πt) ⎠ , 0 ≤ t ≤ 1. − sin(2πt) a) Wie sieht die Bahnkurve aus? b) Beschreiben Sie den Bewegungsvorgang in Worten. 8−12 Zeigen Sie, dass die durch
⎛ ⎜ r(t) = ⎝
⎞ t2 + t + 1 ⎟ 3t ⎠, t ∈ R 2t2 − t
gegebene Raumkurve in einer Ebene liegt, und bestimmen Sie eine Gleichung dieser Ebene. 8−13 Zwei Kurven sind gegeben durch ⎞ t3 ⎜ 2⎟ r(t) = ⎝ t ⎠ t
⎛
⎛
und
⎜ s(u) = ⎝
⎞ 1 + u2 ⎟ 1 ⎠. 1−u
Schneiden sich diese Kurven? Wenn ja, bestimmen Sie den Schnittpunkt und den Schnittwinkel. 8−14 a) In welchen Punkten durchst¨ osst die durch ⎛
⎞ t3 + 1 ⎜ 2 ⎟ r(t) = ⎝ t + 1 ⎠ t2 − 2t gegebene Raumkurve die x-y–Ebene? b) Bestimmen Sie die jeweiligen Schnittwinkel.
133
C. INTEGRALRECHNUNG 9. EINLEITENDE BEISPIELE ZUM BEGRIFF DES INTEGRALS ¨ (9.1) Uberblick In diesem Kapitel soll gezeigt werden, dass verschiedene Problemstellungen aus der Mathematik und den Naturwissenschaften alle mit derselben Idee angegangen werden k¨ onnen und auf mathematische Ausdr¨ ucke gleicher Art, n¨amlich auf sogenannte bestimmte Integrale, f¨ uhren. In Kapitel 10 wird dann dieses bestimmte Integral ganz allgemein definiert. Die hier diskutierten Beispiele • • • •
Bewegung eines Massenpunkts bei gegebener Geschwindigkeit, Arbeit, Fl¨ache unter einem Kurvenst¨ uck, Volumen eines Rotationsk¨ orpers
(9.2) (9.3) (9.4) (9.5)
k¨onnen dann als verschiedene konkrete Erscheinungsformen desselben allgemeinen Begriffs aufgefasst werden. Ganz a¨hnlich war es seinerzeit bei der Ableitung, die beispielsweise als Wachstumsgeschwindigkeit oder Tangentensteigung interpretiert werden kann (vgl. Kapitel 3). Vermutlich kennen Sie bereits den Zusammenhang zwischen dem bestimmten Integral und dem “Fl¨acheninhalt unter einer Kurve” (vgl. (9.4)). Es handelt sich dabei um eine ganz wichtige Anwendung des Integralbegriffs; es w¨are aber verfehlt, das bestimmte Integral einfach mit dem Fl¨acheninhalt zu identifizieren. Dies ist vielmehr nur eine der m¨ oglichen Interpretationen, andere finden Sie in (9.2) bis (9.5) sowie in (10.6). Etwas ganz Entsprechendes hatten wir in Kapitel 3 gesehen: Die Tangentensteigung ist nur eine der vielen Anwendungen der Ableitung, wenn auch eine wichtige und anschaulich leicht verst¨andliche.
© Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0_3
134
9. Einleitende Beispiele zum Begriff des Integrals
(9.2) Bewegung eines Massenpunkts Ein Massenpunkt bewegt sich entlang einer Geraden. Zur Zeit t = 0 befindet er sich im Nullpunkt O, zur Zeit t im Punkt mit der Koordinate s(t): x O
s(t)
In (3.2) sind wir von der Annahme ausgegangen, dass die Funktion s(t) bekannt sei, und haben daraus eine Formel f¨ ur die Geschwindigkeit hergeleitet, n¨amlich v(t) = s(t) ˙ (Ableitung). Nun kehren wir den Spiess um. In vielen F¨allen ist n¨amlich die Geschwindigkeit zur Zeit t bekannt, und man m¨ ochte die Ortskoordinate s(t) bestimmen. Ein bekanntes Beispiel hierzu ist der freie Fall: Ein im Zeitpunkt t = 0 fallen gelassener K¨ orper hat zur Zeit t die Geschwindigkeit v(t) = gt, wo g = 9.81 ms−2 die Fallbeschleunigung ist. Es sei wieder einmal darauf hingewiesen, dass die Geschwindigkeit im allgemeinen Fall ein Vektor ist, vgl. die Bemerkung am Schluss von (3.2). Da wir hier den eindimensionalen Fall betrachten, wird die Geschwindigkeit durch eine einzige Zahl beschrieben, die je nach Bewegungsrichtung positiv oder negativ sein kann. Die oben erw¨ ahnte Formel v(t) = gt gilt, falls die Koordinatenachse in Fallrichtung, also nach unten orientiert ist (andernfalls w¨ urde das Vorzeichen wechseln).
Wir formulieren unser Problem nochmals: Bekannt ist die Geschwindigkeit v(t) in Funktion der Zeit, gesucht ist die Ortskoordinate s(T ) des Massenpunkts zu einer gegebenen Zeit T . W¨ are die Geschwindigkeit konstant, v(t) = v0 , so w¨are die L¨ osung des Problems sehr einfach: Zur¨ uckgelegte Strecke gleich Geschwindigkeit mal Zeit: s(T ) = v0 T . Hier geht es aber um die Situation, wo sich — wie etwa beim freien Fall — die Geschwindigkeit v(t) mit der Zeit ¨andert. Der folgende Gedankengang hilft weiter: Der ganze Vorgang l¨ auft im Zeitintervall [0, T ] ab. Wir denken uns nun dieses Intervall in viele im Vergleich zur Gesamtdauer kleine Teilintervalle zerlegt. W¨ahrend einer solchen kurzen Zeitspanne ¨andert sich die Geschwindigkeit nur wenig; wir d¨ urfen sie ohne allzu grossen Fehler als konstant annehmen. Dann l¨ asst sich aber die in diesem kurzen Teil-Zeitintervall zur¨ uckgelegte Teilstrecke nach der Formel “Geschwindigkeit mal Zeit” sofort ausrechnen. (Zu beachten ist, dass wohl die Geschwindigkeit im einzelnen Teilintervall als konstant angenommen wird, dass sie sich aber von Intervall zu Intervall a¨ndert.) Addiert man alle diese Teilstrecken, so erh¨alt man die bis zum Zeitpunkt T zur¨ uckgelegte Strecke zumindest n¨ aherungsweise. Diese N¨ aherung wird um so besser sein, je kleiner die Teilintervalle gew¨ ahlt werden. Die tats¨ achlich zur¨ uckgelegte Strecke s(T ) wird sich ergeben, wenn man mit einem Grenz¨ ubergang die L¨ ange der Teilintervalle gegen Null streben l¨ asst.
9.2 Bewegung eines Massenpunkts
135
Diese etwas wortreiche Erkl¨arung wollen wir nun in die mathematische Formelsprache u ¨bersetzen. Wir zerlegen dazu zun¨achst das Zeitintervall [0, T ] in Teilintervalle [ti−1 , ti ] gem¨ass folgender Skizze: t1 t2
0 = t0
ti−1
ti
tn−1
tn = T
(Es wird nicht vorausgesetzt, dass die Teilintervalle alle gleiche L¨ ange haben.) Als n¨achstes w¨ahlen wir in jedem Teilintervall [ti−1 , ti ] einen “Zwischenpunkt” τi . τ1 0 = t0
τ2
τi
t1 t2
ti−1
τn ti
tn−1
tn = T
Es ist also ti−1 ≤ τi ≤ ti . Die τi k¨ onnen, m¨ ussen aber nicht, mit den Randpunkten ti−1 oder ti des Teilintervalls zusammenfallen. Wenn die Teilintervalle klein genug sind, so darf man ohne allzu grosse Ungenauigkeit annehmen, die Geschwindigkeit sei in diesem Intervall ann¨ahernd konstant, n¨ amlich ungef¨ahr gleich v(τi ): v(t) ≈ v(τi ) f¨ ur t ∈ [ti−1 , ti ] . Da dieses Zeitintervall die L¨ ange ti − ti−1 = Δti hat, legt der Massenpunkt in dieser Zeit ungef¨ ahr die Strecke v(τi )(ti − ti−1 ) = v(τi )Δti zur¨ uck. ¨ Wir f¨ uhren nun diese Uberlegung f¨ ur jedes Intervall [ti−1 , ti ] durch und erhalten durch Summation einen ungef¨ ahren Wert f¨ ur die gesuchte Gr¨ osse s(T ): s(T ) ≈
n
v(τi )Δti .
i=1
Diese Approximation ist offensichtlich um so genauer, je kleiner die Teilintervalle [ti−1 , ti ] sind. Wir f¨ uhren daher einen Grenz¨ ubergang durch, der darin besteht, dass die L¨ange Δti jedes einzelnen Teilintervalls immer kleiner wird, also gegen 0 strebt. (Dadurch wird automatisch die Anzahl n der Teilintervalle immer gr¨ osser, d.h., sie geht gegen unendlich.) F¨ ur den Limes im eben besprochenen Sinne wird dann gelten: s(T ) = lim
Δti →0
n i=1
v(τi )Δti .
136
9. Einleitende Beispiele zum Begriff des Integrals
F¨ ur diesen Grenzwert verwendet man das neue Zeichen
T
v(t) dt 0
und nennt ihn das bestimmte Integral der Funktion v = v(t) im Intervall [0, T ]. Die genauen Definitionen folgen in Kapitel 10. Die Frage, wie man denn einen solchen Limes berechnet, soll uns im Moment noch nicht k¨ ummern. Vorl¨ aufig ist nur wichtig, dass s(T ) als Grenzwert einer ganz bestimmten Art beschrieben werden kann. Bemerkung Wir haben in (3.2) die Geschwindigkeit v als Ableitung der Funktion s definiert. Im vorliegenden Abschnitt haben wir gesehen, dass die Funktion s als Integral der Funktion v bestimmt werden kann. Es scheint also ein Zusammenhang zwischen Ableitung und Integral zu bestehen. Diese Vermutung trifft tats¨ achlich zu; wir werden in Kapitel 11 darauf eingehen.
(9.3) Arbeit Eine einseitig befestigte Schraubenfeder wird gespannt. Ihr loses Ende sei am Anfang an der Stelle 0, am Ende des Vorgangs an der Stelle b auf der x–Achse:
x 0
b
Wie gross ist die geleistete Arbeit? W¨ are die Federkraft konstant = F , also unabh¨angig von der Lage x des Feder-Endes, so w¨ urde wegen der Definition Arbeit = Kraft mal Weg gelten: W = F b. (Die Kraft ist eigentlich ein Vektor. Da sie hier in der Bewegungsrichtung wirkt, d¨ urfen wir sie als Skalar behandeln. Vgl. aber (1.8.a) und (14.4).) Nun h¨angt jedoch im betrachteten Fall die Federkraft von der Dehnung der Feder ab: F = F (x).* Wir k¨onnen daher die Beziehung “Arbeit = Kraft mal Weg” nicht einfach auf das ganze Intervall [0, b] anwenden. * In einem gewissen Bereich gilt, dass die Federkraft proportional zu x ist. Da es hier aber nicht auf diese spezielle Form der Kraft ankommt, verwenden wir weiterhin die allgemeine variable Kraft F (x).
137
acheninhalt 9.4 Fl¨
¨ Ahnlich wie in (9.2) teilen wir deshalb das Intervall [0, b] in Teilintervalle [xi−1 , xi ] ein und w¨ahlen in jedem solchen Intervall einen “Zwischenpunkt” ξi . ξ1 0 = x0
ξ2
ξi
x1 x2
ξn
xi−1
xi
xn−1
xn = b
Ohne allzu grossen Fehler darf man annehmen, die Kraft im Intervall [xi−1 , xi ] sei ungef¨ahr gleich F (ξi ), so dass f¨ ur die dort geleistete Arbeit gilt Wi ≈ F (ξi )(xi − xi−1 ) = F (ξi )Δxi . Die total geleistete Arbeit ist dann W ≈
n
F (ξi )Δxi .
i=1
Um die Genauigkeit zu erh¨ohen, lassen wir wie in (9.2) die Teilintervalle immer kleiner werden und erhalten schliesslich als exakten Wert W = lim
n
Δxi →0
b
F (ξi )Δxi =
F (x) dx . 0
i=1
(9.4) Fl¨ acheninhalt Gegeben sei eine stetige Funktion f : [a, b] → R mit f (x) ≥ 0 f¨ ur alle x ∈ [a, b]. Wir m¨ochten den Inhalt A des schraffierten Fl¨ achenst¨ ucks bestimmen. Zu diesem Zweck unterteilen wir [a, b] wie vorher und w¨ahlen in jedem [xi−1 , xi ] einen Zwischenpunkt ξi . ξi a = x0
xi−1
xi
xn = b
f
a
Der Ausdruck f (ξi )Δxi hat hier eine einfache Bedeutung: Es handelt sich um den Fl¨ acheninhalt des in der untenstehenden Figur schraffierten Rechtecks. Die Summe n i=1
f (ξi )Δxi
b
138
9. Einleitende Beispiele zum Begriff des Integrals
ist dann der Inhalt der aus den einzelnen Rechtecken zusammengesetzten Fl¨ ache und demzufolge eine Approximation des Fl¨acheninhalts A:
f
a
xi−1
ξi
xi
b
Dank der geometrischen Interpretation sieht man hier besonders gut, was bei verschiedener Wahl der Zwischenpunkte herauskommt. Wir skizzieren vier M¨ oglichkeiten: 1) ξi = xi−1
x0
x1
2) ξi = xi
x2
x3
x4
x1
x2
x3
x1
x2
x3
x4
4) f (ξi ) gr¨ osster Funktionswert in [xi−1 , xi ] (“Obersumme”)
3) f (ξi ) kleinster Funktionswert in [xi−1 , xi ] (“Untersumme”)
x0
x0
x4
x0
x1
x2
x3
x4
Um den gesuchten Fl¨acheninhalt A zu erhalten, wird man nun – wie schon in den vorangegangenen Beispielen – die L¨ange Δxi der Teilintervalle gegen 0 streben lassen. Man findet dann
A = lim
Δxi →0
n i=1
b
f (ξi )Δxi =
f (x) dx . a
9.5 Volumen von Rotationsk¨ orpern
139
(9.5) Volumen von Rotationsk¨ orpern Wie in (9.4) betrachten wir den Graphen einer Funktion f : [a, b] → R mit f (x) ≥ 0. Nun rotieren wir diesen Graphen um die x–Achse. Die in der ersten Skizze von (9.4) schraffierte Fl¨ache erzeugt dann einen “Rotationsk¨orper”, dessen Volumen wir bestimmen m¨ochten: f
x
Wir gehen zun¨ achst genau gleich vor wie in (9.4) und betrachten einen schmalen ange f (ξi ). Beim Rotieren entsteht daraus ein Zylinder Streifen mit Breite Δxi und L¨ mit Radius f (ξi ) und H¨ohe Δxi und somit vom Volumen Vi = πf (ξi )2 Δxi
f (ξi )
Δxi F¨ uhren wir dies f¨ ur alle i durch und summieren, so erhalten wir eine Approximation des Rotationsk¨ orpers durch viele zylinderf¨ormige Scheiben, und f¨ ur sein Volumen V gilt: V ≈
n
πf (ξi )2 Δxi .
i=1
Dieser Ausdruck ist ganz a¨hnlich den bisher betrachteten, allerdings steht unter dem Summenzeichen nicht die Funktion f , sondern die Funktion, welche durch x → πf (x)2 gegeben ist. Zum Schluss f¨ uhren wir wieder den bereits in (9.2) bis (9.4) besprochenen Grenzu ¨bergang durch: Je feiner man die Unterteilung der x–Achse w¨ahlt, desto genauer wird die Approximation des gesuchten Volumens durch diese Summe von d¨ unnen, zylinder-
140
9. Einleitende Beispiele zum Begriff des Integrals
f¨ ormigen Scheiben und man erh¨alt die Formel V = lim
Δxi →0
n
b
πf (ξi )2 Δxi =
πf (x)2 dx .
a
i=1
(9.6) Zusammenfassung Wir haben in den vier besprochenen Beispielen gesehen, dass in ganz verschiedenen Situationen dieselbe mathematische Konstruktion auftritt, n¨ amlich ein Grenzwert, der (abgesehen von den Bezeichnungen) stets die Form n
lim
Δxi →0
f (ξi )Δxi
i=1
hat, wof¨ ur man auch als Abk¨ urzung
b
f (x) dx a
schreibt. Diese vier F¨alle haben einen gemeinsamen Kern: Wir suchen eine mathematische Beschreibung einer Gr¨ osse (aus den Naturwissenschaften oder der Mathematik), f¨ ur die folgendes gilt: • Sie kann durch Summation von vielen kleinen Teilgr¨ossen angen¨ahert werden. • Diese Ann¨aherung ist um so besser, je kleiner (und damit je zahlreicher) die Teilgr¨ ossen sind. Unter diesen Voraussetzungen ist die gesuchte Gr¨ osse der Grenzwert dieser N¨aherungssummen. Ein derartiger Grenzwert wird als bestimmtes Integral bezeichnet. Da dieser Gedankengang auch in vielen anderen F¨allen auftritt, ist es zweckm¨assig, die hier erl¨ auterte Konstruktion ein f¨ ur allemal und losgel¨ ost von speziellen Beispielen durchzuf¨ uhren. Dies soll im n¨achsten Kapitel geschehen. Man gelangt so zum Begriff des bestimmten Integrals, das als wichtiges Werkzeug in vielen Situationen Anwendung findet. Dieses bestimmte Integral wird im n¨ achsten Kapitel allgemein definiert. In den weiteren Kapiteln werden wir dann sehen, wie es effektiv berechnet werden kann, und weitere Anwendungen kennenlernen. (9.∞) Aufgaben Zu diesem Kapitel passen Aufgaben, bei denen es um die Beschreibung von Sachverhalten mittels bestimmter Integrale geht. Solche Aufgaben finden Sie in Kapitel 10, in welchem der Integralbegriff formell eingef¨ uhrt wird.
141
10. DAS BESTIMMTE INTEGRAL ¨ (10.1) Uberblick Gest¨ utzt auf die Beispiele in Kapitel 9 wird das bestimmte Integral — losgel¨ ost von speziellen Anwendungen — als Limes von sogenannten Riemannschen Summen
b
f (x) dx = lim a
Δxi →0
n
(10.2)
f (ξi )Δxi
i=1
definiert und im Detail besprochen.
(10.3), (10.4)
Eine direkte Bestimmung dieses Grenzwerts ist meist schwierig; zur Berechnung dieser Integrale benutzt man in der Praxis den sp¨ater zu behandelnden “Hauptsatz der Differential- und Integralrechnung”.
(10.7) (11.4)
(10.2) Die Definition des bestimmten Integrals Wir wollen nun — wie in (9.6) angek¨ undigt — den in den Beispielen des Kapitels 9 untersuchten Prozess als allgemeine Konstruktion einf¨ uhren. Dazu seien ein abgeschlossenes Intervall [a, b] und eine stetige Funktion f : [a, b] → R,
(a < b)
gegeben. Wir f¨ uhren nun eine Reihe von Schritten durch: 1. Schritt Wir unterteilen das Intervall [a, b] in n Teilintervalle, indem wir Teilpunkte a = x0 < x1 < x2 < . . . < xi−1 < xi < . . . < xn = b w¨ ahlen. (Wir sprechen auch von einer Unterteilung des Intervalls [a, b].) Das i–te Teilintervall [xi−1 , xi ] hat die L¨ange Δxi = xi − xi−1 . (Es wird nicht vorausgesetzt, dass die Teilintervalle alle dieselbe L¨ ange haben.) 2. Schritt In jedem Teilintervall [xi−1 , xi ] w¨ahlen wir einen Zwischenpunkt ξi : xi−1 ≤ ξi ≤ xi .
10. Das bestimmte Integral
142
3. Schritt Mit den so gew¨ahlten Gr¨ ossen bilden wir die Summe n
f (ξi )(xi − xi−1 ) =
i=1
n
f (ξi )Δxi .
i=1
Eine solche Summe wird Riemannsche Summe (nach B. Riemann, 1826–1866) genannt. 4. Schritt Nun verkleinern wir die Teilintervalle immer mehr (d.h., wir lassen Δxi → 0 streben). Dabei wird die Anzahl n der Teilintervalle automatisch immer gr¨ osser (n → ∞). Bei diesem Prozess strebt die Riemannsche Summe einem Grenzwert zu. Dieser heisst das bestimmte Integral von f mit den Grenzen a und b und wird mit
b
f (x) dx a
bezeichnet. Formelm¨assig geschrieben:
b
f (x) dx = lim
Δxi →0
a
n
f (ξi )Δxi .
i=1
Damit ist das bestimmte Integral als allgemeine mathematische Konstruktion eingef¨ uhrt. ¨ Ein Vergleich mit (9.2) bis (9.5) zeigt, dass die dort durchgef¨ uhrten Uberlegungen konkrete Anwendungen des abstrakten Integralbegriffs sind (siehe auch (10.5)). (10.3) Theoretische Bemerkungen zur Definition des Integrals Die Art der Durchf¨ uhrung des Grenz¨ ubergangs
lim
Δxi →0
n
f (ξi )Δxi
i=1
bedarf noch einer Pr¨ azisierung, denn eigentlich sollte nach dem Limeszeichen eine Folge stehen. Dies l¨ asst sich aber wie folgt einrichten: Als Hilfsbegriff f¨ uhrt man die Feinheit η(U ) der Unterteilung U = {x0 , x1 , . . . , xn } ein. Darunter versteht man einfach die L¨ ange des gr¨ ossten Teilintervalls von U . Nun betrachten wir eine Folge von Unterteilungen (Uk ), k = 1, 2, . . . , deren Feinheit mit wachsendem k gegen 0 strebt (η(Uk ) → 0 f¨ ur k → ∞). Diese Bedingung pr¨ azisiert die anschauliche Forderung Δxi → 0. Zu jeder
10.4 Bemerkungen
143
orige Riemannsche Summe Sk und erhalten so eine Folge solchen Unterteilung Uk bilden wir die zugeh¨ (Sk ), k = 1, 2, . . . von Riemannschen Summen. Das bestimmte Integral, also der Ausdruck n
lim
Δxi →0
f (ξi )Δxi ,
i=1
ist dann genauer als Limes der Folge (Sk ) zu interpretieren, in Formeln b a
f (x) dx = lim Sk . k→∞
ur stetige Funktionen f immer existiert und nicht von der Man kann nun zeigen, dass dieser Grenzwert f¨ speziellen Wahl der Folge (Uk ) und der Zwischenpunkte ξi abh¨ angt. Auf den Beweis dieser Tatsache sei verzichtet. Es sei aber darauf hingewiesen, dass sie es erlaubt, bei der Berechnung eines bestimmten Integrals als Grenzwert von Riemannschen Summen die Unterteilung und die Zwischenpunkte so zu w¨ ahlen, oglichst einfach wird. Wir werden uns dies in (10.7) zunutze machen. Allerdings dass die Rechnung m¨ werden wir in den Kapiteln 11 und 12 sehen, dass die effektive Berechnung von Integralen in der Praxis auf eine ganz andere Weise erfolgt.
(10.4) Bemerkungen Nachdem nun das bestimmte Integral definiert ist, sind einige wichtige Bemerkungen zu machen: a) Das bestimmte Integral einer Funktion f (x) ist eine Zahl (und nicht etwa eine Funktion!). Je nach dem Kontext kann diese Zahl eine Strecke, eine Arbeit, ein Fl¨acheninhalt, ein Volumen usw. sein. b) Einige Erl¨auterungen zur Bezeichnung: In der Notation
b
f (x) dx a
heissen a und b die Integrationsgrenzen, f der Integrand und x die Integrationsvariable. Die Bezeichnung dieser Variablen ist ohne Einfluss auf den Wert des Integrals und darf beliebig gew¨ahlt werden, so ist z.B.
b a
b
f (x) dx =
b
f (t) dt =
f (ξ) dξ = . . .
a
y
a
1 Konkret also z.B.
1 0
x2 dx =
1 0
t2 dt =
1
ξ 2 dξ = . . .
y = x2
0
Interpretiert man das Integral als Fl¨ acheninhalt, so gibt das obige Integral den Inhalt des schraffierten St¨ ucks an. Dieser h¨ angt sicher nicht davon ab, ob die Variable x, t oder ξ heisst.
1
x
144
10. Das bestimmte Integral
Wie man sieht, dient das Symbol dx (bzw. dt, dξ) nur zur Angabe der Integrationsvariablen. Dies ist immer n¨ utzlich und manchmal unentbehrlich, denn es ist nicht in jedem Fall klar, welches die Integrationsvariable ist. So ist z.B. 2 2 2 x2 y dy , x y dx = 0
0
denn im ersten Fall wird die quadratische Funktion x → x2 y (y konstant) integriert, im zweiten Fall die lineare Funktion y → x2 y (x konstant). Die Zweckm¨assigkeit des ater bei der Substitutionsregel zeigen (13.3), wo es (formal) Symbols dx wird sich sp¨ wie ein Differential behandelt werden kann. Eine anschauliche Interpretation von dx finden Sie in c). c) Die Bezeichnung
b
f (x) dx a
stammt von G.W. Leibniz, der zusammen mit I. Newton die Differential- und Integralrechnung begr¨ undet hat, vgl. (4.3.c). ¨ Man kann sich den Ubergang n i=1
f (ξi )Δxi
b
f (x) dx a
ubergang werden die Δxi “unendlich klein”, man etwa so vorstellen: Im Grenz¨ wird zu einer “unendlichen ur dx, und die endliche Summe schreibt dann daf¨ Summe” . Dieses Operieren mit unendlich kleinen Gr¨ossen dx und unendlichen Summen urlich nicht pr¨ ist nat¨ azis, da die Begriffe nicht definiert sind; in der assig sein, so zu argumentieren (bitte Praxis kann es aber manchmal ganz zweckm¨ autern dieses Vorgehen nicht mit lauter Stimme, sondern nur in Gedanken!). Wir erl¨ an den Beispielen (9.3) bis (9.5). 1) Fl¨achenberechnung Wir w¨ahlen an der Stelle x ein “unendlich kleines” Intervall der L¨ange dx. Wir erhalten so einen “unendlich schmalen” Streifen der Breite dx und der H¨ ohe f (x), also mit Fl¨ acheninhalt f (x) dx (= df ). Der Inhalt A der gesamten Fl¨ ache wird erhalten, indem man diese “unendlich vielen, unendlich schmalen Streifen” mittels “summiert”: b A= f (x) dx . a
f f (x)
a
dx
b
10.5 Anwendungen der allgemeinen Definition
145
2) Arbeit Wenn sich das lose Ende der Feder an der Stelle x befindet, so betr¨agt die Federkraft F (x). Im “unendlich kleinen” Intervall dx wird also die “infinitesimale” Arbeit dW = F (x) dx geleistet. Die totale Arbeit ist demzufolge die “unendliche Summe”
dx x
b
W =
F (x) dx . 0
3) Volumen eines Rotationsk¨orpers Rotieren wir ein “unendlich schmales” St¨ uck des Graphen um die x–Achse, so erhalten wir einen kleinen Zylinder mit Radius f (x), H¨ ohe dx und Volumen dV = πf (x)2 dx. Das Gesamtvolumen ergibt sich dann zu
b
V =
f (x)
dx
πf (x)2 dx .
a
Es sei nochmals ausdr¨ ucklich darauf hingewiesen, dass diese Schlussweisen vom mathematischen Standpunkt aus nicht exakt sind. Der korrekte Weg zum Integral f¨ uhrt u ¨ber die Riemannschen Summen. Immerhin kann die Methode zumindest als Merkregel f¨ ur die Formeln dienen. (10.5) Anwendungen der allgemeinen Definition Der Zusammenhang unserer abstrakten Definition mit den Beispielen (9.2) bis (9.5) ist so zu verstehen: Das bestimmte Integral, so wie es in (10.2) definiert wurde, ist zun¨ achst ein rein mathematischer Begriff. Dieser hat nun viele Anwendungen innerhalb und ausserhalb der Mathematik. (Diese Anwendungen lieferten aber umgekehrt erst das Bed¨ urfnis f¨ ur die allgemeine Definition, so dass eine gewisse Wechselwirkung vorliegt). Beispiele • Der Physiker wird im Beispiel (9.3) die geleistete Arbeit W durch die Formel
b
F (x) dx 0
definieren, unter Benutzung des vom Mathematiker bereitgestellten Integralbegriffs. ¨ Die Uberlegungen von (9.3) zeigen, dass der anschauliche Sachverhalt durch dieses Integral richtig wiedergegeben wird.
146
10. Das bestimmte Integral
• Dem Mathematiker sagt die Betrachtung von (9.4), dass der Inhalt A des Fl¨ achenassigerweise durch die Formel ucks zweckm¨ st¨
b
A=
f (x) dx a
definiert wird. • Ganz entsprechend ist auch die Formel von (9.5)
b
V =
πf (x)2 dx
a
orpers aufzufassen. als Definition des Volumens eines Rotationsk¨ • Ein weiteres Beispiel ist die Definition der Kurvenl¨ange in (10.6.b). Es ist also wichtig zu wissen, dass das Integral viele Erscheinungsformen hat. Die Interpretation als “Fl¨ache unter der Kurve”, die Ihnen vielleicht schon bekannt ist, ist nur eine unter diesen Formen, wenn auch eine sehr wichtige. (Ein Analogon: Auch die Ableitung hat viele Interpretationsm¨oglichkeiten, worunter die “Steigung der Tangente” nur eine besonders bekannte ist, vgl. (3.5).) Bei dieser Gelegenheit sei darauf hingewiesen, dass die Auffassung des Integrals als assig ist, wenn f (x) ≥ 0 ist f¨ ache unter der Kurve” ohnehin nur dann zul¨ “Fl¨ ur alle x (siehe (12.6.4)). (10.6) Weitere Beispiele zur Anwendung des Integralbegriffs Dieser Abschnitt erg¨anzt die Beispiele in Kapitel 9. Wir wollen erneut zeigen, dass der Integralbegriff zur Beschreibung von gewissen Sachverhalten zwingend ben¨ otigt wird. a) Str¨omung durch ein Rohr Durch ein zylindrisches Rohr vom Radius R fliesst eine Fl¨ ussigkeit mit der Str¨omungsgeschwindigkeit v, welche vom Abstand r von der Rohrachse abh¨ angig ist: v = v(r). (Im Zentrum des Rohrs wird v gr¨ osser sein als am Rand; die genaue Form der Funktion v(r) spielt keine Rolle.) Wie gross ist die pro Zeiteinheit durch das Rohr str¨ omende Fl¨ ussigkeitsmenge M ? W¨ are v konstant, so w¨are M = Av, wo A = πR2 die Querschnittsfl¨ache ist. Da aber dies nicht der Fall ist, m¨ ussen wir einen Integrationsprozess anwenden: Wir zerlegen den Querschnitt in kleine Kreisringe, indem wir den Kreisradius unterteilen: 0 = r0 < r1 < . . . < rn = R .
147
10.6 Weitere Beispiele zur Anwendung des Integralbegriffs
Der Inhalt des i–ten Kreisrings ist als Differenz 2 = π(ri + ri−1 ) · zweier Kreisfl¨achen = πri2 − πri−1 (ri − ri−1 ) = 2πρi Δri . Dabei ist ρi = 12 (ri + ri−1 ) ein Zwischenpunkt und wie u ¨blich ist Δri = ri − ri−1 . Wenn nun Δri klein genug ist, d¨ urfen wir n¨aherungsweise annehmen, die Str¨ omungsgeschwindigkeit sei auf dem ganzen Kreisring konstant, n¨ amlich gleich v(ρi ).
ρi ri−1
ri
Durch den i–ten Kreisring str¨omt dann pro Zeiteinheit die Fl¨ ussigkeitsmenge Mi ≈ 2πρi Δri · v(ρi ) , total also (Summation u ¨ber alle Kreisringe): M≈
n
2πρi v(ρi )Δri .
i=1
Dies ist aber die Riemannsche Summe der Funktion r → 2πrv(r) . F¨ ur immer feiner werdende Unterteilungen erhalten wir im Grenzfall M = lim
n
Δri →0
also ist
2πρi v(ρi )Δri ,
i=1
R
2πrv(r) dr .
M= 0
b) L¨ange eines Kurvenst¨ ucks Wir betrachten eine Funktion f : [a, b] → R und ihren Graphen. Gesucht ist dessen L¨ ange.
f
a
b
Die Methode zur L¨osung dieser Aufgabe besteht darin, die Kurve durch einen “Streckenzug” zu ersetzen, dessen L¨ange berechnet werden kann. Getreu der Grundidee
R
148
10. Das bestimmte Integral
des Integrierens werden dann die einzelnen Teilstrecken immer kleiner gemacht, was eine immer bessere Approximation der gesuchten Kurvenl¨ ange bewirkt.
a = x0
xi−1
xi
xn = b
Zur Konstruktion dieses Streckenzugs haben wir wie u ¨blich das Intervall [a, b] in Teilintervalle eingeteilt. Wir betrachten nun eine einzelne Strecke:
Δyi
Δxi xi−1
xi
Wie erw¨ ahnt, ersetzen wir das Kurvenst¨ uck im Intervall [xi−1 , xi ] durch die Sekante. Die L¨ ange des Kurvenst¨ ucks ist n¨ aherungsweise gleich der Sekantenl¨ ange Li . Nach dem Satz von Pythagoras gilt Li = Δx2i + Δyi2 , wobei Δxi = xi − xi−1 , Δyi = f (xi ) − f (xi−1 ) ist. Nun ist Δyi /Δxi die Steigung der Sekante. Wie man der Skizze entnimmt, gibt es (mindestens) einen Punkt ξi ∈ [xi−1 , xi ] mit f (ξi ) = Δyi /Δxi d.h. mit Δyi = f (ξi )Δxi . Wir erhalten durch Einsetzen:
Δx2i + f (ξi )2 Δx2i = Δxi · 1 + f (ξi )2 .
Li =
xi−1
ξi
xi
Die totale L¨ ange des Kurvenst¨ ucks wird approximiert durch die Summe der Li (d.h. die L¨ ange des Streckenzugs) L≈
n 1 + f (ξi )2 Δxi . i=1
149
10.7 Ein Beispiel zur Berechnung von bestimmten Integralen
Dies ist aber gerade eine Riemannsche Summe der Funktion x →
1 + f (x)2 .
alt man die Kurvenl¨ange L als Integral Nach dem Grenz¨ ubergang Δxi → 0 erh¨
b
L=
1 + f (x)2 dx .
a
Vom mathematischen Standpunkt aus ist diese Formel als Definition der Kurvenl¨ange aufzufassen, eine Definition, die erst dank der Integralrechnung m¨ oglich wird. (10.7) Ein Beispiel zur Berechnung von bestimmten Integralen Wir kennen jetzt die allgemeine Definition des Integrals, und wir haben auch gesehen, dass dieses zur Beschreibung von manchen Sachverhalten unentbehrlich ist. Wir wissen ferner, dass das bestimmte Integral eine Zahl ist. Wir haben aber dieses Integral (also diese Zahl) bis jetzt noch in keinem Beispiel effektiv ausgerechnet. Dies hat folgenden Grund: Die direkte Berechnung des Integrals als Grenzwert von Riemannschen Summen ist im allgemeinen sehr aufwendig. In Kapitel 11 werden wir einen indirekten, aber viel einfacheren Weg kennenlernen. Wir wollen nun aber doch ein Beispiel zur direkten Bestimmung eines Integrals geben. Dieses soll einerseits zeigen, wie eine solche Grenzwertberechnung aussehen kann, und vor allem soll es darlegen, wieviel einfacher die Rechnung mit der in Kapitel 11 vorzustellenden Methode wird. Dabei werden wir die folgende Formel f¨ ur die Summe der ersten n Quadratzahlen gebrauchen, die man einer Formelsammlung entnimmt (oder mit vollst¨ andiger Induktion beweist): (∗)
1 2 + 22 + . . . + n 2 =
1 1 n(n + 1)(2n + 1) = (2n3 + 3n2 + n) . 6 6
Wir betrachten nun die Quadratfunktion f : [0, b] → R, f (x) = x2 . F¨ ur jede nat¨ urliche Zahl n unterteilen wir [0, b] in n gleich grosse Intervalle:
0 = x0 x1
x2
x3
xi−1
xi
xn = b
ib b ib (i = 0, . . . , n) und Δxi = . F¨ ur die Zwischenpunkte w¨ ahlen wir ξi = xi = . Nun n n n berechnen wir die zugeh¨ orige Riemannsche Summe: Es ist also xi =
Sn =
n i=1
f (ξi )Δxi =
n 2 ib i=1
n
·
n b b3 2 i . = 3 n n i=1
150
10. Das bestimmte Integral
Wegen der Formel (∗) ergibt sich
y b3 1 3 1 b3 Sn = 3 (2n3 + 3n2 + n) = (2 + + 2 ) . n 6 6 n n F¨ ur immer feiner werdende Unterteilungen (n → ∞) erhalten wir b 0
x2 dx = lim Sn = n→∞
b3 b3 2= . 6 3
Damit ist dieses Integral berechnet. Geometrisch handelt es sich um die Fl¨ ache des schraffierten Fl¨ achenst¨ ucks, siehe (9.4). Die Bemerkung am Schluss von (10.3) garantiert uns, dass wir f¨ ur jede beliebige Wahl der Unterteilungen und Zwischenpunkte denselben b3 erhalten. Grenzwert der Riemannschen Summen, n¨ amlich 3
0
b
x
(10.8) Einige Rechenregeln f¨ ur das bestimmte Integral a) Summen, Differenzen, Vielfache F¨ ur das bestimmte Integral gelten folgende Regeln b b b (f (x) ± g(x)) dx = f (x) dx ± g(x) dx (1)
a
a
b
cf (x) dx = c
(2)
a
b
f (x) dx .
a
a
Die Regel (2) beispielsweise wird so begr¨ undet: b n cf (x) dx = lim cf (ξi )Δxi Δx i → 0
a
= =
lim
Δx i → 0
c
lim
i=1 n
c
Δxi →0
i=1 n
f (ξi )Δxi b f (ξi )Δxi = c
i=1
f (x) dx . a
Wir werden diese beiden Regeln in (12.5) wieder antreffen.
b) Vertauschen der Integrationsgrenzen b Das Integral a f (x) dx war unter der ausdr¨ ucklichen Voraussetzung definiert worden, ¨ dass a < b ist. F¨ ur a ≥ b definiert man in weitgehender Ubereinstimmung mit der anschaulichen Vorstellung: a (3) f (x) dx = 0
a b
(4) a
a
f (x) dx = −
f (x) dx
f¨ ur b < a .
b
(Vertauschen der Integrationsgrenzen a¨ndert das Vorzeichen!)
uckweise stetige Funktionen 10.9 St¨
151
c) Zerlegung des Intervalls Es sei c ∈ [a, b]. Dann gilt c b f (x) dx = f (x) dx + (5) a
a
b
f (x) dx . c
Betrachtet man den Spezialfall, wo das Integral einen Fl¨acheninhalt darstellt, so ist das Resultat geometrisch klar (man kann es aber auch rein rechnerisch beweisen):
f
a
c
b
Im u ¨brigen gilt die obige Formel auch f¨ ur beliebige Anordnungen von a, b, c; also z.B. f¨ ur c < b < a etc. Der Beweis wird durch Untersuchung der verschiedenen m¨oglichen F¨alle erbracht. (10.9) St¨ uckweise stetige Funktionen Zum Schluss sei noch erw¨ ahnt, dass das bestimmte Integral auch f¨ ur gewisse nicht-stetige Funktionen definiert werden kann. F¨ ur die Praxis von Bedeutung sind hier allenfalls noch die sogenannten st¨ uckweise stetigen Funktionen. Die Funktion f : [a, b] → R heisst st¨ uckweise stetig, wenn es eine Unterteilung U von [a, b] gibt, derart, dass f auf jedem offenen Teilintervall (xi−1 , xi ) stetig ist. Die auf (xi−1 , xi ) eingeschr¨ ankte Funktion sei mit fi bezeichnet.
f1
f3
f4
f2
a = x0
x1
x2
x3
x4 = b
¨ Uber die Funktionswerte in den Teilpunkten xi wird nichts vorausgesetzt. Es sollen jedoch in diesen Teilpunkten die einseitigen Limites von f (3.6.d) existieren. F¨ ur das Integral einer solchen Funktion gilt dann erwartungsgem¨ ass x1
b f (x) dx = a
x0
x2 f1 (x) dx +
x1
xn f2 (x) dx + . . . +
xn−1
fn (x) dx ,
10. Das bestimmte Integral
152
ur die einzelnen Integranden noch wobei f¨ fi (xi−1 ) =
lim
x↓xi−1
fi (x), fi (xi ) = lim fi (x) x↑xi
gesetzt werden muss, damit fi auch in den Randpunkten von [xi−1 , xi ] definiert und in diesem Intervall ¨berall stetig ist. Wir verzichten auf weitere Details. u
(10.∞) Aufgaben In den Aufgaben 10−1 bis 10−8 geht es noch nicht darum, Integrale effektiv auszurechnen. Vielmehr soll das Integral dazu benutzt werden, gewisse Sachverhalte formelm¨ assig zu erfassen. h z
10−1 In einem zylindrischen Gef¨ ass mit Querschnitt Q ist bis zur H¨ ohe h eine Emulsion eingef¨ ullt, in welcher Teilchen einer bestimmten Substanz schweben. Dabei h¨ angt die Dichte ρ der Emulsion von der H¨ ohe z u ¨ber dem Gef¨ assboden ab: ρ = ρ(z) (die Dichte wird in vielen F¨ allen mit zunehmender H¨ ohe z abnehmen, doch spielt die Gestalt der Funktion ρ(z) hier keine Rolle). Dr¨ ucken Sie die Gesamtmasse der Emulsion mittels eines Integrals aus.
0 Q(z) h z
10−2 Das zylindrische Gef¨ ass von Aufgabe 10−1 wird durch ein solches mit (von der H¨ ohe z abh¨ angigem) variablem Querschnitt Q = Q(z) ersetzt, also z.B. durch einen Erlenmeyerkolben. Wie lautet die Formel f¨ ur die Gesamtmasse jetzt?
0
10−3 In einem Fitness-Center stehen Maschinen, an denen man sich mittels Laufen, Rudern oder dergleichen ert¨ uchtigen kann. Zu jedem Zeitpunkt t wird auf einem Display die momentan erbrachte Leistung P (t) angegeben. Am Schluss, z.B. nach 6 Minuten, wird der “totale Kalorienverbrauch T ” angezeigt. Was ist unter dem “totalen Kalorienverbrauch” genau zu verstehen? Wie k¨ onnen Sie die Zahl T formelm¨ assig ausdr¨ ucken? 10−4 Ein Sandsack wird von einem Kran von der H¨ ohe h0 auf die H¨ ohe h1 gehoben. Da er ein Loch hat, nimmt seine Masse m w¨ ahrend des Hochhebens ab, ist also eine Funktion m(h) der H¨ ohe h. Dr¨ ucken Sie die geleistete Arbeit mit Hilfe eines Integrals aus. z ¨ 10−5 Es sei f (x) ≥ 0 f¨ ur x ∈ [a, b]. Uber dem von f und −f begrenzten Gebiet der x-y–Ebene wird ein K¨ orper errichtet derart, dass jede Querschnittsfl¨ ache (normal zur x– a y Achse) ein gleichseitiges Dreieck ist. Dr¨ ucken Sie das Vof lumen des K¨ orpers mit einem bestimmten Integral aus. x b 10−6 Eine ebene Kurve kann auch dadurch gegeben werden, y P dass der Abstand r des Punktes P vom Nullpunkt O als Funktion des Winkels ϕ gegeben wird: r = r(ϕ) (Darstellung der Kurve in “Polarkoordinaten”). Dr¨ ucken Sie in dieser Situation den Inhalt A des schraffierten Fl¨ achenst¨ ucks durch ein Integral aus.
r
ϕ α x β 10−7 Es seien f, g : [a, b] → R zwei Funktionen mit f (x) ≥ g(x) f¨ ur alle O x ∈ [a, b]. Welche anschauliche Bedeutung hat die Zahl ab (f (x) − g(x)) dx? 10−8 Die Leistung L eines Brunnens wird in Litern pro Minute gemessen. Wir nehmen an, sie sei zeitabh¨ angig, L = L(t) (Zeit t in Minuten). Welche anschauliche Bedeutung hat die Zahl t1 L(t) dt, (t1 > t0 )? t0
10.∞ Aufgaben
153
Die Aufgaben 10−9 und 10−10 handeln von der Berechnung eines Integrals ohne Verwendung des Hauptsatzes, vgl. (10.7). Die Aufgabe soll Ihnen erneut vor Augen f¨ uhren, dass schon in einfachen uhsam sein kann. So werden Sie es nachher nie mehr machen! F¨ allen diese direkte Berechnung recht m¨ 10−9 Berechnen Sie ab c dx (a < b; c eine Konstante) als Grenzwert von Riemannschen Summen. 10−10 Berechnen Sie 01 x dx als Limes von Riemannschen Summen. Benutzen Sie dabei die Formel 1 + 2 + 3 + . . . + n = n(n + 1)/2.
154
11. DER HAUPTSATZ DER DIFFERENTIALUND INTEGRALRECHNUNG
¨ (11.1) Uberblick Der Hauptsatz der Differential - und Integral rechnung lautet:
b
f (x) dx = F (b) − F (a) .
(11.4)
a
Dabei ist F eine Stammfunktion von f , d.h., eine Funktion, deren Ableitung gleich f ist (F = f ).
(11.3)
Mit diesem Satz wird die Berechnung des bestimmten Integrals auf das Aufsuchen von Stammfunktionen, also auf die Umkehrung des Differenzierens zur¨ uckgef¨ uhrt, was praktisch die exakte Berechnung u ¨berhaupt erst erm¨ oglicht. Der Schl¨ ussel zum Geheimnis liegt in der Idee, das bestimmte Integral als Funktion der oberen Grenze zu betrachten.
(11.2)
(11.2) Das bestimmte Integral als Funktion der oberen Grenze Hier und im folgenden bezeichnet I ein beliebiges (offenes, abgeschlossenes etc.) Intervall. Wir betrachten eine stetige Funktion f :I→R und w¨ahlen ein festes a ∈ I. F¨ ur jedes x ∈ I ist dann das bestimmte Integral
x
f (t) dt a
im Sinne von (10.2) definiert. Auf diese Weise erhalten wir eine neue Funktion Φ:I→R,
x
Φ(x) =
f (t) dt . a
11.2 Das bestimmte Integral als Funktion der oberen Grenze
155
Wenn f (x) ≥ 0 ist, so hat Φ(x) eine einfache geometrische Bedeutung als Inhalt ucks: des schraffierten Fl¨ achenst¨ f
a
x
Dies gilt jedenfalls f¨ ur x > a; gem¨ ass (10.8) ist Φ(a) = 0 (“geschrumpfter” Fl¨ acheninhalt), und f¨ ur x < a ist Φ(x) der negative Fl¨ acheninhalt.
Selbstverst¨ andlich sind auch andere Interpretationen m¨ oglich. Ist beispielsweise f (t) eine vom Ort t abh¨ angige Kraft, so ist Φ(x) die entlang der Wegstrecke von a bis x geleistete Arbeit (vgl. (9.3)). Bemerkungen a) Da der Buchstabe x in der oberen Grenze des Integrals vorkommt, sollten wir x nicht auch noch als Integrationsvariable w¨ ahlen. Hier sind wir aber ohnehin frei in der Wahl der Bezeichnung (10.4.b) und d¨ urfen deshalb den Buchstaben t verwenden. b) Es soll uns nicht k¨ ummern, dass die Berechnung des Integrals als Grenzwert Riemannscher Summen und damit der Funktionswerte Φ(x) sehr kompliziert sein kann. Die Hauptsache ist, dass wir mit Φ(x) theoretisch arbeiten k¨ onnen. c) In (10.7) haben wir gesehen, dass gilt: b 0
x2 dx =
b3 . 3
Nach einer Umbezeichnung erhalten wir in diesem speziellen Fall eine Formel f¨ ur die Funktion Φ, n¨ amlich x x3 Φ(x) = . t2 dt = 3 0
F¨ ur die so definierte Funktion Φ gilt nun die folgende a¨usserst wichtige Tatsache: Tatsache (I):
Φ ist auf I differenzierbar und es ist Φ (x) = f (x) f¨ ur alle x ∈ I .
Das bisher einzige Beispiel eines Integrals, f¨ ur welches wir einen formelm¨ assigen Ausdruck kennen, ist in Bemerkung c) erw¨ ahnt. Hier ist f (x) = x2 , Φ(x) = x3 /3, und in der Tat ist hier Φ (x) = f (x). Dies best¨ atigt die Tatsache (I).
Wir geben jetzt eine anschauliche Begr¨ undung f¨ ur die Tatsache (I), wobei wir einfachheitshalber f (x) ≥ 0 voraussetzen. Gem¨ass Definition der Ableitung (4.2) m¨ ussen wir den folgenden Grenzwert untersuchen: lim
h→0
Φ(x + h) − Φ(x) . h
11. Der Hauptsatz der Differential- und Integralrechnung
156
uhrt auf Dabei nehmen wir an, es sei h > 0. Der Fall h < 0 wird analog behandelt und f¨ dasselbe Resultat. Nun ist x x+h Φ(x) = f (t) dt , f (t) dt , Φ(x + h) = a
a
d.h. Φ(x + h) − Φ(x) ist der Fl¨acheninhalt des in der Skizze dick umrandeten Fl¨achenst¨ uckes. f
a
x
x+h
Geometrisch ist klar, dass es im Intervall [x, x + h] (mindestens) einen Punkt ξ gibt mit der Eigenschaft, dass das erw¨ahnte Fl¨ achenst¨ uck denselben Inhalt hat wie das Rechteck mit Breite h und H¨ ohe f (ξ):
x
ξ
x+h
In Formeln: Φ(x + h) − Φ(x) = f (ξ)h . Es folgt
Φ(x + h) − Φ(x) f (ξ)h = lim = lim f (ξ) . h→0 h→0 h→0 h h Da aber ξ zwischen x und x + h liegt, strebt mit h → 0 auch ξ → x und damit f (ξ) → f (x). (Dies, weil f stetig ist.) lim
Fassen wir alles zusammen, so erhalten wir lim
h→0
Φ(x + h) − Φ(x) = f (x) h
oder
Φ (x) = f (x) ,
¨ was zu zeigen war. (Unsere Uberlegung st¨ utzt sich auf die geometrische Interpretation des Integrals als Fl¨ acheninhalt. Es gibt auch rein rechnerische Beweise, die aber u ¨ber den Rahmen dieser Vorlesung hinausgehen.)
11.3 Stammfunktionen
157
(11.3) Stammfunktionen Wir kn¨ upfen an die Tatsache (I) von (11.2) an und f¨ uhren einen neuen wichtigen Begriff ein: Es sei f : I → R eine Funktion. Unter einer Stammfunktion (engl antiderivative, primitive function, primitive integral or indefinite integral) von f versteht man eine Funktion F , f¨ ur die gilt: F (x) = f (x)
f¨ ur alle
x∈I.
Die Tatsache (I) kann nun auch so formuliert werden: Wenn f stetig ist, so ist die durch x f (t)dt Φ(x) = a
gegebene Funktion Φ eine Stammfunktion von f . Somit hat jede stetige Funktion f (mindestens) eine Stammfunktion, n¨amlich Φ. Da aber die direkte Berechnung eines bestimmten Integrals i.a. grosse M¨ uhe macht, ist dies zun¨ achst nur von theoretischem Interesse. Der entscheidende Punkt ist nun aber der, dass man das Problem auch umgekehrt betrachten kann. In vielen F¨allen kann man n¨ amlich ganz direkt eine Stammfunktion angeben, indem man einfach die Ableitungsregeln umkehrt. So ist z.B. F (x) = sin x eine Stammfunktion von f (x) = cos x (denn F (x) = (sin x) = cos x = f (x)), G(x) = x2 eine Stammfunktion von g(x) = 2x (denn G (x) = (x2 ) = 2x = g(x)) etc. Diesen Sachverhalt kann man jetzt verwenden, um bestimmte Integrale unter Verwendung von auf irgendeine Weise direkt gefundenen Stammfunktionen zu berechnen. ¨ Wir werden die Uberlegungen anhand des ersten Beispiels weiterf¨ uhren. Aus der allgemeinen Theorie wissen wir, dass x Φ(x) = cos t dt a
eine Stammfunktion von f (x) = cos x ist. Anderseits haben wir direkt eingesehen, dass F (x) = sin x ebenfalls eine Stammfunktion von cos x ist. Wenn wir nun schliessen d¨ urften, dass diese beiden Stammfunktionen Φ und F gleich w¨aren, dass also x b cos t dt = sin x oder speziell cos t dt = sin b a
a
w¨ are, dann h¨ atten wir ein — bisher so unzug¨angliches — Integral auf einfachste Weise ¨ berechnet. Leider ist diese Uberlegung nicht ganz richtig (doch tr¨osten Sie sich: Es ist noch nicht alles verloren!).
11. Der Hauptsatz der Differential- und Integralrechnung
158
Der Grund daf¨ uhrte Betrachtung nicht korrekt ist, liegt ur, dass die eben durchgef¨ darin, dass eine stetige Funktion stets unendlich viele Stammfunktionen hat. Es gilt n¨amlich: Tatsache (II): Wenn F (x) eine Stammfunktion von f (x) ist, dann ist auch F (x) + C f¨ ur jede reelle Zahl C eine Stammfunktion von f (x). Dies folgt einfach daraus, dass jede konstante Funktion die Ableitung 0 hat. Deshalb ist in der Tat (F (x) + C) = F (x) = f (x). Von dieser Feststellung gilt aber auch die Umkehrung: Tatsache (III): Es seien F1 (x) und F2 (x) Stammfunktionen von f (x). Dann gilt F1 (x)−F2 (x) = C (f¨ ur alle x) f¨ ur eine geeignete Konstante C, oder, anders geschrieben: F1 (x) = F2 (x) + C. Dies sieht man wie folgt ein: Es ist F1 (x) = f (x), F2 (x) = f (x) nach Voraussetzung, und somit gilt f¨ ur alle x aus I, dem Definitionsbereich von f : (F1 (x) − F2 (x)) = F1 (x) − F2 (x) = f (x) − f (x) = 0 . Von (6.3.c) her wissen wir aber, dass eine Funktion, deren Ableitung auf ganz I gleich 0 ist, eine Konstante sein muss. Es ist also F1 (x) − F2 (x) = C, was zu zeigen war. Nun betrachten wir unser Beispiel von vorher nochmals mit neuem Mut. Wir d¨ urfen zwar nicht schliessen, dass die beiden Stammfunktionen Φ(x) und sin x von f (x) = cos x gleich sind. Wohl aber gilt, dass sie sich bloss um eine Konstante unterscheiden. Es gibt also eine Zahl C mit x Φ(x) = cos t dt = sin x + C . a
Wie l¨ asst sich dieses C nun bestimmen? Setzen wir x = a, so wird a Φ(a) = cos t dt = 0 = sin a + C a
und wir finden C = − sin a . F¨ ur alle x gilt also
x
cos t dt = sin x − sin a
a
und speziell (mit x = b)
b a
cos t dt = sin b − sin a .
11.3 Stammfunktionen
159
Noch spezieller haben wir zum Beispiel das Resultat
π/2
cos t dt = sin 0
π − sin 0 = 1 . 2
Dies ist nun wirklich ein Erfolg! Wir haben ein bestimmtes Integral, dessen Definition (mit Riemannschen Summen) so kompliziert war, auf ganz einfache Weise berechnen k¨onnen. y 1 y = cos x Interpretieren wir die letzte Formel geometrisch, so sehen wir, dass der Inhalt der schraffierten Fl¨ ache unter der Cosinus-Kurve = 1 ist! π/2 Um den Erfolg noch etwas auszukosten, probieren wir das Verfahren gleich nochmals aus: Zu berechnen sei b x2 dx . a
Es ist leicht, eine Stammfunktion von f (x) = x2 zu erraten: F (x) = 13 x3 hat gerade ¨ die Ableitung f (x) = x2 . Nach den schon einmal gemachten Uberlegungen muss also gelten: x 1 t2 dt = x3 + C f¨ ur alle x ∈ I . 3 a F¨ ur x = a steht links 0, rechts 13 a3 + C, woraus C = − 13 a3 folgt. Wir finden demzufolge
x
t2 dt =
1 3 1 3 x − a 3 3
t2 dt =
1 3 1 3 b − a . 3 3
a
und speziell (setze x = b)
b a
Setzen wir a = 0 (und wechseln wir noch die Integrationsvariable), so erhalten wir das in (10.7) mit einem m¨ uhsamen Grenz¨ ubergang gefundene Ergebnis zur¨ uck:
b 0
x2 dx =
1 3 b . 3
Nach diesen Beispielen dr¨ angt sich die Verallgemeinerung auf beliebige Funktionen geradezu auf.
x
11. Der Hauptsatz der Differential- und Integralrechnung
160
(11.4) Der Hauptsatz der Differential- und Integralrechnung Das folgende Resultat ist f¨ ur die Berechnung von Integralen ¨ausserst wichtig. Der Hauptsatz der Differential- und Integralrechnung: Die Funktion f sei auf dem Intervall I definiert und stetig. Ferner sei F eine beliebige Stammfunktion von f . Dann gilt f¨ ur alle a, b ∈ I:
b
f (x) dx = F (b) − F (a) .
a
¨ Der Beweis dieses Satzes folgt den bereits angestellten Uberlegungen: Nach der “Tatx sache (I)” von (11.2) ist Φ(x) = a f (t) dt eine Stammfunktion von f (x). Wegen der “Tatsache (III)” von (11.3) unterscheiden sich also Φ und F nur um eine Konstante C:
x
f (t) dt = F (x) + C
f¨ ur alle
x∈I.
a
Da Φ(a) = 0 ist, gilt F (a) + C = 0, d.h. C = −F (a). F¨ ur x = b erh¨ alt man
b
f (t) dt = F (b) − F (a) .
a
Abgesehen von der (unwesentlichen) Bezeichnung der Integrationsvariablen ist dies gerade die Behauptung des Satzes. Es sei noch betont, dass die Formel des Hauptsatzes sowohl f¨ ur a < b als auch f¨ ur a > b (und trivialerweise f¨ ur a = b) gilt. Beachten Sie, dass der Hauptsatz eine enge Beziehung zwischen der Ableitung und dem Integral herstellt, eine Beziehung, die a priori nicht auf der Hand liegt (deshalb engl antiderivative). F¨ ur die oft vorkommende Differenz F (b) − F (a) gebraucht man oft die Abk¨ urzung b b F (b) − F (a) = F (x) oder auch F (x) . a
Beispielsweise ist
b x 2 = b2 − a 2 . a
a
11.∞ Aufgaben
161
achsten Kapitel werden wir den Hauptsatz systematisch anwenden. Zum Im n¨ Schluss geben wir noch ein ganz einfaches Beispiel, in welchem zudem eine Bezeichb nung erl¨autert wird. Wir betrachten die konstante Funktion f (x) = 1. Statt a 1 dx b schreibt man einfach a dx. Weil F (x) = x offensichtlich eine Stammfunktion von f (x) ist, erhalten wir b b dx = x = b − a . a
a
Geometrisch ist dies der Fl¨acheninhalt des Rechtecks mit H¨ohe 1 u ¨ber dem Intervall mit den Grenzen a und b (falls a < b ist; andernfalls ist b − a < 0, und wir bekommen acheninhalt). den negativen Fl¨ y 1
x a
b
(11.∞) Aufgaben 11−1 Erraten Sie jeweils eine Stammfunktion des Integranden, und berechnen Sie den Wert der folgenden Integrale: 2 π 1 a) x3 dx, b) sin α dα, c) et dt. 0
−1
0
11−2 Berechnen Sie die folgenden Ableitungen: a)
d dx
x 0
t3 + 1 dt,
b)
1 d sin(t2 ) dt, dx x
c)
d dx
x2 f (t) dt. 0
162
12. STAMMFUNKTIONEN UND DAS UNBESTIMMTE INTEGRAL ¨ (12.1) Uberblick Mit dem Hauptsatz der Differential- und Integralrechnung f¨ uhrt man die Berechnung von bestimmten Integralen auf das Auffinden von Stammfunktionen zur¨ uck. F¨ ur eine Stammfunktion von f (x) schreibt man auch
(11.4)
f (x) dx und nennt diesen Ausdruck ein unbestimmtes Integral.
(12.7)
In diesem Kapitel werden die technischen Grundlagen zum Integrieren geliefert und an Beispielen illustriert.
(12.4), (12.5) (12.6)
(12.2) Rekapitulation Wir wiederholen die wichtigsten Ergebnisse von Kapitel 11. Dabei bezeichnet I weiterhin ein beliebiges Intervall. • Die Funktion F heisst eine Stammfunktion von f : I → R, wenn F (x) = f (x) ist, f¨ ur alle x ∈ I. • Zwei Stammfunktionen von f : I → R unterscheiden sich nur um eine additive Konstante. • Es gilt der Hauptsatz: Wenn F eine Stammfunktion von f ist, dann ist
b
f (x) dx = F (b) − F (a) .
a
Es ist nun klar, dass wir uns u ¨ berlegen m¨ ussen, wie man Stammfunktionen effektiv finden kann. Der Prozess des Aufsuchens von Stammfunktion wird oft kurz “Integrieren” genannt.
163
12.3 Diskussion einiger Stammfunktionen
(12.3) Diskussion einiger Stammfunktionen Der einfachste Weg, Stammfunktionen zu erhalten, besteht offenbar darin, eine Liste der abgeleiteten Funktionen in der umgekehrten Richtung zu lesen. Wir illustrieren diesen Sachverhalt anhand eines Auszugs aus der Tabelle (5.3): Funktion −−−−−−−−−−→ Ableitung Stammfunktion ←−−−−−− Funktion x x
1
2
2x
xr
rxr−1 (r ∈ R)
ex
ex
ln x
1/x
sin x
cos x
tan x
1 + tan2 x
Bemerkungen a) F (x) = x2 ist also eine Stammfunktion von f (x) = 2x. Nat¨ urlich h¨atte man eigentlich lieber eine Stammfunktion von g(x) = x. Diese ist aber sehr einfach zu finden, denn G(x) = x2 /2 hat gerade die Ableitung G (x) = x. b) Ganz entsprechend ist f¨ ur r = −1 xr+1 r+1
eine Stammfunktion von
xr ,
wie man durch Ableiten kontrolliert. c) Da wir in b) durch r + 1 dividierten, gilt die dort gemachte Aussage nur f¨ ur r = −1. Was passiert nun aber f¨ ur r = −1, anders gefragt, welche Funktion ist eine Stammfunktion von x−1 = 1/x? Ein Blick auf die obige Tabelle zeigt, dass ln x eine solche ist, denn die Ableitung von ln x ist ja 1/x. Hier tritt nun aber noch ein weiteres kleines Problem auf: Die Funktion ln x ist nur f¨ ur x > 0 definiert, w¨ ahrend 1/x f¨ ur alle x = 0 definiert ist. Die Funktion ln x ist also nur im Intervall (0, ∞) eine Stammfunktion von 1/x. Zum Gl¨ uck kann man sich auch f¨ ur x < 0 retten, denn es gilt:
12. Stammfunktionen und das unbestimmte Integral
164
Die Ableitung von ln |x| ist gleich 1/x f¨ ur alle x = 0, d.h., ln |x| ist eine Stammfunktion von 1/x f¨ ur alle x = 0. ur x < 0 ist ur x > 0 ist wegen |x| = x alles klar. F¨ Diese Behauptung wird so bewiesen: F¨ ln |x| = ln(−x) und die Kettenregel liefert (ln(−x)) = −
1 1 = , −x x
was noch zu zeigen war.
d) Die Tabelle enth¨alt in der Kolonne rechts auch Funktionen, von denen man wohl eher selten eine Stammfunktion braucht, wie etwa 1 + tan2 x, die tan x als Stamm√ funktion hat. Anderseits vermisst man viel einfachere Funktionen, wie z.B. 1 − x2 oder ln x. Man schliesst daraus, dass es nicht gen¨ ugt, einfach die Ableitungsregeln umzukehren. Vielmehr wird man sich noch raffiniertere Methoden einfallen lassen m¨ ussen. Wir kommen in Kapitel 13 darauf zur¨ uck. e) Es kann auch vorkommen, dass ganz harmlos aussehende Funktionen keine elementare Stammfunktion haben. Unter einer elementaren Funktion versteht man ja bekanntlich eine Funktion, die sich aus den in Tabelle (5.3) aufgelisteten Funktionen gem¨ass (5.6) kombinieren l¨asst. Ein konkretes Beispiel f¨ ur diese Erscheinung −x2 ist z.B. die Funktion f (x) = e . Man kann zeigen, dass es keine im obigen Sinne 2 elementare Funktion F (x) gibt, deren Ableitung gleich e−x ist. Dies heisst aber nicht, dass f (x) u ¨berhaupt keine Stammfunktion hat, vielmehr ist gem¨ass (11.2) die Funktion x 2 F (x) = e−t dt 0
eine Stammfunktion von f (x), allerdings eben keine elementare. Die Frage, welche Funktionen man als “elementar” bezeichnet, ist nat¨ urlich eine Sache der Konventionen. W¨ urden wir n¨ amlich etwa den Logarithmus nicht kennen oder aus irgendeinem Grund 1 eine elementare nicht als “elementar” betrachten, so h¨ atte nicht einmal die Funktion f (x) = x Stammfunktion!
f) Es kann also unter Umst¨anden schwierig oder sogar unm¨oglich sein, eine formelm¨assige Stammfunktion zu finden. Eines aber geht immer (und ist in komplizierteren F¨allen sehr zu empfehlen): Man kann das Ergebnis durch Ableiten kontrollieren. So ist z.B. x ln x − x eine Stammfunktion von ln x, denn (x ln x − x) = ln x. (Nicht beantwortet bleibt vorerst die Frage, wie man u ¨berhaupt einmal auf diese Stammfunktion kommt; vgl. aber (13.6.3).) g) In (12.4) und (12.5) stellen wir die grundlegenden Formeln und Regeln zum Integrieren zusammen. In Kapitel 13 werden wir dann einige weitere Integrationsmethoden und eine Tabelle von Stammfunktionen angeben.
12.5 Integrationsregeln
165
(12.4) Eine erste Liste von Stammfunktionen Aufgrund der verschiedenen in (12.3) gemachten Bemerkungen k¨onnen wir die oben aufgestellte Tabelle f¨ ur den praktischen Gebrauch verbessern: Funktion f (x)
Eine Stammfunktion F (x)
a
ax xr+1 r+1 ln |x|
(r = −1) 1 x ex
xr
ex
sin x
− cos x
cos x 1 √ 1 − x2 1 1 + x2
sin x arcsin x arctan x
Die Funktionen arcsin und arctan werden erst sp¨ater eingef¨ uhrt (Kapitel 17), sind aber der Vollst¨ andigkeit halber bereits jetzt angegeben. Es sei betont, dass die letzten vier Formeln nur gelten, wenn das Bogenmass verwendet wird. Wichtig ist die Tatsache, dass eine Stammfunktion nur bis auf eine additive Konstante bestimmt ist. Man schreibt deshalb zur Verdeutlichung oft F (x) + C,
also z.B.
ln |x| + C
usw.
In der obigen Tabelle wurde darauf verzichtet. In manchen Anwendungen darf diese sogenannte Integrationskonstante keinesfalls vergessen werden, z.B. bei Differentialgleichungen (Kapitel 16), in andern ist sie nicht n¨otig, z.B. bei der Anwendung des Hauptsatzes (11.4), da dort F eine beliebige Stammfunktion sein kann. (12.5) Integrationsregeln Die Tabelle in (12.4) ist durch Umkehrung der Ableitungsformeln (5.3) zustande gekommen. Auch die Ableitungsregeln von (5.2) liefern anders interpretiert Integrationsregeln. Da die Ableitung einer Summe gleich der Summe der Ableitungen ist, ist die Stammfunktion einer Summe gleich der Summe der Stammfunktionen. Im einzelnen erhalten wir auf diese Weise:
12. Stammfunktionen und das unbestimmte Integral
166
Es seien F (x) bzw. G(x) Stammfunktionen von f (x) bzw. von g(x). Dann gilt (1) F (x) + G(x) ist eine Stammfunktion von f (x) + g(x). (2) F (x) − G(x) ist eine Stammfunktion von f (x) − g(x). (3) cF (x) ist eine Stammfunktion von cf (x). Wendet man diese Regeln auf die Berechnung von Integralen mittels des Hauptsatzes an, so erh¨alt man die schon in (10.8) erw¨ahnten Formeln b b cf (x) dx = c f (x) dx
b
a
a b
f (x) ± g(x) dx =
a
b
f (x) dx ±
a
g(x) dx . a
Als Warnung sei noch erw¨ahnt, dass es keine entsprechende Formel f¨ ur das Produkt b f (x)g(x) dx a
gibt. (12.6) Beispiele Die folgenden Beispiele illustrieren zwei Dinge, n¨ amlich einerseits verschiedene Anwendungen des Integralbegriffs (vgl. Kapitel 9 sowie (10.5) und (10.6)) und anderseits die konkrete Berechnung von Integralen unter Verwendung des Hauptsatzes (11.4) und der Regeln (12.4) und (12.5). 2 (2x2 + 3x − 1) dx. 1. Gesucht ist 1
Wir suchen zun¨ achst eine Stammfunktion F (x) von f (x) = 2x2 + 3x − 1. Nach (12.4) und Regel (3) von (12.5) gilt: • x3 /3 ist eine Stammfunktion von x2 , und daher ist 2x3 /3 eine solche von 2x2 . • x2 /2 ist eine Stammfunktion von x, und daher ist 3x2 /2 eine solche von 3x. • x ist eine Stammfunktion von 1. Nach (12.5), Regeln (1) und (2), ist dann F (x) =
2x3 3x2 + −x 3 2
eine Stammfunktion von f . Der Hauptsatz liefert (unter Verwendung der Bezeichnungsweise von (11.4)): 2 2 16 2 3 49 (2x2 + 3x − 1) dx = F (x) = +6−2 − + −1 = . 3 3 2 6 1 1
12.6 Beispiele
167
G(x) = 2x3 /3 + 3x2 /2 − x + 3 ist ebenfalls eine Stammfunktion von f (x), doch bei der Berechnung onnte nat¨ von G(2) − G(1) hebt sich die Zahl 3 einfach weg. (Statt 3 k¨ urlich irgendeine Konstante C stehen.) Dies belegt die Bemerkung am Schluss von (12.4).
2. Berechne
4 √ 1
t+
3 dt. t2
√ 1 Wir m¨ ussen Stammfunktionen von t und von 2 finden. Dazu schreiben wir diese t Ausdr¨ ucke als Potenzen: 3 √ t2 2√ 3 1 • t = t 2 : Eine Stammfunktion ist 3 = t . 3 2 t−1 1 1 −2 = t : Eine Stammfunktion ist =− . 2 t −1 t Wir erhalten •
4 √ 1
4 2 83 2√ 3 3 3 2 3 t + 2 dt = t − 8− − −3 = . = t 3 t 3 4 3 12
1
1 3. Gesucht ist der Inhalt der Fl¨ache unter der durch y = im Intervall [1, 2] gegebenen x Kurve. y Da im angegebenen Intervall y = f (x) ≥ 0 ist, ist der gesuchte Fl¨ acheninhalt gegeben durch 2 f (x) dx. 1
Der Tabelle (12.4) entnehmen wir eine Stammfunktion F (x) von f (x) = 1/x, n¨ amlich F (x) = ln |x|. Es folgt
2
2
f (x) dx = 1
1
1
0
x
2
2 dx = ln |x| = ln 2 − ln 1 = ln 2 = 0.6931 . x 1
Ersetzen wir das Intervall [1, 2] durch [−2, −1], so erhalten wir −1 −1 −1 dx = ln |x| f (x) dx = x −2 −2 −2 = ln | − 1| − ln | − 2| = ln 1 − ln 2 = −0.6931. Das negative Vorzeichen kommt daher, dass das Kurvenst¨ uck unterhalb der x–Achse liegt. Eine ganz a¨hnliche Erscheinung zeigt sich im n¨achsten Beispiel.
y −2
−1
x
12. Stammfunktionen und das unbestimmte Integral
168
4. Wie schon mehrfach betont, ist die Interpretation des Integrals als Fl¨ acheninhalt unter einer Kurve nur zul¨assig, wenn f (x) ≥ 0 ist. Hierzu eine Illustration mit f (x) = sin x. π/2 π/2 sin x dx = − cos x −π/2 −π/2 = − cos π/2 − − cos(−π/2) = 0.
y
−π/2 π/2
Das Ergebnis 0 erkl¨ art sich dadurch, dass das Integral f¨ ur das unterhalb der x–Achse liegende Fl¨ achenst¨ uck einen negativen Fl¨ acheninhalt liefert. Im vorliegenden Fall heben sich die beiden Teile gerade auf.
5. Ausdehnungsarbeit eines Gases In einem Zylinder der Grundfl¨ache A befindet sich ein Gas, das durch einen beweglichen Kolben komprimiert wird. Der Gasdruck h¨angt nat¨ urlich vom Abstand x des Kolbens zum Zylinderboden ab. Wenn der Gasdruck an der Stelle x gleich p(x) ist, dann wirkt auf den Kolben die Kraft F (x) = A · p(x). Wird nun der Kolben von a nach b bewegt, so leistet das Gas nach (9.3) die Arbeit
0
a
x
b
b
W =
Ap(x) dx . a
Als Spezialfall betrachten wir die isotherme Ausdehnung eines idealen Gases (Gesetz von Boyle-Mariotte). Hier gilt die Beziehung p(x)V (x) = C (C eine Konstante), wo V (x) das jeweilige Volumen des Gases ist. In unserm Fall ist V (x) = Ax, und es gilt C C C p(x) = = und daher Ap(x) = . V (x) Ax x Es folgt
b
W =
b
Ap(x) dx = a
a
b b C dx = C ln |x| = C ln , x a a
wobei am Schluss noch eine Rechenregel f¨ ur den Logarithmus, n¨ amlich ln b − ln a = ln(b/a), benutzt wurde.
x
12.6 Beispiele
169
6. Volumen eines Rotationsellipsoides Die Ellipse mit den Halbachsen a und b ist bekanntlich durch die Gleichung
y b
y2 x2 + =1 a2 b2
−a
a
gegeben. Wir rotieren nun diese Ellipse um die x– Achse und erhalten so ein sogenanntes Rotationsellipsoid. Nat¨ urlich gen¨ ugt es, die “obere H¨ alfte” der Ellipse zu rotieren. Wenn wir nun also die Ellipsengleichung nach y aufl¨ osen, so brauchen wir nur jene L¨osung zu ber¨ ucksichtigen, f¨ ur die y ≥ 0 ist. Die obere H¨alfte der Ellipse ist somit der Graph der Funktion 1−
f (x) = b
x2 , a2
x
−b
−a ≤ x ≤ a .
Nach (9.5) berechnet sich das gesuchte Volumen V wie folgt:
a
V =π
2
f (x) dx = πb −a
= πb
2
a
2
−a
x2 1− 2 a
2
dx = πb2
a
−a
1−
x2 dx a2
a 4π 2 x3 (−a)3 a3 2 = ab . x − 2 = πb a − 2 − (−a) − 2 3a 3a 3a 3 −a
Wenn wir hier a = b setzen, dann erhalten wir die bekannte Formel V =
4π 3 a 3
f¨ ur das Volumen der Kugel vom Radius a. 7. Kurvenl¨ange der Parabel
In (10.6) haben wir die Formel f¨ ur die L¨ ange einer Kurve kennengelernt. Wir wollen diese hier auf den Fall der durch y = f (x) = x2 /2 im Intervall [0, 1] gegebenen Parabel anwenden. Wegen f (x) = x erhalten wir f¨ ur die gesuchte L¨ange L:
1
L=
1+
0
2 f (x)
1
dx = 0
1 + x2 dx .
12. Stammfunktionen und das unbestimmte Integral
170
√ Leider findet sich in unserer Tabelle (12.4) keine Stammfunktion von 1 + x2 ; wir machen deshalb einen kleinen Sprung √ nach (13.7), wo zum Gl¨ uck (unter “2. Quadratwurzeln”) eine Stammfunktion von x2 ± a2 angegeben ist. F¨ ur unser Problem verwenden wir das Pluszeichen und setzen a = 1. Es folgt 1 1 x 2 1 2 2 L= 1 + x dx = x + 1 + ln x + x + 1 = . . . 2 2 0 0 √ √ 2 1 + ln 1 + 2 = 1.1478, = 2 2 wie man durch fleissiges Einsetzen best¨atigt. Integrale, die im Zusammenhang mit Bogenl¨ angen auftreten, sind wegen der Wurzel im Integranden meist recht schwierig zu berechnen. Im n¨ achsten Beispiel kommt eine bisher noch nicht behandelte Anwendung des Integralbegriffs vor. 8. Der Mittelwert Es sei f (x) ≥ 0 f¨ ur alle x ∈ [a, b]. Unter dem Mittelwert μ von f versteht man die H¨ohe jenes Rechtecks, das als Grundlinie die durch a und b begrenzte Strecke hat und dessen Inhalt gleich dem Fl¨ acheninhalt unter der Kurve, also gleich b f (x) dx
f
μ
a
a
b
ist. Aus dieser Festsetzung ergibt sich sofort die folgende Formel f¨ ur μ: b 1 μ= f (x) dx. b−a a Ein konkreter Fall: Der Mittelwert der Funktion f (x) = sin x im Intervall [0, π] ist π 1 π 1 2 μ= sin x dx = − cos x = . . . = = 0.6366 . π 0 π π 0
(12.7) Das unbestimmte Integral F¨ ur eine Stammfunktion von f (x) haben wir bis jetzt immer F (x) geschrieben. H¨aufig gebraucht man daf¨ ur aber auch das Zeichen f (x) dx
12.7 Das unbestimmte Integral
171
und spricht dann von einem unbestimmten Integral. So ist etwa x2 dx ur eine Stammfunktion von f (x) = x2 . das Symbol f¨ Ein gewisses Problem stellt sich hier allerdings dadurch, dass ja eine Stammfunktion nie eindeutig bestimmt ist. Wie wir wissen (Tatsache (II) von (11.3)) kann man zu einer Stammfunktion von f eine Konstante addieren und bekommt eine andere Stammfunktion von f . So erhalten wir zum Beispiel
x3 x dx = 3 2
aber auch
x2 dx =
x3 +1, 3
x3 x3 = + 1, also 0 = 1 w¨are. 3 3 Ungeachtet dieser m¨ oglichen Mehrdeutigkeit beh¨alt man aber die zweckm¨assige Bezeichnung f (x) dx gleichwohl bei. In der Praxis f¨ uhrt dies kaum zu Schwierigkeiten, sofern man darauf achtet, dass bei der Durchf¨ uhrung einer Rechnung das Symbol f (x) dx stets eine fest gew¨ ahlte Stammfunktion bezeichnet. Man pflegt auf diese Mehrdeutigkeit hinzuweisen, indem man schreibt und es w¨are nat¨ urlich verfehlt, daraus zu schliessen, dass
f (x) dx = F (x) + C
speziell also etwa
x2 dx =
x3 +C , 3
wobei C eine zwar beliebige, aber im Verlauf einer Rechnung festgehaltene Konstante bedeutet. Hinweis
Eine ganz saubere Behandlung ist m¨ oglich, indem man f (x) dx als Menge aller Stammfunktionen auffasst. Allerdings muss man dann in Formeln wie (1) unten erkl¨ aren, was die Summe zweier solcher Mengen sein soll, was auch wieder einen gewissen Aufwand bedingt. Wir verzichten deshalb auf diese Interpretation.
Bei dieser Gelegenheit sei nochmals der wichtige Unterschied betont: • Das bestimmte Integral ist eine Zahl. • Das unbestimmte Integral ist eine Funktion (bzw. eine Menge von Funktionen).
Die Rechenregeln von (12.5) lassen sich ohne weiteres mit Hilfe von unbestimmten Integralen ausdr¨ ucken:
12. Stammfunktionen und das unbestimmte Integral
172
(1) (2)
f (x) + g(x) dx =
f (x) dx +
f (x) − g(x) dx = f (x) dx − (3) cf (x) dx = c f (x) dx
g(x) dx g(x) dx
Die “Warnung” von (12.5) gilt weiterhin: Es gibt keine entsprechende Formel f¨ ur das Produkt f (x)g(x). (12.8) Integration als Umkehrung der Differentiation Aus den bisherigen Betrachtungen — insbesondere aus dem Hauptsatz (11.4) — hat sich ergeben, dass das Integrieren auf eine Umkehrung des Differenzierens hinausl¨ auft. Diese Tatsache tritt in verschiedenen Spielarten in Formeln auf, von denen wir zum Schluss dieses Kapitels noch einige angeben wollen, da sie in den Anwendungen gelegentlich auftreten. Die Tatsache (I) von (11.2) l¨ asst sich wie folgt formulieren: x d (1) f (t) dt = f (x) . dx a Ist der Integrand schon selbst als Ableitung einer Funktion gegeben, so l¨ asst sich das bestimmte Integral mit Hilfe des Hauptsatzes sofort angeben, denn f (x) ist sicher eine Stammfunktion von f (x): b (2) f (x) dx = f (b) − f (a) . a
Beispiel F¨ ur einen geradlinig bewegten Massenpunkt sei die Geschwindigkeit v = v(t) als Funktion der Zeit bekannt (beim freien Fall w¨are beispielsweise v = gt). Zur Zeit t0 sei der Massenpunkt an der Stelle s(t0 ). Gesucht ist sein Ort zur Zeit t1 . Weil v(t) = s(t) ˙ ist (vgl. (3.2)), gilt t1 t1 t1 v(t) dt = s(t) ˙ dt = s(t1 ) − s(t0 ) oder s(t1 ) = v(t) dt + s(t0 ) . t0
t0
t0
Setzen wir t0 = 0, t1 = T und s(t0 ) = 0, so erhalten wir die Formel T s(T ) =
v(t) dt 0
173
12.∞ Aufgaben
uck, welche dort mit Riemannschen Summen, hier aber direkt mit dem Hauptsatz hergeleivon (9.2) zur¨ tet wurde. Dieses Beispiel illustriert wegen der Beziehung zu (3.2) erneut den Zusammenhang zwischen Differentiation und Integration: v(t) ergibt sich aus s(t) durch Ableiten; umgekehrt gewinnt man s(t) uck. durch Integration aus v(t) zur¨
Die Formel (2) erh¨alt manchmal noch eine andere Form, indem man rein formal ur das Differential benutzt: die Bezeichnung von (7.4), n¨amlich df = f (x) dx, f¨
b
(3)
df = f (b) − f (a) .
a
(12.∞) Aufgaben 12−1 Geben Sie eine beliebige Stammfunktion an von a) f (x) = x10 + 9x8 − x + 1 √ 1 c) h(x) = x + √ x 12−2 Geben Sie eine Stammfunktion F (x) von f (x) √ a) f (x) = x2 + 3 x + 1, x0 = 0, y0 = 1 √ 1 3 c) f (x) = x4 + √ , x0 = 1, y0 = 2 4 3 x 12−3 Berechnen Sie 1 a) (1 + 2x + 3x2 + 4x3 ) dx
−1 1
c) 4
3 2 (u + √ + ) du u u
π/2 e)
−π/4
(sin α − 2 cos α) dα
1 3 − 4 x x d) k(x) = 2 + 2 tan2 x b) g(x) =
an, f¨ ur welche F (x0 ) = y0 gilt. 1 b) f (x) = ex − 2 , x0 = 1, y0 = 1 x π d) f (x) = 2 sin x + cos x, x0 = , y0 = −1 3
√ √ √ 3 4 ( s + s2 + s3 ) ds
0 4
d) 1
1 (ew + √ ) dw w3
π/4 f)
tan2 β dβ
0
12−4 L¨ osen Sie die folgenden Gleichungen nach x auf. x √ 3 a) u du = 60 b) 1
1
b)
2
1
x t
dt = 1
(x > 0)
Weitere Routine-Aufgaben zum Integrieren finden Sie in Kapitel 13. y
12−5 Durch den Graphen der Funktion f (x) = 13 x3 − x (vgl. (6.4)) und die x–Achse wird ein Fl¨ achenst¨ uck begrenzt. Wie gross ist dessen Inhalt?
x
12−6 Vergleichen Sie den Inhalt der Fl¨ achenst¨ ucke unter der durch y = 1/x gegebenen Hyperbel in bezug auf die Intervalle [1, a] und [1, a2 ] mit a > 1. 12−7 Das durch den Graphen der Funktion f (x) = ex und die x–Achse im Intervall [−1, 1] begrenzte Fl¨ achenst¨ uck soll durch eine Parallele zur y–Achse halbiert werden. Durch welchen Punkt der x–Achse geht diese Gerade? 12−8 Wir betrachten den Graphen der Funktion f (x) = 2x − x2 und die Gerade g mit der Gleichung y = ax. Bestimmen Sie a so, dass die beiden schraffierten Fl¨ achenst¨ ucke den gleichen Inhalt haben.
y
x
12. Stammfunktionen und das unbestimmte Integral
174
√ 12−9 Durch y = 4 x und von y = x4 mit x ∈ [0, 1] sind zwei Kurven gegeben. Berechnen Sie den Inhalt des durch diese Kurven begrenzten Fl¨ achenst¨ ucks. osste negative, x2 die kleinste positive Zahl, f¨ ur welche die Sinus- und die 12−10 Es sei x1 die gr¨ Cosinusfunktion gleiche Werte annehmen. Berechnen Sie den Inhalt des von diesen beiden Kurven im Intervall [x1 , x2 ] umschlossenen Fl¨ achenst¨ ucks. 12−11 Der oberhalb der x-Achse liegende Teil des Graphen von f (x) = −x2 + 5x − 4 (zeichnen Sie eine Skizze!) wird um die x-Achse rotiert. Berechnen Sie das Volumen des entstehenden Rotationsk¨ orpers. 12−12 Der Graph der Funktion f : [0, 2] → R, f (x) = x3 wird um die y–Achse rotiert. Es entsteht eine Art Becher. Wie gross ist sein Volumen? √ √ ¨ 12−13 Uber dem von den Graphen von y = x und y = − x (1 ≤ x ≤ 4) begrenzten Gebiet der x-y–Ebene wird ein K¨ orper gebildet, dessen Querschnittsfl¨ ache (normal zur x–Achse) stets ein Quadrat ist (vgl. Aufgabe 10−5 f¨ ur einen a ¨hnlichen Sachverhalt). Berechnen Sie das Volumen dieses K¨ orpers. 12−14 Ein Sandsack von 50 kg Gewicht wird 20 m hochgehoben. Nach 5 m bekommt er ein Loch und verliert gleichm¨ assig Sand, so dass er oben nur noch 45 kg wiegt. Wie gross ist die beim Hochheben geleistete Arbeit? 12−15 Wenn eine Schraubenfeder um die Distanz x auf der Ruhelage gedehnt wird, so besteht f¨ ur die Federkraft F die Beziehung F = −kx, wo k > 0 die sogenannte Federkonstante ist. (Das negative Vorzeichen steht da, weil die Federkraft entgegen der Auslenkung wirkt.) An eine solche Feder wird ein Gewichtstein von 5 kg geh¨ angt. Sie verl¨ angert sich dabei um 20 cm. a) Wie gross ist die Federkonstante k (in Nm−1 )? b) Nun dehne ich die Feder um weitere 5 cm. Welche Arbeit (in J) leiste ich dabei? 12−16 Ein 3 m langer Balken aus Buchenholz (Dichte 0.7 · 103 kg m−3 ) mit einem quadratischen Querschnitt von 20×20 cm schwimmt im Wasser. Welche Arbeit m¨ ussen Sie leisten, wenn Sie ihn vollst¨ andig unter die Wasseroberfl¨ ache dr¨ ucken wollen? 12−17 Eine u ¨ber 24 Stunden von einem Thermographen aufgenommene Temperaturkurve entspreche (stark idealisiert) dem Graphen der Funktion T (t) = 15 +
1 (24t − t2 ), T in ◦ C, t in Stunden. 12
Definieren und berechnen Sie die mittlere Temperatur in dieser 24-Stunden-Periode. 12−18 Bei der Berechnung der L¨ ange eines Kurvenst¨ ucks treten nur selten Integrale auf, die man mit elementaren Funktionen darstellen kann. Im folgenden Beispiel l¨ asst sich das Integral ausrechnen, wenn man den Integranden geschickt umformt. Gesucht ist die L¨ ange des Graphen der Funktion f (x) = 12−19 Jemand rechnet so:
1 2
1 x3 + , 3 x
x ∈ [1, 2] .
1
1 dx = − = (−1) − (1) = −2 . 2 x − 1 −1 x 1
Sie/er wundert sich, dass das Resultat negativ ausf¨ allt, obwohl doch der Integrand negativ ist. Irgendwo muss ein Fehler stecken. Wo? Weitere Aufgaben zu den Anwendungen des Integralbegriffs finden Sie in Kapitel 13.
1 nie x2
175
13. WEITERE INTEGRATIONSMETHODEN ¨ (13.1) Uberblick In Kapitel 11 haben wir den Hauptsatz der Infinitesimalrechnung kennengelernt, der die Berechnung eines bestimmten Integrals auf das Aufsuchen einer Stammfunktion (in anderer Terminologie: eines unbestimmten Integrals) des Integranden zur¨ uckf¨ uhrt.
(11.4)
In Kapitel 12 sind dann die einfachsten Verfahren zum Integrieren vorgestellt worden, n¨ amlich die • Grundformeln (wichtigste Stammfunktionen) und die
(12.4)
• Grundregeln (Integrationsregeln).
(12.5)
In diesem Kapitel sollen nun weitere Methoden behandelt werden. Es sei gleich am Anfang betont, dass es beim Integrieren im Gegensatz zum Differenzieren keine Kombination von Verfahren gibt, welche stets zum Erfolg f¨ uhren w¨ urde. Vielmehr ist das Integrieren — zumindest bei komplizierteren Integranden — wenn nicht gerade eine Kunst, so doch eine Frage des Geschicks und der Routine. Es geht hier nicht darum, m¨oglichst viele Methoden und Tricks vorzustellen. Vielmehr beschr¨anken wir uns auf • Substitution, • Partielle Integration, • Verwendung von Integraltabellen. F¨ uhrt die eine Methode nicht zum Ziel, so kann man eine andere versuchen. Sie m¨ ussen aber darauf gefasst sein, dass ein Integral mit den angegebenen Methoden nicht zu berechnen ist. Zu diesem Fall sind in (13.8) einige Hinweise zu finden. Zum Schluss noch ein Trost. Beim Integrieren hat man — wenn die L¨ osung einmal gefunden ist — stets eine gute Kontrollm¨oglichkeit: Durch Ableiten der gefundenen Stammfunktion muss man den Integranden zur¨ uckerhalten.
(13.2) (13.5) (13.7)
(13.8)
13. Weitere Integrationsmethoden
176
(13.2) Substitution Diese Integrationsmethode erh¨alt man durch Umkehrung der Kettenregel der Differentialrechnung. Mit etwas anderen Bezeichnungen als in (5.2) lautet diese Regel F (u(x)) = F (u(x)) · u (x) . In dieser Formel setzen wir nun F = f . Damit wird insbesondere F zu einer Stammfunktion von f . Die Formel sieht dann so aus: F (u(x)) = f (u(x)) · u (x) . Man entnimmt ihr, dass die zusammengesetzte Funktion x → F (u(x)) eine Stammfunktion der (relativ kompliziert aufgebauten) Funktion x → f (u(x)) · u (x) ist, anders ausgedr¨ uckt: Es ist
f (u(x))u (x) dx = F (u(x)) + C ,
wobei F eine beliebige Stammfunktion von f ist. Trotz der Kompliziertheit des Integranden hat diese Formel viele wichtige Anwen dungen. Man geht dabei so vor: Es sei g(x) dx zu berechnen. Nun sieht man nach, ob der Integrand g(x) in der Form g(x) = f (u(x)) · u (x) geschrieben werden kann, wobei f und u geeignet zu w¨ ahlende Funktionen sind. Dabei ist vor allem darauf zu achten, dass im Integranden g(x) sowohl die Funktion u(x) als auch ihre Ableitung u (x) vorkommt. Eine sichere Beherrschung der Ableitungsregeln ist hier also unerl¨asslich. Hat man nun f und u bestimmt, so braucht man nur noch eine Stammfunktion F von f zu finden und sie auf u(x) anzuwenden. F (u(x)) ist dann eine Stammfunktion von g(x): g(x) dx = f (u(x))u (x) dx = F (u(x)) + C . Dieses Vorgehen soll nun an einigen Beispielen erl¨autert werden.
13.3 Beispiele zur Substitutionsregel
177
(13.3) Beispiele zur Substitutionsregel 1. I = cos(x2 ) · 2x dx . Ein Blick auf den Integranden g(x) = cos(x2 ) · 2x zeigt, dass hier eine Funktion (n¨ amlich x2 ) zusammen mit ihrer Ableitung (n¨ amlich 2x) vorkommt. Wir setzen 2 deshalb u(x) = x . Damit ist auch klar, wie wir die Funktion f w¨ahlen m¨ ussen: f (u) = cos u . (Die Bezeichnung der Variablen mit u ist zweckm¨ assig; der Buchstabe x ist ja bereits mit einer anderen Bedeutung belegt.) Eine Stammfunktion F von f ist ebenfalls leicht zu finden, n¨amlich F (u) = sin u . Mit unseren neuen Bezeichnungen erh¨alt der Integrand jetzt die Form g(x) = cos(x2 ) · 2x = cos(u(x)) · u (x) = f (u(x)) · u (x) . Jetzt k¨ onnen wir unsere Formel anwenden. Es folgt cos(x2 ) · 2x dx = f (u(x))u (x) dx = F (u(x)) + C = sin(x2 ) + C , wobei wir am Schluss die Beziehungen F (u) = sin u und u(x) = x2 gebraucht haben. Wenn man nun die Funktion sin(x2 ) zur Kontrolle mit der Kettenregel ableitet, so erh¨ alt man nat¨ urlich gerade cos(x2 ) · 2x. Man sieht dabei sehr sch¨ on, dass die Integration durch Substitution gerade die Umkehrung der Kettenregel ist.
2. J =
cos(x2 ) · x dx .
W¨ urde hier 2x anstelle von x stehen, so h¨ atte man genau das Integral I von a). unftige Dieser Faktor 2 ist aber deshalb wichtig, weil u(x) = x2 die einzige vern¨ Wahl f¨ ur u ist. Dann ist aber u (x) = 2x und nicht = x. Man findet leicht einen Ausweg, indem man den fehlenden Faktor 2 in den Integranden einf¨ ugt und dies durch den Faktor 12 vor dem Integral kompensiert. Wir schreiben also 1 1 cos(x2 ) · x dx = cos(x2 ) · 2x dx = sin(x2 ) + C , 2 2 wobei wir die in 1. gefundene Formel f¨ ur I gebraucht haben.
13. Weitere Integrationsmethoden
178
ur konstante urlich nur f¨ ugen und Kompensieren des Faktors 2 ist nat¨ Der kleine Trick mit dem Einf¨ Faktoren erlaubt. H¨ uten Sie sich davor, auf diese Weise z.B. ein x in den Integranden schmuggeln zu wollen.
3.
sin x √ dx . cos x
Da sin x die Ableitung von cos x ist (oder jedenfalls fast...), w¨ ahlen wir u(x) = cos x. ¨ Es ist dann u (x) = − sin x. Ahnlich wie in 2. f¨ ugen wir deshalb im Integranden ein Minuszeichen ein und kompensieren es gleich wieder. Wir finden mit f (u) = √ √ 1/ u, F (u) = 2 u
− sin x sin x √ dx = − √ dx = − f (u(x))u (x) dx cos x cos x √ = −F (u(x)) + C = −2 cos x + C .
In der Praxis bew¨ahrt sich ein etwas mechanischeres Vorgehen. Wir haben ja zu √ f (u) (in den Beispielen f (u) = cos u oder f (u) = 1/ u) eine Stammfunktion F (u) (z.B. √ F (u) = sin u oder F (u) = 2 u) gefunden. In Zeichen: F (u) =
f (u) du .
In dieser Stammfunktion muss man aber am Schluss u durch u(x) ersetzen, was symbolisch so ausgedr¨ uckt wird: F (u(x)) =
f (u) du
. u=u(x)
Die Substitutionsformel lautet dann:
f (u(x))u (x) dx =
f (u) du
. u=u(x)
F¨ ur die Praxis merkt man sich anstelle der Formel aber besser das Vorgehen gem¨ass der folgenden Regel:
13.3 Beispiele zur Substitutionsregel
179
1) W¨ ahle u(x). Setze du = u (x) dx. (Diese Beziehung ergibt sich ganz formal aus du = u (x) dx durch Multiplikation mit dx.) 2) Ersetze im zu berechnenden Integral u(x) durch u und u (x) dx durch du. 3) Das Integral hat nun die Form f (u) du . Bestimme eine Stammfunktion f (u) du = F (u) + C . 4) Ersetze im Ausdruck F (u) die Gr¨osse u wieder durch u(x). Das gesuchte Integral ist dann gleich F (u(x)) + C. Mit den n¨achsten Beispielen illustrieren wir das Vorgehen gem¨ass den Punkten 1) bis 4). 4. sin x cos x dx .
5.
1) Wir w¨ahlen u(x) = sin x, u (x) = cos x, du = cos x dx. 2) Wir ersetzen sin x durch u und cos x dx (das direkt im Integral steht) durch du. 3) Wir erhalten einfach u du. Dieses Integral ist sehr leicht zu berechnen; denn F (u) = u2 /2 + C ist eine Stammfunktion von u. 4) F (u(x)) + C = 12 sin2 x + C ist die gesuchte L¨ osung. x2 dx . +1 Wir w¨ahlen u(x) = x3 + 1, dann ist du = 3x2 dx. Wir ersetzen x3 + 1 durch u und x2 dx durch 13 du. (Als Variante h¨ atte man auch wie in Beispiel 2. den Faktor 3 einf¨ uhren (3x2 dx) und mit dem Faktor 13 kompensieren k¨onnen.) 1 Wir erhalten 13 du u = 3 ln |u| + C. Ersetzen von u durch u(x) = x3 + 1 ergibt als L¨ osung 13 ln |x3 + 1| + C.
x3 1) 2)
3) 4)
Man h¨ atte auch u = x3 substitutieren k¨ onnen. Dies h¨ atte auf das Integral dann mit einer zweiten Substitution (v = u + 1) berechnet worden w¨ are.
du uhrt, das u+1 gef¨
13. Weitere Integrationsmethoden
180
urlich nicht so ausf¨ In der Praxis schreibt man die vier Punkte nat¨ uhrlich auf: 1 1/x 6. e dx . x2 1 1 1 u(x) = , u (x) = − 2 , du = − 2 dx. x x x 1 1/x u u e dx = − e du = −e + C = −e1/x + C. x2
Schliesslich besprechen wir noch den Fall, wo die “innere Funktion” u(x) linear ist: u(x) = ax + b mit a = 0. Wegen u (x) = a ist dann du = a dx oder dx = a1 du. Diese Situation kommt h¨ aufig vor und ist f¨ ur die Praxis sehr wichtig — auch wenn sie hier erst am Schluss behandelt wird. 7.
(2x + 1)100 dx .
1 u = 2x + 1, u (x) = 2, du = 2 dx, dx = du . 2 (2x + 1)101 1 1 u101 100 100 (2x + 1) dx = u du = +C = + C. 2 2 101 202 8. et−1 dt . u = t − 1, u (t) = 1, du = dt. et−1 dt = eu du = eu + C = et−1 + C. (Wegen du = dt ist dies ein besonders einfacher Fall.) 9. I = sin x cos x dx Dieses Beispiel wurde schon in 4. behandelt. Es passt aber wegen der Beziehung sin x cos x = 12 sin(2x) (vgl. die Additionstheoreme in (26.15.c)) auch hierher: 1 sin(2x) dx . I= 2 1 u = 2x, du = 2dx, dx = du. 2 1 1 sin u du = − cos(2x) + C. I= 4 4 Erschrocken konstatiert man, dass ein anderes Resultat als in 4. entstanden ist. Die Betroffenheit legt sich aber, wenn man realisiert, dass eine Stammfunktion nur bis auf eine additive Konstante bestimmt ist (vgl. (11.3)). In der Tat unterscheiden sich die beiden gefundenen Stammfunktionen 1 sin2 x und − 14 cos(2x) nur um den konstanten Wert 14 : Wegen cos(2x) = cos2 x − sin2 x (vgl. 2 (26.15.c)) gilt n¨ amlich 1 1 1 1 1 1 1 sin2 x − − cos(2x) = sin2 x + cos2 x − sin2 x = (sin2 x + cos2 x) = . 2 4 2 4 4 4 4 Man kann das Spiel noch weitertreiben, indem man I mit der Substitution u(x) = cos x berechnet. ¨ Man erh¨ alt dann I = − 12 cos2 x + C und kann eine ¨ ahnliche Uberlegung wie eben anstellen.
13.4 Die Substitutionsregel f¨ ur bestimmte Integrale
181
(13.4) Die Substitutionsregel f¨ ur bestimmte Integrale Da F (u(x)) eine Stammfunktion von f (u(x)) · u (x) ist, gilt nach dem Hauptsatz
b
f (u(x))u (x) dx = F (u(b)) − F (u(a)) .
a
Da aber auch F (u) = f (u) du gilt (denn F ist eine Stammfunktion von f ), kann die rechte Seite aufgefasst werden als
u(b)
f (u) du . u(a)
Somit erhalten wir die Formel
b
(∗) a
f (u(x))u (x) dx =
u(b)
f (u) du . u(a)
Beachten Sie die “Transformation” der Grenzen des Integrals. Wir haben also zwei M¨ oglichkeiten, die man nicht durcheinander bringen darf: • Wenn man x als Variable betrachtet, so muss man am Schluss zu F (u(x)) u ¨bergehen. Die Integrationsgrenzen sind dann a und b. • Wenn man u als Variable betrachtet, so hat man am Schluss F (u) zu betrachten, muss dann aber die neuen Integrationsgrenzen u(a) bzw. u(b) einsetzen. Beispiel 2 √ 4x + 1 dx . 0
1 du. 4 Variante 1: Wir berechnen eine Stammfunktion √ 1 √ 1 2 3/2 1 4x + 1 dx = u du = u = (4x + 1)3/2 4 43 6 2 1 1 26 I = (4x + 1)3/2 = (27 − 1) = . 6 6 6 0 Variante 2: Wir benutzen die Formel (∗). Neue Grenzen: u(0) = 1, u(2) = 9 . 1 9√ 1 2 3/2 9 1 26 I= udu = u = (27 − 1) = . 4 1 43 6 6 1 u = 4x + 1, dx =
13. Weitere Integrationsmethoden
182
(13.5) Partielle Integration F¨ ur diese Integrationsmethode gehen wir von der Produktregel (5.2) aus: (f (x)g(x)) = f (x)g(x) + f (x)g (x) . Sicher ist jede Stammfunktion der linken Seite eine solche der rechten. Nun ist aber f (x)g(x) offensichtlich eine Stammfunktion der linken Seite. Also gilt f (x)g(x) =
f (x)g(x) dx +
f (x)g (x) dx
oder, etwas anders geschrieben f (x)g(x) dx = f (x)g(x) − f (x)g (x) dx . Dies ist die Formel der partiellen Integration. Da die Buchstaben f und g meist anderweitig gebraucht werden, schreibt man daf¨ ur gerne u und v:
u (x)v(x) dx = u(x)v(x) −
u(x)v (x) dx .
Diese Formel wird oft dann mit Erfolg zur Bestimmung von f (x) dx angewandt, wenn f (x) in zwei Faktoren zerlegt werden kann, wovon der eine (n¨amlich u ) eine einfache Stammfunktion (u), der andere aber (v) eine einfache Ableitung (v ) besitzt. Wir illustrieren das Vorgehen mit einigen Beispielen. Vorher geben wir noch die Formel f¨ ur partielle Integration bei bestimmten Integralen an, welche man einfach durch Einsetzen der Grenzen erh¨alt:
b
b u (x)v(x) dx = u(x)v(x) −
b
a
a
u(x)v (x) dx .
a
(13.6) Beispiele zur partiellen Integration 1. xex dx . Wir w¨ahlen
u (x) = ex , v(x) = x,
dann ist dann ist
u(x) = ex , v (x) = 1.
13.6 Beispiele zur partiellen Integration
183
Die Formel liefert:
xe dx = xe − x
x
1 · e dx = xe − x
x
ex dx
= xex − ex + C = ex (x − 1) + C .
Bemerkungen a) F¨ ur u(x) darf man irgendeine Stammfunktion von u (x) = ex w¨ahlen; es w¨are auch ex + C m¨ oglich gewesen. Im allgemeinen ist nat¨ urlich C = 0 am bequemsten. ¨ art den Namen “partielle b) Der Ubergang von u zu u ist eine Integration. Dies erkl¨ Integration”. atten wir n¨ amlich u (x) = x (somit c) Richtige Wahl von u und v ist wichtig. H¨ 2 x x u(x) = x /2) und v(x) = e (somit v (x) = e ) gew¨ ahlt, so w¨are auf der rechten Seite ein komplizierteres Integral herausgekommen als jenes, womit wir begonnen haben! 2. I = x2 sin x dx . Wir w¨ahlen
u (x) = sin x, v(x) = x2 ,
u(x) = − cos x, v (x) = 2x.
Es folgt
I = −x cos x + 2 2
x cos x dx .
Das u ¨briggebliebene Integral k¨onnen wir nicht direkt angeben. Wir k¨ onnen aber nochmals partiell integrieren: J = x cos x dx . Wir w¨ahlen
r (x) = cos x, s(x) = x,
Es folgt
r(x) = sin x, s (x) = 1.
J = x sin x −
1 · sin xdx = x sin x + cos x .
Zusammengefasst: I = −x2 cos x + 2x sin x + 2 cos x + C . (Es gen¨ ugt, wenn man die Integrationskonstante C ganz am Schluss hinzuf¨ ugt.) In einem solchen etwas komplizierten Fall ist u ¨brigens eine Kontrolle des Ergebnisses durch Ableiten ratsam.
13. Weitere Integrationsmethoden
184
3. In einzelnen F¨allen hilft der Trick, u (x) = 1, u(x) = x zu setzen: ln x dx . u (x) = 1,
ahlen Wir w¨
u(x) = x, 1 v(x) = ln x, v (x) = . x 1 ln x dx = 1 · ln x dx = x ln x − x · dx x = x · ln x − dx
Dann wird
= x ln x − x + C .
(vgl. (12.3.f)). 4. Auch im n¨ achsten Beispiel ist ein Trick notwendig: 2 I = sin x dx . Die Wahl
u (x) = sin x, v(x) = sin x,
f¨ uhrt auf I = − sin x cos x +
u(x) = − cos x, v (x) = cos x,
cos2 x dx.
Nun ist man so klug als wie zuvor: Versucht man n¨ amlich denselben Kniff mit alt man die zwar richtige, aber wenig hilfreiche Gleichung I = I. cos2 x dx, so erh¨ Ein anderer Einfall hilft aber: Es ist ja cos2 x = 1 − sin2 x und somit
2
cos x dx = Also
(1 − sin2 x) dx = x − I .
I = − sin x cos x + x − I , 2I = x − sin x cos x ,
und schliesslich I=
Kontrolle durch Ableiten!
sin2 x dx =
1 (x − sin x cos x) + C . 2
Die Methode der partiellen Integration kann oft dann versucht werden, wenn der Integrand ein Produkt ist. Es besteht aber keine Garantie daf¨ ur, dass in einem solchen Fall das Verfahren auch tats¨ achlich zum Ziel f¨ uhrt. So versagt die partielle Integration bei x sin(x2 ) dx, wo daf¨ ur die Substitution u = x2 zur L¨osung f¨ uhrt. Manchmal kann man dieselbe Aufgabe aber auch sowohl mit partieller Integration als auch mit Substition anpacken:
13.7 Integraltabelle
5.
185
√ x x + 1 dx .
Wir w¨ ahlen
u (x) = (x + 1)1/2 , v(x) = x,
u(x) = 23 (x + 1)3/2 , v (x) = 1.
Partielle Integration liefert √ 2x x x + 1 dx = (x + 1)3/2 − 3 2x (x + 1)3/2 − = 3
2 (x + 1)3/2 dx 3 4 (x + 1)5/2 + C 15 2 4 = . . . = (x + 1)3/2 x − +C . 5 15
Als zweiten Weg f¨ uhren wir die Substitution u = x + 1, du = dx durch. Wegen x = u − 1 erhalten wir √ √ x x + 1 dx = (u − 1) u du . Zwar k¨onnte das zweite Integral auch mit partieller Integration behandelt werden, doch ist es hier viel einfacher, auszumultiplizieren: .6 √ 2 2 (u−1) udu= (u3/2 −u1/2 )du= u5/2 − u3/2 +C 5 3 2 4 2 5/2 2 3/2 +C. = (x+1) − (x+1) +C=...=(x+1)3/2 x− 5 3 5 15 (Die Punkte deuten weggelassene Umformungen an.)
(13.7) Integraltabelle Eine durchaus zul¨ assige Integrationsmethode besteht darin, das unbestimmte Integral in einer Tabelle nachzuschlagen. Eine kurze Liste hatten wir schon in (12.4) gegeben; hier sind einige weitere Integrale zusammengestellt. (Die Funktionen arcsin und arctan werden in Kapitel 17 besprochen.) In diesem Zusammenhang sei auch auf ausf¨ uhrlichere Formelsammlungen verwiesen. Bei den angegebenen Stammfunktionen ist die Integrationskonstante jeweils weggelassen worden. Die Richtigkeit dieser Formeln l¨ asst sich u ¨brigens in jedem Fall durch Ableiten ¨ nachpr¨ ufen. (Sie haben hier also eine zus¨ atzliche Quelle f¨ ur Ubungsaufgaben zum Differenzieren.)
13. Weitere Integrationsmethoden
186
Funktion
Stammfunktion
a) Rationale Funktionen (ax + b)n (ax + b)−1
a = 0,
n = −1
a = 0
(ax + b)n+1 a(n + 1) 1 ln |ax + b| a √ ax + b − b2 − ac 1 √ √ ln 2 b2 − ac ax + b + b2 − ac
1 ax2 + 2bx + c
b2 > ac
1 ax2 + 2bx + c
b2 < ac
√
1 + 2bx + c
b2 = ac
−
ax2
ax + b cx + d
c = 0
b) Quadratwurzeln x2 ± a2
a2 − x2
1 x2 ± a2 1 √ 2 a − x2 √
ax + b 1 arctan √ ac − b2 ac − b2
1 ax + b
ax ad − bc − ln |cx + d| c c2
a2 x 2 ln x + x2 ± a2 x ± a2 ± 2 2 a2 x x 2 a − x2 + arcsin 2 2 |a| ln x + x2 ± a2 arcsin
x |a|
c) Trigonometrische Funktionen tan x
− ln | cos x|
cot x 1 sin x 1 cos x
ln | sin x| x ln | tan | 2 x π ln | tan( + )| 2 4
13.8 Schlussbemerkungen
187
Beispiele zur Anwendung der Tabelle
1. Gesucht ist
dx . 3x2 + 10x + 3
Wir identifizieren den Integranden als den drittobersten der Tabelle, und zwar ist a = 3, b = 5, c = 3. Wegen b2 = 25 > ac = 9 ist die dritte (und nicht etwa √ die vierte oder f¨ unfte) Formel am Platz. Es ist b2 − ac = 4, und man erh¨ alt als Stammfunktion 1 3x + 1 +C . ln 8 3x + 9 Beachten Sie, dass der Koeffizient von x mit 2b bezeichnet wird. Es ist also b = 5 und nicht etwa b = 10. (Dies vereinfacht die Formeln.) Es sei ferner erw¨ ahnt, dass die Gr¨ osse b2 − ac > 0, = 0 oder < 0 ist, je nachdem, ob die Gleichung ax2 + 2bx + c = 0 zwei, eine oder keine L¨ osung(en) hat. Schliesslich ist eine Kontrolle des Resultats durch Ableiten zu empfehlen. Wer sich daran wagt, benutze die Vereinfachung
3x + 1
= ln |3x + 1| − ln |3x + 9| . ln
3x + 9
2. Gesucht sei
5
I=
4x2 − 36 dx .
3
Dieser Integrand ist nicht in der Tabelle zu finden. Deshalb formen wir um, indem wir den Faktor 4 herausziehen: 5 x2 − 9 dx . I=2 3
Nun k¨onnen wir die erste Formel von b) benutzen (mit dem Minuszeichen und mit a2 = 9). Es folgt 5 x 9 x2 − 9 − ln x + x2 − 9 I=2 2 2 3 1 = . . . = 20 − 9 ln 9 + 9 ln 3 = 20 + 9 ln = 10.1125 , 3 wobei wieder einmal die Rechenregeln f¨ ur den Logarithmus verwendet wurden. (13.8) Schlussbemerkungen Wie schon in (13.1) erw¨ ahnt wurde, werden hier l¨angst nicht alle Integrationsverfahren behandelt, so fehlt beispielsweise die sogenannte Partialbruchzerlegung, die es im Prinzip erlaubt, jede rationale Funktion zu integrieren.
13. Weitere Integrationsmethoden
188
Wenn Sie also einmal trotz eifrigem Bem¨ uhen keine Stammfunktion einer gegebeussen Sie eben Fachleute fragen oder selber in die nen Funktion finden k¨onnten, so m¨ Literatur (z.B. in umfangreichere Integraltabellen) steigen. ur PC und ahige Computerprogramme (f¨ Im u ¨brigen gibt es auch sehr leistungsf¨ Grossrechner), welche Stammfunktionen ermitteln k¨ onnen. unden erfolglos ist. Es kann aber geschehen, dass diese Suche aus prinzipiellen Gr¨ 2 Schon in (12.3.e) wurde darauf hingewiesen, dass gewisse Funktionen wie f (x) = e−x ¨berhaupt keine elementare Stammfunktion besitzen. Andere Funktionen dieser Art u sind z.B. f (x) = sinx x oder f (x) = ln1x . Zum Schluss sei noch auf die numerische Integration hingewiesen. In den meisten naturwissenschaftlichen Anwendungen interessiert man sich f¨ ur das bestimmte Integral, also f¨ ur eine Zahl (z.B. f¨ ur die Gr¨ osse einer Population oder f¨ ur die geleistete Arbeit). Dieser Wert des Integrals kann nun auch ohne Verwendung des Hauptsatzes (also ohne Kenntnis einer Stammfunktion) berechnet werden. Hierzu gibt es viele verschiedene Verfahren, ein einfaches Beispiel wird in (21.3) gegeben. Nat¨ urlich gibt es auch Computerprogramme, die solche numerischen Integrationen durchf¨ uhren k¨onnen, auch gewisse Taschenrechner sind entsprechend eingerichtet. (13.∞) Aufgaben Bei den Aufgaben 13−1 bis 13−7 handelt es sich um Routine-Aufgaben zur Ein¨ ubung der in den Kapiteln 12 und 13 behandelten Integrationsmethoden. 13−1 Summen, Differenzen und Vielfache von Grundfunktionen. 1 −1 1 1 a) (3x2 − x3 + 1) dx b) ( − 2 ) dt t −1 −3 t π/2 1 √ 3 d) (sin ϕ − cos ϕ) dϕ e) (ez − 2 z 2 ) dz
1
13−2 Vorg¨ angiges Umformen des Integranden. 3 x + 5x2 − 4 a) (x2 + 1)2 dx b) dx x2 13−3 Substitution; einfachster Fall (innere Funktion linear). 3 3 dt a) e−s/2 ds b) 1 2t + 1 −2 13−4 Substitution; allgemeiner Fall. a) x(x2 + 1)5 dx d) sin4 ψ cos ψ dψ
e)
13−5 Partielle Integration. a) x2 ln x dx
b)
b)
x2
π/4
(2 + 2 tan2 x) dx
0
√ (1 − t) t dt
c)
π c)
sin 0
x3 − 2 dx
√ 2 (3 u − √ ) du u
f)
0
π/4
4
c)
c)
(ex − 1)2 ex dx
f)
x2 e−x dx
c)
α dα 4
(z 2 + z)3 (2z + 1) dz √
e x √ dx x
(t − 1) sin t dt
13.∞ Aufgaben
189
13−6 Verwendung von Integraltabellen. dx 2z − 1 a) dx b) dz 3x2 + 8x + 4 2z + 1 13−7 Vermischte Beispiele. a) (1 − 2x)n dx d) x3 sin x dx g) x ln(x2 + 1) dx x √ j) dx x+2
b) e)
(1 + x)2 dx √ x 3 (6x2 − 2)ex −x dx
sin(2α) dα 1 − cos(2α) k) t3 sin(t2 ) dt h)
c)
4x2 + 36 dx
√
ln t dt t 1 sin σ f) dσ σ2 i) (2x + 1)2 e2x+1 dx ex l) dx a + bex c)
dx . Eine fleissige Rechnerin verwendet die 2x 1 Substitution u = 2x und erh¨ alt I = 2 ln |2x|. Ihr nicht minder eifriger Kollege zieht zuerst dx den Faktor 12 vors Integral, I = 12 , und findet I = 12 ln |x|. Die beiden vergleichen ihre x Resultate und sind etwas verwirrt. K¨ onnen Sie helfen?
13−8 Gegeben ist das unbestimmte Integral I =
13−9 Der Graph der Funktion f (x) = 2x , x ∈ [1, 2] wird um die x–Achse rotiert. Berechnen Sie das Volumen des entstehenden Rotationsk¨ orpers. 13−10 Der Graph der Funktion f (x) = 1 + sin x, x ∈ [0, π] wird um die x–Achse rotiert. Berechnen Sie das Volumen des entstehenden Rotationsk¨ orpers. 13−11 Berechnen Sie den Mittelwert der Funktion f (x) = x x2 + 9 im Intervall [0, 4]. 13−12 Wie lang ist die durch y = x2 , −1 ≤ x ≤ 1 gegebene Kurve?
190
14. INTEGRATION VON VEKTORFUNKTIONEN ¨ (14.1) Uberblick In diesem Kapitel besprechen wir zwei weitere Anwendungen des Integralbegriffs: • Wenn r(t) eine Vektorfunktion ist, dann wird ihr Integral nach der folgenden Formel koordinatenweise berechnet: ⎛b
b
r(t) dt = a
⎜ ab ⎝ a b a
⎞ x1 (t) dt ⎟ x2 (t) dt ⎠ . x3 (t) dt
(14.2)
Dieses Integral ist wieder ein Vektor. • Die zweite Anwendung basiert auf dem Begriff des Vektorfeldes F (r): Ein Vektorfeld beschreibt eine Situation, wo jedem Punkt R (darge−−→ stellt durch den Vektor r = OR) ein Vektor F = F (r) zugeordnet ist. Ist ein solches Vektorfeld und dazu noch ein Kurvenst¨ uck C gegeben, so kann man das Kurvenintegral, auch Linienintegral genannt, definieren und berechnen:
b
F (r) dr = C
F (r(t)) · r˙ (t) dt .
a
Dabei ist r(t) mit a ≤ t ≤ b eine Parameterdarstellung von C. Der Wert dieses Integrals ist eine Zahl. Ein Kurvenintegral wird z.B. dann ben¨ otigt, wenn die in einem Kraftfeld l¨ angs des Kurvenst¨ ucks C geleistete Arbeit definiert und berechnet werden soll. (14.2) Gew¨ohnliche Integration von Vektorfunktionen Eine Vektorfunktion r(t), gegeben durch ⎞ ⎛ x1 (t) r(t) = ⎝ x2 (t) ⎠ , x3 (t) wird bekanntlich (vgl. (8.5)) koordinatenweise abgeleitet: ⎞ ⎛ x˙ 1 (t) r˙ = ⎝ x˙ 2 (t) ⎠ . x˙ 3 (t)
(14.3)
(14.4), (14.5)
14.2 Gew¨ ohnliche Integration von Vektorfunktionen
191
Ganz analog kann man das bestimmte Integral koordinatenweise berechnen. Wir definieren: ⎛b ⎞ x1 (t) dt b a ⎜ ⎟ r(t) dt := ⎝ ab x2 (t) dt ⎠ . a b x (t) dt a 3 Der Wert dieses Integrals ist also wieder ein Vektor. Wir betrachten nun Anwendungen dieses Konzepts. Beispiele 1. Von einem bewegten Massenpunkt sei der Geschwindigkeitsvektor ⎛
⎞ v1 (t) v (t) = ⎝ v2 (t) ⎠ v3 (t) zu einem beliebigen Zeitpunkt t bekannt. Zur Zeit t0 befinde er sich an der durch den Ortsvektor r(t0 ) = r0 gegebenen Stelle. Wo befindet er sich zum Zeitpunkt t? Es sei r(t) der Ortsvektor des Massenpunkts zur Zeit t. Nach (8.4) ist dann v (t) = r˙ (t). F¨ ur die 1. Koordinatenfunktion gilt daher v1 (t) = x˙ 1 (t) . Durch Integration erhalten wir
t
t
v1 (u) du = t0
x˙ 1 (u) du = x1 (t) − x1 (t0 ) ,
t0
urlich eine Stammfunktion von x˙ 1 (t). (Da die obere Integradenn x1 (t) ist nat¨ tionsgrenze t heisst, wurde die Integrationsvariable neu mit u bezeichnet.) Analoge Formeln gelten f¨ ur die beiden andern Koordinaten. Diese drei Beziehungen lassen sich gem¨ ass der obenstehenden Definition zur folgenden Vektorgleichung zusammenfassen: t
v (u) du = r(t) − r(t0 ) .
t0
Wir erhalten als Antwort auf die eingangs gestellte Frage
t
r(t) = r(t0 ) +
v (u) du .
t0
Wir stellen fest, dass die Integration auch f¨ ur Vektoren als Umkehrung der Differentiation betrachtet werden kann (vgl. (12.8), wo auch das eindimensionale Analogon der obigen Formel steht).
14. Integration von Vektorfunktionen
192
2. Ein konkretes Beispiel zu 1. Es sei (mit t0 = 0) ⎞ ⎛ ⎞ ⎛ 1 − sin t v (t) = ⎝ cos t ⎠ , r(0) = r0 = ⎝ 0 ⎠ . 0 1 Dann ist
⎞ ⎛t ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎞ ⎛ s) (− sin ds 1 1 cos t − 1 cos t 0 ⎟ ⎜ r(t) = ⎝ 0 ⎠ + ⎝ 0t cos s ds ⎠ = ⎝ 0 ⎠ + ⎝ sin t ⎠ = ⎝ sin t ⎠ . t 0 0 t t 1 ds 0
Dabei wurde t t (− sin s) ds = cos s = cos t − 1 0
t
und
0
0
t cos s ds = sin s = sin t 0
benutzt. Ein Vergleich mit (8.2.4) zeigt, dass der Endpunkt des Ortsvektors r(t) eine Schraubenlinie durchl¨auft. (Dies ist nicht verwunderlich, denn v (t) ist gerade die Ableitung jener Vektorfunktion, welche diese Schraubenlinie beschreibt, vgl. (8.5).) (14.3) Vektorfelder Bis jetzt haben wir Vektorfunktionen r(t) betrachtet, bei denen der Vektor r vom Parameter t, also nur von einer Variablen, abhing. Nun wollen wir Vektoren untersuchen, die vom Ort (welcher durch drei Variablen, n¨ amlich die drei Koordinaten, beschrieben wird) abh¨ angen. Diese Situation l¨asst sich darstellen, indem man in jedem Punkt R des Raumes den zu R geh¨ origen Vektor aufzeichnet. Die L¨ange und die Richtung dieses Vektors k¨onnen sich von Punkt zu Punkt a¨ndern. Die untenstehenden Illustrationen sind aus zeichnerischen Gr¨ unden zweidimensional; in Wirklichkeit hat man sich die Situation r¨aumlich vorzustellen. a) Eine Fl¨ ussigkeit str¨omt durch eine R¨ohre. In jedem Punkt R ist die an dieser Stelle herrschende Str¨omungsgeschwindigkeit (ein Vektor!) eingezeichnet:
b) Windgeschwindigkeit. In jedem Punkt eines gewissen Teils der Lufth¨ ulle ist die zugeh¨ orige Windgeschwindigkeit eingetragen (hier scheint gerade ein Wirbelsturm zu w¨ uten):
14.3 Vektorfelder
193
c) Kraftfelder. Dies ist eine wichtige physikalische Anwendung. In jedem Punkt des Raumes (oder eines Teilgebiets davon) wirkt eine bestimmte Kraft, deren Gr¨osse und Richtung im allgemeinen von ihrem Angriffspunkt abh¨angt:
Nun betrachten wir die Situation allgemein. Um den Punkt R vektoriell darstellen zu k¨onnen, w¨ ahlen wir einen Ursprung O. Zum Punkt R geh¨ ort dann ein Ortsvektor, −−→ n¨amlich der Vektor r = OR. Da der im Punkt R angebrachte Vektor F von R und damit von r abh¨ angt, schreibt man daf¨ ur F (r). Damit liegt eine Funktion vor, welche jedem Vektor r des Raumes (oder auch bloss eines Teilgebiets G des Raumes) einen neuen Vektor F (r) zuordnet, also eine Funktion, die auf einer Teilmenge G ⊂ R3 definiert ist und Werte in R3 annimmt: F : G → R3 (G ⊂ R3 ) . Eine solche Funktion nennt man ein Vektorfeld auf G. Wenn der Vektor F eine Kraft darstellt, wie im Beispiel c), dann spricht man auch von einem Kraftfeld. Der Vektor F = F (r) ist wie u ¨blich durch seine drei Koordinatenfunktionen gegeben:
⎛
⎞ F1 (r) F (r) = ⎝ F2 (r) ⎠ . F3 (r)
Dabei sind die Funktionswerte F1 (r), F2 (r), F3 (r) reelle Zahlen, welche vom Vektor ⎛
⎞ x1 r = ⎝ x2 ⎠ , x3 also jeweils von drei reellen Zahlen abh¨angen. F1 , F2 und F3 sind somit (reellwertige) Funktionen von drei Variablen. Auf Funktionen von mehreren Variablen wird sp¨ ater noch genauer eingegangen (Kapitel 22). Es folgen zwei formelm¨ assig gegebene Beispiele:
14. Integration von Vektorfunktionen
194
Beispiele 1. Das elektrostatische Feld einer Punktladung Q > 0 im Ursprung ist gegeben durch Q r, 4πε0 |r|3
r) = E(
(r = 0) .
r) zuDurch diese Formel wird jedem Ortsvektor r ein neuer Vektor, n¨amlich E( geordnet. (Dabei ist ε0 die elektrische Feldkonstante.) In unserem Fall hat dieser Vektor dieselbe Richtung wie r, und sein Betrag ist umgekehrt proportional zum Quadrat des Betrages von r, denn es gilt r)| = |E(
Q Q |r| = . 4πε0 |r|3 4πε0 |r|2
2. Wir betrachten ein Vektorfeld in der Ebene, gegeben durch F (r) =
x1 − x2 x1 + x2
f¨ ur
r =
x1 x2
.
Wir stellen eine Wertetabelle auf, wie wir sie f¨ ur gew¨ohnliche Funktionen kennen.
r
−1 1
−1 0
−1 −1
F (r)
−2 0
−1 −1
0 −2
r 0 1 0 0
0 −1
F (r)
−1 1
0 0
1 −1
r 1 1 1 0
1 −1
F (r)
0 2
1 1
2 0
14.4 Kurvenintegrale
195
Die Vektoren F (r) werden nun jeweils im Endpunkt des Vektors r abgetragen: x2
1 x1 1
(14.4) Kurvenintegrale Wir beziehen unsere Betrachtungen auf ein Beispiel aus der Physik und sprechen daher von einem Kraftfeld statt von einem Vektorfeld. Die erarbeitete Definition l¨asst sich aber ohne weiteres auf beliebige Vektorfelder u ¨bertragen. Es sei also F (r) ein Kraftfeld im Gebiet G des Raumes. Weiter betrachten wir ein Kurvenst¨ uck C, welches ganz in G liegt: G
B A
C
Wir erinnern zuerst daran, dass ein solches Kurvenst¨ uck durch eine Parameterdarstellung (8.3) gegeben ist, also durch eine Funktion t → r(t),
t ∈ [a, b] .
Dabei entspricht r(a) dem Anfangspunkt, r(b) dem Endpunkt der Kurve, d.h., es ist −→ −−→ r(a) = OA, r(b) = OB (wo O wie u ¨blich den gew¨ ahlten Nullpunkt bezeichnet).
14. Integration von Vektorfunktionen
196
Wir m¨ochten die Arbeit W bestimmen, die geleistet wird, wenn sich ein Massenangs der Kurve C unter der Einwirkung des Kraftfeldes F = F (r) bewegt. punkt l¨ ur den Spezialfall gel¨ In (9.3) haben wir das Problem f¨ ost, wo die Kraft stets in der Bewegungsrichtung wirkte und sind dabei auf einen Integrationsprozess gekommen. Wenn nun die Richtung der Kraft nicht mehr mit jener der Bewegung u ¨bereinstimmt, dann ist die Arbeit ein Skalarprodukt zweier Vektoren (1.8.a). Hier liegt nun eine Kombination dieser beiden Situationen vor, und tats¨achlich werden wir sehen, dass die Arbeit durch Integration u ¨ber ein Skalarprodukt erhalten wird. Dies soll nun im einzelnen durchgef¨ uhrt werden. ¨ Ahnlich wie bei den einleitenden Betrachtungen zur Integration in Kapitel 9 teilen wir das “Parameterintervall” [a, b] durch Teilpunkte ti in Teilintervalle: a = t0 < t1 < t2 < . . . < tn = b . Zu diesen Teilpunkten des Intervalls geh¨oren die Endpunkte der Vektoren r(ti ), i = 0, 1, . . . , n auf der Kurve C: A F (r(ti−1 ))
Δri r(ti ) r(ti−1 )
B O
Neben dem Kurvenst¨ uck zwischen je zwei aufeinanderfolgenden Teilpunkten r(ti−1 ) und r(ti ) betrachten wir nun noch das entsprechende Geradenst¨ uck (die Sekante). Wie der Skizze zu entnehmen ist, wird dieses durch den Vektor Δri = r(ti ) − r(ti−1 ) beschrieben. F¨ ur eine sehr feine Unterteilung kann man nun zwei Dinge annehmen: (i) Die Bewegung entlang des Kurvenst¨ ucks zwischen den erw¨ahnten Teilpunkten darf n¨aherungsweise durch die Bewegung entlang des Geradenst¨ ucks (oder Sekante) ersetzt werden.
14.4 Kurvenintegrale
197
ucks ist das Kraftfeld F (r) n¨aherungsweise kon(ii) L¨angs dieses (kurzen) Geradenst¨ stant, und man kann annehmen, es habe den Wert F (r(ti−1 )), d.h. den Wert am Anfangspunkt der Sekante. Damit liegt der Fall vor, dass sich (wenn auch nur n¨aherungsweise) der Massenpunkt geradlinig um den Vektor Δri unter der Einwirkung der konstanten Kraft F (r(ti−1 )) verschiebt. In diesem Fall ist die Arbeit durch das Skalarprodukt “Kraft mal Weg” ur die in diesem Teilst¨ uck geleistete Arbeit gilt also gegeben (1.8.a). F¨ Wi ≈ F (r(ti−1 )) · Δri . (Dies ist wohlverstanden trotz des etwas komplizierten Aussehens ein gew¨ ohnliches Skalarprodukt zweier Vektoren. Wir schreiben hier das Skalarprodukt meist mit einem Punkt (·).) Die Gesamtarbeit W ist n¨aherungsweise gleich der Summe dieser Teilarbeiten: n
W ≈
F (r(ti−1 )) · Δri .
i=1
Nun f¨ uhren wir eine weitere Approximation durch, indem wir Δri durch das VektorDifferential dr ersetzen (vgl. (8.7.b)): Δri ≈ dr = r˙ (ti−1 )Δti . alt man So erh¨ W ≈
n
F (r(ti−1 )) · r˙ (ti−1 )Δti .
i=1
Je feiner die Unterteilungen werden, desto besser approximiert die rechte Seite das, was man sich anschaulich unter der gesamten geleisteten Arbeit vorstellt. Man macht ¨ daher (wie schon in fr¨ uheren F¨allen, z.B. in (9.3)) die durch die obigen Uberlegungen motivierte Beziehung zur Definition und beschreibt die Gesamtarbeit durch die Formel W = lim
Δti →0
n
F (r(ti−1 )) · r˙ (ti−1 )Δti .
i=1
Diese Summe ist aber nichts anderes als eine Riemannsche Summe im Sinne von (10.2) (wobei hier die “Zwischenpunkte” gerade mit den “Teilpunkten” von [a, b] zusammenfallen). Allerdings handelt es sich um die Riemannsche Summe einer ziemlich komplizierten amlich der Funktion Funktion, n¨ t → F (r(t)) · r˙ (t),
t ∈ [a, b] ,
14. Integration von Vektorfunktionen
198
die durch das Skalarprodukt zweier Vektoren definiert ist. Nach (10.2) ist der Limes dieser Riemannschen Summe nichts anderes als das Integral
b
F (r(t)) · r˙ (t) dt .
a
Somit k¨onnen wir zusammenfassend sagen: Die in der besprochenen Situation geleistete Arbeit ist definiert durch b W = F (r(t)) · r˙ (t) dt . a
Ein Integral dieser Form heisst ein Kurvenintegral. Es kann auch f¨ ur beliebige Vektorfelder, unabh¨angig vom Begriff der Arbeit, definiert werden. Wir halten also allgemein fest: Es sei F = F (r) ein beliebiges Vektorfeld und C sei ein Kurvenst¨ uck, gegeben durch die Parameterdarstellung r = r(t) (t ∈ [a, b]). Unter dem Kurvenintegral (oder Linienintegral) von F u ¨ber C versteht man das Integral
b
(1)
F (r(t)) · r˙ (t) dt .
a
Beachten Sie, dass es sich bei (1) um ein ganz gew¨ ohnliches Integral einer Funktion einer Variablen handelt. Ist die Definition des Kurvenintegrals einmal vorhanden, so kann man den Begriff der Arbeit in seiner allgemeinsten Form als ein derartiges Kurvenintegral definieren — die motivierenden Betrachtungen haben gezeigt, dass das Kurvenintegral f¨ ur diesen Zweck unentbehrlich ist. Schreibt man die Vektoren in Komponentenform ⎛
⎞ F1 (r) F (r) = ⎝ F2 (r) ⎠ , F3 (r)
⎞ x1 (t) r(t) = ⎝ x2 (t) ⎠ , x3 (t) ⎛
so erh¨alt man, ausf¨ uhrlich geschrieben:
b
(2) a
b
F (r(t)) · r˙ (t) dt =
F1 (r(t))x˙ 1 (t) + F2 (r(t))x˙ 2 (t) + F3 (r(t))x˙ 3 (t) dt .
a
Unter Verwendung der Formeln (1) oder (2) lassen sich Kurvenintegrale berechnen (siehe (14.6), wo auch ein Rechenschema angegeben ist).
14.5 Weitere Informationen u ¨ ber Kurvenintegrale
199
(14.5) Weitere Informationen u ¨ber Kurvenintegrale Dem Kurvenintegral liegt ein Vektorfeld F (r) und eine Kurve C zugrunde. Nun ist die Kurve C durch eine Parameterdarstellung t → r(t), t ∈ [a, b] gegeben, und r(t) kommt in der Formel (1) f¨ ur das Kurvenintegral explizit vor, zusammen mit r˙ (t). In (8.3) haben wir aber gesehen, dass ein Kurvenst¨ uck C verschiedene Parameterdarstellungen haben kann. “Dynamisch” kann dies so interpretiert werden, dass dieselbe Bahn mit verschiedenen Geschwindigkeiten durchlaufen wird. Man kann nun aber zeigen, dass der Wert des Kurvenintegrals nicht von der gew¨ ahlten Parametrisierung abh¨angt. Dies leuchtet — im Fall der Arbeit — auch physikalisch ein, denn die geleistete Arbeit h¨ angt nicht davon ab, wie schnell sich der Massenpunkt in einem Kraftfeld bewegt. Das eben Gesagte stimmt insofern noch nicht ganz, als die Orientierung der Kurve (der Durchlaufungssinn) eine Rolle spielt. Es ist n¨amlich wichtig, in welcher Richtung die Kurve durchlaufen wird; die Umkehrung des Durchlaufungssinns bewirkt einen Vorzeichenwechsel des Kurvenintegrals. Im Zusammenhang mit Kurvenintegralen ist C also stets als ein orientiertes Kurvenst¨ uck, d.h. als Kurve mit einem Durchlaufungssinn, zu verstehen. Wenn wir uns wie in der Bemerkung am Ende von (8.3) eine Kurve C als Klasse von ¨ aquivalenten Wegen vorstellen, so kommt es, wie man zeigen kann, bei der Berechnung des Kurvenintegrals nicht darauf an, welchen Weg aus der Klasse (m.a.W. welche Parameterdarstellung) man w¨ ahlt.
Die Unabh¨ angigkeit von der Parametrisierung der (orientierten) Kurve C bringt man dadurch zum Ausdruck, dass man die Funktion r(t) und das Parameterintervall [a, b] gar nicht anschreibt. An deren Stelle setzt man das Zeichen C ein. F¨ ur das Kurvenintegral schreibt man dann einfach
F (r) · dr
(3)
F · dr .
oder
C
C
Der Punkt (·) steht nach wie vor f¨ ur das Skalarprodukt. Er k¨ onnte auch weggelassen werden. Formal erh¨ alt man die obige Bezeichnung (3) aus der Formel (1), indem man r˙ (t) dt durch das Differential dr ersetzt. Wenn die Kurve C geschlossen ist (d.h. wenn ihr Anfangs- mit dem Endpunkt zusammenf¨ allt), dann benutzt man auch die Bezeichnung F · dr .
(4) C
Es sei nochmals betont, dass es sich bei diesen etwas imposant aussehenden Integralen um ganz gew¨ ohnliche Integrale handelt, die in konkreten F¨ allen mit der Formel (2) auszurechnen sind. Die Bedeutung der eben eingef¨ uhrten kurzen Schreibweise f¨ ur das Kurvenintegral liegt auch darin, dass sie es erlaubt, physikalische Gr¨ossen in kompakter Form darzustellen.
14. Integration von Vektorfunktionen
200
Ein Beispiel hierzu ist die schon besprochene allgemeine Definition der Arbeit. Auch in der Lehre at und Magnetismus treten Kurvenintegrale auf, so zum Beispiel im Induktionsgesetz von von Elektrizit¨ FARADAY, · dr = − dΦ , E dt C ¨ wo links das Linienintegral u ¨ber das induzierte E–Feld und rechts die Anderung des magnetischen Induktionsflusses steht.
Schliesslich erw¨ ahnen wir noch, dass es auch eine direkte Interpretation der Formel (3) gibt. Bei der Herleitung in (14.4) wurde die “Teilarbeit” Wi durch F (r)·Δr definiert (das Argument ti lassen wir weg). Ersetzen wir nun Δr durch das Differential dr, so ersetzen wir gleichzeitig Wi durch F (r) · dr: F (r)
F (r)
dr
Δr Wi ≈ F (r) · dr
Wi ≈ F (r) · Δr
Das Differential dr darf man sich mit der n¨otigen Vorsicht (vgl. 10.4.c) als “unendlich kleines Kurvenst¨ uck” vorstellen. Geht man also ein ganz kleines St¨ ucklein dr entlang der Kurve, so wirkt in diesem St¨ uck eine (praktisch) konstante Kraft F (r), und es wird die Arbeit F (r) · dr geleistet. Die Gesamtarbeit erh¨ alt man durch Summation bzw. — nach einem Grenz¨ ubergang — durch Integration von F (r) · dr: W = F (r) · dr . C
(14.6) Beispiele zur Berechnung von Kurvenintegralen 1. Das Vektorfeld F (r) sei gegeben durch ⎧ ⎛ ⎞ x1 − x2 ⎨ F1 (r) F (r) = ⎝ x1 + x2 ⎠ also F2 (r) ⎩ x3 F3 (r)
= x1 − x2 = x1 + x2 = x3
⎞ x1 r = ⎝ x2 ⎠ . x3 ⎛
mit
Als Kurve C w¨ahlen wir die Schraubenlinie aus (8.2.4), welche die folgende Parameterdarstellung hat (dabei beschr¨ anken wir uns auf einen Umlauf): ⎧ ⎛ ⎞ cos t ⎨ x1 (t) = cos t r(t) = ⎝ sin t ⎠ , t ∈ [0, 2π] , also x (t) = sin t . ⎩ 2 t x3 (t) = t
201
14.6 Beispiele zur Berechnung von Kurvenintegralen
Um das Skalarprodukt F (r(t)) · r˙ (t) gem¨ ass Formel (1) zu berechnen, geht man am besten schematisch vor: 1) In ⎛ ⎞ x1 − x2 F (r) = ⎝ x1 + x2 ⎠ x3 ersetzen wir r durch r(t) und erhalten dann F (r(t)). Im einzelnen wird x1 durch x1 (t) = cos t, x2 durch x2 (t) = sin t und x3 durch x3 (t) = t ersetzt. Es ergibt sich ⎛ ⎞ cos t − sin t F (r(t)) = ⎝ cos t + sin t ⎠ . t 2) Wir ben¨otigen als zweites den Vektor r˙ (t), der durch koordinatenweises Ableiten erhalten wird. ⎞ ⎛ − sin t r˙ (t) = ⎝ cos t ⎠ . 1 3) Wir bilden das Skalarprodukt F (r(t)) · r˙ (t) und vereinfachen: (cos t−sin t)(− sin t)+(cos t+sin t)(cos t)+t·1 = . . . = sin2 t+cos2 t+t = 1+t . ¨ber das eben 4) Das Kurvenintegral selbst ergibt sich nun durch Integration u berechnete Skalarprodukt
2π
F (r) · dr = C
0
t2 2π (1 + t) dt = t + = 2(π + π 2 ) = 26.0224 . 2 0
2. Gegeben sei das Vektorfeld F (r) durch ⎞ ⎛ 2 x1 + x22 + x23 ⎠. x1 x2 F (r) = ⎝ x1 + x2 + x3 Das (orientierte) Kurvenst¨ uck C sei die Strecke vom Punkt A(2, 1, −1) zum Punkt F B(1, 3, 0). Gesucht ist C · dr. Im Gegensatz zum Beispiel 1. m¨ ussen wir hier zuerst eine Parameterdarstellung von C finden. In (1.10.a) haben wir gesehen, wie das geht: Mit ⎛
⎞ 2 −→ a = OA = ⎝ 1 ⎠ −1
⎛ ⎞ 1 −−→ und b = OB = ⎝ 3 ⎠ 0
⎛
⎞ −1 ist b − a = ⎝ 2 ⎠ , 1
14. Integration von Vektorfunktionen
202
und die gesuchte Parameterdarstellung ist ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ 2−t −1 2 r(t) = a + t(b − a) = ⎝ 1 ⎠ + t ⎝ 2 ⎠ , also r(t) = ⎝ 1 + 2t ⎠ , t ∈ [0, 1] . −1 + t 1 −1 Wir verwenden nun wieder das Rechenschema: 1) Durch Einsetzen der Koordinatenfunktionen von r(t) findet man ⎛ ⎞ ⎞ ⎛ 2 (2 − t)2 + (1 + 2t)2 + (−1 + t)2 6t − 2t + 6 ⎠ = ⎝ −2t2 + 3t + 2 ⎠ . F (r(t)) = ⎝ (2 − t)(1 + 2t) 2t + 2 (2 − t) + (1 + 2t) + (−1 + t) 2) Ableiten ergibt
⎛
⎞ −1 r˙ (t) = ⎝ 2 ⎠ . 1
3) Nun bildet man das Skalarprodukt F (r(t)) · r˙ (t) = (6t2 − 2t + 6)(−1) + (−2t2 + 3t + 2)2 + (2t + 2)1 = −10t2 + 10t 4) Das Kurvenintegral wird auch in diesem Fall recht einfach: 1 1 ˙ F (r(t)) · r(t) dt = F (r) · dr = (−10t2 + 10t) dt C
0
0
10 10 1 5 = − t3 + t2 = . 3 2 3 0
3. Zu berechnen sei C r · dr, wobei C der Einheitskreis in der x-y–Ebene sei. F¨ ur C k¨onnen wir die Parameterdarstellung aus (8.2.2) w¨ ahlen: ⎛ ⎞ cos t r(t) = ⎝ sin t ⎠ , t ∈ [0, 2π] . 0 Das Vektorfeld F (r) ist hier schon als Integrand gegeben, n¨amlich durch F (r) = r, in Koordinaten also einfach ⎛ ⎞ x1 F (r) = ⎝ x2 ⎠ . x3 Unser Rechenschema liefert
⎛
⎞ cos t F (r(t)) = ⎝ sin t ⎠ , 0
⎛
⎞ − sin t r˙ (t) = ⎝ cos t ⎠ . 0
14.7 Quadratische Abnahme einer Wirkung
203
F¨ ur den Integranden F (r(t)) · r˙ (t) erh¨alt man cos t(− sin t) + sin t cos t = 0 . Damit wird auch das Kurvenintegral r · dr = 0 .
C
Die Tatsache, dass der Integrand gleich Null ist, hat eine ganz anschauliche Begr¨ undung: Da die Kurve C ein Kreis ist, steht r˙ r der Tangentialvektor r˙ stets senkrecht auf dem Vektor r (= (r)). Das Skalarprodukt ist also Null. Noch etwas anschauF licher und mit geb¨ uhrender Vorsicht (vgl. den Schluss von (14.5)): als Kraftfeld auf, so steht bei einer Kreisbewegung die Kraft F (r) = r stets senkrecht Fassen wir F auf dem “unendlich kleinen” Kurvenst¨ uck dr. Somit ist das Skalarprodukt r · dr = 0 und damit auch die geleistete Arbeit: C r · dr = 0.
(14.7) Quadratische Abnahme einer Wirkung Wir kehren zur¨ uck zu (14.3), zum Beispiel des elektrostatischen Feldes einer Punktladung. Wir stellten fest, dass der Betrag des elektrostatischen Feldes umgekehrt proportional zum Quadrat des Betrages von r (also der Distanz zum Ursprung) ist: r)| = |E(
Q Q |r| = . 4πε0 |r|3 4πε0 |r|2
Was wir hier erarbeitet haben, ist ein allgemeines Prinzip, welches in Naturwissenschaft und Technik viele Ph¨ anome erkl¨ aren hilft. Wann immer wir eine Formel von der Art antreffen, dass eine Wirkung w dem folgenden Gesetz gen¨ ugt: w=
KQ , 4πr2
dann kann man das folgendermassen interpretieren: K ist eine Naturkonstante, Q eine Quelle im Ursprung, r die Distanz zum Ursprung und damit zur Quelle. Kommt uns 4πr2 bekannt vor? Es ist die Oberfl¨ache einer Kugel mit Radius r. Doch weshalb taucht dies hier im Nenner auf? Wenn wir zum Beispiel eine Strahlungsquelle im Ursprung platzieren (Mobiltelefon, radioaktive Probe), dann fassen wir diese als Punktquelle auf, welche radial in alle Richtungen strahlt. Wenn wir jetzt erstmal lediglich die Verd¨ unnung der Strahlungsquelle durch Distanz betrachten, dann gilt folgendes: Wenn Sie sich von 2 Metern auf 4 Meter Distanz von der radial in alle Richtungen strahlenden Quelle entfernen, wird nicht mehr nur die H¨ alfte der Strahlung auf Sie treffen, sondern nur noch ein Viertel: dazu denken Sie sich eine Kugel von 2 Metern und eine solche von 4 Metern Radius um die Quelle. Die Oberfl¨ achen der Kugeln sind 4π22 = 16π beziehungsweise
14. Integration von Vektorfunktionen
204
unglich von der Quelle emittierten 4π42 = 64π. Es ist also ein Faktor 4. Die urspr¨ ossere Fl¨ache und entsprechend trifft auf Strahlen verteilen sich damit auf eine 4 mal gr¨ jeden cm2 auf der a¨usseren Kugel nur noch 1/4 der Strahlen im Vergleich zu einem cm2 auf der inneren Kugel. Dass 4πr2 in obiger Formel in den Nenner geh¨ ort, kann man dann auch so verstehen, dass KQ auf eine Fl¨ache 4πr2 aufgeteilt wird, also “pro” Fl¨ache und “pro” ist ein Hinweis, dass etwas in den Nenner geh¨ort. Was sind nun die Konsequenzen dieser Formel? Ein paar Beispiele, wobei wir nochmals die Einschr¨ ankungen der nachfolgenden Schlussfolgerungen auflisten: es muss eine Punktquelle sein, welche radial in alle Richtungen wirkt. Wir haben Bremswirkungen, Wechselwirkungen nicht ber¨ ucksichtigt, sondern lediglich die Verd¨ unnung der Strahlungsquelle durch Distanz betrachtet, rein von der Geometrie, der Symmetrie. Physikalisch kann man dies oft durch den Energieerhaltungssatz erkl¨aren. Wir betrachten nur den Haupteffekt. F¨ ur Details und genauere Angaben konsultiere man die entsprechende Fachliteratur. 1. Die Strahlen des Mobiltelefons: Sie sollten l¨ angere Gespr¨ ache mit Kabel durchuhren: anstatt dass Sie das Mobiltelefon direkt am Ohr halten (und damit prakf¨ tisch die H¨alfte der Strahlen mit Ihrem Kopf absorbieren), trifft bei 1 Metern Distanz nur noch ein Bruchteil auf Ihren Kopf und die heikle Gehirnregion auf. Wir haben eine quadratische Abnahme mit der Distanz. 2. Auch bei radioaktiven Strahlen gilt bei Punktquellen analog dem ersten Beispiel eine quadratische Abnahme. Die 3 Grundprinzipien des Strahlenschutzes beinhalten denn auch: Abschirmung, Expositionsdauer und eben die Distanz. 3. Die Gravitationsformel nach Newton: F =
Gm1 m2 . r2
4. Auch die Lautst¨arke im Freien nimmt mit der Distanz quadratisch ab (bei Punktquellen - was Lautsprecher gew¨ ohnlich eben gerade nicht sind!). 5. Bei Radar-Ger¨aten muss man ber¨ ucksichtigen, dass die Strahlen vom aussendenden Radarger¨at auf das Flugzeug treffen und dort erneut gesendet (reflektiert) werden. Das f¨ uhrt im Wesentlichen (abgesehen von Spezialeffekten) zu einer Abnahme mit 1 1 1 = 4. r2 r2 r Um dieser sehr starken Abnahme entgegenzuwirken kann man auf Flugzeugen einen Sender (Transponder) installieren, der aktiv von sich aus sendet. 6. In der Seismologie will man mit Sprengungen im Boden R¨ uckschl¨ usse auf den Untergrund machen. Bei homogenem Untergrund h¨ atte man bei einer einzelnen Sprengladung eine quadratische Abnahme bis zur ersten Reflexion; die Abweichungen davon helfen in der Seismologie, R¨ uckschl¨ usse zum Untergrund zu machen.
205
14.∞ Aufgaben
7. W¨ahrend man bei einer Luftexplosion auch eine quadratische Abnahme der Wirkung hat, gilt erfahrungsgem¨ ass approximativ bei Explosionen auf der Oberfl¨ache, dass dank Bodeneffekt die Abnahme gem¨asse r−2.2 geschieht. 8. Bei Explosionen in Flugzeugen ist die Prognose nicht gut, da es sich im Wesentlichen um eine eindimensionale R¨ohre handelt. Die Explosionswirkung kann sich kaum verd¨ unnen. Eine weitere Frage ist, wie die Wirkung einer st¨arkeren Quelle durch gr¨ osseren Abstand wieder neutralisiert werden kann. Dies kann man aber einfach an der Formel ablesen: w=
KQ . 4πr2
Konstant sind K und 4π. Wenn wir Q verneunfachen, muss man r verdreifachen, um die gleiche Wirkung zu haben wie zuvor. (14.∞) Aufgaben 14−1 Es sei
Berechnen Sie 14−2 Es sei
√ ⎞ 1− 4t √ ⎜ ⎟ 4 r(t) = ⎝ 1 − t3 ⎠ . √ 4 1 − t5 ⎛
1 0
r(t) dt. ⎛
1
⎞
⎟ ⎜ v (s) = ⎝ − sin s ⎠ . cos s
π
π
Berechnen Sie a) 0 v (s) ds, b) 0 v (s) ds , c) 0π |v (s)| ds. 14−3 Ein Punkt bewegt sich im Raum mit der Geschwindigkeit ⎞ 2t ⎟ ⎜ 2 v (t) = ⎝ 1 − 3t ⎠ . 3 1 + 4t ⎛
Wo ist er zur Zeit t = 2, wenn er zur Zeit t = 0 a) im Nullpunkt, b) im Punkt P (1, −1, 2) war? 14−4 Ein Massenpunkt wird zur Zeit t = 0 vom Nullpunkt aus weggeschossen. Seine Anfangsgeschwindigkeit hat die Richtung ⎛ ⎞ 1 ⎜ ⎟ ⎝8⎠ 4 und den Betrag 36 m/s. Auf ihn wirkt die Erdbeschleunigung (damit es einfache Zahlen gibt, k¨ onnen Sie g = 10 m/sec2 setzen). Dabei zeigt die z–Achse wie u ¨blich nach oben. Der Luftwiderstand wird vernachl¨ assigt. a) Berechnen Sie den Geschwindigkeitsvektor v (t) und den Ortsvektor r(t) zur Zeit t. b) Wann und wo trifft der Massenpunkt wieder auf die x-y– Ebene?
14. Integration von Vektorfunktionen
206
(r) (in der Ebene), indem Sie in den neun Punkten 14−5 Machen Sie sich ein Bild des Vektorfeldes F (r) zeichnen mit origen Vektor F (x1 , x2 ) mit x1 = −1, 0, 1 und x2 = −1, 0, 1 jeweils den zugeh¨ 1 −x − x x (x + 1) 2 2 1 2 2 (r) = (r) = a) F b) F x1 x21 (1 − x2 − x22 ) (r) dr, wobei das Kurvenst¨ 14−6 Berechnen Sie F uck C gegeben ist durch r(t). C
⎞ x2 − x 3 ⎟ (r) = ⎜ F ⎝ x3 − x 1 ⎠ ,
⎛
⎞ 1 ⎜ ⎟ r (t) = ⎝ t ⎠ , t2
⎛
x1 − x 2
t ∈ [0, 1] .
(r) dr, wobei das Kurvenst¨ 14−7 Berechnen Sie C F uck C gegeben ist durch r(t). ⎞ x 1 + x2 ⎜ (r) = ⎝ −x1 + x3 ⎟ F ⎠, x 2 − x3
⎛
⎞ cos t ⎜ ⎟ r (t) = ⎝ sin t ⎠ , sin t
⎛
t ∈ [0, 2π] .
(r) dr f¨ ur 14−8 Es sei C die (orientierte) Strecke von A(1, 0, −1) nach B(2, 1, 0). Berechnen Sie C F ⎛ (r) = ⎜ F ⎝
x21 − 2x2 x 2 x3 x23
⎞ ⎟ ⎠.
+ 2x2
(r) dr f¨ 14−9 Berechnen Sie das Kurvenintegral C F ur das Vektorfeld ⎞ 1 + x1 ⎜ (r) = ⎝ 1 − x3 ⎟ F ⎠. x2 ⎛
Das Kurvenst¨ uck C geht dabei von P (0, 0, 1) nach Q(1, 1, 2), und zwar einmal gem¨ ass a), das zweite Mal gem¨ ass b): ⎛ ⎜ a) r(t) = ⎝
t t 1+t
⎞
⎛
⎟ ⎠
⎜ b) r(t) = ⎝
(0 ≤ t ≤ 1) ,
⎞
t t2 1+
t3
⎟ ⎠
(0 ≤ t ≤ 1) .
14−10 Ein Beispiel in der Ebene: Es sei C der von A(2, 0) nach B(0, 2) laufende Viertelkreis mit Zentrum O, und es sei+ (r) = x1 − x2 . F x1 (r) dr. Berechnen Sie C F
14−11 Noch ein Beispiel in der Ebene. Das Kurvenst¨ uck C sei durch die Gleichung y = x3 − x (−1 ≤ x ≤ 1) gegeben. Berechnen Sie C r dr.
207
D. DIFFERENTIALGLEICHUNGEN 15. DER BEGRIFF DER DIFFERENTIALGLEICHUNG ¨ (15.1) Uberblick In diesem Kapitel wird der Begriff der Differentialgleichung eingef¨ uhrt. An verschiedenen Beispielen werden Auftreten und Bedeutung derartiger Gleichungen erkl¨art.
(15.3)
Anschliessend werden ein paar allgemeine Begriffe erl¨ autert. Im Kapitel 16 werden wir uns dann mit einigen L¨osungsmethoden befassen.
(15.4)
(15.2) Einleitung Viele in der Natur stattfindende Vorg¨ange k¨ onnen durch sogenannte Differentialgleichungen beschrieben werden. Unter einer Differentialgleichung versteht man — zun¨achst ganz grob gesagt — eine Gleichung, in der unbekannte Funktionen, ihre Variablen und ihre Ableitungen vorkommen. Die L¨osungen einer solchen Gleichung sind Funktionen, welche die durch die Gleichung gegebenen Bedingungen erf¨ ullen. Dies ist ein markanter Unterschied zu Gleichungen, wie Sie von fr¨ uher her kennen, wo die L¨ osungen einfach Zahlen sind. Wir gliedern den ganzen Themenkreis in zwei Teile, n¨amlich einerseits das Aufstellen und anderseits das L¨ osen der Differentialgleichung. Beim Aufstellen m¨ ochte man einen bestimmten zu untersuchenden Vorgang durch eine Differentialgleichung beschreiben. Gew¨ ohnlich bildet man sich zu diesem Zweck eine Modellvorstellung (oft unter vereinfachenden Annahmen) und versucht, dieses Modell mathematisch zu formulieren. Es geht hier also darum, einen Vorgang aus der Natur in die Sprache der Mathematik zu u ¨bersetzen und damit einer rechnerischen Behandlung zug¨anglich zu machen. Hat man einmal eine Differentialgleichung aufgestellt, so gilt es, diese zu l¨osen. Dies ist eine rein mathematische, aber oft recht schwierige Aufgabe. Es wird nicht immer m¨ oglich sein, die gesuchten L¨osungsfunktionen der Differentialgleichung mit einer expliziten Formel anzugeben. In Kapitel 16 werden wir aber f¨ ur einige einfache F¨alle ein paar direkte L¨osungsmethoden kennenlernen. Wenn die Differentialgleichung einen Vorgang aus der Natur beschreiben soll, so muss noch nachgepr¨ uft werden, wie gut die gefundene L¨osung den gew¨ unschten Sachverhalt wiedergibt, d.h. wie gut sich die theoretische L¨ osung den experimentell gefundenen Daten anpasst. Dies zeigt dann auch, wie gut das gew¨ahlte Modell (mit seinen vereinfachenden Annahmen) war und ob eventuell Modifikationen n¨otig sind.
© Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0_4
15. Der Begriff der Differentialgleichung
208
(15.3) Beispiele von Differentialgleichungen a) Radioaktiver Zerfall Es geht darum, den Zerfall einer radioaktiven Substanz zu beschreiben. Die einfachste Annahme (Modellvorstellung) ist die, dass in einem bestimmten Zeitraum jedes Atom dieselbe Wahrscheinlichkeit hat, zu zerfallen. Dies bedeutet, dass die Anzahl ΔN der in einem kleinen Zeitraum der L¨ange Δt > 0 zerfallenden Atome proportional ist zur Anzahl N (t) der zur Zeit t vorhandenen Atome sowie zur L¨ange Δt des Zeitintervalls*. Es ist also** ΔN = N (t + Δt) − N (t) = −λN (t)Δt . Dabei ist λ eine Proportionalit¨atskonstante. Man pflegt λ > 0 zu w¨ahlen und muss daher in der Formel ein Minuszeichen einsetzen, weil es sich hier um eine Abnahme handelt und ΔN somit < 0 ist. Es ist also: ΔN = −λN (t) . Δt Der Grenz¨ ubergang Δt → 0 liefert nach der Definition der Ableitung (vgl. (4.2)) (1)
N (t) = −λN (t) .
In dieser Gleichung kommt nun eine unbekannte Funktion N (t) und ihre Ableitung N (t) vor. Es handelt sich also um eine Differentialgleichung f¨ ur N (t). In diesem speziellen Fall l¨asst sich die L¨ osung der Differentialgleichung erraten. Gesucht ist ja eine Funktion, deren Ableitung das (−λ)–fache der Funktion ist. Nun weiss man aber, dass die Ableitung der Exponentialfunktion et gerade die Exponentialfunktion et selbst ist. Der in bezug auf (1) fehlende Faktor −λ l¨ asst sich leicht hineinschmuggeln (innere Ableitung). Man setzt N (t) = e−λt und stellt fest, dass diese Funktion der Differentialgleichung (1) gen¨ ugt. Es ist n¨ amlich N (t) = −λe−λt = −λN (t) . f¨ ur alle t. Dies ist aber nicht die einzige Funktion mit N (t) = −λN (t). Man darf n¨amlich die Exponentialfunktion noch mit einer beliebigen Konstanten C multiplizieren. Auch (∗)
N (t) = Ce−λt
* Setzt man Δt = 1, so ist ΔN = −λN (t). Man beschreibt die vorliegende Situation deshalb auch durch den Ausdruck “die Abnahme pro Zeiteinheit ist proportional zu N (t)”. ** Im Verlauf des Zeitintervalls Δt ¨andert sich N (t). Deshalb k¨onnte ΔN auch proportional zu N (t + Δt) oder gar zu N (τ ) f¨ ur ein τ ∈ [t, t + Δt] angesetzt werden. Da aber anschliessend Δt → 0 geht, f¨ uhren diese komplizierteren Ans¨ atze auf dasselbe Resultat.
15.3 Beispiele von Differentialgleichungen
209
ist eine L¨ osung von (1), denn es gilt N (t) = C(−λ)e−λt = −λN (t) . ost vom Problem des radioaktiven Zerfalls, Eine Zwischenbemerkung: Betrachtet man (1) losgel¨ so kann C eine ganz beliebige Konstante sein. In unserer konkreten Aufgabe ist aber N (t) sicher stets positiv, so dass nur noch C > 0 in Frage kommt.
osungen. Wir werden sp¨ Die Differentialgleichung (1) hat also unendlich viele L¨ ater sehen, dass dies eine allgemeine Tatsache ist. osung N (t) = Ce−λt ? Setzen wir t = 0, Was bedeutet die Konstante C in der L¨ 0 so folgt wegen e = 1, dass N (0) = C ist. Daher ist C gerade die Anzahl Atome zum Zeitpunkt 0. Ist diese Anzahl bekannt, N (0) = N0 , so kommt also von den unendlich amlich vielen L¨osungen nur noch eine in Frage, n¨ N (t) = N0 e−λt .
(∗∗)
ort (N¨aheres dazu Man sagt, dass diese L¨osung zur Anfangsbedingung N (0) = N0 geh¨ in (16.2)). Die L¨osung (∗) mit beliebigem C heisst “allgemeine L¨osung”, die L¨osung osung” zur Anfangsbedingung N (0) = N0 . (∗∗) heisst “spezielle L¨ Man kann nat¨ urlich auch eine Anfangsbedingung mit einem beliebigen Zeitpunkt vorschreiben. Es ∗ ussen dann C so w¨ ahlen, dass N (t∗ ) = Ce−λt = N ∗ sei N ∗ die Anzahl der Atome zur Zeit t∗ . Wir m¨ ∗ ∗ λt ist. Es ist also C = N e zu setzen.
Erg¨anzende Bemerkungen 1) Da wir die L¨ osung von (1) erraten haben, kann man sich fragen, ob es eventuell nicht noch andere L¨ osungen geben k¨ onnte, die wir u ¨ bersehen h¨ atten. Wir zeigen nun, dass dies nicht der Fall ist: Jede L¨ osung muss die Form (∗) N (t) = Ce−λt f¨ ur ein passendes C haben. Zu diesem Zweck nehmen wir an, die Funktion N (t) sei eine L¨ osung von (1). Wir vergleichen diese mit der bereits bekannten L¨ osung e−λt und bilden dazu den Quotienten Q(t) = N (t)/e−λt . Nach der Quotientenregel ist dann Q (t) =
e−λt N (t) + λe−λt N (t) N (t) + λN (t) = . −λt 2 (e ) e−λt
Da aber N (t) nach Voraussetzung eine L¨ osung von (1) ist, ist f¨ ur alle t der Z¨ ahler N (t) + λN (t) = ur alle t und deshalb muss Q(t) eine konstante Funktion sein (vgl. 0. Somit ist auch Q (t) = 0, f¨ (6.3.c)), es ist Q(t) = C f¨ ur ein passendes C. Dann ist aber N (t) = Ce−λt , was behauptet wurde. 2) Streng genommen ist die Anzahl N (t) stets eine (wenn auch sehr grosse) ganze Zahl, und die Funktion N (t) macht bei jedem Zerfall einen Sprung. Sie ist also nicht differenzierbar, so dass achst gar nicht sinnvoll ist. Wie schon in (4.6.h) die Differentialgleichung (1) N (t) = −λN (t) zun¨ beschrieben, behilft man sich mit einer Idealisierung: Man stellt sich N (t) als differenzierbare Funktion vor, was nur eine minime Abweichung von der effektiven Situation ergibt, weil die Anzahl der Atome ja ungeheuer gross ist. (In der Praxis wird N (t) ohnehin nicht die Anzahl der Atome sein, sondern die dazu proportionale Masse, in einer geeigneten Einheit.) Eine analoge Situation liegt auch in andern F¨ allen vor, so etwa im folgenden Beispiel.
15. Der Begriff der Differentialgleichung
210
b) Wachstum von Populationen Hier sei N (t) die (im eben erw¨ ahnten Sinn als differenzierbare Funktion aufgefasste) Zahl der Individuen einer Population zur Zeit t (oder ein anderes geeignetes Mass f¨ ur die Gr¨osse der Population). Nach (3.3) ist dann N (t) die Wachstumsgeschwindigkeit zur Zeit t. Es ist ΔN N (t) = lim , Δt→0 Δt wo ΔN/Δt die mittlere Zunahme pro Zeiteinheit ist. Nehmen wir als einfachstes Modell an, dass dieser mittlere Zuwachs (und damit die Wachstumsgeschwindigkeit) proportional zur Zahl der vorhandenen Individuen sei, so erhalten wir die folgende Differentialgleichung mit dem Proportionalit¨atsfaktor a: N (t) = aN (t),
(2)
a>0.
Dieses Modell beschreibt ein unbeschr¨ anktes Wachstum. Man spricht von exponentiellem Wachstum, denn N (t) = Ceat ist eine L¨ osung von (2), siehe die Skizze unten. Da dieses unbeschr¨ ankte Wachstum — zumindest l¨angerfristig gesehen — nicht realistisch ist, kann man mit einer anderen Modellvorstellung annehmen, dass es eine feste obere Schranke B > N (t) f¨ ur die Zahl der Individuen gibt und dass die Population um so langsamer w¨ achst, je n¨aher N (t) an B herankommt. Diese Idee l¨ asst sich mit einer Proportionalit¨ atskonstanten b formelm¨assig so ausdr¨ ucken: (3)
N (t) = b(B − N (t)),
b > 0, B > 0 .
Tats¨achlich wird hier die Wachstumsgeschwindigkeit um so kleiner, je n¨aher N (t) an B herankommt. Dieses Modell hat aber den folgenden Nachteil: Am Anfang des Prozesses, d.h. wenn N (t) sehr klein ist, gilt ungef¨ ahr N (t) ≈ bB , d.h., die Wachstumsgeschwindigkeit ist dann konstant, w¨ahrend man doch am Anfang, bei wenig Individuen, noch keine Einschr¨ankung des Wachstums und somit eher ein exponentielles Wachstum in der Art der Gleichung (2) erwartet. Um auch noch diese Vorstellung zu verwirklichen, kombiniert man (2) und (3) und erh¨ alt (4)
N (t) =
c N (t)(B − N (t)), B
c > 0, B > 0 .
Nebenbemerkung: Weil hier mit N (t)(B − N (t)) zwei Faktoren der gleichen Magnitude B (bzw N ) miteinander multipliziert werden, ist es sinnvoll, im Vergleich zu (2) und (3) die Konstante c noch durch B zu teilen.
15.3 Beispiele von Differentialgleichungen
211
Hier wird man also mit einem Wachstum rechnen, das anfangs ungef¨ ahr exponentiell ist und sp¨ater immer langsamer wird. osungen der Gleichungen (3) und (4) lassen sich nicht mehr wie im Falle Die L¨ osungen mit von (1) oder (2) einfach erraten. Wir werden aber in der Lage sein, die L¨ passenden Methoden zu bestimmen (vgl. (16.8) und (16.12)). Der qualitative Verlauf ist in den folgenden Skizzen dargestellt: N N N B B
(2)
t
(3)
t
(4)
t
Beachten Sie, dass das Wachstum gem¨ass (4) wie erhofft zuerst rasch und dann immer langsamer ist und dass die Gr¨ osse der Population gegen eine gewisse obere Grenze strebt. Wir haben in den obigen Beispielen von der Wachstumsgeschwindigkeit gesprochen. Daneben gibt es noch den Begriff der Wachstumsrate, die als Quotient 1 dN N (t) = N (t) N dt definiert ist. Die Differentialgleichung (2) beschreibt den Fall, wo diese Wachstumsrate konstant ist, in der Gleichung (4) ist sie eine lineare Funktion von N . Noch etwas zur Terminologie: Wie schon in (3.3) erw¨ ahnt, brauchen manche Autoren das Wort Wachstumsrate f¨ ur N (t) (also die Gr¨ osse, die hier Wachstumsgeschwindigkeit heisst). Den Quotienten N (t)/N (t) nennt man dann relative oder spezifische Wachstumsrate. Es heisst also aufpassen.
c) Ausbreitung einer Infektion Die Differentialgleichung (4) kann auch in einem anderen Zusammenhang erhalten werden: Es sei B die Anzahl der Individuen einer Population, in welcher eine ansteckende Krankheit umgeht. Zur Zeit t seien N (t) Individuen infiziert. Unsere Modellvorstellung ist die, dass die Wachstumsgeschwindigkeit N (t) proportional zur Anzahl der gen¨ ugend engen Kontakte zwischen Kranken und Gesunden ist und dass diese Anzahl Kontakte ihrerseits proportional zur Anzahl N (t) der Kranken und zum Anteil B − N (t) B der Gesunden ist. Mit dem Proportionalit¨atsfaktor c finden wir die schon in b) genannte Differentialgleichung B − N (t) N (t) = cN (t) . B
15. Der Begriff der Differentialgleichung
212
ur weitere stillschweigende Annahmen getroffen werden m¨ Man kann sich u ¨berlegen, was f¨ ussen, damit der obige Ansatz gemacht werden darf: So wird angenommen, dass die Krankheit unheilbar ist (eine Abnahme von N (t) infolge Gesundung ist nicht ber¨ ucksichtigt), dass sie aber nicht t¨ odlich ist (die Gesamtzahl B der Population ist konstant) usw.
d) Ein einfacher Schwingungsvorgang
x 0 Ein Massenpunkt (Masse m) sei an zwei gleich langen, homogenen Federn zwischen zwei festen W¨anden aufgeh¨angt. Die Schwerkraft soll vernachl¨ assigt werden. Zur Zeit t sei der Massenpunkt an der Stelle x = x(t). Dann ist die auf ihn wirkende Federkraft proportional zu x (vgl. (9.3)): F = −kx,
k>0.
(Das Minuszeichen sagt aus, dass diese Kraft bei positivem x nach links gerichtet ist.) Anderseits ist diese Kraft gleich “Masse mal Beschleunigung”. Dabei ist die Beschleunigung a(t) gegeben durch a(t) = x ¨(t). (Die Ableitung nach der Zeit bezeichnet man in der Physik bekanntlich gerne mit Punkten.) Es gilt daher: m¨ x(t) = −kx(t),
(5)
k>0.
Dies ist eine Differentialgleichung f¨ ur x(t). Neben der Schwerkraft ist auch die Reibung vernachl¨ assigt worden. Sie sucht ebenfalls die Auslenkung aus der Ruhelage zu verhindern. In erster N¨aherung ist sie proportional zur Geschwindigkeit x(t). ˙ Ber¨ ucksichtigt man diese Reibung, so erh¨ alt man die Differentialgleichung der ged¨ ampften Schwingung (6)
m¨ x(t) = −kx(t) − rx(t), ˙
k, r > 0 .
Wir werden die Differentialgleichungen (5) und (6) hier nicht l¨ osen, sondern verweisen auf die Literatur. e) Bimolekulare Reaktionen Wir betrachten eine in einer L¨ osung ablaufende chemische Reaktion der Form A + B −→ C ,
213
15.3 Beispiele von Differentialgleichungen
ul der Substanz A mit einem Molek¨ ul der Substanz B reagiert und ein wobei ein Molek¨ Molek¨ ul der Substanz C ergibt. Die Konzentration des Stoffes A zur Zeit t = 0 sei a, jene von B sei b. Dabei wird die Konzentration in Mol pro Volumeneinheit, z.B. in Mol/Liter, gemessen. Da die Stoffe A und B miteinander reagieren, nehmen ihre Konzentrationen bis zur Zeit t jeweils um x(t) ab, sie betragen also zu dieser Zeit a − x(t) bzw. b − x(t).* Das sogenannte Massenwirkungsgesetz besagt nun, dass die Reaktionsgeschwindigkeit, n¨amlich x (t), proportional zu a−x(t) und zu b−x(t) ist. Damit k¨ onnen wir die folgende Differentialgleichung aufstellen: x (t) = K(a − x(t))(b − x(t)),
(7)
K>0.
Dabei ist K > 0, weil die umgesetzte Menge x(t) mit der Zeit t zunimmt. In (16.12) osen kann. wird angegeben, wie man (7) l¨ f) Eine geometrische Aufgabe y Gesucht sind die Kurven mit der Eigenschaft, dass die Tangente in jedem Punkt P (x, y) der Kurve die x– Achse im Punkt (x/2, 0) schneidet. Wir fassen dazu die Kurve als Graph einer vorl¨ aufig unbekannten Funktion f (x) auf und beschr¨ anken uns dabei auf den Fall x > 0. Die Tangente im Punkt P hat die Steigung y = f (x). Damit sie durch den Punkt (x/2, 0) geht, muss ihre Steigung aber auch gleich
y
P
y 2y 2f (x) = = x/2 x x sein.
0
Dies f¨ uhrt auf die Beziehung f (x) =
2f (x) , x
x x/2
x
x>0
oder kurz (8)
y =
2y , x
x>0.
In (16.5.b) werden wir sehen, dass die L¨osungen (quadratische) Parabeln sind. * Da die Konzentration in Mol/Volumeneinheit gemessen wird, nehmen die Konzentrationen beider Stoffe A und B um dieselbe Gr¨ osse, n¨ amlich x(t) ab, denn es reagiert je ein Molek¨ ul von B mit einem von A. Die Konzentration von C nimmt dabei um x(t) zu.
15. Der Begriff der Differentialgleichung
214
(15.4) Allgemeines u ¨ber Differentialgleichungen Wir haben nun eine ganze Reihe von Beispielen kennengelernt und wollen dazu einige allgemeine Betrachtungen anstellen. a) Wie wir jetzt wissen, ist eine Differentialgleichung eine Gleichung, in der eine unbekannte Funktion zusammen mit ihren Ableitungen (und den Variablen) vorkommt. Wir unterscheiden zun¨achst: • Gew¨ohnliche Differentialgleichungen: Die gesuchte Funktion ist eine Funktion von einer Variablen. • Partielle Differentialgleichungen: Die gesuchte Funktion ist eine Funktion von mehreren Variablen (und die vorkommenden Ableitungen sind demzufolge partielle Ableitungen, wie wir sie in Kapitel 23 antreffen werden). Wir werden uns hier u ¨berhaupt nicht mit partiellen Differentialgleichungen befassen und verstehen von nun an unter dem Begriff “Differentialgleichung” stets eine gew¨ ohnliche Differentialgleichung. Neben einzelnen Differentialgleichungen betrachtet man auch Systeme von mehreren Differentialgleichungen f¨ ur mehrere unbekannte Funktionen, genauso, wie man auch Systeme von gew¨ ohnlichen Gleichungen f¨ ur zwei oder mehr Unbekannte betrachtet. Mit Systemen von mehreren Differentialgleichungen kann man sehr leistungsf¨ ahige Modelle aufstellen. Wir werden das lediglich in diesem Kapitel am Schluss betrachten, aber nicht die L¨ osungsmethoden dazu erlernen.
b) In den Beispielen von (15.3) hiessen die gesuchten Funktionen N (t), x(t), K(t), f (x). F¨ ur die allgemeinen Untersuchungen wollen wir die Variable stets mit x, die gesuchte Funktion mit y = y(x) bezeichnen. Die Differentialgleichungen aus (15.3) lauten dann: (1) (2) (3)
y = −λy y = ay y = b(B − y)
(5) (6) (7)
(4)
y = cy(B − y)
(8)
my = −ky my = −ky − ry y = K(a − y)(b − y) 2y y = x
Wie man sieht, stimmen die Gleichungen (1) und (2) bis auf die Bezeichnung der Konstanten u ¨berein. c) Unter der Ordnung einer Differentialgleichung versteht man die Ordnung der h¨ ochsten vorkommenden Ableitung. Die Gleichungen (1), (2), (3), (4), (7) und (8) sind von 1. Ordnung, dagegen sind (5) und (6) von 2. Ordnung. d) F¨ ur den Rest unserer Behandlung der Differentialgleichungen beschr¨anken wir uns auf Differentialgleichungen 1. Ordnung und setzen zudem voraus, dass diese in expliziter Form, d.h. aufgel¨ost nach y , gegeben seien. Dies ist f¨ ur alle Gleichungen 1. Ordnung aus den Beispielen (1) bis (4) sowie (7) und (8) der Fall.
215
15.4 Allgemeines u ¨ber Differentialgleichungen
ur eine nicht explizite Differentialgleichung 1. Ordnung w¨ Ein Beispiel f¨ are etwa y + sin y = x + y .
Die allgemeine Form einer expliziten Differentialgleichung 1. Ordnung lautet also y = F (x, y) , wo F eine Funktion von zwei Variablen ist. Solche Funktionen werden “offiziell” zwar erst in Kapitel 22 behandelt, es d¨ urfte aber klar sein, worum es geht. Beispiele werden wir zur Gen¨ uge sehen, wie etwa 2y (vgl. (8)) x y = x − y + 1, usw. . y =
e) Um Missverst¨andnissen vorzubeugen, sei noch folgendes bemerkt: Die Beispiele (1) bis (4) und (7) sind insofern nicht ganz typisch, als dort die rechte Seite F stets eine Funktion von y allein ist. Dieser Spezialfall ordnet sich aber der allgemeinen Theorie unter, ebenso wie jener, wo die rechte Seite nur von x abh¨ angt, wie z.B. y = 2x . Dagegen kommt in der rechten Seite von (8) sowohl x als auch y vor. f) Wir halten hier noch formell fest, was man unter einer L¨osung der Differentialgleichung y = F (x, y) versteht: Eine (auf einer gewissen Teilmenge D von R definierte) Funktion y = f (x) heisst L¨ osung dieser Differentialgleichung, wenn f¨ ur alle x aus dem Definitionsbereich D gilt f (x) = F (x, f (x)) . g) In Kapitel 16 werden wir einige L¨osungsverfahren f¨ ur Differentialgleichungen kennenlernen. Diese Beispiele werden immer explizit l¨ osbar sein, d.h. eine L¨osung in der Form y = f (x) haben, wo f eine “wohlbekannte” Funktion (z.B. eine elementare Funktion im Sinne von (5.6)) ist. Um falschen Vorstellungen aus dem Weg zu gehen, sei darauf hingewiesen, dass dies nicht im2 mer so sein muss. So hat z.B. die Differentialgleichung y = e−x sicher eine L¨ osung, n¨ amlich
15. Der Begriff der Differentialgleichung
216
2
2
eine Stammfunktion von e−x . Wir wissen aber von (12.3.e) her, dass e−x keine elementare osung, die sich mit den bekannten Stammfunktion hat, die Differentialgleichung hat also keine L¨ ucken l¨ elementaren Funktionen ausdr¨ asst. Es gibt in der Tat viele Differentialgleichungen, die auf uhren. neue, nicht elementare Funktionen f¨ In der (sehr weit ausgebauten) allgemeinen Theorie der Differentialgleichungen geht es denn auch weniger darum, explizite, formelm¨ assige L¨ osungen zu finden. Vielmehr untersucht man, ob eine ¨ berhaupt eine L¨ Differentialgleichung u osung hat, ob diese (bei gegebener Anfangsbedingung) osungen in bestimmten Situationen (z.B. f¨ eindeutig bestimmt ist, wie sich die L¨ ur x → ∞) verhalten usw.
Schliesslich sei noch erw¨ahnt, dass es auch numerische Verfahren gibt, welche es erlauben, die L¨ osungen einer Differentialgleichung n¨aherungsweise tabellarisch oder graphisch anzugeben. Wir werden in Kapitel 21 kurz darauf eintreten. (15.5) Systeme von Differentialgleichungen Anhand der Ausbreitung einer Epidemie soll auch allgemein aufgezeigt werden, wie mit Differentialgleichungen Ph¨anomene der realen Welt modelliert werden k¨onnen. Bekanntlich besucht uns im Winter regelm¨assig Influenza A. Die (potentielle) Epidemie beginnt mit ein paar wenigen F¨allen. Dann kann eine regelrechte Explosion der Krankheitsf¨ alle stattfinden. Nach ein paar Wochen hat es dann wieder nur ein paar wenige F¨alle; die Epidemie klingt aus. Wir wissen zudem, dass ein paar Menschen gar nicht infiziert werden. Wir sind am Anfang einer solchen Epidemie daran interessiert zu wissen, wie viele Personen infiziert werden, wie viele Menschen maximal gleichzeitig infiziert sein werden und wann die Epidemie etwa vor¨ uber sein wird. Die Gesundheitsbeh¨ orden werden erste Vorhersagen machen, bei welchen sie sich auf die Erfahrungen von anderen L¨ andern st¨ utzen oder von vergangenen Jahren. Aber solche Vorhersagen k¨onnen sehr unpr¨ azise sein, wenn man nicht ber¨ ucksichtigt, was genau vor sich geht. Hier k¨onnen mathematische Modelle Abhilfe schaffen: mathematische Modelle erlauben die Beschreibung des Verhaltens von Systemen, welche zu kompliziert sind, um sie allein in nat¨ urlicher Sprache zu beschreiben. Weiter kann man versuchen, damit das Verhalten in der Zukunft vorherzusagen. Die Sprache der Mathematik (Differentialgleichungen und Stochastische Prozesse) ist universell in dem Sinne, dass wir damit Prozesse der Physik, Chemie, Biologie, Medizin, Ingenieur-Wissenschaften und Wirtschafts-Wissenschaften beschreiben k¨onnen. Diese Modelle m¨ ussen jedoch zuerst aufgestellt werden: * nachdem ein Ph¨anomen in nat¨ urlicher Sprache beschrieben wurde, * muss die relevante Information in die Sprache der Mathematik u ¨bersetzt werden. Dies nennt man Modellieren. Sobald das Modell steht, kann der ganze Apparat der (reinen und angewandten) Mathematik eingesetzt werden, um das Modell zu analysieren. Die Folgerungen, welche man dann zieht, m¨ ussen danach wieder in die nat¨ urliche
15.5 Systeme von Differentialgleichungen
217
Sprache r¨ uck¨ ubersetzt werden. In obigem Beispiel wird also zuerst eine Fachperson aus aren m¨ ussen, wie der heutige Wissensstand der Medizin der Mathematik ganz genau erkl¨ u ¨ber die Ausbreitung von Influenza A ist. Erfahrene BeraterInnen aus allen Gebieten wissen es: Dies ist ein ganz wichtiger Prozess. Warum? Mathematikerinnen und Mathematiker werden nicht angestellt um zu wissen, sondern um zu denken und hinterfragen. Wenn eine Fachperson einer quantioglichen Gegenfragen), tativ geschulten Person das Problem erkl¨aren muss (mit allen m¨ wird die Fachperson selber viel dazulernen. Zudem muss man sich bewusst sein, dass das “Wissen” ausserhalb der Mathematik unterschiedlich gesichert ist. Es geistern viele Halbwahrheiten, Vermutungen und richtige Theorien herum. In unserem Beispiel kann das Problem folgendermassen beschrieben werden: ein ganz kleiner Anteil der Bev¨olkerung des uns interessierenden Landes ist mit einem Virus olkerung hat die infiziert und kann andere Personen infizieren. Die bereits betroffene Bev¨ Infektion aufgelesen, indem sie in ferne L¨ ander gereist ist oder Kontakt mit Personen aus uchtlinge). Die Infektion wird diesen L¨andern gepflegt hat (Touristen, Gesch¨ aftsleute, Fl¨ eventuell weitergegeben, falls der Kontakt eng genug ist und die potentiell neu infizierte Person empf¨anglich f¨ ur die Infektion ist. Danach kann die neu infizierte Person selber weitere Personen infizieren. Nach einer gewissen Zeit sind die Personen wieder gesund; onnen a) keine weiteren Personen mehr infizieren und sind b) selber nicht mehr sie k¨ anglich. Dies mag die Beschreibung der Medizin sein. Obige Fakten sind in der empf¨ Schulmedizin akzeptiert. Nachdem wir also eine Beschreibung des Ausbreitungsmechanismus in nat¨ urlicher Sprache erhalten haben, wollen wir diesen Mechanismus modellieren (mit Differentialglei¨bersetzen wir obige Erchungen). Wir machen hierbei folgende Annahmen; dabei u urlicher Sprache in die Sprache der Mathematik: kl¨ arungen sukzessive von der nat¨ Wir f¨ uhren drei Variablen S(t), I(t) und R(t) ein, wobei diese Variablen die Anteile osen (Infectives, der Gesamtbev¨ olkerung von Empf¨anglichen (Susceptibles, S(t)), Infekti¨ I(t)) und Entfernten (Removed, R(t)) zur Zeit t angeben. Wir wollen dies pr¨ azisieren: Mit “susceptibles” meinen wir Menschen, welche mit dem Virus infiziert werden k¨onnen, wenn sie Pech haben; mit “infectives” meinen wir kranke Menschen, welche das Virus noch weitergeben k¨ onnen; mit “removed” meinen wir sowohl Personen, welche von Anfang an immun waren, oder isoliert wurden, oder gestorben sind oder nach Krankheit wieder genesen und jetzt erst immun sind (von der mathematischen Modellierung her urlich nicht!). Damit haben wir ganz ist das alles gleich - vom realen Erleben her nat¨ sicher f¨ ur alle t ≥ 0, dass S(t) + I(t) + R(t) = 1 und 0 ≤ S(t), I(t), R(t) ≤ 1. Wir f¨ uhren jetzt zwei Parameter ein: λ und μ; λ, μ > 0. Wir geben damit an, mit welcher Rate die Menschen potentiell infekti¨ ose Kontakte machen (λ) und mit welcher Rate die anglicher Menschen genesen (μ). Eine Infektion kann nur stattfinden, wenn ein Empf¨
15. Der Begriff der Differentialgleichung
218
einen genug engen Kontakt mit einem Infekti¨osen hat. Die Rate, mit der der Anteil der Emf¨anglichen schrumpft, kann deshalb mit λS(t)I(t) modelliert werden. Des Weiteren ose genesen. Damit steigt der Anteil der Entfernten an der Gesamtk¨onnen nur Infekti¨ olkerung mit Rate μI(t). Diese Modellierungsannahmen fassen wir in folgendem bev¨ System von Differentialgleichungen zusammen: dS(t) = −λS(t)I(t) dt dI(t) = λS(t)I(t) − μI(t) = I(t)[λS(t) − μ] dt dR(t) = μI(t). dt
(SIR)
Die Ableitungen auf der rechten Seite summieren auf 0; dies sollte auch sein, da ja S(t) + I(t) + R(t) = 1 f¨ ur alle t ≥ 0. Bemerkung: In Modell (SIR) ist implizit die Annahme eingebaut, dass die Menschen unendlich schnell sich wieder mischen. Sobald ein kleiner Anteil von S zu I gewechselt ¨ hat, kommt er voll in der ersten Ubergangsrate λS(t)I(t) zum Einsatz! Nachdem wir das Modell aufgestellt haben, wollen wir es analysieren. Wir setzen voraus, dass I(t) > 0 f¨ ur alle t ≥ 0. Von der zweiten Gleichung sehen wir, dass der Anteil der Infekti¨osen zunimmt solange λS(t) − μ > 0; andernfalls nimmt dieser Anteil ab. Falls nun S(t) fast 1 ist (z.B. am Anfang einer Epidemie) dann sind I(t) und R(t) fast 0, also gibt es kaum Personen, welche die Infektion einschleppen und kaum jemand ist von Anfang an immun. Dann ist es sogar so, dass der Anteil der Infekti¨ osen zunimmt, falls λ−μ>0⇔λ>μ und damit λ/μ > 1 (das Gegenteil geschieht falls λ/μ < 1). Offenbar ist λ/μ eine kritische Gr¨osse, um zu beurteilen, wie sich diese Epidemie entwickeln wird. Wir nennen sie englisch Basic Reproduction Ratio R0 ; R0 = λ/μ. R0 ist allgemein in einem Modell die durchschnittliche Anzahl Personen, welche eine infizierte Person selber infiziert, solange sie infekti¨ os ist, unter der Annahme, dass jeder Kontakt mit einer empf¨ anglichen Person ist (optimales Umfeld; hier S(t)=1). ˙ Eine Frage der Medizin haben wir hiermit bereits beantwortet: Falls R0 < 1 wird es keinen Ausbruch geben. Ein paar Menschen werden allenfalls noch infiziert werden, dann ist die “Epidemie” vorbei. Falls R0 > 1, so gibt es ein starkes Ansteigen der
15.5 Systeme von Differentialgleichungen
219
Anzahl Infizierten. Der “Peak” wird erreicht sein, sobald λS(t) − μ = 0. 1
S(t)
S(t)
Anteil der Bevölkerung
Anteil der Bevölkerung
1
I(t)
0.8
R(t) 0.6
0.4
0.2
I(t)
0.8
R(t) 0.6
0.4
0.2
0
0 0
1
2
3
4
Zeit
5
6
0
2
4
6
8
10
Zeit
Die Entwicklung von (SIR) kann in einem Computer gut simuliert werden. Wir haben mit “Mathematica” zwei Simulationen mit unterschiedlichen Startwerten (S(0), I(0), R(0)) durchgef¨ uhrt. Man findet sie in den beiden Diagrammen. Diagramm I zeigt eine typische Situation, in der S(0) = 0.9, I(0) = 0.01 und R(0) = 0.09. Die Parameter haben Werte λ = 5, μ = 3. Wir beobachten einen vollen Ausbruch und weniger als 40% (S(∞)) der Empf¨ anglichen werden nie Influenza A bekommen (in unserem Modell). Diagramm II beschreibt die Situation, wo rechtzeitig ein Impfprogramm lanciert wurde. Mit gleichem Anteil Infizierten am Anfang wie bei Diagramm I haben wir S(0) = 0.66, I(0) = 0.01 und R(0) = 0.33, mit λ und μ unver¨ andert. Also ist 1/3 der Bev¨ olkerung geimpft worden (oder war schon immun/isoliert). Es gibt immer noch einen (kleinen) Ausbruch. Aber wenn man die beiden Diagramme vergleicht, sieht man, dass das Impfprogramm viel bewirkt hat. Diese Simulationen geben uns also eine Vorstellung, wie solche Epidemien ablaufen. ¨ Uberraschend ist, dass das Maximum (¨ uber die Zeit) an Infizierten gar nicht so hoch ist (das liegt am relativ grossen μ). Dies war nur ein einf¨ uhrendes Beispiel - wir wollen nicht allzu lange dabei verweilen. Trotzdem sei noch angef¨ ugt, wie man in der Praxis fortfahren w¨ urde. Man will u ¨berpr¨ ufen, ob dieses Modell nahe genug an der Realit¨ at ist. Was “Nahe sein” konkret heisst, ist von der Fragestellung abh¨ angig! Auf jeden Fall wird man dazu Daten brauchen. 1. Wir m¨ ussen wissen, wieviele Menschen am Anfang bereits immun sind (R(0)). Dies ist aber anders von Fall zu Fall, je nach dem welches Virus untersucht wird. Weiter ist dies abh¨ angig von der genetischen und immunologischen Situation der uns interessierenden Bev¨ olkerung. 2. Die Genesungsrate (μ) ist ebenfalls abh¨ angig von der genetischen und immunologischen Situation der uns interessierenden Bev¨olkerung und der Behandlung, welche kranken Leuten zu Teil wird.
220
15. Der Begriff der Differentialgleichung
3. Die Kontaktrate (λ) h¨angt davon ab, wie einfach die Infektion von Person zu Person u ¨bertragen werden kann und wie mobil die Menschen sind. Erinnern Sie sich ans Mittelalter: Es dauerte Jahre, bis eine Epidemie von einem Ende in Europa zum anderen kam. atzen oder von fr¨ Man kann versuchen, solche Gr¨ ossen zu sch¨ uheren Epidemien oder vom Ausland her Parameter u ¨bernehmen. Falls erwartet werden kann, dass die vorhergesagte Entwicklung der Epidemie und der tats¨ achliche Verlauf einigermassen u ¨bereinstimmen, k¨onnen Gegenmassnahmen mit Model (SIR) diskutiert werden: μ kann kaum beeinane verordnen kann. Man flusst werden, ausser dass man infizierten Personen Quarant¨ kann wie bereits besprochen ein Impfprogramm vor Ausbruch der Epidemie starten. Damit steigern wir R(0) und senken S(0). Da die Entwicklung von I(t) von λS(t) − μ abh¨ angt, ist eine Milderung zu erwarten. Individuell k¨onnen Personen m¨oglichen Infektionen vorbeugen, indem Sie eher zu Hause bleiben, ¨offentliche Verkehrsmittel meiden und diverse andere Massnahmen ergreifen. Dies senkt λ. Falls die vorhergesagte Entwicklung und die tats¨ achliche Entwicklung vollkommen auseinanderklaffen, m¨ ussen die Annahmen u ¨berpr¨ uft werden. Aber mathematische Modelle sollten nicht zu kompliziert gemacht werden, weil sonst die Analyse zu schwierig wird. Neben der Schwierigkeit der Analyse darf weiter nicht untersch¨ atzt werden, dass man die Resultate auch interpretieren k¨ onnen muss. Bei (SIR) war dies sehr einfach und sehr sch¨on, oder? Und die Moral oglich, von der Geschichte ist: Machen Sie mathematische Modelle so einfach wie nur m¨ aber nie einfacher. (15.∞) Aufgaben In den Aufgaben 15−1 bis 15−7 geht es darum, Differentialgleichungen aufzustellen. Eine L¨ osung dieser Gleichung wird nicht verlangt. 15−1 Wachstum mit Zuwanderung: Eine Population vermehrt sich mit einer Wachstumsgeschwindigkeit, welche proportional zur jeweiligen Gr¨ osse N (t) der Population ist. Zus¨ atzlich findet aber noch eine zeitlich gleichf¨ ormige Zuwanderung statt. Stellen Sie eine Differentialgleichung f¨ ur N (t) auf. 15−2 Wir nehmen an, eine Bakterienkultur wachse exponentiell, wenn sie nicht gest¨ ort wird. Nun sei aber ein Toxin vorhanden, dessen Konzentration T (t) im Verlauf der Zeit variiert. Es ist vern¨ unftig anzunehmen, die Anzahl der in einem kleinen Zeitintervall vernichteten Bakterien sei proportional zur Anzahl der vorhandenen Bakterien, zur gerade herrschenden Konzentration des Toxins und zur L¨ ange des Zeitintervalls. Stellen Sie eine Differentialgleichung f¨ ur die Anzahl N (t) der Bakterien zur Zeit t auf. 15−3 Wir nehmen an, beim freien Fall in der Luft sei der Luftwiderstand proportional zum Quadrat der Geschwindigkeit v = v(t). Stellen Sie nun eine Differentialgleichung f¨ ur v(t) und eine solche f¨ ur die zur¨ uckgelegte Strecke s(t) auf. Beachten Sie dabei, dass v(t) ˙ die Beschleunigung ist (der fallende K¨ orper habe die Masse m, die Erdbeschleunigung bezeichnen wir wie u ¨ blich mit g). 15−4 Wir nehmen an, die Wachstumsgeschwindigkeit f¨ ur die H¨ ohe h einer Pflanze sei proportional zur H¨ ohe (je h¨ oher die Pflanze, desto rascher w¨ achst sie) und umgekehrt proportional zur 3.
15.∞ Aufgaben
221
Potenz ihres Alters t (zunehmendes Alter verringert die Wachstumsbereitschaft). Stellen Sie eine Differentialgleichung f¨ ur die Funktion h(t) auf. 15−5 Das Wachstum einer Zelle h¨ ache eindringenden Substanzen ab. angt von den durch ihre Oberfl¨ ¨ Wir bezeichnen das Zellvolumen zur Zeit t mit V (t). Wir wollen nun annehmen, die Anderungsgeschwindigkeit des Volumens der als kugelf¨ ormig angenommenen Zelle sei proportional zu ihrer Oberfl¨ ache. Stellen Sie eine Differentialgleichung f¨ ur V (t) auf. orperl¨ 15−6 An einem Lebewesen werden gleichzeitig zwei Gr¨ ange ossen x und y gemessen, z.B. K¨ ¨ndern sich diese Gr¨ ange des Arms. Im Zeitintervall [t, t + Δt] a ossen um Δx bzw. Δy. und L¨ x bzw. Δy definiert. Unter der Die mittlere Wachstumsgeschwindigkeit ist wie u ¨blich durch Δ Δt Δt mittleren Wachstumsrate (vgl. den Schluss von (15.3.b)) versteht man die Ausdr¨ ucke 1 Δy 1 Δx bzw. . x Δt y Δt In manchen F¨ allen wird beobachtet, dass diese beiden Raten zueinander proportional sind. Man spricht dann von allometrischem Wachstum. a) Dr¨ ucken Sie diesen Sachverhalt formelm¨ assig aus. b) Eliminieren Sie Δt, und gewinnen Sie durch Grenz¨ ubergang eine Differentialgleichung f¨ ur y als Funktion von x. y 15−7 Gesucht sind die Funktionen y = f (x), mit der Eigenschaft, dass das Tangentenst¨ uck zwischen der y– und der x–Achse stets vom Ber¨ uhrungspunkt P halbiert wird. Stellen Sie eine Differentialgleichung f¨ ur y auf.
P
x 0 Die folgenden Aufgaben sollen zeigen, dass es zwar schwierig sein kann, die L¨ osung einer Differentialgleichung zu finden, dass aber eine Kontrolle stets m¨ oglich ist. osung der folgenden Differentialgleichung ist: 15−8 Zeigen Sie, dass f (x) = 2x/(2 − x2 ) eine L¨ y = y2 +
y . x
15−9 Zeigen Sie, dass f (x) = (1−2x)e−x eine L¨ osung der folgenden Differentialgleichung 2. Ordnung ist: y + 2y + y = 0 .
222
¨ 16. EINIGE LOSUNGSMETHODEN ¨ (16.1) Uberblick Eine Differentialgleichung besitzt — sofern sie u ¨berhaupt l¨osbar ist — unendlich viele L¨ osungen. Dies ¨aussert sich darin, dass in der sogenannten allgemeinen L¨osung eine Konstante steckt, die man noch passend w¨ahlen kann. Meist geschieht die Festlegung dieser Konstanten dadurch, dass man eine sogenannte Anfangsbedingung vorschreibt, d.h., man gibt sich ein Zahlenpaar (x0 , y0 ) und verlangt von der L¨osungsfunktion f (x), dass f (x0 ) = y0 ist. Auf diese Weise erh¨ alt man die spezielle L¨osung der Differentialgleichung zur gegebenen Anfangsbedingung. Das Richtungsfeld erm¨ oglicht es, eine geometrische Vorstellung vom Verlauf der L¨osungen einer Differentialgleichung zu erhalten, ohne dass die Gleichung gel¨ ost werden muss.
(16.2) (16.2) (16.2) (16.3)
An konkreten L¨osungsverfahren lernen wir kennen: • L¨ osung der linearen Differentialgleichung
(16.5), (16.6)
y = p(x)y + q(x) mit der Methode der Variation der Konstanten. • Die sogenannte Separation der Variablen f¨ ur Gleichungen der Form
(16.9), (16.10)
y = r(x)s(y) . Schliesslich wird die Differentialgleichung
(16.12)
y = a(A − y)(B − y) behandelt, welche in einem Spezialfall, der mit einer Form des eingeschr¨ankten Wachstums zusammenh¨ angt, die sogenannte logistische Funktion als L¨ osung hat. (16.2) Anfangsbedingungen Gem¨ ass (15.4.d) hat eine explizite Differentialgleichung 1. Ordnung die Form y = F (x, y) , und wir beschr¨anken uns hier auf derartige Gleichungen.
16.2 Anfangsbedingungen
223
asst sich eine solche Differentialgleichung durch Erraten l¨ In einfachen F¨ osen: allen l¨ 1. y = 2x. 2. y = y. 3. y = 2xy.
L¨osung: y = x2 + C, L¨osung: y = Cex , 2 osung: y = Cex , L¨
denn y = 2x. denn y = Cex = y. 2 denn y = 2x · Cex = 2xy.
Im Beispiel 1. ist die L¨osung nichts anderes als eine Stammfunktion von 2x. Diese findet man im Prinzip durch Integrieren. Auch bei anderen Differentialgleichungen wird man durch Integrationsprozesse zur L¨osung gelangen, so dass man allgemein sagt, man “integriere” eine Differentialgleichung, wenn man sie l¨ost. Sehr wichtig ist die Feststellung, dass die L¨ osung einer Differentialgleichung (1. Ordnung) nie eindeutig bestimmt ist, sondern noch eine Konstante (in den obigen Beispielen C genannt) enth¨ alt. Wie man an den Beispielen 2. und 3. sieht, tritt aber diese Konstante nicht immer in additiver Form (f (x) + C, wie beim unbestimmten Integral) auf. Jeder Wert von C liefert also eine L¨ osung der Differentialgleichung. In der Praxis schreibt man aber meist nicht den Wert von C direkt vor, sondern man fordert, dass ullt sei. Man gibt sich dazu einen “Anfangspunkt” eine sogenannte Anfangsbedingung erf¨ (x0 , y0 ) und bestimmt dann unter den unendlich vielen L¨ osungen f (x) der Gleichung jene, deren Graph durch (x0 , y0 ) geht, d.h. f¨ ur welche gilt y0 = f (x0 ) . Dieser Sachverhalt sei an den obigen Beispielen 1 bzw. 3 erl¨autert. Beispiel 1 Jede Funktion y = f (x) = x2 + C ist L¨osung. Es sei nun die Anfangsbedingung x0 = 1, y0 = 4 gegeben. Dann muss gelten 4 = y0 = f (x0 ) = f (1) = 1 + C , woraus C = 3 folgt. Die einzige L¨osung der Differentialgleichung, welche dieser Anfangsbedingung gen¨ ugt, ist also y = x2 + 3 . Die folgende, schon in (15.3.a) eingef¨ uhrte Terminologie ist in diesem Zusammenhang u ¨blich: y = f (x) = x2 + C heisst die allgemeine L¨osung, y = f (x) = x2 + 3 heisst die spezielle L¨osung (oder partikul¨ are L¨ osung) zur gegebenen Anfangsbedingung. Beispiel 3 Die allgemeine L¨osung hat die Form 2
y = f (x) = Cex .
224
osungsmethoden 16. Einige L¨
Fordern wir etwa die Anfangsbedingung x0 = 1, y0 = 2, so bestimmt sich die Konstante C durch die folgende kleine Rechnung: 2 = y0 = f (x0 ) = f (1) = Ce =⇒ C =
2 . e
Die entsprechende spezielle L¨osung der Differentialgleichung lautet also y=
2 x2 e . e
F¨ ur die praktische Bedeutung der Anfangsbedingung (und den Grund f¨ ur die Namensgebung) sei auf die Diskussion in (15.3.a) verwiesen, wo wir gesehen haben, dass die spezielle L¨osung dadurch festgelegt wird, dass man den Wert der Funktion N (t) zu einem bestimmten Zeitpunkt t (z.B. t = 0 oder t = t∗ ) vorgibt. Die Aufgabe, eine Differentialgleichung mit gegebenen Anfangsbedingungen zu l¨osen, wird auch “Anfangswertproblem” genannt. Es sei noch erw¨ ahnt, dass bei Differentialgleichungen n-ter Ordnung im allgemeinen n “Integrationskonstanten” auftreten. Ein Beispiel hierzu: Es sei y = x, dann ist y = 12 x2 + C und y = 16 x3 + Cx + D. Man kann hier also zu x0 nicht nur y0 = f (x0 ), sondern auch noch f (x0 ) vorschreiben.
(16.3) Das Richtungsfeld Wir betrachten wieder allgemein die Differentialgleichung y = F (x, y) . Ferner sei y = f (x) eine L¨ osung dieser Gleichung. Wir wollen den Graphen von f untersuchen. Dazu betrachten wir den Punkt (x0 , y0 ) mit y0 = f (x0 ), der nat¨ urlich auf dem Graphen von f liegt. Nun ist aber f eine L¨ osung der obigen Differentialgleichung. Daher gilt f (x0 ) = F (x0 , y0 ) . Die Zahl f (x0 ) ist aber gerade die Steigung des Graphen von f (genauer: der Tangente an den Graphen von f ) im Punkt (x0 , y0 ). Mit anderen Worten: Die L¨osungskurve, welche durch (x0 , y0 ) geht, hat in diesem Punkt die Steigung F (x0 , y0 ). Entscheidend ist nun, dass wir diese Steigung berechnen k¨onnen, ohne die L¨ osungsfunktion f (x) zu kennen, denn F (x, y) ist ja gegeben.
225
16.3 Das Richtungsfeld
Beispiel Es sei y = x − y + 1. (In (16.6.1) werden wir diese Gleichung formelm¨assig l¨osen). angigkeit von x und y. Wir tabellieren zun¨achst y in Abh¨
y
x
2 1 0 −1 −2
−3
−2
−1
0
1
2
3
−4 −3 −2 −1 0
−3 −2 −1 0 1
−2 −1 0 1 2
−1 0 1 2 3
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
Dann zeichnen wir durch jeden Punkt (x, y) der Ebene ein kurzes Geradenst¨ uck mit der zugeh¨origen Steigung y = F (x, y) = x − y + 1. Im Punkt (1, 1) hat das St¨ uck die Steigung F (1, 1) = 1, im Punkt (0, 2) die Steigung F (0, 2) = −1 usw. Wir erhalten so das handgefertigte Bild links. Selbstverst¨ andlich kann man das Rechnen und Zeichnen auch einem Computer u ¨bertragen, der umfangreichere Bilder wie jenes rechts produziert.
y 1 1
x
1 0
1
−2
Das in den obigen Skizzen dargestellte Bild heisst das Richtungsfeld der Differentialgleichung. Wenn (wie im zweiten Fall) gen¨ ugend viele “Richtungselemente” eingezeichnet sind, l¨ asst sich der Verlauf von L¨ osungskurven n¨ aherungsweise erkennen. Die zwei eingezeichneten Kurven sind Beispiele von speziellen L¨ osungen der Differentialgleichung. Da die obere u.a. durch den Punkt (0, 1) geht, handelt es sich dabei um die spezielle L¨osung zur Anfangsbedingung (x0 , y0 ) = (0, 1); entsprechend geh¨ ort die untere Kurve (z.B.) zur Anfangsbedingung (x0 , y0 ) = (0, −2). Ganz allgemein sieht man, dass hier durch jeden Punkt der Ebene eine L¨osungskurve geht.
226
osungsmethoden 16. Einige L¨
Die Entstehung dieser L¨ osungskurve kann man sich anschaulich so vorstellen: Man beginnt bei uck weiter bis zu einem Punkt (x0 , y0 ), geht dort in Richtung (1, y ) (y = F (x0 , y0 )) ein kleines St¨ (x1 , y1 ), rechnet dort die neue Steigung F (x1 , y1 ) aus, geht dort in Richtung (1, y ) (mit neu y = alt man einen Streckenzug, der um so F (x1 , y1 )) weiter bis nach (x2 , y2 ) usw. Auf diese Weise erh¨ genauer die Kurve durch (x0 , y0 ) approximiert, je kleiner die Schritte sind. Im Grenzfall (“unendlich kleine” Schritte, mit Vorsicht zu geniessen) kommt die gesuchte L¨ osungskurve heraus (vgl. (21.4)).
Ein weiterer Blick auf das Richtungsfeld l¨asst schliesslich die Vermutung aufkommen, die Funktion y = x k¨onnte eine spezielle L¨osung der Differentialgleichung y = x − y + 1 sein. Dies l¨asst sich sofort rechnerisch best¨ atigen. In der Tat ist y = 1 und x − y + 1 = x − x + 1 = 1, so dass f¨ ur alle x die Gleichung y = x − y + 1 erf¨ ullt ist. Es folgen zwei weitere Beispiele. In diesen einfachen F¨ allen lassen sich die L¨osungen der Differentialgleichung durch Betrachten des Richtungsfeldes erraten: • Im ersten Beispiel sind die L¨osungskurven Parabeln (tats¨ achlich ist y = 21 x2 + C die allgemeine L¨ osung). • Im zweiten Beispiel sind die L¨osungskurven Kreise um den Koordinatenursprung (vgl. die rechnerische L¨osung in (16.10.3)). y y
x
x
y = −
y = x
x y
Zum Schluss sei noch darauf hingewiesen, dass die Richtungsfelder nicht mit den Vektorfeldern von (14.3) verwechselt werden d¨ urfen. (16.4) Lineare Differentialgleichungen 1. Ordnung Wir kommen nun zur ersten systematischen L¨ osungsmethode. Sie betrifft die sogenannten “linearen Differentialgleichungen 1. Ordnung”. Eine Differentialgleichung 1. Ordnung heisst linear, wenn sie die Form y = p(x)y + q(x) hat, wo p und q Funktionen von x sind.
16.5 Das L¨ ur lineare Differentialgleichungen 1. Ordnung osungsverfahren f¨
227
Die Bezeichnung “linear” bezieht sich einzig darauf, dass y (und y ) nur in der ersten Potenz vorkommen. Die Funktionen p(x) und q(x) dagegen brauchen keineswegs linear zu sein. Von den Beispielen in (15.4.b) sind (1), (2), (3) und (8) lineare Differentialgleichungen 1. Ordnung. Die Gleichungen (4) und (7) sind zwar von 1. Ordnung, aber nicht linear. (Die Beispiele (5) und (6) dagegen sind lineare Differentialgleichungen 2. Ordnung, denn y, y und y kommen alle in der 1. Potenz vor.) alle: Bei linearen Differentialgleichungen unterscheiden wir zwei F¨ Eine lineare Differentialgleichung heisst homogen, wenn q(x) = 0 ist, andernfalls nennt man sie inhomogen. Wenn y = p(x)y + q(x) eine lineare Differentialgleichung ist, dann heisst y = p(x)y die zugeh¨ orige homogene Gleichung. Beispielsweise ist y = xy + 1 eine inhomogene lineare Differentialgleichung (1. Ordnung) und y = xy ist die zugeh¨orige homogene Gleichung. (16.5) Das L¨osungsverfahren f¨ ur lineare Differentialgleichungen 1. Ordnung a) Allgemeines Man l¨ ost eine lineare Differentialgleichung, indem man zuerst die zugeh¨orige homogene Gleichung l¨ ost und anschliessend mit der Methode der “Variation der Konstanten” die L¨osungen der urspr¨ unglichen Gleichung findet. Dies f¨ uhren wir nun im Detail durch. b) L¨osung der homogenen Gleichung Es sei y = p(x)y eine homogene lineare Differentialgleichung. Die L¨ osung l¨ asst sich erraten: Es sei P (x) eine beliebige Stammfunktion von p(x) (d.h. P (x) = p(x)). Dann ist y = KeP (x) ,
K eine beliebige Konstante
die allgemeine L¨ osung der homogenen Gleichung, denn Ableiten ergibt unter Benutzung der Kettenregel y = KeP (x) · P (x) = KeP (x) · p(x) = p(x)y .
228
osungsmethoden 16. Einige L¨
osung einer Es sei noch darauf hingewiesen, dass die konstante Funktion y = 0 stets L¨ homogenen linearen Differentialgleichung ist (setze K = 0). Beispiele 1. y = y sin x :
p(x) = sin x, P (x) = − cos x
L¨ osung: y = Ke− cos x . 2y 2 2. y = , x > 0 : p(x) = , P (x) = 2 ln x = ln x2 . x x 2 L¨ osung: y = Keln x = Kx2 .
Damit sind die in Beispiel (15.3.f) gesuchten Kurven gefunden. Wie dort bereits vorweggenommen wurde, handelt es sich dabei um Parabeln 2. Grades. Beachten Sie, auf welche Weise die Rechenregeln f¨ ur den Logarithmus und die Exponentialfunktion ((26.13), (26.14)) ins Spiel gekommen sind. Als Variante h¨ atte man auch so rechnen k¨ onnen: y = KeP (x) = Ke2 ln x = Ke(ln x)·2 = K(eln x )2 = Kx2 . Da x > 0 vorausgesetzt wurde, durften wir bei der Stammfunktion ln |x| von 1/x das Betrags zeichen weglassen.
Wir erw¨ ahnen an dieser Stelle noch, dass die homogene Gleichung auch mit der Methode der “Separation der Variablen” gel¨ ost werden kann, was in (16.10.1) besprochen wird. c) L¨ osung der inhomogenen Gleichung (“Variation der Konstanten”) Wir betrachten jetzt wieder die inhomogene lineare Differentialgleichung (1)
y = p(x)y + q(x)
und die zugeh¨orige homogene Gleichung (2)
y = p(x)y .
Nach dem eben Gesagten hat (2) die allgemeine L¨osung (3)
y = KeP (x) ,
wo P (x) eine Stammfunktion von p(x) ist. Nun wenden wir die Methode der “Variation der Konstanten” an. Sie besteht darin, dass man f¨ ur die L¨ osung der inhomogenen Gleichung (1) den Ansatz (4)
y = K(x)eP (x)
macht. Man ersetzt also in (3) die Konstante K durch eine vorl¨aufig noch unbekannte Funktion K(x), welche man so zu bestimmen sucht, dass (4) eine L¨ osung von (1) ist.
16.5 Das L¨ ur lineare Differentialgleichungen 1. Ordnung osungsverfahren f¨
229
Um diese Funktion K(x) zu finden, leiten wir die Funktion y ab (Produkt- und Kettenregel!): y = K (x)eP (x) + K(x)p(x)eP (x) .
(5)
Dabei haben wir noch benutzt, dass P (x) = p(x) ist. Nun setzen wir y aus (4) und y ungliche Gleichung aus (5) in die urspr¨ y = p(x)y + q(x) ein. Wir erhalten K (x)eP (x) + K(x)p(x)eP (x) = p(x)K(x)eP (x) + q(x) . Die unterstrichenen Terme heben sich weg (was der Sinn des Ansatzes war) und es bleibt K (x)eP (x) = q(x) . Durch Multiplikation mit dem Reziproken e−P (x) von eP (x) finden wir weiter K (x) = q(x)e−P (x) , woraus man K(x) als Stammfunktion von q(x)e−P (x) bestimmen kann: K(x) = q(x)e−P (x) dx + C . Schliesslich setzt man den so erhaltenen Ausdruck f¨ ur K(x) in den Ansatz (4) ein und findet als L¨osung der inhomogenen linearen Differentialgleichung
q(x)e−P (x) dx + C eP (x) , y= wo P (x) eine beliebige Stammfunktion von p(x) ist. Anders formuliert: (6)
y = (K0 (x) + C)eP (x) ,
wo K0 (x) eine beliebige, fest gew¨ahlte Stammfunktion von q(x)e−P (x) ist. Es ist aber nicht sinnvoll, die obige Formel f¨ ur y auswendig zu lernen und anzuwenden. Vielmehr wird man in jedem einzelnen Fall die Rechnung mit den konkret ¨ gegebenen Funktionen durchf¨ uhren. Die obige Uberlegung zeigt einfach, dass das Verfahren im Prinzip immer funktioniert. “Im Prinzip” deshalb, weil es nicht immer m¨ oglich sein wird, die Stammfunktionen (unbestimmte Integrale) P (x) und K(x) explizit formelm¨ assig anzugeben.
230
osungsmethoden 16. Einige L¨
Die Methode f¨ osung einer inhomogenen linearen Differentialgleichung ur die L¨ y = p(x)y + q(x) lautet also zusammengefasst: 1) Man l¨ost die zugeh¨ orige homogene Differentialgleichung y = p(x)y . Die L¨ osung hat die Form y = KeP (x) , wo P (x) eine Stammfunktion von p(x) ist. 2) Man variiert die Konstante K, d.h., man macht den Ansatz y = K(x)eP (x) , wo K(x) eine noch zu bestimmende Funktion ist. 3) Geht man mit diesem Ansatz in die urspr¨ ungliche inhomogene Differentialgleichung ein, so erh¨ alt man nach einigen Umformungen eine Beziehung f¨ ur K (x), aus der man K(x) zu bestimmen sucht. d) Zur Eindeutigkeit der L¨ osung Bereits in (15.3.a) haben wir uns die Frage gestellt, wie es denn um die Eindeutigkeit der L¨ osung einer Differentialgleichung stehe. Wir haben dort gesehen, dass die Differentialgleichung y = −ay zu einer gegebenen Anfangsbedingung genau eine L¨ osung hat, n¨ amlich y = Ce−ax , wobei die Konstante C durch die Anfangsbedingung eindeutig festgelegt ist. ¨ ¨ Ahnliche Uberlegungen funktionieren auch f¨ ur beliebige lineare Differentialgleichungen. Ohne Beweis sei folgendes Resultat erw¨ ahnt: Die Funktionen p(x) und q(x) seien auf einem Intervall I stetig, ferner sei eine Anfangsbedingung (x0 , y0 ) mit x0 ∈ I gegeben. Dann hat die lineare Differentialgleichung y = p(x)y + q(x) genau eine L¨ osung, welche der gegebenen Anfangsbedingung gen¨ ugt. Haben Sie also auf irgendeine Weise (z.B. mit dem oben beschriebenen Verfahren oder mit der in (16.7) beschriebenen Methode) eine L¨ osung der linearen Differentialgleichung gefunden, so k¨ onnen Sie sicher sein, dass dies die einzige L¨ osung zur gegebenen Anfangsbedingung ist. An dieser Stelle sei noch erw¨ ahnt, dass es Beispiele von (nat¨ urlich nicht linearen) Differentialgleichungen gibt, die zu gewissen Anfangsbedingungen mehr als eine L¨ osung haben. Die allgemeine Untersuchung von Existenz- und Eindeutigkeitsfragen ist Sache der mathematischen Theorie. Wir werden uns hier nicht damit befassen, mit Ausnahme von (21.4), wo wir aus passendem Anlass einen Existenzsatz f¨ ur Differentialgleichungen zitieren werden.
16.6 Beispiele zum L¨ osungsverfahren
231
(16.6) Beispiele zum L¨osungsverfahren 1. y = x − y + 1 (vgl. (16.3) f¨ ur das Richtungsfeld). Wir bringen diese Gleichung auf die u ¨bliche Form: (∗)
y = −y + (x + 1) .
Die zugeh¨ orige homogene Gleichung lautet y = −y. Ihre L¨osung ist wegen p(x) = −1 und P (x) = −x y = Ke−x , was sich auch erraten liesse. Jetzt folgt die Variation der Konstanten: Wir machen den Ansatz y = K(x)e−x mit einer noch zu bestimmenden Funktion K(x). Nun ist gem¨ ass den Ableitungsregeln y = K (x)e−x − K(x)e−x . Setzt man weiter y = K(x)e−x in die rechte Seite von (∗) ein, so erh¨alt man −y + x + 1 = −K(x)e−x + x + 1 . Wir setzen nun die linke und die rechte Seite von (∗) einander gleich: K (x)e−x − K(x)e−x = −K(x)e−x + x + 1 . Wie es sein muss, hebt sich −K(x)e−x weg, und es bleibt die Beziehung K (x)e−x = x + 1 oder umgeformt
K (x) = ex (x + 1)
u ¨brig. Nun integrieren wir und finden K(x) = xex dx + ex dx = ex (x − 1) + ex + C = xex + C (vgl. (13.6.1)). Wenn wir diese Funktion K(x) in den Ansatz y = K(x)e−x einsetzen, erhalten wir f¨ ur die L¨osung y = x + Ce−x . Beachten Sie, wie die Integrationskonstante C auf Umweg u ¨ber K(x) ins Spiel kommt.
232
osungsmethoden 16. Einige L¨
Eine Kontrolle ist zu empfehlen: Tats¨ achlich ist y = 1 − Ce−x
− y + x + 1 = −x − Ce−x + x + 1 = 1 − Ce−x .
und
osung ist also richtig! Die L¨ osung durch den Punkt (0, 0). Es Schliesslich bestimmen wir noch die spezielle L¨ muss gelten: 0 = 0 + Ce−0 , woraus C = 0 folgt. Diese spezielle L¨osung lautet somit ¨berein. y = x. Dies stimmt mit der Feststellung von (16.3) u y 2. y = + x, x > 0. 2x Wir l¨ osen zuerst die homogene Gleichung y = 1 ist P (x) = Mit p(x) = 2x setzt wurde). Somit ist
1 2
ln |x| = ln
y = Keln
y . 2x
|x| = ln
√
x
√
x (letzteres weil x > 0 vorausge-
√ =K x
die allgemeine L¨osung der homogenen Gleichung. Nun “variieren” wir K und machen den Ansatz √ y = K(x) x . √ ucke f¨ ur y Daraus berechnen wir y = K (x) x + K(x) 2√1 x und setzen die Ausdr¨ und y in die gegebene inhomogene Gleichung ein. Wir finden y +x, 2x √ √ K(x) x 1 K (x) x + K(x) √ = +x. 2x 2 x y =
1 auf beiden Seiten weg. Es bleibt In der letzten Gleichung hebt sich K(x) 2√ x
√ K (x) x = x oder K (x) = Daraus folgt
K(x) =
1
√
1
x = x2 .
x 2 dx =
2 3 x2 + C . 3
Als L¨osung der Differentialgleichung finden wir schliesslich √ √ 1 2 3 2 y = K(x) x = ( x 2 + C)x 2 = x2 + C x . 3 3 Die Kontrolle durch Ableiten sei Ihnen u ¨berlassen.
osungen einer linearen Differentialgleichung 16.7 Allgemeines u ¨ber die L¨
233
(16.7) Allgemeines u ¨ber die L¨osungen einer linearen Differentialgleichung Wir sehen uns die Form der L¨osungen der inhomogenen Gleichung (1) noch etwas n¨ aher an. Gem¨ass (16.5.c) hat sie die Gestalt y = (K0 (x) + C)eP (x) ,
(6)
wo K0 (x) eine beliebige, aber fest gew¨ahlte Stammfunktion von q(x)e−P (x) ist. Wir schreiben dies als y = K0 (x)eP (x) + CeP (x)
(7) und stellen fest:
• K0 (x)eP (x) ist eine spezielle L¨osung der inhomogenen Gleichung (1) (setze in (6) C = 0). • CeP (x) ist nach Ansatz die allgemeine L¨osung der zugeh¨origen homogenen Gleichung (2). Die Formel (7) l¨ asst sich damit wie folgt in Worten ausdr¨ ucken: Die allgemeine L¨osung der inhomogenen Gleichung kann geschrieben werden als Summe der allgemeinen L¨ osung der homogenen Gleichung und einer speziellen L¨ osung der inhomogenen Gleichung. Vielleicht sieht man das Ganze anhand des Beispiels 1. noch etwas deutlicher. Dort haben wir gefunden y = (xex + C)e−x . Im Vergleich mit (6) ist K0 (x) = xex und eP (x) = e−x . Multiplizieren wir aus, so erhalten wir die (7) entsprechende Form y = xex e−x + Ce−x = x + Ce−x . osung der inhomogenen Gleichung und CeP (x) = Dabei ist K0 (x)eP (x) = xex e−x = x eine spezielle L¨ −x Ce ist die allgemeine L¨ osung der homogenen Gleichung.
Es sei noch darauf hingewiesen, dass auch die Umkehrung der oben eingerahmten Aussage gilt: Es sei y1 die allgemeine L¨osung der homogenen Gleichung und es sei y2 eine spezielle L¨ osung der inhomogenen Gleichung. Dann ist y = y1 + y2 die allgemeine L¨osung der inhomogenen Gleichung. In der Tat ist nach Voraussetzung y1 = p(x)y1 y2 = p(x)y2 + q(x) .
234
osungsmethoden 16. Einige L¨
Addiert man die beiden Gleichungen, so folgt y = (y1 + y2 ) = y1 + y2 = p(x)(y1 + y2 ) + q(x) = p(x)y + q(x) , osung der inhomogenen Gleichung (und zwar die allgemeine, weil in y1 d.h. y ist eine L¨ bereits die Konstante C steckt). Von diesem Standpunkt aus gesehen kann man eine lineare Differentialgleichung osen: Man findet zuerst die allgemeine L¨osung der homogenen Gleichung, auch so l¨ sucht dann irgendeine spezielle L¨ osung der inhomogenen Gleichung und addiert. Die Methode der “Variation der Konstanten” ist so betrachtet einfach ein systematisches Verfahren zur Auffindung einer solchen speziellen L¨osung. Manchmal l¨ asst sich diese aber auch einfach erraten. Als Illustration zur letzten Bemerkung betrachten wir nochmals das Beispiel 1. von (16.6) (y = x − y + 1). Wir wissen aus (16.3), dass y = x eine spezielle L¨osung der inhomogenen Gleichung ist. Weil aber y = Ce−x die allgemeine L¨ osung der homogenen osung der inhomogenen Gleichung als ur die allgemeine L¨ Gleichung ist, findet man f¨ Summe den bereits bekannten Ausdruck y = x + Ce−x . achsten Abschnitt wenden wir das Verfahren erneut an. Im n¨ (16.8) Die lineare Differentialgleichung mit konstanten Koeffizienten Eine lineare Differentialgleichung mit konstanten Koeffizienten hat die Form y = ay + b,
a = 0 ,
wo a, b reelle Zahlen* sind. Dies bedeutet, dass p(x) und q(x) konstante Funktionen sind. Es ist sofort klar, dass y = Ceax die allgemeine L¨ osung der homogenen Gleichung y = ay ist. Ebensoleicht sieht man aber, dass die konstante Funktion y = −b/a eine spezielle L¨ osung der inhomogenen Gleichung ist, denn f¨ ur diese Funktion sind beide Seiten der Gleichung stets 0. Somit ist
y = Ceax −
b a
die allgemeine L¨osung der obigen Differentialgleichung. Nat¨ urlich f¨ uhrt auch die Methode der Variation der Konstanten zum Ziel, wie Sie selbst nachpr¨ ufen k¨onnen. * Der Fall a = 0, d.h. die Differentialgleichung y = b mit der L¨osung y = bx + C soll im folgenden ausgeschlossen bleiben.
16.9 Separation der Variablen
235
Damit haben wir insbesondere die Differentialgleichung (3) (15.3.b) gel¨ ost. Diese lautet (vgl. auch (15.4.b)) y = −by + bB,
b, B > 0 .
osung ist Die L¨ y = Ce−bx + B , oder, mit den urspr¨ unglichen Bezeichnungen, N (t) = Ce−bt + B . In (15.3.b) ging es um ein eingeschr¨anktes Wachstum; die Zahl B > 0 stellte die obere Schranke f¨ ur die Populationsgr¨ osse dar. Wir suchen nun die spezielle L¨ osung mit der Anfangsbedingung N (0) = N0 ; dabei ist sicher N0 < B. Einsetzen ergibt wegen e0 = 1 N0 = N (0) = C + B oder C = N0 − B < 0 . osung lautet also Die spezielle L¨ N (t) = (N0 − B)e−bt + B . ur t → ∞ (es ist ja b > 0) ur alle t, wegen e−bt → 0 f¨ Wegen N0 − B < 0 ist N (t) < B f¨ strebt N (t) im Verlauf der Zeit gegen B (ohne aber B ganz zu erreichen). Den Graphen von N (t) finden Sie am Schluss von (15.3.b). (16.9) Separation der Variablen Wir kommen nun zu einer weiteren systematischen L¨osungsmethode, der Separation (oder Trennung) der Variablen. Sie l¨asst sich immer dann anwenden, wenn die Differentialgleichung die Form y = r(x)s(y) hat, d.h. wenn sich die rechte Seite F (x, y) als Produkt von zwei Funktionen einer Variablen (einmal von x und einmal von y) schreiben l¨asst. Als Spezialf¨alle k¨ onnen die Funktionen r(x) bzw. s(y) auch den konstanten Wert 1 annehmen, so dass sich auch die Differentialgleichungen y = r(x) dem Verfahren unterordnen.
und
y = s(y)
236
osungsmethoden 16. Einige L¨
In dieser Situation geht man nach folgender Methode vor (die in (16.11) genauer undet wird): begr¨ 1) Schreibe die Differentialgleichung in der Form dy = r(x)s(y) . dx 2) Bringe alle Terme mit y auf die linke, alle Terme mit x auf die rechte Seite. Dabei muss man formal mit dx multiplizieren: dy = r(x) dx . s(y) 3) Bilde auf beiden Seiten das unbestimmte Integral
dy = s(y)
r(x) dx + C .
Integrationskonstante C nicht vergessen!* Man erh¨ alt so die Beziehung S(y) = R(x) + C , 1 , R(x) eine solche von r(x) ist. Durch diese s(y) Beziehung wird y “implizit” als Funktion von x gegeben. Dieses y ist dann die allgemeine L¨osung der Differentialgleichung.
wo S(y) eine Stammfunktion von
4) L¨ose (wenn m¨ oglich) nach y auf. 5) Kontrolliere, ob es konstante L¨osungen gibt, die noch nicht erfasst wurden. Kommentar zu 3) Durch die Formel S(y) = R(x) + C ist die L¨ osung im Prinzip bestimmt. Nat¨ urlich h¨atte man die L¨ osung am liebsten “explizit”, d.h. nach y aufgel¨ost, also in der Form y = f (x). Dies ist aber nicht immer m¨oglich (vgl. (16.10.5). Kommentar zu 5) Konstante L¨ osungen der Differentialgleichung y = r(x)s(y) * Eigentlich tritt bei jedem Integral eine solche Konstante auf; man fasst die beiden aber zusammen.
16.10 Beispiele zur Separation der Variablen
237
ur eine gewisse amlich s(y1 ) = 0 f¨ erh¨ alt man aus den Nullstellen der Funktion s(y). Ist n¨ Zahl y1 , so ist die konstante Funktion y(x) = y1 sicher eine L¨osung der Differentialgleichung: Als Ableitung einer Konstanten ist y = y (x) = 0 f¨ ur alle x, und wegen s(y1 ) = 0 ist auch r(x)s(y) = r(x)s(y(x)) = r(x)s(y1 ) = 0 ur alle x, und die Differentialgleichung ist einfach deshalb erf¨ f¨ ullt, weil beide Seiten gleich Null sind. andig durchgerechnetes Beispiel): Eine Illustration dazu (siehe aber auch (16.10.4) f¨ ur ein vollst¨ y = x(y 2 − 4) hat die konstanten L¨ osungen y = −2 und y = 2.
(16.10) Beispiele zur Separation der Variablen 1. Die lineare homogene Differentialgleichung Wir haben bereits in (16.5.b) gesehen, dass die Differentialgleichung y = p(x)y die allgemeine L¨ osung y = KeP (x) hat, wo P (x) eine Stammfunktion von p(x) ist. Man kann diese Gleichung auch mit Separation der Variablen l¨ osen, und manche haben diese Methode sogar lieber. Wir zeigen diese M¨ oglichkeit an einem konkreten Beispiel, n¨ amlich an der Gleichung y = x2 y , und gehen dazu die f¨ unf Schritte des “Rezepts” von (16.9) der Reihe nach durch. dy = x2 y Schritt 1) dx dy Schritt 2) = x2 dx y dy Schritt 3) = x2 dx y
osungsmethoden 16. Einige L¨
238
x3 + C (Absolutstriche beim ln nicht verges3 sen!) Die beiden auftretenden Integrationskonstanten wurden zu einer zusammengefasst. Integration liefert ln |y| =
Schritt 4)
Um nach y aufzul¨ osen, nimmt man zuerst auf jeder Seite die Exponentialfunktion und erh¨alt wegen eln |y| = |y| und den Rechenregeln f¨ ur die Exponentialfunktion |y| = ex
3
/3+C
wo L = e
C
= ex
3
/3
· eC = L · ex
3
/3
,
ebenfalls eine Konstante ist.
Nun wollen wir noch den Betrag wegschaffen. Beim Weglassen der Betragszeichen ¨andert sich h¨ochstens das Vorzeichen: y = ± Lex
3
/3
.
Setzen wir noch K = ± L, so erhalten wir als allgemeine L¨osung y = Kex Schritt 5)
3
/3
.
Die konstante Funktion y = 0 ist ebenfalls L¨ osung der Differentialgleichung. Diese ist aber in der allgemeinen L¨ osung enthalten, wenn wir K = 0 setzen.
Die allgemeine L¨osung lautet also y = Kex
3
/3
,
(K eine beliebige Konstante) .
Dies w¨ are auch mit der Methode von (16.5.b) herausgekommen, denn x3 /3 ist eine Stammfunktion von 2 x . Kontrolle durch Ableiten: 3 y = K · ex /3 x2 = yx2 .
Beachten Sie an diesem Beispiel speziell: • Methode, wie man den ln wegschafft. • Methode, wie man den Betrag wegschafft. • Kontrolle nicht vergessen! Bemerkung Wir erl¨ autern noch etwas genauer, was mit den Konstanten C, L, K passiert ist. Die Konstante 3 L = eC ist sicher > 0. Die Beziehung |y| = L · ex /3 bedeutet 3 y = Lex /3
oder
3 y = −Lex /3 .
y
y L
x
x −L
Welcher Fall in Frage kommt, h¨ angt von der Anfangsbedingung (x0 , y0 ) ab, f¨ ur y0 > 0 ist es der erste, f¨ ur y0 < 0 der zweite Fall.
16.10 Beispiele zur Separation der Variablen
239
achst K = ± eC = 0. Dass Die Zusammenfassung K = ± L ist also sinnvoll. Allerdings ist zun¨ undet. (Dieser Fall geh¨ ¨brigens zu einer ort u auch K = 0 zugelassen ist, wurde erst im Schritt 5) begr¨ Anfangsbedingung mit y0 = 0.) Nat¨ osen einer homogenen linearen Differentiurlich wird man beim L¨ ¨ algleichung diese Uberlegung nicht jedesmal durchf¨ uhren, sondern f¨ ur K automatisch jede reelle Zahl zulassen. Beachten Sie, dass jede homogene lineare Differentialgleichung die konstante Funktion y = 0 als L¨ osung hat.
Wir geben noch zwei spezielle L¨osungen an: 1) x0 = 1, y0 = 2 Hier muss gelten: 2 = Ke1/3 und somit K = 2 · e−1/3 = 1.433. Die spezielle L¨osung 3 lautet y = 1.433 · ex /3 . 2) x0 = 2, y0 = 0 Hier ist 0 = Ke8/3 , also K = 0. Diese spezielle L¨osung ist die konstante Funktion y = 0. 2. Die lineare Differentialgleichung mit konstanten Koeffizienten Die Differentialgleichung y = ay + b, a, b ∈ R,
a = 0
wurde bereits in (16.8) gel¨ ost. Unser neues Verfahren bew¨ahrt sich aber ebenfalls. Wir schreiben b y = a(y + ) a (d.h., es ist r(x) = a, s(y) = y + ab ). Die ersten drei Schritte des Rezepts ergeben der Reihe nach 1)
dy b = a(y + ), dx a
Die Integration liefert
2)
dy = a dx, y + ab
3)
dy = y + ab
b ln y + = ax + C . a
Durch Anwendung der Exponentialfunktion erhalten wir mit L = eC y + b = eax+C = eax eC = Leax a und mit K = ±L y+
b = Keax , a
woraus sich die allgemeine L¨osung y = Keax −
b a
a dx.
240
osungsmethoden 16. Einige L¨
ergibt. Schritt 4) ist damit erledigt. Schritt 5): Die Funktion y = − ab ist eine konstante L¨osung, die aber in der allgemeinen L¨ osung enthalten ist (setze K = 0). x (Richtungsfeld in (16.3)). y 1 1 Hier ist r(x) = −x, s(y) = (oder auch r(x) = x, s(y) = − ). y y Die vier Schritte des Rezepts liefern der Reihe nach: dy x = − , y dy = −x dx, y dy = − x dx + C . dx y 3. y = −
Die Integration ist ganz leicht und ergibt x2 y2 =− +C 2 2 oder y 2 = c − x2
(mit c = 2C) .
Nun l¨osen wir nach y auf und finden zwei L¨osungen: y1 = c − x 2 , y2 = − c − x2 . Was bedeutet dies? Zuerst verifiziert man nat¨ urlich durch Ableiten, dass beide Funktionen tats¨ achlich L¨osungen der Differentialgleichung sind. Geometrisch stellen √ die L¨ osungen y1 Halbkreise mit Radius c in der oberen, die L¨osungen y2 solche in der unteren Halbebene, dar. Der Eindruck, den wir aus dem Richtungsfeld in (16.3) gewonnen haben, best¨atigt sich also! Es sei nun eine Anfangsbedingung (x0 , y0 ) gegeben. Falls y0 > 0 ist, so liegt dieser Punkt in der oberen Halbebene und es gibt genau einen Halbkreis im Zentrum 0, der durch (x0 , y0 ) geht. F¨ ur √ seinen Radius gilt dann offenbar: r = c. Hier ist die Funktion y1 zu verwenden. Entsprechend f¨ uhrt y0 < 0 auf die L¨ osungsfunktion y2 . (F¨ u r y0 = 0 ist der Halbkreis, auf dem y0 liegt, nicht eindeutig bestimmt. Diese Punkte bilden aber ohnehin eine Ausnahme, denn die urspr¨ ungliche Gleichung y = −x/y ist ja nur f¨ ur y = 0 sinnvoll! ) Konstante L¨ osungen gibt es hier keine.
(x0 , y0 ) y0 > 0
y
x
(x0 , y0 ) y0 < 0
Beachten Sie speziell: ¨ • Ein sorgf¨ altiges Uberdenken der gefundenen L¨ osung ist wichtig, vor allem nat¨ urlich dann, wenn besondere Erscheinungen, wie mehrere L¨ osungen etc., auftreten.
16.10 Beispiele zur Separation der Variablen
241
4. y = 2x(y − 1)2 . Die ersten beiden Schritte liefern dy = 2x dx . (y − 1)2 Integration auf beiden Seiten ergibt −
1 = x2 + C . y−1
Schliesslich l¨osen wir nach y auf: (∗)
y =1−
1 . x2 + C
In diesem Beispiel bringt nun Schritt 5) etwas Neues: Die Differentialgleichung hat offensichtlich die konstante L¨ osung y = 1 (vgl. auch den Kommentar zu 5) in (16.9)). Bemerkenswert dabei ist, dass diese L¨osung im Gegensatz zu den Beispielen 1. und 2. kein Spezialfall der allgemeinen L¨osung (∗) ist: Wie immer man auch C w¨ahlt*, nie wird y = 1 − 1/(x2 + C) = 1. Eine L¨osung — wie hier y = 1 — die kein Spezialfall der allgemeinen L¨ osung ist, nennt man eine singul¨are L¨ osung der Differentialgleichung. Diese zus¨atzliche L¨ osung darf nicht etwa ignoriert werden: W¨ ahlt man n¨ amlich als Anfangsbedingung x0 beliebig und y0 = 1, so gen¨ ugt keine der Funktionen mit der Formel (∗) dieser Anfangsbedingung. Es gibt aber doch eine spezielle L¨ osung der Differentialgleichung, welche diese Anfangsbedingung erf¨ ullt, n¨ amlich die konstante Funktion y = 1, also unsere singul¨ are L¨ osung. In der Figur sind die Graphen der Funktionen (∗) f¨ ur C = −2, −1, 0, 12 und 2 sowie der konstanten Funktion y = 1 eingezeichnet. y Die einzelnen Kurven sind jeweils -1 -2 mit der Konstanten C beschriftet.
y=1 2 1
x
1 2
Beachten Sie an diesem Beispiel speziell: • Es kann singul¨ are L¨ osungen geben. -2 -1 0
0 -1 -2
* Strebt aber C dem Betrage nach gegen ∞, so n¨ahert sich die Funktion y = 1 − 1/(x2 + C) immer mehr der konstanten Funktion y = 1.
osungsmethoden 16. Einige L¨
242
5. y =
2x . 1 + cos y
1 . 1 + cos y Wir f¨ uhren die u ¨blichen Schritte durch: Hier ist r(x) = 2x, s(y) =
2x dy = , (1 + cos y) dy = 2x dx, dx 1 + cos y
(1 + cos y) dy =
2x dx .
Integration liefert y + sin y = x2 + C . Dies ist die implizite Form der L¨ osung, welche in diesem Fall nicht auf explizite Form gebracht werden kann. Schritt 4) entf¨ allt, ebenso Schritt 5) (s(y) wird nie Null).
(16.11) Begr¨ undung der Methode Wie die Beispiele zeigen, scheint das in (16.9) angewandte Rezept zu funktionieren. Es enth¨ alt aber einen rein formalen Schritt (Multiplikation mit dx), der vielleicht etwas zweifelhaft erscheint. Im folgenden sei deshalb noch eine bessere Begr¨ undung angef¨ uhrt. Es sei also y = r(x)s(y) die gegebene Differentialgleichung, wobei r und s stetige Funktionen seien (was wir bis jetzt stillschweigend angenommen haben). Die in (16.9) angegebene Methode l¨ auft darauf hinaus, dass man die Gleichung (∗)
S(y) = R(x) + C
aufstellt, wo S(y) eine Stammfunktion von 1/s(y) und R(x) eine solche von r(x) ist. Dadurch, so wird behauptet, ist die L¨ osung y = f (x) bestimmt (wenn auch vorerst noch in impliziter Form). Dies wollen wir nun nachweisen. Die Funkton y = f (x) gen¨ uge der Beziehung (∗). Es ist dann S(f (x)) = R(x) + C . Durch Ableiten erh¨ alt man
S (f (x)) · f (x) = R (x) .
Nun ist aber S(y) eine Stammfunktion von 1/s(y), R(x) eine solche von r(x). Es folgt mit y = f (x), y = f (x) 1 y = r(x) s(y) oder
y = r(x)s(y) ,
d.h., y = f (x) erf¨ ullt wie behauptet die gegebene Differentialgleichung. Da durch s(y) dividiert wird, muss s(y) = 0 sein. Die Stellen, wo s(y) = 0 ist, spielen aber ohnehin eine Sonderrolle: Sie liefern gem¨ ass Schritt 5) die konstanten L¨ osungen.
(16.12) Die Differentialgleichung y = a(A − y)(B − y) Differentialgleichungen dieses Typs haben wir in (15.3), Gleichungen (4) und (7), angetroffen. Wir betrachten hier nur den Fall, wo A = B ist: y = a(A − y)(B − y),
A = B .
16.12 Die Differentialgleichung y = a(A − y)(B − y)
243
Es handelt sich hier um eine nichtlineare Differentialgleichung 1. Ordnung. Da die rechte Seite eine Funktion von y allein ist, k¨ onnen wir sie mit Separation der Variablen l¨osen. Die dabei vorkommende Integration gibt etwas viel zu rechnen. Man pr¨ uft zuerst die folgende Beziehung nach: 1 1 1 1 . = − (A − y)(B − y) B−A y−B y−A (Die Br¨ uche auf der rechten Seite heissen “Partialbr¨ uche”; es handelt sich hier um einen einfachen Fall der sogenannten Partialbruchzerlegung. Dies ist eine Integrationsmethode, welche hier nicht behandelt wird.) Separation der Variablen f¨ uhrt auf
oder auch
dy = (A − y)(B − y)
1 1 − dy = y−B y−A
a dx
a(B − A) dx = a(B − A)x + C .
Integration liefert
y − B
ln |y − B| − ln |y − A| = ln
= a(B − A)x + C y−A
y − B
= ea(B−A)x+C y−A y−B mit L = ± eC . = Lea(B−A)x y−A Diese Gleichung ist nach y aufzul¨ osen. Wir k¨ urzen die rechte Seite mit z ab: y−B = z, y − B = (y − A)z = yz − Az, y(1 − z) = B − Az y−A (B − A) + (1 − z)A B−A B − zA = =A+ . y= 1−z 1−z 1−z
Somit lautet die L¨osung (mit K = −L) y =A+
B−A . 1 + Kea(B−A)x
Damit haben wir insbesondere die Differentialgleichungen (4) und (7) von (15.3) gel¨ ost. Die Gleichung (4) (eingeschr¨ anktes Wachstum) lautet c y(B − y) B c = − (0 − y)(B − y) . B
y =
Wir k¨ onnen also in der obigen L¨ osungsformel a = − Bc und A = 0 setzen. Die L¨ osung lautet dann B y= , c > 0, B > 0 1 + Ke−cx
osungsmethoden 16. Einige L¨
244
oder, in der Bezeichnung von (15.3.b),
N (t) =
B , 1 + Ke−ct
c > 0, B > 0 .
Eine Funktion dieses Typs heisst eine logistische Funktion. Ihr Graph ist S-f¨ ormig, wie sich aus der folgenden Kurvendiskussion ergeben wird (vgl. die Skizze (15.3.b)). Manche Wachstumsvorg¨ ange werden recht gut durch eine solche Funktion wiedergegeben. N¨ aheres zur logistischen Funktion Zum Schluss dieses Abschnitts wollen wir die Funktion (∗)
N (t) =
B 1 + Ke−ct
B, c > 0
als L¨osung der Differentialgleichung N (t) =
(∗∗)
c N (t)(B − N (t)) B
noch etwas n¨ aher untersuchen. Lesen Sie dazu nochmals die Begr¨ undung f¨ ur den Ansatz (4) (15.3.b) nach. F¨ ur t → ∞ wird (da c > 0 ist) e−ct beliebig klein: lim e−ct = 0. Daraus folgt t→∞
lim N (t) = lim
t→∞
t→∞
B B = =B 1 + Ke−ct 1
und zwar unabh¨ angig vom Wert der Integrationskonstanten K. Mit anderen Worten: Wie gem¨ ass dem Ansatz von (15.3.b) auch zu erwarten ist, strebt die Gr¨osse der Population mit wachsendem t gegen B, ohne aber B jemals ganz zu erreichen (abgesehen vom trivialen Fall K = 0). Die Integrationskonstante K wird durch die Anfangsbedingung bestimmt: Zur Zeit t0 sei die Gr¨ osse der Population = N0 . Aus N0 = N (t0 ) = erh¨ alt man durch Aufl¨ osen nach K K=
B 1 + Ke−ct0
B − N0 ct0 e . N0
Setzt man dies in (∗) ein, so findet man die Formel (∗∗∗)
N (t) =
BN0 B = . 0 −c(t−t0 ) N0 + (B − N0 )e−c(t−t0 ) 1 + B−N e N 0
16.12 Die Differentialgleichung y = a(A − y)(B − y)
245
ur die weitere Diskussion nehmen wir an, es sei B > N0 , dann ist auch K > 0. Dies stimmt F¨ ur die Populationsgr¨ u ¨berein mit dem Ansatz von (15.3.b), in welchem B eine obere Schranke f¨ osse war. Wir berechnen nun die Ableitung von N (t), wobei wir einfachheitshalber auf die Formel (∗) uckgreifen. Man findet zur¨ KcBe−ct N (t) = (1 + Ke−ct )2 und wegen K, c, B > 0 ist N (t) > 0 f¨ ur alle t. Die Funktion N (t) ist also wachsend, wie wir das von unserem Ansatz her auch erwarten. Nun bestimmen wir noch den Wendepunkt. Wir k¨ onnten dazu N (t) ausrechnen und gleich 0 ¨ setzen. Weniger Arbeit gibt die folgende Uberlegung: Aus (∗∗) folgt durch Ableiten (Produktregel und einfache Umformung) c N (t) = N (t)(B − 2N (t)) . B Wie wir schon wissen, ist N (t) > 0 f¨ ur alle t, und da auch c > 0 ist, findet man folgendes: f¨ ur N (t) < B/2 ist N (t) > 0
(Graph beschreibt Linkskurve),
f¨ ur N (t) = B/2 ist N (t) = 0
(Wendepunkt),
f¨ ur N (t) > B/2 ist N (t) < 0
(Graph beschreibt Rechtskurve).
Als Resultat all dieser Bem¨ uhungen erhalten wir den untenstehenden Graphen: N B
B/2
N0 t0
t t1
Insbesondere sieht man folgendes: Die Population w¨achst zuerst langsam, dann immer rascher, bis die H¨alfte des “Grenzwerts” B erreicht ist. Von da an wird das Wachstum wieder langsamer. Durch Umformen und Logarithmieren k¨ onnen wir die Gleichung N (t1 ) = B/2 nach t1 aufl¨ osen. Man findet unter Verwendung von (∗) ln K . t1 = c Der Wendepunkt der logistischen Kurve hat somit die Koordinaten (t1 , B/2). Vom Zeitpunkt t1 an nimmt die Wachstumsgeschwindigkeit ab. Mit etwas Aufwand kann man nachrechnen, dass diese Kurve (wie es an Hand des Graphen auch aussieht) zentralsymmetrisch in bezug auf ihren Wendepunkt ist. Schliesslich sei noch darauf hingewiesen, dass die Differentialgleichung (∗∗) die konstanten L¨ osungen N (t) = 0 und N (t) = B hat. Die zweite L¨ osung wird erhalten, indem man in (∗) die Konstante K = 0 setzt; die erste dagegen kommt durch keine Wahl von K zustande; es handelt sich um eine singul¨ are L¨ osung im Sinne von (16.10.4).
osungsmethoden 16. Einige L¨
246
¨ Bei den obigen Uberlegungen ¨brigens und insbesondere beim Skizzieren des Graphen wurde u stillschweigend vorausgesetzt, dass N (t) u ¨berhaupt Werte < B/2 annimmt. Ist der Anfangswert N0 = N (t0 ) > B/2 (aber < B, wie wir generell vorausgesetzt haben) so ist, da die Funktion N (t) w¨ achst, B/2 < N (T ) < B f¨ ur alle t, und unsere Kurve hat f¨ ur t > t0 keinen Wendepunkt. Sie besteht einfach aus dem “oberen Teil” des oben skizzierten Graphen.
(16.∞) Aufgaben In den Routine-Aufgaben 16−1 bis 16−5 ist stets die allgemeine L¨ osung der angegebenen Differentialgleichung gesucht. 16−1 Homogene lineare Differentialgleichungen. y xy a) y = (x > 0) b) y = x 1 + x2 16−2 Lineare Differentialgleichungen mit konstanten Koeffizienten. 1 a) y = 2y − 1 b) y = − y + 10 2 16−3 Inhomogene lineare Differentialgleichungen. a) y = −y + ex 3 d) y = y + x (x > 0) x 16−4 Separation der Variablen. x a) y = √ 1√+ x2 d) y = 4x y
y + 1 (x > 0) x f) y = x2 (y + x3 )
b) y = y + x3
c) y =
e) y = −y + cos x 1 b) y = 2y e) y = y 2 (x − 1)
c) y = ex−y f) y = 3x2 (y − 1)2
Achten Sie auf singul¨ are L¨ osungen. 16−5 Die Differentialgleichung y = a(A − y)(B − y). a) y = 3(2 − y)(4 − y)
b) y = 4y(1 − y)
16−6 Gegeben ist die Differentialgleichung y =
x y+x. 1 + x2
a) Zeichnen Sie das Richtungsfeld f¨ ur die neun Punkte (x, y) mit x = −1, 0, 1 und y = −1, 0, 1. b) Wie lautet die allgemeine L¨ osung dieser Differentialgleichung? c) Wie lautet die spezielle L¨ osung zur Anfangsbedingung x = 0, y = 1? 16−7 Gegeben ist die Differentialgleichung y = −
2y +x−2 x
(x > 0) .
a) Zeichnen Sie das zugeh¨ orige Richtungsfeld f¨ ur die sechs Punkte (x, y) mit x = 1, 2, 3 und y = 0, 1. b) Geben Sie die allgemeine L¨ osung dieser Differentialgleichung an. c) Geben Sie die spezielle L¨ osung dieser Differentialgleichung an, welche an der Stelle x = 2 ein relatives Extremum hat. Handelt es sich dabei um ein relatives Maximum oder ein relatives Minimum? osung, welche linear ist. Bestimmen 16−8 Die Differentialgleichung y = −y + 2x hat eine spezielle L¨ Sie diese und geben Sie die allgemeine L¨ osung an.
247
16.∞ Aufgaben
16−9 Gegeben ist die Differentialgleichung y =
y +1 2x + 2
(x > −1) .
a) Bestimmen Sie die allgemeine L¨ osung. b) Bestimmen Sie y0 so, dass die spezielle L¨ osung mit der Anfangsbedingung x0 = 1, y0 = ? eine lineare Funktion ist. Geben Sie diese Funktion an. x 16−10 L¨ osen Sie die Differentialgleichung y = mit den Anfangsbedingungen a) x = 2, y = 1, y b) x = 2, y = −1. 16−11 Gegeben ist die Differentialgleichung y = (x − 2)(y + 1). a) Entwerfen Sie das Richtungsfeld f¨ ur die Wertepaare (1,0), (1,1), (1,2), (2,0), (2,1), (2,2), (3,0), (3,1), (3,2). b) Wie lautet die Gleichung der L¨ osungskurve, welche durch den Punkt (2,1) geht? 16−12 Gegeben sind die beiden Differentialgleichungen (A) y =
x2 (y = 0) , y2
(B) y =
y2 (x = 0) . x2
a) Zeichnen Sie in beiden F¨ allen das Richtungsfeld f¨ ur die neun Punkte (x, y) mit x = 1, 2, 3 und y = 1, 2, 3. b) Geben Sie die allgemeine L¨ osung der Differentialgleichung (A) an. c) Geben Sie die allgemeine L¨ osung der Differentialgleichung (B) an. d) Geben Sie eine Funktion an, welche sowohl L¨ osung von (A) als auch L¨ osung von (B) ist. 16−13 L¨ osen Sie in Erg¨ anzung von (16.12) die Differentialgleichung y = a(A − y)(B − y) auch f¨ ur are den Fall, wo A = B ist, d.h. also die Differentialgleichung y = a(A − y)2 . Gibt es singul¨ L¨ osungen? 16−14 Gegeben ist die Differentialgleichung y = (y + 1)2 ex .
y
a) Geben Sie die allgemeine L¨ osung dieser Differentialgleichung an. b) Geben Sie die spezielle L¨ osung zur Anfangsbedingung x = 0, y = 1 an. c) Geben Sie die spezielle L¨ osung zur Anfangsbedingung x = 0, y = −1 an. 16−15 Gesucht ist eine Funktion f , definiert f¨ ur x ≥ 0, mit der folgenden Eigenschaft: Ihr Graph geht durch den Punkt A(0, 1), und in jedem Punkt P des Graphen von f ist die Steigung der Tangente in P doppelt so gross wie die Steigung der Strecke BP , wo B der Punkt (−1, 0) ist. Skizzieren Sie die Kurve.
P
A
x B 16−16 Wir nehmen einmal an, das Volumen V eines kugelf¨ ormigen Lutschbonbons nehme (beim Gebrauch) mit einer zeitlichen Rate ab, die proportional zur jeweils noch vorhandenen Oberfl¨ ache F ist, d.h. es gelte dV = −aF , dt mit a > 0. Am Anfang des Vorgangs hat das Bonbon den Radius r0 . a) Wie gross ist sein Radius zur Zeit t? (Tip: Setzen sie r = r(t) und dr¨ ucken Sie F und V [und damit auch dV /dt, Kettenregel!] durch r(t) aus.) b) Handelt es sich um eine exponentielle Abnahme? c) Nach 10 Minuten hat das Bonbon nur noch den halben Radius. Wann ist es (gem¨ ass unserem Modell) vollst¨ andig dahingeschwunden?
248
osungsmethoden 16. Einige L¨
ahrt auf einem See mit einer Schnelligkeit von 15 km/h. Pl¨ 16−17 Ein Motorboot f¨ otzlich bleibt der Motor stehen. Dreissig Sekunden nachher betr¨ agt die Schnelligkeit nur noch 10 km/h. a) Wie gross ist die Schnelligkeit zwei Minuten nach der Motorpanne, wenn angenommen wird, der Reibungswiderstand des Wassers sei proportional zur Schnelligkeit. b) Kommt mit dieser Modellannahme das Boot jemals zum Stehen? orper mit der 16−18 Ein in ein k¨ uhlendes Medium mit der konstanten Temperatur Tc getauchter K¨ angigen) Temperatur T (t) k¨ (zeitabh¨ uhlt sich gem¨ ass dem sogenannten Abk¨ uhlungsgesetz von ¨ NEWTON ab: Die Anderungsgeschwindigkeit der Temperatur ist proportional zur Differenz T − Tc . orige Differentialgleichung auf und l¨ osen Sie diese. a) Stellen Sie die zugeh¨ b) Ein Kuchen, der bei 180◦ C gebacken wurde, wird in der K¨ uche bei 20◦ C Lufttemperatur agt seine uhlt. Nach 10 Minuten hat er noch eine Temperatur von 100◦ . Wann betr¨ abgek¨ Temperatur 40◦ ?
249
E. AUSBAU DER INFINITESIMALRECHNUNG 17. UMKEHRFUNKTIONEN ¨ (17.1) Uberblick Die Funktion g heisst die Umkehrfunktion der Funktion f (oder die zu f inverse Funktion), wenn f¨ ur alle x aus dem Definitionsbereich von f und alle y aus dem Definitionsbereich von g gilt y = f (x) ⇐⇒ x = g(y) .
(17.3)
Die anschauliche Vorstellung ist dabei die, dass es die Funktion g erm¨ oglicht, die Gleichung y = f (x) bei gegebenem y nach x aufzul¨ osen. Bekannte Beispiele sind: • Quadratfunktion und Wurzel: y = x2 ⇐⇒ x =
√
y,
(x, y ≥ 0) .
• Exponentialfunktion und Logarithmus: y = ex ⇐⇒ x = ln y,
(y > 0) .
Neben der Besprechung der allgemeinen Begriffe und der Untersuchung der Ableitung der Umkehrfunktion befassen wir uns zuerst und vor allem mit den zyklometrischen Funktionen (auch Arcusfunktionen genannt), die nicht als bekannt vorausgesetzt werden.
(17.3) (17.4) (17.2)
Es handelt sich dabei um die Umkehrfunktionen der trigonometrischen Funktionen. Beispielsweise ist die Arcussinus-Funktion gegeben durch y = sin x ⇐⇒ x = arcsin y . Dabei wird — im Sinne einer Konvention — festgelegt, dass stets jener Wert x zu w¨ahlen ist, der im Intervall [− π2 , π2 ] liegt. In ¨ahnlicher Weise werden die Funktionen arccos, arctan, arccot definiert. Diese Funktionen sind auch bei der Berechnung von gewissen Integralen von Bedeutung.
(17.2) (17.5)
© Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0_5
250
17. Umkehrfunktionen
(17.2) Zyklometrische Funktionen a) Einleitung Oft stellt sich die Aufgabe, zu einem gegebenen Wert einer trigonometrischen Funktion, z.B. dem Sinus, den zugeh¨origen Winkel (hier stets im Bogenmass gemessen) zu bestimmen. Anders formuliert: In der Gleichung (1)
y = sin x
ist y gegeben und x gesucht, d.h., wir m¨ ussen diese Gleichung nach x aufl¨ osen. Dazu rufen wir uns die geometrische Definition des Sinus anhand des Einheitskreises in Erinnerung (vgl. (26.15)). Zun¨ achst erkennt man, dass die Gleichung (1) sicher nur dann l¨ osbar ist, wenn −1 ≤ y ≤ 1 ist, denn die Werte der Sinusfunktion liegen alle zwischen −1 und 1. Wir setzen deshalb im folgenden voraus, dass y ∈ [−1, 1] ist. Ist nun ein solches y gegeben, so sehen wir, dass es mehrere Winkel x gibt, deren Sinus = y ist: Da sind zun¨achst die beiden Winkel x1 und x2 im 1. und 2. Quadranten, welche — nebenbei bemerkt — der Beziehung x2 = π − x1 gen¨ ugen. Nun kann man aber noch beliebig viele Uml¨aufe (d.h. volle Winkel 2π) zu diesen beiden addieren oder subtrahieren und findet, dass alle diese Winkel
1
x sin x 1
1 y x2
x1 1
x1 + k · 2π, x2 + k · 2π,
(k ∈ Z)
denselben Sinus, n¨ amlich y, haben. Negative Winkel, die von der positiven x–Achse aus im Uhrzeigersinn gemessen werden, sind selbstverst¨andlich zugelassen. Ein Zahlenbeispiel Es sei y = 12 . Wie man mit einer Tabelle, dem Taschenrechner oder einer Skizze eines halben gleichseitigen Dreiecks feststellt, ist sin 30◦ = 12 , oder im Bogenmass sin π6 = 1 π 5π 1 2 . Ferner ist auch sin(π − 6 ) = sin 6 = 2 , und ebenso ist sin( f¨ ur alle k ∈ Z.
5π 1 π + k · 2π) = sin( + k · 2π) = 6 6 2
17.2 Zyklometrische Funktionen
251
Die Gleichung y = sin x hat also bei gegebenem y (aus [−1, 1]) unendlich viele L¨ osungen, was auch durch Betrachtung des Graphen der Sinusfunktion klar wird: y y x
Damit keine Mehrdeutigkeiten entstehen, zeichnet man nun unter den vielen m¨oglichen L¨ osungen der Gleichung (1) eine bestimmte aus. Welche man nimmt, ist Sache der Konvention. Im Falle des Sinus w¨ahlt man jenen Winkel, welcher im Intervall [− π2 , π2 ] liegt. Ein Blick auf den Einheitskreis oder den Graphen zeigt, dass es in diesem Intervall tats¨ achlich nur einen einzigen Winkel x mit y = sin x gibt. Zu einem gegebenen y aus [−1, 1] geh¨ ort also genau eine Zahl x aus [− π2 , π2 ] mit y = sin x . Diese Zahl x heisst Arcussinus von y, in Zeichen x = arcsin y . So ist etwa (vgl. das obige Beispiel) arcsin 12 =
π 6
(und nicht etwa =
5π 6
usw.).
Betrachten wir die Fragestellung noch anhand des Graphen, so bedeutet die Einschr¨ankung x ∈ [− π2 , π2 ], dass wir uns nur noch f¨ ur den dick markierten Teil der Sinuskurve interessieren. Auch hier sieht man deutlich, dass zu einem gegebenen y ∈ [−1, 1] genau ein x aus [− π2 , π2 ] geh¨ ort mit y = sin x. y y −π/2
x x π/2
Zusammenfassend l¨ asst sich in Worten sagen: arcsin y ist die Zahl aus [− π2 , π2 ], deren Sinus = y ist. Da also zu jedem y aus [−1, 1] eine eindeutig bestimmte Zahl arcsin y geh¨ ort, wird durch die Zuordnung y → arcsin y eine neue Funktion definiert, die Arcussinus-Funktion, kurz der Arcussinus. Ihr Definitionsbereich ist das Intervall [−1, 1].
252
17. Umkehrfunktionen
Ganz analog erh¨alt man zu den u ¨brigen trigonometrischen Funktionen die neuen Funktionen Arcuscosinus, Arcustangens, Arcuscotangens (vgl. (17.2.c) bis (17.2.e)). Man fasst diese Funktionen unter den Namen zyklometrische Funktionen oder ArcusFunktionen zusammen. Bevor wir die u ¨brigen Arcus-Funktionen behandeln, untersuchen wir noch einige ur weitere Eigenschaften des Arcussinus, die aber — entsprechend angepasst — auch f¨ die andern Arcus-Funktionen gelten und weiter unten nicht eigens erw¨ahnt werden. Definitionsgem¨ass bedeuten f¨ ur x ∈ [− π2 , π2 ] und y ∈ [−1, 1] die Aussagen y = sin x und x = arcsin y dasselbe. Formelm¨assig ausgedr¨ uckt: (2)
y = sin x ⇐⇒ x = arcsin y .
In einer solchen Situation spricht man von Umkehrfunktionen oder von inversen Funktionen (vgl. (17.3)). Man sagt, der Arcussinus sei die Umkehrfunktion des Sinus (oder die zum Sinus inverse Funktion) und umgekehrt. Was geschieht, wenn man zwei zueinander inverse Funktionen zusammensetzt? Ersetzt man in der Formel y = sin x die Zahl x durch arcsin y, was wegen (2) zul¨assig ist, so erh¨alt man (3)
(y ∈ [−1, 1]) .
y = sin(arcsin y),
Ebenso kann man in x = arcsin y f¨ ur y den Wert sin x einsetzen und findet (4)
x = arcsin(sin x),
π π (x ∈ [− , ]) . 2 2
Die Einschr¨ ankung f¨ ur y in (3) ist offensichtlich n¨ otig, denn f¨ ur y ∈ / [−1, 1] ist arcsin y gar nicht definiert. Da der Sinus an sich f¨ ur alle x definiert ist, k¨ onnte man die Formel (4) f¨ ur alle x hinschreiben, sie ist aber nur richtig f¨ ur x ∈ [− π , π ]! Dies liegt daran, dass arcsin y definitionsgem¨ ass in diesem 2 2 Intervall liegt. F¨ ur x = π z.B. ist sin x = 0 und somit auch arcsin(sin π) = 0 = π!
Entsprechende Aussagen k¨ onnen auch f¨ ur die u ¨brigen Arcus-Funktionen gemacht werden. Wie bestimmt man die Werte der Arcus-Funktionen? F¨ ur gewisse spezielle Argumente kann man sich den Wert von arcsin usw. durch geometrische Betrachtungen beschaffen. So entnimmt man z.B. der Skizze eines rechtwinklig-gleichschenkligen Drei√ √ ecks, dass sin π4 = 22 ist. Daraus folgt arcsin 22 = π4 . Im Normalfall wird man den Taschenrechner verwenden. Bei vielen Rechnern wird die in der angels¨ achsischen Litera−1 tur u ¨bliche Bezeichnung sin f¨ ur den arcsin benutzt*. Man trifft auch die Bezeichnung “ASIN” an. Bei manchen Modellen muss man die Tastenfolge INV SIN w¨ ahlen (die Bedeutung von “INV” sollte nach dem Gesagten klar sein). In jedem Fall ist es sehr * Hier ist also sin−1 y = arcsin y und nicht etwa =
1 ! sin y
17.2 Zyklometrische Funktionen
253
wichtig, dass der Rechner auf das richtige Winkelmass eingestellt ist! F¨ ur theoretische Betrachtungen, aber auch etwa beim Integrieren (17.5) braucht man das Bogenmass, wo also z.B. arcsin 1 = π2 ist. (Bei Einstellung auf Gradmass k¨ ame arcsin 1 = 90 heraus!) ¨ Zum Schluss dieser Uberlegungen geben wir noch den Graphen der ArcussinusFunktion an. Wir gehen aus von der Beziehung y = sin x ⇐⇒ x = arcsin y
(2)
π π f¨ ur x ∈ [− , ] . 2 2
Der Graph der (auf das Intervall [− π2 , π2 ] eingeschr¨ankten) Funktion y = sin x besteht aus allen Punktepaaren (x, y) mit y = sin x, (x ∈ [− π2 , π2 ]). Wegen (2) beschreiben genau dieselben Punktepaare auch die Beziehung x = arcsin y. Mithin haben y = sin x und x = arcsin y denselben Graphen. In der Darstellung x = arcsin y ist nun aber die unabh¨ angige Variable nicht wie u ¨blich x, sondern y, was ungewohnt ist. Um auf das vertraute Bild zu kommen, m¨ ussen wir also noch x und y vertauschen, was einer Spiegelung an der Geraden y = x entspricht. Somit wird der Graph der Arcussinus-Funktion erhalten, indem man den Graphen der auf [− π2 , π2 ] eingeschr¨ ankten Sinusfunktion an der Geraden y = x spiegelt: y y π/2 1 −π/2
x
−1
x 1
π/2 −1 y = sin x
y = arcsin x −π/2
¨ Ganz entsprechende Uberlegungen gelten f¨ ur die u ¨brigen zyklometrischen Funktionen, die nun im einzelnen besprochen werden. b) Arcussinus ¨ Der Vollst¨andigkeit halber fassen wir die bereits angestellten Uberlegungen nochmals zusammen: Der Definitionsbereich der Arcussinus-Funktion ist das Intervall [−1, 1]. F¨ ur jedes y ∈ [−1, 1] gilt: π π arcsin y ist die Zahl aus [− , ], deren Sinus = y ist . 2 2
254
17. Umkehrfunktionen
Beispiele 1. arcsin 0 = 0, denn 0 ist die einzige Zahl aus [− π2 , π2 ], deren Sinus 0 ist. √
2. arcsin(− ist.
3 2 )
= − π3 , denn − π3 ist die einzige Zahl aus [− π2 , π2 ], deren Sinus = −
3. Analog: arcsin 1 =
π 2,
arcsin(−1) = − π2 , arcsin
√
2 2
=
π 4
√
3 2
etc.
c) Arcuscosinus Genau wie beim Sinus liegen auch die Werte des Cosinus stets im Intervall [−1, 1]. Der Arcuscosinus ist also nur f¨ ur y ∈ [−1, 1] definierbar. Der untenstehenden Skizze des Graphen entnimmt man, dass die Gleichung y = cos x bei gegebenem y genau eine L¨ osung hat, wenn man (wie schon vorher im Sinne einer Konvention) fordert, dass x ∈ [0, π] sein soll. Mit dieser Abmachung definiert man in fast v¨ olliger Analogie zum Arcussinus den Arcuscosinus: Der Definitionsbereich der Arcuscosinus-Funktion ist das Intervall [−1, 1]. F¨ ur jedes y ∈ [−1, 1] gilt: arccos y ist jene Zahl aus [0, π], deren Cosinus = y ist .
Den Graphen erh¨ alt man wie vorhin durch Spiegeln. y π
y 1
y = arccos x
y = cos x π x
−1 x −1
1
Beispiele 1. arccos 1 = 0 (denn cos 0 = 1, und 0 ∈ [0, π]). 2. arccos 0 = π2 (denn cos π2 = 0, und π2 ∈ [0, π]). 3. arccos(−1) = π (denn cos π = −1, und π ∈ [0, π]).
d) Arcustangens Im Gegensatz zu sin und cos nimmt die Funktion tan alle Werte zwischen −∞ und ∞ an. Dies bedeutet, dass der Arcustangens f¨ ur alle y ∈ R definiert werden kann. Zur Erzwingung der Eindeutigkeit beschr¨ ankt man sich hier auf das offene Intervall (− π2 , π2 ). F¨ ur die Intervallgrenzen ± π2 ist der Tangens ja nicht mehr definiert!
17.2 Zyklometrische Funktionen
255
Die Arcustangens-Funktion ist f¨ ur jede reelle Zahl definiert. F¨ ur jedes y ∈ R gilt: π π arctan y ist jene Zahl aus (− , ), deren Tangens = y ist . 2 2
Den Graphen erh¨ alt man wieder durch Spiegeln: y y = tan x
y π/2
y = arctan x
x −π/2
x
π/2 −π/2
Beispiele 1. arctan 0 = 0 (tan 0 = 0, und 0 ∈ (− π2 , π2 )). 2. arctan 1 = π4 (tan π4 = 1 und π4 ∈ (− π2 , π2 )).
e) Arcuscotangens Hier geht alles analog zum Arcustangens; die Konvention ist die, dass man sich auf das offene Intervall (0, π) einschr¨ ankt. Die Arcuscotangens-Funktion ist f¨ ur jede reelle Zahl definiert. F¨ ur jedes y ∈ R gilt: arccot y ist jene Zahl aus (0, π), deren Cotangens = y ist .
Die zugeh¨ origen Graphen haben folgende Gestalt: π
y y = cot x
y y = arccot x
x
x
π
Die Arcuscotangens-Funktion wird nur selten gebraucht. Die meisten Taschenrechner haben auch keine eigene Taste daf¨ ur. Notfalls hilft die folgende, ohne Beweis erw¨ ahnte, Beziehung: 1 1 ) f¨ ur x > 0, arccot x = arctan( x ) + π f¨ ur x < 0. arccot x = arctan( x
256
17. Umkehrfunktionen
(17.3) Umkehrfunktionen In (17.2.a) sind wir, ausgehend vom Aufl¨osen einer Gleichung, auf den Begriff der Umkehrfunktion gekommen. Nat¨ urlich tritt dieser nicht nur im Zusammenhang mit trigonometrischen und zyklometrischen Funktionen auf. Wir stellen hier noch einige ¨ allgemeine Uberlegungen an und zeigen Parallelen auf. Anstelle der in (17.2.a) betrachteten Sinusfunktion untersuchen wir nun eine beliebige Funktion f mit Definitionsbereich D(f ) und wollen die Gleichung y = f (x) bei gegebenem y nach x aufl¨ osen. Dazu ist zun¨ achst n¨ otig, dass y so gew¨ ahlt ist, dass es u ¨berhaupt ein x mit y = f (x) gibt, d.h. dass y ein Funktionswert von f ist. Die Menge aller Funktionswerte, kurz die Wertemenge von f , bezeichnen wir mit W (f ). Es ist also W (f ) = {f (x) | x ∈ D(f )} , und wir verlangen, dass y ∈ W (f ) sei. Wie die Diskussion in (17.2.a) zeigte, kann es vorkommen, dass es zu einem y ∈ W (f ) mehrere x mit f (x) = y gibt. Dann ist aber die Gleichung y = f (x) nicht eindeutig nach x aufl¨ osbar, was unerw¨ unscht ist. Vielmehr ist f¨ ur unsere Bed¨ urfnisse notwendig, dass zu jedem y ∈ W (f ) genau ein x ∈ D(f ) geh¨ ort, welches der Beziehung y = f (x) gen¨ ugt. Eine Funktion mit dieser Eigenschaft heisst injektiv. Die folgenden Skizzen illustrieren den Sachverhalt: y y f
f x
x x1
D(f ) f : D(f ) → R injektiv.
D(f )
x2
f : D(f ) → R nicht injektiv.
Dass die rechts dargestellte Funktion f nicht injektiv ist, erkennt man daran, dass es Zahlen x1 = x2 gibt, f¨ ur welche f (x1 ) = f (x2 ) ist. ¨ Dieser Uberlegung entnimmt man sofort, dass eine Funktion f : D(f ) → R genau dann injektiv ist, wenn f¨ ur alle x1 , x2 ∈ D(f ) gilt: Aus x1 = x2 folgt f (x1 ) = f (x2 ) . Eine wachsende bzw. fallende (genauer streng monoton wachsende bzw. fallende, vgl. (6.2.d)) Funktion ist also injektiv. Gem¨ ass (6.3) gilt somit f¨ ur differenzierbare Funktionen: Ist f (x) > 0 f¨ ur alle x ∈ D(f ) bzw. f (x) < 0 f¨ ur alle x ∈ D(f ), dann ist f injektiv.
17.3 Umkehrfunktionen
257
Wir setzen nun voraus, die Funktion f sei injektiv. Dann geh¨ ort zu jedem y ∈ W (f ) genau ein x mit y = f (x). Durch die Zuordnung y → x wird eine neue Funktion g definiert. F¨ ur diese gilt g(y) = x . Ihr Definitionsbereich D(g) ist gleich W (f ), ferner ist W (g) = D(f ). Man nennt g die zu f inverse Funktion oder die Umkehrfunktion von f . Statt g schreibt man auch f −1 . Gem¨ass unserer Herleitung gilt (vgl. Formel (2) in (17.2)) (5)
y = f (x) ⇐⇒ x = g(y)
f¨ ur alle x ∈ D(f ) und alle y ∈ W (f ) .
Genau wie beim Arcussinus (Formel (3) und (4) in (17.2)) kann man in y = f (x) die Zahl x durch g(y) ersetzen und findet so (6)
y = f (g(y))
f¨ ur alle y ∈ D(g) .
x = g(f (x))
ur alle x ∈ D(f ) . f¨
Analog (7)
Anschaulich heisst dies: Zueinander inverse Funktionen heben sich in ihrer Wirkung auf. agt uhrte Diskussion des Graphen des Arcussinus u ¨bertr¨ Die in (17.2.a) durchgef¨ sich sofort auf den allgemeinen Fall: Die Beziehungen y = f (x) und x = g(y) sind gleichwertig und ergeben als Bild den Graphen von f . Um aber das gewohnte Bild angige Variable auf der horizontalen Achse) zu erhalten, m¨ (unabh¨ ur den ussen wir f¨ Graphen der Umkehrfunktion g = f −1 die Zahlen x und y vertauschen, d.h., wir m¨ ussen an der 45◦ –Geraden durch den Nullpunkt spiegeln: Der Graph von f −1 entsteht aus dem Graphen f durch Spiegelung an der 45◦ -Geraden durch den Nullpunkt. y f −1 = g f
x
258
17. Umkehrfunktionen
Hinweis Man kann nat¨ urlich jeden Graphen an dieser Geraden spiegeln. Wenn aber f nicht injektiv ist, so ist die entstandene Kurve (vgl. die gestrichelte Kurve in der untenstehenden Figur) nicht mehr der Graph einer Funktion. Sie ist genau dann der Graph einer Funktion, wenn f injektiv ist.
y
x
Wir illustrieren nun die obigen Betrachtungen an einigen Beispielen: a) Arcussinus-Funktion Wie passt nun unsere Diskussion in (17.2.a) zum allgemeinen Fall? Die Sinusfunktion ist (wie die anderen trigonometrischen Funktionen auch) a priori nicht injektiv. Sie kann aber (gewissermassen k¨ unstlich) injektiv gemacht werden, indem man sie nur noch auf dem Intervall [− π2 , π2 ] betrachtet: y y x
−π/2
x π/2
Die derart eingeschr¨ankte Funktion hat nun nach der oben entwickelten allgemeinen Theorie eine Umkehrfunktion, und dies ist gerade die Arcussinus-Funktion. b) Exponentialfunktion und Logarithmus Diese Funktionen werden als bekannt vorausgesetzt; sie wurden ja bisher schon oft verwendet (vgl. auch (26.13), (26.14)). Es geht hier nur um eine weitere Illustration des Begriffs der Umkehrfunktion. Die Exponentialfunktion y = f (x) = ex ist wachsend, denn ihre Ableitung f (x) = ex ist stets positiv (vgl. (6.3)). Insbesondere ist f injektiv. Man kann deshalb die Umkehrfunktion g bilden, welche, wie Sie wissen, “nat¨ urlicher Logarithmus” genannt wird: x = g(y) = ln y. Wie steht es mit den Definitionsbereichen? f (x) = ex ist f¨ ur alle x ∈ R definiert, x d.h., es ist D(f ) = W (g) = R. Ferner ist e > 0 f¨ ur alle x und es ist W (f ) = D(g) = {y | y > 0}. Die Beziehung (5) lautet dann y = ex ⇐⇒ x = ln y
f¨ ur alle x und f¨ ur alle y > 0 .
17.4 Die Ableitung der Umkehrfunktion
259
Die Beziehungen (6) und (7) ergeben die bekannten und wichtigen Formeln ur alle y > 0, eln y = y f¨
ur alle x . ln ex = x f¨
Die Graphen geben durch Spiegelung an der Geraden mit der Gleichung y = x auseinander hervor und sehen bekanntlich so aus (vgl. auch (26.13), (26.14)): y y y = ex
y = ln x
x
x
c) Die Quadratwurzel Auch hier erfahren Sie nichts prinzipiell Neues: Die zur Quadratfunktion y = x2 √ inverse Funktion ist die Wurzelfunktion x = y. Dies folgt einfach daraus, dass √ x = y L¨ osung der Gleichung y = x2 ist. Beachten Sie, dass y ≥ 0 sein muss. √ Allerdings gibt es noch eine zweite L¨osung: x = − y. Um die Eindeutigkeit zu erzwingen, wird verlangt, dass die Wurzelfunktion stets Werte ≥ 0 annimmt. Die √ Beschr¨ ankung auf Werte x = y ≥ 0 bedeutet, dass man sich nur f¨ ur den rechten Ast der Parabel y = x2 interessiert. Anders ausgedr¨ uckt: Man macht die (a priori nicht injektive) Funktion y = x2 sozusagen gewaltsam injektiv, indem man den Definitionsbereich auf die Menge {x | x ≥ 0} einschr¨ ankt. Dies ist v¨ ollig analog zur π π Situation beim Arcussinus, wo man sich auf [− 2 , 2 ] beschr¨ ankte. Der Graph der Wurzelfunktion wird dann durch Spiegelung des rechten Parabelastes erhalten: y y y=
√
x
y = x2 x
x
(17.4) Die Ableitung der Umkehrfunktion In (5.3) sind die Ableitungsformeln f¨ ur die zyklometrischen Funktionen angegeben, aber noch nicht bewiesen worden. Dies holen wir nun nach, und zwar tun wir dies mittels einer allgemeinen Formel f¨ ur die Ableitung der Umkehrfunktion.
260
17. Umkehrfunktionen
Dazu argumentieren wir geometrisch: Der Graph von f −1 = g entsteht aus dem Graphen von f durch Spiegeln an der 45◦ -Geraden durch den Nullpunkt (17.3): Der Punkt (x0 , y0 ) auf dem Graphen von f geht dabei in den Punkt (y0 , x0 ) auf dem Graphen von g u ¨ber. Dabei werden auch die entsprechenden Tangenten gespiegelt. Nun hat die Tangente an den Graphen von f in (x0 , y0 ) die Steigung f (x0 ), und es ist klar, dass die gespiegelte Tangente die reziproke Steigung 1/f (x0 ) hat. y g (y0 , x0 ) f (x0 , y0 ) x Es folgt: Es sei y0 = f (x0 ) (und somit x0 = g(y0 )). Dann gilt f¨ ur die Ableitung der zu f inversen Funktion g an der Stelle y0 : g (y0 ) =
1 1 = f (x0 ) f (g(y0 ))
f¨ ur
f (x0 ) = 0 .
Diese Formel ist nicht sinnvoll, wenn f (x0 ) = 0 ist. Geometrisch bedeutet dies, dass die Tangente an den Graphen von f in (x0 , y0 ) horizontal ist. Die gespiegelte Tangente ist dann vertikal, das heisst aber, dass die entsprechende Ableitung nicht existiert. Die Funktion g ist an dieser Stelle nicht differenzierbar. Die Ableitungsformel ist hier mit ¨ einer geometrischen Uberlegung plausibel gemacht worden. Auf einen strengen Beweis sei wie u ¨blich verzichtet. Schreibt man die Formel f¨ ur die Ableitung der Umkehrfunktion mittels des Differentialquotienten, so lautet sie (mit y = f (x), x = g(y)): 1 dx = , dy dy dx
d.h., man kann formal die Regel f¨ ur das Reziproke eines Bruches anwenden.
Die eben besprochene Formel wenden wir nun auf die zyklometrischen Funktionen an und bestimmen so deren Ableitung. a) Arcussinus Es sei f (x) = sin x, g(y) = arcsin y. Dann gilt y = sin x ⇐⇒ x = arcsin y, x ∈ [− π2 , π2 ]. F¨ ur x = − π2 bzw. π2 , also y = −1 bzw. 1, ist f (x) = cos x = 0. Die Umkehrfunktion arcsin ist also an den Stellen −1 und 1 nicht differenzierbar. (Ein Blick auf
261
17.5 Beispiele zur Anwendung der Arcusfunktionen
den Graphen zeigt, dass dort tats¨achlich vertikale Tangenten vorliegen.) F¨ ur alle anderen y ist 1 1 g (y) = = . f (x) cos x Nun soll auf der rechten Seite nicht x, sondern y vorkommen. Wegen y = sin x und sin2 x + cos2 x = 1 ist cos x = 1 − y 2 . Dabei ist die positive Wurzel zu w¨ahlen, denn x liegt ja in (− π2 , π2 ), wo cos x > 0 ist. Somit ist g (y) =
1 1 − y2
,
wie in der Tabelle (5.3) angegeben (mit x anstelle von y). Die Formel zeigt ganz von selbst, dass der Arcussinus f¨ ur y = ± 1 nicht differenzierbar ist. b) Arcuscosinus Ein analoges Vorgehen liefert die Formel aus der Tabelle (5.3). c) Arcustangens Es sei f (x) = tan x, g(y) = arctan y. Dann gilt y = tan x ⇐⇒ x = arctan y, x ∈ [− π2 , π2 ]. f (x) = 1 + tan2 x ist nie 0, somit ist arctan u ¨berall differenzierbar. F¨ ur alle y gilt also 1 1 1 g (y) = , = = f (x) 1 + y2 1 + tan2 x womit die Formel bereits bewiesen ist. d) Arcuscotangens Die Formel aus Tabelle (5.3) wird entsprechend erhalten. (17.5) Beispiele zur Anwendung der Arcusfunktionen Die Umkehrung der Ableitungsformeln f¨ ur Arcusfunktionen ergibt Ausdr¨ ucke f¨ ur gewisse Integrale, vgl. (12.4) und die Tabelle (13.7). Merken Sie sich vor allem
dx = arctan x + C, 1 + x2
√
dx = arcsin x + C . 1 − x2
Beispiele 1. Gesucht ist der Fl¨acheninhalt A unter der durch y = gegebenen Kurve.
1 im Intervall [0, 1] 1 + x2
17. Umkehrfunktionen
262
¨ Ahnlich wie in (12.6.3) findet man 1 1 π dx A= = arctan x = . 2 1 + x 4 0 0 Dass arctan 1 = π4 ist, sollte man eigentlich noch auswendig wissen. Andernfalls muss man eben den Taschenrechner gebrauchen. Wie schon in (17.2.a) erw¨ahnt, ist dabei unbedingt darauf zu achten, dass er auf das Bogenmass (RAD) eingestellt ist. Andernfalls w¨ urde er f¨ ur arctan 1 den Wert 45 (Grad) oder gar 50 (“Neugrad”) liefern, was einen ganz falschen Fl¨ acheninhalt erg¨abe.
y
A x
0
1
dx √ 2. I = 1 − 4x2 Eine einfache Substitution (u = 2x, dx = 12 du) ergibt I = 12 arcsin(2x) + C. dx 3. I = 2 + 3x2 Hier muss man etwas raffinierter substituieren. Man schreibt den Nenner in der Form 2 + 3x2 = 2(1 + 32 x2 ) und setzt u = 32 x, du = 32 dx. Dann wird
I=
1 · 2
2 3
du 1 1 = √ arctan u + C = √ arctan 1 + u2 6 6
3 x+C . 2
(17.∞) Aufgaben 17−1 Bestimmen Sie durch Betrachtung der Dreiecke mit den Winkeln ( π , π , π ) und ( π , π , π ) die 6 3 2 4 4 2 folgenden Funktionswerte: √ √ a) arcsin(− 12 ), b) arccos(− 23 ), c) arctan 3, d) arctan(−1). 17−2 Zeichnen Sie den Graphen der Funktion f (x) = arcsin(sin x) f¨ ur −2π ≤ x ≤ 2π. 17−3 Zeigen Sie mit Hilfe der Ableitung, dass die folgenden Funktionen auf dem angegebenen Intervall u ¨berall fallend und damit injektiv sind. Geben Sie die inverse Funktion samt ihrem Definitionsbereich an. Skizzieren Sie ferner die Graphen von f und f −1 . a) f (x) = x − x2 , x ∈ [ 12 , ∞),
b) f (x) = e−x + 1, x ∈ (−∞, ∞).
17−4 Die Funktion x → F (x) = 95 x + 32 rechnet ◦ Celsius in ◦ Fahrenheit um. a) Welches ist der der physikalischen Wirklichkeit entsprechende Definitionsbereich von F ? b) Geben Sie die zu F inverse Funktion an. Welches ist ihr Definitionsbereich? Welches ist hier ihre konkrete Bedeutung? 17−5 Zeigen Sie, dass die folgenden Funktionen die Ableitung 0 haben. Welche Identit¨ aten (d.h. f¨ ur alle zugelassenen x g¨ ultigen Beziehungen) ergeben sich? a) f (x) = arcsin x + arccos x (−1 < x < 1), x b) f (x) = arctan x − arcsin √ . 1 + x2
17.∞ Aufgaben
263
17−6 Berechnen Sie die Ableitung der folgenden Funktionen.
√ c) Z(z) = arctan z b) A(s) = arccos(s2 ) − 1) a) f (x) = arcsin(x 1−z x+1 1 − t2 d) W (z) = arctan e) A(x) = arctan f) f (t) = arcsin 1+z x−1 1 + t2 17−7 Das Zifferblatt der Uhr eines in einer Ebene stehenden Kirchturms hat einen Durchmesser von 5 m. Der Mittelpunkt des Zifferblatts befindet sich 22.5 m u ¨ber dem Boden. Ein Fotograf h¨ alt seine Kamera auf Augenh¨ ohe (1.7 m). Wie weit muss er sich vom Fuss des Kirchturms entfernen, um das Zifferblatt unter dem gr¨ osstm¨ oglichen Winkel aufzunehmen?
17−8 Berechnen Sie die folgenden unbestimmten Integrale. dx √ a) b) arctan t dt 1 − 9x2 x dt d) dx e) dt 1 + 16x4 2t2 + 2t + 5 17−9 Der Graph der Funktion 1 f (x) = x + √ , 0≤x≤1 1 + x2
1 dx 2 + 8x2 2 − x2 dx f)
c)
wird um die x–Achse rotiert. Berechnen Sie das Volumen des entstehenden Rotationsk¨ orpers. 17−10 Wie lautet die allgemeine L¨ osung der folgenden Differentialgleichungen? y y x x , (x > 0), c) y = + √ , (0 < x < 1). a) y = ex (1 + y 2 ), b) y = + x 1 + x2 x 1 − x2
264
18. EINIGE WICHTIGE FUNKTIONEN UND IHRE ANWENDUNGEN
¨ (18.1) Uberblick In diesem Kapitel werden einige wichtige Funktionen behandelt. Die meisten unter ihnen sind nicht neu und sind schon fr¨ uher vorgekommen. Hier soll nun vor allem der Aspekt ihrer Anwendbarkeit in den Naturwissenschaften betont werden: • Trigonometrische Funktionen werden zur Darstellung von periodischen Vorg¨angen gebraucht. • Die Exponentialfunktion und verschiedene daraus hergeleitete Funktionen haben oft mit Wachstumsvorg¨angen zu tun. • Von diesen Abwandlungen der Exponentialfunktion werden die hyperbolischen Funktionen und ihre Umkehrfunktionen, die Areafunktionen, noch etwas n¨aher besprochen. • Oft tritt eine Funktion f (x) in gewissen Modifikationen auf, wie et¨ wa f (x − a), f (x) + b, f (cx), sf (x). Diese Anderungen haben gut u ¨berblickbare Auswirkungen auf den Graphen der Funktion. • Eine andere Anwendung von Exponentialfunktion und Logarithmus sind die logarithmischen Skalen. Versieht man eine oder beide Koordinatenachsen mit dieser Skala, so wird der Graph einer Exponentialbzw. einer Potenzfunktion zu einer Geraden.
(18.3) (18.4) (18.7) (18.6) (18.7)
(18.2)
(18.11), (18.12)
(18.2) Modifikation einer Funktion y Wir betrachten eine Funktion f (x) und ihren Graphen, der durch die Beziehung y = f (x) gegeben ist. Wir modifizieren nun diese Beziehung auf verschiedene Arten und sehen, was herauskommt.
f x y
a) Verschiebung in x–Richtung Wir setzen f1 (x) = f (x − a) f¨ ur a > 0. Der Graph von f1 ist gegen¨ uber dem Graphen von f um die Strecke a nach rechts verschoben. Entsprechend liefert f (x + a), a > 0 eine Verschiebung nach links.
f1
f1 (x) = f (x − a)
x x−a x
18.2 Modifikation einer Funktion
265
y
b) Verschiebung in y–Richtung Nun sei f2 (x) = f (x) + b f¨ ur b > 0. Hier wird der Graph von f um b nach oben verschoben. Analog ergibt f (x) − b, b > 0, eine Verschiebung nach unten. c) Spiegelung an der y–Achse
f2
b
x
y f3
Der Graph der Funktion f3 (x) = f (−x) wird durch Spiegelung von f an der y–Achse erhalten. x d) Streckung/Stauchung in x–Richtung Es sei c > 0. Wir untersuchen f4 (x) = f (cx). Der Wert von f4 an der Stelle x ist gleich jenem von f an der Stelle cx. Deshalb entspricht ¨ der Ubergang von f zu f4 einer Streckung in x– Richtung mit dem Faktor 1c . (F¨ ur c > 1, also 1 c < 1 handelt es sich anschaulich um eine “Stauchung”.)
y f4 x cx x y
Ist c < 0, so kommt gem¨ ass c) zur Streckung 1 um |c| eine Spiegelung an der y–Achse hinzu. x
e) Spiegelung an der x–Achse ¨ Dieser Ubergang wird durch f5 (x) = −f (x) geleistet.
f5
f) Streckung/Stauchung in y–Richtung Es sei s > 0. Wir untersuchen f6 (x) = sf (x). Der Wert von f6 an der Stelle x ist das s–fache des ¨ Werts von f (x). Der Ubergang von f zu f6 besteht in einer Streckung (s > 1) (oder Stauchung (s < 1)) in y–Richtung. F¨ ur s < 0 kommt gem¨ ass e) eine Spiegelung an der x-Achse hinzu.
y f6
x
Diese verschiedenen Modifikationen k¨ onnen nat¨ urlich auch kombiniert werden; im Extremfall zu g(x) = sf c(x − a) + b . In (18.3) wird dieses Thema aufgenommen.
18. Einige wichtige Funktionen und ihre Anwendungen
266
(18.3) Periodische Funktionen Wir betrachten hier die trigonometrische Funktionen (Sinus, Cosinus etc.) unter einem neuen Gesichtspunkt (siehe (26.15) f¨ ur die wichtigsten Grundbegriffe). Ihr erster Kontakt mit diesen Funktionen fand wohl in der Geometrie (Trigonometrie) statt, doch gibt es auch noch ganz anders geartete Anwendungen. In den Naturwissenschaften ist n¨ amlich vor allem wichtig, dass die trigonometrischen Funktionen periodisch sind, denn es gilt bekanntlich f¨ ur alle x ∈ R (wir verwenden wie u ¨blich das Bogenmass) sin(x + 2π) = sin x,
cos(x + 2π) = cos x .
Ganz allgemein nennt man eine Funktion f periodisch, wenn es eine Zahl p > 0 gibt mit f (x + p) = f (x) f¨ ur alle x. F¨ ur die Sinusfunktion kann man p = 2π w¨ahlen, es w¨ are aber auch p = 4π, 6π usw. m¨ oglich. Die kleinste positive Zahl p mit der erw¨ahnten Eigenschaft heisst die Periode von f (im Fall der Sinusfunktion also p = 2π). Periodische Vorg¨ange sind ja in der Natur sehr h¨ aufig (man denke an Schwingungsvorg¨ ange, Biorhythmen oder dergleichen). Somit treten periodische Funktionen in ganz nat¨ urlicher Weise auf. Als konkretes Beispiel erw¨ahnen wir das Elektrokardiogramm, das man (mit einer gewissen Idealisierung) als Darstellung einer periodischen Funktion betrachten kann:
p Zun¨ achst scheint diese Kurve u ¨berhaupt nichts mit trigonometrischen Funktionen zu tun zu haben. Es gibt aber einen wichtigen mathematischen Satz, der besagt, dass jede einigermassen “vern¨ unftige” periodische Funktion f als eine sogenannte Fourierreihe, n¨ amlich als unendliche Reihe der Form f (x) = a0 +
∞
(an cos nx + bn sin nx)
n=1
dargestellt werden kann. (Die durch die obige EKG-Kurve gegebene Funktion w¨ are z.B. bereits “vern¨ unftig” genug!) In dieser Formel wird vorausgesetzt, dass f die Periode 2π hat, was durch eine Massstabs¨ anderung leicht erreicht werden kann (siehe unten). Wir k¨ onnen hier nicht n¨ aher auf diese Fourierreihen eingehen. Wir erw¨ ahnten sie, um zu zeigen, dass die Bedeutung der trigonometrischen Funktionen weit u ¨ ber die Dreiecksberechnung hinausgeht, bilden sie doch gem¨ ass den obigen Bemerkungen sozusagen Bausteine der periodischen Funktionen.
18.3 Periodische Funktionen
267
Wir haben oben gesehen, dass Sinus und Cosinus die Periode 2π haben. Wir zeigen nun, wie man die Funktionen so modifizieren kann, dass sie eine beliebige Periode p haben. Es gen¨ ur den Cosinus geht alles analog. Im ugt, den Sinus zu betrachten, f¨ π ¨brigen gilt ja cos x = sin(x + 2 ) (Verschiebung!). u Wir behaupten: Die Funktion f (x) = sin( 2π p x) hat die Periode p. In der Tat ist n¨ amlich 2π 2π 2π f (x + p) = sin (x + p) = sin x + 2π = sin x = f (x) , p p p denn der Sinus hat die Periode 2π. Zum Beispiel hat die Funktion sin(πx) die Periode 2, die Funktion sin( 12 πx) die Periode 4 usw. y y = sin x
1 x
y = sin π2 x
0
1
2
3
4
7
5
y = sin πx
Wir haben hier eine Anwendung von Punkt d) von (18.2) vor uns. Die eben diskutierte Funktion f (x) = sin( 2π p x) hat also die Periode p. Ferner hat sie eine Nullstelle in x = 0 und ist dort wachsend, denn f (0) > 0. Eine Funktion g mit der Periode p, die an einer beliebigen Stelle x0 eine Nullstelle hat und dort wachsend ist, erh¨ alt man, indem man x durch x − x0 ersetzt (geometrisch: Verschiebung des Graphen parallel zur x–Achse, vgl. Punkt a) von (18.2)). Die Formel lautet dann 2π g(x) = sin (x − x0 ) . p Die Maxima bzw. Minima dieser Funktion liegen bei 1 bzw. bei −1. Man sagt, sie habe die Amplitude 1. W¨ unscht man nun eine periodische Funktion h (mit Periode p und einer Nullstelle in x0 ) mit einer beliebigen Amplitude A > 0, so muss man g(x) mit A multiplizieren (Punkt f) von (18.2)). Man erh¨ alt 2π h(x) = A sin (x − x0 ) . p y A x x0 −A
x0 + p
268
18. Einige wichtige Funktionen und ihre Anwendungen
Beispiel Gesucht ist eine periodische Funktion h mit folgenden Eigenschaften: • Periode 24 (Stunden), • eine Nullstelle (mit wachsender Funktion) f¨ ur x = 5, • Amplitude 3. π L¨osung: h(x) = 3 sin( 12 (x − 5)).
Wie gross ist der Funktionswert um Mitternacht? L¨ osung: h(0) = h(24) = 3 sin(− 5π 12 ) ≈ −2.9. (Bogenmass verwenden!)
(18.4) Die Exponentialfunktion F¨ ur die Grundeigenschaften der Exponentialfunktion verweisen wir auf (26.13), wo auch die Definition der Zahl e = 2.718281828 . . . angegeben ist. Wenn man von der Exponentialfunktion (mit dem bestimmten Artikel und ohne weitere Zus¨ atze) spricht, so ist immer die Exponentialfunktion mit der Basis e, also die Funktion x → ex gemeint. Um Exponenten zu vermeiden, schreibt man auch exp x oder exp(x) anstelle von ex . F¨ ur die Anwendungen in den Naturwissenschaften ist die wohl wichtigste Eigenschaft der Exponentialfunktion die, dass sie gleich ihrer Ableitung ist*. Es gilt ja dex = ex . dx osung der DifferentialAnders ausgedr¨ uckt: Die Exponentialfunktion y = ex ist eine L¨ gleichung y = y . Da y = f (x) das Wachstumsverhalten der Funktion y = f (x) beschreibt, wird die Exponentialfunktion u ¨berall dort eine Rolle spielen, wo die Wachstumsgeschwindigkeit proportional zum jeweiligen Funktionswert ist. Beispiele hierzu haben wir in (15.3.a) und (15.3.b) kennengelernt. Wenn man es mit der Exponentialfunktion zu tun hat, so ben¨otigt man auch immer die dazu inverse Funktion, den nat¨ urlichen Logarithmus. Hier gilt (vgl. Beispiel b) in (17.3) oder (26.14.c)): y = ex ⇐⇒ x = ln y , ln(ex ) = x , eln y = y . * F¨ur die Exponentialfunktion zur Basis a = e gilt diese einfache Formel nicht mehr; vielmehr ist
dax = ln a · ax . dx
18.5 Radioaktiver Zerfall
269
Diese Beziehungen braucht man z.B., um Exponenten “herunterzuholen” (vgl. etwa Beispiel 1. in (16.10)). Als eine andere Anwendung des Logarithmus sei festgehalten, dass die allgemeine Exponentialfunktion f (x) = Cax , (a > 0) stets auch mit der Basis e geschrieben werden kann. Wegen a = eln a ist f (x) = Cax = Cex·ln a . Der Graph von eλx hat f¨ ur λ > 0 die untenstehende Form (vgl. auch (26.13.e)), ur wobei er um so steiler ist, je gr¨ osser λ ist. Diese Skizze schliesst wegen ln a > 0 f¨ a > 1 auch den Fall ax = ex·ln a f¨ ur a > 1 ein. Der Graph von e−λx (λ > 0) wird gem¨ass Punkt c) von (18.2) durch Spiegelung des ersten Graphen an der y–Achse erhalten. Er schliesst den Fall ax f¨ ur 0 < a < 1 ein, denn hier ist ln a < 0. y
y
1
y = eλx x
1
y = e−λx x
(18.5) Radioaktiver Zerfall In diesem Abschnitt wird anhand des radioaktiven Zerfalls das Auftreten der Exponentialfunktion bei Zerfallsvorg¨angen beschrieben, vgl. auch (15.3.a). Entsprechendes gilt f¨ ur exponentielles Wachstum (15.3.b). Wir untersuchen eine radioaktive Substanz. In (15.3.a) sind wir von der Modellvorstellung ausgegangen, dass in einem bestimmten Zeitraum jedes Atom dieselbe Wahrscheinlichkeit hat, zu zerfallen. In einem kleinen Zeitintervall ist dann die Anzahl der Zerf¨ alle proportional zur Anzahl der vorhandenen Atome. Dies f¨ uhrt auf die Differentialgleichung N (t) = −λN (t), λ > 0 f¨ ur die Anzahl N (t) der Atome, welche, wie man direkt nachrechnet (vgl. aber auch (15.3.a)), die folgende L¨osung hat: N (t) = N0 e−λt . Es sei noch darauf hingewiesen, dass es sich bei der besprochenen Funktion N (t) um eine Idealisierung handelt. Man beschreibt die Anzahl N (t) der Atome durch die Funktion N0 e−λt , welche auch
18. Einige wichtige Funktionen und ihre Anwendungen
270
urlich stets ganzzahlig ist. Wegen nicht-ganzzahlige Werte annimmt, wogegen die Anzahl der Atome nat¨ aherung an die Wirklichkeit aber ohne weiteres erlaubt. Zuder grossen Zahl der Atome ist diese Ann¨ dem muss man N (t) als differenzierbar voraussetzen, wenn man die Methoden der Differentialgleichung einsetzen will (siehe auch den Schluss von (15.3.a)).
Nun betrachten wir die Funktion N (t) = N0 e−λt noch etwas genauer. Dabei ist N0 die Anzahl der zur Zeit t = 0 vorhandenen Atome, denn N (0) = N0 e0 = N0 . Da λ > 0 ist, ist nach dem am Schluss von (18.4) gesagten e−λt eine fallende Funktion, wie es auch sein muss, da die Anzahl der Atome im Verlauf der Zeit abnimmt. Was bedeutet nun λ konkret? Um dies zu ergr¨ unden, betrachten wir die Halbwertszeit T1/2 des untersuchten Isotops. Dies ist bekanntlich die L¨ ange jenes Zeitintervalls, in dem die H¨alfte der vorhandenen Atome zerf¨ allt. Wir werden sehen, dass diese Halbwertszeit weder von der Anzahl Atome noch von der gew¨ahlten Anfangszeit abh¨ angt. Nat¨ urlich h¨angt sie aber von der betrachteten Substanz ab. Der Zusammenhang zwischen der sogenannten Zerfallskonstanten λ und der Halbwertszeit T1/2 ist durch die Formeln T1/2 =
(1)
ln 2 λ
oder
λ=
ln 2 T1/2
gegeben. Dies sieht man folgendermassen ein: Wir betrachten einen beliebigen Zeitpunkt t1 . Zur Zeit t1 ist die Anzahl der vorhandenen Atome N1 = N (t1 ) = N0 e−λt1 . Wenn nun T1/2 die Halbwertszeit ist, so sind zur Zeit t2 = t1 + T1/2 nur noch halb so viele Atome da. Mit N2 = N (t2 ) = N0 e−λt2 ist dann N2 =
1 N1 . 2
Nun ist aber N2 = N0 e−λt2 = N0 e−λ(t1 +T1/2 ) = N0 e−λt1 · e−λT1/2 = N1 e−λT1/2 . Wegen N2 =
1 N 2 1
folgt N1 e−λT1/2 =
1 N 2 1
oder e−λT1/2 =
1 . 2
Logarithmieren ergibt −λT1/2 = ln
1 2
und weiter (unter Benutzung der Regel ln x−1 = − ln x) T 1/ 2 = −
ln
1 2
λ
=
ln 2 0.69315 . . . = . λ λ
Dies ist die gesuchte Beziehung. Nat¨ urlich h¨ angen λ und T1/2 vom untersuchten Isotop ab. Dagegen h¨ angt, wie schon oben erw¨ ahnt, T1/2 weder von N0 noch von t1 ab.
271
18.6 Die hyperbolischen Funktionen
Zum Schluss noch eine praktische Anwendung der ganzen Geschichte: Bei der aologischen Altersbestimmung vergleicht man die 14 C-Konzentration von lebenden arch¨ Wesen mit jener der Funde und berechnet nach der “Zerfallsgleichung” (d.h. der Gleiur N (t)) das Alter des Fundes. chung f¨ Beispiel Bei Ausschachtungsarbeiten wurden Speisereste gefunden, deren t¨at 90% der Aktivit¨at von lebenden Pflanzen betrug, d.h. es war
14
C-Radioaktivi-
N (t) = 0.9 , N (0) wobei t das Alter der Speisereste (in Jahren) bedeutet. N (0) stellt die Zahl der radioaktiven Teilchen am Anfang, N (t) jene Zahl heute dar. Die Halbwertszeit von 14 C ist bekannt, sie betr¨agt T1/2 = 5730 Jahre, wobei in der Literatur auch abweichende Angaben vorkommen. Gem¨ass Formel (1) ist λ=
0.693 = 0.000121 . 5730
Nach der “Zerfallsgleichung” ist N (0) = N0 , N (t) = N0 e−λt . Es folgt 0.9 = e−λt und diese Gleichung ist nach t aufzul¨osen. Logarithmieren liefert ln 0.9 = −λt −0.105 = −0.000121 · t , woraus t ≈ 870 Jahre folgt. Damit ist das Alter der Speisereste bestimmt.
Die Methode basiert auf der Annahme, dass das Verh¨ altnis zwischen dem “normalen” Kohlenstoff 12 C und dem radioaktiven Isotop 14 C in der Atmosph¨ are zeitlich konstant bleibt (14 C zerf¨ allt einerseits laufend, wird aber durch die kosmische Strahlung neu erzeugt). Lebewesen (Tiere und Pflanzen) nehmen also 12 C und 14 C in einem konstanten Verh¨ altnis auf. Mit dem Tod endet diese Aufnahme, und das Verh¨ altnis a ¨ndert sich, da 14 C zerf¨ allt.
(18.6) Die hyperbolischen Funktionen Verwandt mit der Exponentialfunktion sind die sogenannten hyperbolischen Funktionen (gelesen “Sinus hyperbolicus” usw.). Sie sind definiert durch 1 x (e − e−x ) 2 1 cosh x = (ex + e−x ) 2 ex − e−x sinh x = x tanh x = cosh x e + e−x cosh x ex + e−x coth x = = x sinh x e − e−x sinh x =
(x = 0) .
18. Einige wichtige Funktionen und ihre Anwendungen
272
Wir werden diese Funktionen kaum gebrauchen, erw¨ ahnen sie aber der Vollst¨ andigkeit halber (und weil sie auf manchen Taschenrechnern vorkommen). Ihre Graphen haben folgendes Aussehen:
y y
y = sinh x
1
y = cosh x x
x
y y = coth x
y 1
1
y = tanh x
x
x
−1
−1
Diese Funktionen erf¨ ullen allerlei Beziehungen, die an trigonometrische Funktionen erinnern und die Bezeichnungen rechtfertigen. Die hyperbolischen Funktionen sind aber im Gegensatz zu den trigonometrischen nicht periodisch. Wir erw¨ ahnen folgende Formeln: cosh2 x − sinh2 x = 1
f¨ ur alle
x,
sinh(x + y) = sinh x cosh y + cosh x sinh y
f¨ ur alle
x, y ,
cosh(x + y) = cosh x cosh y + sinh x sinh y
f¨ ur alle
x, y .
Diese werden durch Nachrechnen leicht best¨ atigt. Setzt man x = cosh t, y = sinh t, so folgt aus der erstgenannten Formel nach einer Umbezeichnung: x2 − y 2 = 1 ,
d.h., die Punkte (x, y) liegen auf einer Hyperbel. (F¨ ur die trigonometrischen Funktionen x = cos t und y = sin t ist entsprechend x2 + y 2 = 1, d.h., die Punkte (x, y) liegen auf einem Kreis!) Dies m¨ oge zur Begr¨ undung der Bezeichnungen dienen. Der Graph von cosh x heisst manchmal auch Kettenlinie, denn man kann zeigen, dass eine beidseitig aufgeh¨ angte Kette unter ihrem Eigengewicht im wesentlichen (d.h. bis auf Konstanten) die Form dieses Graphen annimmt.
18.7 Die Areafunktionen
273
(18.7) Die Areafunktionen Schliesslich seien noch die sogenannten Areafunktionen kurz erw¨ ahnt. Es handelt sich dabei um die zu den hyperbolischen Funktionen inversen Funktionen, vgl. dazu (17.3). Wie man den Graphen entnimmt, sind die Funktionen sinh, tanh und coth injektiv, cosh ist a priori nicht injektiv, wird aber durch Einschr¨ ankung des Definitionsbereichs injektiv gemacht: Man w¨ ahlt [0, ∞] als neuen Definitionsbereich. Nun lassen sich die Umkehrfunktionen bilden. Im einzelnen lauten die Definitionen (arsinh z.B. wird gelesen “area sinus hyperbolicus”): y y y y
= sinh x = cosh x = tanh x = coth x
(x ∈ R) (x ≥ 0) (x ∈ R) (x = 0)
⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒
x = arsinh y x = arcosh y x = artanh y x = arcoth y
(y ∈ R) , (y ≥ 1) , (|y| < 1) , (|y| > 1) .
Die Graphen erh¨ alt man wie u ¨blich durch Spiegeln. Es sei noch erw¨ ahnt, dass man die Areafunktionen auf den Logarithmus zur¨ uckf¨ uhren kann. Es gilt n¨ amlich: arsinh y = ln(y + artanh y =
1 2
ln
1+y 1−y
y 2 + 1) ,
arcosh y = ln(y +
(|y| < 1) ,
arcoth y =
1 2
y 2 − 1) (y > 1) ,
y +1 ln y− (|y| > 1) . 1
Wir beweisen die Formel f¨ ur arsinh (die andern F¨ alle gehen analog): Wir m¨ ussen die Gleichung y = sinh x = alt man (und e−x = 1/z) erh¨
y=
1 1 z− , 2 z
1 x (e 2
− e−x ) nach x aufl¨ osen. Mit der Abk¨ urzung ex = z
2yz = z 2 − 1,
z 2 − 2yz − 1 = 0 .
L¨ ost man diese quadratische Gleichung bei gegebenem y nach z auf, so findet man ex = z = y ±
y2 + 1 .
Da aber z = ex stets positiv ist, kommt in diesem Augenblick nur das Pluszeichen in Frage. Durch Logarithmieren erh¨ alt man schliesslich den gesuchten Ausdruck f¨ ur x:
x = ln(y +
y y 2 + 1) .
(x, y) F¨ ur ganz Neugierige: Woher kommt der Wortteil “area”? Setzt man x = cosh t, y = sinh t (t ∈ R), so liegen, wie schon erw¨ ahnt, die Punkte (x, y) auf der Hyperbel x2 −y 2 = 1 und zwar f¨ ur t > 0 auf dem gezeichneten rechten Ast. Man kann dann ausrechnen, dass t = arcosh x = arsinh y gleich dem Fl¨ acheninhalt (“area”) der schraffierten Figur ist.
x
18. Einige wichtige Funktionen und ihre Anwendungen
274
(18.8) Die Ableitung der hyperbolischen und der Areafunktionen Die Ableitung der hyperbolischen Funktionen ergibt sich unmittelbar aus der Definition und den Ableitungsregeln. So ist z.B. d sinh x 1 d 1 x = (e − e−x ) = (ex + e−x ) = cosh x . dx dx 2 2 F¨ ur die Areafunktionen kann man entweder die Regel f¨ ur die Ableitung der Umkehrfunktionen (17.4) oder aber die Beziehungen von (18.7) verwenden. Wir verzichten auf weitere Details. Die Ableitungen dieser acht Funktionen sind in (5.3) bereits tabelliert worden.
(18.9) Weitere Funktionen im Zusammenhang mit der Exponentialfunktion Neben den hyperbolischen Funktionen verwendet man gelegentlich noch weitere Funktionen, die mit Hilfe der Exponentialfunktion gebildet werden. Im folgenden seien einige aufgef¨ uhrt. (Beachten Sie die Schreibweise exp(x) f¨ ur ex .) a) Die logistische Funktion f (x) =
a 1 + Ce−bx
f¨ ur geeignete Konstanten a, b, C (siehe (16.12)). b) Die Dichtefunktion der Normalverteilung Diese f¨ ur die Wahrscheinlichkeitsrechnung wichtige Funktion ist gegeben durch ϕ(x) = √
1 1 x − μ 2 . exp − 2 σ 2πσ
Dabei ist μ eine beliebige, σ eine positive reelle Zahl. Eine Kurvendiskussion ergibt, dass der Graph von ϕ die folgende “Glockenform” hat:
x μ−σ
μ
μ+σ
Der Graph ist symmetrisch zur Geraden x = μ, und seine Wendepunkte liegen an den Stellen x = μ ± σ.
18.10 Logarithmische Skalen
275
aherung an Grenzwerte c) Exponentielle Ann¨ Ein Blick auf den Graphen der Funktion y = e−x (18.4) zeigt, dass diese Funktion an der Stelle x = 0 den Wert 1 annimmt und sich dann mit wachsendem x rasch der x–Achse n¨ahert. In manchen F¨allen ist eine Funktion gesucht, die zur Zeit t = 0 (wir fassen hier die unabh¨ angige Variable lieber als Zeit auf und schreiben t statt x) einen Anfangswert y0 annimmt und im Verlauf der Zeit einem “Grenzwert” y∞ zustrebt. Ein einfaches Beispiel einer solchen Funktion ist gegeben durch y = y∞ + (y0 − y∞ ) · e−ct ,
c>0.
In der Tat: F¨ ur t = 0 ist e−ct = 1, und es folgt y(0) = y0 . Je gr¨osser aber t wird, desto kleiner wird e−ct und damit auch das Produkt (y0 − y∞ ) · e−ct . Der Funktionswert y kommt dabei immer n¨aher an y∞ heran. Die Gr¨ osse c beschreibt im wesentlichen die Geschwindigkeit der Ann¨ aherung: Je gr¨ osser c ist, desto rascher n¨ ahert sich die Funktion dem Wert y∞ . Der Graph hat (f¨ ur y0 < y∞ ) folgende Gestalt: y y∞
y0 x Diese Funktion haben wir u ¨brigens (mit anderen Bezeichnungen) in (16.8) als L¨ osung einer linearen Differentialgleichung mit konstanten Koeffizienten angetroffen. (18.10) Logarithmische Skalen Eine weitere Anwendung von Exponentialfunktion und Logarithmus ist die logarithmische Skala, die zur Darstellung von gewissen Sachverhalten oft sehr zweckm¨assig ist. Wir besprechen zuerst den eindimensionalen Fall und anschliessend die sogenannten logarithmischen Papiere. Viele Gr¨ ossen in den Naturwissenschaften und der Technik sind positiv, das heisst > 0 (L¨angen, Gewichte, Frequenzen, Temperatur in Grad Kelvin) und haben einen absoluten Nullpunkt. Damit kann man sicher, was den Definitionsbereich betrifft, den Logarithmus bilden. Bei vielen Gr¨ossen ist es manchmal sinnvoll, Verh¨ altnisse zu bilden: Verdoppelung von Frequenzen, L¨ angen und Gewichten beispielsweise - eine Verdoppelung der Temperatur in Grad Celsius gemessen ist hingegen weniger sinnvoll. Die
18. Einige wichtige Funktionen und ihre Anwendungen
276
folgenden Anwendungen betreffen normalerweise Gr¨ ossen, bei denen die Bildung von Verh¨ altnissen sinnvoll ist - es sind sogenannte Verh¨altnisskalen (mehr dazu im zweiten Band bei der beschreibenden Statistik). Aus praktischen Gr¨ unden verwenden wir im folgenden den Zehnerlogarithmus (Logarithmus zur Basis 10) Log x = log10 x. Man erh¨alt die logarithmische Skala, indem man auf einer linearen Skala den Punkt x neu mit X = 10x anschreibt: 0.1
0.5
1
X
5
10
50
100
−1
−0.301
0
x
0.699
1
1.699
2
Die Skala ist also gewissermassen eine graphische Darstellung der Wertetabelle (Funktionstafel von X = 10x ): x X = 10x
−1 0 0.1 1
0.69897 5
1 1.69897 10 50
2 100
urlich x = Log X. Wegen X = 10x ist nat¨ Derartige Skalen sind z.B. dann praktisch, wenn die darzustellende Variable einen grossen Bereich umfasst. Allerdings werden dabei die Intervalle ungleich behandelt. So haben die Intervalle [0.1, 1], [1, 10], [10, 100] etc. in dieser logarithmischen Skala alle dieselbe L¨ange, was aber mitunter ganz erw¨ unscht sein kann, wie z.B. in der untenstehenden Darstellung des elektromagnetischen Spektrums. Ferner kann der Wert X = 0 nicht dargestellt werden, da Log 0 nicht definiert ist. Beispiel Das elektromagnetische Spektrum, dargestellt auf einer logarithmischen Skala (Frequenz in Hertz): Sichtbares Licht LW
MW KW UKW
106
108
Mikrowellen
1010
Infrarot
1012
UV
1014
1016
R¨ontgenstrahlen
1018
Eine weitere Bedeutung haben die logarithmischen Skalen deshalb, weil man mit ihnen Koordinatensysteme bilden kann, in denen die Exponentialfunktionen bzw. die Potenzfunktionen durch Geraden dargestellt werden. (18.11) Das halblogarithmische Koordinatensystem Dieses Koordinatensystem wird erhalten, indem die Abszisse wie u ¨blich mit einer linearen Skala, die Ordinate aber mit einer logarithmischen Skala versehen wird.
277
18.11 Das halblogarithmische Koordinatensystem
Beispiele (mit verschiedenen Massst¨aben): Y y 100
10
1
Y
2
10
P
5 4 3 2
1 x 1
2
1
3
x 1
2
3
Auf der linken Seite ist dabei der Punkt P (1, 100) eingetragen. Beachten Sie, dass der Abstand zur x-Achse effektiv nicht = 100, sondern nur = Log 100 = 2 ist! F¨ ur die praktische Arbeit kann entsprechend liniertes sogenanntes halblogarithmisches Papier (ein Muster ist weiter unten abgebildet) in verschiedenen Massst¨aben im Internet heruntergeladen oder im Fachhandel gekauft werden. Nat¨ urlich sind dann nur noch die Werte Y angeschrieben; die horizontale Achse beschriftet man selbst passend. Das halblogarithmische Koordinatensystem hat die folgende wichtige Eigenschaft: Der Graph der Exponentialfunktion Y = f (x) = cax
mit a > 0 und c > 0
ist in diesem Koordinatensystem eine Gerade. Im Bild weiter unten ist rechts die Funktion Y = 2x dargestellt. Da ihr Graph hier eine Gerade ist, muss man nur zwei Punkte berechnen — hier x = 0, Y = 1 und x = 2, Y = 4 — und kann den Graphen auf einfachste Weise zeichnen. Wir u ¨ berlegen uns noch, warum wirklich eine Gerade herauskommt. Zu jedem x tragen wir n¨ amlich auf der logarithmischen Skala Y = cax ab. Die Vertikaldistanz zum Punkt Y ist aber nicht Y , sondern y = Log Y . Es ist also y = Log Y = Log(cax ) = x · Log a + Log c,
(a > 0, c > 0) .
Setzen wir noch Log a = A, log c = C, so erhalten wir im linearen x-y–System die Gleichung
y = Ax + C ,
welche tats¨ achlich eine Gerade darstellt.
18. Einige wichtige Funktionen und ihre Anwendungen
278
Y 10 9 8 7 6 5
2
101 9 8 7
4
6
3
5 4
2
3
2
1 1
x 0
1
2
3
4
5
Graph von Y = 2x
Halblogarithmisches Papier
Halblogarithmisches Papier kann dann n¨ utzlich sein, wenn man vermutet, eine gewisse Beziehung werde durch eine Exponentialfunktion beschrieben. 102 9 8 7 6
Beispiel Die Konzentration Y (in μg/10 ml) eines bestimmten Enzyms wird in Funktion der Zeit t (in Minuten) gemessen. Man vermutet, dass ungef¨ahr folgende Beziehung gilt: Y = aq
5 4 3
2
t
f¨ ur noch zu bestimmende Konstanten a, q. Die Messwerte sind: t 0 10 30 50 60 70 80 Y 95 54 21 7.5 4 2.4 1.6
101 9 8 7 6 5 4
Wir tragen nun die Daten auf halblogarithmi- 3 schem Papier ab. Die Punkte liegen alle ungef¨ahr 2 auf einer Geraden, so dass man annehmen kann, die angegebene Beziehung sei approximativ rich1 tig. 0 20 40 60 80 Wir bestimmen nun noch a und q. F¨ ur t = 0 ist Y = 95, es folgt a = 95. Der graphischen Darstellung entnimmt man weiter, dass f¨ ur t = 87 der Wert von Y = 1 ist. Aus 1 = 95 · q 87 folgt 1 87 q= ≈ 0.95 . 95
279
18.12 Das doppeltlogarithmische Koordinatensystem
(18.12) Das doppeltlogarithmische Koordinatensystem Hier wird auf beiden Achsen eine logarithmische Skala verwendet, wie man anhand des weiter unten gezeigten Musters von “doppeltlogarithmischem Papier” sehen kann. Das doppeltlogarithmische Koordinatensystem hat die folgende wichtige Eigenschaft: Der Graph der Potenzfunktion Y = aX b
mit
X > 0, a > 0
ist in diesem Koordinatensystem eine Gerade. 102 9 8 7 6 5 4 3
Y 10 9 8 7 6 5 4
2
101 9 8 7 6 5
3
4 3
2 2
1
1 1
2
3
4
5
1
6 7 8 910
Doppeltlogarithmisches Papier
2
3
4
5
2
6 7 8 910
X 1
2
3
4 5
Graph von Y = 2X 2
Beweis f¨ ur diese Eigenschaft: Zu jedem X tragen wir u ¨ber dem mit X angeschriebenen Punkt der Abszisse auf der logarithmischen Skala den Wert Y = aX b ab. Im linearen System ist aber x = Log X, y = Log Y . Wir logarithmieren deshalb die Gleichung und erhalten Log Y = Log(aX b ) = Log a + b Log X oder eingesetzt y = bx + Log a. Ersetzen wir noch Log a durch a , so haben wir in der Tat eine Geradengleichung gefunden: y = bx + a .
Die Anwendungen entsprechen jenen von (18.12), wobei nat¨ urlich an Stelle der Exponentialfunktion jetzt eine Potenzfunktion steht.
18. Einige wichtige Funktionen und ihre Anwendungen
280
Beispiel Im untenstehenden doppeltlogarithmischen Achsenkreuz sind die Schweizerrekorde in den Laufdisziplinen (M¨ anner, Stand 31.07.2019) eingetragen, und zwar findet man auf der horizontalen Achse die Distanz in Metern, auf der vertikalen Achse die Rekordzeit in Sekunden. Da die Punkte ungef¨ahr auf einer Geraden liegen, kann man annehmen, dass die Beziehung approximativ durch eine Potenzfunktion gegeben ist. (Das Beispiel wird in (23.7) fortgesetzt.) Y 10000 8 6
Distanz
Rekordzeit
in m
Rekordzeit in
4
Sekunden
100
10.11
10.11
200 400
20.04 44.99
20.04 44.99
800
1:42.55
102.55
1’000
2:15.63
135.63
1’500
3:31.75
211.75
[Meile] 2’000
3:50.38 4:54.46
230.38 294.46
3’000
7:41.05
461.05
5’000
13:07.54
787.54
8
10’000
27:44.36
1664.36
6
20’000 25’000
59:14.02 1:18:54.8
3554.02 4734.8
4
30’000
1:35:40.8
5740.8
2
2
1000 8 6 4
2
100
X
10 100
2
4
6
8 1000
2
4
6
8 10000
2
3
Beachten Sie, wie n¨ utzlich die logarithmische Einteilung der Skalen ist. Eine lineare Skala, die von 100 m bis 30’000 m reichen w¨ urde, m¨ usste entweder sehr lang sein, oder dann w¨ aren die feineren Unterschiede, etwa im Bereich 100 m bis 400 m, nicht mehr gut trennbar. (18.13) Zusammenfassung Die wichtigen Eigenschaften der logarithmischen Skala sind: • Auf halblogarithmischem Papier wird die Exponentialfunktion Y = cax durch eine Gerade dargestellt. • Auf doppeltlogarithmischem Papier wird die Potenzfunktion Y = aX b durch eine Gerade dargestellt.
18.13 Zusammenfassung
281
Man kann diese Eigenschaft dazu verwenden, bei einem empirisch (durch Messoglicherweise durch werte) gegebenen funktionellen Zusammenhang festzustellen, ob er m¨ eine Exponential- oder eine Potenzfunktion gegeben sei. Man braucht dazu bloss die Messwerte auf halb- und auf doppeltlogarithmisches Papier aufzutragen. Beispiel Es seien folgende Werte gegeben x y
1.5 1.8
2.5 2.6
101 9 8
101 9 8
7
7
6
6
5
5
4
4
3
3
2
2
4.0 4.6
5.0 6.8
6.5 12.0
1
1 0
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8 9 101
Wie man sieht, liegen in der halblogarithmischen Darstellung die Punkte ziemlich genau auf einer Geraden: Der Zusammenhang wird durch eine Exponentialfunktion vermittelt. Wir weisen noch darauf hin, dass es auch Papiere gibt, wo die Abszisse logarithmisch, die Ordinate aber linear geteilt ist. Eine Gerade in diesem Koordinatensystem hat die Gleichung y = ax + b (x bezieht sich wie immer auf die lineare Skala). Wegen x = Log X wird durch diese Gerade die Funktion y = a Log X + b
oder
y = Log(BX a )
(mit b = Log B)
dargestellt. Es sei schliesslich noch bemerkt, dass die Bezeichnungen “doppeltlogarithmisch” und “halblogarithmisch” zwar u ¨ blich, aber nicht ganz konsequent sind. Statt letzterem w¨ are wohl “einfachlogarithmisch” passender.
282
18. Einige wichtige Funktionen und ihre Anwendungen
(18.14) Weitere Beispiele aus dem t¨aglichen Leben
Vier Vorbemerkungen: 1. Im t¨aglichen Leben wird von Laien oft synonym von einem exponentiellen oder logarithmischen Zusammenhang zwischen zwei Gr¨ossen gesprochen. Umgangssprachlich ist das ohne weitere Pr¨azisierung nicht falsch. Die Aufl¨ osung liegt darin, dass die Exponentialfunktion und die Logarithmusfunktion jeweils Umkehrfunktionen voneinander sind. Beim gleichen Zusammenhang sieht man entweder einen exponentiellen oder einen logarithmischen Zusammenhang, je nachdem, ob man von der x-Achse oder von der y-Achse her schaut. 2. Wenn exponentielles Wachstum vorliegt (y(t) = eλt ), dann bedeutet eine Zunahme auf der Zeitachse von t nach t + 1 eine Zunahme der Funktionswerte um den Faktor eλ , n¨amlich von y(t) = eλt zu y(t + 1) = eλ(t+1) = eλt eλ . Bei einem linearen Zusammenhang (einer Geraden y(t) = at + b) bedeutet eine derartige Zunahme eine konstante, additive Zunahme um a von y(t) = at + b zu y(t + 1) = a(t + 1) + b = at + a + b. 3. Exponentielles Wachstum: a) Modell: exponentielles Wachstum erhalten wir als ¨ L¨ osung der Differentialgleichung y = αy. Das heisst, dass das Wachstum, die Anderung, proportional zum aktuellen Bestand ist. b) Wirklichkeit: Das stimmt in den h¨ aufig genannten Bereichen aber nicht exakt (Bev¨ olkerungs- oder Wirtschaftswachstum; Anzahl Zellen bei der Zellteilung). Trotzdem kann man umgangssprachlich immer ¨ von exponentiellem Wachstum sprechen, wenn die Anderung etwa proportional zum aktuellen Stand ist. Leider wird in reisserischen Medienberichten und in der Politik auch sonst der Begriff “exponentiell” benutzt, einfach um “schnell” dramatisch zu unterstreichen. Das ist falsch und ¨argerlich. Der oft einzige Bereich, wo der Einsatz des Wortes “exponentiell” korrekterweise erfolgt, ist bei der Initialphase beim Ausbruch einer gef¨ahrlichen Epidemie. 4. Wir Menschen haben oft eine logarithmische Skala bei der subjektiven Wahrnehmung (zum Beispiel bei Tonh¨ohe und Lautst¨ arke), weil wir in der Natur ein grosses Spektrum abdecken m¨ ussen. Man kann staunen, wie die Natur das hingekriegt hat. Hingegen gibt es eine u ¨bergeordnete Erkl¨ arung, weshalb wir Menschen, wenn jung und gesund, beispielsweise genau Frequenzen von 20 bis 20’000 Hertz (Faktor 1000) wahrnehmen k¨onnen: diese Frequenzen waren ein Konkurrenzvorteil in Urzeiten und h¨ ohere Frequenzen machten bei uns an Land (im Gegensatz zu Walen im Meer) keinen Sinn. Mithilfe der Grunds¨atze von “Survival of the Fittest” kann man den Bereich also indirekt erkl¨ aren. Wie das dann in der Evolutionsgeschichte sich entwickelt hat, bleibt beeindruckend. Fliegen k¨ onnen wir ja nicht, obschon es ein Konkurrenzvorteil w¨ are....
18.14 Weitere Beispiele aus dem t¨ aglichen Leben
283
Beispiel 1: Tonh¨ ohe Wir Menschen erleben in der Musik subjektiv Oktaven als gleichm¨assige Erh¨ohung der Tonh¨ ohe (linear). In der Tat ist aber physikalisch, objektiv messbar, jede Oktave eine Verdoppelung der Frequenz. Man hat also pro Schritt auf der x-Achse (1 Oktave) einen Faktor 2 mehr Frequenz auf der y-Achse. Wenn wir die Schrittweite weiter verfeinern gilt folgendes: es gibt pro Oktave 12 Halbt¨one, deren Schritte wir √ alle gleich erleben. Auf der y-Achse ist es jeweils ein Faktor 12 2, weil die Hintereinanderausf¨ uhrung von 12 Halbt¨onen eine Oktave gibt und die Frequenzen jeweils um √ einen Faktor steigen: ( 12 2)12 = 2. In der nachfolgenden Darstellung findet man die wichtigsten Zusammenh¨ange rund um die Tonh¨ ohen (und Lautst¨ arken):
50 Lautst¨ arke (dB)
H¨orbereich des Menschen, 40
9 - 10 Oktaven
30 20 10 1 Oktave 0
2
4
6
1 Oktave 8
10
12
14
16
18
20
Frequenz (kHz)
32.7 Hz
65.4 Hz
130.8 Hz
261.6 Hz
523.3 Hz
1046.5 Hz
2093 Hz
4186 Hz
Beispiel 2: Lautst¨ arke Die von uns Menschen empfundenen Lautst¨arken von T¨onen basieren physikalisch auf dem (relativen) Schalldruck. Dieser wird in Dezibel (dB) angegeben. Im Hinblick auf die Logarithmen nur soviel: eine Erh¨ ohung um ein Dezibel bedeutet eine
284
18. Einige wichtige Funktionen und ihre Anwendungen
Verzehnfachung des Schalldrucks. Bei der Wahrnehmung der Lautst¨arke, welche in phon angegeben wird und auf einem normierten Schalldruck aufbaut, gilt dasselbe. Die nachfolgenden Alltagswerte in Dezibel zeigen, dass wir die Steigerung in Dezibel (oder ustern 20 dB, normale Phon) linear erleben: H¨orschwelle 0 dB, Uhrticken 10 dB, Fl¨ orsch¨aden bei Unterhaltung 40-60 dB, lauter Strassenl¨arm 70 dB, Schreien 80 dB, Geh¨ aden bei kurzfristiger langfristiger Einwirkung 85 dB, Druckluftbohrer 90 dB, Geh¨orsch¨ Einwirkung 120 dB, Schmerzschwelle 130 dB. Die Werte sind genaugenommen nat¨ urlich angig und auch sonst nur als Gr¨ ur die ossenordnung zu verstehen. F¨ vom Abstand abh¨ Details sei auf Physikb¨ ucher verwiesen. Beispiel 3: Erdbebenst¨ arken Bei der Angabe der St¨ arke von Erdbeben wird in den Nachrichten die Richterskala erw¨ahnt. Dies ist zwar wissenschaftlich nur bei kleinen Werten korrekt (bis etwa 6.5). Der kommunikativen Einfachheit halber wird die Richterskala mit Hilfe von anderen Messungen nach oben erweitert. Dabei gilt bei der Richterskala, dass eine Erh¨ohung eines Wertes um 1 auf der Richterskala eine Erh¨ ohung des Ausschlags des Messger¨ates um 101 bedeutet. Wir haben wieder eine logarithmische Skala. Von unserem Empfinden her ist eine Erh¨ ohung auf der Richterskala von 3 auf 4 oder von 5 auf 6 eine gleich starke Erh¨ohung. Nebenbei: die freigesetzte Energie steigt pro Einheit auf der Richterskala etwa um den Faktor 32. Kernreaktoren der Generation 2 k¨onnen Erdbeben der St¨arke 8 dank Ausgleichsmechanismen aushalten. Erdbeben u ¨ber dem Wert 9.5 sind kaum m¨ oglich, weil nicht genug Druck aufgebaut werden kann - es kommt vorher zu einer leichteren Entladung. Beispiel 4: Abnahme von Luftdruck und Luftdichte mit der H¨ohe In tiefen Schichten der Atmosph¨are (bis 11’000 Meter) nehmen sowohl Luftdruck wie auch Luftdichte etwa exponentiell ab. Es gilt ann¨ aherungsweise, dass etwa alle 5’500 Meter der Luftdruck halbiert wird. Die Luftdichte sinkt etwas weniger schnell, weil die Temperaturabnahme dem entgegenwirkt. Beispiel 5: Der pH-Wert Der pH-Wert ist der negative, dekadische Logarithmus der Konzentration der Wasserstoffionen in Mol pro Liter. Was heisst das? Der pH-Wert sei 7 (neutral). Dann gilt 10−7 = C, wo C die Konzentration von H + in Mol pro Liter ist. Wir formen um, indem wir den Zehnerlogarithmus (dekadisch) nehmen: −7 = log10 (C) und multiplizieren noch mit −1 und erhalten: 7 = − log10 (C). Das ist jetzt aber genau die eingangs angegebene Definition.
285
18.∞ Aufgaben
(18.∞) Aufgaben 18−1 Zeichnen Sie die Graphen der folgenden Funktionen in dasselbe Koordinatensystem ein: 1 a) f1 (x) = x3 , b) f2 (x) = − x3 − 1, c) f3 (x) = (x + 1)3 + 1. 4 18−2 Skizzieren Sie die Graphen von 1 a) y = cos(πx), b) y = cos π(x − ), c) y = 1 + 12 cos π(x − 1). 2 18−3 Die Auslenkung einer an beiden Enden befestigten Saite der L¨ ange L ist an der Stelle x (0 ≤ x ≤ L) gegeben durch A(x) = A0 sin nπ ur n = 1, 2, 3. L x, n = 1, 2, 3 . . .. Zeichnen Sie dies f¨ 18−4 Die Theorie der Biorhythmen lehrt, dass das Gef¨ uhlsleben in wellenf¨ ormigen Hochs und Tiefs mit einer Periode von 28 Tagen verl¨ auft. Wir denken uns eine Gef¨ uhlsskala mit Minimalwert 0 und Maximalwert 100. Ferner war Ihr pers¨ onlicher Wert am 1. Januar, 00.00 Uhr, gerade durchschnittlich (d.h. 50), aber immerhin mit aufsteigender Tendenz. Wie gross ist er am 28. Februar, 12.00 Uhr? Tip: Verwenden Sie eine passend modifizierte Sinusfunktion. 18−5 Uran-239 hat eine Halbwertszeit von 23.5 Minuten. Nach welcher Zeitspanne ist noch a) ein Viertel, b) ein F¨ unftel der urspr¨ unglichen Substanzmenge vorhanden? c) Welcher Prozentsatz ist nach 60 Minuten noch vorhanden? (Tip f¨ ur a): Erst denken, dann rechnen!) 18−6 Das “Gesetz von BOUGUER-LAMBERT” besagt folgendes: Wenn Licht mit der Intensit¨ at I 0 senkrecht auf eine Wasseroberfl¨ ache trifft, dann betr¨ agt die Intensit¨ at in x Metern Tiefe noch I0 exp(−μx). Dabei ist μ eine positive Konstante, der “Absorptionskoeffizient”. Wir nehmen an, es sei μ = 1.4 m−1 . a) Wieviel Prozent der urspr¨ unglichen Intensit¨ at hat das Licht in 2 m Tiefe? b) In welcher Tiefe betr¨ agt die Intensit¨ at noch 10% der urspr¨ unglichen? 18−7 a) Bestimmen Sie die Konstanten a, b, c so, dass die Funktion f (t) = a + be−ct die folgenden Eigenschaften hat: f (0) = 10, f (1) = 20, f (t) → 30 f¨ ur t → ∞. b) Wie gross ist f (2)? c) Geben Sie eine Differentialgleichung 1. Ordnung an, die f (t) als L¨ osung hat. 18−8 Ein Faden, der an zwei Punkten aufgeh¨ angt wird, nimmt unter seinem Eigengewicht die Form ur ein passendes a > 0. einer Kettenlinie an, d.h. des Graphen der Funktion f (x) = a cosh( x a ), f¨ Berechnen Sie die Kurvenl¨ ange dieser Kettenlinie f¨ ur a = 1 im Intervall [−1, 1]. 18−9 Zeichnen Sie in einem doppeltlogarithmischen Koordinatensystem die Graphen von a) Y = √ 5 4 X, b) Y = 10/X ein (1 ≤ X ≤ 10). 18−10 Zeichnen Sie in einem halblogarithmischen Koordinatensystem die Graphen von a) Y = 2·1.5x , b) Y = 10 · 0.8x ein (0 ≤ x ≤ 8). 18−11 Das sogenannte allometrische Wachstum (vgl. Aufgabe 15−6) f¨ uhrt auf eine Potenzfunktion der Form Y = aX b . Gegeben ist die folgende Tabelle: X
0.5
1.5
5
8
10
Y
0.10
0.55
3.35
6.68
9.50
a) Zeichnen Sie diese Werte in ein geeignetes logarithmisches Papier ein. b) Wie gross (ungef¨ ahr) ist Y f¨ ur X = 1? c) F¨ ur welches X (ungef¨ ahr) ist Y = 15?
18. Einige wichtige Funktionen und ihre Anwendungen
286
ahernd exponentiell verl¨ auft, 18−12 Von einem Wachstumsvorgang weiss man, dass er zumindest ann¨ osse der Population zur Zeit t bezeichnet. Messungen d.h., dass Y = abt gilt, wo Y = Y (t) die Gr¨ ergeben folgende Tabelle: t 1 3 4 6 7 Y
4.5
10
15
34
52
a) Bestimmen Sie mit einer graphischen Methode die Gr¨ ossen a und b. b) Man m¨ ochte Y in der Form Y = Ceλt schreiben. Bestimmen Sie C und λ. 18−13 Von einer Funktion f kennt man einige Werte: x f (x)
1.5
3
5
7
9
9
5.6
3.5
2.1
1.3
Zeichnen Sie diese Punkte sowohl in ein halb- als auch in ein doppeltlogarithmisches Koordinatensystem ein, und entscheiden Sie, ob es sich eher um eine Potenz- oder um eine Exponentialfunktion handelt.
287
19. POTENZREIHEN ¨ (19.1) Uberblick In diesem Kapitel geht es um die Darstellung von Funktionen durch unendliche Reihen, genauer durch sogenannte Potenzreihen. So ist beispielsweise x x2 x3 ex = 1 + + + + ... 1! 2! 3! f¨ ur alle x ∈ R. Ein Weg, derartige Reihenentwicklungen zu finden, besteht darin, die sogenannte Taylorreihe (mit Zentrum x0 ) der Funktion f zu bilden. Diese hat die Form ∞ f (k) (x0 ) (x − x0 )k . k!
(19.5)
(19.7)
k=0
F¨ ur geeignete Werte von x (die in jedem Einzelfall zu bestimmen sind) konvergiert diese Reihe gegen f (x). Dies liefert eine theoretische M¨ oglichkeit zur Bestimmung der Funktionswerte f (x). F¨ ur die praktische Berechnung muss man die Reihe irgendwo abbrechen und erh¨alt so das Taylorpolynom n f (k) (x0 ) k=0
k!
(19.9)
(x − x0 )k
als N¨ aherung f¨ ur f (x). Zu Beginn des Kapitels werden die wichtigsten Fakten im Zusammenhang mit Folgen und Reihen repetiert.
(19.2) (19.3)
(19.2) Folgen Die Begriffe “Folge” und “Reihe” (siehe 19.3) werden an sich als bekannt vorausgesetzt (und kamen deshalb schon fr¨ uher dann und wann vor). In diesem Kapitel wird aber sehr viel von Reihen die Rede sein. Deshalb repetieren wir die wichtigsten Grundbegriffe. Wir beginnen mit Folgen. a) Der Begriff der Folge Eine Folge (genauer eine Zahlenfolge) a 0 , a1 , a2 , . . .
19. Potenzreihen
288
ist dadurch gegeben, dass jeder nat¨ urlichen Zahl n eine reelle Zahl an zugeordnet wird. Etwas pr¨ aziser formuliert: Eine Folge ist eine Funktion f : N → R,
n → an .
Man schreibt daf¨ ur auch kurz (an ),
n = 0, 1, 2, . . . .
Selbstverst¨ andlich darf man mit der Numerierung auch bei 1 (oder sonst einer ganzen Zahl) beginnen. Wir nennen einige Beispiele: a) Die arithmetische Folge (an ) gegeben durch an = an + b, (n = 0, 1, 2, . . .); zum Beispiel (mit a = 3, b = 2): 2, 5, 8, 11, . . . . b) Die geometrische Folge (bn ) gegeben durch bn = cq n , (n = 0, 1, 2, . . .); zum Beispiel (mit c = 5, q = 3): 5, 15, 45, 135, 405, . . . . c) Die Folge ( n1 ), n = 1, 2, 3, . . . :
1, 12 , 13 , 14 , . . . .
Es sei noch betont, dass alle hier betrachteten Folgen unendlich sein sollen. Sogenannte “abbrechende Folgen” werden wir nicht behandeln. b) Der Grenzwert einer Folge Wenn die Glieder an einer Folge mit wachsendem n beliebig nahe an eine feste reelle Zahl a herankommen, so sagt man, die Zahl a sei der Grenzwert (oder Limes) der Folge und schreibt a = lim an
oder
n→∞
an → a,
n→∞.
Beispiele 1. Die Folge ( n1 ) (n = 1, 2, . . .) hat den Grenzwert 0, denn wenn nur n gross genug ist.
1 n
n
liegt beliebig nahe bei 0,
n = 1, 2, . . . 2. Die Folge an mit an = 1 + (−1) n 0, 32 , 23 , 54 , . . . strebt entsprechend gegen 1. 1.
an
2.
1
an
1 n
n 1
2
3
4
5
1
2
3
4
5
6
Nach dieser anschaulichen Erl¨ auterung geben wir der Vollst¨ andigkeit halber noch die pr¨ azise Definition des Begriffs Grenzwert an. Es sei (an ) eine Folge. Die Zahl a ∈ R heisst Grenzwert (oder Limes) dieser Folge, wenn die nachstehende Bedingung erf¨ ullt ist:
289
19.2 Folgen
angt), urliche Zahl N (welche von ε abh¨ Zu jeder (noch so kleinen) Zahl ε > 0 gibt es eine nat¨ derart, dass gilt: ur alle n > N . |an − a| < ε f¨ Bemerkungen a) Diese Bedingung l¨ asst sich als (vielleicht nicht u ¨ berm¨ assig attraktives) “Spiel” beschreiben: Ich urfen mir irgendeine kleine (aber pom¨ ochte nachweisen, dass die Folge (an ) konvergiert. Sie d¨ sitive) Zahl ε vorgeben. Meine Aufgabe ist es, einen Index N zu produzieren, derart, dass der Abstand |an − a| von diesem Index an (d.h. f¨ ur alle n > N ) kleiner als Ihre Zahl ε ist. Gelingt mir dies, und zwar f¨ ur jedes von Ihnen vorgeschlagene ε, so hat die Folge den Limes a (und ich habe gewonnen). Finden Sie aber auch nur ein einziges ε, auf das ich nicht reagieren kann, so habe ich verloren (und a ist nicht Grenzwert der Folge). 1 b) Als (ganz einfaches) Beispiel behaupte ich, der Grenzwert der Folge (an ) mit an = n sei Null. 1 1 1 Sie w¨ ahlen ein kleines ε, z.B. ε = 0.001 = 1000 . Dann ist aber |an − a| = | n − 0| = n < ε, sobald n > 1000 ist. Ich w¨ ahle also N = 1000 (oder eine gr¨ ossere Zahl). Wenn Sie es erneut versuchen, etwa mit ε = 10−6 , so kontere ich mit N = 106 usw. Ich gewinne somit diese Spiel: 1 = 0. Es ist limn→∞ n
c) Die Verifikation der obigen Bedingung erfordert, dass der Grenzwert a bekannt ist. Das Verfahren ist also keine Formel zur Bestimmung eines unbekannten Grenzwerts. Vielmehr handelt es sich um eine Art Test, der nachweist, dass eine Zahl, von der man vermutet, sie k¨ onnte den Grenzwert sein, dies auch tats¨ achlich ist. d) Wenn eine Folge einen Grenzwert hat, so kann es keinen zweiten geben, wie man zeigen kann. Der Limes einer Folge ist also eindeutig bestimmt, was die Verwendung des bestimmten Artikels rechtfertigt.
Der Sachverhalt “a = limn→∞ an ” wird auch dadurch ausgedr¨ uckt, dass man sagt: “Die Folge (an ) konvergiert gegen a”. Will man — ohne Bezugnahme auf a — festhalten, dass der Grenzwert der Folge existiert, so sagt man, sie sei konvergent. Eine nicht konvergente Folge heisst divergent. So ist z.B. die Folge (bn ) = ((−1)n ), n = 0, 1, 2, . . . divergent. H¨ atte sie n¨ amlich einen Limes b, so m¨ ussten von einem bestimmten Index an alle Folgenglieder, das sind aber hier die Zahlen 1 und −1, beliebig nahe bei b liegen, was offensichtlich unm¨ oglich ist. Auch die Folge (cn ) mit cn = n, n = 0, 1, 2, . . . ist divergent, allerdings auf eine etwas andere Art, worauf wir gleich zu sprechen kommen. c) Uneigentliche Konvergenz Die eben betrachtete Folge (cn ) : 0, 1, 2, 3, . . . divergiert “anders” als die Folge (bn ) : 1, −1, 1, −1, 1 . . . .Hier ist man versucht zu sagen, (cn ) habe den Grenzwert ∞, denn die Folgenglieder werden mit wachsendem n immer gr¨ osser. Da ∞ keine Zahl, sondern ein Symbol ist, spricht man aber im Falle von (cn ) nicht von Konvergenz im eigentlichen Sinne, wo der Grenzwert ja eine reelle Zahl sein muss. Auch hier l¨ asst sich aber eine pr¨ azise Definition geben: Eine Folge (cn ) konvergiert uneigentlich gegen ∞ (oder divergiert gegen ∞), wenn gilt: Zu jeder (noch so grossen) Zahl C gibt es eine nat¨ urliche Zahl N mit cn > C
f¨ ur alle
n>N .
19. Potenzreihen
290
In Worten also: Die Folgenglieder werden schliesslich gr¨ osser als jede beliebige Zahl. Man schreibt dann lim cn = ∞
n→∞
oder
cn → ∞
ur f¨
n→∞.
Der Ausdruck lim cn = −∞ ist entsprechend definiert. n→∞
Warnung Das Symbol ∞ beschreibt einen Sachverhalt und ist nicht etwa eine Zahl. Insbesondere darf man nicht einfach die Rechenregeln der reellen Zahlen auf ∞ u ¨bertragen. Es w¨ are z.B. sinnlos, den Bruch ∞ = 1 setzen zu wollen. ∞
(19.3) Reihen Nahe verwandt mit dem Begriff der Folge ist jener der Reihe (alle hier betrachteten Reihen sind unendlich, also nichtabbrechend). Sie kennen die geometrische Reihe. Ein Beispiel dazu ist 1+
1 1 2 1 3 1 4 + + + + ... . 2 2 2 2
Man sagt, die Summe dieser Reihe sei gleich 2. Damit meint man folgendes: Wir berechnen der Reihe nach s0 = 1 s1 = 1 + s2 = 1 + s3 = 1 + s4 = 1 + usw.
=1 1 2 1 2 1 2 1 2
= 1.5 + + +
( 12 )2 ( 12 )2 ( 12 )2
= 1.75 + +
( 12 )3 ( 12 )3
= 1.875 +
( 12 )4
= 1.9375 ,
Die so konstruierte Folge (sn ) strebt gegen 2 (f¨ ur einen Beweis siehe (19.4.a)). Man schreibt dies gew¨ ohnlich so: ∞ k 1 k=0
2
=1+
1 1 2 1 3 + + + ... = 2 . 2 2 2
Man kann das obige Beispiel als Modell f¨ ur die allgemeine Situation nehmen. Es sei a 0 , a1 , a2 , . . . eine Folge reeller Zahlen. Wir konstruieren daraus eine neue Folge s 0 , s1 , s2 , . . .
19.4 Beispiele von Reihen
291
die sogenannte Teilsummen- oder Partialsummenfolge von (ak ) durch die Bildungsvorschrift s 0 = a0 s 1 = a0 + a1 s 2 = a0 + a1 + a2 . .. s n = a0 + a1 + a2 + . . . + an =
n
ak .
k=0
.. . Wenn nun die Folge (sn ) konvergiert und den Grenzwert s ∈ R hat, so sagt man, die ∞ Reihe ak konvergiere (andernfalls divergiert die Reihe), und s heisst dann die Summe k=0
der Reihe: s=
∞
ak .
k=0
Eine Reihe ist also nichts anderes als eine Folge, die unter einem speziellen Blickwinkel betrachtet wird. Beachten Sie, dass das Zeichen
∞
ak
k=0
nicht eine unendliche Summe von reellen Zahlen bezeichnet (die gar nicht zu definieren are), sondern den Limes einer gewissen Folge! Man darf deshalb nicht unbesehen die w¨ f¨ ur endliche Summen bekannten Rechenregeln auf Reihen u ¨bertragen. Die folgenden Formeln haben aber trotzdem G¨ ultigkeit, wie man zeigen kann: ∞
(ak + bk ) =
k=0
∞
ak +
k=0
∞ k=0
bk ,
∞
cak = c
k=0
∞
ak ,
(c ∈ R) ,
k=0
sofern die Reihen auf den rechten Seiten konvergieren. (19.4) Beispiele von Reihen a) Die geometrische Reihe Die geometrische Reihe mit dem Quotienten q hat die folgende Form: ∞ k=0
qk = 1 + q + q2 + q3 + . . . .
19. Potenzreihen
292
Wir berechnen die Partialsummen sn mit einem kleinen Trick. Es ist sn = 1 + q + q 2 + . . . + q n ,
qsn = q + q 2 + . . . + q n + q n+1 ,
alt daraus woraus sn − qsn = 1 − q n+1 folgt. Man erh¨ sn =
1 − q n+1 1−q
(q = 1) .
F¨ ur |q| < 1 ist aber lim q n = 0, und somit ist n→∞
lim sn =
n→∞
1 . 1−q
Also: F¨ ur |q| < 1 konvergiert die geometrische Reihe und es ist ∞
qk = 1 + q + q2 + . . . =
k=0
1 . 1−q
F¨ ur |q| ≥ 1 divergiert die Reihe, wie man zeigen kann. alt man die Summe 2, wie in (19.3) schon gesagt wurde. Setzt man q = 12 , so erh¨ Etwas allgemeiner kann man die geometrische Reihe mit dem Anfangsglied a = 0 und dem Quotienten q betrachten: ∞
aq k = a + aq + aq 2 + aq 3 + . . . .
k=0 a . Sie konvergiert ebenfalls f¨ ur |q| < 1 und hat die Summe 1−q
b) Die harmonische Reihe Darunter versteht man die Reihe
1+
∞ 1 1 1 1 1 1 + + + + + ... = . 2 3 4 5 6 k k=1
Das allgemeine Glied ist an = 1/n. F¨ ur n → ∞ strebt es gegen Null. Berechnet man einige Teilsummen, so k¨ onnte man bald einmal den Eindruck bekommen, die Reihe konvergiere: s1 = 1, s2 = 1.5, . . . , s5 = 2.2833 . . . , . . . s20 = 3.5977 . . . , s21 = 3.6453 . . . , . . . , s100 = 5.1873 . . . , . . . , s1000 = 7.4854 . . . , . . . . Dieser Eindruck ist aber grundfalsch, die harmonische Reihe divergiert n¨ amlich! Um dies einzusehen,
19.5 Potenzreihen
293
betrachten wir die Teilsummen mit 2, 4, 8, 16, 32 . . . Gliedern: 1 3 s2 = 1 + = , 2 2 1 1 1 1 1 1 1 1 s4 = 1 + + ( + ) > 1 + + ( + ) = 1 + + = 2 3 4 2 4 4 2 2 1 1 1 1 1 1 1 s8 = 1 + + ( + ) + ( + + + ) 2 3 4 5 6 7 8 1 1 1 1 1 1 1 1 1 >1+ +( + )+( + + + )=1+ + + 2 4 4 8 8 8 8 2 2 1 1 1 1 1 1 1 s16 = 1 + + ( + ) + ( + . . . + ) + ( + . . . + ) 2 3 4 5 8 9 16 1 1 1 1 1 1 1 > 1 + + ( + ) + ( + ... + ) + ( + ... + ) 2 4 4 8 8 16 16 1 1 1 6 1 =1+ + + + = , 2 2 2 2 2
4 , 2
1 5 = , 2 2
usw. Die Ungleichungen werden dadurch erhalten, dass man in jeder Klammer die Nenner gleich dem letzten (gr¨ ossten) vorkommenden Nenner setzt. Jede der betrachteten Teilsummen ist also um mindestens 12 gr¨ osser als die vorangehende, woraus man erkennt, dass die Teilsummenfolge u ¨ ber alle Grenzen w¨ achst: Die harmonische Reihe divergiert. Im allgemeinen ist es nicht leicht, bei einer gegebenen Reihe zu entscheiden, ob sie konvergent ist oder nicht, und die Bestimmung der Summe kann noch viel schwieriger sein. Wir wollen aber nicht n¨ aher auf diese Dinge eintreten.
(19.5) Potenzreihen In diesem Abschnitt beschreiten wir Neuland. Wir betrachten Reihen, deren Summanden nicht einfach Zahlen, sondern Funktionen sind. Weil es sich im hier zu besprechenden Fall bei diesen Funktionen um Potenzfunktionen (wie z.B. x → a2 (x − x0 )2 , siehe unten) handelt, spricht man von Potenzreihen. (Eine andere Art von Funktionenreihen ist in (18.3) kurz erw¨ahnt worden.) Nun f¨ uhren wir die relevanten Begriffe ein: Unter einer Potenzreihe mit Zentrum x0 versteht man eine Reihe der Form (1)
∞
ak (x − x0 )k = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + a3 (x − x0 )3 + . . . .
k=0
Dabei denkt man sich die ak als fest gegebene reelle Zahlen, w¨ ahrend man x als Variable betrachtet. In den Anwendungen werden wir fast nur Potenzreihen mit Zentrum x0 = 0 antreffen. Eine solche hat die Form (2)
∞
ak xk = a0 + a1 x + a2 x2 + a3 x3 + . . . .
k=0
Die Theorie schreiben wir aber doch stets f¨ ur den allgemeinen Fall auf.
19. Potenzreihen
294
Setzt man in einer Potenzreihe f¨ ur x irgendeine Zahl ein, so erh¨alt man eine gew¨ohnliche Zahlenreihe, wie sie in (19.3) besprochen wurde. Bei jeder Reihe tritt sofort als Reflex die Frage nach der Konvergenz auf. Wir werden weiter unten darauf zur¨ uckangen wird. Zuerst kommen; es ist aber klar, dass die Antwort vom Wert von x abh¨ betrachten wir jedoch zwei Beispiele: Beispiele 1. Setzen wir in (1) x0 = 0 (wir haben dann Fall (2) vor uns) und ak = 1 f¨ ur alle k, dann erhalten wir die geometrische Reihe 1 + x + x2 + x3 + . . . , die genau dann konvergiert, wenn |x| < 1 ist und in diesem Fall die Summe hat; f¨ ur x = − 13 beispielsweise die Summe 34 .
1 1−x
2. Auch 1 + (x − 1) + (x − 1)2 + (x − 1)3 + . . . ist eine geometrische Reihe, diesmal mit dem Quotienten x − 1. Es handelt sich hier um eine Potenzreihe mit Zentrum 1. Sie konvergiert f¨ ur |x − 1| < 1, was gleichbedeutend mit 0 < x < 2 ist. Ihre Summe ist f¨ ur diese Werte von x gleich 1 1 = . 1 − (x − 1) 2−x
Nun kehren wir zur allgemeinen Situation zur¨ uck und betrachten die Potenzreihe (1). Wie schon erw¨ahnt, muss man wie bei jeder Reihe als erstes nach der Konvergenz fragen. Da f¨ ur eine bestimmte Potenzreihe die ak fest sind, h¨angt die Konvergenz bloss von x ab: F¨ ur gewisse x (z.B. sicher f¨ ur x = x0 , denn hier sind alle Summanden ausser eventuell a0 gleich Null) wird die Potenzreihe konvergieren; daneben kann es auch x geben, f¨ ur welche sie divergiert. Der Konvergenzbereich D einer Potenzreihe ist die Menge aller x ∈ R, f¨ ur welche die Reihe konvergiert. Dieses D h¨ angt selbstverst¨ andlich von der betrachteten Potenzreihe, also von den Koeffizienten ak ab*. F¨ ur jedes x aus D ist die Summe der Reihe eine reelle Zahl. Somit wird durch p:D→R,
x → p(x) =
∞
ak (x − x0 )k
k=0
eine Funktion p definiert. Diese Potenzreihenfunktion ordnet jedem x, f¨ ur welches die Summe der Potenzreihe u ¨berhaupt definiert ist, diese Summe als Funktionswert zu. * Man kann zeigen, dass D ein zu x0 symmetrisch gelegenes offenes Intervall ist, zu dem eventuell (abh¨ angig von der Reihe) noch Randpunkte hinzukommen. Vgl. die Beispiele in (19.8).
19.5 Potenzreihen
295
Betrachten wir in diesem Zusammenhang nochmals die beiden obigen Beispiele. Im ur x ∈ D ist Beispiel 1. ist D = {x ∈ R | −1 < x < 1} = (−1, 1) und f¨ ∞
p(x) =
1 = 1 + x + x2 + x3 + . . . = xk . 1−x k=0
Im Beispiel 2. ist D = {x ∈ R | 0 < x < 2} = (0, 2) und f¨ ur x ∈ D gilt ∞
p(x) =
1 = 1 + (x − 1) + (x − 1)2 + (x − 1)3 + . . . = (x − 1)k . 2−x k=0
Wir kommen nun nochmals auf die Potenzreihenfunktionen im allgemeinen zur¨ uck. Die Beziehung ∞ p(x) = ak (x − x0 )k k=0
bedeutet, dass p(x) der Limes der Teilsummen sn von ∞
ak (x − x0 )k = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . . + an (x − x0 )n + . . .
k=0
ist. Dabei ist die n-te Teilsumme sn = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . . + an (x − x0 )n , konkret etwa im Beispiel 2. sn = 1 + (x − 1) + . . . + (x − 1)n , einfach ein Polynom. Somit ist eine Potenzreihenfunktion ein Grenzwert von Polynomfunktionen, die wir nun mit pn (x) statt mit sn bezeichnen wollen. Wegen pn (x) → p(x) kann p(x) mit beliebiger Genauigkeit angen¨ahert werden, indem man das Polynom pn (x) f¨ ur ein gen¨ ugend grosses n berechnet (beachten Sie, dass man pn (x) einfach dadurch erh¨ alt, dass man die Potenzreihe f¨ ur p(x) “abschneidet”). Damit k¨ onnen die Werte von Potenzreihenfunktionen mit beliebiger Genauigkeit bestimmt werden. Nun sehen wir uns noch einige weitere konkrete Beispiele an. Wir gehen von der geometrischen Reihe aus. Wie wir wissen, ist (3)
1 = 1 + x + x2 + x3 + . . . 1−x
f¨ ur
|x| < 1 .
Wir k¨onnen diese Formel auch dahingehend interpretieren, dass wir sagen, wir h¨ atten 1 eine Darstellung der Funktion 1−x als Potenzreihe gefunden. Man sagt auch, man habe diese Funktion in eine Potenzreihe entwickelt.
19. Potenzreihen
296
Es wird unser Ziel sein, einige der wichtigsten Funktionen (wie ex , sin x usw.) in Potenzreihen zu entwickeln. In (19.8) werden wir sehen, dass gilt (4)
ex = 1 +
x x2 x3 + + + ... 1! 2! 3!
f¨ ur alle x ∈ R .
Wie wir weiter oben allgemein diskutiert haben, bedeutet dies, dass wir ex als Limes von Polynomfunktionen mit beliebiger Genauigkeit effektiv berechnen k¨ onnen. (Dasselbe 1 gilt nat¨ urlich auch f¨ ur 1−x , ist aber nicht so bedeutsam, da wir diese Funktionswerte auch direkt ausrechnen k¨ onnen!) Wir k¨ onnen schon jetzt einige weitere Potenzreihen bestimmen. Ersetzen wir in (3) x durch −x (was legitim ist, denn |x| < 1 ⇐⇒ | − x| < 1), so erhalten wir (5)
1 = 1 − x + x2 − x 3 + x 4 − . . . 1+x
f¨ ur
|x| < 1 .
Ebenso d¨ urfen wir in (3) und (5) x durch x2 ersetzen und finden so (6) (7)
1 = 1 + x2 + x4 + x6 + . . . 1 − x2 1 = 1 − x2 + x4 − x6 + . . . 1 + x2
f¨ ur
|x| < 1 ,
f¨ ur
|x| < 1 .
An dieser Stelle weisen wir auf einen wichtigen Punkt hin: Wenn wir eine Funktion f in eine Potenzreihe entwickeln, so braucht der Definitionsbereich von f nicht mit 1 dem Konvergenzbereich D der Potenzreihe u ¨bereinzustimmen. So ist z.B. f (x) = 1−x 1 f¨ ur alle x = 1 definiert, f (x) = 1+x2 sogar f¨ ur alle x ∈ R; trotzdem konvergieren die Potenzreihen (3) und (7) nur f¨ ur |x| < 1. Ohne Beweis erw¨ahnen wir schliesslich, dass die Koeffizienten ak einer Potenzreihenentwicklung von f (mit gegebenem Zentrum x0 ) eindeutig bestimmt sind. Dies hat folgende praktische Bedeutung: Wenn wir auf irgendeine Weise eine Potenzreihenentwicklung einer Funktion gefunden haben, dann ist dies auch die einzig m¨ogliche. (19.6) Rechnen mit Potenzreihen Wie wir gesehen haben, sind Potenzreihenfunktionen Grenzwerte von Polynomfunktionen vom Grad n (n → ∞). Es verwundert deshalb nicht, dass sich manche Eigenschaften von Polynom- auf Potenzreihenfunktionen u ¨bertragen. Dem wollen wir etwas nachgehen. Wir betrachten dazu eine Potenzreihe p(x) =
∞ k=0
mit Konvergenzbereich D.
ak (x − x0 )k
19.6 Rechnen mit Potenzreihen
297
a) Potenzreihen mit gleichem Zentrum x0 d¨ urfen gliedweise addiert und subtrahiert werden: Ist ∞ bk (x − x0 )k q(x) = k=0
eine weitere Potenzreihe, dann gilt p(x) + q(x) =
∞
(ak + bk )(x − x0 )k ,
k=0
ur alle x, f¨ und zwar f¨ ur welche sowohl p(x) als auch q(x) konvergiert. Eine analoge ur die Differenz. Formel gilt f¨ urfen gliedweise mit einer Konstanten multipliziert werden: F¨ ur jede b) Potenzreihen d¨ reelle Zahl c und alle x ∈ D ist cp(x) =
∞
cak (x − x0 )k .
k=0
Die Formeln a) und b) folgen aus den allgemeinen Regeln f¨ ur Reihen (Schluss von (19.3)). Beispiel Durch Addition der Reihen (3) und (5) 1 = 1 + x + x2 + x 3 + x4 + . . . 1−x 1 = 1 − x + x2 − x 3 + x4 − . . . 1+x finden wir
2 1 1 = + = 2 + 2x2 + 2x4 + . . . . 1 − x2 1−x 1+x
Durch (nach Regel b) erlaubte) Multiplikation mit
1 2
erhalten wir die Reihe (6) zur¨ uck.
Wichtig f¨ ur die Infinitesimalrechnung sind die n¨achsten beiden Regeln: c) Eine Potenzreihe darf (in D) gliedweise abgeleitet* werden: Aus p(x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + a3 (x − x0 )3 + . . . folgt p (x) = a1 + 2a2 (x − x0 ) + 3a3 (x − x0 )2 + 4a4 (x − x0 )3 + . . . . * In allf¨alligen Randpunkten des Konvergenzbereichs braucht dies nicht mehr zuzutreffen.
19. Potenzreihen
298
d) Eine Potenzreihe darf (in D) gliedweise integriert werden (die Integrationsgrenzen ussen in D liegen): Aus a, b m¨ p(x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + a3 (x − x0 )3 + . . . folgt
b
b
a0 dx +
p(x) dx = a
b
a
b
a1 (x − x0 ) dx +
a
a2 (x − x0 )2 dx + . . .
a
b 1 b 1 b = a0 x + a1 (x − x0 )2 + a2 (x − x0 )3 + . . . . 2 3 a a a
Diese beiden Regeln sind nicht etwa unmittelbare Konsequenzen der Summenregel f¨ ur die Ableitung bzw. das Integral, sondern m¨ ussten neu bewiesen werden, denn es werden ja nicht endliche Summen, sondern Limites von solchen abgeleitet bzw. integriert. Wir verzichten hier auf die Beweise.
Beispiele 1. Als erste Anwendung differenzieren wir die Beziehung (3) 1 = 1 + x + x2 + x3 + x4 + . . . 1−x auf beiden Seiten und erhalten (mit Regel c)) die neue Potenzreihe 1 = 1 + 2x + 3x2 + 4x3 + . . . (1 − x)2
(8)
f¨ ur |x| < 1 .
2. Als zweites integrieren wir die Reihe (7) von 0 bis t (t ∈ D = (−1, 1)):
t 0
1 dx = 1 + x2
t
t
1 dx −
0
t
2
x dx + 0
t
x dx −
0
4
x6 dx + . . . .
0
Wir finden nach kurzer Rechnung (arctan x ist eine Stammfunktion von 1/(1+x2 )): (9)
arctan t = t −
t5 t7 t3 + − + ... 3 5 7
f¨ ur |t| < 1 .
Man kann zeigen, dass diese Formel auch noch f¨ ur t = 1 gilt, und erh¨ alt wegen arctan 1 = π die 4 u ¨berraschende Beziehung: 1 1 1 1 π = 1 − + − + − ... . 4 3 5 7 9
3. F¨ ur eine etwas andere Anwendung verwenden wir die Potenzreihe (4) f¨ ur ex . In −x2 (12.3.e) wurde festgehalten, dass die Funktion f (x) = e keine elementare Stammfunktion hat. Insbesondere ist x 2 e−t dt 0
19.7 Taylorreihen
299
nicht in geschlossener Form durch elementare Funktionen darstellbar. Unter Verwendung von Potenzreihen l¨asst sich dieses Integral aber dennoch berechnen. Ersetzen wir n¨amlich in der Potenzreihe (4) x durch −t2 , so erhalten wir 2 1 1 1 e−t = 1 − t2 + t4 − t6 + t8 − . . . , 2 6 24
und durch gliedweises Integrieren findet man (f¨ ur alle x ∈ R)
x
(10) 0
2
e−t dt = x −
x3 x5 x7 x9 + − + − ... . 3 2 · 5 6 · 7 24 · 9 2
Diese Potenzreihe stellt also eine Stammfunktion von e−x dar.
(19.7) Taylorreihen In den Beispielen (8) und (9) sind wir, ausgehend von der geometrischen Reihe, durch geschickte Manipulationen auf die Potenzreihenentwicklung von zwei weiteren ¨ Funktionen (1/(1 − x)2 und arctan x) gestossen. In (10) geschah etwas Ahnliches, allerdings lag dieser Rechnung die Beziehung (4) zugrunde, deren G¨ ultigkeit von vornherein sicher keineswegs klar ist. Wir werden aber im folgenden sehen, dass die Formel (4) nicht zuf¨allig, sondern aufgrund eines systematischen Verfahrens zustande kommt. Wir stellen uns also die Aufgabe, eine gegebene Funktion f (x) (z.B. ex oder sin x) in eine Potenzreihe zu entwickeln. Dazu gehen wir so vor, dass wir annehmen, die Funktion f (x) besitze eine Potenzreihenentwicklung mit Zentrum x0 : (∗)
f (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + a3 (x − x0 )3 + . . . + ak (x − x0 )k + . . . .
Dies heisst also, dass die rechts stehende Potenzreihe f¨ ur alle x in einer gewissen Umgebung von x0 konvergiert* und f (x) als Summe hat. Unsere Aufgabe besteht nun zun¨achst darin, die Koeffizienten ak zu bestimmen. Der Anfang ist ganz einfach: Setzt man in (∗) f¨ ur x den Wert x0 ein, so f¨ allt rechts mit Ausnahme von a0 alles weg, und wir finden a0 = f (x0 ) . Die Fortsetzung des Verfahrens wird durch die Idee erm¨ oglicht, die Beziehung (∗) sukzessive abzuleiten, was wegen (19.6.c) erlaubt ist. Dazu m¨ ussen wir die (f¨ ur unsere Zwecke u ¨berhaupt nicht einschneidende) Voraussetzung treffen, f (x) sei in x0 unendlich oft differenzierbar. Und nun geht’s los. * Wie gegen Ende von (19.5) festgestellt wurde, kann der Konvergenzbereich der Potenzreihe ohne weiteres kleiner sein als der nat¨ urliche Definitionsbereich von f .
19. Potenzreihen
300
Wir bilden die 1. Ableitung: f (x) = a1 + 2a2 (x − x0 ) + 3a3 (x − x0 )2 + . . . + kak (x − x0 )k−1 + . . . Setzen wir wieder x = x0 , so erhalten wir f (x0 ) = a1 , also ist a1 = f (x0 ) . Berechnung der zweiten Ableitung liefert f (x) = 2a2 + 3 · 2a3 (x − x0 ) + 4 · 3a4 (x − x0 )2 + . . . + k(k − 1)ak (x − x0 )k−2 + . . . und f¨ ur x = x0 findet man f (x0 ) = 2a2 oder umgeformt a2 =
1 f (x0 ) . 2
Genauso ist f (x) = 3 · 2a3 + 4 · 3 · 2a4 (x − x0 ) + . . . + k(k − 1)(k − 2)ak (x − x0 )k−3 + . . . , und folglich ist a3 =
1 f (x0 ) . 3·2
Im allgemeinen Fall ist f (k) (x0 ) = k(k − 1)(k − 2) . . . 3 · 2 · ak = k!ak und wir haben die gesuchte Formel f¨ ur an gefunden, n¨ amlich
ak =
f (k) (x0 ) , k!
k = 0, 1, 2, . . .
Dabei ist wie u ¨blich k! = k(k − 1)(k − 2) . . . 3 · 2 · 1, (siehe (26.4.a)). Die Formel gilt auch f¨ ur k = 0 wegen der Konventionen 0! = 1 (26.4) und f (0) (x) = f (x) (4.5). Nach diesen Rechnungen schadet es nichts, wenn wir uns nochmals genau u ¨berlegen, was wir eigentlich gemacht haben. Wir haben folgendes gezeigt: Wenn die Funktion f (x) in einer Umgebung von x0 u ¨berhaupt als Potenzreihe darstellbar ist, dann m¨ ussen die Koeffizienten durch die obige Formel gegeben sein; die Reihe hat also die Form ∞ f (k) (x0 ) k=0
k!
(x − x0 )k = f (x0 ) +
f (x0 ) f (x0 ) (x − x0 ) + (x − x0 )2 + . . . . 1! 2!
19.7 Taylorreihen
301
ur x0 = 0 Diese Potenzreihe heisst die Taylorreihe der Funktion f mit Zentrum x0 . F¨ spricht man manchmal auch von der Maclaurinreihe. Die Frage nach dem Konvergenzbereich D bleibt vorerst offen und ist separat abaren. Aufgrund der Herleitung der Formel hoffen wir nat¨ zukl¨ urlich, dass diese Reihe f¨ ur alle x ∈ D gegen f (x) konvergiert. Die schlechte Nachricht ist die, dass dies nicht unbedingt der Fall sein muss. Ein Beispiel daf¨ ur ist die Funktion 1 exp(− x2 ) x= 0 f : R → R, f (x) = , 0 x=0 f¨ ur die — wie ohne Beweis angegeben sei — f (k) (0) = 0 ist, f¨ ur alle k (insbesondere ist f im Nullpunkt unendlich oft differenzierbar). Somit sind alle ak = 0 und die Taylorreihe mit Zentrum 0 nimmt f¨ ur alle x den Wert 0 an. Sie kann also nicht die Funktion f (x) darstellen.
Allerdings — und dies ist die gute Nachricht — treten solche “Pathologien” bei den u ¨blichen elementaren Funktionen nicht auf. In diesen F¨allen hat die Taylorreihe von f (x) — wenigstens dort, wo sie konvergiert — tats¨ achlich die gegebene Funktion f (x) als Summe. Immerhin kann auch in diesem g¨ unstigen Fall der Konvergenzbereich der Taylorreihe kleiner als der Definitionsbereich von f (x) sein, eine Situation, die wir schon in (19.5) erw¨ahnt haben. ¨ Aus diesen Uberlegungen ergibt sich, dass man bei einer gegebenen Funktion f (x) zwei Fragen zu pr¨ ufen hat: • Welches ist der Konvergenzbereich D der Taylorreihe? • Konvergiert sie dort wirklich gegen f (x)? Erst wenn die zweite Frage bejaht ist, darf man schreiben f (x) =
∞ f (k) (x0 ) k=0
k!
(x − x0 )k
f¨ ur
x∈D.
Die Beantwortung dieser beiden Fragen erfordert oft subtile Untersuchungen, auf die wir hier nicht eingehen k¨ onnen. Wir werden deshalb im n¨achsten Abschnitt die entsprechenden Tatsachen jeweils ohne Beweis zitieren. Zum Schluss dieses Abschnitts noch ein Wort zum Begriff “Taylorreihe”. Die Taylorreihe einer Funktion ist eine ganz gew¨ohnliche Potenzreihe. Der Name “Taylorreihe” weist nur auf die Methode hin, mit der diese Reihe gefunden wurde. Steht die Reihe einmal da, z.B. 1 = 1 + x + x2 + x 3 + . . . , 1−x so ist nicht mehr auszumachen, ob diese Reihe mit der Formel ak = f (k) (x0 )/k! oder anderswie gewonnen wurde*. * In der Tat ist die Formel f¨ur die geometrische Reihe direkt bewiesen worden (19.4). Dass auch die Berechnung der Taylorreihe mit Zentrum 0 auf dasselbe Resultat f¨ uhrt, ist mit einer einfachen Rechnung nachzuweisen.
19. Potenzreihen
302
Beachten Sie in diesem Zusammenhang die Eindeutigkeit einer Potenzreihenentwicklung, die am Schluss von (19.5) erw¨ahnt wurde, und aus der folgt, dass die Art der Bestimmung der Potenzreihe f¨ ur das Ergebnis keine Rolle spielt. (19.8) Berechnung von Taylorreihen Wir bestimmen nun f¨ ur einige wichtige Funktionen die Taylorreihen, und zwar immer mit Zentrum 0. Dazu ben¨ otigen wir alle Ableitungen dieser Funktionen an der Stelle x0 = 0. a) Exponentialfunktion f (x) = ex f (x) = ex f (x) = ex f (x) = ex .. .
f (0) = 1 f (0) = 1 f (0) = 1 .. .
f (n) (x)= ex .. .
f (n) (0)= 1 .. .
Damit k¨onnen wir die Taylorreihe gem¨ass (19.7) angeben. Die Theorie zeigt, dass diese f¨ ur alle x ∈ R konvergiert und zwar — wie erhofft — gegen ex (wie oben erw¨ahnt, sei auf die Beweise verzichtet). Damit gilt ex = 1 +
x x2 x3 xn + + + ... + + ... , 1! 2! 3! n!
In Kurzform:
∞ xk
ex =
k=0
k!
,
x∈R.
x∈R.
F¨ ur x = 1 erh¨ alt man speziell die folgende Reihendarstellung von e: e=1+
1 1 1 + + + ... . 1! 2! 3!
Der Reihe f¨ ur ex kann man allerlei Eigenschaften der Exponentialfunktion entnehmen. Wir beschr¨anken uns auf die folgende Beziehung: F¨ ur jeden festen Exponenten n gilt ex =∞. x→∞ xn lim
Anschaulich bedeutet dies, dass die Exponentialfunktion mit x → ∞ schneller w¨ achst als jede feste Potenz xn .
303
19.8 Berechnung von Taylorreihen
ur x > 0 entnehmen wir der Potenzreihendarstellung, dass Dies sieht man so ein: F¨ ex = 1 +
x x2 xn+1 xn+1 + + ... + + ... > 1! 2! (n + 1)! (n + 1)!
uhrt auf ist. Division mit xn f¨
x ex , > xn (n + 1)!
und der rechts stehende Ausdruck strebt mit x → ∞ gegen ∞, somit auch die linke Seite.
b) Sinusfunktion f (x) = sin x f (x) f (x) f (x) f (3) (x) f (4) (x)
= sin x = cos x = − sin x = − cos x = sin x .. .
f (0) f (0) f (0) f (3) (0) f (4) (0)
=0 =1 =0 = −1 =0 .. .
Wegen f (x) = f (4) (x) beginnt die Geschichte bei f (4) (0) von vorn. Nun l¨asst sich die Taylorreihe bilden. Auch hier kann man zeigen, dass sie f¨ ur alle x gegen f (x) konvergiert. Somit gilt: sin x =
x3 x5 x7 x − + − + ... , 1! 3! 5! 7!
x∈R.
(Es ist nicht verwunderlich, dass nur ungerade Potenzen von x auftreten, denn es gilt ja sin(−x) = − sin x.) Mit dem Summenzeichen geschrieben lautet die Formel sin x =
∞ k=0
(−1)k
x2k+1 , (2k + 1)!
x∈R.
(Beachten Sie, wie man das wechselnde Vorzeichen sowie die Tatsache, dass nur ungerade Potenzen vorkommen, in den Griff bekommt.) Wir weisen wieder einmal darauf hin, dass in der Analysis das Argument von trigonometrischen Funktionen immer im Bogenmass zu verstehen ist. Dies gilt sowohl f¨ ur die obige Reihe als auch f¨ ur die im n¨ achsten Beispiel besprochene Cosinus-Reihe. c) Cosinusfunktion f (x) = cos x f (x) f (x) f (x) f (3) (x) f (4) (x)
= cos x = − sin x = − cos x = sin x = cos x .. .
f (0) f (0) f (0) f (3) (0) f (4) (0)
=1 =0 = −1 =0 =1 .. .
19. Potenzreihen
304
cos x = 1 −
x2 x4 x6 + − + ... , 2! 4! 6!
x∈R.
(Wegen cos(−x) = cos x kommen hier nur die geraden Potenzen vor.) Kurz formuliert: ∞ x2k (−1)k , x∈R. cos x = (2k)! k=0
d) Logarithmusfunktion f (x) = ln(1 + x) Da ln x an der Stelle x = 0 nicht definiert ist, betrachten wir nicht ln x, sondern ln(1 + x). f (x) f (x) f (x) f (3) (x) f (4) (x) f (5) (x)
f (n) (x)
= ln(1 + x) 1 = 1+x −1 = (1 + x)2 2 = (1 + x)3 −2 · 3 = (1 + x)4 2·3·4 = (1 + x)5 .. . (−1)n+1 (n − 1)! = (1 + x)n .. .
f (0)
=0
f (0)
= 1 = 0!
f (0) = −1 = −1! f (3) (0) = 2 = 2! f (4) (0) = −2 · 3 = −3! f (5) (0) = 2 · 3 · 4 = 4! .. . f (n) (0) = (−1)n+1 (n − 1)! .. .
Es zeigt sich hier, dass die so hergeleitete Taylorreihe zwar nur f¨ ur x ∈ (−1, 1] konvergiert, dort aber wie gew¨ unscht die Funktion ln(1 + x) als Summe hat. Also gilt ln(1 + x) = x −
x2 x3 x4 x5 + − + − ... , 2 3 4 5
oder ln(1 + x) =
∞ k=1
(−1)k+1
xk , k
x ∈ (−1, 1] .
x ∈ (−1, 1] .
Zur Herleitung der Formel wurde noch ben¨ utzt, dass (k − 1)!/k! = 1/k ist. F¨ ur x = 1 ist speziell ln 2 = 1 −
1 1 1 1 + − + − ... . 2 3 4 5
305
19.8 Berechnung von Taylorreihen
e) Die allgemeine binomische Formel (Binomialreihe) Wir betrachten f (x) = (1 + x)s , wo s eine beliebige reelle Zahl ist. (Wir sollten √ ur s = 12 beispielsweise w¨are dann xs = x, und diese nicht etwa xs betrachten, denn f¨ Funktion ist bekanntlich an der Stelle 0 nicht differenzierbar.) Die Ableitungen von (1 + x)s sind ja sehr leicht zu berechnen: f (x) f (x) f (x)
= (1 + x)s = s(1 + x)s−1 = s(s − 1)(1 + x)s−2 .. .
f (0) f (0) f (0)
f (n) (x) = s(s − 1)(s − 2) . . . (s − n + 1)(1 + x)s−n f (n) (0) .. .
=1 =s = s(s − 1) .. . = s(s − 1) . . . (s − n + 1) .. .
Die so erhaltene Taylorreihe konvergiert (wie man zeigen kann) jedenfalls f¨ ur x ∈ (−1, 1) gegen (1 + x)s : s(s − 1) 2 s(s − 1)(s − 2) 3 x + x + ... 2! 3! s(s − 1) . . . (s − n + 1) n ... + x + . . . , x ∈ (−1, 1) . n!
(1 + x)s = 1 + sx +
¨ Die Ahnlichkeit der Koeffizienten der Taylorreihe mit den Binomialkoeffizienten (26.4.b) ist augenf¨ allig. Man pflegt deshalb f¨ ur k ∈ N und s ∈ R zu definieren:
s s s(s − 1)(s − 2) . . . (s − k + 1) = 1, = (k ≥ 1) . 0 k k! Mit dieser Festsetzung lautet die obige Formel einfach (1 + x)s = 1 +
s s 2 s 3 x+ x + x + ... , 1 2 3
bzw. (1 + x)s =
∞
s k=0
s
k
x ∈ (−1, 1) ,
xk .
ur s = − 12 . Beachten Sie dabei, dass im Zur Illustration berechnen wir einige k f¨ s Z¨ ahler von k genau k Faktoren stehen. 1
1
1
(− 12 )(− 32 ) −2 1 −2 3 −2 = 1, =− , = = 0 1 2 2 2 8 1
1
1 3 5 1 3 5 (− 2 )(− 2 )(− 2 ) (− 2 )(− 2 )(− 2 )(− 72 ) −2 5 −2 35 = =− , = = . 3 6 16 4 24 128
19. Potenzreihen
306 urliche Zahl ist, so ist ks nie = 0. Ist aber s ∈ N, so ist Wenn s keine nat¨ wie man anhand der Definition einsieht. In diesem Fall bricht die Taylorreihe amlich zur u ¨blichen binomischen Formel f¨ Polynom vom Grad s, n¨ ur (1 + x)s . nat¨ urlich f¨ ur alle x ∈ R.)
s
ur alle k > s, k = 0 f¨ ab und wird zu einem (Dann konvergiert sie
Spezielle Werte von s ergeben die Taylorreihen f¨ ur 1 1+x √ f (x) = 1 + x 1 f (x) = √ 1+x f (x) =
(s = −1) ,
vgl. hierzu (5) von (19.5) ,
(s = 12 ) , (s = − 12 ) .
ur Setzt man also z.B. s = − 12 in die obige Formeln ein, so erh¨alt man die Taylorreihe f¨ √ f (x) = 1/ 1 + x: √
5 35 4 3 1 1 x − ... , = 1 − x + x2 − x3 + 2 8 16 128 1+x
x ∈ (−1, 1) .
Die anderen F¨alle liefern a¨hnliche Reihen. f) Weitere Beispiele Die Berechnung der h¨ oheren Ableitungen einer Funktion f geht nicht immer so einfach wie in den F¨ allen a) bis e). Man wird deshalb manchmal auch auf andere Weise versuchen, eine Potenzreihenentwicklung zu finden. Beispiele hierzu sind die Formeln (3) sowie (5) bis (10) von (19.5) und (19.6). Weitere Beispiele dieser Art sind etwa die Beziehungen x2 x3 x4 ln(1 − x) = − x + + + + ... , 2 3 4 sin(x2 ) = x2 −
x6 x10 x14 + − + ... , 3! 5! 7!
x ∈ [−1, 1) , x ∈ R,
die man erh¨ alt, wenn man in der Reihe f¨ ur ln(1 + x) bzw. f¨ ur sin x die Gr¨ osse x durch −x bzw. durch x2 ersetzt. Wir geben nun noch eine weitere, etwas interessantere, Illustration dieser Methode. Beispiel Die Potenzreihenentwicklung von arcsin x.Da eine Berechnung der k-ten Ableitung f¨ ur grosse k √ sehr m¨ uhsam w¨ are, gehen wir anders vor. In der obenstehenden Potenzreihenentwicklung von 1/ 1 + x 2 ersetzen wir x durch −t und erhalten √
1 1 − t2
=1+
1 2 3 5 6 35 8 t + t4 + t + t + ... , 2 8 16 128
t ∈ (−1, 1) .
√ Nun beachten wir, dass arcsin t eine Stammfunktion von 1/ 1 − t2 ist. Durch gliedweise Integration (Regel d) von (19.6)) finden wir x arcsin x = 0
=x+
√
x
1 1−
t2
dt =
1 dt + 0
1 2
x 0
t2 dt +
3 8
3 5 5 7 35 9 1 3 x + x + x + x + ... , 6 40 112 1152
x 0
t4 dt +
35 128
x ∈ (−1, 1) .
x 0
t8 dt + . . .
307
19.9 Taylorpolynome
Nimmt man sich die M¨ ossen zu rechnen, so findet man die Formel uhe, mit allgemeinen Gr¨
arcsin x =
∞ k=0
(2k)! x2k+1 . 22k (k!)2 (2k + 1)
Die obigen Formeln gelten u ¨brigens auch noch f¨ ur x = ±1.
Die eben besprochene Darstellung von Funktionen durch Potenzreihen hat zwei Bedeutungen. Man kann einerseits diese Reihen zur konkreten Berechnung von Funktionswerten verwenden. Dabei muss man notgedrungen nach einer gewissen Anzahl von Gliedern abbrechen. Man kommt so auf ein Polynom, das sogenannte Taylorpolynom (19.9), mit dessen Hilfe man die gesuchten Funktionswerte n¨aherungsweise berechnen kann. In (19.10) wird etwas u ¨ber den Fehler gesagt, den man dabei macht. Der zweite Punkt ist eher theoretischer Natur. Die trigonometrischen Funktionen werden ja meist unter Bezugnahme auf die Geometrie eingef¨ uhrt. Will man aber einen rein rechnerischen Aufbau der Analysis betreiben, so ist dieser Weg nicht zul¨ assig. Deshalb verwendet man in der Theorie die obigen Potenzreihen direkt als Definition der Sinus- und der Cosinusfunktion. Auch die Exponentialfunktion wird meist durch ihre Potenzreihe definiert. (19.9) Taylorpolynome Wie wir eben gesehen haben, lassen sich die meisten f¨ ur uns wichtigen Funktionen als Summe ihrer (unendlichen) Taylorreihe darstellen. Bricht man nun diese Reihe nach dem n-ten Glied ab, so erh¨ alt man auf diese Weise ein Polynom, n¨ amlich
pn (x) =
n f (k) (x0 ) k=0
k!
= f (x0 ) +
(x − x0 )k
f (x0 ) f (x0 ) f (n) (x0 ) (x − x0 ) + (x − x0 )2 + . . . + (x − x0 )n . 1! 2! n!
Dieses Polynom heisst das Taylorpolynom n-ten Grades (mit Zentrum x0 ) der Funktion f . Beachten Sie erneut, dass x0 eine feste Zahl ist, nur x ist variabel. Welcher Zusammenhang besteht nun zwischen der Funktion f und ihrem n-ten Taylorpolynom pn (x)? Dieses Polynom ist nichts anderes als eine Teilsumme der Taylorreihe. Somit gilt ur n → ∞ , pn (x) → f (x) f¨ f¨ ur alle x, f¨ ur welche die Taylorreihe von f tats¨ achlich gegen f konvergiert (f¨ ur f (x) = ex also f¨ ur alle x ∈ R, f¨ ur f (x) = ln(1 + x) f¨ ur alle x ∈ (−1, 1], vgl. (19.8)). Dies bedeutet,
19. Potenzreihen
308
dass f (x) um so besser durch das (leicht berechenbare!) Polynom pn (x) angen¨ahert wird, je gr¨ osser n ist, vgl. dazu die Zahlenbeispiele weiter unten. onnen die Frage der Ann¨ aherung noch etwas anders sehen. Dazu berechnen wir einige Wir k¨ Ableitungen von
pn (x) = f (x0 ) +
f (x0 ) f (x0 ) f (x0 ) f (n) (x0 ) (x − x0 ) + (x − x0 )2 + (x − x0 )3 + . . . + (x − x0 )n . 1! 2! 3! n!
f (x 0 )
1. Ableitung:
pn (x) =
2. Ableitung:
p n (x) = 2 ·
3. Ableitung:
p n (x) = 3 · 2 ·
1!
+2·
f (x0 ) 2!
f (x0 ) 2!
+3·2·
f (x0 ) 3!
(x − x0 ) + 3 ·
f (x0 ) 3!
f (x0 ) 3!
(x − x0 )2 + . . . + n
(x − x0 ) + . . . + n(n − 1)
+ . . . + n(n − 1)(n − 2)
f (n) (x0 ) (x − x0 )n−1 n!
f (n) (x0 ) (x − x0 )n−2 n!
f (n) (x0 ) (x − x0 )n−3 . n!
¨brig (die Fakult¨ aten Setzen wir nun x = x0 , so fallen alle Terme, die x − x0 enthalten, weg. Es bleibt u im Nenner heben sich gerade weg) pn (x0 ) = f (x0 ),
pn (x0 ) = f (x0 ),
p n (x0 ) = f (x0 ),
p n (x0 ) = f (x0 ) .
Es ist klar, wie die Sache weiterl¨ auft. Wir erhalten folgende Beziehung:
Es ist (k) p(k) (x0 ) n (x0 ) = f
f¨ ur k = 0, 1, . . . , n .
In Worten: An der Stelle x = x0 stimmen der Funktionswert und die Werte der ersten n Ableitungen der Funktionen pn und f u ¨berein. Daraus folgt, dass die Approximation von f durch pn vor allem in der N¨ ahe von x0 gut sein wird, pn (x) ≈ f (x)
in der N¨ahe von x0 ,
und zwar ist die Ann¨ aherung um so besser, je gr¨osser n ist, wie wir oben schon gesehen haben. Geometrisch betrachtet schmiegt sich der Graph von pn (x) jenem von f (x) um so besser an, je gr¨osser n ist, vgl. Beispiel d) unten. Wir bemerken noch, dass zur Bildung des Taylorpolynoms pn (x) nur die Existenz der ersten n Ableitungen von f (x) (und nicht die Existenz der Taylorreihe) n¨ otig ist. Das Taylorpolynom 1. Grades ist gegeben durch p1 (x) = f (x0 ) + f (x0 )(x − x0 ) . Dies ist nichts anderes als die beste Approximation von f (x) durch eine lineare Funktion (in der N¨ahe von x0 ), welche schon in (7.3) behandelt wurde. Ein Vergleich mit der Formel f¨ ur die Taylorreihe zeigt, dass man diese lineare Approximation dadurch erh¨alt, dass man in der Taylorreihe die Terme “von h¨oherer Ordnung in Δx” (Δx = (x − x0 )), d.h. die Quadrate, Kuben, . . . von (x − x0 ) einfach wegl¨ asst.
19.9 Taylorpolynome
309
Beispiele und Bemerkungen Aus den in (19.8) hergeleiteten Formeln f¨ ur die Taylorreihen lassen sich ohne weiteres Formeln f¨ ur Taylorpolynome ablesen: a) f (x) = ex . p1 (x) = 1 + x, p2 (x) = 1 + x + p3 (x) = 1 + x + b) f (x) = √
x2 2 , x2 x3 2 + 6
usw.
1 . 1+x
Wir verwenden die Formel von (19.8.e) mit s = − 12 . p1 (x) = 1 − 12 x, p2 (x) = 1 − 12 x + 38 x2 , 5 3 x usw. p3 (x) = 1 − 12 x + 38 x2 − 16 c) Wie schon erw¨ ahnt, sind diese Taylorpolynome Approximationen von f (x). Die nachstehende Tabelle enth¨ alt einige Zahlwerte zum Vergleich von f und p3 . f (x) ex
p3 (x) x2 2
1+x+
+
x3 6
f (0.2)
p3 (0.2)
1.2214
1.2213
sin x
x−
x3 6
0.1987
0.1987
cos x
1−
x2 2
0.9801
0.9800
x2 2
+
0.1823
0.1827
0.9129
0.9125
ln(1 + x) √
1 1+x
x− 1−
x 2
+
3x2 8
x3 3
−
5x3 16
d) In der folgenden Figur k¨ onnen Sie den Graphen der Funktion y = sin x mit jenen der Taylorpolynome p1 (x) = x, p3 (x) = x − p5 (x) = x −
x3 6 x3 6
, +
x5 120 ,
vergleichen. Sie erkennen, dass in der N¨ ahe von 0 die Ann¨ aherung sehr gut ist. In gr¨ osserer Entfernung vom Nullpunkt ist die Approximation durch p5 (x) die beste, was kraft unserer Herleitung des Taylorpolynoms nicht verwundert.
19. Potenzreihen
310
y
y = p1 (x)
1 y = p5 (x)
-4
-3
2
1
-1
-2
y = sin x x 4 3
y = p3 (x)
-1
e) Schliesslich wollen wir das Taylorpolynom 2. Grades einer etwas komplizierteren Funktion ausrechnen. Es sei 1+x f (x) = . 1 + ex F¨ ur p2 (x) ben¨otigen wir die ersten beiden Ableitungen von f (x). Es ist (1 + ex ) − (1 + x)ex 1 − xex = (1 + ex )2 (1 + ex )2 x 2 x x −(1 + e ) (xe + e ) − 2(1 − xex )(1 + ex )ex −xex − 3ex − e2x + xe2x f (x) = = . x 4 (1 + e ) (1 + ex )3 f (x) =
(i) Wir bestimmen zuerst das Taylorpolynom mit Zentrum x0 = 0. Dazu brauchen wir den Funktionswert (d.h. die 0. Ableitung) und die ersten beiden Ableitungen an der Stelle 0: f (0) =
1 , 2
f (0) =
1 , 4
f (0) = −
1 . 2
Die allgemeine Formel f¨ ur p2 (x) mit Zentrum 0, 1 p2 (x) = f (0) + f (0)x + f (0)x2 , 2 ergibt in unserem Fall 1 1 1 + x − x2 . 2 4 4 Dieses Polynom ist in der N¨ahe von x0 = 0 eine gute Approximation f¨ ur die Funktion f (x). In der Tat ist z.B. p2 (x) =
p2 (0.1) = 0.5225 , f (0.1) = 0.5225228 . . . .
311
19.10 Das Restglied
(ii) Mit dem Zentrum x0 = 1 erhalten wir (auf 4 Stellen gerundet): 2 = 0.5379 , 1+e f (1) = . . . = −0.1243 , f (1) =
f (1) = . . . = −0.2115 . Es folgt p2 (x) = 0.5379 − 0.1243(x − 1) − 0.1058(x − 1)2 = 0.5564 + 0.0873x − 0.1058x2 . (19.10) Das Restglied Ersetzt man zwecks Berechnung eines Funktionswerts die Funktion f durch ihr Taylorpolynom pn , so begeht man einen Fehler, der durch die Differenz Rn (x) = f (x) − pn (x) beschrieben wird. Dieser Ausdruck heisst das Restglied und h¨ angt neben f von x0 , x und n ab. Es stellt sich die Aufgabe, dieses Restglied wenigstens gr¨ ossenordnungsm¨ assig abzusch¨ atzen. Es gibt dazu verschiedene M¨ oglichkeiten, eine davon ist die folgende Tatsache: Es gibt die Zahl z zwischen x0 und x (d.h. x0 < z < x f¨ ur x0 < x, x < z < x0 f¨ ur x < x0 ), f¨ ur welche gilt: f (n+1) (z) Rn (x) = (x − x0 )n+1 . (n + 1)!
Dieser Ausdruck sieht genau so aus wie der allgemeine Term der Taylorreihe, abgesehen davon, dass f (n+1) (z) statt f (n+1) (x0 ) steht. Ein Beweis steht im Anhang (27.4). Der genaue Wert von z ist allerdings nicht bekannt, eine grobe Kenntnis reicht aber manchmal aus, brauchbare Angaben u ¨ber Rn (x) zu machen. Beispiel Wir untersuchen die Sinusfunktion, wobei wir das Zentrum x0 = 0 w¨ ahlen. Mit f (x) = sin x ist f (n+1) (z) = ± sin z oder ± cos z, also sicher |f (n+1) (z)| ≤ 1. Es gilt somit |Rn (x)| =
|f (n+1) (z)| n+1 1 ≤ |x| |x|n+1 . (n + 1)! (n + 1)!
Wollen wir also z.B. sin 0.5 (Bogenmass!) mit einem Taylorpolynom pn (x) so bestimmen, dass der absolute Fehler dem Betrage nach < 0.0001 wird, so m¨ ussen wir n so gross w¨ ahlen, dass 1 (0.5)n+1 < 0.0001 (n + 1)! wird. Probieren ergibt, dass dies f¨ ur n ≥ 5 der Fall ist. Das Taylorpolynom p5 (x) = x −
x5 x3 + 3! 5!
19. Potenzreihen
312
ur das leistet also das Gew¨ unschte. (Kontrolle: p5 (0.5) = 0.4794270 . . . , sin 0.5 = 0.4794255 . . ..) F¨ alt man p3 (0.5) = 0.47916 . . ., was einen zu grossen absoluten Fehler Taylorpolynom 3. Grades erh¨ ergibt; p3 gen¨ ugt also noch nicht. Derartige Verfahren werden im Prinzip in Taschenrechnern und Computern verwendet, um Funkurlich werden dabei diese Methoden noch optimiert. tionswerte wie sin x zu berechnen. Nat¨
(19.∞) Aufgaben 19−1 Suchen (erraten) Sie den Grenzwert a der Folge (an ), und bestimmen Sie die kleinste Zahl ur alle n > N . N ∈ N, so dass gilt: |an − a| < 0.001 f¨ 1 1 3n 1 a) an = √ , b) an = 1 + 2 , c) an = , d) an = 2 . n n n+2 n +n asst sich manchmal dadurch berechnen, dass man die Folgenglieder 19−2 Der Grenzwert limn→∞ an l¨ geschickt umformt. Tun Sie dies f¨ ur 1 + 2n + 3n2 (Division von Z¨ ahler und Nenner durch eine passende Potenz von n.) 4 + 5n + 6n2 √ √ √ √ n+1+ n b) an = n + 1 − n (Multiplikation mit √ √ ). n+1+ n a) an =
19−3 Berechnen Sie die Summen der folgenden geometrischen Reihen: a) 1 − x3 + x6 − x9 + x12 − . . . , |x| < 1 1 1 1 1 b) 1 + + 2 + 3 + 4 + . . . , |y| > 1 y y y y 8 16 4 + ... c) 2 + + + 3 9 27 19−4 Untersuchen Sie die folgenden Reihen auf Konvergenz, und berechnen Sie gegebenenfalls die Summe: 1 1 1 + + + . . ., b) ln( 12 ) + ln( 23 ) + ln( 34 ) + . . .. a) 1·2 2·3 3·4 Tip f¨ ur a): Schreiben Sie die einzelnen Summanden als Differenz. 19−5 Welche Funktionen werden durch die folgenden Potenzreihen dargestellt? (Vergleich mit bekannten Reihen.) x x2 x3 x4 x4 x8 x12 x16 + − + − . . ., b) 1 − + − + − . . ., 1! 2! 3! 4! 2! 4! 6! 8! 3 5 7 9 x x x x c) − + − + . . .. 3! 5! 7! 9! 19−6 Ermitteln Sie die Summe der folgenden Reihen durch Vergleich mit bekannten Potenzreihen: 4 8 16 1 1 1 1 1 a) 1 + 2 + + + + . . ., b) − + − + − . . ., 2! 3! 4! 2 4·2 8·3 16 · 4 32 · 5 2 2 2 2 c) − + − + . . .. 4! 6! 8! 10! 19−7 Verifizieren Sie die bekannten Ableitungsformeln f¨ ur die Funktionen ex , sin x, cos x durch gliedweises Ableiten der Potenzreihen. a) 1 −
19−8 a) Leiten Sie aus der Taylorreihe f¨ ur ln(1+x) die Taylorreihe f¨ ur f (x) = ln(1+x2 ) (−1 < x < 1) her. 2x (−1 < x < 1). b) Bestimmen Sie jetzt durch Ableiten die Taylorreihe von g(x) = 1 + x2 c) Die Taylorreihe von g(x) kann auch aus der geometrischen Reihe hergeleitet werden. Wie?
19.∞ Aufgaben
313
19−9 a) Leiten Sie aus der Taylorreihe f¨ ur ln(1 + x) jene von ln(1 − x) her. b) Leiten Sie unter Benutzung der Formel ln(a/b) = ln a − ln b die Reihendarstellung von 1+x ln( ) (−1 < x < 1) her. 1−x c) Durch passende Wahl von x kann man eine Reihe f¨ ur ln 3 finden. Geben Sie die ersten vier von Null verschiedenen Glieder an, und vergleichen Sie die Teilsumme mit dem wahren Wert von ln 3. 19−10 a) Bestimmen Sie die Taylorreihe des hyperbolischen Cosinus (cosh x) mit Zentrum 0 durch Berechnung von f (n) (0) f¨ ur alle n. b) Zeigen Sie, dass die Formel cosh x = 12 (ex + e−x ) zusammen mit der Exponentialreihe dasselbe Resultat liefert. 19−11 Die Funktion f (x) = sin(x2 ) hat keine elementare, d.h. durch die bekannten Funktionen aus dr¨ uckbare Stammfunktion. Nach (11.2) ist aber Φ(x) = 0x sin(t2 ) dt eine Stammfunktion von f (x). Geben Sie, ausgehend von der Sinusreihe, die ersten f¨ unf von Null verschiedenen Summanden der Potenzreihe (mit Zentrum 0) von Φ(x) an. 19−12 Berechnen Sie das Taylorpolynom n-ten Grades mit Zentrum x0 . x+1 x+1 a) f (x) = b) f (x) = , x0 = 0, n = 3 , x0 = 1, n = 3 x+2 x+2 x √ e d) f (x) = 1 + sin x, x0 = 0, n = 2 , x0 = 0, n = 3 c) f (x) = 1+x √ e) f (x) = x + 1 ln(x + 1), x0 = 0, n = 3 f) f (x) = esin x , x0 = 0, n = 4. √ 19−13 Schreiben Sie die Binomialreihe von a) f (x) = 1/ 4 1 + x, b) g(x) = 3 (1 + x)4 bis und mit x4 3 an. c) Berechnen Sie (1.05)4 exakt und mit dem in b) erhaltenen Taylorpolynom. 19−14 Berechnen Sie cos 0.5 (Bogenmass!) unter Verwendung eines Taylorpolynoms, so dass der absolute Fehler dem Betrag nach < 10−5 ist.
314
20. UNEIGENTLICHE INTEGRALE ¨ (20.1) Uberblick Uneigentliche Integrale sind Integrale, in deren Grenzen das Symbol ∞ vorkommt, also Integrale der Form
∞
b
f (x) dx,
∞
f (x) dx, −∞
a
(20.2), (20.3)
f (x) dx . −∞
Sie sind in naheliegender Weise als Grenzwerte definiert (und es kann deshalb vorkommen, dass sie nicht existieren). Dieser Begriff wird an einigen Beispielen illustriert. Daneben wird noch ein weiterer Typ von uneigentlichen Integralen kurz vorgestellt.
(20.4)
(20.2) Uneigentliche Integrale zweiter Art Bis jetzt haben wir immer u ¨ber ein endliches Intervall [a, b] integriert (a, b ∈ R). Es ist aber f¨ ur viele Anwendungen zweckm¨assig, den Begriff des Integrals so zu erweitern, dass die Funktion auch u ¨ber ein unendliches Intervall integriert werden darf. Man gelangt so zum Begriff des uneigentlichen Integrals. (Genauer spricht man hier von uneigentlichen Integralen zweiter Art; wir werden in (20.4) die uneigentlichen Integrale erster Art antreffen.) Wir betrachten zuerst den Fall, wo die obere Integrationsgrenze b = ∞ ist. Dazu sei f auf [a, ∞) (a ∈ R) definiert und stetig. Es ist wohl ziemlich klar, was man unter ∞ f (x) dx a
verstehen soll, n¨ amlich den Grenzwert
t
f (x) dx .
lim
t→∞
a
Nat¨ urlich braucht dieser Limes nicht zu existieren. Tut er das aber, so bezeichnen wir ihn mit ∞ f (x) dx a
und nennen ihn ein uneigentliches Integral (zweiter Art). Es gilt also
∞
t
f (x) dx = lim a
t→∞
f (x) dx . a
20.2 Uneigentliche Integrale zweiter Art
315
urlich Ganz analog definiert man nat¨
b
b
f (x) dx = lim
s→−∞
−∞
f (x) dx . s
Beispiele ∞ 1 1. dx . 2 x 1 Bekanntlich ist −
1 1 eine Stammfunktion von 2 . Somit ist x x t 1 t 1 1 dx = − = − + 1 . 2 x 1 t 1 x
Es folgt
t
1 1 dx = lim (1 − ) = 1 , 2 t→∞ x t 1 d.h., das uneigentliche Integral existiert und hat den Wert 1. ∞ 1 √ dx . 2. x 4 Hier ist entsprechend ∞ √ √ 1 1 t lim x− 2 dx = lim 2x 2 = lim (2 t − 2 4) = ∞ , lim
t→∞
√
t→∞
t→∞
4
4
t→∞
achst. Dieses uneigentliche denn t wird beliebig gross, wenn t immer mehr w¨ Integral existiert also nicht. (Beachten Sie, dass “∞” ein Symbol und keine Zahl ist.) −1 1 3. dx . −∞ x Hier ist −1 −1 1 lim dx = lim ln |x| = lim (0 − ln |s|) = −∞ . s→−∞ s s→−∞ s→−∞ x s
Auch dieses uneigentliche Integral existiert nicht.
Wir geben zu den drei Beispielen noch eine anschauliche Interpretation des Sachverhalts: Die schraffierte (ins Unendliche reichende) Fl¨ ache hat y y y 1. 2. -1 x x 1 endlichen Inhalt,
x 4 unendlichen Inhalt,
3. unendlichen Inhalt.
20. Uneigentliche Integrale
316
∞
4.
xe−x dx.
0
Wir integrieren partiell, vgl. Beispiel (13.6.a).
xe−x dx = −xe−x +
e−x dx = −xe−x − e−x ( + C) .
Es folgt
t
lim
t→∞
xe−x dx = lim
t→∞
0
t −xe−x − e−x = lim (−te−t − e−t ) − (0 − 1) = 1 , t→∞
0
denn es ist lim e−t = 0 (dies ist klar) sowie lim te−t = 0. t→∞
t→∞
Am Ende von (19.8.a) wurde gezeigt, dass ex /xn → ∞ strebt (mit x → ∞) f¨ ur alle n ∈ N. Somit strebt xn /ex → 0 f¨ ur x → ∞, und die Beziehung limt→∞ te−t = 0 folgt, wenn wir n = 1 setzen.
5. Es geht darum, einen K¨orper der Masse m = 1 kg aus dem Gravitationsfeld der Erde zu schiessen. Welche Arbeit wird dabei geleistet? Es sei r (in m) der Abstand des Schwerpunktes des K¨orpers vom Erdmittelpunkt. Zwischen der Erde und dem K¨orper wirkt dann die Gravitationskraft F (r) = G
M ·m M =G 2 , r2 r
wo G die Gravitationskonstante (G = 6.67 · 10−11 Nm2 kg−2 ) und M = 5.976 · 1024 kg die Erdmasse ist. Zu Beginn sei der K¨ orper auf der Erdoberfl¨ ache (Erdradius r0 = 6.37 · 106 m). Nach (9.3) ist dann die geleistete Arbeit gleich
∞
∞
F (r) dr = GM r0
r0
1 dr = GM · lim R→∞ r2
R r0
GM 1 dr = . . . = = 6.26 · 107 Nm . r2 r0
(20.3) Uneigentliche Integrale zweiter Art, Fortsetzung In diesem Abschnitt geht es um Integrale der Form
∞
f (x) dx , −∞
deren Definition zun¨achst zu motivieren ist. Stellt man sich den Wert dieses Integrals anschaulich als Fl¨ acheninhalt vor (f¨ ur diese motivierende Betrachtung denken wir uns einfachheitshalber, es sei f (x) ≥ 0 f¨ ur
317
20.3 Uneigentliche Integrale zweiter Art, Fortsetzung
alle x), so soll damit der Inhalt einer beidseitig bis ins Unendliche reichenden Fl¨ ache beschrieben werden. y
f
x Diese Vorstellung f¨ uhrt auf eine einleuchtende Forderung: Wenn die obige Fl¨ ache einen “endlichen Inhalt” hat, dann soll dies auch f¨ ur die beiden “kleineren” Teile gelten, die von −∞ bis a bzw. von a bis ∞ reichen (wo a irgendeine Zahl ist), d.h., die uneigentlichen Integrale a ∞ f (x) dx und f (x) dx −∞
a
sollen beide im Sinne von (20.2) existieren.
∞ Diese Forderung zeigt u ¨brigens, dass die vielleicht naheliegende Definition − f (x) dx = ∞ r ∞ urde z.B. −∞ x dx = 0, w¨ ahrend 0∞ x dx gar limr→∞ −r f (x) dx nicht brauchbar ist, denn damit w¨ nicht existiert! (Im Gegensatz zu unserer motivierenden Annahme nimmt f (x) hier auch negative Werte an, was an der Sache nichts a ¨ndert.)
Wenn aber die beiden obigen uneigentlichen Integrale existieren, dann wird man vern¨ unftigerweise a ∞ ∞ f (x) dx = f (x) dx + f (x) dx (∗) −∞
−∞
a
setzen (siehe Skizze). a f (x) dx
∞
f (x) dx
f a
−∞
x a Man wird deshalb darauf gef¨ uhrt, die Formel (∗) (zusammen mit der Existenz der ∞ beiden Integrale rechterhand) als Definition von −∞ f (x) dx zu nehmen. Nun scheint (∗) noch von der Wahl der Zahl a abh¨ angig zu sein. Dies trifft aber in Tat und Wahrheit nicht zu, denn es gilt folgendes: Wenn es u ¨berhaupt eine Zahl c gibt, so dass die beiden uneigentlichen Integrale c ∞ f (x) dx und f (x) dx −∞
c
20. Uneigentliche Integrale
318
existieren, dann existieren f¨ ur jede reelle Zahl a die beiden Integrale
a
f (x) dx
∞
f (x) dx .
und
−∞
a
Zudem gilt dann
a −∞
∞
f (x) dx +
(∗∗)
c −∞
a
∞
f (x) dx +
f (x) dx =
f (x) dx , c
angt nicht von der Wahl der “Trennstelle” a ab. d.h., die Summe der beiden Teile h¨ Diese Tatsache leuchtet geometrisch ein:
a
c
a −∞
∞
c −∞
a
∞ c
Man kann sie auch rechnerisch herleiten: (Wir lassen einfachheitshalber den Term f (x) dx weg und nehmen an, es sei a > c. Der Fall a < c geht analog.) a a a c a c c a = lim = lim = lim + + = + . s→−∞ s s→−∞ s s→−∞ s −∞ c −∞ c c c a ur a∞ . Hier Somit existiert −∞ genau dann, wenn −∞ existiert. Entsprechendes zeigt man f¨ ∞ ∞ a ist a = c − c . Nun sieht man sofort, dass die Beziehung (∗∗) gilt.
¨ Motiviert von den eben gemachten Uberlegungen, treffen wir nun die folgende Definition: ∞ Das uneigentliche Integral f (x) dx existiert, wenn es eine Zahl c gibt, so dass −∞
sowohl
c
f (x) dx
(1) −∞
als auch
∞
f (x) dx
(2) c
existiert. Falls dies zutrifft, so setzt man
∞
(3)
f (x) dx = −∞
c
∞
f (x) dx + −∞
f (x) dx . c
319
20.3 Uneigentliche Integrale zweiter Art, Fortsetzung
Wie wir oben gesehen haben, existieren dann die Integrale (1) und (2) f¨ ur jede beliebige Zahl c, und der Wert von (3) ist f¨ ur jede Wahl von c derselbe. Beispiele y
1. Wir betrachten ∞ dx . 1 + x2 −∞
1 x
Dazu m¨ ussen wir eine Zahl c w¨ ahlen und die uneigentlichen Integrale c ∞ dx dx und 2 1 + x2 −∞ 1 + x c untersuchen. Aus Symmetriegr¨ unden dr¨ angt sich die Wahl c = 0 auf. Dann ist
∞ 0
dx = lim t→∞ 1 + x2
t 0
t π dx = lim arctan x = lim arctan t = . t→∞ t→∞ 1 + x2 2 0
Wegen der Symmetrie ist dann auch
0 −∞
π dx = 2 1+x 2
∞
und es folgt −∞
dx =π. 1 + x2
Integrale vom hier behandelten Typ sind in der Wahrscheinlichkeitsrechnung (im Zusammenhang mit den sogenannten stetigen Verteilungen) von besonderer Bedeutung. y 2. Wir betrachten x ∞ −x2 xe dx . −∞
2 Auch hier w¨ahlt man c = 0. Das unbestimmte Integral I = xe−x dx berechnet 2 man mit der Substitution u = −x2 , du = −2xdx und findet I = − 12 e−x ( + C). Also ist ∞ t 1 1 1 2 2 t 2 −x2 xe dx = lim xe−x dx = lim − e−x = lim − (e−t − 1) = , t→∞ t→∞ t→∞ 2 2 2 0 0 0 2
denn e−t → 0 f¨ ur t → ∞. Damit existiert dieses uneigentliche Integral und hat den 0 2 Wert 12 . Entsprechend berechnet man −∞ xe−x dx = − 12 und findet schliesslich einfach ∞ 2
xe−x dx = 0 .
−∞
Im Hinblick auf die Symmetrie erstaunt das Ergebnis kaum. Beachten Sie aber, dass Sie nicht einfach a priori aufgrund dieser Symmetrie sagen k¨ onnen, das Integral existiere und habe den
20. Uneigentliche Integrale
320
achlich notwendig zu zeigen, dass die beiden “halben” uneigentliWert 0. Vielmehr ist es tats¨ 0 2 2 ur sich allein existieren. Das weiter oben xe−x dx und 0∞ xe−x dx beide f¨ chen Integrale − ∞ ∞ besprochene Integral −∞ x dx hat dieselben Symmetrieverh¨ altnisse, existiert aber nicht!
(20.4) Uneigentliche Integrale erster Art Diese Art von uneigentlichen Integralen ist f¨ ur uns von geringer Bedeutung. Wir beschr¨anken uns deshalb auf zwei Beispiele, die auch den Begriff erl¨autern. 1 1 1. dx . 0 x Das Wesentliche ist hier, dass der Integrand x1 an der Stelle x = 0 (der unteren Integrationsgrenze) nicht definiert ist. Dagegen ist er auf jedem abgeschlossenen Intervall [s, 1], 0 < s < 1 definiert. Man ist also versucht, zu definieren:
1 0
1 dx = lim s↓0 x
1 s
1 dx . x
1 ur s → 0 Nun ist aber s x1 dx = ln 1 − ln s = − ln s und − ln s strebt gegen ∞ f¨ (s > 0). Dieses uneigentliche Integral existiert nicht. 1 1 √ dx . 2. x 0 ¨ Es gilt dieselbe Uberlegung wie oben. Hier ist aber
1 s
√ 1 √ 1 √ dx = 2 x = 2 − 2 s . x s
√
ur s → 0 (s > 0), existiert diesmal das uneigentliche Integral, Da s → 0 strebt f¨ und zwar ist 1 1 √ dx = 2 . x 0 Anschauliche Interpretation: Die schraffierte (ins Unendliche reichende) Fl¨ ache hat y y
2.
1.
x
x 1 unendlichen Fl¨ acheninhalt,
1 endlichen Fl¨acheninhalt.
20.∞ Aufgaben
321
(20.∞) Aufgaben 20−1 Existieren die folgenden uneigentlichen Integrale? Wenn ja, geben Sie ihren Wert an. ∞ ∞ ∞ 0 dx dx u √ a) , b) , c) e3t dt, d) du. 4 3 (x + 1) 1 + u2 x−2 0 18 −∞ 1 20−2 Existieren die folgenden uneigentlichen Integrale? Wenn ja, geben Sie ihren Wert an. ∞ ∞ ∞ ∞ 3 dt x3 eu a) , b) dx, c) du, d) x2 e−|x| dx. 2 4 2 u −∞ 2 + 8t −∞ 1 + x −∞ 1 + e −∞ 20−3 Existieren die folgenden uneigentlichen Integrale? Wenn ja, geben Sie ihren Wert an. 7 5 1 4 du dx et x √ √ dt, d) a) , c) , b) dx. 2 t u−3 x−1 3 2 (3x − 6) 0 e −1 1 20−4 F¨ ur welche positiven Werte von r konvergiert das uneigentliche Integral ∞ dx ? xr 1 Wie gross ist dann sein Wert? 20−5 F¨ ur welche positiven Werte von r konvergiert das uneigentliche Integral
1 0
dx ? xr
Wie gross ist dann sein Wert? 1 (x ≥ 0) rotiert um die x–Achse. Ist es sinnvoll zu sagen, 1+x der so entstandene unendlich ausgedehnte K¨ orper habe ein endliches Volumen? Wenn ja, wie gross ist es? Was k¨ onnen Sie u ¨ber den Inhalt des Fl¨ achenst¨ ucks sagen, das entsteht, wenn der K¨ orper mit einer Ebene geschnitten wird, welche die Rotationsachse enth¨ alt?
20−6 Der Graph der Funktion f (x) =
322
21. NUMERISCHE METHODEN ¨ (21.1) Uberblick Die numerische Mathematik (kurz Numerik genannt) befasst sich mit der konkreten zahlenm¨assigen L¨osung von mathematischen Problemen, vor allem auch von solchen, die in der Praxis auftreten. In diesem Kapitel werden drei Anwendungsbereiche von numerischen Methoden vorgestellt: • Numerische L¨osung von Gleichungen, • Numerische Berechnung von Integralen, • Numerische L¨osung von Differentialgleichungen.
(21.2) (21.3) (21.4)
Die hier vorgef¨ uhrten Verfahren sind recht einfach und in ihrer Funktionsweise gut zu verstehen; dies war mit ein Kriterium f¨ ur ihre Auswahl. In der Praxis werden solche Probleme nat¨ urlich auf dem Computer gel¨ ost, die dort verwendeten Methoden sind effizienter, aber auch komplizierter als die hier besprochenen. Das vorliegende Kapitel soll Ihnen aber wenigstens die Existenz solcher Verfahren bewusst machen. (21.2) Numerische L¨osung von Gleichungen Wir betrachten in diesem Abschnitt Gleichungen mit einer Unbekannten. Sie haben schon fr¨ uh gelernt, dass man f¨ ur quadratische Gleichungen eine L¨osungsformel verwenden kann. Auch f¨ ur Gleichungen 3. und 4. Grades gibt es solche Formeln, in denen gewisse Wurzelausdr¨ ucke vorkommen. Diese sind aber so kompliziert, dass sie f¨ ur die Praxis nur schlecht geeignet sind. F¨ ur Gleichungen vom 5. und h¨oheren Grad aber gibt es — wie man beweisen kann — keine derartigen Formeln mehr. Ebensowenig existieren L¨osungsformeln f¨ ur Gleichungen, in denen beispielsweise die Exponentialfunktion oder eine trigonometrische Funktion vorkommt. Um derartige Gleichungen zu l¨osen, bedient man sich in der Praxis sogenannter numerischer Verfahren, mit denen man die L¨osung nicht exakt, sondern nur bis zu einer gew¨ unschten Genauigkeit bestimmt. Von den vielen existierenden Verfahren sei hier exemplarisch die Methode von Newton (auch “Methode von Newton-Raphson” genannt) vorgestellt. Eine Gleichung mit einer Unbekannten, wie etwa x2 − ln x = 2 oder x3 − x = 1 kann stets auf die allgemeine Form f (x) = 0 gebracht werden. Die Newtonsche Methode beruht nun darauf, dass man einen bereits bekannten N¨aherungswert x0 f¨ ur eine Nullstelle der Funktion f sukzessive verbessert.
osung von Gleichungen 21.2 Numerische L¨
323
Die erste N¨aherung x0 kann etwa einer graphischen Darstellung entnommen werden. Anschliessend berechnet man den Funktionswert y0 = f (x0 ) und ersetzt den Graphen der Funktion f durch die Tangente im Punkt (x0 , y0 ). y (x0 , y0 )
f
x x1
x0
Der Schnittpunkt x1 dieser Tangente mit der x-Achse wird dann (so hofft man) eine verbesserte N¨aherung f¨ ur die gesuchte Nullstelle sein. Falls n¨otig, wiederholt man den Prozess und verbessert x1 zu einer N¨aherung x2 usw.. Formelm¨assig sieht die Sache so aus: Die Tangente an den Graphen von f im Punkt (x0 , y0 ) hat die Steigung f (x0 ). Ihre Gleichung lautet demnach y − y0 = f (x0 ) x − x0 oder (vgl. auch (7.2)) y = f (x0 )(x − x0 ) + y0 . Ihren Schnittpunkt mit der x-Achse erhalten wir aus der Beziehung 0 = f (x0 )(x1 − x0 ) + y0 durch Aufl¨osen nach x1 zu x1 = x0 −
y0 f (x0 ) = x0 − . f (x0 ) f (x0 )
Entsprechend findet man f¨ ur die Fortsetzung des Verfahrens xn+1 = xn −
f (xn ) . f (xn )
Man berechnet also sukzessive die Approximationen x0 , x1 , x2 , . . . f¨ ur die gesuchte Nullstelle und h¨ ort auf, wenn man mit der erzielten Genauigkeit zufrieden ist. Dieses Verfahren f¨ uhrt im allgemeinen recht schnell auf eine L¨osung, deren Genauigkeit f¨ ur die Praxis gen¨ ugt, und kann deshalb auch “von Hand” durchgef¨ uhrt werden.
324
21. Numerische Methoden
Selbstverst¨ andlich geht es mit einem programmierbaren Taschenrechner oder mit einem Computer noch schneller. Gewisse Taschenrechner und viele Computerprogramme ugen aber u ¨ber Routinen, die solche Gleichungen ohne weitere Programmierarbeit verf¨ direkt und effizient l¨osen. Beispiel Zu l¨ osen sei die Gleichung x2 − ln x = 2 . Wir bringen sie auf die Form f (x) = x2 − ln x − 2 = 0
(x > 0)
und berechnen gleich noch die Ableitung von f : f (x) = 2x −
1 . x
Um die erste N¨aherung x0 zu finden, skizzieren wir den Graphen von f . Zuerst √ stellt man fest, dass f (x) = 0 ist f¨ ur x = 1/ 2. Ferner gilt: F¨ ur 0 < x < F¨ ur x > √12
√1 2
ist f (x) < 0, der Graph f¨allt. ist f (x) > 0, der Graph w¨achst.
Nun berechnen wir noch einige Funktionswerte und k¨ onnen dann den Graphen grob skizzieren: y x 0.1 0.5 √ 1/ 2 1.0 2.0
f (x) 0.30 −1.06 −1.15 −1.00 1.31
1 f x 1
2
-1 Der Zeichnung entnimmt man, dass die Funktion zwei Nullstellen hat. Als Beispiel bestimmen wir die gr¨ ossere und w¨ahlen als ersten N¨ aherungswert x0 = 1.5. Daraus berechnet man f (x0 ) = −0.1555. Der Wert x0 ist also noch keine gute N¨aherung f¨ ur die Nullstelle. Nun verwenden wir die oben hergeleitete Formel f¨ ur x1 : x1 = x0 −
f (x0 ) −0.1555 = 1.5 − = 1.5666 . f (x0 ) 2.3333
21.3 Numerische Integration
325
Eine Kontrollrechnung zeigt, dass f (x1 ) = 0.0053 schon recht nahe bei 0 liegt. Wir verbessern diesen Wert aber noch weiter: x2 = x1 −
f (x1 ) 0.0053 = 1.5666 − = 1.5645 . f (x1 ) 2.4949
Damit finden wir f (x2 ) = 0.0001. Wenn wir, wie hier, mit vier Stellen nach dem Komma rechnen, so ist es sinnvoll, mit dieser N¨aherung aufzuh¨ oren. Zur Beruhigung berechnen wir noch f (1.5644) = −0.0002. Da dieser Wert negativ ist, muss die Nullstelle irgendwo zwischen 1.5644 und 1.5645 liegen. Bemerkungen a) Der Prozess, der im Ersetzen der Kurve durch ihre Tangente besteht, ist nichts anderes als die schon in (7.3) besprochene Linearisierung (vgl. auch (19.9)). b) Wie die folgende Figur zeigt, kann es vorkommen, dass x1 nicht wie erhofft eine bessere, sondern eine schlechtere N¨ aherung als x0 ist:
y x0
x1
x
Wir verzichten auf theoretische Untersuchungen zu diesem Problemkreis (man k¨ onnte z.B. Bedingungen suchen, welche garantieren, dass die gem¨ ass den obigen Formeln definierte Folge x0 , x1 , x2 , . . . gegen eine Nullstelle konvergiert). Die skizzierte Situation wird in der Praxis kaum ahlt. eintreten, wenn man anhand des Graphen den Wert x0 nahe genug bei der Nullstelle w¨
(21.3) Numerische Integration Die Berechnung von Integralen mit dem Hauptsatz (vgl. (11.4)), also unter Verwendung der Formel b f (x) dx = F (b) − F (a) , a
erfordert die Kenntnis einer Stammfunktion F (x) von f (x). Es kann nun sein, dass man keine solche Stammfunktion angeben kann, sei es, weil die zugeh¨ origen Rechnungen zu umfangreich werden oder weil der Integrand f (x) gar keine elementare Stammfunktion besitzt (vgl. (12.3.e)). In solchen F¨ allen helfen die sogenannten numerischen Integrationsmethoden, mit denen man den Wert des Integrals n¨aherungsweise berechnen kann. Diese Methoden werden auch dann eingesetzt, wenn die Funktion f (x) nicht formelm¨ assig, sondern durch einige Wertepaare (xi , yi ) gegeben ist.
326
21. Numerische Methoden
In diesem Abschnitt werden wir die sogenannte Simpson-Formel als ein Beispiel eines solchen Verfahrens kennenlernen. Hierzu nehmen wir an, dass drei Funktionswerte bekannt seien, n¨amlich y0 = f (a), a + b y1 = f , 2 y2 = f (b).
y0
a
y1
(a + b)/2
y2
b
Die Simpson-Formel (auch “Keplersche Fassregel” genannt)* lautet mit diesen Bezeichnungen b b−a f (x) dx ≈ (y0 + 4y1 + y2 ) . 6 a Beispiele
1
dx . x2 + 1 Mit den Funktionswerten f (0) = 1, f (0.5) = 0.8, f (1) = 0.5 erhalten wir
1. Gesucht sei
0
1 0
1 dx ≈ (1 + 3.2 + 0.5) = 0.7833 . . . . x2 + 1 6
In diesem Beispiel k¨ onnte man allerdings auch den Hauptsatz der Infinitesimalrechnung verwenden, denn wir wissen, dass arctan x eine Stammfunktion von 1/(1+x2 ) ist. Der exakte Wert des Integrals ist demzufolge
1 0
π dx = arctan 1 − arctan 0 = − 0 = 0.7854 . x2 + 1 4
¨ (Wie man sieht, ist die Ubereinstimmung recht gut.) 1 2 2. Gesucht sei e−x dx .
0
In (12.3.e) ist gesagt worden, dass dieser Integrand keine elementare Stammfunktion besitzt. Wir verwenden deshalb die Simpson-Formel. Mit f (0) = 1,
1 1 f ( ) = e− 4 = 0.7788, 2
* J. KEPLER, 1571–1630, T. SIMPSON, 1710–1761.
f (1) = e−1 = 0.3679
21.3 Numerische Integration
finden wir
1
327
2
e−x dx ≈
0
1 (1 + 4 · 0.7788 + 0.3679) = 0.7472 . 6
3. Bei einer Vase der H¨ohe 40 cm betr¨ agt der Radius oben 6 cm, in der Mitte 10 cm und unten 8 cm. Wie gross ist ihr Volumen V ? Wir denken uns die Vase durch Rotation des Graphen von f um die x-Achse erzeugt. Gem¨ ass (9.5) ist dann
40
f (x)2 dx .
V =π 0
Die Funktion f ist nicht formelm¨assig gegeben, wir kennen aber drei Werte f (0) = 8,
f (20) = 10,
f (40) = 6 ,
und somit auch deren Quadrate f (0)2 = 64,
f (20)2 = 100,
f (40)2 = 36 .
Damit l¨ asst sich die Simpson-Formel (mit a = 0, b = 40) anwenden:
40
f (x)2 dx ≈ π
V =π 0
40 (64 + 4 · 100 + 36) = 10471.98 . 6
Das Volumen der Vase betr¨ agt also rund 10470 cm3 .
Bemerkungen a) Wie die Formel zeigt, st¨ utzt sich die n¨aherungsweise Berechnung eines Integrals mit der Simpson-Formel bloss auf die Kenntnis der drei Funktionswerte y0 , y1 , y2 . Das Verhalten der Funktion an den anderen Stellen des Intervalls [a, b] spielt u ¨berhaupt keine Rolle. Dies hat den Vorteil, dass das Integral auch berechnet werden kann, wenn nur die Werte y0 , y1 , y2 bekannt sind, vgl. Beispiel 3. oben. b) Auf der anderen Seite bedeutet dies, dass die Approximation nicht sehr genau sein kann. Eine Verbesserung kann durch Vermehrung der Anzahl “St¨ utzstellen” erreicht werden, wie z.B. in der als n¨ achstes zu besprechenden “grossen” SimpsonFormel. Die “grosse” Simpson-Formel Bei der Herleitung der Simpson-Formel haben wir das Intervall [a, b] in zwei gleich grosse Teile geteilt. Eine bessere Approximation ist nat¨ urlich zu erwarten, wenn man das Intervall in mehr als zwei Teilintervalle zerlegt.
328
21. Numerische Methoden
F¨ ur eine Unterteilung in 2n (also eine gerade Anzahl) gleich grosse Teile a = x0
x1
x2
x3
x4
x2n−1 x2n = b
gilt die “grosse” Simpson-Formel
b
f (x) dx ≈
a
b−a (y0 + 4y1 + 2y2 + 4y3 + 2y4 + 4y5 + . . . + 4y2n−1 + y2n ) , 6n
ur n = 1 erh¨ alt man die zuerst besprochene “kleine” Simpsonwobei yi = f (xi ) ist. F¨ Formel. Die “grosse” Simpson-Formel ergibt sich, wenn man die kleine Simpson-Formel der Reihe nach auf die “Doppel-Intervalle” x0 , x1 , x2 x2 , x3 , x4 . .. x2n−2 , x2n−1 , x2n anwendet und die Summe bildet. F¨ ur n = 3, also 2n = 6, beispielsweise finden wir (vgl. (10.8.e)) x2
b f (x) dx =
a
a
x4 f (x) dx +
b f (x) dx +
x2
f (x) dx x4
x4 − x 2 b − x4 x2 − a (y0 + 4y1 + y2 ) + (y2 + 4y3 + y4 ) + (y4 + 4y5 + y6 ) 6 6 6 b−a (y0 + 4y1 + 2y2 + 4y3 + 2y4 + 4y5 + y6 ) . = 6·3 ≈
Wir erhalten so in der Tat die grosse Simpson-Formel f¨ ur den Fall n = 3. Dabei wurde noch benutzt, dass b−a x 2 − a = x 4 − x2 = b − x 4 = 3 ist.
Diese Formel eignet sich gut f¨ ur die Programmierung auf einem Taschenrechner oder Computer, sofern nicht bereits eingebaute Programme zur numerischen Integration vorhanden sind. Wir erw¨ ahnen ohne Beweis eine Fehlerabsch¨ atzung. Es sei I der mit der grossen Simpson-Formel berechnete Wert des Integrals. Ferner sei M das Maximum des Betrags der 4. Ableitung von f im Intervall [a, b]. Dann gilt
b
(b − a)5
·M . f (x) dx − I
≤
2880n4 a Beachten Sie, dass n in der 4. Potenz vorkommt. Wird also n z.B. verdoppelt, so wird der maximale Fehler 16-mal kleiner. F¨ ur n = 1 erh¨ alt man die entsprechende Absch¨ atzung f¨ ur die kleine SimpsonFormel. In der Praxis wird es nat¨ urlich nicht immer leicht sein, die 4. Ableitung zu untersuchen und so M zu finden.
329
osung von Differentialgleichungen 21.4 Numerische L¨
Begr¨ undung der Simpson-Formel f
Wie kommt man u ¨berhaupt auf die (“kleine”) Simpson-Formel? Die Idee ist die folgende: Es gibt genau eine Polynomfunktion 2. Grades p(x), deren Graph durch die drei Punkte (a, f (a)) = (a, y0 ),
a + b 2
, f(
p
a + b a + b ) = , y1 , (b, f (b)) = (b, y2 ) 2 2
geht. Diese Funktion p(x) wird sich nicht allzusehr von f (x) unterscheiden, woraus b a
f (x) dx ≈
a
b
b p(x) dx a
folgt. Bestimmt man nun diese Polynomfunktion p(x) und rechnet ab p(x) dx effektiv aus, so kommt man auf den Wert b b−a p(x) dx = (y0 + 4y1 + y2 ) , 6 a der eine N¨ aherung f¨ ur ab f (x) dx ist, was gerade die Simpson-Formel liefert. Die Einzelheiten der Rechnung k¨ onnen Sie in (27.7) nachschlagen.
(21.4) Numerische L¨ osung von Differentialgleichungen In Kapitel 16 haben wir Differentialgleichungen der Form (1)
y = F (x, y)
behandelt. Unser Ziel war damals, die L¨ osung dieser Differentialgleichung in der Form y = f (x) mit einer explizit angegebenen Funktion f (x) zu finden. Die allgemeine L¨osung enth¨alt noch eine Konstante (meist C genannt), deren Wert durch eine Anfangsbedingung (2)
(x0 , y0 )
festgelegt werden kann. Man erh¨ alt so die spezielle L¨osung zur Anfangsbedingung (2), f¨ ur die (3)
f (x0 ) = y0
gilt. Der Graph dieser L¨osungsfunktion geht also durch den Punkt (x0 , y0 ). Fasst man (1) und (2) zusammen, so spricht man auch von einem Anfangswertproblem. Es ist nun nicht immer m¨oglich, eine formelm¨ assige L¨osung eines Anfangswertproblems zu finden. In solchen F¨allen kann man aber versuchen, das Problem numerisch zu l¨osen, in dem Sinne, dass man f¨ ur gewisse x die Werte der speziellen L¨osung f (x) n¨aherungsweise berechnet und so eine Art Wertetabelle f¨ ur f erh¨ alt. Im folgenden sei
330
21. Numerische Methoden
das wohl einfachste dieser Verfahren, das sogenannte Verfahren von Euler*, vorgestellt. Es orientiert sich an der Idee des Richtungsfeldes (16.3). Dazu sei f die spezielle L¨osung von (1) mit der Anfangsbedingung (2). Wie wir aus (16.3) wissen, k¨onnen wir die Steigung der Funktion f an der Stelle (x0 , y0 ) ausrechnen, ohne die Funktion selbst zu kennen, es ist ja f (x0 ) = y = F (x0 , y0 ) .
(4)
onnen wir aber die Gleichung der Tangente an den Graphen von f im Punkt Damit k¨ (x0 , y0 ) bestimmen, es ist y = p(x) = f (x0 ) + f (x0 )(x − x0 ) .
(5)
Nun ver¨andern wir x0 um einen kleinen Wert h. Statt auf dem Graphen von f gehen wir im Sinne einer N¨ aherung auf der Tangente weiter. Dies ist nichts anderes als die bereits in (7.3) besprochene Linearisierung, vgl. auch (21.2). Die Zahl (6)
y
y1 = p(x0 + h) = f (x0 ) + f (x0 )h
f
urzen ist also eine N¨aherung f¨ ur f (x0 + h). Wir k¨ nun x0 + h mit x1 ab und setzen in (6) noch f (x0 ) = y0 und f (x0 ) = F (x0 , y0 ) (wegen (3) und (4)). So erhalten wir (vgl. auch die Figur)
y1 hF (x0 , y0 ) y0
h x
f (x1 ) ≈ y1 = y0 + hF (x0 , y0 ) .
x0
x0 + h
Nun nehmen wir (x1 , y1 ) als neuen Ausgangspunkt und wiederholen das Prozedere. Mit x2 = x1 + h finden wir f (x2 ) ≈ y2 = y1 + hF (x1 , y1 ) usw. Mit dieser Idee k¨onnen wir dann f (x) f¨ ur beliebige x bestimmen. Das Eulersche Verfahren l¨asst sich nach diesen Vorbereitungen wie folgt beschreiben: Zu l¨ osen ist das Anfangswertproblem y = F (x, y) mit y(x0 ) = y0 . Gesucht ist der Wert der L¨osung an der Stelle x = z. Wir teilen das Intervall mit den Endpunkten x0 und z in n gleiche Teile der “Schrittweite” h= * L. EULER, 1707–1783
z − x0 n
331
osung von Differentialgleichungen 21.4 Numerische L¨
(die auch negativ sein kann) und setzen xi = x0 + ih. Speziell ist dann xn = z. h x0
xn = z
xi
x1
Mit Hilfe der gegebenen Funktion F berechnen wir der Reihe nach y1 = y0 + hF (x0 , y0 ) y2 = y1 + hF (x1 , y1 ) .. . yi+1 = yi + hF (xi , yi ) .. . yn = yn−1 + hF (xn−1 , yn−1 ) . Dann ist yn ein N¨ aherungswert f¨ ur f (z). Anschaulich bedeutet die Konstruktion, dass man dem Richtungsfeld folgt: y
x x0
x1
x2
x3
x4
x5
Beispiel Wie in (16.3) betrachten wir die Differentialgleichung y = −y + x + 1 . Als Anfangsbedingung nehmen wir x0 = 0, y0 = 1. Gesucht sei der Wert der speziellen L¨ osung an der Stelle x = z = 1. Wir w¨ ahlen n = 5, d.h. h = 0.2. Dann ist x0 = 0, x1 = 0.2, . . . , x4 = 0.8, x5 = z = 1. Mit F (x, y) = −y + x + 1 erhalten wir i 0 1 2 3 4 5
xi 0.0 0.2 0.4 0.6 0.8 1.0
yi 1 1 1.04 1.112 1.2096 1.32768
F (xi , yi ) 0 0.2 0.36 0.488 0.5904
yi+1 = yi + hF (xi , yi ) y1 = 1 + 0.2 · 0 y2 = 1 + 0.2 · 0.2 y3 = 1.04 + 0.2 · 0.36 y4 = 1.112 + 0.2 · 0.488 y5 = 1.2096 + 0.2 · 0.5904
=1 = 1.04 = 1.112 = 1.2096 = 1.32768
21. Numerische Methoden
332
Es folgt f (1) ≈ y5 = 1.33. In (16.6) haben wir die allgemeine L¨osung bestimmt: y = f (x) = x + Ce−x . Wir k¨onnen deshalb in diesem Fall unsere L¨ osung kontrollieren. Die Anfangsbedingung x0 = 0, y0 = 1 wird erf¨ ullt, wenn man C = 1 setzt. Als spezielle L¨osung finden wir y = f (x) = x + e−x . Der exakte Wert ist daher f (1) = 1.367 . . . . Unsere N¨aherungsl¨ osung ist schon recht osung verbessert werden. Mit genau. Durch Verkleinerung der Schrittweite h kann die L¨ h = 0.01 beispielsweise erh¨alt man f (1) ≈ 1.366. Bemerkungen: a) Das Eulersche Verfahren ist relativ einfach und nicht allzu genau; die Fehlerquellen sind leicht zu erkennen: Einmal ersetzt man die L¨ osungsfunktion in (xi , yi ) durch ihre Linearisierung, dann ¨ osungsfunktion, wechselt man aber beim Ubergang von (xi , yi ) zu (xi+1 , yi+1 ) auch noch die L¨ denn die spezielle L¨ osung, die durch (xi , yi ) geht, wird i.a. nicht gleich der L¨ osung sein, die durch (xi+1 , yi+1 ) geht. b) In der Praxis, und insbesondere auf Rechenanlagen, verwendet man deshalb verbesserte (aber entsprechend kompliziertere) Methoden, auf die hier nicht eingegangen werden kann. c) Das Verfahren setzt voraus, dass u ¨berhaupt eine L¨ osung existiert und dass sie eindeutig ist. Wir haben uns bisher nie gross um solche Fragen gek¨ ummert (vgl. aber (16.5.d)). Die Theorie der Differentialgleichungen stellt Aussagen bereit, welche Existenz und Eindeutigkeit sicherstellen. Ein solcher Satz sei hier ohne Beweis zitiert: Die Funktion F (x, y) sei stetig auf dem Rechteck R der x-y–Ebene, gegeben durch
b
x0 − a ≤ x ≤ x0 + a, y0 − b ≤ x ≤ y0 + b. Ferner habe sie dort eine stetige partielle Ableitung nach y. Dann hat das Anfangswertproblem y = F (x0 , y0 ),
y y0
b a
y(x0 ) = y0
a
x
x0
genau eine auf dem Intervall [x0 − r, x0 + r] definierte L¨ osung. Dabei ist r die kleinere der beiden Zahlen a und b/M , wo M das Maximum des Betrags von f (x, y) in R ist. Stetigkeit von Funktionen von zwei Variablen und partielle Ableitungen werden sp¨ ater besprochen ((22.8) und (23.2)).
(21.∞) Aufgaben 21−1 L¨ osen Sie die folgenden Gleichungen: a) x = e−x , b) x3 = cos x, c) x ln x − x − 1 = 0. ahre Lage der 21−2 a) Skizzieren Sie grob den Graphen von f (x) = x3 − 6x2 + 9x + 1, um die ungef¨ Nullstellen zu ermitteln (suchen Sie die Extrema!). b) Bestimmen Sie diese Nullstellen x.
21.∞ Aufgaben
333
21−3 Geben Sie die Extremal- und die Nullstellen der Funktion g(x) = x4 + 2x2 − 4x − 1 an. 21−4 Berechnen Sie den Inhalt des von der y–Achse und den durch die Graphen von y = x bzw. achenst¨ ucks. y = cos x begrenzten Fl¨ 21−5 Welcher Punkt auf dem Graphen der Funktion f (x) = ln x liegt am n¨ achsten beim Nullpunkt? Wie gross ist dieser Abstand? 21−6 Ein Tank hat die Form eines liegenden Zylinders vom Radius 1 m. Auf einem Messstab soll eine Marke f¨ ur die F¨ ullmenge 25% angebracht werden. Auf welcher H¨ ohe (auf mm genau) u ¨ ber dem tiefsten Punkt befindet sich diese Marke? y 21−7 In der nebenstehenden Figur ist der Graph der Funktion f (x) = sin2 x skizziert. Bestimmen Sie z so, dass der Inhalt des schraffierten Fl¨ achenst¨ ucks = 1 ist.
x z
21−8 Berechnen Sie mit der “kleinen” Simpson-Formel n¨ aherungsweise die folgenden Integrale: 2 1 π/4 dt dx x ln(1 + e ) dx, c) , b) a) 5 cos t 0 1+x 0 −1 Vergleichen Sie im Fall a) Ihr Resultat mit dem exakten Wert (13.7). 21−9 Ein Fass mit kreisf¨ ormigen Querschnitten wird ausgemessen. Es ist 2 m lang und sein Durchmesser an den Enden betr¨ agt je 1.5 m. In der Mitte ist es einfacher, den Umfang zu bestimmen; dieser betr¨ agt 6.2 m. Berechnen Sie n¨ aherungsweise das Volumen das Fasses. 21−10 Berechnen Sie n¨ aherungsweise die L¨ ange der Sinuskurve im Intervall [0, π ] a) mit der kleinen 2 Simpson-Formel, b) mit der grossen Simpson-Formel (6 Teilintervalle). 21−11 Es sei f (x) die L¨ osungsfunktion des angegebenen Anfangswertproblems. Berechnen Sie n¨ aherungsweise den Wert von f (z) (Eulersches Verfahren mit 5 Teilintervallen). 1 + y2 , f (0) = 1, z = 0.5. a) y = 1 + x2 x−y b) y = , f (1) = 1, z = 2. x+y √ c) y = x + y, f (1) = 3, z = 1.5.
334
F. FUNKTIONEN VON MEHREREN VARIABLEN ¨ 22. ALLGEMEINES UBER FUNKTIONEN VON MEHREREN VARIABLEN ¨ (22.1) Uberblick In diesem Kapitel werden die Grundtatsachen u ¨ber Funktionen von mehreren Variablen sowie einige Beispiele vorgestellt, wobei wir uns aber meist auf den Fall von zwei Ver¨anderlichen beschr¨anken.
(22.2) (22.3)
Daneben werden einige M¨oglichkeiten zur anschaulichen Darstellung von solchen Funktionen aufgezeigt: • Graph, • Niveaulinien, • Partielle Funktionen.
(22.4) (22.5) (22.6)
Zum Schluss werden einige mehr theoretische Dinge wie Grenzwert und Stetigkeit besprochen.
(22.8)
(22.2) Einleitende Beispiele Wir beginnen mit drei Beispielen zur Illustration des Begriffs der Funktion von mehreren Variablen. a) F¨ ur ein reales Gas (Substanzmenge 1 Mol) besteht bei der Temperatur T zwischen dem Gasdruck p und dem Volumen V nach der van der Waalsschen Zustandsgleichung die Beziehung p = p(T, V ) =
RT a . − V −b V2
Dabei ist R die allgemeine Gaskonstante, a und b sind Konstanten, die vom betrachteten Gas abh¨angen. Der Druck p ist also nicht nur von einer Gr¨osse, sondern von zwei Gr¨ossen, n¨amlich T und V , abh¨ angig. Man sagt dementsprechend, p sei eine Funktion von zwei Variablen. In unserem Fall ist diese Funktion formelm¨assig gegeben. Diese Formel gilt aber nur dann, wenn T und V innerhalb gewisser Grenzen variieren. Die derart zugelassenen Paare (T, V ) bilden den Definitionsbereich der Funktion p. b) Wir untersuchen die Temperaturverteilung im Raum. Dazu f¨ uhren wir ein r¨ aumliches rechtwinkliges Koordinatensystem ein. Jeder Punkt ist dann durch seine
© Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0_6
22.3 Der Begriff der Funktion von mehreren Variablen
335
drei Koordinaten x, y, z bestimmt. Die Temperatur T h¨angt nun in experimentell feststellbarer Weise von den Zahlen x, y, z ab: T ist eine Funktion der drei Variablen x, y, z T = T (x, y, z) . ur einen festen Zeitpunkt. Bedenkt man aber, dass die TemperaturverteiDies gilt f¨ lung auch von der Zeit t abh¨ angt, so wird T sogar eine Funktion von vier Variablen: T = T (x, y, z, t) . c) Funktionen von zwei Variablen sind bei der Behandlung von Differentialgleichungen als bequeme Abk¨ urzung bereits vorgekommen. Wir schrieben damals y = F (x, y) , wo F (x, y) f¨ ur einen Ausdruck wie x − y + 1 oder dergleichen stand (vgl. z.B. (15.4.d)). (22.3) Der Begriff der Funktion von mehreren Variablen Mit R2 bezeichnen wir die Menge aller geordneten Paare von reellen Zahlen. “Geordnet” heisst dabei, dass die 1. und die 2. Stelle zu unterscheiden sind: (1, 2) ist nicht dasselbe wie (2, 1). Geometrisch l¨asst sich R2 als Ebene deuten, indem man (x, y) als den Punkt P mit den kartesischen Koordinaten (x, y) interpretiert. Analog ist Rn die Menge aller geordneten “n–Tupel” (x1 , x2 , . . . , xn ) ,
xi ∈ R (i = 1, 2, . . . , n) .
Die Menge Rn wird auch “n–dimensionaler Raum” genannt. Speziell besteht der 3– dimensionale Raum R3 aus allen geordneten “Tripeln” (x, y, z). In vollkommener Analogie zum Fall einer Variablen (26.9) geben wir nun die folgende allgemeine Definition*: Eine Funktion von n Variablen ist dadurch gegeben, dass jedem n–Tupel (x1 , x2 , . . . , xn ) aus einer gewissen (nicht-leeren) Teilmenge D(f ) ⊂ Rn (dem Definitionsbereich von f ) in eindeutiger Weise eine reelle Zahl f (x1 , x2 , . . . , xn ) zugeordnet wird. Es ist klar, dass die Untersuchung einer Funktion von mehreren Variablen komplizierter ist als jene von Funktionen einer Variablen. Die meisten neuen Ph¨ anomene ¨ zeigen sich aber bereits beim Ubergang von einer zu zwei Variablen. Dies erlaubt uns, die Theorie haupts¨achlich an Beispielen von Funktionen von zwei Variablen zu illustrieren. * Genauer spricht man von einer reellwertigen Funktion, da die Funktionswerte reelle Zahlen sind. Daneben gibt es auch vektorwertige Funktionen, die z.B. bei Vektorfeldern (14.3) auftreten, mit denen wir uns aber im Abschnitt F nicht weiter besch¨ aftigen werden.
¨ber Funktionen von mehreren Variablen 22. Allgemeines u
336
(22.4) Der Graph einer Funktion von zwei Variablen Es sei f : D(f ) → R (mit D(f ) ⊂ R2 ) eine Funktion von zwei Variablen. Ein Paar (x, y) aus D(f ) entspricht dabei einem Punkt der x-y–Ebene. Wir betrachten nun ein r¨aumliches Koordinatensystem und tragen u ¨ber jedem Punkt (x, y) ∈ D(f ) den Funktionswert f (x, y) in Richtung der z-Achse ab. Die so erhaltene Menge G = G(f ) = {(x, y, f (x, y)) | (x, y) ∈ D(f )} heisst der Graph von f . z f (x, y)
(x, y, f (x, y))
x y
x
y (x, y) Der Graph einer Funktion einer Variablen ist (wenigstens f¨ ur die u ¨blicherweise vorkommenden Funktionen) eine Kurve in der Ebene. In Analogie dazu kann der Graph einer Funktion von zwei Variablen als Fl¨ache im dreidimensionalen Raum aufgefasst werden. z y f f y D(f ) x D(f )
x
337
22.4 Der Graph einer Funktion von zwei Variablen
Beispiele: a) Die lineare Funktion von zwei Variablen Eine Funktion der Form f (x, y) = ax + by + c , wo a, b und c feste reelle Zahlen sind, heisst eine lineare Funktion (von zwei Variablen). Wir behaupten, dass der Graph dieser Funktion eine Ebene ist, welche durch den Punkt (0, 0, c) geht und senkrecht zum Vektor ⎛ ⎞ a n = ⎝ b ⎠ −1 steht. z n
Dies sieht man so ein: Der Punkt (x, y, z) liegt genau dann auf dem Graphen von f , wenn z = ax + by + c ist, d.h. wenn (∗)
·
ax + by − z + c = 0
gilt. Setzen wir noch ⎛ ⎞ 0 a = ⎝ 0 ⎠ , c
x − a
a
⎛ ⎞ x r = ⎝ y ⎠ , z
x x y
so schreibt sich (∗) als Gleichung f¨ ur ein Skalarprodukt: n(r − a) = 0 .
Dies ist, wie wir in (1.10.b) gesehen haben, gerade die vektorielle Form der Ebenengleichung f¨ ur die Ebene, welche durch den Punkt (0, 0, c) geht und senkrecht auf n steht. b) Zur vorl¨ aufigen weiteren Illustration skizzieren wir die folgenden drei Graphen. z z z y
y
y
x x f (x, y) = x2 + y 2
x
f (x, y) =
1 − x2 − y 2
f (x, y) = xy
¨ber Funktionen von mehreren Variablen 22. Allgemeines u
338
Wir geben einige kurze Erl¨ auterungen zu den drei Beispielen: 1) Weil d = x2 + y 2 der Abstand des Punktes (x, y) vom Nullpunkt (in der x-y–Ebene betrachtet) ist, h¨ angt z = f (x, y) = x2 + y 2 = d2 nur von diesem Abstand ab. Man sieht nun ohne grosse M¨ uhe ein, dass der Graph durch Rotation der Parabel z = x2 um die z-Achse entsteht (Rotationsparaboloid). 2) Die Zahl d = x2 + y 2 + z 2 ist der Abstand des Punktes (x, y, z) vom Nullpunkt im Raum (vgl. (2.4), Regel 6) oder (22.8)). Aus z = f (x, y) = 1 − x2 − y 2 folgt x2 +y 2 +z 2 = 1. Die Punkte auf dem Graphen von f haben also alle den Abstand 1 vom Nullpunkt. Weiter ist z als Quadratwurzel definitionsgem¨ ass stets ≥ 0. Daraus folgt, dass der Graph die “n¨ ordliche ¨ Halbkugel inkl. Aquator” vom Radius 1 ist. 3) Hier sei auf (22.5) verwiesen.
Nat¨ urlich ist es nicht immer leicht, eine u ¨bersichtliche r¨aumliche Skizze des Graphen zu zeichnen. In (22.5) und (22.6) werden wir zwei andere Arten der Darstellung kennenlernen. (22.5) Niveaulinien Eine der Methoden, Funktionen von zwei Variablen anschaulich darzustellen, beruht auf der Verwendung von sogenannten Niveaulinien. Wenn wir uns die in den obigen Beispielen dargestellten Fl¨ achen als Landschaften mit Bergen und T¨alern vorstellen, so sind die Niveaulinien nichts anderes als die von den Landkarten her bekannten H¨ohenkurven. Man w¨ ahlt n¨ amlich eine Zahl c (die “H¨ohe”) und bestimmt alle Punkte (x, y), deren Funktionswert f (x, y) = c ist. Die Menge dieser Punkte bildet f¨ ur ein festes c im Normalfall eine Kurve in der x-y–Ebene (Ausartungen sind m¨ oglich: Die Menge kann sich aus zwei oder mehr Teilkurven zusammensetzen, sie kann leer sein etc.). Diese Kurve heisst Niveaulinie. Wir illustrieren dies nun in einigen F¨allen. Beispiele 1. Sei f : R2 → R , f (x, y) = xy Niveau
c = 0:
Niveau
c = 1:
Niveau
c = −1:
(siehe (22.4.b)). Wir w¨ ahlen einige Niveaus:
f (x, y) = xy = 0. Diese Gleichung ist dann erf¨ ullt, wenn x = 0 oder y = 0 ist. Die L¨ osungsmenge wird gebildet durch die y–Achse und die x–Achse. 1 f (x, y) = xy = 1 oder y = . x Die Niveaulinie ist hier der Graph der Funktion y = 1/x, also eine Hyperbel, in der unten eingezeichneten Lage (1. bzw. 3. Quadrant). 1 f (x, y) = xy = −1 oder y = − . x Die Niveaulinie ist ebenfalls eine Hyperbel (2. und 4. Quadrant).
22.5 Niveaulinien
339
Auch alle anderen Niveaus c = 0 liefern Hyperbeln. Wir erhalten so die links wiedergegebene Figur, in der die Kurven mit den Niveaus c = −1, . . . , 2 beschriftet sind. Dabei entspricht der Nullpunkt einer “Passh¨ohe”, der Aufstieg erfolgt in Richtung der strichpunktierten Pfeile. Zeichnet man diese Niveaulinien in die r¨aumliche Darstellung von (22.4.b) ein, so erh¨ amlich eine Art Reliefbild alt man noch eine weitere Darstellungsm¨oglichkeit, n¨ (rechts). Die durch die Gleichung z = xy beschriebene Fl¨ache wird u ¨brigens “hyperbolisches Paraboloid” genannt. y 0
-2 -1 1 2
2. f (x, y) =
1 1
2 1 0 -1 -2
x
1 − x2 − y 2 , (x2 + y 2 ≤ 1)
(siehe (22.4.b)).
Hier sehen Niveaulinien und Reliefbild wie folgt aus: y 1
1 x
F¨ ur ein konstantes Niveau c ist die Niveaulinie durch c=
1 − x2 − y 2
gegeben. (Da eine Quadratwurzel stets ≥ 0 ist, kommen nur Niveaus c ≥ 0 in Frage). Quadrieren und Umformen ergibt x2 + y 2 = 1 − c 2 ,
¨ber Funktionen von mehreren Variablen 22. Allgemeines u
340
√ und dies ist die Gleichung eines Kreises um den Nullpunkt mit Radius 1 − c2 . (Daraus folgt u ¨brigens, dass c ≤ 1 sein muss, was die Tatsache reflektiert, dass der h¨ ochste Punkt der Halbkugel die H¨ohe 1 hat.) Die Niveaulinien sind also Kreise; als “ausgearteter Fall” tritt noch ein Punkt auf. 3. f (x, y) = x2 (y + 1) Wir w¨ahlen als typische Beispiele die drei Niveaus c = −1,
x2 (y + 1) = −1 :
c = 0,
x2 (y + 1) = 0 :
c = 1,
x2 (y + 1) = 1 :
1 −1, x2 y = −1 oder x = 0 , 1 y = 2 −1. x y=−
Dies ergibt zusammen mit einigen weiteren Niveaulinien folgendes mit den Werten von c beschriftete Bild (f¨ ur c = 0 erhalten wir zwei Geraden): y
1 2
1 0.5 0.2
0.2 0.5 1
2
1
x
0 0
-1
-0.5 -0.2
-0.2 -0.5
-1
In der Praxis setzt das Zeichnen von solchen Niveaulinien voraus, dass die Gleichung f (x, y) = c tats¨ achlich nach y (oder auch nach x) aufgel¨ ost werden kann. (22.6) Partielle Funktionen Dies ist ein weiterer wichtiger Begriff bei Funktionen von mehreren Variablen. Wir werden ihn vor allem im Fall von zwei Ver¨anderlichen benutzen und illustrieren ihn zun¨ achst an einem Beispiel.
22.6 Partielle Funktionen
341
In (22.2) haben wir die van der Waalssche Zustandsgleichung angeschrieben p = p(T, V ) =
RT a − 2 , V −b V
welche den Druck eines Gases in Abh¨ angigkeit von Temperatur und Volumen angibt. Oft wird das Volumen fest vorgegeben, also konstant sein. Man schreibt dann V = V0 = const. In diesem Fall h¨angt der Druck nur noch von der Temperatur T ab, ist also eine Funktion einer Variablen, die man durch die Formel T → p(T, V0 ) =
a RT − 2 V0 − b V0
angeben kann. Man spricht von einer partiellen Funktion der Funktion p. K¨ urzt man u ¨brigens die oben auftretenden Konstanten ab: R/(V0 −b) = r, −a/V02 = s, so lautet die Gleichung f¨ ur die partielle Funktion einfach T → rT + s . Es handelt sich somit um eine lineare Funktion (einer Variablen). Genausogut kann man anstelle des Volumens die Temperatur konstant halten (T = T0 ) und das Volumen variieren. Auf diese Weise erh¨alt man eine zweite partielle Funktion von p, n¨amlich RT0 a V → p(T0 , V ) = − V −b V2 (wo also T = T0 als Konstante und V als Variable aufzufassen ist). Nach diesem Beispiel betrachten wir den allgemeinen Fall einer Funktion von zwei Variablen f : D(f ) → R, (x, y) → f (x, y), D(f ) ⊂ R2 . Nun halten wir y konstant (y = y0 ) und fassen nur noch x als Variable auf. Die so erhaltene Funktion einer Variablen x → f (x, y0 ) heisst eine partielle Funktion von f (genauer m¨ usste man sagen: Die partielle Funktion in Richtung x durch y0 ). Wir bezeichnen diese Funktion im folgenden meist mit ϕ (genauer w¨ are ϕy0 , mit einem expliziten Hinweis auf y0 , doch ist diese Bezeichnung zu umst¨andlich). Also: ϕ(x) = f (x, y0 ) .
342
¨ber Funktionen von mehreren Variablen 22. Allgemeines u
urlich so gew¨ ¨berhaupt Punkte (x, y0 ) ahlt werden muss, dass es u Es sei noch erw¨ ahnt, dass y0 nat¨ in D(f ) gibt, vgl. (22.7), Beispiel 1.
Entsprechend definiert man die partielle Funktion in Richtung y durch x0 : y → f (x0 , y) , wobei also jetzt x konstant ist (x = x0 ) und y variiert. Wir bezeichnen diese partielle Funktion im folgenden mit ψ: ψ(y) = f (x0 , y) .
(22.7) Geometrische Veranschaulichung der partiellen Funktionen Wir rufen zun¨achst in Erinnerung, dass der Graph von f eine Fl¨ ache im Raum ist. Nun betrachten wir die partielle Funktion ϕ(x) = f (x, y0 ) bei konstant gehaltenem y0 . Wir interessieren uns also im Moment nur f¨ ur die Funktionswerte an den Stellen (x, y0 ), wo y0 fest ist. Diese Punkte (x, y0 ) liegen aber (in der x-y–Ebene) alle auf einer Parallelen g zur x–Achse, welche durch y0 geht (vgl. Skizze unten). Die Funktionswerte z = f (x, y0 ) = ϕ(x) werden wie u ¨blich u ¨ber (x, y0 ) abgetragen. Die Menge aller so erhaltenen Punkte bildet eine Kurve im Raum. Diese liegt einerseits auf dem Graphen von f (der Fl¨ache) und andererseits in der Ebene E, welche durch g geht und parallel zur x-z–Ebene ist. Mit anderen Worten: Der Graph der partiellen Funktion ϕ ist die Schnittkurve des Graphen von f mit der Ebene E. Ganz entsprechend sieht der Fall aus, wo x = x0 konstant ist und wo y variiert, wo also z = f (x0 , y) = ψ(y) ist. Hier wird die Fl¨ache mit einer Ebene parallel zur y-z–Ebene geschnitten.
343
22.7 Geometrische Veranschaulichung der partiellen Funktionen
z
z
ψ
ϕ
y0 E
x0 y
(x0 , y0 )
x
y
(x0 , y0 )
x
Bestimmt man nun mehrere partielle Funktionen und zeichnet diese in einer r¨ aumlichen Skizze in den entsprechenden Ebenen parallel zur x-z– bzw. y-z–Ebene ein, so erh¨ alt man ein anschauliches Bild des Graphen: z
y
x
Manche Computerprogramme erlauben es, solche Zeichnungen sehr bequem herzustellen, siehe Beispiel 3. unten. Beispiele 1. Betrachten wir nochmals das Beispiel 2) von (22.4.b): z = f (x, y) =
1 − x2 − y 2 .
F¨ ur ein konstant gehaltenes y0 lautet die Gleichung der partiellen Funktion z = ϕ(x) =
1 − x2 − y02 .
Mit einer Umformung erhalten wir z 2 + x2 = 1 − y02 ,
¨ber Funktionen von mehreren Variablen 22. Allgemeines u
344
und dies ist die Gleichung eines Kreises mit Radius 1 − y02 . Er ist in der Ebene E zu zeichnen, welche durch y0 geht. (Da z stets ≥ 0 sein muss, zeichnen wir nur einen Halbkreis ein). Ganz entsprechend geht man f¨ ur konstantes x = x0 vor. z
x
1
1
y
Eingetragen sind die Graphen der partiellen Funktionen ϕ(x) f¨ ur
y0 = 0 und f¨ u r y0 =
ψ(y) f¨ ur
x0 = 0 .
1 , 2
Es ist auch geometrisch klar, dass die Schnittkurven der betrachteten Ebenen mit der Halbkugel Halbkreise sind. Der Skizze entnimmt man noch, dass y0 nicht beliebig gew¨ ahlt werden darf, sondern im Intervall [−1, 1] liegen muss, ebenso x0 . Vgl. die entsprechende Bemerkung in (22.6).
2. Im Fall des Beispieles 3) von (22.4.b), f (x, y) = xy, sind die partiellen Funktionen gegeben durch ϕ(x) = f (x, y) = xy0 , ψ(y) = f (x0 , y) = x0 y . Es handelt sich hier um lineare Funktionen. Die Schnittkurven des Graphen von f mit den Ebenen parallel zur x-z– bzw. zur y-z–Ebene sind also Geraden! 3. f (x, y) = x2 (y + 1) (vgl. (22.5.3) f¨ ur die Niveaulinien). Partielle Funktionen in x–Richtung (y konstant): y y y y y
= −2 : z = −x2 = −1 : z = 0 =0 : z = x2 =1 : z = 2x2 =2 : z = 3x2 .
Mit Ausnahme von y = −1 handelt es sich bei den Graphen dieser partiellen Funktionen um Parabeln.
22.8 Grenzwerte und Stetigkeit
345
Partielle Funktionen in y–Richtung (x x = −1 x = − 21 x=0 x = 12 x=1
konstant): : z =y+1 : z = 14 (y + 1) :z=0 : z = 14 (y + 1) : z =y+1.
Die Graphen sind Geraden. Wir zeichnen nun alle diese Graphen (jeweils in der entsprechenden Ebene) in eine r¨aumliche Skizze (links) ein. Vergr¨ ossert man die Anzahl der partiellen Funktionen, so wird das Bild anschaulicher (rechts). z
z
y
y
x
x
Zum Schluss sei noch erw¨ ahnt, wie partielle Funktionen im allgemeinen Fall von n Variablen definiert sind. Hier h¨ alt man alle Ver¨ anderlichen fest, bis auf eine einzige, und erh¨ alt so n partielle Funktionen. F¨ ur n = 3 beispielsweise sind das die drei Funktionen x → f (x, y0 , z0 ) ,
y → f (x0 , y, z0 ) ,
z → f (x0 , y0 , z) .
(22.8) Grenzwerte und Stetigkeit In diesem Abschnitt besprechen wir die im Titel erw¨ ahnten Begriffe. Da wir sie nur am Rande gebrauchen werden, fassen wir uns kurz und beschr¨ anken uns auf den Fall von zwei Variablen.
¨ber Funktionen von mehreren Variablen 22. Allgemeines u
346
Zuerst sei nochmals die Formel f¨ ur den Abstand d der zwei Punkte P (x, y, z) und P0 (x0 , y0 , z0 ) im Raum R3 erw¨ahnt. Betrachten wir die Vektoren ⎛ ⎞ x r = ⎝ y ⎠ , z
⎛
⎞ x0 r0 = ⎝ y0 ⎠ , z0
ass (2.4), Formel 6), ist so ist d = |r − r0 | und gem¨ d=
(x − x0 )2 + (y − y0 )2 + (z − z0 )2 .
Entsprechend wird der Abstand d der zwei Punkte (x, y) und (x0 , y0 ) in der Ebene R2 gegeben durch d = d (x, y), (x0 , y0 ) = (x − x0 )2 + (y − y0 )2 . Diesen Abstand werden wir nun einige Male gebrauchen. Im Sinne einer Definition erweitert man die obigen Formeln auf den n-dimensionalen Raum Rn und sagt, der Abstand der Punkte (u1 , u2 , . . . , un ) und (v1 , v2 , . . . , vn ) sei gleich
(u1 − v1 )2 + (u2 − v2 )2 + . . . + (un − vn )2 .
F¨ ur n = 1, d.h. f¨ ur R1 = R, stimmt diese Formel wegen (26.8) u ¨berein.
(x − x0 )2 = |x − x0 | u ¨brigens mit jener von
Die anschauliche Definition des Grenzwerts einer Funktion von zwei Variablen entspricht jener im Fall einer Variablen gem¨ass (3.6.b). Die Zahl r heisst der Grenzwert der Funktion f (von zwei Variablen) an der Stelle (x0 , y0 ), wenn f (x, y) beliebig nahe bei r liegt, f¨ ur alle Punkte (x, y), die gen¨ ugend nahe bei (x0 , y0 ) liegen, wobei aber stets (x, y) = (x0 , y0 ) sein muss. Im Falle einer Variablen befinden sich die “nahe bei x0 ” gelegenen Punkte einfach links oder ahrend im Falle von zwei Variablen die “nahe bei (x0 , y0 )” gelegenen Punkte rund um rechts von x0 , w¨ (x0 , y0 ) herum verteilt liegen. Es gibt dann also sozusagen sehr viele M¨ oglichkeiten, sich dem Punkt (x0 , y0 ) zu n¨ ahern: Wichtig ist, dass sich f (x, y) f¨ ur jeden dieser “Wege” demselben Wert r n¨ ahern muss, damit der Limes existiert! Eine Illustration dazu finden Sie in (24.6).
(x0 , y0 )
(x0 , y0 )
(x0 , y0 )
(x0 , y0 )
22.8 Grenzwerte und Stetigkeit
347
Die nachstehende formale Definition (vgl. (3.6.b) f¨ ur das “eindimensionale” Analogon) nimmt auf diese Gegebenheiten R¨ ucksicht. Es sei f : D → R eine Funktion von zwei Variablen und es sei (x0 , y0 ) ∈ R2 . Die Zahl r heisst der Grenzwert von f an der Stelle (x0 , y0 ), falls folgende Bedingung erf¨ ullt ist: ur alle (x, y) ∈ D, (x, y) = Zu jedem ε > 0 existiert ein δ > 0, so dass |f (x, y) − r| < ε ist f¨ (x0 , y0 ), mit d((x, y), (x0 , y0 )) < δ. Dabei ist |f (x, y) − r| der Abstand in R, w¨ ahrend d((x, y), (x0 , y0 )) jener in R2 ist.
An Bezeichnungen f¨ ur den Grenzwert sind in Gebrauch: lim
f (x, y) = r
oder
(x,y)→(x0 ,y0 )
f (x, y) → r, (x, y) → (x0 , y0 ) .
ur die Definition der Stetigkeit einer Funktion f von zwei Variablen greifen Auch f¨ ass (4.6.c) zur¨ uck. Die anschauliche Beschreibung wir auf den eindimensionalen Fall gem¨ lautet wie folgt: Die Funktion f heisst stetig an der Stelle (x0 , y0 ), wenn f (x, y) beliebig nahe, d.h. so nahe wie man nur will, bei f (x0 , y0 ) liegt, vorausgesetzt, dass (x, y) nahe bei (x0 , y0 ) liegt. Wie in (4.6.c) gibt es auch eine formelm¨ assige Definition. Sie lautet: Es sei f : D → R eine Funktion von zwei Variablen und es sei (x0 , y0 ) ∈ D. Die Funktion f heisst stetig an der Stelle (x0 , y0 ), falls folgende Bedingung erf¨ ullt ist: Zu jeder (noch so kleinen) Zahl ε > 0 gibt es eine (von ε abh¨ angige) Zahl δ > 0 mit |f (x, y) − f (x0 , y0 )| < ε f¨ ur alle (x, y) ∈ D mit d((x, y), (x0 , y0 )) < δ. Dabei bezeichnet d(·) den Abstand in R2 .
Weiter definiert man wie in (4.6.c): 1) f heisst stetig auf der Teilmenge X ⊂ D, wenn f an jeder Stelle (x0 , y0 ) ∈ X stetig ist. 2) f heisst stetig, wenn f auf dem ganzen Definitionsbereich stetig ist. In (4.6.e) haben wir die Begriffe Grenzwert und Stetigkeit miteinander in Beziehung gebracht. Ein analoger Zusammenhang besteht auch hier. Es gilt: Die Funktion f ist genau dann an der Stelle (x0 , y0 ) stetig, wenn lim
(x,y )→(x0 ,y0 )
f (x, y) = f (x0 , y0 )
ist (die Schreibweise beinhaltet die Existenz des Grenzwerts). Auf den Beweis, der ¨ ahnlich wie in (4.6.e) geht, sei verzichtet.
Ohne genauere Untersuchung und in etwas vager Form erw¨ ahnen wir, dass Funktionen von zwei Variablen stetig sind, wenn sie auf “vern¨ unftige” Weise formelm¨assig unter Verwendung von stetigen Funktionen einer Variablen definiert sind. So sind etwa f (x, y) = x2 y + 2xey + sin(xy) , arctan(x + y) , g(x, y) = 1 + x2 ln y h(x, y) = 2 x + y2
¨ber Funktionen von mehreren Variablen 22. Allgemeines u
348
auf ihrem Definitionsbereich stetig. (22.∞) Aufgaben 22−1 Bestimmen Sie den maximalen Definitionsbereich D der nachstehend angegebenen Funktionen f , d.h. die Menge aller (x, y) ∈ R2 , f¨ ur welche f (x, y) definiert ist. Stellen Sie D als Teilmenge der Ebene graphisch dar. √ 1 √ a) f (x, y) = xy, b) f (x, y) = arcsin(x + y), c) f (x, y) = , d) f (x, y) = y − x. 2 ln(x − y) 22−2 Gegeben ist die lineare Funktion f (x, y) = 4 − x − 2y. a) Zeichnen Sie die Niveaulinien f¨ ur z = const = −4, −2, 0, 2, 4. b) Stellen Sie den Graphen von f in einem r¨ aumlichen Koordinatensystem dar. x2 + y 2 , (x > 0). 2x a) Zeichnen Sie die Niveaulinien f¨ ur die Niveaus c = 1 und c = 2. b) Was geschieht f¨ ur c = 0? 1 . 22−4 Es sei f (x, y) = 2 x −y a) Zeichnen Sie in der x-y–Ebene alle Punkte ein, f¨ ur welche f nicht definiert ist. b) Zeichnen Sie die Niveaulinien f¨ ur die Niveaus c = ± 12 , ±1, ±2. 22−3 Es sei f (x, y) =
22−5 Es sei f (x, y) =
x2 − 1 . y2 + 1
a) Zeichnen Sie die Niveaulinien f¨ ur die Niveaus c = 0, ± 12 , ±1. b) Wie h¨ angt die Art der Niveaulinien von c ab? 1 22−6 Es sei f (x, y) = x2 + , (y > 0). y a) Bestimmen Sie die partiellen Funktionen f¨ ur x = −1, 0, 1 und f¨ ur y = 1, 2, 3. b) Zeichnen Sie eine r¨ aumliche Skizze. 22−7 Es sei f (x, y) = x2 + 4y 2 . a) Zeichnen Sie die Niveaulinien f¨ ur die Niveaus c = 0, 1, 4. b) Bestimmen Sie die partiellen Funktionen f¨ ur x = 0, 1, 2 und y = 0, 1, 2. 22−8 Es sei f (x, y) = e−x (1 + y) mit 0 ≤ x ≤ 1 und 0 ≤ y ≤ 1. a) Bestimmen Sie die partiellen Funktionen f¨ ur x = 0, 12 , 1 und y = 0, b) Zeichnen Sie eine r¨ aumliche Skizze.
1 , 2
1.
22−9 Gegeben sind die Punkte A(−1, 0) und B(1, 0). Die Funktion f : R2 → R wird dadurch definiert, dass jedem Punkt P (x, y) die Summe der Quadrate der Abst¨ ande AP bzw. BP zugeordnet wird. Was bedeuten in diesem Fall die Niveaulinien? Wie sehen sie aus?
349
23. DIFFERENTIALRECHNUNG VON FUNKTIONEN VON MEHREREN VARIABLEN ¨ (23.1) Uberblick Der wichtigste Begriff in diesem Kapitel ist jener der partiellen Ableitung einer Funktion von mehreren Variablen. Diese wird mit ∂f = fx , ∂x
bzw.
∂f = fy ∂y
(23.2)
etc.
bezeichnet und dadurch erhalten, dass man alle Variablen ausser x (bzw. y) festh¨ alt und die so entstandene partielle Funktion als Funktion einer Variablen nach x (bzw. nach y) ableitet. Geometrisch stellt die partielle Ableitung nach x (im Fall von zwei Variablen) die Steigung der Tangente an die Schnittkurve des Graphen von f mit einer Ebene parallel zur x-z–Ebene dar.
(23.3)
Man kann auch h¨ohere partielle Ableitungen bilden, wobei f¨ ur die “gemischten” partiellen Ableitungen unter vern¨ unftigen Voraussetzungen eine Vertauschbarkeitsbeziehung gilt, n¨amlich
(23.4)
fxy = fyx . ¨ Ahnlich wie im Fall einer Variablen kann man die partiellen Ableitungen zum Auffinden von relativen Extrema benutzen: Wenn f in einem inneren Punkt (x0 , y0 ) ein relatives Extremum hat (und wenn f dort partiell differenzierbar ist), dann muss gelten:
(23.5)
fx (x0 , y0 ) = fy (x0 , y0 ) = 0 . ¨ Die zweiten partiellen Ableitungen k¨ onnen zur Uberpr¨ ufung von Existenz und Art des Extremums verwendet werden. Als Anwendung behandeln wir die Methode der kleinsten Quadrate, die es erlaubt, eine Gerade an gegebene Punkte m¨oglichst gut anzupassen.
(23.7)
(23.2) Partielle Ableitungen a) Erste Beispiele Eine Funktion von mehreren Variablen kann nach jeder dieser Variablen einzeln abgeleitet werden. Auf diese Weise erh¨alt man die sogenannten partiellen Ableitungen
23. Differentialrechnung von Funktionen von mehreren Variablen
350
dieser Funktion. Wir illustrieren dies zun¨achst an Beispielen von Funktionen f (x, y) onnen wir durch Festhalten der einen bzw. der ass (22.6) k¨ von zwei Variablen. Gem¨ anderen Variablen zwei partielle Funktionen bilden: ϕ(x) = f (x, y0 ) ,
y0
konstant ,
ψ(y) = f (x0 , y) ,
x0
konstant .
Da nun ϕ und ψ Funktionen einer Variablen sind, k¨ onnen wir sie in der u ¨blichen Weise ableiten. Beispiele 1. f (x, y) = x3 + x2 y. ϕ(x) = f (x, y0 ) = x3 + x2 y0 (y0 konstant). ϕ (x) = 3x2 + 2xy0 . Beachten Sie, dass y0 beim Ableiten als konstanter Faktor zu behandeln ist, der erhalten bleibt. ψ(y) = f (x0 , y) = x30 + x20 y (x0 konstant). ψ (y) = x20 . Hier ist x30 ein konstanter Summand, der beim Differenzieren null wird. Ferner ist x20 ein konstanter Faktor, und die Ableitung von y (nach y) ist = 1. 2. f (x, y) = x sin y + y 2 cos x + y + 2. Analog zum Beispiel 1. erhalten wir ϕ(x) = f (x, y0 ) = x sin y0 + y02 cos x + y0 + 2. ϕ (x) = sin y0 − y02 sin x. ψ(y) = f (x0 , y) = x0 sin y + y 2 cos x0 + y + 2. ψ (y) = x0 cos y + 2y cos x0 + 1. Die additive Konstante 2 f¨allt hier jeweils weg.
Die so erhaltenen Ableitungen ϕ (x) bzw. ψ (y) heissen nun die partiellen Ableitungen von f nach x bzw. nach y. b) Allgemeine Definition und Bezeichnungen Die anschauliche Definition lautet in Worten (f¨ ur die pr¨azise Formulierung siehe d)): Die partielle Ableitung von f nach x ist die gew¨ ohnliche Ableitung der partiellen Funktion in Richtung x von f . Das Analoge gilt nat¨ urlich f¨ ur y und — falls mehr als zwei Variablen vorhanden sind — auch f¨ ur alle u ¨brigen Variablen.
23.2 Partielle Ableitungen
351
F¨ ur die partiellen Ableitungen sind verschiedene Bezeichnungen im Gebrauch. F¨ ur die partiellen Ableitungen an der Stelle x = x0 , y = y0 schreibt man ∂f (x0 , y0 ) ∂x ∂f (x0 , y0 ) ∂y
oder
fx (x0 , y0 ) ,
oder
fy (x0 , y0 ) .
Die runden ∂ sollen dabei andeuten, dass es sich um eine partielle und nicht um eine gew¨ ohnliche Ableitung handelt. c) Beispiele zur praktischen Berechnung Die Definition der partiellen Funktion bestand ja gerade darin, dass man alle Variablen bis auf eine einzige konstant setzte. Daraus ergibt sich folgende praktische Regel: Um die partielle Ableitung von f nach einer Variablen, z.B. nach x, zu berechnen, denkt man sich alle Variablen ausser x konstant und leitet dann mit den u ¨blichen Differentiationsregeln nach x ab. In den ersten Beispielen in a) haben wir der Verdeutlichung halber die konstant gehaltene “Variable” mit einem Index 0 gekennzeichnet. Dies tut man gew¨ohnlich nicht, sondern man denkt sich einfach diese Variablen als Konstante. Beispiele
x2 + y 2 . x 2x = . fx (x, y) = 2 2 2 2 x +y x + y2 2y y fy (x, y) = = . 2 2 2 2 x +y x + y2 Hier wurde die Kettenregel angewendet. Beachten Sie auch die Symmetrie in bezug auf x und y.
1. f (x, y) =
2. Die Variablen brauchen durchaus nicht immer x und y zu heissen. u2 v g(u, v) = . u + v2 (u + v 2 ) · 2uv − 1 · u2 v u2 v + 2uv 3 = . gu (u, v) = 2 2 (u + v ) (u + v 2 )2 (u + v 2 ) · u2 − 2v · u2 v u3 − u2 v 2 gv (u, v) = = . (u + v 2 )2 (u + v 2 )2 3. Und noch ein Beispiel mit drei Variablen: F (x, y, z) = xy + x3 y 2 z + 2z + 1. ∂F = y + 3x2 y 2 z. ∂x
23. Differentialrechnung von Funktionen von mehreren Variablen
352
∂F = x + 2x3 yz. ∂y ∂F = x3 y 2 + 2. ∂z d) Pr¨azisierungen zur Definition Nat¨ urlich braucht die partielle Ableitung (ebenso wie die gew¨ohnliche Ableitung) nicht unbedingt zu existieren. Wenn sie aber existiert, so sagt man, f sei partiell differenzierbar (nach der betreffenden Variablen). Die Funktion f (x, y) = x2 + y 2 aus dem Beispiel 1. von c) ist f¨ ur alle (x, y) ∈ R2 definiert. Dagegen existieren fx und fy an der Stelle (0, 0) nicht.
Bevor wir die allgemeinen Begriffe notieren, halten wir fest, dass die Ableitungen (im Sinne von (4.2)) der partiellen Funktionen ϕ(x) (bzw. ψ(y)) an der Stelle x0 (bzw. y0 ) auch direkt unter Verwendung der Funktion f geschrieben werden k¨ onnen. Wegen ϕ(x) = f (x, y0 ) ist ja fx (x0 , y0 ) = ϕ (x0 ) = lim
x→x0
ϕ(x) − ϕ(x0 ) f (x, y0 ) − f (x0 , y0 ) = lim x→x0 x − x0 x − x0
und analog f¨ ur fy (x0 , y0 ) = ψ (y0 ). Dies wird im Punkt 1) der folgenden Definition benutzt. Wir fassen nun alles bisher Besprochene (f¨ ur den Fall zweier Variablen) nochmals zusammen (vgl. (4.2) f¨ ur den Fall einer Variablen). Es sei f : D(f ) → R eine Funktion von zwei Variablen und es sei (x0 , y0 ) ∈ D(f ). 1) Die Funktion f heisst an der Stelle (x0 , y0 ) nach x bzw. nach y partiell differenzierbar, wenn die Grenzwerte lim
x→x0
f (x, y0 ) − f (x0 , y0 ) x − x0
bzw. lim
y→y0
f (x0 , y) − f (x0 , y0 ) y − y0
existieren. Diese Grenzwerte heissen dann die partiellen Ableitungen von f nach x (bzw. nach y) an der Stelle (x0 , y0 ). 2) Wenn f in (x0 , y0 ) sowohl nach x wie auch nach y partiell differenzierbar ist, so sagt man einfach, f sei dort partiell differenzierbar. 3) Wenn f f¨ ur jedes (x0 , y0 ) aus einer Teilmenge X von D(f ) partiell differenzierbar ist, so sagt man, f sei auf X partiell differenzierbar. 4) Wenn f f¨ ur jedes (x0 , y0 ) ∈ D(f ) partiell differenzierbar ist, so sagt man, f sei partiell differenzierbar.
353
23.3 Geometrische Interpretation der partiellen Ableitungen
Weiter sehen wir, dass durch (x, y) → fx (x, y)
und
(x, y) → fy (x, y)
onnen also die partiellen Ableitungen zwei neue Funktionen definiert werden. Wir k¨ selbst auch als Funktionen von zwei Variablen auffassen. Ihr Definitionsbereich besteht aus allen Punkten (x, y), in denen die betreffende partielle Ableitung existiert. Schliesslich sei noch erw¨ahnt, dass sich die obigen Begriffsbildungen in offensichtli¨bertragen. cher Weise auf Funktionen von mehr als zwei Variablen u
(23.3) Geometrische Interpretation der partiellen Ableitungen In (22.7) haben wir die partielle Funktion ϕ(x) (im Falle von zwei Variablen) geometrisch interpretiert: Ihr Graph ist die Schnittkurve des Graphen von f mit der Ebene E, welche durch (x0 , y0 ) geht und parallel zur x-z–Ebene ist. Nun ist aber ϕ (x0 ) geometrisch betrachtet nichts anderes als die Steigung der Tangente an den Graphen von ϕ (an der Stelle x0 ). Es folgt wegen fx (x0 , y0 ) = ϕ (x0 ): Die partielle Ableitung von f nach x in (x0 , y0 ) ist die Steigung der Schnittkurve des Graphen von f mit der Ebene E (parallel zur x-z–Ebene durch (x0 , y0 )) an der Stelle (x0 , y0 ). Entsprechendes gilt f¨ ur fy (x0 , y0 ). Die folgende Figur illustriert den Sachverhalt. z
Tangente Graph von ϕ ψ
Tangente Graph von ψ
x
(x0 , y0 ) E
y
F¨ ur mehr als zwei Variablen versagt nat¨ urlich die geometrische Vorstellung!
23. Differentialrechnung von Funktionen von mehreren Variablen
354
(23.4) H¨ohere partielle Ableitungen Es sei f auf D partiell differenzierbar. Dann k¨onnen wir, wie schon erw¨ ahnt, die partiellen Ableitungen als Funktionen betrachten: fx : D → R ,
fy : D → R .
Diese Funktionen k¨onnen nun wieder partiell differenzierbar sein, d.h., wir k¨onnen sie nach x bzw. nach y ableiten. Es gibt die folgenden M¨oglichkeiten: ∂2f (x, y) , • fx nach x ableiten: Ergebnis fxx (x, y) oder ∂x2 ∂2f (x, y) . • fx nach y ableiten: Ergebnis fxy (x, y) oder ∂y∂x ∂2f (x, y) , • fy nach x ableiten: Ergebnis fyx (x, y) oder ∂x∂y ∂2f (x, y) . • fy nach y ableiten: Ergebnis fyy (x, y) oder ∂y 2 Die erhaltenen Gr¨ossen heissen nat¨ urlich die zweiten partiellen Ableitungen von f . Ganz entsprechend geht man f¨ ur Funktionen von mehr als zwei Variablen vor. Wir wiederholen die eingef¨ uhrten Bezeichnungen: ∂2f • f zweimal nach x abgeleitet: fxx = . ∂x2 ∂2f . • f zuerst nach x, dann nach y abgeleitet: fxy = ∂y∂x Im zweiten Fall ist die Reihenfolge von x und y unterschiedlich. Wie wir aber weiter unten sehen werden, spielt dies in den meisten F¨ allen keine Rolle. Dieser Prozess l¨asst sich (entsprechende Differenzierbarkeit vorausgesetzt) weiter fortf¨ uhren: So kann man etwa fxx nach x oder nach y partiell differenzieren usw. und erh¨ alt so partielle Ableitungen 3. und (allgemein) h¨oherer Ordnung: fxxx =
∂3f , ∂x3
fxxy =
∂3f ∂y∂ 2 x
Beispiele 1. f (x, y) = x3 y + xey . 2 partielle Ableitungen 1. Ordnung: fx (x, y) = 3x2 y + ey
fy (x, y) = x3 + xey .
4 partielle Ableitungen 2. Ordnung: fxx (x, y) = 6xy fyx (x, y) = 3x2 + ey
fxy (x, y) = 3x2 + ey fyy (x, y) = xey .
etc. .
23.4 H¨ ohere partielle Ableitungen
355
8 partielle Ableitungen 3. Ordnung: fxxx (x, y) = 6y fxxy (x, y) = 6x fyxx (x, y) = 6x fyxy (x, y) = ey
fxyx (x, y) = 6x fxyy (x, y) = ey fyyx (x, y) = ey fyyy (x, y) = xey .
2 3 2
2. f (x, y, z) = x + yz + x y z . 3 partielle Ableitungen 1. Ordnung (wir lassen das Argument (x, y, z) einfachheitshalber weg): fx = 1 + 2xy 3 z 2 fz = y + 2x2 y 3 z . fy = z + 3x2 y 2 z 2 9 partielle Ableitungen 2. Ordnung: fxx = 2y 3 z 2 fyx = 6xy 2 z 2 fzx = 4xy 3 z
fxy = 6xy 2 z 2 fyy = 6x2 yz 2 fzy = 1 + 6x2 y 2 z
fxz = 4xy 3 z fyz = 1 + 6x2 y 2 z fzz = 2x2 y 3 .
27 partielle Ableitungen 3. Ordnung, davon nur zwei Beispiele: fxyz = 12xy 2 z
fzxy = 12xy 2 z .
Man sieht, dass in diesen Beispielen die Reihenfolge der partiellen Ableitungen vertauscht werden darf. So ist z.B. fyx = fxy (in beiden Beispielen) , fxz = fzx , fyz = fzy (Beispiel 2.) , fxxy = fxyx = fyxx (Beispiel 1.) , fxyz = fzxy (Beispiel 2.). Dieses Ergebnis ist auf den ersten Blick gar nicht etwa selbstverst¨andlich und auch ur welche in gewissen Punkten gar nicht immer richtig! In der Tat gibt es Funktionen, f¨ gilt: fxy (x0 , y0 ) = fyx (x0 , y0 ). Wir verzichten auf Beispiele. ur dessen nicht ganz F¨ ur die Praxis wichtig ist aber das folgende positive Resultat, f¨ einfachen Beweis auf die Lehrb¨ ucher der Differential- und Integralrechnung verwiesen sei: Hat eine Funktion f von mehreren Variablen partielle Ableitungen von k–ter Ordnung und sind diese alle stetig (im Sinne von (22.8)), so ist bei den partiellen Ableitungen bis und mit k–ter Ordnung die Reihenfolge der Differentiationen vertauschbar. Der wichtigste Spezialfall hievon lautet: Es sei f (x, y) eine Funktion von zwei Variablen. Sind die 2. partiellen Ableitungen fxy (x, y) und fyx (x, y) beide stetig, so ist fxy = fyx .
23. Differentialrechnung von Funktionen von mehreren Variablen
356
(23.5) Extrema von Funktionen von zwei Variablen a) Vorbereitungen Genau wie bei Funktionen von einer Variablen kann man auch bei Funktionen von zwei Ver¨ anderlichen nach Extrema fragen. Zur exakten Formulierung der Ergebnisse ben¨otigen wir die Begriffe der ε-Umgebung und des inneren Punktes, die schon im Falle einer Variablen eine Rolle spielten (vgl. (6.2)). Unter einer ε-Umgebung Uε (x0 , y0 ) (ε > 0) versteht man die Menge aller Punkte (x, y), deren Abstand von (x0 , y0 ) < ε ist: Uε (x0 , y0 ) = {(x, y) | d((x, y), (x0 , y0 )) < ε} . Der Abstand d ist bereits in (22.8) definiert worden: d((x, y), (x0 , y0 )) =
(x − x0 )2 + (y − y0 )2 .
Eine solche ε-Umgebung ist also eine offene Kreisscheibe vom Radius ε. (“Offen” bedeutet, dass der Rand der Kreisscheibe nicht zur Umgebung geh¨ ort.) Wenn D eine Teilmenge von R2 ist, so sagt man, ein Punkt (x0 , y0 ) ∈ D sei ein innerer Punkt von D, wenn es eine (wenn auch noch so kleine) ε-Umgebung von (x0 , y0 ) gibt, welche ganz in D enthalten ist (vgl. auch (6.2)). Die anderen Punkte von D heissen Randpunkte von D.
innerer Punkt D Randpunkt
Die nachstehende Definition der verschiedenen Arten von Extrema (vgl. (6.5)) ist eigentlich selbstverst¨ andlich. Wir geben sie aber der Vollst¨andigkeit halber an. Die Funktion f : D(f ) → R hat an der Stelle (x0 , y0 ) ein absolutes Maximum, wenn gilt: f (x0 , y0 ) ≥ f (x, y) f¨ ur alle (x, y) ∈ D(f ) . Das absolute Minimum wird entsprechend definiert. Maxima und Minima fasst man unter dem Begriff Extrema zusammen. Die Funktion f hat an der Stelle (x0 , y0 ) ein relatives Maximum, wenn es eine εUmgebung Uε (x0 , y0 ) gibt mit f (x0 , y0 ) ≥ f (x, y)
f¨ ur alle
(x, y) ∈ D(f ) ∩ Uε (x0 , y0 ) .
Relatives Minimum bzw. relatives Extremum werden sinngem¨ ass definiert.
357
23.5 Extrema von Funktionen von zwei Variablen
b) Wie bestimmt man Extrema? In Analogie zum Fall einer Variablen (6.5) gilt die folgende notwendige Bedingung: Es sei (x0 , y0 ) ein innerer Punkt von D(f ) und f sei an dieser Stelle partiell differenzierbar. Wenn f in (x0 , y0 ) ein relatives Extremum hat, dann gilt fx (x0 , y0 ) = 0 ,
fy (x0 , y0 ) = 0 .
Wir geben eine anschauliche Begr¨ undung f¨ ur den Fall eines relativen Maximums: z
ϕ
y0 y x
(x0 , y0 )
Wenn f an der Stelle (x0 , y0 ) ein relatives Maximum hat, so hat die partielle Funktion ϕ(x) = f (x0 , y0 ) an der Stelle x0 ebenfalls ein relatives Maximum. Aufgrund der notwendigen Bedingung von (6.5.d)) f¨ ur Funktionen einer Variablen muss dann ϕ (x0 ) = 0 sein. Nun ist aber ϕ (x0 ) = fx (x0 , y0 ) (vgl. (23.2.d)), woraus die Bedingung fx (x0 , y0 ) = 0 bereits folgt. Die zweite Bedingung fy (x0 , y0 ) = 0 wird ganz analog bewiesen. F¨ ur die Bedingung von (6.5.d)) wird wesentlich vorausgesetzt, dass x0 ein innerer Punkt von D(ϕ) ist. Diese Bedingung ist aber ass ein innerer Punkt erf¨ ullt, denn (x0 , y0 ) ist voraussetzungsgem¨ von D(f ), vgl. Skizze.
y D(f ) D(ϕ)
Wir k¨ onnen auch ein Analogon zur Zusammenfassung von (6.5.d)) geben:
x
23. Differentialrechnung von Funktionen von mehreren Variablen
358
Ein relatives Extremum (wenn es u ¨berhaupt existiert) tritt an einer der folgenden Stellen auf: 1. Innere Punkte (x0 , y0 ) mit fx (x0 , y0 ) = fy (x0 , y0 ) = 0, 2. Randpunkte von D(f ), 3. Stellen, wo f nicht partiell differenzierbar ist. Unter diesen m¨oglichen Kandidaten f¨ ur Extrema ermittelt man dann durch Vergleich die absoluten Maxima bzw. Minima, sofern solche vorhanden sind. Wir m¨ ussen aber bei den absoluten Extrema mit Definitionsbereich im R2 eine Warnung aussprechen, weil im Gegensatz zu R im R2 eine Problematik dazukommt. Wir illustrieren dies an folgender anschaulichen Situation, illustriert am Minimum, Maximum analog: Wenn eine Funktion einer Variablen f (x) nur eine Stelle x0 besitzt mit f (x0 ) = 0 und dort ein lokales Minimum ist, dann ist es auch ein absolutes Minimum (zum Beispiel x2 ). Dies gilt aber im R2 nicht! Die gr¨ ossere Freiheit der zwei Dimensionen des Definitionsbereichs erlaubt es, Funktionen f (x, y) zu konstruieren, welche nur eine einzige Stelle (x0 , y0 ) mit fx (x0 , y0 ) = fy (x0 , y0 ) = 0 haben, diese ist auch ein lokales Minimum - aber es ist kein absolutes Minimum. Das nachfolgende Beispiel zeugt davon: f (x, y) = e3x + y 3 − 3yex . Der einzige Punkt mit fx (x0 , y0 ) = fy (x0 , y0 ) = 0 ist (0, 1), und mit Methoden, die gleich folgen, kann man zeigen, dass dort ein relatives Minimum ist. Aber f (0, −3) = −17 < f (0, 1) = −1. Es gibt also Orte mit kleineren Funktionswerten.
z y
x
Das heisst f¨ ur die Praxis: in einer Dimension konnten wir - dank der Differentialrechnung - die Form der Funktion so verstehen, dass wir einfach entscheiden konnten, ob ein relatives Extremum auch absolutes Extremum ist. Besteht der Definitionsbereich aus zwei Dimensionen, so lehrt uns obiges Gegenbeispiel, dass man nicht einfach von den relativen Extrema auf die absoluten schliessen kann. Im Rahmen dieses Buches kann dies nicht tiefer behandelt werden. Wir argumentieren in den nachfolgenden Beispielen wo n¨ otig und m¨ oglich mit der Anschauung. Ein fundamentales Resultat aus der Mathematik ist jedoch derart leistungsf¨ahig, dass wir es ohne Beweis hier auff¨ uhren wollen. In einer Dimension haben wir es bereits in (6.5.c) kennengelernt: Wenn der Definitionsbereich I ein abgeschlossenes Intervall und wenn f : I → R stetig ist (dazu reicht Differenzierbarkeit), dann hat f in I (mindestens) ein absolutes Maximum und ein absolutes Minimum. In zwei Dimensionen gilt analog f¨ ur stetige Funktionen beispielsweise bei den h¨aufigen Definitionsbereichen D(f ) = {(x, y) | x2 + y 2 ≤ r2 } oder D(f ) = {(x, y) | a ≤ x ≤ b, c ≤ y ≤ d}, dass diese (mindestens) ein absolutes Maximum
359
23.5 Extrema von Funktionen von zwei Variablen
und ein absolutes Minimum annehmen. Allgemein reicht es, wenn der Definitionsbereich zusammenh¨angt, nur endlich ausgedehnt ist und der Rand dazugeh¨ort (vgl. Beispiel 4 mit der Wanne in (23.6)). c) Wie bestimmt man die Art des Extremums? Schon im Falle einer Variablen ist das Verschwinden der Ableitung keine hinreichende Bedingung f¨ ur ein Extremum. Man wird deshalb erwarten, dass dies im Falle zweier Ver¨ anderlicher nicht anders ist. Wir untersuchen dazu einige Beispiele (vgl. (22.4.b)): Beispiele z 1. f (x, y) = x2 + y 2 , D(f ) = R2 . Hier ist fx (x, y) = 2x, fy (x, y) = 2y. Wann sind die beiden partiellen Ableitungen gleichzeitig = 0? Es muss gelten: 2x0 = 0, 2y0 = 0. Wir finden als einzige L¨osung: (x0 , y0 ) = (0, 0).
y
x
Der Skizze entnimmt man, dass dieser Punkt ein relatives und sogar ein absolutes Minimum liefert. Dagegen hat diese Funktion auf ihrem Definitionsbereich R2 kein absolutes Maximum, denn f (x, y) nimmt beliebig grosse Werte an. z 2. f (x, y) = 1 − x2 − y 2 , D(f ) = {(x, y) | x2 + y 2 ≤ 1}. x Es ist fx (x, y) = − , 1 − x2 − y 2 y . fy (x, y) = − 1 − x2 − y 2 Die partiellen Ableitungen werden nur im Nullpunkt (x0 , y0 ) = (0, 0) gleichzeitig = 0.
y
x
Die Betrachtung des Graphen ergibt, dass an dieser Stelle ein Maximum (relativ und absolut) vorliegt. Am Rande von D(f ), d.h. f¨ ur alle (x, y) mit x2 + y 2 = 1, hat f dagegen u ¨berall ein absolutes Minimum. Die Untersuchung der partiellen Ableitungen kann uns diese Minima gleich aus zwei Gr¨ unden nicht liefern: – Es handelt sich nicht um innere, sondern um Randpunkte. – f ist an diesen Stellen gar nicht partiell differenzierbar (die Nenner werden 0).
23. Differentialrechnung von Funktionen von mehreren Variablen
360
3. f (x, y) = xy, D(f ) = R2 .
z
y Hier ist fx (x, y) = y, fy (x, y) = x, und erneut ist der Punkt (0, 0) der einzige Punkt, x wo beide partiellen Ableitungen = 0 sind. Die Skizze zeigt aber, dass f dort weder ein relatives Maximum noch ein relatives Minimum hat. (Man nennt einen solchen Punkt einen Sattelpunkt. In einer Landschaft entspricht er einer Passh¨ ohe.) Auf R2 hat f weder ein absolutes Maximum noch ein absolutes Minimum. Schr¨ ankt man aber zum Beispiel den Definitionsbereich auf die Menge {(x, y) | x ≥ 0, y ≥ 0} ein, so nimmt f in jedem amlich 0 an. Punkt (x0 , y0 ) mit x0 = 0 oder y0 = 0 sein absolutes Minimum, n¨
Gelegentlich l¨ asst sich die Art eines Extremums auch dadurch ermitteln, dass man zum vornherein weiss, dass ein Maximum oder ein Minimum auftreten muss. ¨ Ahnlich wie im Fall einer Variablen (6.5.e)) kann man aber auch die zweiten (partiellen) Ableitungen heranziehen, um den Charakter eines Extremums zu untersuchen. Man setzt dazu voraus, dass diese zweiten partiellen Ableitungen, also fxx , fyy , fyx , fxy existieren und stetig sind. Insbesondere ist dann fxy = fyx (23.4). Nun gilt der folgende, ohne Beweis angegebene Sachverhalt: • Voraussetzungen: • • •
(x0 , y0 ) sei innerer Punkt von D(f ), fx (x0 , y0 ) = fy (x0 , y0 ) = 0, die 2. partiellen Ableitungen von f existieren und sind stetig.
• Bezeichnung: Wir definieren die Zahl A durch A = A(x0 , y0 ) = fxx (x0 , y0 ) · fyy (x0 , y0 ) − [fxy (x0 , y0 )]2 . • Behauptung: 1. Ist A > 0, so hat f in (x0 , y0 ) ein relatives Extremum und zwar liegt • f¨ ur fxx (x0 , y0 ) < 0 ein relatives Maximum vor, • f¨ ur fxx (x0 , y0 ) > 0 ein relatives Minimum vor. 2. Ist A < 0, so hat f in (x0 , y0 ) kein relatives Extremum. 3. Ist A = 0, so kann auf diesem Wege keine Entscheidung gef¨ allt werden. Die “Bevorzugung” von fxx (x0 , y0 ) in 1. ist nur scheinbar. Wenn A > 0 ist, dann m¨ ussen n¨ amlich fxx (x0 , y0 ) und fyy (x0 , y0 ) gleiches Vorzeichen haben. F¨ ur einen Beweis des oben genannten Kriteriums sei auf die Lehrb¨ ucher der Differential- und Integralrechnung verwiesen.
23.6 Beispiele zur Bestimmung von Extrema
361
Beispiele 4. Im Beispiel 1. oben ist fxx (0, 0) = fyy (0, 0) = 2 und fxy (0, 0) = 0. Es folgt A = 4 > 0 und fxx (0, 0) > 0. Somit muss ein Minimum vorliegen, was wir schon wussten. 5. Im Beispiel 3. oben ist fxx (0, 0) = fyy (0, 0) = 0 und fxy (0, 0) = 1. Es folgt A = −1 < 0: f hat in (0, 0) — wie bekannt — kein Extremum. Beachten Sie, dass im Fall, wo A < 0 ist, mit Bestimmtheit ausgesagt werden kann, dass f in (x0 , y0 ) kein relatives Extremum hat. Im Fall einer Variablen kann eine solche Behauptung durch blosse Untersuchung der 2. Ableitung nie gemacht werden. Wenn Sie das obige Kriterium mit jenem von (6.5.e)) f¨ ur Funktionen, z.B. f , einer Variablen vergleichen wollen, so m¨ ussen Sie beachten, dass der Ausdruck A nicht das Analogon der 2. Ableitung f (x0 ) ist. Vielmehr entspricht A der Gr¨ osse (f (x0 ))2 . Diese Zahl ist (im Gegensatz zu A) stets ≥ 0. Ist f (x0 ) = 0, so ist sogar f (x0 )2 > 0, was dem obigen Fall 1. (A > 0) entspricht. Hier liegt sowohl f¨ ur eine Variable als auch f¨ ur zwei Variablen ein relatives Extremum vor, und das Vorzeichen der 2. Ableitung entscheidet dar¨ uber, ob es sich um ein Maximum oder Minimum handelt. Eine dem Fall 2. (A < 0) entsprechende Situation kommt — wie eben erw¨ ahnt — f¨ ur eine Variable nicht vor. Der Fall 3. (A = 0) schliesslich entspricht der Beziehung f (x0 ) = 0, und sowohl f¨ ur eine Variable wie f¨ ur zwei Variablen ist hier keine Entscheidung m¨ oglich. ¨ Zum Schluss dieses Abschnitts sei noch erw¨ ahnt, dass die obigen Uberlegungen auch f¨ ur Funktionen von drei und mehr Variablen durchgef¨ uhrt werden k¨ onnen. S¨ amtliche Begriffe wie innerer Punkt, absolutes und relatives Extremum etc. u ¨ bertragen sich sinngem¨ ass. Dies gilt auch f¨ ur das am Schluss von (23.5.b) genannte Kriterium; insbesondere sind jene Punkte, in denen alle partiellen Ableitungen den Wert Null annehmen, Kandidaten f¨ ur ein relatives Extremum. Auch die in (23.5.c) erw¨ ahnte Gr¨ osse A, die es erlaubt, die Kandidaten n¨ aher zu pr¨ ufen, hat ein — wenn auch relativ kompliziertes — Analogon f¨ ur Funktionen von mehr als zwei Variablen.
(23.6) Beispiele zur Bestimmung von Extrema 1. Gesucht seien die relativen Extrema der Funktion f : R2 → R, gegeben durch f (x, y) = 3x2 − 2xy + y 2 + 2x − 6y + 1 . Der Definitionsbereich R2 hat keine Randpunkte. Ferner ist f u ¨berall partiell differenzierbar. Somit m¨ ussen die relativen Extrema (falls sie u ¨berhaupt existieren) in jenen Punkten angenommen werden, f¨ ur welche fx (x0 , y0 ) = fy (x0 , y0 ) = 0 gilt. Wir berechnen also zuerst diese partiellen Ableitungen und finden fx (x, y) = 6x − 2y + 2 , fy (x, y) = −2x + 2y − 6 .
362
23. Differentialrechnung von Funktionen von mehreren Variablen
Wir setzen diese partiellen Ableitungen gleich Null und erhalten ein lineares Gleichungssystem f¨ ur zwei Unbekannte: 6x − 2y + 2 = 0 , −2x + 2y − 6 = 0 . osung Dieses l¨ost man mit bekannten Methoden und erh¨alt als L¨ x = 1,
y=4.
Damit ist der “kritische Punkt” (x0 , y0 ) bestimmt: (x0 , y0 ) = (1, 4) . Um nachzupr¨ ¨berhaupt ein Extremum (und wenn ja, von welcher ufen, ob dort u Art) vorliegt, brauchen wir die zweiten partiellen Ableitungen: fxx (x, y) = 6 ,
fxy (x, y) = −2 ,
fyy (x, y) = 2 .
Die in (23.5.c) angegebene Gr¨osse A(x0 , y0 ) berechnet sich zu A(1, 4) = 6 · 2 − (−2)2 = 8 > 0. Damit besitzt A ein relatives Extremum im Punkt (1, 4) und wegen fxx (1, 4) = 6 > 0 handelt es sich um ein relatives Minimum. Da die 2. partiellen Ableitungen konstant sind, h¨ angt A hier nicht vom Punkt (x0 , y0 ) ab. Im allgemeinen wird dies nicht so sein (vgl. Beispiel 2.).
2. Hier untersuchen wir die Funktion g : R2 → R, gegeben durch g(x, y) = x3 − 6xy + y 3 . Wir berechnen gleich alle ben¨ otigten partiellen Ableitungen: gx (x, y) = 3x2 − 6y, gy (x, y) = −6x + 3y 2 , gxx (x, y) = 6x, gxy (x, y) = −6, gyy (x, y) = 6y . Um die kritischen Punkte zu bestimmen, setzen wir gx und gy gleich Null: 3x2 − 6y = 0 −6x + 3y 2 = 0 . Der ersten Gleichung entnimmt man, dass y = 21 x2 ist. Setzt man dies in die zweite Gleichung ein, so folgt 3 3 −6x + x4 = x( x3 − 6) = 0 . 4 4
23.6 Beispiele zur Bestimmung von Extrema
363
√ Daraus ergeben sich sofort die zwei L¨osungen x1 = 0, x2 = 3 8 = 2. Die zugeh¨oriur Extrema gen y–Werte sind y1 = 0, y2 = 2. Damit haben wir zwei Kandidaten f¨ gefunden: (x1 , y1 ) = (0, 0) und (x2 , y2 ) = (2, 2) . Es ist nicht verwunderlich, dass x1 = y1 und x2 = y2 ist, denn die Funktion g ist symmetrisch in x und y.
F¨ ur den Ausdruck A erhalten wir A(x, y) = fxx (x, y)fyy (x, y) − [fxy (x, y)]2 = 36xy − 36 . Es folgt A(0, 0) = −36 < 0 ,
A(2, 2) = 108 > 0 .
Im Punkt (0, 0) hat g also kein relatives Extremum, wohl aber im Punkt (2, 2). Wegen gxx (2, 2) = 12 > 0 liegt im Punkt (2, 2) ein relatives Minimum vor. Randpunkte sind keine vorhanden, ebensowenig Stellen, wo g nicht partiell differenzierbar ist. 3. Zu konstruieren sei eine oben offene Schachtel mit gegebenem Rauminhalt V . Die Kantenl¨ angen x, y, z seien so zu bestimmen, dass die Oberfl¨ ache (und damit der Materialverbrauch) minimal wird. F¨ ur die Oberfl¨ ache gilt y
z
x
F (x, y, z) = xy + 2xz + 2yz . In Wirklichkeit handelt es sich aber nicht um eine Funktion von drei Variablen. Wegen V = xyz sind nur zwei Gr¨ossen x, y, z frei w¨ahlbar. Deshalb m¨ ussen wir eine dieser drei Gr¨ ossen eliminieren: Wir setzen etwa z=
V xy
in F ein und erhalten F (x, y) = xy +
2V 2V + . y x
Wegen xyz = V = 0 muss x > 0 und y > 0 sein. Der f¨ ur die Aufgabe sinnvolle Definitionsbereich von F , d.h. die Menge {(x, y) | x > 0, y > 0}, hat also keine Randpunkte. Nun bilden wir die partiellen Ableitungen und setzen sie gleich Null: Fx (x, y) = y −
2V x2
Fy (x, y) = x −
2V . y2
23. Differentialrechnung von Funktionen von mehreren Variablen
364
Zu l¨ osen ist das folgende Gleichungssystem: 2V =0 x2 2V x− 2 =0 y y−
2V x2 2V x= 2 y y=
oder
4V 2 Aus der ersten Gleichung folgt y 2 = 4 . Setzen wir dies in die zweite ein, so x erhalten wir x4 x4 x = 2V oder x = . 2 4V 2V Wegen der Bedingung xyz = V (= 0) ist sicher x = 0. Wir d¨ urfen durch x dividieren und finden so √ x3 3 1= oder x = 2V . 2V 2V Setzen wir dies in die Beziehung y = 2 ein, so folgt mit etwas Potenzrechnung x √ √ y = 3 2V (also y = x), und wegen xyz = V erh¨ alt man schliesslich noch z = 12 3 2V . Der einzige Punkt (x0 , y0 ), wo beide partiellen Ableitungen verschwinden, ist also gegeben durch √ 3 x0 = y0 = 2V . Es fehlt uns jetzt leider die notwendige Theorie, um mathematisch sauber zu begr¨ unden, dass dies das globale Minimum ist (was es in der Tat ist). Nur dank Anschauung folgern wir, dass die Aufgabe eine L¨osung hat, dass ein Minimum existiert, und wir schliessen, dass der fragliche Punkt wirklich das Minimum ergibt: √ 1√ 3 3 x0 = y0 = 2V , z0 = 2V . 2 Wir k¨ onnen aber mathematisch sauber zumindest zeigen, dass obiger Punkt ein ¨ relatives Minimum ist. Dies machen wir noch zur Ubung und ziehen dazu auch die zweiten Ableitungen gem¨ass (23.5.c) zu Rate: Es ist 4V 4V , Fyy (x, y) = 3 , x3 y √ Einsetzen von x0 = y0 = 3 2V ergibt Fxx (x, y) =
A=2·2−1=3>0
und
Fxy (x, y) = 1 .
Fxx (x0 , y0 ) > 0 .
Damit ist mathematisch sauber gezeigt, dass es zumindest ein relatives Minimum ist. 4. Zum Schluss betrachten wir noch ein etwas aufwendigeres Beispiel.
23.6 Beispiele zur Bestimmung von Extrema
365
Aus einem rechteckigen Blechst¨ ange b soll durch (symuck der Breite a und der L¨ angsstreifen und anschliessendes Anf¨ ugen von metrisches) Aufbiegen von zwei L¨ Seitenw¨anden eine Wanne von maximalem Volumen hergestellt werden. Wie breit ussen die L¨angsstreifen sein, und in welchem Winkel (ϕ) sind sie auf(Breite x) m¨ zubiegen? ussen wir offensichtlich den Inhalt der Querschnittsfl¨ aUm die Aufgabe zu l¨osen, m¨ che F maximal machen. x
x
ϕ
x sin ϕ ϕ
a − 2x
x cos ϕ
Das gesuchte Fl¨ achenst¨ uck setzt sich aus einem Rechteck mit den Seiten a − 2x und x sin ϕ sowie zwei rechtwinkligen Dreiecken mit den Katheten x sin ϕ und x cos ϕ zusammen. Es folgt F = F (x, ϕ) = (a − 2x)x sin ϕ + x2 sin ϕ cos ϕ = ax sin ϕ − 2x2 sin ϕ + x2 sin ϕ cos ϕ . ϕ π/2 F¨ ur x und ϕ sind die folgenden Werte zul¨ assig: a π 0 0. Nun multiplizieren wir aus: (x2i − 2xi x + x2 ) (xi − x)2 = xi + x2 = x2i − 2x · nx + nx2 = x2i − 2x 1 2 1 2 2 xi xi = x2i − nx2 = x2i − n = xi − . n n
S=
23. Differentialrechnung von Funktionen von mehreren Variablen
374
Wegen S > 0 ist auch nS > 0, also (∗)
n
x2i −
xi
2
>0.
Daraus folgt A > 0: die Funktion F hat an der kritischen Stelle ein relatives Extremum, das wegen Faa (a, b) = 2 x2i > 0 (es k¨ onnen ja nicht alle xi = 0 sein) ein relatives Minimum ist (vgl. (23.5.c)). Nebenbei bemerkt zeigt (∗), dass der Nenner in den obenstehenden Formeln (3) und (5) stets = 0 ist.
(23.∞) Aufgaben Wir haben bereits darauf aufmerksam gemacht, dass bei Funktionen von R2 nach R nicht von relativen Extrema auf absolute geschlossen werden kann (siehe Gegenbeispiel bei (23.5)). Die ¨ nachfolgenden Aufgaben sind jetzt aber der Ubung halber so zu l¨ osen, als ob dieser Schluss immer richtig sei — er stimmt in diesen F¨ allen auch tats¨ achlich. 23−1 Berechnen Sie alle partiellen Ableitungen 1. Ordnung von x √ a) f (x, y) = xy 2 + x2 y + b) g(r, s) = ln(r 2 + rs + 1) y d) F (α, β) = α sin(α2 − β 2 ) c) h(u, v) = arctan u2 + v 2 x+y x e) G(r, s, t) = exp(r + st + r2 t3 ) f) F (x, y, z) = + z y+z 23−2 Berechnen Sie x2 y zy ∂2 b) Fxyz f¨ ur F (x, y, z) = cos(x2 + xy) + 2 (x, z = 0) a) ∂x∂y z x c) Alle partiellen Ableitungen 2. Ordnung von G(x, y) = x ln(xy 2 ). x + y2 d) Alle partiellen Ableitungen 2. Ordnung von H(x, y, z) = 2 . z +1 23−3 Berechnen Sie die folgenden Ausdr¨ ucke und vereinfachen Sie sie soweit als m¨ oglich. ur f (α, β) = sin α cos β. a) fα + fβ f¨ x2 + y 2 .
ur r(x, y) = b) rxx + ryy f¨
23−4 In der Differentialgleichung ∂C ∂2C = ∂t ∂x2 kommen partielle Ableitungen vor. Man spricht deshalb von einer partiellen Differentialgleichung. a) Welche Beziehung m¨ ussen die Zahlen a und b erf¨ ullen, damit C(x, t) = exp(ax + bt) eine L¨ osung der obigen Gleichung ist? x2 eine L¨ osung der obigen Gleichung ist. b) Bestimmen Sie c so, dass C(x, t) = t−1/2 exp − ct 23−5 Gegeben ist eine Funktion von zwei Variablen. Gesucht sind, wenn vorhanden, die relativen Extrema. Wo werden sie angenommen, welches ist der extremale Funktionswert? a) f : R2 → R, f (x, y) = 3x2 − 3xy + 2y 2 − 9x + 2y + 1. b) g : R2 → R, g(x, y) = x2 − 3xy + y 2 − x − y + 7.
375
23.∞ Aufgaben
ur 23−6 Dasselbe f¨ a) f (x, y) = x2 (y + 1) − 5xy + 6y + 1. b) f (x, y) = (6 − x − y)x2 y 3 (x > 0, y > 0). c) f (x, y) = x3 − xy + y 2 − 5y. 23−7 Die Wirkung W (x, t), die x Einheiten eines Medikaments t Stunden nach der Einnahme auf allen durch W (x, t) = (x2 a − x3 )t2 · e−t (0 < einen Patienten haben, wird in manchen F¨ x < a, t > 0) dargestellt. Bestimmen Sie die Dosis x und die Zeit t so, dass W (x, t) maximal ist. 23−8 Bestimmen Sie die Zahlen a, b, c so, dass deren Summe gleich 90 und deren Quadratsumme minimal ist. 23−9 Eine quaderf¨ ormige Pappschachtel hat einen St¨ ulpdeckel, dessen H¨ ohe h einen Viertel der Schachtelh¨ ohe z betr¨ agt. Das Volumen der Schachtel soll 6400 cm3 betragen. Bestimmen Sie die Dimensionen x, y, z der Schachtel so, dass der Kartonverbrauch minimal wird. Dabei ist die Kartondicke zu vernachl¨ assigen.
h z
x
y 23−10 Und noch eine Schachtel. Sie soll ein gegebenes Volumen V haben. a) Wir verschn¨ uren sie in der u ¨blichen Weise. F¨ ur welche Dimensionen x, y, z wird der Schnurverbrauch minimal? b) Wie sieht die Sache aus, wenn die Schnur f¨ ur den einen “Umlauf”, n¨ amlich parallel zu den Kanten x und z doppelt genommen wird? Der Schnurverbrauch f¨ ur den Knoten braucht nicht ber¨ ucksichtigt zu werden.
z y
x
23−11 Ein Quader mit Seitenfl¨ achen parallel zu den Ebenen x = 0, y = 0 und z = 0 hat eine Ecke im Nullpunkt. Die r¨ aumlich diagonal gegen¨ uberliegende Ecke P liegt auf der Ebene mit der Gleichung 6x + 3y + 2z = 6. Bestimmen Sie die Koordinaten von P so, dass der Quader maximales Volumen hat. 23−12 Zwei Raumkurven sind gegeben durch die Parameterdarstellungen ⎛
⎞ t ⎜ ⎟ r(t) = ⎝ 1 − t ⎠ 1 2
⎛ und
0
⎞
⎟ ⎜ s(u) = ⎝ 1 − u ⎠ u2
Bestimmen Sie den kleinsten Abstand der beiden Kurven (es gen¨ ugt, das Quadrat des Abstands zu minimieren!). 23−13 Welcher Punkt der Ebene mit der Gleichung 2x − y + 2z = 16 hat vom Nullpunkt den kleinsten Abstand? ache im Raum. Welcher Punkt 23−14 Der Graph der Funktion f (x, y) = 1 + 2x2 + y 2 ist eine Fl¨ dieser Fl¨ ache hat vom Punkt (6, 2, 0) minimalen Abstand? Wie gross ist dieser minimale Abstand? 23−15 Welcher Punkt der durch z = xy + 1 gegebenen Fl¨ ache hat vom Punkt (1,1,0) minimalen Abstand? Wie gross ist dieser?
376
23. Differentialrechnung von Funktionen von mehreren Variablen
23−16 Das skizzierte, aus einem Rechteck und einem gleichschenkligen Dreieck bestehende F¨ unfeck hat einen gegebenen Umfang U . Bestimmen Sie x, y und α so, dass sein Fl¨ acheninhalt maximal wird.
α y x
23−17 Berechnen Sie mit Hilfe der Methode der kleinsten Quadrate diejenige Gerade, welche die Punkte (xi , yi ) am besten approximiert. xi
0
2
4
6
8
10
yi
1.3
2.6
3.4
4.5
5.3
6.4
Welchen y–Wert w¨ urden Sie f¨ ur x = 12 erwarten? F¨ ur welchen x–Wert wird (ungef¨ ahr) der Wert y = 5 angenommen? oren. 23−18 Es wird vermutet, dass die folgenden Daten zu einer Exponentialfunktion Y = crx geh¨ xi
2
4
6
8
Yi
2
3.5
6
10
Bringen Sie die Gleichung durch Logarithmieren auf lineare Form ,und berechnen Sie die Koeffizienten der Regressionsgeraden sowie c und r. 23−19 Die folgende Tabelle enth¨ alt die Schweizerrekorde u ¨ber einige Laufdistanzen bei den Damen (Stand 31.07.2019). Distanz in m Laufzeit
100
400
1000
5000
10.95
50.52
2:31.51
14:59.28
Versuchen Sie, n¨ aherungsweise die Rekordzeiten u ¨ber 800 m und 1500 m zu berechnen.
377
24. DAS TOTALE DIFFERENTIAL ¨ (24.1) Uberblick In Kapitel 7 haben wir versucht, eine Funktion einer Variablen in der N¨ahe eines Punktes m¨ oglichst gut durch eine lineare Funktion zu approximieren. Dabei wurde der Graph durch die Tangente ersetzt. Hier wollen wir dasselbe im zweidimensionalen Fall tun. An die Stelle der Tangente tritt nun die Tangentialebene. ¨ Ahnlich wie in Kapitel 7 wird man auf den Begriff des Differentials
(24.2)
gef¨ uhrt, das hier genauer totales Differential heisst und durch
(24.3)
df = fx (x0 , y0 ) dx + fy (x0 , y0 ) dy gegeben ist. Es kann z.B. zur Untersuchung der Fehlerfortpflanzung verwendet werden. Im Gegensatz zum Fall einer Variablen ist hier das Differential df nicht immer eine “gute” Approximation des Funktionszuwachses Δf . Diese Tatsache f¨ uhrt dazu, den Begriff der totalen Differenzierbarkeit einzuf¨ uhren. Schliesslich erw¨ ahnen wir noch kurz den Zusammenhang mit Kurvenintegralen und Differentialformen, der in der Physik wichtig ist.
(24.4)
(24.5)
(24.7)
(24.2) Die Tangentialebene In (7.3) und (7.4) haben wir eine Funktion f einer Variablen in der Umgebung eines Punktes x0 linearisiert, d.h., wir haben sie durch die lineare Funktion
y p f
p(x) = f (x0 ) + f (x0 )(x − x0 ) approximiert. Geometrisch bedeutete dies, dass der Graph der Funktion durch die Tangente im Kurvenpunkt (x0 , f (x0 )) ersetzt wurde.
x x0
Wir stellen uns nun die Aufgabe, das analoge Problem f¨ ur Funktionen von zwei Variablen zu l¨osen. Gegeben ist also eine Funktion f von zwei Variablen und ein innerer Punkt (x0 , y0 ) ihres Definitionsbereichs. Gesucht ist eine lineare Funktion p von zwei Variablen, welche in der N¨ahe von (x0 , y0 ) eine (zun¨achst im anschaulichen Sinn) gute Approximation von f sein soll. Der Graph einer solchen linearen Funktion ist eine
378
24. Das totale Differential
Ebene (22.4), und man kann sich vorstellen, dass der Graph von p die Tangentialebene an den Graphen von f im Punkt P0 (x0 , y0 , z0 ) (mit z0 = (x0 , y0 )) sein wird. Dazu m¨ ussen wir uns zuerst u ¨berlegen, wie man die Tangentialebene u ¨berhaupt definieren kann. Anschaulich wird man sagen, dass die Tangentialebene eine Ebene ist, die den Graphen im Punkt P0 ber¨ uhrt, d.h. sich dort m¨ oglichst gut an diesen Graphen anschmiegt. Diese Idee kann nun in eine “mathematischere” Beschreibung verwandelt werden. Wir sagen, die Ebene E sei die Tangentialebene an den Graphen von f im Punkt P0 , wenn sie die folgende Eigenschaft hat: F¨ ur jede auf dem Graphen der Fl¨ache verlaufende und durch P0 gehende Kurve liegt die Kurventangente im Punkt P0 in der Ebene E. Zwei derartige Kurven haben wir schon oft angetroffen, n¨amlich die Graphen der ur festes y0 bzw. x0 . Aufgrund unserer obigen Definition partiellen Funktionen ϕ und ψ f¨ enth¨alt die Tangentialebene E sicher die Tangenten an die Graphen von ϕ und ψ. Diese Tatsache leuchtet auch geometrisch ein, wenn man die folgende Skizze betrachtet, wo die Richtungsvektoren u und v dieser Tangenten eingetragen sind, also die sogenannten Tangentialvektoren. Dabei ist nur die Richtung von u und v wichtig, auf die L¨ange dieser Vektoren kommt es nicht an. z P0 u
v
f ψ
ϕ
x0
y0 (x0 , y0 )
y
x Wie findet man nun die Gleichung dieser Tangentialebene? Zun¨achst muss sie sicher durch den Punkt P0 (x0 , y0 , z0 ) mit z0 = f (x0 , y0 ) gehen. Ferner enth¨alt sie, wie erw¨ ahnt, die Tangenten an die Graphen der partiellen Funktionen ϕ und ψ, also auch die Tangentialvektoren u und v . In (8.4) und (8.5) haben wir aber gelernt, dass man die Tangentialvektoren an eine mittels Parameterdarstellung gegebene Kurve durch Berechnung der Ableitung findet. Wir stellen deshalb eine Parameterdarstellung der durch ϕ gegebenen Raumkurve auf. Die Punkte auf dieser Kurve haben die Koordinaten P (x, y0 , ϕ(x)), wo ϕ(x) = f (x, y0 ) eine partielle Funktion ist. Um dieselbe Bezeichnung −−→ wie in Kapitel 8 zu haben, ersetzen wir x durch t. F¨ ur den Ortsvektor OP = r(t) gilt
24.2 Die Tangentialebene
379
⎛
⎞ t r(t) = ⎝ y0 ⎠ . ϕ(t) −−→ F¨ ur t = x0 ergibt sich der Ortsvektor OP0 . Die Ableitung dieses Vektors nach t ist dann
⎞ 1 r˙ (t) = ⎝ 0 ⎠ , ϕ (t) ⎛
und wenn wir hier t = x0 setzen, so erhalten wir den gesuchten Tangentialvektor u. Dabei beachten wir noch, dass ϕ (x0 ) = fx (x0 , y0 ) (partielle Ableitung) ist. Wir finden somit ⎛ ⎞ 1 ⎠. 0 u = ⎝ fx (x0 , y0 ) V¨ ollig analog berechnen wir
⎞ 0 ⎠. v = ⎝ 1 fy (x0 , y0 ) ⎛
Da diese beiden Vektoren in der gesuchten Tangentialebene liegen, ist diese normal zu ⎞ −fx (x0 , y0 ) n = u × v = ⎝ −fy (x0 , y0 ) ⎠ . 1 ⎛
Da aber die Tangentialebene auch noch durch P0 (x0 , y0 , z0 ) geht, k¨ onnen wir ihre Gleichung gem¨ ass (1.7.b) bestimmen. Sie lautet n(r − a) = 0 ⎛
⎞ x0 a = ⎝ y0 ⎠ . z0
mit
Ausrechnen liefert −fx (x0 , y0 )(x − x0 ) − fy (x0 , y0 )(y − y0 ) + (z − z0 ) = 0 oder, wenn z0 durch f (x0 , y0 ) ersetzt und die Gleichung umgeformt wird, z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) .
380
24. Das totale Differential
Dies ist also die gesuchte Gleichung der Tangentialebene. Beachten Sie die Analogie zur am Anfang des Abschnitts angegebenen Tangentengleichung im eindimensionalen Fall. Beispiel Wir betrachten die Funktion z = f (x, y) = xy (vgl. (22.4.b) f¨ ur Skizzen) und bestimmen die Tangentialebene f¨ ur x0 = 2, y0 = 3. Wegen fx (x, y) = y, fy (x, y) = x ist f (x0 , y0 ) = 6,
fx (x0 , y0 ) = 3,
fy (x0 , y0 ) = 2 .
Die Gleichung der Tangentialebene im Punkt P0 (6, 3, 2) lautet also z = 6 + 3(x − 2) + 2(y − 3) = 3x + 2y − 6 oder auch 3x + 2y − z − 6 = 0 .
Zur Frage der Existenz der Tangentialebene Von unserer Tangentialebene haben wir eingangs dieses Abschnitts verlangt, dass sie f¨ ur jede durch P0 gehende und auf dem Graphen von f liegende Kurve die Tangente in P0 enth¨ alt. Ob eine solche Ebene u ¨berhaupt existiert, haben wir ausser acht gelassen. Wenn es nun tats¨ achlich eine Tangentialebene gibt, so enth¨ alt sie sicher die Vektoren u und v (Tangentialvektoren an die durch ϕ bzw. ψ gegebenen Kurven) und hat deshalb die oben hergeleitete Gleichung z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) . Es gibt aber noch viele weitere Kurven, die auf der Fl¨ ache liegen und durch P0 gehen. Es ist a priori gar nicht klar, ob wirklich die Tangenten (in P0 ) an alle diese Kurven in unserer Ebene liegen. In der Tat gibt es Beispiele, wo dies nicht zutrifft. In einem solchen Fall existiert die Tangentialebene nicht; die obige Gleichung beschreibt dann zwar eine durch P0 gehende Ebene, aber eben nicht die Tangentialebene. In (24.6) werden wir ein Beispiel f¨ ur diese Situation antreffen. F¨ ur die Praxis ist die hier angesprochene Schwierigkeit aber von untergeordneter Bedeutung, denn f¨ ur die u ¨blicherweise vorkommenden Funktionen existiert die Tangentialebene stets. F¨ ur den n¨ achsten Abschnitt setzen wir zun¨ achst einfach die Existenz von fx (x0 , y0 ) und fy (x0 , y0 ) voraus, vgl. aber (24.5) und (24.6) f¨ ur genauere Informationen.
(24.3) Das totale Differential Unser Ziel war es, die Funktion f (x, y) in der N¨ ahe von (x0 , y0 ) durch eine lineare ¨ Funktion p(x, y) zu approximieren. Gem¨ ass den Uberlegungen von (24.2) wird man (1) w¨ ahlen.
p(x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )
381
24.3 Das totale Differential
Wir k¨ onnen nun die in (7.4) angestellten Untersuchungen auf die neue Situation ausdehnen: Wir betrachten die Punkte (x0 , y0 ) und (x, y) aus dem Definitionsbereich von f und verwenden die u ¨blichen Abk¨ urzungen Δx = x − x0 Δy = y − y0 Δf = f (x, y) − f (x0 , y0 ) = f (x0 + Δx, y0 + Δy) − f (x0 , y0 ) . ¨ Hier ist Δf die Anderung des Funktionswerts von f , wenn man von (x0 , y0 ) nach (x, y) geht. In der N¨ ahe von (x0 , y0 ) gilt f (x, y) ≈ p(x, y) , und wegen (1) k¨onnen wir schreiben: (2)
f (x, y) − f (x0 , y0 ) ≈ fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )
oder (3)
Δf ≈ fx (x0 , y0 )Δx + fy (x0 , y0 )Δy .
Den rechtsstehenden Ausdruck nennt man das totale Differential von f (an der Stelle (x0 , y0 )) und bezeichnet ihn mit df , (4)
df = fx (x0 , y0 )Δx + fy (x0 , y0 )Δy ,
oder, mit den Bezeichnungen dx = Δx, dy = Δy: (5)
df = fx (x0 , y0 ) dx + fy (x0 , y0 ) dy .
Die Formel (3) lautet dann kurz (6)
Δf ≈ df .
Der Name “totales Differential” kann so gedeutet werden: Die Zahl df gibt den Zuwachs wieder, wenn man sowohl x als auch y ver¨andert. Dagegen beschreibt fx (x0 , y0 ) dx ¨ allein die “partielle” Anderung in x–Richtung, analog fy (x0 , y0 ) dy. Setzt man in (1) x = x0 , y = y0 , so folgt zun¨ achst p(x0 , y0 ) = f (x0 , y0 ), und aus (1) erh¨ alt man p(x, y) − p(x0 , y0 ) = fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )
382
24. Das totale Differential
oder df = p(x, y) − p(x0 , y0 ) .
(7)
¨ Die Zahl df ist also die Anderung des Werts der linearen “Ersatzfunktion” p, wenn man von (x0 , y0 ) nach (x, y) geht. Auch hier ist die Analogie zum Fall einer Variablen (7.4) ass (6) zur Approximation von Δf gebraucht, evident. Wie schon damals wird df gem¨ vgl. die Beispiele weiter unten. Die folgende Figur zeigt den Sachverhalt geometrisch auf. z (x0 , y0 , z0 ) p f
y df Δf x0 (x, y, 0) x
x
Genau gleich definiert man das totale Differential f¨ ur Funktionen von mehr als zwei Variablen. Beispielsweise hat man f¨ ur drei Ver¨ anderliche: df = fx (x0 , y0 , z0 )Δx + fy (x0 , y0 , z0 )Δy + fz (x0 , y0 , z0 )Δz . Nat¨ urlich ist hier eine zeichnerische Darstellung im dreidimensionalen Raum nicht mehr m¨ oglich.
Beispiele 1. Es sei f (x, y) = x2 y + xy 3 . Gesucht ist das totale Differential an der Stelle x0 = 1, y0 = 2. Wegen fx (x, y) = 2xy+y 3 , fy (x, y) = x2 +3xy 2 ist fx (x0 , y0 ) = 12, fy (x0 , y0 ) = 13. Wir erhalten somit df = 12Δx + 13Δy . Gibt man Δx und Δy noch zahlenm¨ assig an, z.B. Δx = 0.01, Δy = −0.05, so findet man df = 12 · 0.01 + 13 · (−0.05) = −0.53 . Mit diesen Zahlen k¨onnen wir Δf auch exakt ausrechnen. Δf = f (x0 + Δx, y0 + Δy) − f (x0 , y0 ) = 9.48 − 10 = −0.52 . Dies best¨atigt die Beziehung Δf ≈ df .
383
24.4 Anwendung auf die Fehlerfortpflanzung
2. Wir betrachten einen Zylinder vom Radius r und von der H¨ohe h. Sein Volumen ist gegeben durch V = V (r, h) = πr2 h . Wir gehen jetzt von den Ausgangsgr¨ ossen r0 und h0 zu neuen Gr¨ossen r und h u ¨ber und fragen uns, wie sich das Volumen V ¨andert. Mit Δr = r − r0 , Δh = h − h0 wird ΔV = V (r, h) − V (r0 , h0 ) . Setzen wir r = r0 + Δr, h = h0 + Δh, so erhalten wir ΔV = π(r0 + Δr)2 (h0 + Δh) − πr02 h0 = 2πr0 h0 Δr + πr02 Δh + πh0 (Δr)2 + 2πr0 ΔrΔh + π(Δr)2 Δh . Das totale Differential dagegen errechnet sich zu dV = 2πr0 h0 Δr + πr02 Δh . Es unterscheidet sich also von ΔV genau um die Terme, in welchen Δr bzw. Δh oherer Ordnung” (Produkte bzw. Potenzen) vorkommen (vgl. (19.9)). in “h¨ (24.4) Anwendung auf die Fehlerfortpflanzung Das totale Differential wird gebraucht, wenn man die Fortpflanzung von Fehlern bei Funktionen von zwei und mehr Variablen untersuchen will. Das eindimensionale Analogon wurde bereits in (7.5) betrachtet. Es seien x, y Messgr¨ ossen mit den wahren Werten x0 , y0 und den absoluten Fehlern Δx = x − x0 , Δy = y − y0 . Auf (x, y) werde nun eine Funktion f von zwei Variablen angewendet. Wie pflanzt sich der Fehler fort? Gesucht ist also der Fehler Δf = f (x, y)− f (x0 , y0 ) in Abh¨ angigkeit von den Fehlern Δx und Δy. Die Formel (6) von (24.3) hilft uns weiter: Δf ≈ df . Explizit ist Δf ≈ fx (x0 , y0 )Δx + fy (x0 , y0 )Δy . Beispiele 1. In einem rechtwinkligen Dreieck werden die Hypotenuse c und der Winkel α gemessen. Man erh¨ alt c = 100 mm mit einer Genauigkeit von ±0.1 mm und α = 40◦ mit einer Genauigkeit von ±1◦ . Anschliessend berechnet man die Kathete a = c sin α (= 64.28) .
c α
a
384
24. Das totale Differential
Wie genau ist das Resultat ungef¨ahr? Durch die Erfahrung gewitzigt (vgl. etwa die Beispiele 2. in (7.3) und (7.5)), arbeiten wir im Bogenmass. Es ist dann c = 100, |Δc| ≤ 0.1 , 40π π α= , |Δα| ≤ . 180 180 Gesucht ist Δa ≈ da = ac (c0 , α0 )Δc + aα (c0 , α0 )Δα = sin α0 Δc + c0 cos α0 Δα . Wie schon in (7.5) n¨ahern wir die unbekannten wahren Werte c0 , α0 durch die Messwerte c, α an. Dann ist Δa ≈ sin
40π 40π Δc + 100 cos Δα = 0.64Δc + 76.60Δα . 180 180
Wir wissen, dass |Δc| ≤ 0.1 und |Δα| ≤ π/180 ist. Daraus folgt* < |Δa| ≈ |0.64Δc| + |76.60Δα| ≤ 0.64 · 0.1 + 76.60
π = 1.40 . 180
Man findet also a = 64.28 ± 1.40 mm.
2. Dieses Beispiel betrachten wir im Hinblick auf den relativen Fehler. Es sei f (x, y) = xy . Dann ist fx (x0 , y0 ) = y0 ,
fy (x0 , y0 ) = x0 ,
sowie Δf ≈ y0 Δx + x0 Δy . F¨ ur x0 = 0, y0 = 0 k¨onnen wir durch x0 y0 = f (x0 , y0 ) dividieren und erhalten Δx Δy Δf + . ≈ f (x0 , y0 ) x0 y0 Die Gr¨ osse Δx x0 (absoluter Fehler geteilt durch den wahren Wert) heisst der relative Fehler (vgl. (7.5)). In der obigen Formel steht links der relative Fehler von f (x, y) = xy, also des Produkts. Wir haben somit gezeigt, dass gilt: Der relative Fehler eines Produkts ist n¨ aherungsweise gleich der Summe der relativen Fehler der Faktoren. Misst man also eine Seite eines Rechtecks mit einem relativen Fehler von 1%, die andere mit einem solchen von 2%, so hat die daraus berechnete Rechtecksfl¨ ache einen relativen Fehler von 3%. * Hier wird die “Dreiecksungleichung” benutzt, die besagt, dass |x + y| ≤ |x| + |y| ist (vgl. (26.8)).
24.5 Totale Differenzierbarkeit
385
Wie schon in (7.5) sei darauf hingewiesen, dass wir hier den “maximalen Fehler einer Einzelur den “mittleren Fehler einer Reihe von Messungen” gelten andere messung” behandelt haben. F¨ Fehlerfortpflanzungsgesetze.
(24.5) Totale Differenzierbarkeit Wie gut ist eigentlich die Approximation von f (x, y) durch die lineare Funktion p(x, y) bzw. jene des Zuwachses Δf durch das Differential df ? In (7.6) haben wir diese Frage f¨ ur Funktionen einer Variablen studiert. Im Fall zweier Variablen lautet die Formel f¨ ur das Differential df = fx (x0 , y0 )Δx + fy (x0 , y0 )Δy . Nat¨ urlich m¨ ussen wir voraussetzen, dass f partiell differenzierbar ist. In dieser Formel kommen die partiellen Ableitungen in der x– ¨ und der y–Richtung vor. Die Formel scheint also die Anderungen der Funktion beim Fortschreiten in andern Richtungen (z.B. auf der Winkelhalbierenden gem¨ ass Figur) gar nicht zu ber¨ ucksichtigen. Es ist deshalb eigentlich nicht zum vornherein klar, dass die ¨ Approximation beim Ubergang von (x0 , y0 ) zu einem beliebigen Punkt (x, y) immer gut ist. Um diesen Problemkreis n¨aher zu untersuchen, betrachten wir wie in (7.5) den “Fehler” r(x, y) = f (x, y) − p(x, y) = Δf − df . In (7.6) haben wir in der analogen Situation gesehen, dass gilt (∗)
lim
x→x0
r(x) =0, |x − x0 |
unschenswert, d.h., dass r(x) auch im Vergleich zum Abstand |x−x0 | klein ist. Es w¨are w¨ wenn die analoge Formel auch f¨ ur zwei Variablen gelten w¨ urde. Um sie aufzuschreiben, m¨ ussen wir den Nenner |x−x0 |, d.h. den Abstand von x und x0 , durch d((x, y), (x0 , y0 )) ersetzen (vgl. (22.8)). Wir erhalten so (∗∗)
lim (x,y)→(x0 ,y0 )
r(x, y) =0. d((x, y), (x0 , y0 ))
Beachten Sie, dass gem¨ ass (22.8) die obige Grenzwertbeziehung besagt, dass der Bruch r(x, y)/d((x, y), (x0 , y0 )) f¨ ur alle zum Punkt (x0 , y0 ) f¨ uhrenden Wege dem Wert 0 beliebig nahekommt. Leider gilt nun diese Formel (∗∗) nicht immer. Ein Beispiel dazu folgt in (24.6). Hier tritt also ein wesentlicher Unterschied zu den Funktionen einer Variablen auf:
386
24. Das totale Differential
Eine Variable (vgl. (7.5))
Zwei Variablen
Wenn f in x0 differenzierbar ist, d.h., wenn f (x0 ) existiert, dann gilt (∗) immer.
Wenn f in (x0 , y0 ) partiell differenzierbar ist, d.h., wenn fx (x0 , y0 ) und fy (x0 , y0 ) existieren, dann ist es zwar m¨ oglich, dass (∗∗) gilt, dies muss aber nicht unbedingt der Fall sein.
Man macht nun aus der Not eine Tugend: Da es w¨ unschenswert ist, dass (∗∗) gilt (die lineare Funktion p(x, y) soll in der N¨ ahe von (x0 , y0 ) eine gute Approximation von f (x, y) sein), fordert man diese Bedingung zus¨ atzlich und kommt so auf folgenden neuen Begriff: Die Funktion f von zwei Variablen heisst total differenzierbar an der Stelle (x0 , y0 ), wenn sie dort partiell differenzierbar ist und wenn dar¨ uber hinaus die Beziehung (∗∗)
lim (x,y)→(x0 ,y0 )
r(x, y) =0 d((x, y), (x0 , y0 ))
gilt. Wie eben erw¨ahnt wurde (vgl. das Beispiel in (24.6)), ist nicht jede partiell differenzierbare Funktion auch total differenzierbar. F¨ ur solche Funktionen kann man zwar das totale Differential immer noch bilden, aber es ist dann keine “gute” Approximation von f mehr, da (∗∗) verletzt ist. Zum Gl¨ uck ist diese Schwierigkeit f¨ ur die Praxis kaum von Bedeutung. In den meisten F¨allen sind n¨ amlich die partiell differenzierbaren Funktionen auch total differenzierbar, denn es gilt die folgende, ohne Beweis mitgeteilte Tatsache: Wenn f in einer gewissen Umgebung von (x0 , y0 ) partiell differenzierbar ist und wenn die partiellen Ableitungen in (x0 , y0 ) stetig sind, dann ist f in (x0 , y0 ) total differenzierbar. Da in der Praxis diese Stetigkeitsbedingung meist erf¨ ullt ist, pflegt man das totale Differential ohne Skrupel zu verwenden. Der Fall von mehr als zwei Variablen wird entsprechend behandelt. Der Begriff der totalen Differenzierbarkeit ist zum systematischen Studium von Funktionen von mehreren Variablen von fundamentaler Bedeutung. Wir werden aber diese Betrachtungen hier nicht weiterf¨ uhren.
387
24.6 Ein Gegenbeispiel
(24.6) Ein Gegenbeispiel Hier geben wir f¨ ur speziell Interessierte das versprochene Beispiel einer partiell, aber nicht total differenzierbaren Funktion an. Dasselbe Beispiel zeigt auch, dass die Tangentialebene nicht immer zu existieren braucht. Es sei f : R2 → R, f (x, y) = 3 x3 + y 3 , und wir w¨ ahlen (x0 , y0 ) = (0, 0). Die u ¨blichen Ableitungsregeln ergeben x2 fx (x, y) = , 3 3 ( x + y 3 )2
y2 fy (x, y) = . 3 3 ( x + y 3 )2
F¨ ur x = y = 0 liefern diese Formeln den undefinierten Ausdruck 00 . Trotzdem existieren dort die partiellen Ableitungen, wie man durch direkte Limesbildung erkennt: Es ist n¨ amlich gem¨ ass (23.2.d) fx (0, 0) = lim
x→0
f (x, 0) − f (0, 0) x = lim =1. x→0 x x−0
Analog findet man fy (0, 0) = 1 . F¨ ur die lineare Funktion p(x, y) erhalten wir p(x, y) = fx (0, 0)x + fy (0, 0)y = x + y . Somit ist r(x, y) = f (x, y) − p(x, y) =
3
Mit d((x, y), (x0 , y0 )) = erhalten wir r(x, y) = d((x, y), (x0 , y0 ))
3
x3 + y 3 − (x + y) .
x2 + y 2
x3 + y 3 − (x + y) . x2 + y 2
Wir wollen nun zeigen, dass der Limes dieses Ausdrucks f¨ ur (x, y) → (x0 , y0 ) = (0, 0) nicht existiert. Wie in (22.8) erw¨ ahnt wurde, m¨ usste er sich im Falle der Existenz stets derselben Zahl r n¨ ahern, wie immer man sich in der x-y–Ebene an den Punkt (0, 0) heranbewegt. Wir geben nun zwei solcher Wege an:
y
y
x Entlang der x-Achse: y = 0, x > 0. 3 x−x x3 + y 3 − x − y = 0. = 2 2 x x +y Der Limes ist = 0.
x Entlang der Winkelhalbierenden y = x, x, y > 0. √ √ 3 3 3 x3 + y 3 − x − y 2x3 − 2x 2x − 2x √ √ . = = 2 2 2 2x 2x x +y √ 3 2−2 Der Limes ist √ = 0. 2
24. Das totale Differential
388
Der Grenzwert lim
(x,y )→(x0 ,y0 )
r(x, y) d((x, y), (0, 0))
existiert also nicht einmal, geschweige denn, dass er = 0 w¨ are. Die Formel (∗∗) ist somit sicher nicht richtig, d.h. diese Funktion f ist in (0, 0) nicht total differenzierbar, obwohl sie dort partiell differenzierbar ist, wie wir gesehen haben. Im Hinblick auf die Bemerkung am Schluss von (24.2) zeigen wir noch, dass f¨ ur diese Funktion im Punkt (0, 0) keine Tangentialebene existiert. Da in diesem Punkt die partiellen Ableitungen existieren (und beide = 1 sind) m¨ usste die Tangentialebene E, wenn sie existieren w¨ urde, die Gleichung z =x+y
oder ⎛
haben. Dann w¨ are
x+y−z =0 1
⎞
⎜ ⎟ n=⎝ 1 ⎠ −1 ein Normalenvektor zu E (vgl. (2.6.6)). Unser Ziel ist es, eine Kurve auf dem Graphen von f anzugeben, die durch (0, 0) geht und deren √ √ Tangente in diesem Punkt nicht in E liegt. Setzen wir x = t, y = t, z = 3 t3 + t3 = 3 2 t, so liegt der Punkt (x, y, z) sicher auf dem Graphen von f . Damit liegt die durch ⎛
⎞ t ⎜ ⎟ r(t) = ⎝ t ⎠ √ 3 2t gegebene Kurve (eine Gerade) vollst¨ andig auf dem Graphen von f . Ableiten liefert ⎛
⎞ 1 ⎜ ⎟ r˙ (t) = ⎝ 1 ⎠ , √ 3 2
⎛
speziell
⎞ 1 ⎜ ⎟ r˙ (0) = ⎝ 1 ⎠ . √ 3 2
Die Kurventangente im Nullpunkt hat die Richtung r˙ (0) und liegt nicht in der Ebene E, denn f¨ ur den Normalenvektor n von E ist das Skalarprodukt ⎞ ⎛ ⎞⎛ 1 1 √ ⎟ ⎜ ⎟⎜ 3 ˙ n r(0) = ⎝ 1 ⎠ ⎝ 1 ⎠ = 2 − 2 = 0 . √ 3 2 −1 Damit ist gezeigt, dass die Funktion f in (0, 0) keine Tangentialebene besitzt. Diese Situation tritt aber, wie schon fr¨ uher erw¨ ahnt, in der Praxis kaum auf. Es gilt n¨ amlich allgemein: Wenn f in (x0 , y0 ) total differenzierbar ist (z.B. wenn die partiellen Ableitungen in einer Umgebung von (x0 , y0 ) existieren und in (x0 , y0 ) stetig sind (vgl. Schluss von (24.5)), dann existiert die Tangentialebene in (x0 , y0 ).
(24.7) Differentialformen und Kurvenintegrale Differentiale von Funktionen von mehreren Variablen werden auch in der Physik (vor allem in der Thermodynamik) verwendet. In diesem Abschnitt erl¨autern wir einige relevante Begriffsbildungen, ohne aber auf Details einzugehen.
389
24.7 Differentialformen und Kurvenintegrale
¨ber totale Differentiale a) Kurvenintegrale u Wir betrachten eine Funktion F (x, y) von zwei Variablen, welche total differenzierbar ist, sowie ihr totales Differential dF = Fx (x, y) dx + Fy (x, y) dy . Weiter sei C eine orientierte Kurve in der x-y–Ebene, gegeben durch die Parameterdarstellung r(t) =
x(t) y(t)
a≤t≤b.
,
Unter Verwendung von Kurvenintegralen (14.4) kann man nun das totale Differential dF l¨ angs C integrieren. Man setzt dazu im Sinne einer Definition
dF = C
C
(Fx (x, y) dx + Fy (x, y) dy) =
wo v (r) das Vektorfeld
v (r) =
Fx (r) Fy (r)
=
Fx (x, y) Fy (x, y)
v (r) dr , C
ist. Gem¨ ass (14.4) rechnet man dieses Integral unter Verwendung der Parameterdarstellung von C als gew¨ ohnliches Integral aus: b
dF =
a
C
Fx (x(t), y(t)) x(t) ˙ + Fy (x(t), y(t)) y(t) ˙ dt .
Man kann nun zeigen, dass folgende Formel gilt: C
dF = F (x(b), y(b)) − F (x(a), y(a)) .
Der Wert des Kurvenintegrals h¨ angt also nur vom Anfangspunkt (x(a), y(a)) und vom Endpunkt (x(b), y(b)) der Kurve und nicht von der Kurve selbst ab:
(x(b), y(b)) Jede dieser orientierten Kurven liefert denselben Wert des Integrals.
(x(a), y(a)) b) Differentialformen Wir haben in a) Kurvenintegrale der Form
dF = C
C
(Fx (x, y) dx + Fy (x, y) dy)
24. Das totale Differential
390
angeschrieben. Man kann aber auch Kurvenintegrale der allgemeineren Form (f (x, y) dx + g(x, y) dy) C
berechnen und zwar mit der zu a) analogen Formel b
˙ f (x(t), y(t)) x(t) ˙ + g(x(t), y(t)) y(t) dt .
a
ahrend sie beim totalen Der Unterschied zu a) ist der, dass hier die Funktionen f, g beliebig sind, w¨ Differential partielle Ableitungen ein und derselben Funktion F , also von der Form f = Fx ,
(∗)
g = Fy
ultigkeit von (∗) ist auf sein m¨ ussen. Dies wird im allgemeinen nicht zutreffen. Notwendig f¨ ur die G¨ alle F¨ alle, dass fy = g x
(∗∗)
ist, denn wir wissen aus (23.4), dass Fxy = Fyx sein muss, jedenfalls unter vern¨ unftigen Voraussetzungen u ¨ber die Funktion F . Der Ausdruck f (x, y) dx + g(x, y) dy heisst eine Differentialform. Nicht jede Differentialform ist ein totales Differential, da (∗) nicht zu ¨ber eine Differentialform genau gelten braucht. Man kann nun beweisen, dass das Kurvenintegral u dann nur von Anfangs- und Endpunkt der Kurve (und nicht von der Kurve selbst) abh¨ angt, wenn diese Differentialform ein totales Differential ist. Wir illustrieren diese Tatsache an einem Beispiel: Die Differentialform (x − y) dx + (x + y) dy ist kein totales Differential, denn ∂(x − y) ∂(x + y) = −1 = =1. ∂y ∂x
y (0,1)
Wir integrieren nun diese Differentialform u ¨ ber zwei verschiedene von (1, 0) nach (0, 1) f¨ uhrende Wege: 1−t , 0 ≤ t ≤ 1. C1 : Gerade: r(t) = x t (1,0) cos t C2 : Viertelkreis: r(t) = , 0 ≤ t ≤ π/2. sin t Eine leichte Rechnung unter Verwendung der oben angegebenen Formel (vgl. auch (14.6)) zeigt:
C1
((x − y) dx + (x + y) dy) = 1 ,
C2
((x − y) dx + (x + y) dy) = π/2 .
Das Kurvenintegral h¨ angt also nicht nur von Anfangs- und Endpunkt, sondern vom Weg selbst ab.
24.∞ Aufgaben
391
c) Anwendung in der Thermodynamik In der Thermodynamik formuliert man den 1. Hauptsatz mit der Formel δQ
= dU + δW
.
¨ uhrte kleine W¨ armemenge, dU ist die Anderung der inneren Energie Dabei ist δQ eine dem Gas zugef¨ und δW ist die geleistete Arbeit. Hier ist dU ein totales Differential. Dies bedeutet, dass die gesamte innere Energie
dU
U = C
nur vom Zustand (V, T ) (V : Volumen, T : Temperatur) abh¨ angt und nicht vom Weg (Kurve C in der V -T –Ebene), auf dem das System zu diesem Zustand gelangt ist, vgl. Schluss von (24.7.a). Man sagt deshalb, U sei eine Zustandsgr¨ osse. Dagegen sind Q und W keine Zustandsgr¨ ossen, und δQ sowie δW sind keine totalen Differentiale (deshalb das Zeichen δ statt d), sondern allgemeinere Differentialformen, bei denen der Wert des Kurvenintegrals von der durchlaufenen Kurve in der V -T –Ebene abh¨ angt.
(24.∞) Aufgaben 24−1 Bestimmen Sie die Gleichung der Tangentialebene a) der Funktion f (x, y) = x2 y + 2xy 3 + x + 1 im Punkt x0 = 1, y0 = −1, z0 = ?, y b) der Funktion g(x, y) = x y + x (x, y > 0) im Punkt x0 = 2, y0 = 1, z0 = ?. 24−2 a) Durch die Gleichung z = x2 + y 2 wird ein Rotationsparaboloid beschrieben (siehe (22.4.b)). In welchem Punkt dieser Fl¨ ache ist die Tangentialebene normal zum Vektor ⎛ ⎞ −2 ⎜ ⎟ n = ⎝ −4 ⎠? 1
b) Die Gleichung 3x2 + 2y 2 + z 2 = 15 beschreibt ein Ellipsoid. In welchem Punkt mit positiver z–Koordinate ist die Tangentialebene parallel zur Ebene mit der Gleichung −3x + 4y + 2z = 1? 24−3 a) Bestimmen Sie das totale Differential der Funktion f (x, y) = ln(x + y 2 ) im Punkt (1,2). y im Punkt (−2, 2). b) Bestimmen Sie das totale Differential der Funktion g(x, y) = 3yx2+8 +1
24−4 Berechnen Sie den Wert des Differentials von f (x, y, z) = (x + yz)exz an der Stelle x0 = 0, y0 = 1, z0 = −1 f¨ ur die Werte Δx = 0.01, Δy = 0.05, Δz = −0.05. 24−5 Ein gerader Kreiskegel hat den Radius r und die H¨ ohe h. Diese Gr¨ ossen werden um Δr bzw. ¨ Δh ge¨ andert. Approximieren Sie die Anderungen des Volumens V und der Mantelfl¨ ache M durch das totale Differential. Vergleichen Sie dV und ΔV . ¨ 24−6 Der Fl¨ acheninhalt eines Kreissegments mit Radius r und Offnungswinkel α ist gegeben durch
A = r2 (α − sin α). Wir nehmen an, der Winkel k¨ onne auf 1◦ genau, der Radius auf 1 mm genau gemessen werden. Wie gross ist ungef¨ ahr der maximale Fehler f¨ ur den Fl¨ acheninhalt, wenn eine Messung die Werte r = 50 mm, α = 70◦ ergibt?
24−7 Der (elektrische) Widerstand R (in Ω) eines Drahtes ist gegeben durch die Formel R = ρ/A. Dabei ist ρ der spezifische Widerstand (in Ωm), die L¨ ange (in m) und A die Querschnittsfl¨ ache des Drahtes (in m2 ). Ein Draht mit kreisf¨ ormigem Querschnitt habe eine L¨ ange von 50 cm (auf 1 mm genau gemessen) und einen Durchmesser von 2 mm (auf 0.2 mm genau gemessen). Wie gross ist ungef¨ ahr der maximale Fehler f¨ ur R ur Kupfer) als exakt angenommen wird? a) Wenn ρ = 1.7 · 10−8 Ωm (dies ist der Wert f¨ b) Wenn ρ mit einem Fehler von ±0.05 · 10−8 Ωm behaftet ist?
392
25. MEHRDIMENSIONALE INTEGRALE ¨ (25.1) Uberblick In diesem Kapitel werden Integrale von Funktionen von zwei Variablen besprochen, n¨amlich sogenannte Gebietsintegrale
(25.2)
f (x, y) dx dy , D
wo D eine Teilmenge der Ebene ist. Es geht dabei vor allem um das Verst¨andnis der Grundidee und von einigen einfachen Beispielen. Auf weitergehende Anwendungen wird verzichtet.
(25.4)
(25.2) Gebietsintegrale In (10.2) wurde das bestimmte Integral einer Funktion f einer Variablen als Limes von Riemannschen Summen definiert: b n f (x) dx = lim f (ξi )Δxi . Δxi →0
a
i=1
Dabei l¨asst sich (wenigstens solange f (x) ≥ 0 ist), das Integral anschaulich als Inhalt des Fl¨ achenst¨ ucks zwischen Kurve und x–Achse deuten, die Riemannsche Summe als Inhalt einer aus Rechtecken zusammengesetzten N¨aherung:
a = x0
ξ1
x1
ξ2 x2
ξ3
x3
ξ4 x 4 = b
Eine ganz analoge Konstruktion l¨ asst sich f¨ ur den Fall einer Funktion von mehreren Variablen durchf¨ uhren. Wie schon fr¨ uher beschr¨anken wir uns aber auf den Fall von zwei Ver¨anderlichen (schon deshalb, weil man hier die Situation noch aufzeichnen kann). Es sei also f : D → R eine Funktion von zwei Variablen mit Definitionsbereich D ⊂ R2 . Dabei setzen wir voraus, dass D beschr¨ankt, d.h., dass D in einem gen¨ ugend
25.2 Gebietsintegrale
393
gross gew¨ ahlten (und achsenparallelen) Rechteck enthalten sei. Die Seiten des Rechtecks sind durch Intervalle auf der x– und auf der y–Achse gegeben. Im Falle einer Variablen hatten wir den Definitionsbereich [a, b] in Teilintervalle unterteilt. Hier unterteilen wir sowohl das Intervall auf der x–Achse als auch jenes auf der y–Achse durch Teilpunkte x0 , x1 , . . . , xm bzw. y0 , y1 , . . . , yn : y y5 y4 y3 D y2 y1 y0 x x0
x1 x2 x3
x4 x5
x6
Auf diese Weise erhalten wir mn kleine Rechtecke. Um der Tatsache Rechnung zu tragen, dass gewisse Rechtecke u ¨ber den Rand von D hinausreichen oder sogar ganz ausserhalb von D liegen, definieren wir f auch f¨ ur Punkte, die nicht in D liegen, und zwar einfach dadurch, dass wir f dort u ¨berall den Funktionswert 0 zuordnen. Mit Δxi = xi − xi−1 und Δyk = yk − yk−1 bezeichnen wir wie u ¨blich die L¨ ange der einzelnen Teilintervalle. Das Teilrechteck Rik hat dann den Fl¨ acheninhalt Δxi Δyk . yk yk−1
Rik xi−1
xi
Im Fall einer Variablen hatten wir zur Definition der Riemannschen Summe in jedem Teilintervall [xi−1 , xi ] einen “Zwischenpunkt” ξi gew¨ ahlt. Hier w¨ ahlen wir nun auch noch in [yk−1 , yk ] einen Zwischenpunkt ηk und erhalten so in jedem Rechteck Rik einen Punkt mit den Koordinaten (ξi , ηk ), i = 1, . . . , m, k = 1, . . . , n. Der Ausdruck z y f (ξi , ηk )Δxi Δyk hat nun eine einfache geometrische Bedeutung (wenigstens f¨ ur den Fall, wo f (x, y) ≥ 0 ist, worauf wir uns in dieser motivierenden Betrachtung beschr¨anken wollen): Er ist einfach das Volumen eines Quaders mit Grundfl¨ache Rik und H¨ ohe f (ξi , ηk ).
x
25. Mehrdimensionale Integrale
394
Summiert man u ¨ber alle diese Quader, so erh¨alt man offensichtlich einen N¨ aherungswert f¨ ur das Volumen des K¨ orpers zwischen D und dem Graphen G von f .
z G
Formelm¨ assig schreibt sich dieser Ausdruck als Doppelsumme
y
D x
n
m
f (ξi , ηk )Δxi Δyk .
k=1 i=1
Man nennt dies in Analogie zu (10.2) eine Riemannsche Summe. Je feiner man die Unterteilung w¨ahlt, desto besser wird das Volumen durch die Riemannsche Summe approximiert. Man wird deshalb dazu gef¨ uhrt, den Grenzwert
lim
m n
Δxi →0 Δyk →0 k=1 i=1
f (ξi , ηk )Δxi Δyk
zu betrachten. Dieser Grenzwert heisst das Gebietsintegral (oder Bereichsintegral oder zweifaches Integral) der Funktion f u ¨ber dem Bereich D, in Zeichen f (x, y) dx dy . D
Es gilt also
f (x, y) dx dy = D
lim
n m
Δxi →0 Δyk →0 k=1 i=1
f (ξi , ηk )Δxi Δyk .
Dieses Gebietsintegral stellt f¨ ur den Fall, wo f (x, y) ≥ 0 ist, das oben beschriebene Volumen zwischen den Fl¨achenst¨ ucken D und G dar. Selbstverst¨ andlich kann man die Definition auch f¨ ur Funktionen benutzen, welche negative Werte annehmen (man erh¨ alt dann negative Beitr¨ age zum Integral, vgl. z.B. (12.6.3)). Im u ¨brigen ist die Interpretation des Integrals als Volumen nur eine von vielen M¨ oglichkeiten. Es gibt viele andere Begriffe, die sich unter Verwendung von mehrfachen Integralen definieren lassen, z.B. die Masse eines K¨ orpers, das Tr¨agheitsmoment usw.
25.3 Berechnung von Gebietsintegralen
395
Bemerkungen a) Man kann zeigen, dass f¨ ur eine stetige Funktion f der obige Grenzwert, also das Integral, stets existiert und unabh¨ angig von der Wahl der Rik und der Zwischenpunkte ist; dies in Analogie zu (10.3). Zus¨ atzlich muss dabei vorausgesetzt werden, dass der Definitionsbereich D eine einigermassen “vern¨ unftige” Gestalt hat. Wir wollen hier nicht definieren, was das genau heissen soll, aber in allen praktisch auftretenden F¨ allen wird diese Situation vorliegen. Es gen¨ ugt z.B., wenn D wie in der Figur durch endlich viele Graphen von differenzierbaren Funktionen berandet ist.
y y = x2
y= D
√
x
y =3−x x
b) F¨ ur Funktionen von drei und mehr Variablen definiert man in analoger Weise mehrfache Integrale. Auf Einzelheiten sei hier verzichtet.
(25.3) Berechnung von Gebietsintegralen Die obige Definition eines Integrals als Grenzwert von Riemannschen Summen ist zur konkreten Berechnung ungeeignet. Wir werden nun aber zeigen, wie man die Berechnung von Gebietsintegralen auf die Berechnung von zwei gew¨ ohnlichen Integralen (einer Variablen) zur¨ uckf¨ uhren kann. Die folgenden Ausf¨ uhrungen sind Plausibilit¨ atsbetrachtungen. Ein strenger Beweis w¨ are recht kompliziert. Wir nehmen vorerst an, es sei f (x, y) ≥ 0, so dass wir das Integral als Volumen interpretieren d¨ urfen. Zuerst beschreiben wir den Definitionsbereich D durch folgende Figur: β(ξi )
y
y = β(x)
1 α(ξi )
y = α(x) a
x ξi
b
Dabei ist die “obere” Begrenzung von D durch die Funktion y = β(x) mit x ∈ [a, b] gegeben, die “untere” durch y = α(x) mit x ∈ [a, b]. Dabei muss stets α(x) ≤ β(x) sein, es ist aber ohne weiteres zugelassen, dass z.B. α(a) = β(a) ist (vgl. Beispiel (25.4.1)). Das gesuchte Integral
f (x, y) dx dy D
wird angen¨ ahert durch die Riemannsche Summe n m
(1)
f (ξi , ηk )Δxi Δyk ,
k=1 i=1
welche wir wie folgt in Summanden zerlegen: (2)
n k=1
f (ξ1 , ηk )Δx1 Δyk + . . . +
n k=1
f (ξm , ηk )Δxm Δyk .
25. Mehrdimensionale Integrale
396
Nun betrachten wir einen einzelnen solchen Summanden (i ist fest, k variabel): (3)
n
f (ξi , ηk )Δxi Δyk = Δxi
n
f (ξi , ηk )Δyk .
k=1
k=1
z
Die geometrische Interpretation ist die folgende: Wir fassen gem¨ass Figur 2 alle Quader mit Breite Δxi (anders ausgedr¨ uckt die Quader mit den Grundfl¨ achen Ri1 , Ri2 , . . . Rin ) zu einem treppenf¨ormigen K¨ orper zusammen.
2
H¨alt man nun Δxi fest und l¨ asst Δyk gegen Null streben, so erh¨ alt man ann¨ahernd das Volumen der Scheibe Si , welche die Breite Δxi hat (Figur 3 ).
D Δxi
n
x Si
z
Nun kann man aber das Volumen von Si mit einem gew¨ohnlichen Integral ausdr¨ ucken. Die Summe (4)
y
3
y
f (ξi , ηk )Δyk
k=1
D
ist n¨ amlich eine Riemannsche Summe der Funktion x
y → f (ξi , y) bei festgehaltenem ξi . (Dies ist eine partielle Funktion im Sinne von (22.6)).
Der Grenzwert von (4) beim Grenz¨ ubergang Δyk → 0 ist also einfach das Integral der Funktion y → f (ξi , y), wobei ξi festgehalten wird. Wie man der Figur 1 entnimmt, variiert y im Intervall [α(ξi ), β(ξi )]. F¨ ur das Volumen Vi der Scheibe Si gilt also wegen (3) und (4) (5)
Vi = Δxi lim
Δyk →0
n
β(ξi )
f (ξi , ηk )Δyk = Δxi
f (ξi , y) dy . α(ξi )
k=1
Das zuletzt stehende Integral h¨angt von ξi ab. (Diese Gr¨ osse kommt sowohl im Integranden als auch in den Integrationsgrenzen vor.) F¨ uhren wir zur Abk¨ urzung die Funktion β(x) (6) F (x) = f (x, y) dy, x ∈ [a, b] α(x)
ein, so ist das erw¨ahnte Integral gleich F (ξi ) und (5) kann kurz in der Form (7)
Vi = F (ξi )Δxi
25.3 Berechnung von Gebietsintegralen
397
geschrieben werden. Um das gesamte Volumen V zu erhalten, addieren wir die Volumina der einzelnen Scheiben S1 , . . . , Sn und finden m V ≈ F (ξ1 )Δx1 + F (ξ2 )Δx2 + . . . + F (ξm )Δxm = (8) F (ξi )Δxi . Diese Ann¨aherung ist umso besser, je d¨ unner die Scheiben Si , d.h. je kleiner die Δxi sind (Figur 4 ). In (7) steht wieder eine Riemannsche Summe, und zwar diesmal eine solche der Funktion F (x). Mit Δxi → 0 strebt diese gegen b F (x) dx .
i=1
z 4
y
a
Somit ist einerseits (9)
x
b
F (x) dx .
V = a
Anderseits ist V als Grenzwert der Riemannschen Summe (1) f¨ ur Δxi → 0, Δyk → 0 auch gleich dem gesuchten Gebietsintegral: f (x, y) dx dy . (10) V = D
Fassen wir (9) und (10) zusammen und setzen wir noch in (9) die Definition (6) von F (x) ein, so erhalten wir die endg¨ ultige Formel
b
(11)
β(x)
f (x, y) dx dy = D
a
f (x, y) dy dx .
α(x)
In Worten: Zur Berechnung des Gebietsintegrals integriert man f (x, y) zun¨achst nur nach y (denkt sich also x als fest), wobei die Grenzen des Integrals im allgemeinen von x abh¨ angen. Damit wird dieses “innere Integral” zu einer Funktion von x (die oben mit F (x) bezeichnet wurde), die man nun noch nach x integriert. Die Berechnung von solchen Gebietsintegralen ist also auf zwei gew¨ ohnliche Integrationen zur¨ uckgef¨ uhrt. Man spricht deshalb auch von Doppelintegralen. Bemerkungen y a) Man kann zeigen, dass die obige Formel auch f¨ ur beliebige (nicht notwendigerweise positive) stetige (oder st¨ uckweise stetige) Funktionen gilt. b) Bei komplizierteren Definitionsbereichen ist manchmal eine Aufteilung n¨ otig (vgl. die Figur f¨ ur ein anschauliches Beispiel); gelegentlich empfiehlt es sich auch, die Rollen von x und y zu vertauschen. c) Analoge Formeln gelten f¨ ur Funktionen von mehr als zwei Variablen.
x
25. Mehrdimensionale Integrale
398
(25.4) Beispiele 1. D sei durch die nebenstehende Figur gegeben und es sei f (x, y) = x + y. Gesucht ist
f (x, y) dx dy =
I=
y 1 y = β(x) = x
(x + y) dx dy .
D
D
D
Nach der Formel (11) ist
0
1
I=
x
(x + y) dx dy = D
y = α(x) = x2 x 1
(x + y) dy dx .
x2
0
Wir berechnen zuerst das “innere Integral” (x fest, y variabel).
x y 2 x2 3 x4 3x2 x4 − x + = − x3 − . (x + y) dy = xy + = x2 + 2 x2 2 2 2 2 x2 x
Nun kommt das “¨aussere Integral”. 1 0
1 1 3x2 x4 x3 x4 x5 3 (x + y) dy dx = − x3 − dx = − − = 20 . 2 2 2 4 10 2 x 0 0 x
Somit ist I = 3/20 = 0.15. 2. Der Bereich D sei durch die Koordinatenachsen und die Gerade y = 1 − x begrenzt. Wir betrachten den Graphen der Funktion f (x, y) = xy mit (x, y) ∈ D. (“Hyperbolisches Paraboloid”, vgl. die Skizze in (22.5.1).) Zusammen mit D begrenzt dieser Graph einen K¨orper. Wie gross ist dessen Volumen? Nach den bisherigen Betrachtungen ist
y 1
β(x) = 1 − x D
x
α(x) = 0 1
V =
xy dx dy .
z
D
y
Mit Formel (11) berechnen wir
1
V =
1−x
xy dx dy = D
0
xy dy dx .
0
F¨ ur das innere Integral finden wir
1−x
1−x
xy dy = x 0
y dy = x 0
1−x y 2 1 = (x3 − 2x2 + x) . 2 0 2
x
25.4 Beispiele
399
Die a¨ussere Integration liefert nun 1 1 3 11 2 1 1 V = (x − 2x2 + x) dx = − + = . 2 0 2 4 3 2 24
3. Zwei Zylinder vom Radius 1, der eine parallel zur y-Achse, der andere parallel zur z-Achse, schneiden sich. Wie gross ist das Volumen des entstehenden K¨ orpers? z
y x
Zylindergleichung x2 + y 2 = 1
Zylindergleichung x2 + z 2 = 1
Das im “2. Oktanten” (x, y, z ≥ 0) liegende St¨ uck dieses K¨orpers hat die nebenstehende Form.
z
Das Gesamtvolumen ist das achtfache des Volumens dieses Teils. Wir fassen die Grundfl¨ ache dieses Teils als Definitionsbereich D auf.
1 1
1 x Die gekr¨ ummte obere Begrenzung des K¨orpers ist als Teil der Zylinderfl¨ ache x2 + z 2 = 1 gegeben durch f (x, y) = z = 1 − x2 , (x, y) ∈ D .
y 1
Somit erhalten wir f¨ ur das Gesamtvolumen V =8 f (x, y) dx dy = 8 1 − x2 dx dy . D
y=
√
y
1 − x2
D x 1
D
Nach der oben erl¨auterten Methode finden wir 1 √1−x2 V =8 1 − x2 dy dx . 0
0
F¨ ur das “innere Integral” wird bei festem x nach y integriert, der Integrand ist eine konstante Funktion √1−x2 √1−x2 1 − x2 dy = 1 − x2 y = 1 − x2 1 − x2 = 1 − x2 . 0
0
25. Mehrdimensionale Integrale
400
F¨ aussere Integral” erhalten wir ur das “¨
1
V =8 0
1 x3 16 (1 − x2 ) dx = 8 x − = . 3 0 3
Damit ist das Volumen bestimmt. Bemerkenswert ist, dass die Zahl π im Schlussresultat nicht mehr vorkommt. (25.∞) Aufgaben 25−1 In den folgenden drei F¨ allen ist der Definitionsbereich D ein Rechteck. ex−y dx dy, D = {(x, y) | 0 ≤ x ≤ 2, 0 ≤ y ≤ 1}, a) D x x2 + y dx dy, D = {(x, y) | 0 ≤ x ≤ 1, 0 ≤ y ≤ 1}, b) D π x cos(x + y) dx dy, D = {(x, y) | 0 ≤ x ≤ π, 0 ≤ y ≤ }. c) 2 D √ 25−2 a) (x + 2y) dx dy, D = {(x, y) | 0 ≤ x ≤ 4, 0 ≤ y ≤ x}, D 1 1 ( √ + √ ) dx dy, D = {(x, y) | 1 ≤ x ≤ 2, 1 ≤ y ≤ x2 }. b) x y D 1 im Intervall [0, 1]. Berechnen 25−3 a) D sei begrenzt durch die Graphen von y = x2 und von y = x 2 x Sie dx dy. 2 D y b) D sei begrenzt durch die Graphen von y = 1+x und von y = x3 im Intervall [0, 1]. Berechnen (x2 + y) dx dy.
Sie D
(x4 y 2 + 1) dx dy.
25−4 a) D sei das Dreieck mit den Ecken (0,0), (1,0) und (1,3). Berechnen Sie D
b) D sei der Bereich, der durch die Ellipse x2 + 3y 2 = 4 und die Gerade x = 1 begrenzt wird (x + y) dx dy. und der den Nullpunkt enth¨ alt. Berechnen Sie D
¨ 25−5 a) Uber dem durch die Graphen von y = 3x und y = 4 − x2 begrenzten endlichen Bereich der x-y–Ebene wird ein “Zylinder” (mit zur z–Achse parallelen Mantellinien) errichtet. Seine obere Begrenzung ist durch die Ebene z = x + 5 gegeben. Wie gross ist sein Volumen? ¨ b) Uber dem Dreieck mit den Eckpunkten (0,0), (0,1) und (1,0) wird ein Prisma errichtet, dessen eine Kante die z–Achse ist. Die obere Begrenzung des Prismas wird durch die Fl¨ ache z = x2 + y 2 + 1 gegeben. Berechnen Sie dessen Volumen.
401
G. ANHANG 26. ZUSAMMENSTELLUNG EINIGER GRUNDBEGRIFFE ¨ (26.1) Uberblick In diesem Kapitel sind einige wichtige Begriffe, Tatsachen und Formeln zusammengestellt, die im Skript mehr oder weniger stillschweigend gebraucht werden. Da es sich dabei um Mittelschulstoff handelt, der an sich als bekannt vorausgesetzt wird, stehen diese Dinge nur zur Auffrischung des Ged¨achtnisses hier und werden entsprechend kurz behandelt. (26.2) Mengen a) Der Begriff der Menge Eine Menge ist eine wohlbestimmte Gesamtheit von Dingen oder Objekten, welche Elemente dieser Menge genannt werden. “Wohlbestimmt” bedeutet, dass von jedem denkbaren Objekt im Prinzip klar ist, ob es zur Menge geh¨ ort oder nicht. Wenn das Objekt x zur Menge M geh¨ ort, so schreibt man x ∈ M (gelesen “x Element von M ”, “x in M ”, etc.), andernfalls schreibt man x ∈ / M. Zwei Mengen M und N heissen gleich (in Zeichen M = N ), wenn sie dieselben Elemente enthalten. So ist zum Beispiel {x ∈ N | 0 < x < 3} = {x ∈ R | x2 − 3x + 2 = 0} . An diesem Beispiel sehen wir auch, wie man Mengen mit geschweiften Klammern beschreibt. b) Teilmengen, die leere Menge Wenn jedes Element der Menge N auch Element der Menge M ist, dann sagen wir, N sei Teilmenge von M und schreiben N ⊂ M (der Fall N = M ist dabei miteingeschlossen). Als leere Menge (in Zeichen ∅) bezeichnet man die Menge, die u ¨berhaupt keine Elemente enth¨ alt. Jede Menge enth¨ alt ∅ als Teilmenge. c) Durchschnitt und Vereinigung von Mengen Wenn M und N Mengen sind, so versteht man unter dem Durchschnitt M ∩ N die Menge all jener Objekte x, die sowohl Element von M als auch Element von N sind: M ∩ N = {x | x ∈ M und x ∈ N } . © Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0
26. Zusammenstellung einiger Grundbegriffe
402
Dieser Durchschnitt kann auch die leere Menge sein. In diesem Fall sagt man, M und N seien disjunkt (oder elementfremd). Unter der Vereinigung M ∪ N der Mengen M und N versteht man die Menge all oren: jener Objekte x, welche entweder zu M oder zu N (oder zu beiden) geh¨ M ∪ N = {x | x ∈ M oder x ∈ N } . Diese Bildungen kann man sehr sch¨on anhand der sogenannten Venn-Diagramme veranschaulichen:
M
N
M ∩N
M
N
M ∪N
Selbstverst¨ andlich lassen sich auch Durchschnitt und Vereinigung von mehr als zwei (sogar von unendlich vielen) Mengen bilden. d) Differenz von Mengen M \N Unter der Differenz M \ N (auch gelesen “M ohne N ”) der Mengen M und N versteht man die Menge aller Elemente von M , welche nicht zu N geh¨ oren: M \ N = {x | x ∈ M, x ∈ N } .
M N
Beispielsweise ist R \ {0} die Menge aller von Null verschiedenen reellen Zahlen. e) Das kartesische Produkt Wiederum seien M und N Mengen. W¨ ahlen wir ein Element m ∈ M und ein Element n ∈ N , so k¨onnen wir die beiden zu einem geordneten Paar (m, n) zusammenf¨ ugen. “Geordnet” soll besagen, dass die Reihenfolge eine Rolle spielt: Die geordneten Paare (m, n) und (m , n ) sind genau dann gleich, wenn sowohl m = m als auch n = n ist. Die Menge aller solcher geordneter Paare wird mit M × N bezeichnet und heisst das kartesische Produkt (oder die Produktmenge) von M und N . M × N = {(m, n) | m ∈ M, n ∈ N } . Besonders wichtig ist der Fall, wo M = R und N = R ist. Man schreibt dann statt R × R auch kurz R2 . Somit ist R2 die Menge aller geordneter Paare (x, y) mit
403
26.3 Reelle Zahlen
x, y ∈ R. Die konkrete Bedeutung von “geordnet” ist hier, dass die beiden Pl¨ atze gut zu unterscheiden sind: (1,2) ist ein anderes Paar als (2,1). Sie wissen, dass man R2 geometrisch als die Ebene deuten kann, indem man (x, y) als Punkt P mit den kartesischen (d.h. auf ein rechtwinkliges Koordinatensystem bezogenen) Koordinaten (x, y) interpretiert: y
P
y 1
Die erste Zahl (hier x) heisst die Abszisse von P . Die zweite Zahl (hier y) heisst die Ordinate von P . x
x
1
Zahlenpaare, die Koordinaten eines Punktes sind, pflegt man manchmal mit einem senkrechten Strich zu bezeichnen: (x|y) statt (x, y). Wir verwenden hier aber immer die Schreibweise mit dem Komma. (26.3) Reelle Zahlen a) Der Begriff der reellen Zahl Wir befassen uns hier kurz mit dem Begriff der reellen Zahl. Es kann aber nicht darum gehen, eine strenge Definition der reellen Zahlen zu geben. Eine solche geh¨ort in die “reine” Mathematik und ist u ¨berdies recht kompliziert und abstrakt. F¨ ur uns gen¨ ugt es, eine reelle Zahl als unendlichen Dezimalbruch aufzufassen, wie etwa 3.14159265 . . . oder − 0.333333 . . . . Dabei kennen wir als Spezialfall die abbrechenden Dezimalbr¨ uche, wie 2.5
oder
−8.125
oder
1000 ,
die man ja auch in Form eines unendlichen Dezimalbruchs schreiben k¨ onnte 2.50000 . . . ,
−8.12500000 . . . ,
1000.00000 . . . .
Schliesslich sei darauf hingewiesen, dass 0.9999 . . . = 1 ,
2.49999 . . . = 2.5 usw.
ist. b) Wichtige Teilmengen der reellen Zahlen Die Menge der reellen Zahlen bezeichnen wir (wie u ¨blich) mit R. Wichtige Teilmengen sind:
26. Zusammenstellung einiger Grundbegriffe
404
urlichen Zahlen. Es ist 1) Die Menge N der nat¨ N = {0, 1, 2, 3, . . .} . Beachten Sie, dass wir die Null mit zu den nat¨ urlichen Zahlen rechnen. Dies wird nicht in allen ussig, es handelt sich um eine Definitionsfrage. uchern so gehandhabt. Ein Streit dar¨ uber ist m¨ B¨ aufigkeiten ohne weiteres auch die Null ur uns massgebend sollte sein, dass beim Z¨ F¨ ahlen von H¨ vorkommen kann. Es gibt ja z.B. Ehepaare mit 0, 1, 2, . . . Kindern.
2) Die Menge Z der ganzen Zahlen. Es ist Z = {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} = {0, ±1, ±2, . . .} . 3) Die Menge Q der rationalen Zahlen. Eine reelle Zahl heisst rational, wenn sie von der Form ab mit a, b ∈ Z, b = 0 ist. Rationale Zahlen sind beispielsweise 1 3 7 2 , − 5 , 1 (= 7) etc. Ohne Beweis (vielleicht haben Sie einen solchen in der Mittelschule kennengelernt) sei erw¨ ahnt, dass jede rationale Zahl eine abbrechende oder eine periodische Dezimalbruchdarstellung besitzt: 1 = 0.25, 4
4 = 1.3333 . . . = 1.3, 3
2 = 0.285714285714285714 . . . = 0.285714 . 7
Umgekehrt stellt jeder derartige Dezimalbruch eine rationale Zahl dar.
Neben den rationalen Zahlen gibt es noch die irrationalen Zahlen, das sind einfach jene reellen Zahlen, welche nicht rational sind. Dazu geh¨oren z.B. die wichtigen Zahlen π und e (die Beweise f¨ ur die Irrationalit¨ at dieser Zahlen sind schwierig), √ √ aber auch Zahlen wie 2 und 3. c) Potenzen Auch hier geht es um eine Rekapitulation. 1) F¨ ur n ∈ N, n = 0 und alle a ∈ R ist an = $a · a · a%&· . . . · a' . (n−mal) 2) F¨ ur jedes a ∈ R, a = 0 setzt man a0 = 1 . 3) F¨ ur n ∈ N, n = 0 und alle a ∈ R, a = 0 definiert man a−n =
1 . an
a−1 =
1 . a
Speziell ist
26.4 Einige Formeln
405
4) Es sei q eine rationale Zahl und a sei eine positive reelle Zahl (a > 0). Wie definiert man aq ? Falls q > 0 ist, schreibt man q = m n mit m, n ∈ N, m, n = 0 und setzt √ aq = n am . (Dies ist auch noch f¨ ur a = 0 sinnvoll). Falls q < 0 ist, schreibt man q = − m n mit m, n ∈ N, m, n = 0 und setzt √ 1 n aq = √ = a−m . n am Speziell ist a1/n =
√ n
a.
Der Versuch, aq f¨ ur negative a und rationale, aber nicht ganze Exponenten q zu definieren, f¨ uhrt auf Schwierigkeiten. Deshalb setzten wir a > 0 voraus. Wenn man aber das Wurzelzeichen √ verwendet, so betrachtet man oft ungerade Wurzeln aus negativen Zahlen als sinnvoll: 3 −8 = √ 5 −2, −243 = −3 etc. .
Wir erw¨ ahnen hier noch folgende Konvention bez¨ uglich der Quadratwurzel: Es ist √ √ stets a ≥ 0, d.h., a bezeichnet die positive Zahl, deren Quadrat gleich a ist (vgl. (26.8)). (Entsprechendes gilt auch f¨ ur alle n-ten Wurzeln f¨ ur gerades n.) ur beliebige reelle x verschieben wir auf (26.13). 5) Die Definition von ax f¨ (26.4) Einige Formeln a) Fakult¨at Es sei n eine nat¨ urliche Zahl und es sei n = 0. Dann ist n! (gelesen “n Fakult¨ at”) definiert durch n! = 1 · 2 · 3 · . . . · (n − 1) · n , also z.B. 1! = 1, 2! = 1 · 2 = 2, 3! = 1 · 2 · 3 = 6 usw. Ferner definiert man 0! = 1 . b) Binomialkoeffizient Es sei n eine nat¨ urliche Zahl (n = 0 ist von Anfang an zugelassen). Ferner sei k eine nat¨ urliche Zahl mit 0 ≤ k ≤ n. Der Binomialkoeffizient nk (gelesen “n tief k”) ist definiert durch
26. Zusammenstellung einiger Grundbegriffe
406
n n! = . k k! (n − k)!
7·6·5 7 7! = = 35 . = 3! 4! 3·2·1 3
So ist z.B.
Spezialf¨alle sind (wegen der Festsetzung 0! = 1):
n n! = 1, = 0 0! n!
n n! = = 1, n n! 0!
0 0! = =1. 0 0! 0!
Wir treten hier nicht auf den Zusammenhang mit der Kombinatorik ein. Dagegen sei die f¨ ur alle n ∈ N g¨ ultige binomische Formel erw¨ahnt: (a + b)n = an +
n n−1 n n−2 2 a b+ a b + ... 1 2
n n 2 n−2 + abn−1 + bn . ... + a b n−1 n−2
(26.5) Das Summenzeichen Es seien n Zahlen x1 , x2 , . . . , xn gegeben. Die Summe x1 + x2 + x3 + . . . + xn wird oft durch das Zeichen
n
xi
i=1
abgek¨ urzt. Dabei heisst i der Summationsindex, 1 und n heissen die Summationsgrenzen. Es ist v¨ollig willk¨ urlich, welcher Buchstabe f¨ ur den Summationsindex verwendet wird. So ist etwa 4 4 xi = xk (= x1 + x2 + x3 + x4 ) . i=1
k=1
Manchmal ist es auch zweckm¨assig, Index und Grenzen gleichzeitig zu ¨andern: 4 i=1
xi =
5 j=2
xj−1 =
3 h=0
xh+1 .
26.6 Einige mathematische Symbole
407
Trotz seines Namens braucht der Summationsindex nicht unbedingt als Index aufzutreten. Beispiele hierzu: n
m
k = 1 + 2 + 3 + . . . + n,
k=1
kxk = 2x2 + 3x3 + . . . + mxm .
k=2
Die obenerw¨ ahnte binomische Formel l¨asst sich nun kurz in folgender Gestalt schreiben: n
n n−k k b . a k
(a + b)n =
k=0
Es kann vorkommen, dass in der Summe n
xi
i=1
alle xi = x sind. In diesem Fall ist n
xi = x1 + x2 + . . . + xn = x + x + . . . + x = nx .
i=1
Ersetzen wir auch unter dem Summenzeichen xi durch x, so erhalten wir die Formel n
x = nx .
i=1
Die beiden folgenden Rechenregeln f¨ ur das Summenzeichen beweist man sehr leicht durch “Ausschreiben” der Summen: n
ai +
i=1
c
n i=1 n i=1
bi = ai =
n i=1 n
(ai + bi ) , cai .
i=1
(26.6) Einige mathematische Symbole
a) Das Zeichen =⇒ (Implikation) steht zwischen zwei Aussagen und bedeutet, dass die zweite Aussage aus der ersten folgt, oder (etwas pr¨ aziser): “Wenn die erste Aussage wahr ist, dann auch die zweite.” Zum Beispiel gilt 0 < x < π =⇒ sin x > 0 .
26. Zusammenstellung einiger Grundbegriffe
408
Dies besagt folgendes: Wenn x zwischen 0 und π liegt, dann ist der Sinus von x (im Bogenmass gemessen, vgl. (26.15)) positiv. Man beachte, dass die umgekehrte Aussage sin x > 0 =⇒ 0 < x < π in diesem Fall nicht richtig ist (der Sinus ist n¨ amlich z.B. auch dann positiv, wenn 2π < x < 3π ist). alle, wo nicht nur die Implikation A =⇒ B, sondern auch ihre b) Es gibt aber auch F¨ Umkehrung B =⇒ A zutrifft. In diesem Fall schreibt man A ⇐⇒ B und sagt, die Aussagen A und B seien ¨aquivalent. Dies bedeutet folgendes: Wenn A wahr ist, dann ist auch B wahr und umgekehrt. Man sagt auch: A ist genau dann wahr, wenn B wahr ist. Zwei ¨aquivalente Aussagen sind also gleichwertig. Ein einfaches Beispiel hierzu: x3 > 0 ⇐⇒ x > 0 . c) Das Zeichen ≈ bedeutet “ungef¨ ahr gleich”. So ist z.B. π ≈
22 7 .
(26.7) Ungleichungen Ein weiteres wichtiges Werkzeug im Umgang mit reellen Zahlen sind Ungleichungen. Die folgenden Bezeichnungen sind wohlbekannt: ab:a a≥b:a
ist ist ist ist
kleiner als b, kleiner oder gleich b, gr¨ osser als b, gr¨ osser oder gleich b.
Das Rechnen mit Ungleichungen basiert auf vier einfachen Grundregeln: Regel I:
Aus a < b folgt a + c < b + c f¨ ur jede reelle Zahl c.
Regel II:
Aus a < b folgt ac < bc f¨ ur jede positive reelle Zahl c, (c > 0).
Regel III:
Aus a < b folgt ac > bc f¨ ur jede negative reelle Zahl c, (c < 0). 1 1 Aus 0 < a < b folgt 0 < < . b a
Regel IV:
Die dritte Regel wird am ehesten verletzt, und zwar deshalb, weil man bei einer Zahl x oft gar nicht daran denkt, dass sie negativ sein k¨ onnte: Aus 3 < 4 darf man nicht unbesehen schliessen, dass 3x < 4x ist, sondern muss ganz vorsichtig eine Fallunterscheidung machen: F¨ ur x > 0 ist 3x < 4x, f¨ ur x < 0 ist 3x > 4x (und f¨ ur x = 0 ist 3x = 4x = 0).
Setzt man in Regel III c = −1, so erh¨alt man als Spezialfall Aus a < b folgt −a > −b .
26.8 Der absolute Betrag
409
(26.8) Der absolute Betrag Der absolute Betrag |a| (kurz der Betrag) einer Zahl a ist — anschaulich — diese Zahl ohne ihr Vorzeichen. Beispielsweise ist |3| = 3 | − 2| = 2 |0| = 0 . Eine formelle Definition lautet: ( |a| =
a
f¨ ur
a≥0
−a
f¨ ur
a 0} definiert, denn negative Gewichte sind sinnlos. e) In den Naturwissenschaften sollte man sich daran gew¨ohnen, dass die Funktion nicht immer f und die “unabh¨ angige Variable” nicht immer x heisst. Die Gr¨ osse einer Population in Abh¨angigkeit von der Zeit t wird etwa mit N (t) bezeichnet. f) Man betrachtet auch Funktionen von mehreren Variablen, wie z.B. f (x, y) = x + y usw. (vgl. Kapitel 22). Eine andere Verallgemeinerung ist die, dass die Funktionswerte nicht reelle Zahlen, sondern Vektoren sind (vgl. (14.3)). g) Noch allgemeiner ist der Begriff der Abbildung: Es seien A, B irgendwelche Mengen. Eine Abbildung f : A → B ist dadurch gegeben, dass jedem Element a ∈ A in eindeutiger Weise ein Element f (a) ∈ B zugeordnet ist.
411
26.11 Rationale Funktionen
y h) Der Graph einer Funktion: Sie kennen die graphische Darstellung einer Funktion: Man f¨ uhrt ein rechtwinklif (x) ges (kartesisches) Koordinatensystem ein und tr¨agt u ¨ber jedem x aus D(f ) den zugeh¨origen Funktionswert y = f (x) ab. Die Menge G = G(f ) aller so erhaltenen Punkte der x-y–Ebene heisst der Graph der Funktion f : G = G(f ) = {(x, f (x)) | x ∈ D(f )} .
G(f )
D(f )
x
x
i) Im folgenden werden einige wichtige Funktionen einer Variablen n¨aher besprochen. (26.10) Polynomfunktionen Eine Polynomfunktion (kurz: ein Polynom) ist eine Funktion der Form f (x) = an xn + an−1 xn−1 + . . . + a2 x2 + a1 x + a0 , wobei a0 , a1 , . . . , an reelle Zahlen sind. Wenn an = 0 ist, so sagt man, f habe den Grad n. So ist z.B. f (x) = 2x4 + x3 − 3x + 1 eine Polynomfunktion 4. Grades. Speziell gilt: • Polynom vom Grad 0: Konstante Funktion f (x) = a • Polynom vom Grad 1: Lineare Funktion f (x) = ax + b • Polynom vom Grad 2: Quadratische Funktion f (x) = ax2 + bx + c. (26.11) Rationale Funktionen Rationale Funktion Eine Funktion q heisst eine rationale Funktion, wenn sie Quotient von zwei Polynomfunktionen f und g ist : q(x) =
f (x) . g(x)
Sie ist u ¨berall dort definiert, wo der Nenner nicht Null ist. Beispiele: 1 definiert f¨ ur x = 0 , x 2 x +1 r(x) = definiert f¨ ur x = 1 , x−1 1 s(x) = 2 definiert f¨ ur alle x . x +1
q(x) =
Jede Polynomfunktion kann als rationale Funktion aufgefasst werden (man w¨ ahle f¨ ur den Nenner g(x) die konstante Funktion g(x) = 1). Deshalb heissen Polynomfunktionen manchmal auch ganze rationale Funktionen.
26. Zusammenstellung einiger Grundbegriffe
412
y
Die Graphen der rationalen Funktionen kann man im Rahmen der Differentialrechnung untersuchen, vgl. (6.7). Den Graphen der Funktion q(x) = x1 , die Hyperbel, wollen wir aber auch an dieser Stelle skizzieren.
1 x 1
(26.12) Potenzfunktionen Unter einer Potenzfunktion versteht man eine Funktion der Form
f (x) = axr ,
wobei der Exponent eine beliebige (positive oder negative) reelle Zahl sein darf. Wir geben noch die Graphen der Potenzfunktionen f (x) = xr an. Wir d¨ urfen hier den konstanten Faktor a getrost weglassen, bewirkt er doch nur eine Streckung oder Stauchung des Graphen in y–Richtung (bei negativem a noch verbunden mit einer Spiegelung an der x–Achse), vgl. hierzu (18.2). Diese Graphen lassen sich in drei Klassen einteilen: A) Alle Potenzfunktionen mit r > 1 sehen ungef¨ahr aus wie die Parabel (r = 2). Sie “beginnen horizontal” bei 0. B) Alle Potenzfunktionen mit 0 < r < 1 verhalten sich im wesentlichen wie die Wurzelfunktion (r = 12 ). Sie “beginnen vertikal” bei 0. C) Alle Potenzfunktionen mit r < 0 besitzen einen Graphen a¨hnlich jenem der Hyperbel (r = −1). y
y
y
1
1
1 x 1 A)
x
x 1
1 B)
C)
26.13 Exponentialfunktionen
413
(26.13) Exponentialfunktionen In diesem Abschnitt werden die wichtigsten Grundtatsachen u ¨ber die Exponentialfunktionen zusammengestellt, dasselbe tun wir in (26.14) f¨ ur die Logarithmusfunktionen. F¨ ur weitere Angaben siehe (17.3) und (18.5). a) Definition: Eine Funktion der Form f (x) = ax
(a eine reelle Zahl > 0)
heisst eine Exponentialfunktion (weil die unabh¨ angige Variable x im Exponenten steht), genauer die Exponentialfunktion mit Basis a. Manchmal nennt man auch die etwas allgemeinere Funktion g(x) = Cax
(a > 0, C eine beliebige Konstante)
eine Exponentialfunktion. Man unterscheide gut zwischen • Potenzfunktion (26.12) • Exponentialfunktion
x → xa , x → ax .
b) Eine eher theoretische Betrachtung: Wir wollen uns u ¨ berlegen, was ax (a > 0) eigentlich bedeutet: F¨ ur eine nat¨ urliche Zahl n ist klar, ur eine ganze Zahl m (z.B. ist a−2 = 1/a2 ). Auch f¨ ur rationale Exponenten kennen was an ist, ebenso f¨ wir eine vern¨ unftige Definition, vgl. (26.3.c): m
an =
√ n
am
(n > 0) .
ur irrationale Exponenten x zu definieren. Das eigentliche Problem besteht nun darin, die Zahl ax auch f¨ Zu diesem Zweck gewinnt man aus der Dezimalbruchdarstellung von x eine Folge von rationalen Zahlen xn , welche gegen x konvergiert. Da xn rational ist, ist axn nach dem weiter oben Gesagten bereits definiert. Die gesuchte Zahl ax kann dann als Grenzwert der Folge axn definiert werden: ax = lim axn . n→∞
Eine andere (vom mathematischen Standpunkt aus elegantere) M¨ oglichkeit besteht darin, gem¨ ass (19.8.a) ex durch eine Potenzreihe und ln x als Umkehrfunktion von ex zu definieren und anschliessend ax = ex·ln a zu setzen.
c) Haupteigenschaften der Exponentialfunktionen Nachdem nun die Definition von ax (a > 0) prinzipiell gekl¨art ist, stellen wir einige Eigenschaften der Funktion f : R → R,
f (x) = ax
26. Zusammenstellung einiger Grundbegriffe
414
zusammen. Dabei wollen wir von jetzt an stets voraussetzen, dass a = 1 ist, denn ur a = 1 konstant und im Moment nicht weiter ur alle x ist die Funktion f¨ wegen 1x = 1 f¨ interessant. 1) 2) 3) 4)
f (0) = 1. f (1) = a. Es ist f (x) > 0 f¨ ur alle x ∈ R. urliche Exponenten bekannten Potenzrechenregeln gelten weiterhin: Die f¨ ur nat¨ ax ay = ax+y , (ab)x = ax bx
ax = ax−y , ay (a, b > 0) .
(ax )y = axy
f¨ ur alle
x, y
5) Eine “Nichtregel” als Warnung: ax + ay kann nicht weiter vereinfacht werden. d) Die Exponentialfunktion mit Basis e F¨ ur die Theorie ist vor allem der Fall wichtig, wo die Basis a gleich der sogenannten Eulerschen Zahl e ist: e = 2.718281828 . . . Einer der Gr¨ unde f¨ ur die Wichtigkeit dieser speziellen Wahl ist der, dass die Ableitung von ex gerade gleich ex ist. Betrachten wir kurz die Zahl e: Sie ist definiert als Grenzwert einer Folge, n¨ amlich der Folge 1 sn = (1 + )n . n In der nachstehenden Tabelle sind einige Glieder dieser Folge angegeben: n 1 2 3 4 5 10 100 1000 10000 100000 1000000
sn 2 2.25 2.37037. . . 2.44140. . . 2.48832 2.593742460. . . 2.704813829. . . 2.716923932. . . 2.718145926. . . 2.718268237. . . 2.718280469. . .
Beim Betrachten dieser Tabelle gewinnt man den Eindruck, dass die Folge (sn ) konvergiert, d.h. mit wachsendem n immer n¨ aher an eine gewisse Zahl, ihren Grenzwert,
26.13 Exponentialfunktionen
415
herankommt (dass dem auch wirklich so ist, liesse sich — mit einigem Aufwand — exakt beweisen). Dieser Grenzwert wird nun eben mit e bezeichnet: e = lim (1 + n→∞
1 n ) . n
Genauere Rechnungen ergeben f¨ ur die ersten Stellen von e: e = 2.71828182845904 . . . Beachten Sie, dass nach 2.7 (zuf¨ allig) zweimal die Ziffernfolge 1828 auftritt! Man kann aber zeigen, dass e eine irrationale Zahl ist; die Dezimalbruchentwicklung ist also nicht periodisch. Eine Darstellung von e als Summe einer Reihe finden Sie in (19.8.a).
Nach diesem Exkurs kehren wir wieder zur Exponentialfunktion mit der Basis e zur¨ uck. In diesem Fall spricht man einfach von der Exponentialfunktion (ohne weiteres Attribut, obwohl der Ausdruck “nat¨ urliche Exponentialfunktion” ganz vern¨ unftig w¨are). Die Funktion ex wird auch exp(x) geschrieben, was typographisch bequem ist. Ihre Werte kann man Tabellen oder dem Taschenrechner entnehmen. Die meisten Rechner k¨ onnen auch ax (a > 0) berechnen. Sonst behilft man sich hier mit der in (26.14) bewiesenen Formel ax = ex·ln a . e) Der Graph der Exponentialfunktion Der Graph von ax h¨ angt qualitativ vor allem davon ab, ob a < 1 oder a > 1 ist. Im ersten Fall f¨allt er, im zweiten w¨achst er. Wir skizzieren die Graphen f¨ ur die beiden typischen F¨alle a = 1/e und a = e. y
y 3
3 e
e y=
2
1 x e
= e−x
1
1 e−1 -1
y = ex
2
e−1
x 0
-1
1
Beachten Sie, dass die “fallende” Funktion f (x) = f (x) = e−x geschrieben wird, was wegen
1 e
= e−1 m¨ oglich ist.
0
x 1
1 x e
h¨ aufig in der Form
26. Zusammenstellung einiger Grundbegriffe
416
(26.14) Der Logarithmus a) Definition Die folgenden Ausf¨ uhrungen finden sich in einem etwas allgemeineren Umfeld auch in (17.3). Ein Blick auf den Graphen der Exponentialfunktion y = ax (mit a = 1) zeigt uns, dass zu jeder positiven Zahl y > 0 genau ein x existiert mit y = ax : y
y
y = ax
x x Wir k¨onnen also die Gleichung y = ax bei gegebenem y > 0 eindeutig nach x aufl¨ osen. Die so erhaltene Zahl x heisst (wie Sie von der Schule her wissen) der Logarithmus von y zur Basis a, in Zeichen x = loga y . Die Zuordnung y → loga y liefert eine Funktion, die Logarithmusfunktion zur Basis a. Ihr Definitionsbereich besteht aus allen y > 0 (da ax > 0 ist f¨ ur alle x, l¨asst sich der Logarithmus f¨ ur Zahlen ≤ 0 nicht definieren!). Es liegen also zwei gleichwertige Aussagen vor, (1)
x = loga y ⇐⇒ y = ax
welche als Definition des Logarithmus aufgefasst werden k¨onnen. In Worten: loga y ist die eindeutig bestimmte Zahl x, so dass ax = y ist. Ein Zahlenbeispiel: Da 23 = 8 ist, ist 3 = log2 8, ebenso folgt aus 5−1 = 1/5 = 0.2, dass log5 0.2 = −1 ist. Ersetzen wir in der Formel y = ax die Zahl x durch loga y (was wegen (1) zul¨ assig ist), so erhalten wir (2)
y = aloga y
f¨ ur alle y > 0 .
26.14 Der Logarithmus
417
ur y die Gr¨osse ax ein und finden Ganz entsprechend setzen wir in x = loga y f¨ x = loga ax
(3)
f¨ ur alle x .
Die Formeln (2) und (3) sind n¨ utzlich, um Logarithmen wegzuschaffen oder “Exponenten herunterzuholen”. b) Haupteigenschaften des Logarithmus 1) 2) 3) 4)
loga 1 = 0. loga a = 1. loga x ist nur f¨ ur x > 0 definiert. Rechenregeln f¨ ur Logarithmen: loga (rs) = loga r + loga s r loga = loga r − loga s s loga (rs ) = s · loga r
f¨ ur alle r, s > 0 f¨ ur alle r, s > 0 f¨ ur alle r > 0 und alle s ∈ R .
5) Eine “Nichtregel” als Warnung: loga (r + s) kann nicht weiter vereinfacht werden. c) Der nat¨ urliche Logarithmus Die Logarithmusfunktion zur Basis e (also die Umkehrfunktion von exp) heisst die nat¨ urliche Logarithmusfunktion. Man schreibt ln x
(oder auch log x) .
Mit Hilfe des nat¨ urlichen Logarithmus kann man die “allgemeine” mit der “nat¨ urlichen” Exponentialfunktion in Beziehung bringen, und ebenso die “allgemeine” und die nat¨ urliche Logarithmusfunktion. Es gelten n¨amlich folgende Formeln: ax = ex·ln a ln x loga x = , x>0. ln a x Die erste Formel folgt sofort aus den Beziehungen eln a = a und eln a·x = eln a . F¨ ur die zweite Formel wendet man ln auf die Beziehung x = aloga x an und findet ln x = ln aloga x = loga x · ln a, woraus das gesuchte Ergebnis folgt.
26. Zusammenstellung einiger Grundbegriffe
418
Der Graph des nat¨ urlichen Logarithmus sieht wie folgt aus (vgl. (17.3)): y y = ax 1 x 1
2
e3
Zum Schluss sei nochmals auf den fundamentalen Zusammenhang hingewiesen ((26.14.a), Formel (1)) y = ex ⇐⇒ x = ln y
(x, y, ∈ R, y > 0) .
Ferner gilt gem¨ ass (26.14.a), Formeln (2) und (3), eln y = y f¨ ur alle x
ur alle ln e = x f¨
y>0, x.
(26.15) Die trigonometrischen Funktionen Auch hier geht es um Grundbegriffe. Einige zus¨ atzliche Angaben zu den trigonometrischen Funktionen finden Sie in (17.2) und (18.3). a) Geometrische Definition von Sinus und Cosinus Die trigonometrischen Funktionen werden im Prinzip als bekannt vorausgesetzt. Im folgenden werden die wichtigsten Tatsachen rekapituliert. Zun¨ achst sei daran erinnert, dass wir f¨ ur die theoretischen Betrachtungen die Winkel stets im Bogenmass messen (englisch: radian). Der volle Kreisumfang (360◦ ) entspricht dann 2π, ein rechter Winkel (90◦ ) entspricht π2 , allgemein: tBogenmass = tGrad ·
π . 180
Wir betrachten nun den Einheitskreis, dessen Zentrum im Nullpunkt eines rechtwinkligen Koordinatensystems liegt. Den Winkel t tragen wir von der positiven x–Achse aus ab, und zwar so, dass dem Gegenuhrzeigersinn ein positiver Winkel entspricht. Der Winkel t bestimmt dann einen Punkt P auf dem Einheitskreis und somit auch dessen kartesische Koordinaten x und y in eindeutiger Weise. Deshalb sind x und y Funktionen von t. Man nennt x den Cosinus von t, y den Sinus von t:
26.15 Die trigonometrischen Funktionen
419
x = cos t,
y = sin t .
y 1 sin t
P t cos t
x 1
Die Winkel t, t ± 2π, t ± 4π, . . . , allgemein t + n2π (n ∈ Z), ergeben alle denselben Punkt P auf dem Einheitskreis. Es folgt sin(t + 2π) = sin t,
cos(t + 2π) = cos t
usw. Man sagt deshalb, Sinus und Cosinus seien periodische Funktionen mit der Periode 2π, vgl. (18.3). b) Die Graphen von Sinus und Cosinus y 1 −π
y
y = sin x x
π
-1
−π
2π
1 -1
y = cos x x
π 2π
c) Die wichtigsten Beziehungen Zwischen den trigonometrischen Funktionen bestehen viele Beziehungen, f¨ ur welche auf Formelsammlungen verwiesen sei. Wir erw¨ ahnen hier nur die allerwichtigsten: 1) 2) 3) 4) 5) 6)
sin2 x + cos2 x = 1 sin(−x) = − sin x cos(−x) = cos x sin x + π2 = cos x sin(x ± y) = sin x cos y ± cos x sin y cos(x ± y) = cos x cos y ∓ sin x sin y
f¨ ur f¨ ur f¨ ur f¨ ur f¨ ur f¨ ur
alle x. alle x. alle x. alle x. alle x, y. alle x, y.
Die Formeln 5) und 6) heissen Additionstheoreme.
26. Zusammenstellung einiger Grundbegriffe
420
d) Tangens und Cotangens Man definiert tan x =
sin x , cos x
cot x =
cos x . sin x
Offenbar ist der Tangens u ¨berall dort definiert, wo cos x = 0 ist, also f¨ ur alle x =
π + kπ 2
(k ∈ Z) .
Entsprechend ist der Cotangens f¨ ur alle x definiert, f¨ ur die sin x = 0 ist, also f¨ ur alle x = kπ
(k ∈ Z) .
Wegen der Periodizit¨ at von sin und cos haben tan und cot sicher die Periode 2π. In Wirklichkeit haben sie sogar die Periode π, denn es gilt tan(x + π) =
sin(x + π) − sin x sin x = = = tan x cos(x + π) − cos x cos x
und analog f¨ ur f¨ ur den Cotangens. Die Graphen sehen wie folgt aus: y
y
π 2
1
π
x
y = tan x
1
π 2
π
x
y = cot x
e) Secans und Cosecans Eher der Kuriosit¨ at halber seien noch die folgenden Funktionen erw¨ ahnt (man trifft sie in der amerikanischen Literatur gelegentlich an): Secans:
sec x =
Cosecans:
csc x =
1 cos x 1 sin x
(Definitionsbereich wie tangens), (Definitionsbereich wie cotangens).
26.16 Das griechische Alphabet
421
(26.16) Das griechische Alphabet
A B Γ Δ E Z H Θ
α β γ δ ε ζ η θ
Alpha Beta Gamma Delta Epsilon Zeta Eta Theta
I K Λ M N Ξ O Π
ι κ λ μ ν ξ o π
Iota Kappa Lambda M¨ u N¨ u Xi Omikron Pi
P Σ T Y Φ X Ψ Ω
ρ σ τ υ ϕ χ ψ ω
Rho Sigma Tau Ypsilon Phi Chi Psi Omega
422
¨ 27. EINIGE ERGANZUNGEN ¨ (27.1) Uberblick In diesem Kapitel sind f¨ ur speziell interessierte Leserinnen und Leser einige ausgew¨ ahlte Beweise zusammengestellt, deren Einf¨ ugung in den laufenden Text nicht zweckm¨assig erschien. (27.2) Skalar- und Vektorprodukt a) Distributivit¨ at des Skalarprodukts Hier geht es darum, die Formeln (3a)
(a + b)c = ac + bc
und (3b)
a(b + c) = ab + ac
von (1.8.d) geometrisch zu begr¨ unden. Wegen der Kommutativit¨ at des Skalarprodukts (Regel (1) von (1.8.d)) gen¨ ugt es, (3b) zu beweisen. F¨ ur a = 0 gilt die Formel sicher. F¨ ur a = 0 setzen wir e = | a1 | a; dies ist ein Einheitsvektor. Es reicht nun aus, die Formel e(b + c) = eb + ec
(∗)
nachzuweisen, denn aus (∗) folgt durch Multiplikation mit |a| unter Ben¨ utzung von Regel (2) von (1.8.d) die gew¨ unschte Formel (3b). Nun hat eb eine einfache geometrische Bedeutung. Wenn wir mit b1 den auf e projizierten Vektor b bezeichnen, dann hat b1 bis aufs Vorzeichen die L¨ ange eb = |e||b| cos ϕ. Diese Zahl ist > 0, wenn ϕ ein spitzer und < 0, wenn ϕ ein stumpfer Winkel ist. Deshalb gilt in beiden F¨ allen die einheitliche Formel b1 = (eb)e (dies ist ein Ausdruck der Form Skalar (eb) mal Vektor (e)). Analog ist c1 = (ec)e. Geometrisch ist klar, dass die Projektion des Summenvektors b + c auf e gerade die Summe der Projektionen b1 bzw. c1 ist (vgl. die Figur, die r¨ aumlich aufzufassen ist, da e, b und c nicht in einer Ebene zu liegen brauchen). Somit gilt (e(b + c))e = (eb)e + (ec)e = (eb + ec)e , also m¨ ussen die Skalare e(b + c) und eb + ec gleich sein. Dies ist aber genau die Formel (∗).
b ϕ
e b1
b ϕ e b1 b + c b
b) Formel (2) f¨ ur das Vektorprodukt
c
Die Formel (2) von (1.9.c) lautet
e
(ra) × b = a × (rb) = r(a × b) . Wegen der “Antikommutativit¨ at” des Vektorprodukts (Regel (1) von (1.9.c)) gen¨ ugt es, zu zeigen, dass (∗∗)
(ra) × b = r(a × b)
423
27.3 Beweise der Ableitungsregeln und -formeln
gilt. F¨ ur r > 0 haben a und ra dieselbe Richtung, und die Beziehung (∗∗) folgt wegen |(ra) × b| = |ra| |b| sin ϕ = r |a| |b| sin ϕ = |r(a × b)| . F¨ ur r < 0 hat ra die zu a entgegengesetzte Richtung, und es ist |ra| = |r| |a| = −r|a|. Die von ra und b aufgespannte Ebene ist deshalb dieselbe wie die von a und b aufgespannte. Die k¨ urzeste Drehung, welche ra in b u ¨berf¨ uhrt, und die k¨ urzeste Drehung, welche a in b u ¨berf¨ uhrt, haben entgegengesetzten Drehsinn. Somit hat (ra) × b die zu a × b entgegengesetzte Richtung. F¨ ur den Betrag gilt weiter
π−ϕ ra
b ϕ
a
|(ra) × b| = |ra| |b| sin(π − ϕ) = |ra| |b| sin ϕ = |r| |a| |b| sin ϕ = |r(a × b)| . Schliesslich hat r(a × b) wegen r < 0 die zu a × b entgegengesetzte Richtung, also dieselbe Richtung wie (ra) × b. Alles zusammen liefert (ra) × b = r(a × b), d.h. die gesuchte Beziehung (∗∗). c) Distributivit¨ at des Vektorprodukts Hier sollen die Formeln (3) von (1.9.c), n¨ amlich (a + b) × c = a × c + b × c
und
a × (b + c) = a × b + a × c
begr¨ undet werden. Wegen der “Antikommutativit¨ at” des Vektorprodukts braucht nur eine der Formeln, beispielsweise die zweite, bewiesen zu werden. F¨ ur a = 0 ist alles klar. F¨ ur a = 0 setzen wir (wie schon im Fall des Skalarprodukts in a)) e = | a1 | a (ein Einheitsvektor). Wir zeigen (∗∗∗)
e × (b + c) = e × b + e × c .
Daraus folgt dann durch Multiplikation mit |a| (unter Verwendung der Regel (2) von (1.9.c)) die gew¨ unschte Formel. Der Vektor e × b hat die L¨ ange |b| sin ϕ. Dies ist gerade die L¨ ange der Projektion von b auf die Normalebene E zu e. Da e × b normal auf b e und b steht, liegt e × b in der Ebene E, und man sieht, dass e × b die e um einen rechten Winkel gedrehte Projektion von b ist. (Der Drehsinn ergibt sich aus der “Rechte-Hand-Regel”.) Der Vektor e × c l¨ asst sich ϕ E analog deuten. Schliesslich ist e × (b + c) die um einen rechten Winkel · e × b gedrehte Projektion des Summenvektors b + c auf E. Nun l¨ auft es aber auf dasselbe hinaus, ob wir die Vektoren b und c zuerst einzeln projizieren, drehen und dann die Summe bilden oder ob wir zuerst die Summe bilden und dann projizieren und drehen. Im ersten Fall erhalten wir e × b + e × c, im zweiten Fall e × (b + c), d.h. wir haben die gesuchte Gleichheit (∗∗∗) gefunden.
(27.3) Beweise der Ableitungsregeln und -formeln In (5.7) sind im Sinne einer exemplarischen Auswahl einige Ableitungsregeln und -formeln hergeleitet worden. Wegen der Wichtigkeit dieser Regeln folgen hier die noch fehlenden Beweise. In a), b) und c) wird vorausgesetzt, dass f und g in x0 differenzierbar sind.
27. Einige Erg¨ anzungen
424
a) Summenregel Wir setzen h(x) = f (x) + g(x). Gesucht ist h (x0 ) = lim
Δy
x→x0 Δx
Δy h(x) − h(x0 ) = . Δx x − x0
mit
Wir formen den Differenzenquotienten um: f (x) + g(x) − f (x0 ) − g(x0 ) Δy = Δx x − x0 =
f (x) − f (x0 ) g(x) − g(x0 ) + . x − x0 x − x0
Nach Voraussetzung streben die beiden Summanden rechts mit x → x0 gegen f (x0 ) bzw. g (x0 ). Somit existiert Δy h (x0 ) = lim x→x0 Δx und es ist h (x0 ) = f (x0 ) + g (x0 ) . Der Fall f (x) − g(x) wird genau gleich behandelt. b) Regel vom konstanten Faktor Wir setzen h(x) = cf (x). Gesucht ist Δy
h (x0 ) = lim
x→x0 Δx
Eine einfache Umformung liefert
mit
Δy cf (x) − cf (x0 ) . = Δx x − x0
f (x) − f (x0 ) Δy =c , Δx x − x0
und da der Quotient gegen f (x0 ) strebt, strebt die ganze rechte Seite gegen cf (x0 ), woraus h (x0 ) = cf (x0 ) folgt. c) Quotientenregel Es sei h(x) =
f (x) und es sei g(x0 ) = 0. g(x)
Es ist
f (x) Δy 1 f (x0 ) = − Δx x − x0 g(x) g(x0 ) f (x)g(x ) − f (x )g(x) 1 0 0 . = x − x0 g(x)g(x0 )
Mit einem a ¨hnlichen Trick wie bei der Produktregel (5.7.a) folgt: Δy f (x)g(x0 ) − f (x)g(x) + f (x)g(x) − f (x0 )g(x) 1 = Δx x − x0 g(x)g(x0 ) g(x) − g(x0 ) 1 f (x) − f (x0 ) − f (x) · = g(x) · g(x)g(x0 ) x − x0 x − x0 1)
2)
? 1 g(x0 )g(x0 )
3)
4)
5)
?
?
?
?
g(x0 )
f (x0 )
f (x0 )
g (x0 )
425
27.3 Beweise der Ableitungsregeln und -formeln
Die angegebenen Grenzwerte gelten in den F¨ allen 1), 2), 4) wegen der Stetigkeit von f bzw. g in x0 , in den F¨ allen 3) und 5) nach Voraussetzung. Δy Man schliesst, dass h (x0 ) = limx→x0 existiert und dass Δx h (x0 ) =
f (x0 )g(x0 ) − f (x0 )g (x0 ) g(x0 )2
ist. d) Kettenregel Die Voraussetzungen sind: g ist differenzierbar in x0 , f ist differenzierbar in y0 = g(x0 ). In (5.7.b) haben wir eine Plausibilit¨ atsbetrachtung f¨ ur die Kettenregel durchgef¨ uhrt, die aber einen i.a. nicht zul¨ assigen Schritt, n¨ amlich eine Erweiterung mit 00 enthielt. Wir umgehen im nachstehenden Beweis diese Schwierigkeit, indem wir darauf achten, dass y − y0 nie im Nenner steht, ausser es sei y = y0 . Wir setzen dazu ⎧ ⎨ f (y) − f (y0 ) k(y) = y − y0 ⎩ f (y0 )
f¨ ur
y = y0
f¨ ur
y = y0 .
Diese neue Funktion hat offenbar die Eigenschaft, dass lim k(y) = lim
y→y0
y→y0
f (y) − f (y0 ) = f (y0 ) = k(y0 ) y − y0
ist (k ist also in y0 stetig). Ferner gilt f¨ ur alle y aus dem Definitionsbereich von f : k(y)(y − y0 ) = f (y) − f (y0 ) . (F¨ ur y = y0 folgt dies aus der Definition, f¨ ur y = y0 sind beide Seiten der Gleichung = 0.) Nun formen wir den Differenzenquotienten um: Δy f (y) − f (y0 ) k(y)(y − y0 ) f (g(x)) − f (g(x0 )) = = = Δx x − x0 x − x0 x − x0 g(x) − g(x0 ) = k(y) f¨ ur alle x = x0 . x − x0 F¨ ur x → x0 strebt (wegen der Stetigkeit) y = g(x) gegen y0 = g(x0 ). Damit strebt k(y) gegen k(y0 ) = f (y0 ) und der Differenzenquotient strebt gegen g (x0 ). Somit existiert h (x0 ) = lim
Δy
x→x0 Δx
und es ist
h (x0 ) = f (y0 ) · g (x0 ) = f (g(x0 )) · g (x0 ) .
e) Eine Bemerkung In den vorangegangenen Betrachtungen haben wir stillschweigend einige Rechenregeln f¨ ur Grenzwerte von Funktionen gebraucht, in a) z.B. “Der Grenzwert einer Summe ist die Summe der Grenzwerte”. Mit einigem Aufwand kann man diese Behauptungen unter Verwendung der exakten Definition des Grenzwerts auch rechnerisch beweisen. Es gelten die folgenden Formeln:
27. Einige Erg¨ anzungen
426
1) 2) 3) 4)
lim (f (x) + g(x)) = lim f (x) + lim g(x) ,
x→x0
x→x0
x→x0
lim (f (x) − g(x)) = lim f (x) − lim g(x) ,
x→x0
x→x0
x→x0
lim c · f (x) = c · lim f (x) ,
x→x0
x→x0
lim (f (x) · g(x)) = lim f (x) · lim g(x) ,
x→x0
x→x0
x→x0
f (x) limx→x0 f (x) 5) lim = falls lim g(x) = 0 . x→x0 g(x) x→x0 limx→x0 g(x) Die Formeln sind so zu interpretieren: Wenn die Grenzwerte auf der rechten Seite einer Formel existieren, dann existiert auch der Grenzwert auf der linken Seite und die angegebene Gleichheit gilt. f) Ableitung der konstanten Funktion f (x) = c Dies ist ganz einfach: Es ist f (x) − f (x0 ) c−c Δy = = =0 Δx x − x0 x − x0 und somit auch f (x0 ) = lim
Δy
x→x0 Δx
=0
f¨ ur alle x0 .
g) Die Ableitung der Exponentialfunktion In (5.7.c) ist die Ableitung des nat¨ urlichen Logarithmus bestimmt worden: (ln x) =
1 x
(x > 0) .
Nun ist aber der nat¨ urliche Logarithmus die Umkehrfunktion der Exponentialfunktion: y = f (x) = ex ⇐⇒ x = g(y) = ln y . Wir k¨ onnen also die Formel von (17.4) anwenden und finden 1 1 f (x) = = = y = ex . g (y) 1/y Somit ist (ex ) = ex . h) Die Ableitung der allgemeinen Exponential- und Logarithmusfunktion Es sei f (x) = ax (= ex·ln a )
(vgl. (26.14.c)) .
Wir berechnen f mit der Kettenregel, wobei die innere Ableitung gleich ln a ist: f (x) = ln a · ex·ln a = ln a · ax . Ferner sei g(x) = loga x =
ln x ln a
(vgl. (26.14.c)) ,
und die Regel vom konstanten Faktor liefert g (x) =
1 . x · ln a
427
27.3 Beweise der Ableitungsregeln und -formeln
i) Die Ableitung der allgemeinen Potenzfunktion Es sei f (x) = xn f¨ ur einen beliebigen Exponenten n ∈ R und f¨ ur x > 0. Dann ist f (x) = en·ln x . f bestimmt sich durch die Kettenregel, wobei diesmal die innere Ableitung = n x ist. Man findet f (x) =
n n·ln x n = xn = nxn−1 . e x x
j) Die Ableitung der Sinusfunktion Als Vorbereitung zeigen wir mittels der geometrischen Definition der trigonometrischen Funktionen, dass folgende Beziehung gilt: sin x lim =1. x→0 x Wie der Beweis zeigen wird, gilt dies aber nur dann, wenn der Winkel im Bogenmass gemessen wird! Dazu stellen wir zun¨ achst fest, dass es wegen ten.
sin(−x)
−x
sin x = −−x =
sin x
x
gen¨ ugt, x > 0 zu betrach-
Der untenstehenden Skizze entnimmt man, dass das Dreieck OAP einen kleineren Fl¨ acheninhalt hat als der Sektor OBP , und dieser wiederum hat einen kleineren Fl¨ acheninhalt als das Dreieck OBQ. Dr¨ uckt man diese Fl¨ acheninhalte mit den aus der Geometrie bekannten Formeln aus, so folgt f¨ ur alle x mit 0 < x < π/2:
(∗)
1 1 1 1 sin x sin x · cos x < x < tan x = . 2 2 2 2 cos x
Q P tan x
1
x
sin x
O
cos x
A
B
Dabei wurde noch ben¨ utzt, dass die Strecke OB die L¨ ange 1 hat (Radius des Einheitskreises) und dass OA = cos x, AP = sin x und BQ = tan x ist. Wir formen (∗) um, indem wir mit 2 multiplizieren und durch sin x dividieren: cos x
x0 ) mit F (z) = 0. (Auf eine strenge Begr¨ undung sei verzichtet. Die Skizze zeigt eine der m¨ oglichen Situationen.)
F
t x
z
x0
ur n = 1 27.6 Die Taylorsche Formel f¨
431
Die Ableitung von F (t) berechnet sich auf etwas langatmige, aber prinzipiell nicht schwierige Weise mit der Produkt- und der Kettenregel. (Beachten Sie: t ist variabel, x und x0 sind konstant.) f (t) f (t) (x − t) − 1! 1! f (t) f (t) 2 (x − t) − · 2(x − t) + 2! 2! (4) f (t) f (t) + (x − t)3 − · 3(x − t)2 3! 3! . . .
F (t) = f (t) +
+
f n+1) (t) f (n) (t) A (x − t)n − · n(x − t)n−1 − (n + 1)(x − t)n . n! n! (n + 1)!
Wir haben mehr Terme als in (3) angeschrieben, damit man sieht, wie sich fast alles weghebt (f (t) und
f (t) f (t) 1!
,
1!
(x − t) und
f (t) 2!
2(x − t) usw.).
Es bleibt u ¨brig: F (t) =
(4)
f (n+1) (t) A (x − t)n − (x − t)n . n! n!
F¨ ur die Zahl z mit x < z < x0 (bzw. x0 < z < x) gilt F (z) = 0. Wir erhalten so: A f (n+1) (z) (x − z)n = (x − z)n , n! n! woraus sofort A = f (n+1) (z) folgt, was behauptet worden war. Damit ist die Taylorsche Formel bewiesen.
(27.6) Die Taylorsche Formel f¨ ur n = 1 In diesem Fall hat diese Formel die Gestalt f (x) = f (x0 ) + f (x0 )(x − x0 ) +
f (z) (x − x0 )2 2!
f¨ ur ein z zwischen x und x0 . Hier ist p(x) = f (x0 ) + f (x0 )(x − x0 ) gerade die in (7.3) besprochene lineare Ersatzfunktion. Damit wird r(x) = f (x) − p(x) = und weiter |f (x) − p(x)| =
f (z) (x − x0 )2 2!
|f (x)| (x − x0 )2 . 2
Ist nun M das Maximum des Betrages der 2. Ableitung in [x, x0 ] bzw. [x0 , x], so ist |f (x) − p(x)| ≤ Dies ist die (7.3), Bemerkung b) erw¨ ahnte Formel.
M (x − x0 )2 . 2
27. Einige Erg¨ anzungen
432
(27.7) Die Simpson-Formel In diesem Abschnitt wird die (kleine) Simpson-Formel begr¨ undet. Die dahintersteckende Idee ist es, die Funktion f durch ein quadratisches Polynom zu ersetzen. Es gibt genau eine Polynomfunktion 2. Grades p(x), deren Graph durch die drei Punkte
(a, f (a)) = (a, y0 ),
a + b 2
, f(
a + b a + b ) = , y1 (b, f (b)) = (b, y2 ) 2 2
f y0 a
p y2
y1 b
geht. Diese Funktion p(x) wird sich nicht allzusehr von f (x) unterscheiden, woraus b a
f (x) dx ≈
b p(x) dx a
folgt. Nun ben¨ otigen wir zun¨ achst eine Formel f¨ ur p(x). Es ist rechnerisch einfacher, nicht den eigentlich naheliegenden Ansatz p(x) = r0 + r1 x + r2 x2 mit noch zu bestimmenden Koeffizienten r0 , r1 , r2 zu machen, sondern p(x) = s0 + s1 (x − a) + s2 (x − a)(x − b) zu setzen*. Die scheinbare Komplizierung wird dadurch wettgemacht, dass p(a) = 0 ist. Wir bestimmen jetzt die Koeffizienten s0 , s1 , s2 so, dass gilt: p(a) = y0 ,
p(
a+b ) = y1 , 2
p(b) = y2 .
Dazu setzen wir ein: Aus p(a) = s0 und der Forderung p(a) = y0 finden wir sofort s 0 = y0 . Analog: Aus y2 = p(b) = s0 + s1 (b − a) = y0 + s1 (b − a) folgt s1 =
y2 − y 0 . b−a
Die Rechnung f¨ ur s2 ist etwas l¨ anger: p(
b−a b−a a−b a+b ) = y1 =⇒ y1 = s0 + s1 ( ) + s2 ( )( ) 2 2 2 2 y 2 − y0 b − a a−b 2 = y0 + ( ) − s2 ( ) . b−a 2 2
Weitere Umformungen liefern schliesslich s2 =
2y0 − 4y1 + 2y2 . (a − b)2
* Man spricht hier vom Newtonschen Interpolationspolynom. Ein analoger Ansatz wird verwendet, wenn ein Polynom vom Grad n durch n + 1 Punkte gelegt werden soll.
27.7 Die Simpson-Formel
433
ahnt, Gem¨ ass Konstruktion gilt, wie schon erw¨ b a
f (x) dx ≈
b p(x) dx . a
Wir berechnen jetzt das rechtsstehende Integral.
a
b
b
b p(x) dx = s0
a
dx + s1
= s0 (b − a) + s1 ·
a
(x − a) dx + s2
b a
(x − a)(x − b) dx
1 1 (b − a)2 + s2 · (a − b)3 . 2 6
(Die detaillierte Berechnung der drei Integrale sei Ihnen u ¨berlassen, wir haben gleich das Schlussresultat angegeben.) Setzt man nun noch die vorher bestimmten Werte f¨ ur die Koeffizienten s0 , s1 , s2 ein, so folgt b a
p(x) dx = y0 (b − a) +
y2 − y 0 1 2y0 − 4y1 + 2y2 1 · (b − a)2 + · (a − b)3 . b−a 2 (a − b)2 6
K¨ urzt und klammert man b − a vor, so findet man b
1 1 p(x) dx = (b − a) y0 + (y2 − y0 ) − (2y0 − 4y1 + 2y2 ) . 2 6 a
Mit einer weiteren Umformung folgt als gew¨ unschtes Ergebnis die Simpson-Formel: b a
f (x) dx ≈
b p(x) dx = a
b−a (y0 + 4y1 + y2 ) . 6
434
¨ 28. LOSUNGEN DER AUFGABEN (28.1) L¨osungen zu Kapitel 1 1−1 Verkleinerte Zeichnung. Die Summe a + b kann in der Ebene konstruiert werden; c wird in diese Ebene geklappt (c1 ). Dann ist |a + b + c| = |a + b + c1 |. Eine (nicht verlangte) Rechnung liefert f¨ ur diese L¨ ange 7.87 cm.
a b
a + b +
c1
c1
wird eine zu G parallele Gerade einge1−2 Im Endpunkt von F geschnitten. Eine (nicht zeichnet und mit der Richtung von R = 9.85 N, |R| = 9.40 N. verlangte) Rechnung ergibt |G|
G R 110◦ F
P 80◦
P
− − → − − → − − → −−→ − − → − − → 1−3 a) Wegen P Q = OQ − OP ist P M = 12 (OQ − OP ). Es folgt −−→ − − → 1 − − → − − → − − → − − → OM = OP + 2 (OQ − OP ) = 12 (OP + OQ). − → − − → −−→ − − → − → −−→ r (− r − b) Analog ist P N = r+ s OQ−OP ) und ON = OP + r +s (OQ− − − → − − → − − → 1 OP ) = r+s (sOP + rOQ).
M
O
Q C
−−−→ −→ −→ −−−→ 1−4 Es ist AMa = 12 (AB + AC), vgl Aufg. 1−3. Analog ist BMb = − − → −−−→ − − → −→ −→ 1 −→ 1 −→ (BA + BC), CMc = 2 (CA + CB). Wegen AB = −BA usw. 2 −−−→ −−−→ −−−→ folgt AMa + BMb + CMc = 0.
Mb Ma
A Mc
−−→ − − → 1−5 Es ist OM = 12 u + 12 v + w . Wegen Aufg. 1−3 ist dann OP = −→ − − → 1 − 1 1 1 1 1 3 1 (OM + OV ) = 4 u + 4 v + 2 w + 2 y = 4 u + 4 v + 2 w . (Ein 2 solcher Ausdruck heisst u ¨brigens eine Linearkombination von u, v , w .)
B
M P U
w
V
u
v O
osungen zu Kapitel 1 28.1 L¨
435
1−6 a) Wenn |a| = |b| ist, dann sind, wie man der Skizze (Rhombus!) entnimmt, a + b und a − b die Richtungen der beiden Winkelhalbierenden. b) Es kommt hier nur auf die Richtung der Vektoren a und b und nicht auf ihre L¨ ange an. Wir ersetzen daher a durch den Einheitsvektor a1 = | a1 | a, analog b1 = 1 b.
a
|b|
b
Da a1 und b1 gleiche L¨ ange haben, k¨ onnen wir a) anwenden und finden f¨ ur die Richtungen der beiden Winkelhalbierenden die Vektoren a1 ±b1 . Nat¨ urlich gibt jedes Vielfache dieser Vektoren ebenfalls die gew¨ unschte Richtung an, z.B. (multipliziere mit |a||b|) die Vektoren |b|a ± |a|b.
Y C D −→ − − → −→ −−→ 1−7 Aus der Zeichnung folgt W X = 12 AB + 12 BC und Y Z = −→ − − → −→ − − → −−→ − − → 1− CD + 12 DA. Nun ist aber AB + BC + CD + DA = 0 (ge2 X −−→ −→ schlossenes Viereck), woraus W X + Y Z = 0 folgt. Die Vektoren Z −−→ −→ W X und −Y Z sind also in dem Sinne gleich, dass sie denselben freien Vektor vertreten, sie sind somit gleich lang und parB −−→ −−→ W allel. Dasselbe gilt f¨ ur XY und −ZW . Das Viereck W XY Z ist daher ein Parallelogramm und liegt deshalb in einer Ebene, A unabh¨ angig von der Lage von A, B, C und D. − − → − − → 1−8 P sei der Mittelpunkt von OA, Q jener von BC. Dann ist OP = 12 a, OQ = 12 (b +c). Damit ist r(t) = 1 a + t · 1 (b +c −a) eine Parameterdarstellung von g, analog ist s(u) = 1 b + u· 1 (a +c −b) 2
2
2
2
eine solche von h. (Da zwei verschiedene Geraden vorliegen, m¨ ussen wir auch zwei verschiedene Parameter (t, u) verwenden.) Setzt man t = u = 12 , so wird r( 12 ) = s( 12 ) = 14 (a + b + c). Die −→ Geraden schneiden sich also im Punkt S mit OS = 1 (a + b + c). 4
PS. Da Parameterdarstellungen nie eindeutig bestimmt sind, sind Sie vielleicht auf andere L¨ osungen gekommen, z.B. auf r(t) = 12 a + t(b +c −a). In jedem Fall m¨ ussen Sie aber denselben −→ Ortsvektor OS erhalten. 1−9 Ausmultiplizieren (unter Verwendung der Regeln von (1.8.d)) ergibt (a − b)(a + 2b) = a2 +ab − √ 2b2 = |a|2 + |a||b| cos 45◦ − 2|b|2 = 1 + 2 · 2 − 8 = −5.586. 2
1−10 Mit den eingezeichneten Vektoren a und b (|a| = a, |b| = b) sind die Diagonalen durch d = a + b und e = a − b gegeben. Dann ist d2 + e2 = |d|2 + |e|2 = (a + b)2 + (a − b)2 = a2 + 2ab + b2 + a2 − 2ab + b2 = 2a2 + 2b2 = 2a2 + 2b2 .
a
b 1−11 Die eingetragenen Vektoren a, b bzw. d haben die L¨ angen 2, 3 bzw. 4. Dabei ist d = a + b. a) Es folgt d2 = a2 + 2ab + b2 und weiter ab = 12 (d2 − a2 − b2 ) = 12 (16 − 4 − 9) = 32 . Schreiben wir nun ab in der Form |a||b| cos α = 2 · 3 · cos α, so finden wir 3 = 2 · 3 · cos α, also cos α = 14 , woraus α = 75.5◦ folgt. F¨ ur 2 β berechnen wir a ¨hnlich wie oben das Skalarprodukt a(a + b) auf zwei Arten: a(a + b) = a2 + ab = 4 + 32 = 11 , aber auch 2 , β= a(a+b) = |a||(a+b)| cos β = 2·4·cos β. Es folgt cos β = 11 16 46.6◦ . b) Die zweite Diagonale ist durch e = a − b gegeben. Nun ist e2 = (a − b)2 = a2 − 2ab + b2 = 4 − 2 · 32 + 9 = 10 (wir √ kennen den Wert von ab von oben), und daher ist |e| = 10.
d
a β α b
osungen der Aufgaben 28. L¨
436
− → − −→ 1−12 a) Es gilt OQ = a + b + c, AP = −a + b + c. b) Weil ab = ac = bc = 0 ist (dies wird im − → − folgenden oft ben¨ utzt), ist |OQ|2 = (a + b + c)2 = a 2 + b 2 + c 2 = 14. Somit haben OQ √ −→ − − → −→ − − → und AP die L¨ ange 14. c) Einerseits ist AP OQ = |AP ||OQ| cos ϕ. Anderseits gilt auch −→ − − → AP OQ = (−a + b + c)(a + b + c) = −a 2 + b 2 + c 2 = 12. Es folgt cos ϕ = 12/14, ϕ = −→ − − → −→ 31.0◦ . d) Es ist BA = a − b, BC = c − b. Somit ist |BA|2 = (a − b)2 = a2 + b2 = 5, also −→ √ − − → √ BA = 5. Analog BC = 13. (Sie k¨ onnen auch den Satz von Pythagoras verwenden.) Ferner √ √ −→ − − → −→ − − → −→ − − → 2 ist BA BC = (a − b)(c − b) = b = 4. Aus BA BC = |BA||BC| cos ψ = 5 13 cos ψ folgt √ cos ψ = 4/ 65, ψ = 60.26◦ . − − → −−→ − − → −−→ 1−13 a) Es muss OC AM = 0 sein. Nun ist OC = a + b, AM = 12 b − a, und Einsetzen ergibt √ 12 b − a2 = 0 (da ab = 0). Es folgt |b| = 2|a| ≈ 29.7 cm. b) Das Rechteck OACD hat die 2 Gr¨ osse eines DIN-A4-Blattes. 1−14 Da c ein Vielfaches von a ist, ist es zweckm¨ assig, den Einheitsvektor a1 = | a1 | a zu betrachten. ange von c. Somit Dann ist a1b = |a1 ||b| cos ϕ = |b| cos ϕ, und dies ist bis aufs Vorzeichen die L¨ ist c = (a1b)a1 . (Beachten Sie die Form: Die Zahl a1b wird mit dem Vektor a1 multipliziert.) Ist ϕ stumpf, so ist a1b < 0 und c zeigt in der zu a entgegengesetzten Richtung; die Formel ab 1 ab a, so folgt c = a. stimmt auch hier. Ersetzt man a1 durch a = |a| |a|2 aa 1−15 |a| |r| cos ϕ = ar = |r| bedeutet, dass entweder r = 0 ist, oder dass |a| cos ϕ = 1, d.h. cos ϕ = 0.5 oder ϕ = 60◦ ist. Sie m¨ ussen sich Vektoren im Raum (und nicht bloss in der Ebene) denken. Die gesuchten Punkte bilden daher den Mantel eines Kegels mit Spitze in O und Achsenrichtung ¨ a, dessen halber Offnungswinkel (bzgl. a) 60◦ betr¨ agt. 1−16 a) S¨ udpol, b) Nordpol, c) Punkt auf dem Aequator mit L¨ ange 30◦ W, d) dito mit L¨ ange 150◦ E, e) dies ist der Nullvektor, der keine Richtung hat. Ein Vergleich von d) und e) zeigt, dass das Vektorprodukt das Assoziativgesetz i.a. nicht erf¨ ullt. √ ) = 2, 1−17 Es ist |u| = |b| |c| sin( π 2 √ √ = 12 2 22 = 12 . |v | = 12 |c| |a × b| sin π 4 Da v die Richtung von b hat, ist v = 1 b. 2
u v
1−18 Wegen |a × b| = |a| |b| sin ϕ ist a × b = 0 genau dann, wenn b = 0 oder sin ϕ = 0 ist (denn −−→ − − → −−→ − − → a = 0). F¨ ur b = OX − OP bedeutet dies, dass entweder X = P gilt oder dass OX − OP parallel (ϕ = 0◦ ) oder “antiparallel” (ϕ = 180◦ ) zu a ist. Die Punkte X liegen also auf der Geraden durch P in Richtung a. 1−19 a) Eine in der Ebene liegende Horizontale steht sowohl auf g als auch auf n normal. Deshalb n, h2 = n × g (= −h1 ). b) r steht normal zu n und zur Horizontalen, hat also ist h1 = g × die Form ± n × h1 . Da der Apfel sicherlich nach unten rollt, u ¨berlegt man sich anhand einer n × (g × n) ist. (Andere L¨ osungen ergeben sich auf Grund der Skizze, dass r = n × h1 = Antikommutativit¨ at von ×.) 1−20 |a×b|2 +|ab|2 = |a|2 |b|2 sin2 ϕ+|a|2 |b|2 cos2 ϕ = |a|2 |b|2 , wobei die Beziehung sin2 ϕ+cos2 ϕ = 1 (vgl. (26.15)) benutzt wurde.
osungen zu Kapitel 2 28.2 L¨
437
(28.2) L¨osungen zu Kapitel 2 Aus Platzgr¨ unden werden die Koordinaten der Vektoren meist neben- statt untereinander geschrieben. −→ − − → − − → 2−1 a) Mit a = OA = (3, 2, −2) und c = OC = (0, 2, −1) ist b = OB = a +c = (3, 4, −3), also haben √ − − → −→ 2 2 2 wir B(3, 4, −3). b) |OB| = 3 + 4 + (−3) = 34 = 5.8310, |AC| = |c − a| = |(−3, 0, 1)| = √ √ √ − − → −→ − − → −→ 10 = 3.1623. c) cos ϕ = OB AC/|OB||AC| = −12/( 34 10) = −0.6508, also ϕ = 130.6◦ . Der verlangte spitze Winkel misst 49.4◦ . d) Da a und c in der Ebene liegen, stehen die Vektoren ± a × c = ±(2, 3, 6) normal dazu. Um die gesuchten Einheitsvektoren zu erhalten, muss noch durch den Betrag 7 dividiert werden. Die Antwort lautet: ±(2/7, 3/7, 6/7). 2−2 Die Gerade g bzw. h haben die Parameterdarstellung (1, 0, 1) + t(2, 2, −2) = (1 + 2t, 2t, 1 − 2t) −→ (denn AB = (3, 2, −1)− (1, 0, 1) = (2, 2, −2)), bzw. (5, 8, −1) + u(3, 1, −4) = (5 + 3u, 8 + u, −1 − 4u). (Vgl. (2.6.4). (Da zwei Geraden gleichzeitig vorkommen, m¨ ussen wir zwei verschiedene Parameter t und u verwenden.) F¨ ur den Schnittpunkt m¨ ussen drei Gleichungen mit zwei Unbekannten erf¨ ullt sein: 1 + 2t = 5 + 3u 2t = 8 + u 1 − 2t = −1 − 4u. Aus den ersten beiden erh¨ alt man t = 5, u = 2, und da diese beiden Werte auch die dritte Gleichung erf¨ ullen, schneiden sich g und h in dem zu diesen Werten geh¨ orenden Punkt R(11, 10, −9). 2−3 Gem¨ ass (2.6.7) ist (mit offensichtlichen Bezeichnungen) der Normalenvektor n = (b−a)×(c−a) = (−3, 3, 1)×(−5, 5, −1) = (−8, −8, 0). F¨ ur die Ebenengleichung n(r − a) = 0 erh¨ alt man durch Einsetzen −8x + 24 − 8y − 8 = 0, also 8x + 8y = 16, was zu x + y = 2 vereinfacht werden kann. In dieser Gleichung kommt z nicht vor, was bedeutet, dass die Ebene parallel zur z–Achse ist. Ihren Schnittpunkt mit der x–Achse erhalten wir, indem wir y = 0 setzen und so x = 2 bekommen; analog ist x = 0, y = 2 der Schnittpunkt mit der y–Achse.
z
2 x
2 y
2−4 Genau wie in (2.6.6) bestimmt man die Ebenengleichungen. E: 2x+y −z = 2, F : x+3y +z = 5. Da die Schnittgerade in beiden Ebenen liegt, hat sie einen Richtungsvektor q , der normal zu n und m ist. Wir k¨ onnen deshalb q = n×m = (4, −3, 5) setzen. Nun brauchen wir noch einen Punkt der Schnittgeraden, d.h. einen gemeinsamen Punkt von E und F . Wir suchen beispielsweise den Punkt der Schnittgeraden, der in der x-y–Ebene liegt, f¨ ur den also z = 0 gilt. Setzt man z = 0 in diese Gleichungen ein, so findet man 2x + y = 2 x + 3y = 5. Die L¨ osungen sind x = 1/5, y = 8/5, d.h. (1/5, 8/5, 0) ist ein gemeinsamer Punkt beider Ebenen. Nach (1.10.a) ist dann (1/5, 8/5, 0) + t(4, −3, 5) eine Parameterdarstellung der Schnittgeraden. PS. Nat¨ urlich gibt es noch viele andere M¨ oglichkeiten. Der Richtungsvektor kann ein beliebiges Vielfaches von q sein, und der Schnittpunkt (1/5, 8/5, 0) kann durch irgendeinen andern gemeinsamen Punkt der Ebenen, etwa durch (1, 1, 1), ersetzt werden. — Als Variante kann anstelle von q = n×m ein zweiter gemeinsamer Punkt von E und F bestimmt und die Methode von (2.6.4) angewandt werden. 2−5 Wie in (2.6.4) bestimmen wir die Parameterdarstellungen AB: (1, −2, 2) + t(4, 4, 1) und P Q: (1, 3, 4)+u(6, −4, −2). Die x– und y–Koordinaten des Kreuzungspunkts werden erhalten, indem
438
osungen der Aufgaben 28. L¨
wir die entsprechenden Koordinaten der beiden Parameterdarstellungen gleichsetzen: 1 + 4t = 1 + 6u −2 + 4t = 3 − 4u. origen Punkte Wir erhalten t = 3/4, u = 1/2 und den Kreuzungspunkt K(4, 1, 0). Die zugeh¨ auf den Strecken entsprechen diesen Parameterwerten. Auf AB ist es der Punkt C(4, 1, 11/4), auf P Q der Punkt R(4, 1, 3). Dabei liegt R um 1/4 h¨ oher als C. (Es ist noch festzuhalten, dass achlich zwischen A und B liegt, denn 0 ≤ t ≤ 1; Entsprechendes gilt f¨ ur R.) der Punkt C tats¨ 2−6 Wir f¨ uhren ein Koordinatensystem gem¨ ass Skizze ein. Daz nach hat der Normalenvektor zur Dachebene 1 die Form n1 = k n2 = (1, 0, tan 55◦ ) f¨ ur das Dach 2. Die (0, 1, tan 65◦ ), analog Schnittgerade der beiden Dachebenen hat also die Richtung y q = n1 × n2 = (tan 55◦ , tan 65◦ , −1). Der Winkel ϕ zwischen x der z–Achse, gegeben durch die Richtung k = (0, 0, 1) und q wird mit dem Skalarprodukt berechnet: qk = |q ||k| cos ϕ. Einq 2 1 setzen ergibt cos ϕ = −1/|q | = −1/2.7638 und ϕ = 111.2◦ . Der ◦ ◦ ◦ zugeh¨ orige spitze Winkel ist ψ = 180 −111.2 = 68.8 und f¨ ur den gesuchten Neigungswinkel ϑ bez¨ uglich der Horizontalebene (die normal zu k ist) folgt ϑ = 90◦ − 68.8◦ = 21.2◦ . pa a. Einsetzen ergibt q = 2a = (2, −4, 4). Weiter 2−7 Aufgabe 1−14 liefert die Beziehung q = |a|2 ist r = p − q = (−8, 4, 8). (Kontrolle: Wegen qr = 0 stehen q und r tats¨ achlich senkrecht aufeinander.) 2−8 Jeder Punkt auf der x–Achse hat die Form X(x, 0, 0). Wir m¨ ussen x so w¨ ahlen, dass die −−→ −−→ Vektoren XA = (3 − x, 2, 1) und XB = (−4 − x, 4, 2) senkrecht aufeinander stehen. Wir setzen das Skalarprodukt (3 − x)(−4 − x) + 8 + 2 = 0 und erhalten die quadratische Gleichung x2 + x − 2 = 0, welche die L¨ osungen x = 1 und x = −2 hat. √ √ −→ − − → −→ 2−9 a) |AB| = |(3, −2, −2)| = 17 = 4.1231, |BC| = |(2, 4, 1)| = 21 = 4.5826, |CA| = |(−5, −2, 1)| √ −→ −→ −→ −→ = 30 = 5.4772. b) AB AC = |AB||AC| cos α. Es folgt cos α = 0.5756 und α = 54.85◦ (Winkel bei A). Analog: β = 77.78◦ , γ = 47.37◦ . c) Wie in (2.6.3) ist der Fl¨ acheninhalt √ −→ −→ = 12 |AB × AC| = 12 |(6, −7, 16)| = 12 341 = 9.2331. −→ −→ 2−10 a) Die Dachebene E hat den Normalenvektor n = AB × AC = (6, −7, 16) (vgl. Aufgabe 2−9, c)). Die Ebenengleichung lautet daher n(r − a) = 0 mit a = (1, 3, 6) oder ausgerechnet 6x − 7y + 16z = 81. Die Schnittgerade mit der x-y–Ebene erh¨ alt man, wenn man z = 0 setzt, also 6x−7y = 81 oder, in der u ¨ blichen Form der Geradengleichung y = 67 x− 81 . b) Die Normale 7 zur x-y–Ebene hat die Richtung k = (0, 0, 1). Der Winkel zwischen n und k berechnet sich mit dem Skalarprodukt zu 29.95◦ . Dies ist auch der gesuchte Schnittwinkel. c) Die Zahl z ist so zu bestimmen, dass der Punkt D(4, 3, z) in der Ebene E liegt. Einsetzen in die Ebenengleichung ergibt 6 · 4 − 7 · 3 + 16z = 81, also z = 39/8 = 4.875. Dies ist die gesuchte H¨ ohe. d) Gem¨ ass Aufgabe 1−19 ist q = n × (g × n) mit g = (0, 0, −1) (Richtung der Schwerkraft. Die in Aufgabe 1−19 gemachte Voraussetzung, der Winkel zwischen g und n sei stumpf, ist erf¨ ullt.) Einsetzen von n = (6, −7, 16) liefert q = (96, −112, −85). 2−11 a) Der Lichtstrahl durch a in Richtung q hat die Parameterdarstellung r(t) = (1, 3, 6) + t(2, 1, −1) = (1 + 2t, 3 + t, 6 − t). Er schneidet dann die x-y–Ebene, wenn die z–Koordinate = 0 ist, also f¨ ur t = 6. Der Schatten von A hat die Koordinaten A1 (13, 9, 0). b), c) Analog: Der ¨ blich Schatten von B (bzw. C) hat die Koordinaten B1 (12, 5, 0) (bzw. C1 (16, 10, 0)). Wie u √ √ −−−→ −−−→ berechnet man nun die L¨ ange der Vektoren A1 B1 = 17 = 4.1231, A1 C1 = 10 = 3.1623 sowie den Zwischenwinkel 122.47◦ .
osungen zu Kapitel 3 28.3 L¨
439
2−12 In den Endpunkten der Ortsvektoren ri (mit Anfangspunkt O) seien die Massen mi angebracht. Die Physik lehrt, dass der Schwerpunkt S dieses Systems durch die Beziehung miri −→ i s = OS = mi i
gegeben ist. Der Figur entnimmt man die vier Vektoren r1 = a = (1, 0, 1), r2 = b = (1, 1, 0), r3 = c = (1, 2, 1), r4 = d = (0, 2, 1). Die obige Formel liefert 1 2a + 3b + 4c + d −→ = (9, 13, 7). s = OS = 2+3+4+1 10 S hat die Koordinaten (0.9, 1.3, 0.7).
√ = muss die Richtung f = (1, 0, 1) (mit |f | = 2) und den Betrag 100 haben, es folgt F 2−13 F √ √ hat die Richtung g = (1, 1, 0) und daher die Gestalt G = (x, x, 0) (100/ 2, 0, 100/ 2). G √ √ = F +G = (x + 100/ 2, x, 100/ 2). F¨ ur den f¨ ur ein zu bestimmendes x> 0. Nun ist R √ erh¨ Betrag von R alt man 2x2 + 200x/ 2 + 1002 . Dies muss = 150 sein. Quadriert man, √ so bekommt man eine quadratische Gleichung f¨ ur x, n¨ amlich 2x2 + 200x/ 2 + 1002 = 1502 , = 72.4745. Da man nun mit genau einer positiven L¨ osung x = 51.2472. Damit wird |G| = (70.7107, 0, 70.7107) und und R = (121.9579, 51.2472, 70.7107) kennt, kann man mit dem F Skalarprodukt den Zwischenwinkel berechnen: 24.74◦ . mit r = (1, 2, 1). F hat die Richtung (0, −1, −1) und den Betrag 4, d.h. = r × F 2−14 Es ist M O √ √ √ √ √ F = (0, −2 2, −2 2). Ausrechnen des Vektorprodukts liefert M O = (−2 2, 2 2, −2 2), √ | = 2 6 Nm. |M O
2−15 a) Wir setzen ϕ = 47◦ 24 = 47.4◦ , ψ = 8◦ 33 = 8.55◦ (Achtung beim Umrechnen von Grad und Minuten in Dezimalzahlen!) sowie r = 6371 (mittlerer Erdradius) und r = r cos ϕ (vgl. Skizze). Man liest −−→ −→ dann ab: OM = (42278, 0, 0) sowie OZ = ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ 6371 cos ϕ cos ψ 4264 r cos ψ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎝ r sin ψ ⎠ = ⎝ 6371 cos ϕ sin ψ ⎠ = ⎝ 641 ⎠ . 6371 sin ϕ 4690 r sin ϕ
z
Z r
y
ϕ r
b) Der Normalenvektor n zur Horizontalebene in Z¨ u−→ rich (Z) hat die Richtung von OZ. F¨ ur den gesuchten −−→ Elevationswinkel α zwischen ZM und der Horizontal−−→ ebene gilt α = 90◦ −β, wo β der Winkel zwischen ZM −→ und n = OZ ist. Mittels a) berechnet man sofort −−→ −−→ −→ ZM = OM − OZ = (38014, −641, −4690). Mit dem Skalarprodukt bestimmt man den Winkel β = 55.1◦ , woraus folgt, dass die gesuchte Elevation α = 34.9◦ ist.
(28.3) L¨osungen zu Kapitel 3 Kapitel 3 enth¨ alt keine Aufgaben.
ψ M x
osungen der Aufgaben 28. L¨
440
(28.4) L¨osungen zu Kapitel 4 Vorbemerkung: Wegen der Vielzahl der Bezeichnungen f¨ ur den Differenzenquotienten und f¨ ur die Ableitung k¨ onnen die L¨ osungen der vorliegenden Aufgaben selbstverst¨ andlich auch in ¨ ausserlich anderer Form erscheinen. 4−1 (a) ↔ (2), (b) ↔ (1), (c) ↔ (4). 4−2 (a): Mittlere Verdunstungsgeschwindigkeit im Zeitintervall von t0 bis t. (b): Verdunstungsgeschwindigkeit zur Zeit t0 . Wegen F (t) < F (t0 ) ist der Differenzenquotient (a) negativ. 4−3 a) Dieser Differenzenquotient gibt an, wieviel jedes zus¨ atzlich produzierte St¨ uck kostet, wenn oht wird. b) Die Ableitung (Differentialquotient) von K an die Produktion von s1 auf s2 erh¨ der Stelle s1 gibt n¨ aherungsweise an, wieviel ein zus¨ atzlich erzeugtes St¨ uck kostet, nachdem uck hergestellt worden sind. bereits s1 St¨ 4−4 Im Zeitintervall Δt = t − t0 fliesst die Ladungsmenge ΔQ = Q(t) − Q(t0 ) durch den Leiterquerschnitt. Die mittlere Stromst¨ arke in diesem Intervall betr¨ agt also ΔQ/Δt, und die momentane Stromst¨ arke wird als Grenzwert dQ ΔQ ˙ Q(t) = = lim Δt→0 Δt dt definiert. Damit ist gleichzeitig die in der Aufgabenstellung verwendete, etwas ungenaue Formulierung “Ladung pro Zeiteinheit” pr¨ azisiert worden. 4−5 Unter dem mittleren Ausdehnungskoeffizienten im Temperaturintervall [T1 , T2 ] ist die durchschnittliche L¨ angen¨ anderung pro Temperatureinheit, also der Differenzenquotient L(T2 ) − L(T1 ) ΔL = ΔT T2 − T1 zu verstehen. L¨ asst man nun T2 gegen T1 streben, so erh¨ alt man den Ausdehnungskoeffizienten f¨ ur die Temperatur T1 als Ableitung L (T1 ). 4−6 Die mittlere Reaktionsgeschwindigkeit im gegebenen Zeitintervall ist durch den Differenzenquotienten x(t0 + Δt) − x(t0 ) Δx = Δt Δt gegeben. Er gibt an, um wieviel Mol die Konzentration des Stoffes C im betrachteten Zeitintervall pro Zeiteinheit zugenommen hat. Die Reaktionsgeschwindigkeit zum Zeitpunkt t0 ist entsprechend der Grenzwert des Differenzenquotienten, also die Ableitung x(t ˙ 0 ), die hier u ¨blicherweise mit Punkten bezeichnet wird. 4−7 Im Zeitintervall Δt betr¨ agt die Winkel¨ anderung Δϕ = ϕ(t + Δt) − ϕ(t). Die mittlere Winkelgeschwindigkeit ist der Quotient dieser Gr¨ ossen, die (momentane) Winkelgeschwindigkeit ist ihr Grenzwert f¨ ur Δt → 0, also die Ableitung ϕ(t). ˙ Entsprechend ist die (momentane) Winkelbeschleunigung durch die zweite Ableitung ϕ ¨ (t) gegeben. 4−8 a) Das Volumenst¨ uck zwischen h0 und h hat das Volumen ΔV = QΔh, mit Δh = h − h0 . Darin befindet sich die Salzmenge ΔM = M (h) − M (h0 ). Die mittlere Konzentration ist durch den Differenzenquotienten 1 ΔM ΔM = ΔV Q Δh gegeben. b) Die Konzentration an der Stelle h0 wird durch den Grenz¨ ubergang Δh → 0 erhalten, ist also bis auf den Faktor 1/Q gleich der Ableitung, n¨ amlich gleich 1 M (h0 ). Q
osungen zu Kapitel 4 28.4 L¨
441
ohe h) gleich c ist, dann enth¨ alt das angig von der H¨ c) Wenn die Konzentration u ¨ berall (unabh¨ Volumenst¨ uck ΔV = QΔh die Stoffmenge ΔM = cΔV = cQΔh. Der obige Differenzenquotient nimmt dann stets den Wert c an, damit ist aber auch sein Grenzwert, also die Konzentration ¨berall gleich c (unabh¨ angig von h0 ), was behauptet wurde. an der Stelle h0 , u ahern sich immer mehr dem Wert 1; z.B. erh¨ alt man f¨ ur h = 0.01 4−9 a) Die Differenzenquotienten n¨ ur h = 0.001 den Wert 1.0000003. Man darf also hoffen, der Grenzwert, den Wert 1.00003, f¨ d.h. die Ableitung der Tangensfunktion an der Stelle 0, sei gleich 1. Diese Hoffnung wird durch die Ableitungsformel (vgl. (5.3)) best¨ atigt. PS. Wenn Sie 0.01745. . . erhalten haben, dann haben Sie entgegen der Anweisung Ihren Rechner auf Gradmass eingestellt. (Der obige Wert ist u ¨brigens der Umrechungsfaktor π/180 vom Gradins Bogenmass.) b) F¨ ur h = 0.001 bzw. h = 0.0001 ist der Differenzenquotient gleich 6.7793 bzw. gleich 6.7733. Die Ableitung dieser Funktion an der Stelle 2 wird also ungef¨ ahr 6.77 betragen. Wenn Ihnen dabei nicht ganz wohl ist, so k¨ onnen Sie in (5.5.12) nachsehen, dass die gesuchte Ableitung den exakten Wert 4(ln 2 + 1) = 6.772588 . . . hat. 4−10 a) Es ist f (x + h) = (x + h)3 + (x + h)2 + 1 = x3 + 3x2 h + 3xh2 + h3 + x2 + 2xh + h2 + 1, also ur den Differenzenquotienten f (x + h) − f (x) = 3x2 h + 3xh2 + h3 + 2xh + h2 . Es folgt f¨ f (x + h) − f (x) 3x2 h + 3xh2 + h3 + 2xh + h2 = = 3x2 + 3xh + h2 + 2x + h. h h Geht man zum Grenzwert h → 0 u ¨ber, so erh¨ alt man f (x) = 3x2 + 2x. b) Es ist f (x) − f (x0 ) =
x x − x0 x0 = − . 1−x 1 − x0 (1 − x)(1 − x0 )
Daraus folgt 1 f (x) − f (x0 ) = , x − x0 (1 − x)(1 − x0 ) ahert sich dieser Ausdruck immer mehr dem Wert 1/(1 − x0 )2 , d.h., es ist und f¨ ur x → x0 n¨ (wenn wir den Index 0 weglassen) f (x) =
1 . (1 − x)2
c) Wir formen zuerst die Differenz f (x) − f (x0 ) um, wobei wir a ¨hnlich wie in (4.4.b) passend erweitern: √ √ √ √ √ √ x0 − x x0 − x x0 + x 1 x0 − x 1 f (x) − f (x0 ) = √ − √ = √ √ = √ √ ·√ √ = √ √ √ √ . x x0 x x0 x x0 x0 + x x x0 x0 + x Es folgt lim
x→x0
1 f (x) − f (x0 ) −1 −1 = lim √ √ √ √ = x · 2√x , d.h. f (x) = − √ 3 . x→x0 x − x0 2 x 0 0 x x0 x0 + x
osungen der Aufgaben 28. L¨
442
4−11 a) D, b) S, c) S, d) U, e) U, f) D. Um zu erraten, welcher Fall vorliegt, gen¨ ugt es, jeweils die Graphen zu zeichnen. a)
y
b)
y
c)
x
y
y
d)
f)
y
x
x
x
x
y
e)
x
1
Wer es genauer wissen will, verwendet die Definitionen. Dazu drei Beispiele: a) Es ist f (x) = −x2 f¨ ur x ≤ 0 und f (x) = x2 f¨ ur x ≥ 0. Durch Einsetzen verifiziert man sofort, dass lim
x↑0
f (x) − f (0) f (x) − f (0) = lim =0 x−0 x−0 x↓0
ist. d.h., f hat an der Stelle 0 die Ableitung 0. (Anschaulich: Die beiden “H¨ alften” der Kurve haben sowohl von links als auch von rechts kommend im Nullpunkt die Steigung 0.) c) Es ist f (x) = 0 f¨ ur x ≤ 0 und f (x) = 2x f¨ ur x ≥ 0. Deshalb ist limx↑0 f (x) = limx↓0 f (x) = 0, was nach (4.6.f) Stetigkeit im Nullpunkt bedeutet. Da der Graph dort aber eine Ecke hat, ist f an der Stelle 0 nicht differenzierbar. Rechnerisch sieht dies so aus: Es ist der Grenzwert von Δf f (x) − f (0) = Δx x−0 f¨ ur x → 0 zu bestimmen. Wegen der Definition von f sind die Grenzwerte von links und von rechts getrennt zu berechnen. Man erh¨ alt lim
Δf
x↑0 Δx
= lim
0−0
x↑0 x − 0
= 0,
lim
Δf
x↓0 Δx
= lim
2x − 0
x↓0 x − 0
= lim 2 = 2. x↓0
Diese Grenzwerte sind verschieden, somit ist f an der Stelle 0 nicht differenzierbar. d) Da f (x) beliebig gross wird, wenn nur x nahe genug bei 1 ist, existiert limx→1 f (x) nicht; daher ist f an der Stelle 1 zwar (gewissermassen k¨ unstlich) definiert, aber nach (4.6.f) nicht stetig. 4−12 a) F¨ ur alle x = 1 ist f (x) = x − 1. Deshalb ist limx→1 f (x) = 0, und wenn wir c = 0 setzen, ist f nach (4.6.f) an der Stelle 1 stetig. √ b) F¨ ur alle x = 1 ist f (x) = x + 1, also ist limx→1 f (x) = 2, und wir m¨ ussen c = 2 setzen. c) Der Skizze entnimmt man, dass c = 2 sein muss. Rechnerisch geht’s so: lim f (x) = lim x2 = 1,
x↑1
x↑1
lim f (x) = lim c − x = c − 1.
x↓1
x↑1
Da die beiden Seiten gleich sein m¨ ussen, ist c − 1 = 1, d.h. c = 2 zu setzen. d) Dies geht analog zu c). Man erh¨ alt c = 0. y
y
c)
d) x 1
x 1
osungen zu Kapitel 5 28.5 L¨
443
(28.5) L¨osungen zu Kapitel 5 5−1 Summen, Differenzen und Vielfache von Grundfunktionen. 2 5 2 6 1 1 a) −2x−2 + 6x−3 = − 2 + 3 b) u− 3 − 6u− 2 = √ − 6√ 3 2 x x u u5 √ 3 5 5 5 1 1 2 4 8) − sin(ϕ) c) z − 8 = √ (setze zuerst z z = z d) 1 + tan (ϕ) − sin(ϕ) = 8 8 8 z3 cos2 (ϕ) 1 e) ln 2 · 2t − ln 3 · 3t f) ea + a 5−2 Produkt- und Quotientenregel. 2(1 − x2 ) (x2 − x + 1)2 cos σ d) 2eξ sin ξ e) − 2 sin σ ρeρ − 2eρ − 2 g) et (cos t + t · cos t − t · sin t) h) ρ3 5−3 Kettenregel; einfachster Fall (innere Funktion linear). a)
2 (t + 1)2
b)
a) 12(2 + 3x)3 3 d) − √ 2 1 − 3r g) αeατ cos βτ − βeατ sin βτ
b) nb(a + by)n−1 1 e) a + bc
c) α · sin α f)
2ex (ex + 1)2
i) u(1+2 ln u) = u(1+ln(u2 ))
c) 2e2X−1 b f) a + bc
h) cos(α + γ) cos(α − γ) + sin(α + γ) sin(α − γ) = cos(2γ) Es wurde ein Additionstheorem (26.15.c) verwendet: cos(x − y) = cos x cos y + sin x sin y. Das einfache Resultat (cos 2γ) l¨ asst vermuten, dass schon der gegebene Ausdruck vereinfacht werden kann. Dies trifft in der Tat zu. Auf Grund der Formel 2 sin x cos x = sin(x + y) cos(x − y) gilt alt man (da α sin(α + γ) cos(α − γ) = 12 (sin 2α + sin 2γ). Leitet man diesen Ausdruck ab, so erh¨ konstant ist) wiederum cos 2γ. cos(2α) cos(β − α) cos(β + α) + sin(β − α) sin(β + α) = i) cos2 (β − α) cos2 (β − α) Additionstheorem wie oben. Beachten Sie auch, dass cos(−2α) = cos(2α) ist. 5−4 Kettenregel. a) 4(x3 + x2 − 1)3 (3x2 + 2x) d) √
1
b) −2 cos δ e−2 sin δ 1 sin θ · cos θ 8u(u2 − 1) h) (u2 + 1)3 e)
1 + x2 1 g) T · ln T
c) 3
v2
(v 3 + 1)2 1 γ f) − sin (γ + 1)2 γ+1
sin x i) (cos x · ln(sin x) + cos x)(sin x)sin x (Ansatz: (sin x)sin x = eln(sin x) = eln(sin x)·sin x .) 5−5 Kettenregel; Verkn¨ upfung von mehr als zwei Funktionen. 2
a) cos(ex ) · 2x · ex
2
5−6 Allerlei. 4x a) 1 − x4 3 6 5−7 a) 2 + 4 + √ t 4 t5 d) 10! (= 10 · 9 · 8 · · · 2 · 1)
b) −2ϕ · tan(ϕ2 )
c)
b) tan3 α
c) −
1 u3 e) sin α + cos α b)
2
1 3u2 ln(u3 + 1) u3 + 1
2u √ (u − 1)2 u2 + 2u − 1 1 c) − 2 x f) (x + n)ex f¨ ur alle n ∈ N.
osungen der Aufgaben 28. L¨
444
(28.6) L¨osungen zu Kapitel 6 6−1 Zeichnet man sich die Graphen der Ableitungen auf, so erkennt man, dass f1 = f3 ist: y
y
f1
y
f2
x
y
f3
f4 x
x
x
y
6−2 Es wird mehrfach verwendet, dass ex stets > 0 ist. a) Es ist f (x) > 0 f¨ ur x > 1, f (x) = 0 f¨ ur x = 1 und f (x) < 0 f¨ ur x < 1. b) f (x) = xex > 0 (also f wachsend) f¨ ur x > 0, f (x) = 0 ur x < 0. c) f¨ ur x = 0 (rel. Min.), f (x) < 0 (also f fallend) f¨ f (x) = (x + 1)ex > 0 (Linkskurve) f¨ ur x > −1, f (x) = 0 f¨ ur x = −1 (Wendepunkt), f (x) < 0 (Rechtskurve) f¨ ur x < −1.
x 1
6−3 Es wird mehrfach verwendet, dass 1+1x2 stets > 0 ist. a) Es ist f (x) > 0 f¨ ur x > 0, f (x) = 0 f¨ ur x = 0 und f (x) < 0 f¨ ur x < 0. b) f (x) =
2
1−x (1+x2 )2
y
> 0, also f wachsend, f¨ ur
ur x = ±1, f (x) < 0, also f fallend, f¨ ur |x| < 1, f (x) = 0 f¨ |x| > 1. c) f (x) =
3
2x −6x . Das Vorzeichen (1+x2 )3 2x(x2 − 3) ab. Er ist >
x 1
h¨ angt nur vom
0 genau dann, Z¨ ahler 2x3 − 6x = √ wenn x und x2 − 3 dasselbe Vorzeichen haben, also f¨ ur x > 3 √ (beide positiv) und f¨ ur − 3 < x < 0 (beide negativ). In diesen √ Bereichen bildet der Graph eine Linkskurve, f¨ ur x < − 3 und √ 0 < x < 3 dagegen eine Rechtskurve. An den Stellen x = √ ± 3, 0 hat der Graph Wendepunkte. 6−4 Ein m¨ oglicher Verlauf ist der Skizze zu entnehmen.
y
x -1
1
ur x = ±2. Ferner ist f (−2) = 16, f (2) = −16. a) D = [−3, 3]. 6−5 Es ist f (x) = 3x2 − 12 = 0 f¨ Dieses Intervall enth¨ alt die Werte ±2, wo f (x) = 0 ist. Werte am Rand: f (−3) = 9, f (3) = −9. Vergleich ergibt: f hat das absolutes Maximum (bzw. Minimum) an der Stelle −2 (bzw. 2). b) D = (0, 1). Dieses Intervall enth¨ alt die Werte ±2 nicht und hat auch keine Randpunkte: Auf D hat f keine Extrema (weder absolute noch relative). c) D = [0, 1]. Dieses Intervall enth¨ alt die Werte ±2 nicht, hat aber Randpunkte, in denen die absoluten Extrema angenommen werden: f (0) = 0 (abs. Max.), f (1) = −11 (abs. Min.). ur ln x = −1, d.h. x = e−1 = e1 = 0.3679. a) D = [ 14 , 2]. 6−6 Es ist g (x) = ln x + 1 = 0 f¨ − 1 Dieses Intervall enth¨ alt e , ferner ist g(e−1 ) = −e−1 = −0.3679. Werte am Rand: g( 14 ) = −0.3466, g(2) = 1.3863. Vergleich ergibt: Abs. Maximum f¨ ur x = 2, abs. Minimum f¨ ur x = e − 1 . 1 − 1 alt e nicht, die Extrema m¨ ussen am Rand auftreten: b) D = [ 2 , 2]. Dieses Intervall enth¨ g( 12 ) = −0.3466 (abs. Minimum), g(2) = 1.3863 (abs. Maximum). c) D = ( 12 , 2). Hier ist e−1 ∈ / D, und D hat auch keine Randpunkte: Keine abs. Extrema.
osungen zu Kapitel 6 28.6 L¨
445
6−7 Es ist (vgl. auch die Skizze) ⎧ 2 ⎪ ⎨x − 1 h(x) = 1 − x2 ⎪ ⎩ 2 x −1
y f¨ ur x ≤ −1, f¨ ur −1 < x < 1, f¨ ur x ≥ −1.
An den Stellen x = ±1 ist h nicht differenzierbar; dort liegt das absolute Minimum (h(±1) = 0). Das abs. Maximum wird x an den zwei Randpunkten ±2 angenommen (h(±2) = 3). Fer-2 2 ner ist x0 = 0 der einzige Wert mit f (x0 ) = 0, dieses rel. Maximum ist aber kein absolutes Maximum. √ √x 1√ √ √x √ ¨ 6−8 Ahnlich wie in (5.5.12) setzen wir x = eln x = e 2 x ln x (es wurde noch ln x = 1 2
ln x ben¨ utzt). Fleissiges Rechnen ergibt
F (x) =
√ √x 1 1 x · √ · 1 + ln x , 2 x 2
F (x) =
√ √x 1 1 1 x · · 1 + ln x − √ ln x + (ln x)2 . 4x 2 x 4
Damit ist F (x) = 0 ⇐⇒ ln x = −2 ⇐⇒ x = e−2 . Setzt man diesen Wert in F (x) ein, so 1
3
erhalten wir F (e−2 ) = ( e1 )( e ) · e4 > 0. Es handelt sich um ein relatives Minimum. 6−9 Auszug aus EULERs L¨ osung im Original: xx − 3x + 2 erit Posito y = xx + 3x + 2 6x2 − 12 dy = dx (xx + 3x + 2)2
et
ddy −12x3 + 72x + 72 = . 2 dx (xx + 3x + 2)3
√ √ √ dy Statuatur dx = 0; fiet vel x = + 2 vel x = − 2. Priori casu x = 2 erit √ 48 2 + 72 ddy = √ 2 dx (4 + 3 2)3 ideoque affirmativum ob [numeratorem et] denominatorem affirmativum; hinc erit y minimum √ √ 4−3 2 = √ = 12 2 − 17 = −0, 02943725. 4+3 2 √ Posteriori casu x = − 2 fit √ √ ddy −48 2 + 72 24(3 − 2 2) = √ 3 = √ 3 , 2 dx (4 − 3 2) (4 − 3 2) cuius valor ob numeratorem affirmativum et denominatorem negativum erit negativus ideoque y fiet maximum √ √ 4+3 2 = √ = −12 2 − 17 = −33, 97056274. 4−3 2 Anhand dieses Textes sollten Sie auch ohne Lateinkenntnisse in der Lage sein, Ihre L¨ osung nachzukontrollieren. Beachten Sie, dass EULER manchmal von den unsern leicht abweichende ). Notationen verwendet (xx, ddy dx2 6−10 Es ist L1 = a/ cos α, L2 = b/ sin α, L = L1 + L2 ist die Gesamtl¨ ange der Stange (die Dicke der Stange wird nicht ber¨ ucksichtigt). Wir setzen dL a sin α b cos α =0 = − dα cos2 α sin2 α
a
α
L1 u1
u2
L2 b
osungen der Aufgaben 28. L¨
446
sin α 3 und finden b cos3 α = a sin3 α, woraus wegen tan α = cos b/a α die Beziehung tan α = folgt. Wenn a und b zahlenm¨ assig gegeben w¨ aren, so k¨ onnten wir den Winkel α und damit L ¨ sofort bestimmen. Da dies nicht der Fall ist, f¨ uhren wir eine geometrische Uberlegung durch. 3 /a = b/u = tan α = b/a, also u1 = Der Zeichnung entnimmt man die Beziehungen u 1 2 a 3 b/a, u2 = b 3 a/b. Damit erhalten wir f¨ ur die maximale L¨ ange √ √ 3 3 L = L1 + L2 = a2 + u21 + b2 + u22 = a2 + b2 a4 + b2 + a2 b4 . Da anschaulich klar ist, dass ein Maximum existieren muss, verzichten wir auf die Verwendung der zweiten Ableitung. a 6−11 Bekanntlich betr¨ agt das DIN-A4-Format 297 × 210 [mm]. Wir setzen r = 210, s = 297. Der Strahlensatz liefert die Beziehung (s−x)/a = t/b, d.h. t = ab (s−x), und damit y = r−b+ ab (s−x). F¨ ur den Fl¨ acheninhalt A erhalten wir A = xy = (r − b)x + b 2 assig sind alle x mit x ∈ D = [s − a, s]. Wir a (sx − x .) Zul¨
b r
y x
finden A = r − b + ab s − 2ab x, A = − 2ab . Damit wird A = 0 − a2 + s2 . Wenn x0 im Innern des zul¨ assigen f¨ ur x0 = ar 2b Intervalls liegt, dann haben wir sicher ein relatives Maximum, denn A (x0 ) < 0. a) a = 60, b = 40. Einsetzen liefert x0 = 276. Diese Zahl liegt im zul¨ assigen Intervall D = [237, 297], und man stellt fest, dass dort ein absolutes Maximum angenommen wird. Der zugeh¨ orige Wert von y bestimmt sich zu 184. b) a = 40, b = 60. Einsetzen liefert x0 = 198.5 ∈ / D = [257, 297]. Das absolute Maximum wird deshalb in einem der Randpunkte angenommen. Direktes Ausrechnen ergibt, dass dies f¨ ur x = 257 (und y = 210) geschieht.
s−x
s a s−x b t
6−12 Die L¨ ange des verf¨ ugbaren Zauns sei L. 8
Variante 1: Aus x + 2y = L folgt y = 12 (L − x). Da in allen F¨ allen L > 8 ist, durchl¨ auft x das Intervall D = (0, 8]. Der Fl¨ acheninhalt ist = F = xy = 12 (Lx − x2 ). Die Gleichung F (x) = 12 L−x = 0 hat die L¨ osung x0 = L , ferner ist F (x) = 2 −1 < 0, d.h., F hat in x0 ein relatives Maximum, sofern x0 ∈ D ist, was noch nicht feststeht. In der Tat gilt folgendes: a) L = 12, x0 = 6 ∈ D. Wegen F (8) = 16 und F (6) = 18 wird das absolute Maximum F = 18 f¨ ur x = 6 angenommen. / D. Das Maximum F = 48 wird im b) L = 20, x0 = 10 ∈ Randpunkt x = 8 angenommen. c) L = 28, x0 = 14 ∈ / D. Das Maximum F = 80 wird im Randpunkt x = 8 angenommen.
Variante 2: Hier ist L = x + 2y + (x − 8) = 2x + 2y − 8, also y = 12 (L + 8) − x. Da y > 0 sein muss, ist das zul¨ assige Intervall f¨ ur x diesmal = E = [8, 12 (L + 8)). Der Fl¨ acheninhalt ist = G = xy = 12 (L + 8)x − x2 . Es ist G (x) = 12 (L + 8) − 2x = 0 f¨ u r x0 = L + 2 (und wieder ist G (x) < 0). Wie oben 4 unterscheiden wir drei F¨ alle.
y x x−8
8
y x
osungen zu Kapitel 6 28.6 L¨
447
/ E = [8, 10). Das Maximum G = 16 wird im Randpunkt x = 8 angenoma) L = 12, x0 = 5 ∈ men. b) L = 20, x0 = 7 ∈ / E = [8, 14). Das Maximum G = 48 wird im Randpunkt x = 8 angenommen. c) L = 28, x0 = 9 ∈ E = [8, 18). Wegen G(8) = 80 und G(9) = 81 wird das absolute Maximum ur x = 9 angenommen. G = 81 f¨ Fazit: Im Fall a) ist die Variante 1 besser, im Fall c) die Variante 2, im Fall b) liefern beide Varianten dasselbe. 6−13 Es sei w die Geschwindigkeit (besser: Schnelligkeit) im Wald, v jene am Waldrand, dann ist v = aw. Ferner sei r der Radius des Zauberwalds. Der Winkel bei B ist = β/2; dies folgt aus ele¨ mentargeometrischen Uberlegungen (der Peripheriewinkel ist halb so gross wie der Zentriwinkel). Der Zeitbedarf z = z(β) betr¨ agt z(β) = r
β 2 cos(β/2) , + aw w
weiter ist
(v)
(w) B
1 dz sin(β/2) , =r − dβ aw w
β
β/2
A
d2 z cos(β/2) = −r . dβ 2 2w
dz = 0 ist, wenn sin(β/2) = 1/a ist. Dabei ist 0 ≤ β ≤ π. Der Prinz stellt leicht fest, dass dβ Dies ist nur f¨ ur a ≥ 1 m¨ oglich, d.h., wenn das Ross am Waldrand schneller ist als im Gestr¨ upp 2
d z < 0 ist (ausser im (was es hoffentlich auch ist). Der Prinz merkt aber ferner, dass immer dβ 2 uninteressanten Fall β = π). Die Funktion z hat also dort, wo ihre Ableitung 0 ist, stets ein relatives Maximum. Ihr Graph beschreibt im Intervall [0, π] eine Rechtskurve. Dies bedeutet nun aber, dass das absolute Minimum in einem der Randpunkte β = 0 oder β = π angenommen wird. Er findet z(0) = 2r/w, z(π) = πr/aw. F¨ ur 2 > π/a, d.h. f¨ ur a > π/2 ist z(0) > z(π), das Minimum wird f¨ ur β = π (Ritt dem Waldrand entlang) angenommen; entsprechend ist f¨ ur a < π/2 der gerade Weg durch den Wald am schnellsten. F¨ ur a = π/2 sind beide Wege gleich schnell (so dass sich der Prinz beim Hin- und R¨ uckritt etwas Abwechslung leisten kann).
6−14 Als L¨ angeneinheit w¨ ahlen wir Meter, als Zeiteinheit Minuten. Das Volumen bis zur Wasserh¨ ohe 1 m betr¨ agt (trapezf¨ ormiger = 35 [m3 ]. Bei einer Leistung von 0.2 1 Querschnitt!) 5 · 10+4 2 agt die F¨ ullzeit f¨ ur diesen Teil 175 Minuten. Das m3 /min betr¨ restliche Volumen (rechteckiger Querschnitt) betr¨ agt 50 m3 , F¨ ullzeit 250 Minuten. Es sei h die F¨ ullh¨ ohe.
h x 6
4
Fall 1: 0 ≤ h ≤ 1. Das schraffierte St¨ uck hat den Fl¨ acheninhalt 4h + xh/2 = 4h + 3h2 (denn h : x = 1 : 6). Das entsprechende Volumen betr¨ agt 20h + 15h2 . F¨ ur die F¨ ullzeit t = t(h) bis zur H¨ ohe h gilt 0.2t = 20h + 15h2 . Wir l¨ osen diese Gleichung nach h auf, wobei nur die positive L¨ osung in Frage kommt, und finden √ −20 + 400 + 12t . h(t) = 30 Die Steiggeschwindigkeit zur Zeit t (mit 0 ≤ t ≤ 175, entsprechend 0 ≤ h ≤ 1) ist die Ableitung dh 1 100 1 12 √ = √ [m/min] bzw. √ [cm/min]. = dt 30 2 400 + 12t 10000 + 300t 10000 + 300t Fall 2: 1 ≤ h ≤ 2. Hier ist die Steiggeschwindigkeit offensichtlich konstant, n¨ amlich = 0.4 cm/min, denn f¨ ur den einen Meter Steigh¨ ohe werden 250 Minuten ben¨ otigt. (Dieser Wert wird u ¨brigens auch erhalten, wenn man im Fall 1 t = 175 setzt.)
osungen der Aufgaben 28. L¨
448 6−15 Wir messen den Drehwinkel α im Bogenmass. Da sich das Licht t. alle sechs Sekunden einmal dreht, ist α = α(t) = 26π t = π 3 2 oder, Ferner ist x = 5 tan α. Es folgt x˙ = 5 1 + tan2 α(t) · π 3 wenn wir tan α wieder durch x ausdr¨ ucken: x˙ = 53π 1 + ( x )2 . 5 6−16 Wenn die Zeit t in Sekunden gemessen wird, dann gilt f¨ ur den π t. Fergem¨ ass Skizze gemessenenen Drehwinkel ϕ = ϕ(t) = 60 π t) = 5 cos( π t). Die vertikale Komponer ist z(t) = r cos( 60 60 nente der Geschwindigkeit bzw. der Beschleunigung findet man durch Ableiten: dz π π z(t) ˙ = =− sin( t), dt 12 60
x
5 α
z z ϕ
d2 z π π2 z¨(t) = cos( t), =− dz 2 720 60
Die Aufgabenstellung verlangt, Geschwindigkeit und Beschleunigung nach unten positiv zu rechnen. Da die z–Achse aber nach oben positiv orientiert wurde, sind noch die Vorzeichen zu wechseln: z(t) ˙ =
π π dz = sin( t) [ms−1 ], dt 12 60
z¨(t) =
d2 z π2 π =− cos( t) [ms−2 ] . 2 dz 720 60
Damit ist (im betrachteten Intervall 0 ≤ t ≤ 60) die Geschwindigkeit stets ≥ 0, was mit der Anschauung u ¨bereinstimmt. 6−17 Wir messen die Steigungswinkel der Tangenten jeweils im Gegenuhrzeigersinn von der positiven x–Achse aus. sin x a) Es ist sin x = cos x ⇐⇒ cos x = 1, also f¨ ur x = π/4. In diesem Punkt ist die x = tan √ agt 35.26◦ . Steigung der Sinuskurve = cos(π/4) = 2/2, der Steigungswinkel der Tangente betr¨ Analog ist der Steigungswinkel im Fall der Cosinuskurve (negative Tangentensteigung!) gleich 144.74◦ . Der Schnittwinkel betr¨ agt deshalb 109.48◦ . √ b) Schnittpunkt bei x = 1. In diesem Punkt hat y = x4 die Steigung 4, y = 4 x die Steigung 1/4. Der Schnittwinkel betr¨ agt hier 75.96◦ − 14.03◦ = 61.93◦ . 6−18 Wir gehen gem¨ ass (6.7) vor. a) Es ist D(f ) = {x ∈ R | x = ±1}. b) Wegen f (x) = f (−x) besteht eine Symmetrie bez¨ uglich der y–Achse. c) Der Z¨ ahler x2 + 1 ist stets > 0. Es folgt f (x) > 0 f¨ ur |x| > 1, f (x) < 0 f¨ ur |x| < 1. c) Es ist f (x) = −4x/(x2 − 1)2 , also f (x) > 0 (Funktion w¨ achst) f¨ ur x < 0, allt) f¨ ur x > 0. F¨ ur x = 0 liegt wegen f (0) = 0, f (0) < 0 ein relatives f (x) < 0 (Funktion f¨ ahler ist stets > 0, also: f (x) > 0 Maximum vor. e) Es ist f (x) = (12x2 + 4)/(x2 − 1)3 . Der Z¨ (Linkskurve) f¨ ur |x| > 1 und f (x) < 0 (Rechtskurve) f¨ ur |x| < 1. Keine Wendepunkte, da 2
2
1+(1/x )
x +1 = f nie = 0 ist. f) Wegen f (x) = x gilt f (x) → 1 f¨ ur x → ±∞ (horizontale 2 −1 1−(1/x2 ) Asymptote). Ferner gilt f (x) → ∞ f¨ ur x ↑ −1 und x ↓ 1 sowie f (x) → −∞ f¨ ur x ↓ −1 und x ↑ 1 (vertikale Asymptoten). g) Wichtiger Funktionswert: f (0) = 1. Graph siehe unten.
6−19 Auch hier gehen wir gem¨ ass (6.7) vor. F¨ ur den Umgang mit Exponentialfunktion und Logarithmus siehe (26.13,14). a) D(g) = R. b) Keine Symmetrien. c) g(x) = 0 bedeutet e−x = e−2x , d.h. −x = −2x, also ur x < 0 ist g(x) < 0. x = 0 (einzige Nullstelle). F¨ ur x > 0 ist e−x > e−2x , d.h. g(x) > 0. F¨ −x d) Es ist g (x) = −e + 2e−2x . Teilt man durch e−x , so folgt g (x) = 0 ⇐⇒ 1 = 2e−x , ur x < ln 2 ist g (x) > 0 (Funktion w¨ achst), f¨ ur x > ln 2 ist also −x = ln 12 oder x = ln 2. F¨ allt), relatives Maximum f¨ ur x = ln 2. e) Es ist g (x) = e−x − 4e−2x . g (x) < 0 (Funktion f¨ Wie in d) folgt g (x) = 0 ⇐⇒ x = ln 4, g (x) > 0 (Linkskurve) f¨ ur x > ln 4, g (x) < 0 (Rechtskurve) f¨ ur x < ln 4, Wendepunkt f¨ ur x = ln 4. f) F¨ ur x → ∞ streben e−x und e−2x
osungen zu Kapitel 7 28.7 L¨
449
ur x → −∞ ist g(x) → −∞. g) g(ln 2) = 1/4 (rel. beide gegen 0 (horizontale Asymptote); f¨ Max.); g(ln 4) = 1/8 (Wendepunkt). Graph siehe unten. y 6-18 y x -1
6-19
1
x 1
(28.7) L¨osungen zu Kapitel 7 7−1 Es ist f (x) = 3x2 + 12x + 9, f (x) = 6x + 12. Daraus folgt, dass −2 die einzige Nullstelle von f ist, und da f (x) < 0 f¨ ur x < −2 und f (x) > 0 f¨ ur x > −2 ist, liegt in −2 tats¨ achlich ein Wendepunkt vor. Die Steigung der Tangente in diesem Punkt betr¨ agt f (−2) = −3. Ferner ist f (−2) = −1, also geht die Tangente durch den Punkt (−2, −1). Nach (7.2) hat sie die Gleichung y = −3x − 7. 7−2 Definitionsgem¨ ass ist p(x) = f (x0 ) + f (x0 )(x − x0 ). a) Es ist f (x) = 1/(1 − x)2 . Es folgt f (x0 ) = f (−1) = − 12 , f (x0 ) = 14 und damit p(x) = − 12 + 14 (x + 1) = 14 x − 14 . F¨ ur die Abweichung gilt f (x1 ) − p(x1 ) = 0.00032. b) Es ist f (x) = −e1−x . Es folgt f (x0 ) = f (1) = 1, f (x0 ) = −1 und damit p(x) = 1−(x−1) = 2 − x. Schliesslich ist f (x1 ) − p(x1 ) = 0.0000498.
√ 7−3 a) Mit f (x) = 3 x ist f (x) = 13 x−2/3 . Mit x0 = 64 ist f (x0 ) = 4, f (x0 ) = 1/48 ist die √ 1 (x − 64). F¨ ur x = 63 erh¨ alt man 3 63 ≈ p(63) = Linearisierung gegeben durch p(x) = 4 + 48 1 4 + 48 (−1) = 3.9792.
cos x. Mit x0 = π/6 (entspricht 30◦ ) ist b) Hier ist im Bogenmass zu rechnen. Es ist f (x) = √ √ f (x0 ) = 0.5, f (x0 ) = 3/2. Dann ist p(x) = 0.5 + 23 (x − π ) F¨ ur x = 29π/180 (entspricht 6 alt man sin 29◦ ≈ p(29π/180) = 0.4849. 29◦ ) erh¨
7−4 a) Es ist f (x) =
1 (x2 3
+ 2x + 3)−2/3 · (2x + 2), also f (4) = 10/27. Damit ist df =
b) Es ist g (t) = cos t − sin t, g ( π ) = −0.3660, also dg = −0.3660dt. 3 7−5 a) Es ist f (x) = ex /(ex + 1)2 und f (0) = 1/4. Mit dx = 0.05 wird df =
1 0.05 4
10 dx. 27
= 0.0125.
b) Es ist f (x) = x/(x2 + 1) und f (2) = 2/5. Mit dx = −0.1 wird df = −0.04. 7−6 a) Mit V (r) = 43π r3 ist dV = 4πr2 Δr.
b) Das Seifenwasser nimmt das Volumen S = π · 1.52 · 4 mm3 ein. Die daraus entstehende Seifenblase vom 25 mm Radius hat n¨ aherungsweise das Volumen 4π · 252 · Δr. Setzt man dies = S, so folgt Δr = 0.0036 mm.
osungen der Aufgaben 28. L¨
450
7−7 Wir dr¨ ucken die Querschnittsfl¨ ache A = πr2 mit Hilfe des Umfangs U = 2πr aus: A = A(U ) = U 2 . Mit U = 30.5 erhalten wir den Fl¨ acheninhalt 74.0 cm2 . Weiter ist A (U ) = 2Uπ . Wir 4π sch¨ atzen den absoluten Fehler ΔA mit dem Differential dA = A (U )ΔU ab. Wegen |ΔU | < 0.1 [cm] folgt wie in (7.5) |ΔA| < |A (30.5)|·0.1 = 0.485 cm2 . Der absolute Fehler betr¨ agt h¨ ochstens
≈
etwa 0.5 cm2 .
7−8 Der Stein legt im freien Fall in t Sekunden die Strecke s = 12 gt2 zur¨ uck, wo g = 9.81 ms−1 die Fallbeschleunigung ist. Mit t = 5 ergibt sich eine H¨ ohe von 122.6 m. Sch¨ atzt man den Fehler mit dem Differential ds = gtΔt ab, so erh¨ alt man wie in (7.5) f¨ ur den absoluten Fehler < 9.81 · 5 · 0.1 = 4.9 m. Der absolute Fehler betr¨ |Δs| ≈ agt maximal ca. 5 m. Der relative Fehler ist maximal gleich 4.9/122.6 = 0.04, also etwa 4%. Dies entspricht dem doppelten relativen Fehler von t (vgl. auch Aufgabe 7−11). 7−9 Wir berechnen c mit dem Cosinussatz: c2 = a2 + b2 − 2ab cos γ = 64 + 36 − 96 cos γ. Wir √ erhalten c = c(γ) = 100 − 96 cos γ, f¨ ur γ = 35◦ also c = 4.6 [cm]. Weiter ist c (γ) = √ atzen den absoluten Fehler mit dem Differential dc ab, wobei 48 sin γ/ 100 − 96 cos γ. Wir sch¨ < |c (35π/180)| · |2π/180| = 0.2 cm. γ = 35π/180 und |Δγ| < 2π/180 (Bogenmass!) ist: |Δc| ≈ Der absolute Fehler ist kleiner als etwa 2 mm. 7−10 Es sei b die Breite des Flusses, b = 4/ tan α = 4 cot α, mit α = 10◦ also b = 22.7 [m]. Ferner ist ¨ wie in Aufgabe 7−9 sch¨ atzen wir den absoluten Fehler durch das b (α) = −4/ sin2 α. Ahnlich < |−4/ sin2 (10π/180)|· Differential db ab, mit α = 10π/180 und |Δα| < π/180. Es ist dann |Δb| ≈ |π/180| = 2.3 m. Dies ist der ungef¨ ahre maximale absolute Fehler der Breitenbestimmung. 1 7−11 Der absolute Fehler Δy = Δxn wird durch das Differential dy = nxn− Δx abgesch¨ atzt. Der 0 relative Fehler wird durch Division durch xn erhalten: 0
nx0n−1 Δx Δxn Δx ≈ =n . n x0 xn x0 0 Somit ist der relative Fehler von y ungef¨ ahr das n–fache des relativen Fehlers von x, also ±n%. Hinweis zu 7−7 bis 7−10: Eine andere Methode, den Fehler abzusch¨ atzen, besteht darin, dass man die gesuchte Gr¨ osse mit dem kleinst- und dem gr¨ osstm¨ oglichen Messwert berechnet. In Aufgabe 7−7 etwa sind dies die Werte U = 30.4 und U = 30.6 cm. Im ersten Fall erh¨ alt man A = 73.5 cm2 , im zweiten A = 74.5 cm2 , woraus die Bandbreite des Fehlers ebenfalls ersichtlich ist. Die Verwendung des Differentials hat den Vorteil, dass sie das allgemeine Prinzip der Linearisierung verwendet und dass sie sich auf Funktionen von mehreren Variablen u ¨ bertragen l¨ asst (Kapitel 24).
(28.8) L¨osungen zu Kapitel 8 Aus Platzgr¨ unden werden die Koordinaten der Vektoren neben- statt u ¨ bereinander geschrieben. ¨ 8−1 Die x–Koordinate muss stets = 0 sein. Ahnlich wie in (8.2.3.b,c) finden wir r(t) = (0, 2 + 2 cos t, 2 + 2 sin t), 0 ≤ t ≤ 2π. z 8−2 Wir f¨ uhren den Winkel t als Parameter ein. Der Punkt P liegt auf der Geraden y = x und hat vom Nullpunkt den √Abstand √ √
2 2
√
cos t,
2 2
2 2
cos t, cos t), cos t, sin t) mit 0 ≤ t ≤ π 2
cos t. Seine x-y–Koordinaten sind deshalb ( also k¨ onnen wir r(t) = ( w¨ ahlen.
2 2
1 y t P
x 8−3 Analog zu (8.2.4) ist r(t) = (2 + cos(2πt), 2 + sin(2πt), 3t), 0 ≤ t ≤ 1 eine m¨ ogliche Parameterdarstellung.
osungen zu Kapitel 8 28.8 L¨
451
8−4
Zu 8−5 y y
1 e x
P t r O
x 2πr
B
8−5 Wenn der Kreis abrollt, dann ist die Strecke OB bis zum Ber¨ uhrungspunkt gleich dem abgerollten Umfang, also = rt (im Bogenmass). Wie man der Zeichnung entnimmt, hat der Kurvenpunkt P die x–Koordinate x = rt − r sin t und die y–Koordinate y = r − r cos t. Es folgt r(t) = r(t − sin t, 1 − cos t), wobei das Parameterintervall 0 ≤ t ≤ 2π einer einmaligen Drehung entspricht. (Beachten Sie, dass die Formel f¨ ur alle Werte von t gilt, also auch dann, wenn sin t oder cos t negativ ist. F¨ ur den in der Figur eingetragenen Winkel t gilt beispielsweise sin t > 0, cos t < 0.) 8−6 Ableiten ergibt 1 r˙ (t) = ( (1 + t)−1/2 , t(t2 + 7)−1/2 , 2t), 2
1 ¨ r(t) = (− (1 + t)−3/2 , 7(t2 + 7)−3/2 , 2). 4
Einsetzen liefert 1 3 r˙ (t) = ( , , 6), 4 4
1 7 ¨ r(t) = (− , , 2). 32 64
8−7 b) Der h¨ ochste Kurvenpunkt ist der Punkt mit der maximalen z–Koordinate. Nun ist z = 4t − 4t2 , und durch Ableiten findet man, dass f¨ ur t = 1/2 das absolute Maximum vorliegt. Der zugeh¨ orige h¨ ochste Punkt hat die Koordinaten ( 12 , 1, 1). c) Gesucht ist der Parameterwert t, f¨ ur welchen der Kurvenpunkt in der Ebene liegt, d.h. f¨ ur welchen −4(1 − t) + 3 · 2t + 2(4t − 4t2 ) = 0 ist. Zusammenfassen f¨ uhrt auf die quadratische osungen 2 und 14 . Wegen Gleichung 8t2 − 18t + 4 mit den L¨ 0 ≤ t ≤ 1 kommt nur die zweite in Frage, zu ihr geh¨ ort der Punkt ( 34 , 12 , 34 ).
z 1
x
z 4
− − → − − → 8−8 b) Es ist OP = (4, 0, 4), OQ = (0, 4, 4). Mit dem Skalarprodukt findet man sofort cos ϕ = 0.5, also ϕ = 60◦ (oder π/3). c) Die Tangente im Punkt mit dem Parameterwert t hat die Richtung r˙ (t) = (−1, 1, 2t). Diese Richtung bildet mit der xy–Ebene genau dann einen Winkel von 45◦ , wenn sie mit dem Vektor k = (0, 0, 1) Winkel von 45◦ oder 135◦ einschliesst. Es muss also √ 2t r˙ (t) k 2 =± = √ 2 2 + 4t2 |r˙ (t)| |k| √ sein. Quadrieren f¨ uhrt auf die L¨ osungen t = 2/2 und t = √ − 2/2. √Einsetzen liefert √ die gesuchten Kurvenpunkte (2 − √ √ 2 , 2
2+
2 1 , 2) 2
bzw. (2 +
2 , 2
2−
2 1 , 2 ). 2
y 2
1
Q
P
O y x 4
4
osungen der Aufgaben 28. L¨
452
z 8−9 a), b). Zun¨ achst stellt man fest, dass r(0) = r(2π) = (2, 1, 0) ist. Die Kurve ist also geschlossen. Die Tangenten im Punkt P (2, 1, 0) haben aber f¨ ur die beiden Parameterwerte verschiedene Richtungen. Es ist r˙ (t) = (− sin t, cos t, 12 cos( 2t )), d.h. r˙ (0) = (0, 1, 12 ), r˙ (2π) = (0, 1, − 12 ). Wir kennen den Punkt P sowie die Richtungen der beiden Tangenten und k¨ onnen die Parameterdarstellungen angeben. Sie lauten u(s) = (2, 1 + s, 12 s) bzw. v (s) = (2, 1 + s, − 12 s).
1
y x
2
2
c) Die Projektion der Kurve auf die x-y–Ebene ist ein Kreis z mit Zentrum (1,1) und Radius 1. Die z–Koordinate sin( 2t ) w¨ achst f¨ ur 0 ≤ t < π und f¨ allt f¨ ur π < t ≤ 2π. Weil die in a) und b) ermittelten Tangenten in P je nach Parameterwert y verschiedene Richtungen haben, hat die Kurve dort eine Spitze. x Dieses Verhalten wird verst¨ andlicher, wenn man t von 0 bis 4π laufen l¨ asst. Die Kurve hat dann die Form einer “geknickten” Ziffer 8 (f¨ ur t ∈ (0, 2π) oberhalb, f¨ ur t ∈ (2π, 4π) unterhalb der x-y–Ebene, siehe Figur). d) Der Abstand zum Nullpunkt ist gegeben durch (1 + cos t)2 + (1 + sin t)2 + sin2 ( 2t ). Die Rechnung vereinfacht sich, wenn wir nicht diesen Ausdruck, sondern sein Quadrat, also f (t) = (1 + cos t)2 + (1 + sin t)2 + sin2 ( 2t ) = 3 + 2 cos t + 2 sin t + sin2 ( 2t ) minimieren. (Dabei wurde wieder einmal sin2 t + cos2 t = 1 benutzt.) Es ist f (t) = −2 sin t + 2 cos t + 12 sin t (unter Ber¨ ucksichtigung der Beziehung sin( 2t ) cos( 2t ) = 12 sin t). Damit ist f (t) = 0 genau dann, wenn tan t = sin t/ cos t = 4/3 ist. Im Intervall [0, 2π] gibt es genau 2 Werte t mit tan t = 4/3, n¨ amlich (im Bogenmass) 0.9272 . . . und 0.9272 . . . + π = 4.0688 . . . . Betrachtet man die Kurve, so ist klar, dass der zweite Wert das absolute Minimum liefert. (Man k¨ onnte auch mit der zweiten Ableitung arbeiten.) Einsetzen dieses Werts in r(t) ergibt den gesuchten Punkt (0.4, 0, 2, 0.8944). z √ 8−10 b) Wegen r˙ (t) = (1, 2t, 2t − 2) ist |r˙ (0)| = r˙ (1) = 5. c) 1 √ Gesucht ist das Minimum von v(t) = |r˙ (t)| = 8t2 − 8t + 5. y Mit den u ¨blichen Methoden sieht man, dass dieses Minimum 1 1 f¨ ur t = 2 angenommen wird und dass der minimale Betrag von √ v(t) gleich 3 ist.
1
x
8−11 a) Wir k¨ onnen sin(2πt) vorklammern und finden so r(t) = sin(2πt) · (1, 2, −1). Der Vektor r(t) ist also stets ein Vielfaches von (1, 2, −1). Wenn t das Intervall [0, 1] durchl¨ auft, so durchl¨ auft 2πt das Intervall [0, 2π]. Deshalb durchl¨ auft r(t) f¨ ur t ∈ [0, 1] die Strecke zwischen den Punkten P (−1, −2, 1) und Q(1, 2, −1). b) Diese Bewegung verl¨ auft wie folgt (man braucht einfach die Werte von sin(2πt) zu beachten): alt man der Reihe nach den Nullpunkt O, den Punkt Q, nochmals F¨ ur t = 0, 14 , 12 , 34 , 1 erh¨ den Nullpunkt, den Punkt P und landet schliesslich wieder bei O. 8−12 Wir w¨ ahlen drei einfache Werte von t, z.B. t = −1, 0, 1 und erhalten so drei Punkte der Raumkurve, n¨ amlich (1, −3, 3), (1, 0, 0) und (3, 3, 1). Mit der Methode von (2.6.7) bestimmen wir die Gleichung der Ebene durch diese drei Punkte, sie lautet −2x + y + z + 2 = 0. Es bleibt nachzupr¨ ufen, ob tats¨ achlich alle Punkte der Raumkurve (also f¨ ur beliebiges t) in dieser Ebene liegen. Dies trifft aber zu, denn es ist −2(t2 + t + 1) + 3t + (2t2 − t) + 2 = 0.
osungen zu Kapitel 10 28.10 L¨
453
ufen, ob es Parameterwerte t, u gibt, mit r(t) = s(u). Dazu m¨ 8−13 Es ist zu pr¨ ussen die drei ullt sein. Aus der zweiten Gleichung folgt Gleichungen t3 = 1 + u2 , t2 = 1 und t = 1 − u erf¨ uft man die t = 1 oder t = −1; die dritte liefert im ersten Fall u = 0, im zweiten Fall u = 2. Pr¨ beiden Paare mit der ersten Gleichung nach, so sieht man, dass t = 1, u = 0 die einzige L¨ osung ist. Es gibt also genau einen Schnittpunkt, n¨ amlich (1,1,1). Der Schnittwinkel ist der Winkel zwischen den beiden Tangenten in diesem Punkt, also zwischen den Vektoren r˙ (1) und s˙ (0). Man findet leicht r˙ (1) = (3, 2, 1) und s˙ (0) = (0, 0, −1) und berechnet mit dem Skalarprodukt den gesuchten Winkel zu 74.5◦ (oder 105.5◦ ). ur t = 0 und t = 2 vor, ur z = t2 − 2t = 0, also f¨ 8−14 Schnittpunkte mit der x-y–Ebene liegen f¨ n¨ amlich S(1, 1, 0) und T (9, 5, 0). Wegen r˙ (t) = (3t2 , 2t, 2t − 2) haben die Tangentialvektoren in S bzw. T die Richtung (0, 0, −2) bzw. (12, 4, 2). Der erste ist parallel zur z–Achse, also sieht ur den zweiten berechnen wir man ohne Rechnung, dass der erste Schnittwinkel = 90◦ ist. F¨ zuerst den Winkel der Tangente mit der z–Achse, also mit dem Vektor k = (0, 0, 1), und finden √ cos ϕ = 2/ 164, d.h. ϕ = 81.0◦ . Der gesuchte Schnittwinkel betr¨ agt daher 9.0◦ .
(28.9) L¨osungen zu Kapitel 9 Kapitel 9 enth¨ alt keine Aufgaben.
(28.10) L¨osungen zu Kapitel 10 10−1 Das Intervall [0, h] wird im Sinne von (10.2) unterteilt: 0 = z0 < z1 < . . . < zi−1 < zi < . . . zn = h .
h Dadurch wird der Inhalt des zylindrischen Gef¨ asses in (d¨ unne) zi zi−1 ξi Scheiben mit Querschnittsfl¨ ache Q zerlegt. Das Volumen der i–ten Scheibe betr¨ agt Vi = Q · (zi − zi−1 ) = Q · Δzi . In jedem Teilintervall [zi−1 , zi ] w¨ ahlen wir weiter einen Zwischenpunkt 0 ζi . Obwohl die Dichte an sich variabel ist, nehmen wir an, dass sie im Intervall [zi−1 , zi ] konstant = ρ(ζi ) ist. Gem¨ ass der f¨ ur konstante Dichte g¨ ultigen Formel “Masse = Dichte mal Volumen” hat die i–te Scheibe ungef¨ ahr die Masse ρ(ζi ) · Vi = ρ(ζi ) · Q · Δzi . Die Gesamtmasse der Substanz wird ahert. Diese Approximation ist um durch die Riemannsche Summe n i=1 Q · ρ(ζi ) · Δzi angen¨ so besser, je feiner die Unterteilung wird. Im Grenzfall erhalten wir die gesuchte Masse exakt als h h n Q · ρ(ζi ) · Δzi = Qρ(z) dz = Q ρ(z) dz . lim Δz i → 0
i=1
0
0
Die letzte Gleichheit gilt wegen (10.8.a). 10−2 Die Aufgabe wird im Prinzip gleich wie die Aufgabe 10−1 gel¨ ost. Der einzige Unterschied besteht darin, dass der Fl¨ acheninhalt des Querschnitts variabel ist: Q = Q(z). Die Gesamtmasse der i–ten Scheibe betr¨ agt daher ρ(ζi ) · Vi = ρ(ζi ) · Q(ζi ) · Δzi . Entsprechend ¨ andert sich die Riemannsche Summe, und man erh¨ alt am Schluss das Integral 0h Q(z)ρ(z) dz.
h zi zi−1 ξi 0
10−3 Unter dem “totalen Kalorienverbrauch” T ist die im betreffenden Zeitintervall (z.B. 6 Minuten) geleistete Arbeit zu verstehen. Innerhalb eines kleinen Zeitintervalls Δti = ti − ti−1 kann man die Leistung als konstant betrachten: P = P (τi ) f¨ ur ein τi mit ti−1 ≤ τi ≤ ti .
osungen der Aufgaben 28. L¨
454
ahert, und der Somit wird T durch Summation als Riemannsche Summe in=1 P (τi )Δti angen¨ ur T das Integral 00.1 P (t) dt. (Die obere ubergang liefert als exakten Wert f¨ u ¨bliche Grenz¨ Integrationsgrenze 0.1 kommt daher, dass P den Verbrauch pro Stunde angibt und dass 6 osung von are leicht analog zur L¨ Minuten lang trainiert wurde.) Eine detaillierte Darstellung w¨ Aufg. 10−1 aufzuschreiben. ass (9.2) l¨ osen. Es ist bloss zu beachten, dass die (variable) asst sich gem¨ 10−4 Diese Aufgabe l¨ Gewichtskraft gleich m(h)g (g = Fallbeschleunigung) ist. Somit ist die geleistete Arbeit durch = g hh1 m(h) dh gegeben. 0
10−5 Diese Aufgabe hat gewisse Parallelen zu (9.4) (Volumen eines Rotationsk¨ orpers). Wir teilen das Intervall [a, b] wie u ¨blich in ahlen in jedem Teilinkleine Teilintervalle [xi−1 , xi ] ein und w¨ tervall einen Zwischenpunkt ξi . Durch diese Unterteilung wird der K¨ orper in d¨ unne Scheiben der Dicke Δxi = xi − xi−1 zerlegt, welche (nahezu) die Form eines dreiseitigen Prismas haben, dessen Grundfl¨ ache ein gleichseitiges Dreieck und dessen H¨ ohe = Δxi ist. Dieses gleichseitige Dreieck hat die Seiten√ √ l¨ ange si = 2f (ξi ), also den Inhalt 43 s2i = 3f (ξi )2 . Das Vo√ lumen der d¨ unnen Scheibe betr¨ agt demgem¨ ass 3f (ξi )2 Δxi , das Gesamtvolumen wird durch die Riemannsche Summe n √ 2 ahert. Mit dem u ¨blichen Grenz¨ uberi=1 3f (ξi ) Δxi angen¨ √ gang erhalten wir f¨ ur das Volumen den Wert ab 3f (x)2 dx = √ b 3 a f (x)2 dx. Der Unterschied zur Formel f¨ ur das Volumen des Rotationsk¨ orpers (9.4) besteht also darin, dass der dort √ auftretende Faktor π durch 3 ersetzt wird.
a f
x b
si Δxi
In den L¨ osungen von 10−6 bis 10−8 argumentieren wir im Stil von (10.4.c). Eine exakte Durchf¨ uhrung via Riemannsche Summen ist selbstverst¨ andlich in allen F¨ allen m¨ oglich. y r dϕ 10−6 F¨ ur einen sehr kleinen Winkel dϕ ist das schraffierte Fl¨ achenst¨ uck praktisch ein Kreissektor (denn r variiert nur wenig, wenn r sich ϕ zu ϕ + dϕ ¨ andert). Nach der u ¨blichen Formel hat dieser Sektor den Inhalt 12 r2 dϕ = 12 r(ϕ)2 dϕ, und der Gesamtinhalt x ergibt sich durch Integration zu 12 αβ r(ϕ)2 dϕ. 10−7 Die Gr¨ osse (f (x) − g(x)) dx steht f¨ ur den Inhalt eines sehr schmalen Streifens gem¨ ass Skizze. Deshalb liefert der Ausdruck b a (f (x) − g(x)) dx den Inhalt des durch die beiden Kurven begrenzten Fl¨ achenst¨ ucks. Beachten Sie, dass es nicht darauf ankommt, welches Vorzeichen f (x) oder g(x) hat; wichtig ist nur, dass stets f (x) ≥ g(x) ist.
y f x g
10−8 Im kleinen Zeitintervall dt fliesst die Wassermenge L(t) dt aus der R¨ ohre. Das Integral tt01 L(t) dt gibt daher die im Zeitintervall [t0 , t1 ] gelieferte Wassermenge an. y
10−9 Wir unterteilen das Intervall [a, b] beliebig c a = x0 < x1 < . . . < xi−1 < xi < . . . < xn = b , und w¨ ahlen Zwischenpunkte ξi . Da f konstant ist (f (x) = c f (ξi )Δxi = f¨ ur alle x), gilt f¨ ur die Riemannsche Summe n n n i=1 n i=1 cΔxi = c i=1 Δxi . Nun ist aber i=1 Δxi offensichtlich = b − a. Jede Riemannsche Summe nimmt also den Wert
x
osungen zu Kapitel 11 28.11 L¨
455
c(b − a) an, und damit auch ihr Limes, das Integral. Also ist ab c dx = c(b − a). (Falls c > 0 ist, ohe c; f¨ ur c < 0 ist das Integral so ist dies der Inhalt des Rechtecks mit Grundlinie b − a und H¨ negativ; der Inhalt des entsprechenden Rechtecks ist dann der Betrag des Integrals.) ¨bernehmen wir auch die Bezeichnungen. Im Falle 10−10 Wir gehen wie in (10.7) vor. Von dort u unserer Aufgabe ist b = 1 und vor allem ist f (x) = x (statt x2 ). Deshalb erhalten wir f¨ ur die analog berechnete Riemannsche Summe n n n i 1 1 Sn = f (ξi )Δxi = i. · = 2 n n n i=1
i=1
i=1
Die letzte Summe aber ist = n(n + 1)/2, und wir finden Sn =
1 n(n + 1) n+1 1 1 · = = + . n2 2 2n 2 2n
F¨ ur n → ∞ strebt dieser Ausdruck offensichtlich gegen 1/2, es folgt 1 1 x dx = , 2 0 was bei geometrischer Interpretation (als Fl¨ acheninhalt) ohnehin klar ist.
(28.11) L¨osungen zu Kapitel 11 11−1 In den Kapiteln 12 und 13 soll das “Erraten” durch systematischere Verfahren ersetzt werden. Diese Aufgaben dienen sozusagen als Vor¨ ubung. a) Gesucht ist eine Funktion F (x), deren Ableitung = x3 ist. Nun ist die Ableitung von x4 gleich 4x3 , der st¨ orende Faktor 4 kann weggeschafft werden, indem man F (x) = 14 x4 setzt. Nach dem Hauptsatz ist dann
2 1 1 2 1 x3 dx = F (2) − F (0) = x4
= · 16 − · 0 = 4 . 4 4 4 0 0 b) Lassen Sie sich nicht durch die Bezeichnung der Variablen mit α st¨ oren. Gesucht ist eine Stammfunktion F (α) von sin α. Da cos α die Ableitung − sin α hat, k¨ onnen wir F (α) = − cos α w¨ ahlen. Es folgt
π π
sin α dα = − cos α
= − cos π + cos 0 = 2 . 0
0
c) Da et offensichtlich eine Stammfunktion von et ist, erh¨ alt man
1 1
1 et dt = et
= e1 − e−1 = e − = 2.3504 . e −1 −1 11−2 Wir benutzen die Tatsache (I) von (11.2) sowie die dort verwendete Definition von Φ(x). a) Da Φ (x) gleich dem Integranden ist, folgt unmittelbar, dass die gesuchte Ableitung gleich √ x3 + 1 ist. b) Das Integral hat noch nicht die Form Φ(x). Wegen (10.8.b) ist aber x 1 sin(t2 ) f t = − sin(t2 ) dt = −Φ(x) . x
1
Wegen der Tatsache (I) hat die Ableitung den Wert − sin(x2 ). c) Das Integral hat den Wert Φ(x2 ). Die Ableitung dieser Funktion ist nach der Kettenregel gleich Φ (x2 ) · 2x (2x ist die innerer Ableitung), also gleich 2x · f (x2 ).
osungen der Aufgaben 28. L¨
456
osungsvariante kann man auch den Hauptsatz verwenden. Dies sei an Beispiel b) gezeigt. Als L¨ Nach diesem Satz ist x1 sin(t2 ) dt = F (1) − F (x), wo F (x) = sin(x2 ) ist. Da F (1) konstant ist, erh¨ alt man als Ableitung des Integrals erneut den Wert −F (x) = − sin(x2 ). Es sei noch ahnt, dass die Integranden von a) und b) keine elementare Stammfunktion haben (vgl. erw¨ (12.2.e) f¨ ¨hnliche Situation). ur eine a
(28.12) L¨osungen zu Kapitel 12 1 12−1 a) 1 x11 + x9 − 1 x2 + x b) 3 ln |x| + x−3 11 2 3 2 c) x3/2 + 2x1/2 d) 2 tan x 3 12−2 Die Bedingung F (x0 ) = y0 kann jeweils durch geeignete Wahl der Integrationskonstanten C erf¨ ullt werden. 1 3 1 a) x3 + x4/3 + x + 1 b) ex + − e 3 4 x √ 17 3 3 d) −2 cos x + sin x − c) x7/3 + 4x1/4 − 7 7 2 √ 193 2 , c) −11.5 − 3 ln 4 = −15.6589, d) e4 − e + 1 = 52.8799, e) −2 − = −2.7071, 12−3 a) 4, b) 105 2 π f) 1 − = 0.9217. 4 x √ 3 3 3 12−4 a) Aus u du = x4/3 − = 60 folgt x = 27. 4 4 1 2 2 2 2 1 dt = ln 2 − ln x = ln = 1 folgt = e, also x = = 0.7358. b) Aus x x e x t √ 12−5 Die Nullstellen von f (x) sind ± 3, 0. Wenn Sie einfach von y √ √ − 3 bis 3 integrieren, so erhalten Sie den Wert 0, denn der √ 3 unterhalb der x–Achse liegende Teil des Graphen liefert einen x √ negativen Beitrag zum Integral. Sie m¨ ussen also getrennt von − 3 √ √ − 3 bis 0 und von 0 bis 3 integrieren. Nun ist 0 1 3 3 . √ ( x − x) dx = 3 4 − 3 √ Aus Symmetriegr¨ unden ist dann das Integral von 0 bis 3 3 3 gleich − 4 , und der gesuchte Fl¨ acheninhalt ist gleich 2 . a dx a2 dx 12−6 Wegen 1 x = ln a, 1 x = ln a2 = 2 ln a ist der zweite Fl¨ acheninhalt doppelt so gross wie der erste. 1 x −1 . Der gesuchte Punkt b 12−7 Der Inhalt A des fraglichen Fl¨ achenst¨ ucks ist = − 1 e dx = e − e b x 1 b − 1 = 12 (e − e−1 ), woraus sich der x–Achse ist gegeben durch −1 e dx = 2 A. Es folgt e − e 1 − 1 b = ln 2 (e + e ) = 0.4338 ergibt. y 12−8 Der ganze Fl¨ acheninhalt unter der Kurve betr¨ agt 02 (2x−x2 ) dx = 43 . Ferner ben¨ otigt man die x–Koordinate z des Schnittuhrt auf punkts der Parabel mit der Geraden: az = 2z − z 2 f¨ z = 0 (uninteressant) und z = 2 − a. Die Zahl a ist so zu bestimmen, dass das Fl¨ achenst¨ uck F1 den Inhalt 23 hat. (Man x k¨ onnte auch die Fl¨ acheninhalte von F1 und F2 gleich oder aber den Inhalt von F2 gleich 23 setzen, was auf ¨ ahnliche Rechnungen f¨ uhrt.) Der Inhalt von F1 ist gleich
osungen zu Kapitel 12 28.12 L¨
z (∗)
A1 =
0
457
x3 ax2
2−a a 2−a (2x − x2 ) − ax dx = x2 − − − , = (2 − a)2 1 − 3 2 0 3 2
wobei z = 2 − a ben¨ utzt wurde. Hier ist es gut, wenn man nicht zuviel ausmultipliziert (sonst kommt man auf einer Gleichung 3. Grades f¨ ur a), sondern beachtet, dass die Klammer ganz √ rechts den Wert (2 − a)/6 hat. Es folgt A1 = (2 − a)3 /6 = 2/3 und daraus a = 2 − 3 4 = 0.4126. Etwas k¨ urzer wird die Rechnung, wenn man in (∗) die obere Grenze z bel¨ asst und a = 2 − z einsetzt:
z x3 z3 ax2
z z2 z3 (2x − x2 ) − ax dx = x2 − A1 = = z2 − − − (2 − z) = .
3 2 3 2 6 0
0
√ √ 3 urlich ist dieser So findet man A1 = z6 = 23 , d.h. z = 3 4 und a = 2 − z = 3 4 wie oben. Nat¨ einfachere Weg nicht zum vorneherein erkennbar. √ √ 4 x ≥ x4 . Der Fl¨ acheninhalt ist somit gegeben durch 01 ( 4 x−x4 ) dx =
12−9 Im Intervall [0, 1] ist
3 . 5
12−10 Die Schnittpunkte der beiden Kurven findet man durch Gleichsetzen: sin x = cos x ⇐⇒ tan x = 1, woraus sich x1 = − 34π und x2 = π ergibt. Im Intervall [x1 , x2 ] ist cos x ≥ sin x, weshalb der 4 √ π/4 gesuchte Fl¨ acheninhalt gleich −3π/4 (cos x − sin x) dx = 2 2 ist. 12−11 Der Graph ist eine nach unten ge¨ offnete Parabel. Die Nullstellen sind x = 1 und x = 4. Das Volumen des Rotationsk¨ orpers ist gegeben durch V = π 14 (−x2 +5x−4)2 dx. Durch Ausmultiplizieren des Integranden und durch Integration des erhaltenen Polynoms 4. Grades, n¨ amlich x4 − 10x3 + 33x2 − 40x + 16, erh¨ alt man V = 8.1π. 12−12 Da der K¨ orper durch Rotation des Graphen von y = x3 um die y–Achse entsteht, kann man nicht direkt die Formel von (9.5) anwenden. Vielmehr approximiert man das Volumen durch d¨ unne zylinderf¨ ormige Scheiben, die senkrecht zur y–Achse ste√ hen. Eine solche Scheibe hat den Radius x = 3 y, und wenn x von 0 bis 2 l¨ auft, dann l¨ auft y von 0 bis 8. Das Volumen ist √
8 π. somit gegeben durch π 08 ( 3 y)2 dy = π 35 y 5/3 = 96 5
y
1
4
x
y 8
x 2 12−13 Der Ansatz ist v¨ ollig analog zu Aufgabe 10−5, es ist einzig das gleichseitige Dreieck mit Seitenl¨ ange 2f (x) durch das Quadrat mit Seitenl¨ ange 2f (x) zu ersetzen, welches den Inhalt 4f (x)2 hat. Das gesuchte Volumen ist also gegeben durch 4 b √ f (x)2 dx = 4 ( x)2 dx = 30 . 4 0
a
1
12−14 Wenn wir die H¨ ohe h das Sackes vom Boden aus messen, so ist die Masse m(h) des Sackes gegeben durch 50 0≤h≤5 m(h) = 5 ≤ h ≤ 20. 50 + 5−h 3 ist eine lineare (gleichm¨ assige Abnahme!) Funktion von h, welche f¨ ur h = 5 den Der Term 5−h 3 Wert 0 und f¨ ur h = 20 den Wert −5 annimmt und so die Gewichtsabnahme um 5 kg beschreibt. ur die letzten 15 m aber durch F¨ ur die ersten 5 m ist die Arbeit gegeben durch W1 = 50 · g · 5, f¨ W2 = g 520 (50 + 5−h ) dh = g · 712.5. Die total geleistete Arbeit ist somit gleich 962.5g J, wo 3 g = 9.81 ms−1 die Fallbeschleunigung ist. (Vgl. auch (9.3) und Aufgabe 10−4.)
osungen der Aufgaben 28. L¨
458
12−15 a) Bei einer Belastung von m = 5 kg wird die Feder um 0.2 m ausgelenkt. In diesem Fall haben die Gewichtskraft und die Federkraft den gleichen Betrag, es ist also 5g = 0.2k, woraus k = 25g folgt. angte Masse b) Wenn die Feder um x m aus der Ruhelage ausgelenkt ist, so wirkt auf die angeh¨ die Kraft mg − kx. (F¨ ur x > 0.2 ist diese Zahl negativ, denn die Resultierende von Feder- und Gewichtskraft zeigt nach oben, entgegen der Verl¨ angerungsrichtung.) Wenn ich die Auslenkung der Feder von 0.2 m auf 0.25 m vergr¨ ossere, so leiste ich die Arbeit W = 00..225 (−(mg−kx)) dx =
0.25
−(mgx − k2 x2 )
. Setzt man Zahlen ein (m = 5, g = 9.81, k = 25g), so folgt W = 0.3066 J. 0. 2
12−16 Es sei ρW = 1000 kg m−3 die Dichte des Wassers, ρH = 700 kg ohe des Balkens (gleich seiner m−3 jene des Holzes, h sei die H¨ Breite) und sei seine L¨ ange. ¨ber Wasser befindliWir bestimmen zuerst die H¨ ohe x0 des u chen Teils des Balkens. Dieser ist im Gleichgewicht, wenn die Auftriebskraft FA und die Gewichtskraft FG denselben Betrag haben. Dabei ist FG = gρH h2 , denn h2 ist das Volumen des Balkens. Die Auftriebskraft ist gleich der Gewichtskraft des vom Balken verdr¨ angten Wassers, also ist FA = gρW h(h−x0 ). Gleichsetzen von FG und FA ergibt x0 = h(ρW − ρH )/ρW . Setzt man Zahlen ein, so folgt x0 = 0.06 m.
x0
h
h
Dr¨ uckt man den Balken tiefer ins Wasser, so wird die Auftriebskraft immer gr¨ osser, die Gewichtskraft bleibt konstant. F¨ ur die H¨ ohe x des noch u ¨ber Wasser befindlichen Teils ist diese Differenz gleich gρW h(h−x)−gρH h2 = gh(ρW (h−x)−ρH h). Beim vollst¨ andigen Eintauchen variiert x zwischen x0 = 0.06 und 0. Die zu leistende Arbeit ist gegeben durch
x0 ρW 2
x0 gh(ρW (h − x) − ρH h) dx = gh (ρW − ρH )hx − x = . . . = 10.5948 J . 2 0
0
12−17 Die gesuchte mittlere Temperatur T ist ein konkretes Beispiel eines Mittelwerts im Sinne von (12.6.8). Somit gilt 24 24 1 1 1 T = T (t) dt = 15 + (24t − t2 ) dt = . . . = 23◦ C . 24 0 24 0 12 12−18 Zu bestimmen ist L = f (x) =
2 1
1 + f (x)2 dx. Wir berechnen der Reihe nach
1 1 1 1 1 1 1 2 1 2 (x − 2 ), f (x)2 = (x4 − 2 + 4 ), 1 + f (x)2 = (x4 + 2 + 4 ) = (x2 + 2 ) . 2 x 4 x 4 x 2 x
(Dies war die in der Aufgabenstellung angesprochene “geschickte Umformung”.) Es folgt 2 1
2 1 1 x3 17 1 2 (x + 2 ) dx = ( − ) = . . . = . L= 1 2 x 2 3 x 12 1 12−19 Der Integrand f (x) = x12 ist im Nullpunkt, der im Integrationsintervall [−1, 1] liegt, gar nicht definiert. Bei der Herleitung des Hauptsatzes hatten wir aber vorausgesetzt, dass die betrachtete Funktion auf auf einem ganzen Intervall definiert ist. (In unserem Fall zerst¨ ort die “Definitionsl¨ ucke” im Nullpunkt die ganze sch¨ one Theorie.)
osungen zu Kapitel 13 28.13 L¨
459
(28.13) L¨osungen zu Kapitel 13 Zu 13−1 bis 13−7: Wenn Sie die hier gegebenen L¨ osungen ableiten, so werden (sollten) Sie nat¨ urlich den entsprechenden Integranden von der Vorderseite bekommen. Auf diese Weise erhalten Sie gratis ¨ 36 Ubungsaufgaben zum Differenzieren. Abk¨ urzungen: P steht f¨ ur partielle Integration, S f¨ ur Substitution (mit Angabe einer m¨ oglichen “inneren Funktion”). 13−1 Summen, Differenzen und Vielfache von Grundfunktionen.
1
x4 1 − 1 2 + x
a) x3 − =4 b) ln |t| +
= − − ln 3 = −1.7652 4 t 3 −1 −3
π/2
4 √
c) 2u3/2 − 4u1/2
= 10 d) − cos ϕ − sin ϕ
= 2 − 1 = 0.4142 1
1 6 11 = 0.5182 e) ez − z 5/3
= e − 5
0
5
13−2 Vorg¨ angiges Umformen des Integranden. 2 1 5 a) x + x3 + x + C (Ausmultiplizieren) 5 3 2√ 3 2√ 5 c) t − t + C (Ausmultiplizieren) 3 5
π/4
f) 2 tan x
=2
π/4
0
b)
1 2 4 x + 5x + + C (Ausdividieren) 2 x
13−3 Substitution; einfachster Fall (innere Funktion linear).
−2/3
3
a) −2eu
= −2e−s/2
= 4.9903 (S: u = −s/2) 1 − 2
7
3 1 1
b) ln |u| = ln |2t + 1|
= 0.4236 (S: u = 2t + 1) 2 2 3
π/4
1π
α α = −4 cos
= 1.1716 (S: u = ) c) −4 cos u
4 0 4 0 13−4 Substitution; allgemeiner Fall. 1 2 a) (x + 1)6 + C (S: u = x2 + 1) 12 1 c) (z 2 + z)4 + C (S: u = z 2 + z) 4 1 e) (ex − 1)3 + C (S: u = ex − 1) 3
2 (x3 − 2)3 + C (S: u = x3 − 2) 9 1 d) sin5 ψ + C (S: u = sin ψ) 5 √ √ f) 2e x + C (S: u = x) b)
13−5 Partielle Integration. x3 x3 ln x − +C 3 9 c) (1 − t) cos t + sin t + C a)
13−6 Verwendung von Integraltabellen.
1 3x + 2
+C a) ln
4 3x + 6
c) x x2 + 9 + 9 ln x + x2 + 9 + C
b) −(x2 e−x + 2xe−x + 2e−x ) + C
b) z − ln |2z + 1| + C
osungen der Aufgaben 28. L¨
460
13−7 Vermischte Beispiele. 1 (1 − 2x)n+1 (S: u = 1 − 2x) 2(n + 1) √ √ 4 2√ 5 b) 2 x + x3 + x + C (Ausmultiplizieren) 3 5 2 (ln t)3 + C (S: u = ln t) c) 3 3 d) −x cos x + 3x2 sin x + 6x cos x − 6 sin x + C (3 × P) a) −
3 e) 2ex −x + C (S: u = x3 − x) 1 1 f) cos + C (S: u = ) σ σ 1 g) (x2 + 1)(ln(x2 + 1) − 1) + C (S: u = x2 + 1 und Trick von (13.6.3)) 2 1 h) ln(1 − cos(2α)) + C (S: u = 1 − cos(2α)) 2 1 i) (2x + 1)2 e2x+1 − (2x + 1)e2x+1 + e2x+1 + C (S: u = 2x + 1 und 2 × P) 2 2√ x + 2(x − 4) + C (S: u = x + 2, vgl. (13.6.5)) j) 3 1 sin(t2 ) − t2 cos(t2 ) + C (S : u = t2 , dann P) k) 2 1 1 l) ln |a + bex | f¨ ur b = 0, ex f¨ ur b = 0. b a
13−8 Wegen der bekannten Rechenregeln f¨ ur Logarithmen ist ln |2x| = ln 2 + ln |x|. Somit unterscheiden sich die beiden Resultate um die additive Konstante 12 ln 2, aber Stammfunktionen sind ja ohnehin nur bis auf solche additiven Konstanten bestimmt. Es besteht also kein Widerspruch! H¨ atten die beiden ihre L¨ osungen in der Form 12 ln |2x| + C bzw. 12 ln |x| + C aufgeschrieben, so w¨ aren sie vielleicht selbst zum obigen Schluss gekommen. 13−9 Zu berechnen ist V = π 01 (2x )2 dx. Wir gehen zur Exponentialfunktion mit Basis e u ¨ber und x 2 2 x ln 2 . Eine Stammfunktion von e2x ln 2 finden wir mit der Substitution schreiben (2 ) = e u = 2x ln 2, du = 2 ln 2: 1 1 e2x ln 2 dx = e2x ln 2 = 2x . 2x dx = 2 ln 2 2 ln 2 Einsetzen der Grenzen und Multiplikation mit π liefert V =
3π 2 ln 2
= 6.79856.
π
13−10 Wegen V = π 0 (1 + sin x)2 dx ben¨ otigen wir eine Stammfunktion F (x) von (1 + sin x)2 = 1 + 2 sin x + sin2 x. Die ersten beiden Summanden sind einfach, f¨ ur den dritten sei auf (13.6.4) verwiesen. Wir finden F (x) = x − 2 cos x + 12 (x − sin x cos x). Einsetzen der Grenzen 0 und π und Multiplikation mit π ergeben V = π 4 + 32π = 27.3708. √ 13−11 Zu berechnen ist μ = 14 04 x x2 + 9 dx. Wir verwenden die Substitution u = x2 + 9 und transformieren die Grenzen (Variante 2 von (13.4)): du = 2 dx, u(0) = 9, u(4) = 25. Es folgt
1 4 2 1 25 √ 1 2 3/2
25 49 μ= u = . x x + 9 dx = u du = 4 0 8 9 83 6 9 13−12 Eine ¨ ahnliche Aufgabe ist in (12.6.7) gel¨ ost worden. Hier wird der Integrand etwas komplizier1 1 ter. Zu bestimmen ist L = − 1 + f (x)2 dx = − 1 + (2x)2 dx. Dieser Integrand findet 1 1 sich nicht direkt in der Integraltabelle (13.7). Mit der Substitution u = 2x du = 2 dx erhalten
osungen zu Kapitel 14 28.14 L¨
461
ass (13.7): wir aber gem¨
1 1 u 2 1
1 + (2x)2 dx = 1 + u2 du = u + 1 + ln
u + u2 + 1
2 2 2 2
x 1
= (2x)2 + 1 + ln
2x + (2x)2 + 1
. 2 4 Hier sind wir wieder zur Variablen x zur¨ uckgegangen (Variante 1 von (13.4)). Einsetzen der Grenzen −1 und 1 in diese Stammfunktion liefert nach einigem Rechnen L = 2.9579.
(28.14) L¨osungen zu Kapitel 14 Aus Platzgr¨ unden werden die Koordinaten der Vektoren meist neben- statt untereinander geschrieben. 1
3 5 , ). 7 9 √ √ 14−2 a) (π, −2, 0), b) π 2 + 4 = 3.7242, c) 0π |v (s)| ds = 0π s2 + 1 ds = 6.1099 (Tabelle (13.7). 2 14−3 Nach Beispiel 1. von (14.2) ist r(t) = r(2)+ 0 v (s) ds. Es folgt a) r(2) = (0, 0, 0)+(4, −6, 18) = (4, −6, 18), b) r(2) = (1, −1, 2) + (4, −6, 18) = (5, −7, 20).
14−1
0
r(t) dt = ( 15 ,
14−4 Gegeben sind der Ortsvektor r(0) = (0, 0, 0) des Massenpunkts zur Zeit t = 0 und sein Geschwindigkeitsvektor v (0) = (4, 32, 16). Dieser Vektor ergibt sich dadurch, dass er die Richtung q = (1, 8, 4) und den Betrag 36 hat (q hat den Betrag 9, also muss v (0) = 4q sein). Ferner kennt man den Beschleunigungsvektor a = (0, 0, −10) (die Beschleunigung ist zeitlich konstant und wirkt senkrecht nach unten (deshalb das Minuszeichen) und hat den Betrag g ≈ 10). Nun ist a(t) = v˙ (t) = ¨ r(t), und deshalb ist zun¨ achst (koordinatenweise Integration) ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ 4 0 4 t t ⎟ ⎟ ⎜ ⎜ ⎟ ⎜ 32 a(s) ds = ⎝ 32 ⎠ + ⎝ 0 ⎠ = ⎝ v (t) = v (0) + v˙ (s) ds = ⎠. 0
0
16
−10t
16 − 10t
Analog wird wegen r˙ (t) = v (t) der Ortsvektor r(t) durch Integration erhalten: ⎛ ⎞ ⎛ ⎞ ⎛ 0 4t 4t t t ⎜ ⎟ ⎜ ⎟ ⎜ r(t) = r(0) + v (s) ds = ⎝ 0 ⎠ + ⎝ 32t r˙ (s) ds = 32t ⎠=⎝ 0
0
0
16t − 5t2
16t − 5t2
⎞ ⎟ ⎠.
Der Punkt trifft die x-y–Ebene wieder, wenn die z–Koordinate = 0 ist: 16t − 5t2 = 0 liefert (t = 0 ergibt den Startzeitpunkt) und den Auftreffpunkt r( 16 ) = ( 64 , 512 , 0). t = 16 5 5 5 5 14−5 a)
b) y
y
x 1
Dicke Punkte bezeichnen den Nullvektor.
1
x
osungen der Aufgaben 28. L¨
462
(r(t)) und r˙ (t): 14−6 Wir berechnen (vgl. das Schema in (14.6) F ⎛ ⎞ ⎞ ⎛ 0 t − t2 ⎜ ⎟ ⎟ ⎜ 2 (r(t)) = ⎝ t − 1 ⎠ , r˙ (t) = ⎝ 1 ⎠ . F 2t 1−t (r(t)) · r˙ (t) findet man (t2 − 1) + (1 − t) · 2t = −t2 + 2t − 1. Dieser F¨ ur das Skalarprodukt F (r) dr = − 1 . alt so C F Ausdruck muss von 0 bis 1 integriert werden. Man erh¨ 3 14−7 Das Vorgehen ist dasselbe wie in Aufgabe 14−6: ⎛ ⎞ cos t + sin t ⎜ (r(t)) = ⎝ − cos t + sin t ⎟ F ⎠, 0 (r(t)) · r˙ (t) = Es ist dann F r) dr = −2π. C F (
− sin2
t−
⎛ ⎞ − sin t ⎟ ˙r(t) = ⎜ ⎝ cos t ⎠ . cos t
cos2
t = −1, und Integration von 0 bis 2π liefert
14−8 Wie in Beispiel 2. von (14.6) bestimmen wir zuerst eine Parameterdarstellung r(t) der Strecke AB. Es ist ⎛ ⎞ ⎞ ⎛ ⎞ ⎛ 1+t 1 1 + t2 ⎟ ⎜ ⎟ ⎜ ⎟ (r(t)) = ⎜ r(t) = ⎝ t ⎠ , t ∈ [0, 1], somit r˙ (t) = ⎝ 1 ⎠ und weiter F ⎝ t2 − t ⎠ . 2 1+t −1 + t 1 1 5 2 Damit wird C F (r) dr = 0 (2 − t + 3t ) dt = 2 . 14−9 Wir erhalten durch Einsetzen bzw. Ableiten von r(t) ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1+t 1 1+t ⎟ ⎜ ⎟ ⎟ (r(t)) = ⎜ (r(t)) = ⎜ a) F b) F ⎝ −t ⎠ , r˙ (t) = ⎝ 1 ⎠ , ⎝ −t3 ⎠ ,
⎛
1
⎞
⎜ ⎟ r˙ (t) = ⎝ 2t ⎠ . 2 t 1 3t 1 1 3 Damit wird im Fall a) C F (r) dr = 0 (1 + t) dt = 2 , im Fall b) C F (r) dr = 0 (1 + t + t4 ) dt = 17 . Diese Aufgabe zeigt u ¨brigens, dass der Wert eines Kurvenintegrals i.a. nicht bloss von den 10 Endpunkten der Kurve, sondern von der Kurve selbst abh¨ angt. t2
14−10 Wir geben zuerst eine Parameterdarstellung f¨ ur C an. Es ist −2 sin t 2 cos t π (r(t)) = 2(cos t − sin t) . und weiter F r(t) = , t ∈ [0, ], somit r˙ (t) = 2 2 cos t 2 cos t 2 sin t (r) dr = π/2 4(1−sin t cos t) dt = 2(π−1). (Wie man sin t cos t dt Man erh¨ alt schliesslich C F 0 berechnet, ist in (13.3.4) und (13.3.9) beschrieben.) (r) = r = x1 . Eine einfache Parameterdarstellung von C ist gegeben durch r(t) = 14−11 Hier ist F x2 1 t ˙ (t) = , t ∈ [−1, 1] (vgl. den Hinweis in (8.3)). Wegen r ist schliesslich 3t2 − 1 t3 − t 1 5 3 r) dr = −1 (3t − 4t + 2t) dt = 0. C F (
osungen zu Kapitel 15 28.15 L¨
463
(28.15) L¨osungen zu Kapitel 15 15−1 In einem kleinen Zeitintervall der L¨ ange Δt ¨ andert sich aufgrund des (zu N (t) proportionalen) “internen” Wachstums die Gr¨ osse der Population um ΔN = aN (t)Δt (a > 0). Dazu kommt die “externe” Zuwanderung. Diese ist zeitlich gleichf¨ ormig, d.h. proportional zur L¨ ange des betrachteten Zeitintervalls, hat also die Form bΔt (b > 0). Zusammen erhalten wir ΔN = aN (t)Δt + bΔt. Dividieren wir durch Δt und lassen anschliessend Δt gegen Null streben, so erhalten wir die gesuchte Differentialgleichung, n¨ amlich N (t) = aN (t) + b, (a, b > 0) . Hinweis: Dies ist eine sogenannte “lineare Differentialgleichung mit konstanten Koeffizienten” (vgl. auch die Gleichung (3) in (15.3.b)), die in (16.8) gel¨ ost wird. ¨ 15−2 Ahnlich wie in Aufgabe 15−1 ist das “interne” Wachstum im Zeitintervall Δt gegeben durch ΔN = aN (t)Δt (a > 0). Nach Annahme vermindert sich wegen der Wirkung des Giftstoffs die Anzahl der Bakterien in diesem Zeitraum um bN (t)T (t)Δt f¨ ur ein b > 0. Zusammen erhalten wir ΔN = aN (t)Δt − bN (t)T (t)Δt. Division durch Δt und der u ¨bliche Grenz¨ ubergang Δt → 0 f¨ uhren auf die Differentialgleichung N (t) = N (t)(a − bT (t)), (a, b > 0) . 15−3 Die positive Achse soll nach unten zeigen. Auf den K¨ orper wirkt die Gewichtskraft mit dem Betrag FG = mg nach unten sowie die Reibungskraft mit dem Betrag FR = av(t)2 (f¨ ur ein a > 0) nach oben. Die resultierende Kraft FG − FR ist gleich Masse m mal Beschleunigung v(t), ˙ was auf die Differentialgleichung mv(t) ˙ = mg − av(t)2
oder
v˙ = g −
a 2 v m
a s˙ 2 . f¨ uhrt. Wegen v(t) = s˙ (t) hat die Differentialgleichung f¨ ur s(t) die Form ¨ s=g− m
15−4 Die gegebenen Bedingungen f¨ uhren direkt auf die Differentialgleichung h dh =a 3 . dt t Hinweis: Diese Differentialgleichung kann mit der Methode der Separation der Variablen (16.9) gel¨ ost werden. 15−5 Wenn V das Volumen und F die Oberfl¨ ache der Zelle bezeichnet, dann ist nach Aufgabenstel4π 3 2 lung dV angigen) Radius der Zelle dt = aF . Weiter ist V = 3 r , F = 4πr , wo r den (zeitabh¨ 4π 3 bezeichnet. Nun dr¨ ucken wir F durch V aus. Aus V = 3 r folgt r = 3 34Vπ . Daraus ergibt sich √ 3 durch Einsetzen und Umformen F = 36πV 2 . Somit lautet die gesuchte Differentialgleichung √ √ dV 3 3 = a 36πV 2 = b V 2 , dt wo b eine der Einfachheit halber eingef¨ uhrte neue Konstante ist. Hinweis: Diese Differentialgleichung kann mit der Methode der Separation der Variablen (16.9) gel¨ ost werden. 15−6 a) Die Proportionalit¨ at dr¨ uckt sich in der Form 1 Δx 1 Δy =k y Δt x Δt f¨ ur ein k > 0 aus.
osungen der Aufgaben 28. L¨
464
b) Eine einfache Umformung f¨ uhrt auf Δy/Δx = ky/x und der Grenz¨ ubergang Δx → 0 liefert die Differentialgleichung dy y =k . dx x Hinweis: Diese Differentialgleichung kann mit der Methode der Separation der Variablen (16.9) gel¨ ost werden. 15−7 Der Punkt P (x, y) soll die Strecke XY halbieren. Dann muss X die Koordinaten X(2x, 0) und Y die Koordinaten Y (0, 2y) haben. Die Steigung der Tangente ist einerseits gleich y , anderseits gleich (0 − 2y)/(2x − 0) = −y/x. Dies f¨ uhrt bereits auf die gesuchte Differentialgleichung y y = − . x
y
Y
Hinweis: Diese Differentialgleichung kann mit der Methode der Separation der Variablen (16.9) gel¨ ost werden. Es zeigt sich, dass die gesuchten Kurven Hyperbeln mit der Gleichung y = C/x sind.
P x X
15−8 Mit y = 2x/(2 − x2 ) ist y = (2x2 + 4)/(2 − x2 )2 . Durch Einsetzen best¨ atigt man, dass y ist. y = y2 + x
15−9 Mit y = (1 − 2x)e−x ist y = 2xe−x − 3e−x und y = −2xe−x + 5e−x . Durch Einsetzen best¨ atigt man, dass y + 2y + y = 0 ist.
(28.16) L¨osungen zu Kapitel 16
1 + x2 1 16−2 a) y = Ce2x + b) y = Ce−x/2 + 20 2 Es stehen verschiedene L¨ osungsmethoden zur Verf¨ ugung: – L¨ osen der homogenen Gleichung mit anschliessender Variation der Konstanten. – Wenn die Gleichung y = ay + b in der Form y = a(y + ab ) geschrieben wird, kann wie in (16.10.2) Separation der Variablen angewandt werden. – Schliesslich kann auch einfach die in (16.8) angegebene Formel y = Ceax − ab verwendet werden. 1 16−3 a) y = ex + Ce−x b) y = Cex −x3 −3x2 −6x−6 c) y = x ln x + Cx 2 3 1 d) y = −x2 + Cx3 e) y = (sin x + cos x)+Ce−x f) y = Cex /3 − x3 − 3 2 Zu e): Berechnung von ex cos x dx : Zweimaliges partielles Integrieren ergibt ex cos x dx = ex cos x + ex sin x − ex cos x dx , 16−1 a) y = Cx
woraus
folgt.
b) y = C
ex cos x dx =
1 x (e cos x + ex sin x) + C 2
3 uhrt auf das Integral Zu f) Berechnung von x5 e−x /3 dx : Die Substitution u = −x3 /3 f¨ u 3 ue du, das mit partieller Integration berechnet werden kann (13.6.1).
osungen zu Kapitel 16 28.16 L¨
465
√ √ b) y = ± x + C 16−4 a) y = 1 + x2 + C are L¨ osung y = 0. d) y = (x2 + C)2 , singul¨ 1 e) y = , singul¨ are L¨ osung y = 0. x2 x−
c) y = ln(ex + C)
2 +C
f) y = 1 − x3 1+C , singul¨ are L¨ osung y = 1. In a), b) und c) gibt es keine singul¨ aren L¨ osungen. Beachten Sie in c), dass ex−y = ex e−y ist. 16−5 a) y = 2 +
2 1+Ce6x
b) y =
1 1+Ce−4x
gem¨ ass der Formel von (16.12). Die Differentialgleichungen in den Aufgaben 16−6 bis 16−9 sind linear. 16−6 b) Zur L¨ osung der homogenen Differentialgleichung berechnet man mit Substitution (u = 1 + x2 ) eine Stammfunktion von p(x), n¨ amlich x 1 dx = ln(1 + x2 ) = ln 1 + x2 1 + x2 2
y
x 1
und erh¨ alt y = Keln
√
1+x2
=K
1 + x2 .
Variation der Konstanten f¨ uhrt (mit derselben Substitution) auf x √ K(x) = dx = 1 + x2 + C , 1 + x2 √ woraus sich die allgemeine L¨ osung y = 1 + x2 + C 1 + x2 ergibt. c) y = 1 + x2 . 16−7 b) L¨ osung der homogenen Gleichung: Aus p(x) = −2/x folgt P (x) = −2 ln x, und die L¨ osung lautet y = Ke−2 ln x = K/x2 . Die Variation der Konstanten f¨ uhrt auf K(x) = (x3 − 2x2 ) dx 4 3 2 = x4 − 2x3 +C. Die allgemeine L¨ osung lautet y = x4 − 23x + xC2 .
y 1 x
= 1 + 6C . Da y (2) = 0 c) Es ist y = x − 23 − 2xC 3 und y 2 2 x4 sein muss, ergibt sich C = 43 , ferner ist dann y (2) > 0. Die
2 spezielle L¨ osung lautet demnach y = x4 − 23x + 3x4 2 und hat an der Stelle x = 2 ein relatives Minimum.
16−8 Mit der Vorgabe, dass die Gleichung eine lineare L¨ osung hat, k¨ onnen Sie den Ansatz y = ax + b in die Gleichung einsetzen. Es folgt y = a = −(ax + b) + 2x. Dies soll f¨ ur alle x gelten, folglich muss 2 − a = 0 und −b = a sein, d.h., es ist a = 2, b = −2. Die spezielle L¨ osung der inhomogenen Gleichung lautet also y = 2x − 2. Die allgemeine L¨ osung der homogen Gleichung ass (16.7) ist dann y = Ce−x +2x−2 die gesuchte allgemeine ist (offensichtlich) y = Ce−x . Gem¨ L¨ osung der inhomogenen Gleichung. √ 16−9 a) Aus p(x) = 1/(2x + 2) folgt (Substitution u = 2x + 2) P (x) = 12 ln(2x + 2) = ln 2x + 2 und √ die L¨ osung der homogenen Gleichung lautet y = K 2x + 2. Variation der Konstanten f¨ uhrt √ √ (nochmals dieselbe Substitution) auf K(x) = 2x + 2 + C und y = 2x + 2 + C 2x + 2. b) Diese L¨ osungsfunktion ist offensichtlich dann linear, wenn C = 0 ist. Sie hat in diesem Fall √ die Form y = 2x + 2. Setzt man x0 = 1 ein, so folgt y0 = 4 + C 4. Damit C = 0 wird, muss y0 = 4 gew¨ ahlt werden.
osungen der Aufgaben 28. L¨
466
Die Differentialgleichungen in den Aufgaben 16−10 bis 16−14 k¨ onnen alle mit Separation der Variablen gel¨ ost werden. 2 2 uhrt auf y dy = x dx, also auf y2 = x2 + C. Als L¨ 16−10 Separation f¨ osung erhalten wir (mit 2 2 c = 2C) die Kurve, die durch y − x = c gegeben ist (es handelt sich um eine Hyperbel). L¨ osen √ wir nach y auf, so folgt y = ± x2 + c. Hier h¨ angt das Vorzeichen von den Anfangsbedingungen √ ab (eine ¨ ahnliche Situation trat in (16.10.3) auf). Man erh¨ alt im Fall a) y = x2 − 3, im Fall √ 2 b) y = − x − 3. y
16−11 b) Separation der Variablen f¨ uhrt auf die Gleichung ln(y + 1) = 1 2 x − 2x + C und auf die allgemeine L¨ osung 2 1 2 y = Ce 2 x −2x − 1 .
1
Die spezielle L¨ osung wird f¨ ur C = 2e2 erhalten. Diese Differentialgleichung ist u ¨ brigens linear (y = y(x − 2) + (x − 2)) und h¨ atte auch mit Variation der Konstanten gel¨ ost werden k¨ onnen. 16−12 Die Separation der Variablen f¨ uhrt in beiden F¨ allen auf einfache Integrale. Man erh¨ alt als L¨ osungen: b) y = √ 3 3 1 x . (Im Fall c) gibt x + C, c) y = 1/( x − D) = 1−Dx es noch die singul¨ are L¨ osung y = 0.) d) F¨ ur C = 0 bzw. D = 0 erh¨ alt man in beiden F¨ allen die L¨ osung y = x. Dies kann auch den Richtungsfeldern entnommen werden.
x 1
(B) y
(A) y
1
1
x
x 1
1
16−13 Separation der Variablen f¨ uhrt auf 1 dy = a dx + C und = ax + C . 2 (A − y) A−y are L¨ osung y = A. Als L¨ osung erhalten wir y = A − ax1+C . Ferner existiert die singul¨ 16−14 Separation der Variablen f¨ uhrt auf −1 dy = ex dx + C und weiter y = x −1. (y + 1)2 e +C Die Anfangsbedingung liefert im Fall a) die spezielle L¨ osung mit C = − 32 . Setzt man im Fall b) −1 − 1. Diese Gleichung die Werte x = 0, y = 1 in die Formel f¨ ur y ein, so erh¨ alt man −1 = 1+ C ist f¨ ur keinen Wert von C erf¨ ullt. Dies heisst aber noch nicht, dass die Gleichung keine L¨ osung zur Anfangsbedingung b) hat. Vielmehr ist die spezielle L¨ osung in diesem Fall die singul¨ are L¨ osung y = −1. y 16−15 Da die Tangente die Steigung y hat, entnimmt man der Skizze sofort die Bedingung y = 2y/(x + 1). Dies ist eine homogene lineare Differentialgleichung. Ihre allgemeine L¨ osung ist y = P C(x + 1)2 . Die Anfangsbedingung x0 = 0, y0 = 1 liefert den Wert C = 1, so dass die gesuchte Kurve durch die Formel y = (x + 1)2 , x ≥ 0 gegeben ist. 16−16 a) F¨ ur die Oberfl¨ ache der Kugel gilt F = 4πr2 , f¨ ur ihr Volumen 4π 3 angt, leiten wir nach V = 3 r . Da r = r(t) von der Zeit abh¨ der Kettenregel ab. Wir finden 4π dV = dt 3
d r(t)3 dt
=
4π 3r(t)2 · r (t) . 3
A x B
osungen zu Kapitel 17 28.17 L¨
467
Setzt man dies in die gegebene Differentialgleichung ein, so erhalten wir 4π 3r(t)2 · r (t) = −a4πr(t)2 , 3 und nach dem Wegk¨ urzen bleibt die Differentialgleichung r (t) = −a u ¨brig. Diese hat die allgemeine L¨ osung r(t) = −at + C und mit r(0) = r0 die spezielle L¨ osung r(t) = −at + r0 . b) Dies ist keine exponentielle Abnahme. 1 1 r0 . Es ist dann r(t) = − 20 r0 t + r0 , c) Wenn r(10) = −a · 10 + r0 = 12 r0 ist, dann folgt a = 20 und dieser Radius wird gleich Null f¨ ur t = 20. Nach 20 Minuten ist der Genuss also vorbei! 16−17 a) Die auf das Boot wirkende Reibungskraft ist voraussetzungsgem¨ ass proportional zur Schnelligkeit v. Die Beschleunigung v˙ ist ihrerseits proportional zur Kraft, so dass wir den Ansatz v˙ = −λv (λ > 0) machen k¨ onnen. Das Minuszeichen (zusammen mit der Forderung, dass λ > 0 sei) ergibt sich daraus, dass die Beschleunigung entgegen der Bewegungsrichtung wirkt (sie bremst). Diese Differentialgleichung hat offensichtlich die L¨ osung v = v(t) = Ce−λt . Wir wissen, dass v(0) = 15 und v(0.5) = 10 ist, wobei die Zeit in Minuten nach dem Stillstand gemessen wird. Die erste Bedingung liefert sofort den Wert der Konstanten C, n¨ amlich C = 15. Der zweiten Bedingung entnimmt man die Beziehung e−λ·0.5 = 10/15 = 2/3, und es folgt λ = −2 ln(2/3) = 0.8109. Die gesuchte Schnelligkeit v(2) ist also gegeben durch v(2) = 15e−λ·2 . Nun ist −λ · 2 = 4 ln(2/3) = ln((2/3)4 ) (Rechenregeln f¨ ur Logarithmen!). 4 2 −λ· 2 = 15 · 3 = 2.9626. (Etwas weniger elegant ist es, f¨ ur λ einfach Damit ist v(2) = 15e den N¨ aherungswert 0.8109 zu verwenden.) b) Da v(t) eine Exponentialfunktion ist, wird (unrealistischerweise) v(t) nie Null. 16−18 a) Der Ansatz f¨ uhrt auf die Differentialgleichung dT dt = −a(T − Tc ). (Das Minuszeichen bei der Konstanten a steht deshalb, weil a wie u ¨blich positiv sein soll. Da die Temperatur abnimmt, ist dT art.) Dies ist eine lineare Diffedt < 0, anderseits ist T − Tc > 0, was die Vorzeichen erkl¨ rentialgleichung mit konstanten Koeffizienten f¨ ur die Funktion T (t), deren allgemeine L¨ osung durch T (t) = Tc + Ke−at gegeben ist. b) F¨ ur t = 0 ist T (0) = 180. Diese Anfangsbedingung liefert zun¨ achst den Wert K = 160 (da Tc = 20 ist). Um auch noch a zu bestimmen, benutzen wir die Beziehung 100 = T (10) = 20 + 160e−a·10 . Es folgt e−a·10 = 80/160 = 1/2 und a = −0.1 · ln(1/2). Gesucht ist nun τ mit T (τ ) = 40. Aus T (τ ) = 20 + 160e−aτ ergibt sich e−aτ = 20/160 = 1/8 sowie τ = − a1 ln(1/8). Wie in Aufgabe 16−17 k¨ onnten wir numerisch rechnen. Es geht auch exakt: ln(1/8) 3 ln(1/2) 1 ln(1/8) = 10 = 10 = 30 . a ln(1/2) ln(1/2) Dabei wurde benutzt, dass ln(1/8) = ln (1/2)3 = 3 ln(1/2) ist. τ =−
(28.17) L¨osungen zu Kapitel 17 17−1 F¨ ur a) bis c) entnimmt man der Figur (unter Verwendung des Satzes von Pythagoras) die folgenden Beziehungen: = a) sin π 6 b) cos π = 6
1 =⇒ sin(− π ) = − 12 =⇒ arcsin(− 12 ) = − π . 2√ 6 6 √ √ 3 3 3 5π 5π =⇒ cos = − =⇒ arccos(− ) = . 6 2 2 6 √2 √ √ 3/ 2 π = 3 =⇒ arctan 3 = 3 . 1/2
= c) tan π 3 = 1 =⇒ tan(− π ) = −1 =⇒ arctan(−1) = π . d) tan π 4 4 4
(F¨ ur d) k¨ onnen Sie ein rechtwinklig-gleichschenkliges Dreieck betrachten.)
1/2
√
√ − 3/2 −1/2
3/2
osungen der Aufgaben 28. L¨
468
17−2 Da der Sinus die Periode 2π hat, gen¨ ugt es, das Intervall [0, 2π] zu betrachten. F¨ ur x ∈ [0, π ] 2 π ist arcsin(sin x) = x, vgl. Formel (4) in (17.2.a). F¨ ur x > 2 aber ist arcsin(sin x) = x, denn arcsin x liegt stets in [− π , π ]. F¨ ur solche x m¨ usssen wir zuerst Winkel im Intervall [− π , π] 2 2 2 2 finden, die denselben Sinus haben. Nun gelten f¨ ur alle x die Formeln sin x = sin(π − x) und sin x = sin(x − 2π). , 32π ] ist π − x ∈ [− π , π ]. Also gilt f¨ ur diese x die Beziehung f (x) = arcsin(sin x) = F¨ ur x ∈ [ π 2 2 2 arcsin(sin(π − x)) = π − x (lineare Funktion). , π ]. Also gilt f¨ ur diese x die Beziehung f (x) = arcsin(sin x) = F¨ ur x ∈ [ 32π , 2π] ist x−2π ∈ [− π 2 2 arcsin(sin(x − 2π)) = x − 2π (lineare Funktion). Ber¨ ucksichtigen wir noch die Periodizit¨ at, so k¨ onnen wir den aus verschiedenen Geradenst¨ ucken bestehenden Graphen zeichnen. y x 2π
−2π
ur x > 12 , f ist 17−3 a) Die Ableitung f (x) = 1 − 2x ist < 0 f¨ somit auf D(f ) = [ 12 , ∞) fallend. Wegen f ( 12 ) = 14 ist W (f ) = (−∞, 14 ) = D(f −1 ). Zur Bestimmung von f −1 l¨ osen wir die Gleichung y = x − x2 nach x auf: x = 12 ± 14 − y. Da x ≥ 12 ist, kommt nur das Pluszeichen in Frage. Vertauschen wir noch x und y, so erhalten wir 1 1 f −1 (x) = + −x. 2 4 ur alle x ist f u ¨berall fallend. b) Wegen f (x) = −e−x < 0 f¨ Wegen e−x > 0 ist f (x) > 1 f¨ ur alle x; man findet W (f ) = osen wir y = e−x + 1 nach x auf und (1, ∞) = D(f −1 ). L¨ vertauschen x und y, so finden wir
f −1
y
x 2 f
y f
1
f −1 (x) = − ln(x − 1) .
x f −1
17−4 a) D = (−273.15, ∞) (absoluter Nullpunkt!). b) Die inverse Funktion ist gegeben durch C(x) = Sie rechnet ◦ Fahrenheit in ◦ Celsius um.
5 x− 160 9 9
mit Definitionsbereich (−459.67, ∞).
urlich die Ketten17−5 Die Behauptung f (x) = 0 ergibt sich durch Nachrechnen (im Fall b) muss nat¨ regel benutzt werden). Wegen (6.3.c) ist dann f eine konstante Funktion, f (x) = c. Der Wert von c kann durch Einsetzen eines beliebigen Wertes von x, z.B. von x = 0 ermittelt werden. . Daraus folgt die Formel a) Es ist c = arcsin 0 + arccos 0 = π 2 arcsin x + arccos x =
π , 2
die u ¨brigens auch f¨ ur x = ±1 gilt. Geometrisch gesehen handelt sich dabei um eine Umsetzung − x) = cos(x). der bekannten Beziehung sin( π 2 b) Hier findet man c = 0, also ist
osungen zu Kapitel 17 28.17 L¨
469
x arctan x = arcsin √ 1 + x2
√ x
1 + x2 α
f¨ ur alle x. Auch hier gibt es eine geometrische Erkl¨ arung. Im nebenstehenden rechtwinkligen Dreieck ist tan α = x, sin α = √ osen nach α erh¨ alt man (zumindest f¨ ur x/ 1 + x2 . Durch Aufl¨ α ≥ 0) die Formel.
1
17−6 Ableitungen. a)
1
1 − (x − 1)2 1 d) − √ 2 1 − z2
b) − √
2s
1 √ 2 z(1 + z) 2 2 f) (t < 0); − (t > 0) 1 + t2 1 + t2 c)
1 − s4 1 e) − 1 + x2
Zu f): Bei der Berechnung der Ableitung tritt der Ausdruck √t 2 auf. Da die Quadratwurzel t √ aus einer Zahl definitionsgem¨ ass stets positiv ist, ist t2 = |t|, was bewirkt, dass der obige Ausdruck = −1 ist f¨ ur t < 0 und +1 f¨ ur t > 0. (An der Stelle t = 0 ist die Funktion u ¨brigens nicht differenzierbar.)
a −arctan b ist. Leitet 17−7 Die Figur zeigt, dass α = α(x) = arctan x x man α(x) ab und setzt die Ableitung = 0, dann erh¨ alt man die Beziehung
a α
a b = 2 , x2 + b 2 x + a2 √ deren Aufl¨ osung den Wert x = ab liefert. Setzt man a = 25 − 1.7 = 23.3, b = 20 − 1.7 = 18.3 ein, so folgt x = 20.65 m. Der zugeh¨ orige maximale Winkel misst 6.90◦ .
b
x
17−8 Integrale. 1 arcsin(3x) + C (S: u = 3x) 3 1 c) arctan(2x) + C (S: u = 2x) 4 2t + 1 1 + C (13.7) e) arctan 3 3
b) t arctan t − ln
a)
1 + t2 + C
1 arctan(4x2 ) + C (S: u = 4x2 ) 8 x x f) 2 − x2 + arcsin √ + C (13.7) 2 2
d)
Die Abk¨ urzung S bedeutet “Substitution”. In b) wurde der in (13.6.3) erl¨ auterte “Trick” benutzt. 17−9 Das Volumen ist durch V = π
1 0
f (x)2 dx gegeben. Quadrieren liefert
f (x)2 = x2 + √
2x 1 + x2
+
1 . 1 + x2
F¨ ur das zweite Integral benutzen wir die Substitution u = 1 + x2 , das dritte ist gerade der Arcustangens. Braves Ausrechnen liefert dann V = 6.1172. 17−10 a) wird mit Separation der Variablen gel¨ ost, b) und c) sind lineare Differentialgleichungen. a) y = tan(ex + C), b) y = x(arctan x + C), c) y = x(arcsin x + C).
osungen der Aufgaben 28. L¨
470
(28.18) L¨osungen zu Kapitel 18 18−1
18−2 y b)
y
c) c)
a)
x 1
x
b)
a)
18−3 y x L
18−4 Es sei t die Zeit (in Tagen) nach dem 1. Januar, 00.00. Dann stellt die Funktion f (t) = π t den gesuchten Stand des Gef¨ uhlslebens dar. Sie hat die Periode 28, die Ampli50 + 50 sin 14 tude 50, und ihr Graph ist um den Wert 50 nach oben verschoben, so dass f (t) wie gew¨ unscht π cos π t zwischen 0 und 100 schwankt. Ferner ist f (0) = 50. Schliesslich ist wegen f (t) = 50 14 14 die Ableitung f (0) > 0; die Tendenz am Neujahr ist aufsteigend. (Beachten Sie, dass auch f (14) = 50 ist, allerdings mit absteigender Tendenz, denn f (14) < 0.) Nun vergehen vom 1. Januar, 00.00 bis zum 28. Februar, 00.00 genau 58 Tage, bis zum 28. Februar, 12.00 also 58.5 Tage. Der gesuchte Wert ist schliesslich = f (58.5) = 76.6. (Er ist auch gleich f (2.5), da f die Periode 28 hat.) 18−5 a) Da 14 = ( 12 )2 ist, vergehen genau zwei Halbwertszeitspannen, hier also 2 · 23.5 = 47 Minuten, bis noch ein Viertel der urspr¨ unglichen Menge vorhanden ist. b) Die Zerfallsgleichung lautet N (t) = N0 e−λt , wo λ = ln 2/T1/2 ist. Gesucht ist τ mit N (τ ) = N0 e− λτ = N0 /5. Es folgt e−λτ =
1 , 5
1 also τ = − λ ln
1 5
= 54.56 Minuten.
c) Es ist N (60)/N0 = e−λ60 = 0.1704. Der gesuchte Prozentsatz ist 17.04%. 18−6 a) I(2)/I0 = e−1.4·2 = 0.0608 Die Intensit¨ at betr¨ agt nur noch 6.08%. b) Es muss I(x)/I0 = e−1.4x = 0.1 sein. Damit ist −1.4x = ln 0.1, woraus x = 1.64 m folgt. 18−7 a) Wegen f (t) → 30 f¨ ur t → ∞ ist a = 30. Weiter ist f (0) = a + b = 10, also b = −20 und f (1) = a + be−c = 20. Daraus folgt e−c = (20 − a)/b = 0.5 und c = − ln 0.5 = ln 2. Zusammengefasst: f (x) = 30 − 20e−x ln 2 . b) f (2) = 30 − 20e−2 ln 2 = 30 − 20 · 14 = 25. c) Es ist f (x) = 20 ln 2e−x ln 2 = ln 2(30 − f (x)). Die Differentialgleichung lautet somit y = ln 2(30 − y). 18−8 Die Kurvenl¨ ange L ist gem¨ ass (10.6) durch ab 1 + f (x)2 dx gegeben. Mit f (x) = cosh x ist f (x) = sinh x und 1 + f (x)2 = 1 + sinh2 x = cosh2 x (18.6). So findet man die einfache Formel 1 L= − 1 cosh x dx = sinh 1 − sinh(−1) = 2.3504.
osungen zu Kapitel 19 28.19 L¨
471
18−9
Zu 18−11
18−10
10
a)
8 6 5
60
a)
40 20
4
10 8 6
3
4 3
2
2
b)
b) 1
1
2
3
4
5 6
1
8 10
0
1
2
3
4
5
6
7
8
30 20 15 10 8 5 4 3 2 1 0.8 0.5 0.4 0.3 0.2 0.1 0.1 0.2
0.5
1
2
5
10 15
18−11 Der obenstehenden Figur entnimmt man die Werte a) Y ≈ 0.28, b) X ≈ 13.5. t 18−12 a) Der untenstehenden Figur entnimmt man, dass a ≈ 3 ist. Aus 52 = Y (7) ≈ 3b folgt t ≈ 7 52/3 ≈ 1.5. b) Y (t) ≈ 3et ln 1.5 ≈ 3e0.4t .
Zu 18−13 60
10
10
40
8
8
6
6 5
4
4
3
3
2
2
20 10 8 6 4 3 2 1
0
1
2
3
4
5
6
7
8
1
0
1
2
3
4
5
6
7
8
9 10
1
1
2
3
4
5 6
8 10
18−13 Die obenstehenden Figuren zeigen, dass auf dem halblogarithmischen Papier die Punkte ziemlich genau auf einer Geraden liegen. Es handelt sich also um eine Exponentialfunktion.
(28.19) L¨osungen zu Kapitel 19 √ √ 19−1 a) a = 0; die Bedingung |an −a| = |an −0| = 1/ n < 0.001 ist f¨ ur 1 < 0.001 n, also f¨ ur n > 106 √ erf¨ ullt. Somit ist N = 106 . b) Analog: a = 1; |an − a| = 1/n2 < 0.001 f¨ ur n > 1000 = 31.62. Es folgt N = 31. c) Probieren mit einigen Werten von n l¨ asst vermuten,
dass an → 3 strebt
3n
f¨ ur n → ∞, vgl. auch Aufgabe 19−2,a). Nun ist |an − a| = 2+ − 3 ur
= 2+6 n < 0.001 f¨ n
ur n2 + n > 1000. 6 < 0.001(2 + n). Es folgt N = 5998. d) a = 0. Nun ist |an − a| = n21+n < 0 f¨ 2 osung den Wert 31.126, Die quadratische Gleichung n + n = 1000 hat als einzige positive L¨ somit ist N = 32.
19−2 a) Division von Z¨ ahler und Nenner durch n2 ergibt 1 2 2 + n +3 an = n4 . 5 +n +6 n2 1 und n12 gegen 0 streben, erh¨ alt man limn→∞ an = 3/6 = 1/2. Da n b) Die vorgeschlagene Multiplikation ergibt
(n + 1) − n 1 an = √ ur n → ∞ . √ = √ √ → 0 f¨ n+1+ n n+1+ n
osungen der Aufgaben 28. L¨
472
19−3 Es ist jeweils die Summenformel aus (19.4.a) zu verwenden. a) q = −x3 ergibt s = (Dies ist sinnvoll, weil
|x3 |
1
.
1+x3 y < 1 ⇐⇒ |x| < 1 ist.) b) q = y f¨ uhrt auf s = y− (sinnvoll, weil 1 1
| y1 | < 1 ⇐⇒ |y| > 1). c) s = 2 1 + ( 23 ) + ( 23 )2 + ( 23 )3 + . . . = 2/(1 − der Klammer hat den Quotienten q =
2 . 3
2 ) 3
= 6. Die Reihe in
(Siehe auch die Formel am Schluss von (19.4.a).)
1 19−4 a) Mit ak = k·(k1+1) ist ak = k1 − k+1 , k = 1, 2, . . . . Es folgt 1 1 1 1 1 1 1 1 − + − + − + ... + − . sn = a1 + . . . + an = 1 2 2 3 3 4 n n+1 1 Die meisten Terme heben sich weg, es bleibt sn = 1 − n+1 , und damit ist klar, dass sn → 1 strebt f¨ ur n → ∞. Die Reihe konvergiert und hat die Summe 1.
b) Gem¨ ass der Formel ln( ab ) = ln a − ln b findet man f¨ ur die Teilsummen 2 3 n 1 ) sn = ln( ) + ln( ) + ln( ) + . . . + ln( 2 3 4 n+1 = ln 1 − ln 2 + ln 2 − ln 3 + ln 3 − ln 4 + . . . + ln n − ln(n + 1) . ¨ ur n → ∞ strebt Ahnlich wie in a) hebt sich fast alles weg. Es bleibt sn = − ln(n + 1), und f¨ sn gegen −∞. Die Reihe divergiert. 19−5 a) Das Auftreten von allen Fakult¨ aten erinnert an die Exponentialreihe (19.8.a). Allerdings wechseln die Vorzeichen ab; man wird so auf die Funktion e−x gef¨ uhrt. b) Es kommen nur die Fakult¨ aten der geraden Zahlen vor, und die Vorzeichen wechseln ab. Dies l¨ asst an die Cosinusreihe (19.8.c) denken, wobei aber die Exponenten von x noch nicht stimmen. Eine entsprechende Anpassung zeigt, dass die Reihe die Funktion cos(x2 ) darstellt (s.a. (19.8.f)). ¨ c) Ahnlich wie in b) findet man, dass hier die Funktion x − sin x dargestellt wird. ur x = 12 : 19−6 a) Exponentialreihe (19.9.a): Summe e2 = 7.3891. b) Logarithmusreihe (19.8.d) f¨ 3 2 urde am Anfang noch der Ausdruck 2 − 2! (= 1) stehen, so Summe ln( 2 ) = 0.4055. c) W¨ w¨ are die Summe (Cosinusreihe (19.8.c)) = 2 cos 1. Somit findet man f¨ ur die gegebene Reihe die Summe 2 cos 1 − 1 = 0.0806. 19−7 Anwendung der Regel c) aus (19.6) ergibt, dass die Ableitung der Exponentialreihe (19.8.a) wieder die Exponentialreihe, die Ableitung der Sinusreihe (19.8.b) die Cosinusreihe (19.8.c) und die Ableitung der Cosinusreihe die negative Sinusreihe liefert. 19−8 a) Ersetzt man in der Logarithmusreihe (19.8.d) x durch x2 , so folgt ln(1 + x2 ) = x2 −
x6 x8 x10 x4 + − + − ... . 2 3 4 5
b) Gliedweises Ableiten (nach (19.6.d) erlaubt) ergibt 2x = 2x − 2x3 + 2x5 − 2x7 + 2x9 − . . . . 1 + x2 c) Multiplizieren Sie die Reihe (7) aus (19.5) mit 2x, dann erhalten Sie gerade die Reihe aus b).
osungen zu Kapitel 19 28.19 L¨
473
19−9 a) Diese Formel finden Sie in (19.8.f). b) Es ist 1+x ln = ln(1 + x) − ln(1 − x) 1−x x3 x4 x5 x2 x3 x4 x5 x2 + − + − ... + x + + + + + ... = x− 2 3 4 5 2 3 4 5 x3 x5 x7 =2 x+ + + + ... . 3 5 7 x x7 so wird 11+ −x = 3. Setzt man in den ersten vier Termen (bis und mit 7 ) so erh¨ alt man den Wert ln 3 ≈ 1.0981. Der genaue Wert ist 1.0986 . . . .
c) Setzt man x = x=
1 , 2
1 , 2
19−10 a) Gem¨ ass den Ableitungsformeln von (5.3) (siehe auch (18.8)) ist (sinh x) = cosh x und (cosh x) = sinh x. Deshalb wird (mit f (x) = cosh x) f (0) = 1, f (0) = 0 , f (0) = 1, f (0) = 0 usw.. In der Taylorreihe kommen nur gerade Potenzen von x vor; sie hat die Form 1+
x2 x4 x6 + + + ... 2! 4! 6!
ur e−x in die Formel cosh x = 12 (ex + e−x ) ein, so erh¨ alt b) Setzt man die Reihen f¨ ur ex und f¨ man genau die obige Reihe und weiss zudem, dass sie f¨ ur alle x gegen cosh x konvergiert (weil die Exponentialreihe f¨ ur alle x konvergiert). 19−11 Ersetzt man in der Sinusreihe (19.8.b) x durch t2 , so erh¨ alt man sin(t2 ) =
x2 x6 x10 x14 − + − + ... 1! 3! 5! 7!
Integriert man gliedweise von 0 bis x, so erh¨ alt man x 3 x7 x11 x15 x − + − + ... sin(t2 ) dt = Φ(x) = 1! · 3 3! · 7 5! · 11 7! · 15 0 1 1 3 1 1 + x − x2 + x . 2 4 8 16 2 1 1 3 2 2 2 1 1 41 b) p3 (x) = + (x − 1) − (x − 1)2 + (x − 1)3 = x − x + x+ . 3 9 27 81 81 27 9 81 1 1 1 1 c) p3 (x) = 1 + x2 − x3 , d) p2 (x) = 1 + x − x2 . 2 3 2 8 1 3 1 1 e) p3 (x) = x − x , f) p4 (x) = 1 + x + x2 − x4 . 24 2 8 1 15 3 195 4 5 2 19−13 a) 1 − x + x − x + x . 4 32 128 2048 2 2 4 3 5 4 4 x + x . b) 1 + x + x − 3 9 81 243 c) 3 (1.05)4 = 1.067216175 (Taschenrechner), bzw. = 1.067216178. 19−12 a) p3 (x) =
19−14 Wie in (19.10) ist
(n+1)
f 1 (z) (0.5)n+1
≤ (0.5)n+1 . |Rn (0.5)| =
(n + 1)! (n + 1)! Dieser Ausdruck ist sicher kleiner als 0.00001, wenn n ≥ 6 ist (Ausprobieren von verschiedenen Werten von n). Somit muss die Cosinusreihe (19.8.c) bis und mit x6 angeschrieben werden: cos(0.5) ≈ 1 −
0.54 0.56 0.52 + − = 0.87758 ± 0.00001 . 2! 4! 6!
osungen der Aufgaben 28. L¨
474
(28.20) L¨osungen zu Kapitel 20 20−1 a) 12 . (Substitution u = x + 1.) b) Existiert nicht. (Substitution u = x − 2.) c) u = 3t.) d) Existiert nicht. (Substitution v = 1 + u2 .) . 20−2 a) π 4
(Schreibe den Integranden in der Form
1 4
1 ; dies 2(1+(2t)2 ) = 1 + x4 .) c) π . 2
1 . 3
(Substitution
liefert die Stammfunktion
arctan(2t).) b) Existiert nicht. (Substitution u (Substitution v = eu f¨ uhrt u) → 0 f¨ u r u → ∞ und arctan(e auf die Stammfunktion arctan(eu ). Wegen arctan(eu ) → π 2 0 ∞ f¨ ur u → −∞ ist 0∞ = π − arctan 1, −∞ = arctan 1 − 0, woraus −∞ = π folgt. Der Wert 2 2 π 2 arctan 1 = 4 wird hier gar nicht ben¨ otigt.) d) 3 . (Fallunterscheidung: F¨ ur x > 0 ist der Inte3
3
3
grand = x2 e−x , mit Stammfunktion − 13 e−x ; f¨ ur x < 0 ist er = x2 ex , mit Stammfunktion 1 x e 3
3
. )
20−3 a) 4. (Substitution v = u − 3.) b) Existiert nicht. (Substitution u = 3x − 6.) c) Existiert nicht. uhrt auf die Stammfunktion ln(et − 1), welche mit t → 0 gegen −∞ (Substitution u = et − 1 f¨ √ . (Substitution u = x − 1 f¨ uhrt auf den Integranden u + √1 .) strebt.) d) 28 3 u
20−4 F¨ ur r = 1 ist 1t dx ur t → ∞. xr dx = ln t. Das uneigentliche Integral existiert nicht, da ln t → ∞ f¨ t1−r − 1 . dx = F¨ ur r = 0 (aber > 0) ist 1t dx xr 1−r 1−r ur t → ∞. Das uneigentliche F¨ ur r > 1 ist der Exponent 1 − r von t negativ und t1−r → 0 f¨ 1 . Integral existiert und hat den Wert r− 1
F¨ ur 0 < r < 1 ist dieser Exponent positiv, also strebt t1−r → ∞. Das uneigentliche Integral existiert nicht. 20−5 F¨ ur r = 1 ist s1 dx ur xr dx = − ln s. Das uneigentliche Integral existiert nicht, da ln s → −∞ f¨ s → 0. 1 s1−r F¨ ur r = 0 (aber > 0) ist s1 dx xr dx = 1−r − 1−r .
ur s → 0. Das uneigentliche F¨ ur r > 1 ist der Exponent 1 − r von s negativ und s1−r → ∞ f¨ Integral existiert nicht. F¨ ur 0 < r < 1 ist dieser Exponent positiv, also strebt s1−r → 0. Das uneigentliche Integral 1 existiert und hat den Wert 1−r .
20−6 F¨ ur jedes t > 0 ist π 0t f (x)2 dx das Volumen des Rotationsk¨ orpers u ¨ ber dem Intervall [0, t]. F¨ ur t → ∞ strebt in un1 ) der obige Ausdruck gegen π. serem Fall (mit f (x) = 1+ x Diese Zahl kann als Volumen des unendlich ausgedehnten Rotationsk¨ orpers gedeutet werden. Die Schnittfl¨ ache dagegen ist dx gegeben, und dieses uneigentliche Integral exidurch 2 0∞ 1+ x stiert nicht. Diese Fl¨ ache hat also keinen endlichen Inhalt.
y
x
(28.21) L¨osungen zu Kapitel 21 21−1 a) 0.567143, b) 0.865474, c) 3.591121. M¨ ogliche Startwerte k¨ onnen f¨ ur a) und b) dadurch gefunden werden, dass man die Graphen von f (x) = x und g(x) = e−x (bzw. f (x) = x3 und g(x) = cos x) grob aufzeichnet und den Schnittpunkt der Graphen von f und g sucht. Im Fall c) scheint die Kurvendiskussion etwas 1 + 1 umformt und beide Graphen einzeln zeichnet, komplizierter; wenn man aber auf ln x = x so findet man auch hier sofort den ungef¨ ahren Schnittpunkt.
osungen zu Kapitel 21 28.21 L¨
475
21−2 Es ist f (x) = 3x2 − 12x + 9 = 0 f¨ ur x = 1 und x = 3. Die Werte an diesen Extremalstellen sind f (1) = 5, f (3) = 1, ferner ist f (0) = 1. Damit kann der Graph grob skizziert werden. Insbesondere erkennt man, dass es nur eine Nullstelle gibt und dass diese nahe bei 0 liegt Ihr Wert bestimmt sich zu −0.103803.
y
x 1 y
21−3 Es ist g (x) = 4x3 +4x−4, g (x) = 12x2 +4. Wegen g (x) > 0 f¨ ur alle x ist g (x) wachsend, hat also genau eine Nullstelle x0 , die sich zu x0 = 0.682328 berechnet. Dort hat g(x) ein relatives (und absolutes) Minimum. Es ist g(x0 ) = −2.581412 < 0. Wegen g (x) < 0 f¨ ur x < x0 und g (x) > 0 f¨ ur x > x0 f¨ allt g(x) links von x0 und steigt rechts davon. Somit hat g(x) genau zwei Nullstellen. N¨ aherungsweise Berechnung liefert daf¨ ur die Werte −0.224229 und 1.296370.
x 1
21−4 Die Graphen von x und cos x schneiden sich f¨ ur x = x0 = 0.739085. Der Fl¨ acheninhalt ist gegeben durch 0x0 (cos x − x) dx = sin x0 − x20 /2 = 0.400489. y 21−5 Der Abstand von (0, 0) zu (x, ln x) ist gegeben durch x2 + (ln x)2 . Es ist etwas einfacher (und gleichwertig), das Quadrat des Abx stands, also die Funktion f (x) = x2 + (ln x)2 zu minimieren. 1 2 Wir setzen f (x) = 2x + x ln x = 0 und l¨ osen diese Gleichung n¨ aherungsweise. Die Nullstelle ist x0 = 0.652919, der gesuchte Punkt ist (x0 , ln x0 ) = (0.652919, −0.426302), und der gesuchte Abstand ist = 0.779767. 2
21−6 Das schraffierte Segment hat den Fl¨ acheninhalt r2 (α − sin α), wobei hier r = 1 ist. Damit der Tank zu 25% voll ist, muss das Segment den Fl¨ acheninhalt π haben. Gesucht ist also α 4 1 . Mit diesem α ist dann b = cos α mit 2 (α − sin α) = π 4 2 und a = 1 − cos α . Die n¨ aherungsweise Berechnung ergibt 2 α = 2.309881 und a = 0.596 m (auf mm genau).
α 1 b a
21−7 Gem¨ ass (13.6.4) ist 0z sin2 x dx = zul¨ osen. Man findet z = 1.788820.
1 (z 2
− sin z cos z). Dies ist = 1 zu setzen und nach z auf-
21−8 a) N¨ aherungswert 0.8827. Exakt (gem¨ ass einer Formel aus (13.7): ln | tan( 38π )| = 0.88137. b) N¨ aherungswert 1.4664. c) N¨ aherungswert 1.0101. Genauere numerische Verfahren liefern (auf vier Stellen nach dem Dezimalpunkt exakt): b) 1.4676, c) 1.0535. 0.752 + 4( 62.π2 )2 + 0.752 ≈ 5.26 m2 . (Vgl. Beispiel 3. in (21.3).) 21−9 V ≈ π 3 π/2 √ 1 + cos2 x dx. Mit der kleinen Simpson-Formel erh¨ alt man L ≈ 21−10 Nach (10.6.b) ist L = 0 1.9146, mit der grossen (n = 3) L ≈ 1.9101.
osungen der Aufgaben 28. L¨
476
21−11 Durch Erh¨ ohung der Anzahl Teilintervalle und entsprechende Verkleinerung der Schrittweite ¨bertragen wird) erhalten Sie bessere N¨ aherungen als die h (was am besten einem Programm u osungen. angegebenen, mit f¨ unf Teilintervallen bestimmten L¨ ¨brigens mit Separaa) Mit h = 0.1 folgt f (0.5) ≈ 2.575. Diese Differentialgleichung kann u ost werden. F¨ ur die Anfangsbedingung (0,1) erh¨ alt man nach einigen tion der Variablen gel¨ x Umformungen f (x) = 11+ −x . Der exakte Wert ist daher f (0.5) = 3. b) Mit h = 0.2 folgt f (2) = 1.14032. Durch Ableitung und Einsetzen k¨ onnen Sie nachpr¨ ufen, √ √ osung zur Anfangsbedingung (1,1) ist. Der exakte Wert dass f (x) = −x + 2 1 + x2 eine L¨ ist deshalb f (2) = 1.162278. c) Mit h = 0.1 folgt f (1.5) = 4.073. Eine N¨ aherungsl¨ osung mit einem bessern Verfahren liefert f (1.5) = 4.09198.
(28.22) L¨osungen zu Kapitel 22 22−1 a) D = {x, y | xy ≥ 0} = {x, y | x, y ≥ 0 oder x, y ≤ 0}. b) D = {x, y | |x + y| ≤ 1} = {x, y | −1 ≤ x + y ≤ 1}. c) Es muss x2 − y > 0, also y < x2 sein. Ferner darf der Nenner des Bruchs nicht = 0 sein, d.h. y = x2 − 1. √ d) D = {x, y | x ≥ 0, y ≥ x}. y y y y
1
x
x
x
x 1
a)
b)
d)
c)
22−2 z
y
−4
4
−2 0 2 4
1 x x
2
4
22−3 a) F¨ ur c = 1 erh¨ alt man die Beziehung x2 + y 2 = 2x. In der Mittelschule haben Sie gelernt, dass man hier eine quadratische Erg¨ anzung vornimmt und diese Gleichung in der Form (x − 1)2 + y 2 = 1 schreibt. Es handelt sich um den Kreis mit Zentrum (1,0) und Radius 1. Analog erhalten Sie f¨ ur c = 2 den Kreis mit Zentrum (2,0) und Radius 2. b) Wegen x > 0 nimmt die Funktion nur Werte > 0 an: Das Niveau c = 0 liefert keine Kurve.
y y 1
2
x 1
osungen zu Kapitel 22 28.22 L¨
477 y
1/2
22−4 a) Die Funktion ist nicht definiert f¨ ur alle Punkte, die auf der Parabel y = x2 liegen. b) Aus f (x, y) = 1/(x2 − y) = c folgt y = x2 − 1c . Die Niveaulinien gehen aus der Parabel von a) durch Parallelverschiebung hervor.
−1 −2 2 1 x
1/2
22−5 a) Man erh¨ alt (unter Verwendung einiger Mittelschulkenntnisse u ¨ber Ellipsen und Hyperbeln) die folgenden Niveaulinien: c = 0 : x2 − 1 = 0, also die zwei Geraden x = ±1. c = 12 : Hyperbel 2x2 − y 2 = 3. c = 1 : Hyperbel x2 − y 2 = 2. c = − 12 : Ellipse x2 + 12 y 2 = 12 . c = −1 : x2 + y 2 = 0. Die Niveaulinie reduziert sich auf den Nullpunkt. ¨ b) F¨ uhrt man ¨ ahnliche Uberlegungen wie in a) mit allgemeinem c durch, so folgt: c < −1 : Nicht m¨ oglich, da f (x, y) ≥ −1 ist, f¨ ur alle x, y. c = −1 : Nullpunkt (vgl. a)). −1 < c < 0 : Ellipsen. c = 0 : Geraden x = ±1 (siehe a)). c > 0 : Hyperbeln.
y
x −1/2
1 1/2
0
0
1/2 1
22−6 a) x = ±1 : z = 1 + y1 . x = 0: z = y1 . y = 1 : z = x2 + 1. y = 2 : z = x2 + 12 . y = 3 : z = x2 + 13 . Figur unten. 22−7 a) F¨ ur c = 0 erh¨ alt man den Nullpunkt; die beiden andern Niveaulinien sind Ellipsen. b) x = 0 : z = 4y 2 . x = 1 : z = 1 + 4y 2 . x = 2 : z = 4 + 4y 2 . y = 0 : z = x2 . y = 1 : z = x2 + 4. y = 2 : z = x2 + 16. Figur unten. 22−8 a) x = 0 : z = 1 + y. x = 12 : z = e−1/2 (1 + y). x = 1 : z = e−1 (1 + y). (Drei Geraden.) y = 0 : z = e−x . y = 12 : z = 32 e−x . y = 1 : z = 2e−x . Figur unten. Zu 22−6 Zu 22−7 Zu 22−8 z z y 1
4
x
1
x 1
x
3 y
1
1
y
22−9 f (x, y) = (x+1)2 +y 2 +(x−1)2 +y 2 = 2x2 +2y 2 +2. Die Niveaulinien bilden den geometrischen Ort aller Punkte P , f¨ ur die die Summe der Quadrate der Abst¨ ande zu A und zu B konstant ist. F¨ ur c = 2 besteht die Niveaulinie aus dem Nullpunkt; f¨ u r c > 2 handelt es sich um Kreise um den Nullpunkt mit Radius
c − 1.
2
osungen der Aufgaben 28. L¨
478
(28.23) L¨osungen zu Kapitel 23 x 1 x2 √ 23−1 a) fx = y 2 + 2x y + , fy = 2xy + √ − 2 . y 2 y y 2r + s r b) gr = 2 , gs = 2 . r + rs + 1 r + rs + 1 u v √ √ , hv = . c) hu = (1 + u2 + v 2 ) u2 + v 2 (1 + u2 + v 2 ) u2 + v 2 d) Fα = 2α2 cos(α2 − β 2 ) + sin(α2 − β 2 ), Fβ = −2αβ cos(α2 − β 2 ). e) Gr = (1+2rt3 ) exp(r +st+r2 t3 ), Gs = t exp(r +st+r2 t3 ), Gt = (s+3r2 t2 ) exp(r +st+r2 t3 ). 1 1 x+y x 1 x , Fz = − 2 − . f) Fx = + , Fy = − z y+z z (y + z)2 z (y + z)2 23−2 a) −(2x2 + xy) cos(x2 + xy) − sin(x2 + xy). 2x 2 b) Fxyz = − 2 − 3 . z x 1 2 2x c) Gxx = , Gxy = Gyx = , Gyy = − 2 . x y y d) Fxx = Fxy = Fyx = 0, Fxz = Fzx = − 2(3z 2 − 1)(x + y 2 ) . (z 2 + 1)3
2z 4yz , Fyz = Fzy = − 2 , Fzz = (1 + z 2 )2 (z + 1)2
In c) kann die Rechnung noch etwas vereinfacht werden, wenn man beachtet, dass ln(xy 2 ) = ln x + 2 ln y ist. 23−3 a) fα + fβ = cos α cos β − sin α sin β = cos(α + β). (Additionstheorem, (27.15.c).) b) rxx = y 2 (x2 + y 2 )−3/2 , ryy = x2 (x2 + y 2 )−3/2 , rxx + ryy = (x2 + y 2 )−1/2 = 1/r(x, y).
23−4 a) Es ist Ct = b exp(ax + bt), Cxx = a2 exp(ax + bt). C(x, t) ist eine L¨ osung, falls b = a2 .
1 x 2 − 5/ 2 x2 2x2 x2 2 b) Es ist Ct = (− t−3/2 + ) exp(− ), Cxx = −t−3/2 (− t + 1) exp(− ). 2 c ct c ct ct Multipliziert man aus und vergleicht die Koeffizienten von t−3/2 und t−5/2 , so sieht man, dass c = 4 eine L¨ osung liefert.
23−5 a) Es ist fx = 6x − 3y − 9, fy = −3x + 4y + 2. Man setzt fx = fy = 0 und l¨ ost das lineare Gleichungssystem. Die L¨ osung ist x0 = 2, y0 = 1. Wegen fxx = 6, fxy = −3 und fyy = 4 ist A = A(2, 1) = 15 > 0: f hat in (2, 1) ein Extremum, wegen fxx (2, 1) = 6 > 0 liegt dort ein relatives Minimum vor. Es ist f (2, 1) = −7. b) Es ist gx = 2x − 3y − 1, gy = −3x + 2y − 1, ferner ist gxx = 2, gxy = −3, gyy = 2, also A = −5 (f¨ ur alle (x, y)), so dass diese Funktion keine relativen Extrema hat. (Es ist also gar osen; die L¨ osung w¨ are u ¨brigens (−1, −1). ) nicht n¨ otig, das Gleichungssystem gx = gy = 0 zu l¨ 23−6 a) Man setzt fx = 2x(y + 1) − 5y = 0 und fy = x2 − 5x + 6 = 0. Die zweite Gleichung hat die L¨ osungen x1 = 2, x2 = 3. Die erste Gleichung liefert die zugeh¨ origen L¨ osungen y1 = 4, y2 = −6. Weiter ist fxx = 2(y + 1), fxy = 2x − 5, fyy = 0. Es folgt A(2, 4) < 0, A(3, −6) < 0 und f hat keine relativen Extrema. b) Wir setzen fx = 12xy 3 − 3x2 y 3 − 2xy 4 = 0 und fy = 18x2 y 2 − 3x3 y 2 − 4x2 y 3 = 0. Da x >, 0, y > 0 vorausgesetzt wurde, k¨ onnen wir durch xy 3 bzw. x2 y 2 dividieren. Wir erhalten die Gleichungen 12−3x−2y = 0 und 18−3x−4y = 0 mit der L¨ osung x0 = 2, y0 = 3. Einsetzen in die 2. partiellen Ableitungen ergibt fxx (2, 3) = −162, fyy (2, 3) = −144, fxy (2, 3) = −108. Es folgt, dass f an der Stelle (2,3) ein absolutes Maximum hat; es ist f (2, 3) = 108. c) fx = 3x2 − y = 0, fy = −x + 2y − 5 = 0. Die zweite Gleichung liefert x = 2y − 5. Setzt man dies in die erste ein, so erh¨ alt man die quadratische Gleichung 12y 2 −61y +75 mit den L¨ osungen
osungen zu Kapitel 23 28.23 L¨
479
25 y1 = 3, y2 = 12 . Es ist dann x1 = 1, x2 = − 56 . Weiter ist A(x, y) = 12x − 1, so dass nur f¨ ur (x1 , y1 ) = (1, 3) ein Extremum (und zwar ein rel. Minimum) vorliegt. Es ist f (1, 3) = −8.
23−7 Wx = (2ax − 3x2 )t2 e−t = 0, Wt = (x2 a − x3 )(2te−t − t2 e−t ) = 0. Wegen t2 e−t > 0 (denn t > 0 nach Voraussetzung) folgt aus der ersten Gleichung x0 = 23a . Einsetzen in die zweite Gleichung liefert t0 = 2. Ferner ist Wxx = (2a − 6x)t2 e−t , Wxt = (2xa − 3x2 )(2te−t − t2 e−t ) und Wtt = (x2 a − x3 )(2e−t − 4te−t + t2 e−t ). Einsetzen liefert A( 23a , 2) = 64 a4 e−4 > 0 (Extremum vorhanden) 27 und Wxx ( 23a , 2) = −8ae−2 < 0 (relatives Maximum). 23−8 Es ist a + b + c = 90 und a2 + b2 + c2 soll minimal sein. Wir setzen c = 90 − a − b in die obige Beziehung ein und erhalten f (a, b) = 2a2 + 2b2 + 2ab − 180a − 180b + 8100. Diese Funktion ist zu minimieren. Mit fa = 4a + 2b − 180 und fb = 4b + 2a − 180 findet man a = 30, b = 30 und damit auch c = 30 (die Symmetrie sollte nicht u ¨ berraschen). Die Gr¨ osse A nimmt den Wert achlich das Minimum gefunden. 12 > 0 an; wegen faa = 4 > 0 haben wir tats¨ 23−9 Der Bedarf an Karton berechnet sich zu 2xy + 2xz + 2yz + 12 xz + 12 yz = 2xy + 52 xz + 52 yz. Wegen V = xyz = 6400 k¨ onnen wir z = 6400 xy einsetzen und finden die zu minimierende 16000 + . Dabei ist x, y > 0. Partielles Ableiten ergibt fx = Funktion F (x, y) = 2xy + 16000 y x 2y −
16000
x2
= 0, Fy = 2x −
16000
y2
= 0. Setzt man y = 8000 aus der ersten Gleichung in die x2
zweite ein, so erh¨ alt man (da y > 0 ist) y0 = 20 und damit x0 = 20, z0 = 16. Die Dimensionen sind damit bestimmt. Es ist weiter Fxx = 32000 , Fyy = 32000 und Fxy = 2. Damit wird x3 y3 A(20, 20) > 0 und Fxx (20, 20) > 0; es liegt also in der Tat ein relatives Minimum vor. V 23−10 a) Wenn L die L¨ ange der Schnur ist, dann ist L = 2x + 2y + 4z. Aus xyz = V folgt z = xy 4V und L(x, y) = 2x + 2y + xy . Dabei ist sicher x, y > 0. Die partiellen Ableitungen werden wie
4V u ¨blich gleich Null gesetzt: Lx = 2 − x42Vy = 0, Ly = 2 − xy 2 = 0. Aus der ersten Gleichung √ 2V setzt man y = x2 in die zweite ein und findet so die L¨ osungen x0 = y0 = 3 2V , z0 = 3 V /4.
Weiter ist A(x0 , y0 ) =
(
2 48V 8V 4 √ > 0 und Lxx (x0 , y0 ) = √ = √ > 0; wir haben wie 3 3 3 2V ) 8 ( 2V ) 4 2V
gew¨ unscht ein relatives Minimum. b) Die Rechnungen gehen ganz a ¨hnlich. Es ist diesmal L =4x + 2y + 6z, und somit L(x, y) = √ 3 3 3V 6V , y0 = 6V und z0 = 3 29V . 4x + 2y + xy . Der gleiche Prozess wie in a) liefert x0 = 4 108V Hier ist A(x0 , y0 ) = √ 3 (
2
9V /2)4
16 > 0 und Fxx (x0 , y0 ) = √ 3
6V
> 0.
23−11 Wenn P die Koordinaten (x, y, z) hat, dann ist das Volumen des Quaders gleich V = xyz; ferner muss 6x + 3y + 2z = 6 gelten. Es folgt z = 3 − 3x − 32 y. Einsetzen in V = xyz liefert die Funktion V (x, y) = 3xy − 3x2 y − 32 xy 2 . Wir setzen Vx = 3y − 6xy − 32 y 2 = 0 und Vy = 3x − 3x2 − 3xy = 0. Wegen x, y > 0 darf durch x bzw. y dividiert werden. Es entstehen zwei lineare Gleichungen: 3 − 6x − 32 y = 0 und 3 − 3x − 3y = 0 mit den L¨ osungen x = 13 , y = 23 , und es wird z = 1. Mit Vxx = −6y, Vyy = −3x und Vxy = 3 − 6x − 3y wird A( 13 , 23 ) = 3 > 0 (Extremum vorhanden); wegen Vxx ( 13 , 23 ) < 0 handelt es sich wie erwartet um ein Minimum. Das maximale Volumen betr¨ agt 29 . 23−12 Das Quadrat des Abstands der durch r(t) und s(u) gegebenen Kurvenpunkte betr¨ agt f (t, u) = t2 +(u−t)2 +( 12 −u2 )2 = u4 +2t2 −2ut+ 14 . Wir setzen ft = 4t−2u = 0 und fu = 4u3 −2t = 0. Aus der ersten Gleichung setzen wir u = 2t in die zweite ein und erhalten 32t3 − 2t = 0 mit den origen Werten von u: u0 = 0, u1 = 12 , u2 = L¨ osungen t0 = 0, t1 = 14 , t2 = − 14 und den zugeh¨ 1 2 ur − 2 . Wegen A(t, u) = 48u − 4 wird A(0, 0) < 0, hier hat man kein Extremum, wohl aber f¨ (t1 , u1 ) und (t2 , u2 ), wo relative Minima vorliegen. In diesen F¨ allen ist der minimale Abstand √ beide Male gleich f (t, u) = 3/4 = 0.4330.
osungen der Aufgaben 28. L¨
480
23−13 Wie in Aufgabe 23−12 ist es rechnerisch einfacher, das Quadrat des Abstands des Punktes P (x, y, z) zum Nullpunkt zu minimieren. Dieses ist gegeben durch x2 + y 2 + z 2 ; da P in der onnen wir (z.B.) y durch y = −16 + 2x + 2z Ebene mit der Gleichung 2x − y + 2z = 16 liegt, k¨ ucken. Es wird dann x2 +y 2 +z 2 = 5x2 +5z 2 +8xz −64x−64z +256 = f (x, z). Nullsetzen ausdr¨ uhrt auf die Gleichungen 10x + 8z = 64 und 10z + 8x = 64 mit der partiellen Ableitungen f¨ der L¨ osung x = z = 32 , y = − 16 . Wegen A(x, z) = 36 > 0 und fxx = 10 > 0 haben wir 9 9 tats¨ achlich das Minimum gefunden (dessen Existenz auch geometrisch klar ist). Der minimale Abstand betr¨ agt 16/3. (Diese Aufgabe kann selbstverst¨ andlich auch mit Vektorgeometrie gel¨ ost werden.) 23−14 Auch hier betrachten wir das Quadrat des Abstands vom Punkt (6, 2,0) zum Punkt ache, n¨ amlich f (x, y) = (6−x)2 +(2−y)2 +(0− 1 + 2x2 + y 2 )2 (x, y, 1 + 2x2 + y 2 ) auf der Fl¨ = 3x2 + 2y 2 − 12x − 4y + 41. Wir setzen fx = 6x − 12 = 0, fy = 4y − 4 = 0 und finden sofort den Kandidaten (x0 , y0 ) = (2, 1). Wegen fxx = 6 > 0, fyy = 4 und fxy = 0 ist A(2, 1) = 24. √ Es liegt ein Minimum vor; der minimale Abstand betr¨ agt 27. ¨ 23−15 Ahnlich wie in Aufgabe 23−14 betrachten wir das Quadrat des Abstandes von (1, 1, 0) zum Punkt (x, y, xy + 1) auf der Fl¨ ache, also den Ausdruck f (x, y) = (x − 1)2 + (y − 1)2 + (xy + 1)2 = x2 y 2 +x2 +y 2 +2xy−2x−2y+3. Es folgt fx = 2xy 2 +2x+2y−2 = 0, fy = 2x2 y+2y+2x−2 = 0. Division durch 2 und Subtraktion der beiden Gleichungen f¨ uhrt auf die Beziehung x2 y = xy 2 d.h. auf xy(x − y) = 0. Es ist also entweder x = 0 oder y = 0 oder x = y. Einsetzen in eine der Gleichungen gibt im ersten Fall die L¨ osung x1 = 0, y1 = 1, im zweiten die L¨ osung alt man die Gleichung 3. Grades x3 + 2x − 1 = 0. x2 = 1, y2 = 0. Im dritten Fall (x = y) erh¨ Eine fl¨ uchtige Skizze des Graphen zeigt, dass diese Funktion nur eine Nullstelle hat, die sich z.B. mit dem Newtonschen Verfahren berechnen l¨ asst. Man erh¨ alt x3 = y3 = 0.4534. Mit fxx = 2 + 2y 2 , fyy = 2 + 2x2 , fxy = 4xy + 2 pr¨ ufen wir noch Existenz und Art der Extrema. Wir finden A(0, 1) > 0, A(1, 0) > 0. In diesen beiden F¨ allen liegt ein relatives Minimum √ vor; der minimale Abstand betr¨ agt 3. Dagegen ist A(x3 , y3 ) < 0, diese Stelle liefert kein Extremum (und es w¨ are gar nicht n¨ otig gewesen, die Gleichung 3. Grades zu l¨ osen, wenn man A(x3 , y3 ) < 0 vorg¨ angig bestimmt h¨ atte). ¨ 23−16 Einfache trigonometrische Uberlegungen f¨ uhren auf die Formeln f¨ ur Umfang U = x + 2y + cosx α und Inhalt F = xy + 14 x2 tan α. Der ersten entnimmt man y = 12 (U − x − cosx α ). Einsetzen in x2 + x2 tan α . Es folgt F = 1 U − x − x + x tan α die zweite liefert F = 12 U x − x2 − cos x α 2 2 cos α 2 2 1 sin α 1 π oder 30◦ . F¨ und Fα = x2 2 cos . Nun ist F − = 0 f¨ u r sin α = , also f¨ u r α = ur α 2α 2 cos2 α √6 √ x erh¨ alt man dann unter Verwendung von Fx = 0 den Wert x = U/(2 + 3) = (2 − 3)U . √ √ Dazu geh¨ oren die Werte y = 16 (3 − 3)U und F = 14 (2 − 3)U 2 . Es ist anschaulich klar, dass ein Maximum existieren muss; man kann aber auch mit einigem √ √ √ Aufwand die Gr¨ ossen A((2 − 3)U, π/6) = 16 (2 3 − 3)U 2 > 0 und Fxx ((2 − 3)U, π/6) = √ −1 − 3/2 < 0 berechnen. Wer es genauer wissen will, betrachtet noch allf¨ allige Randpunkte des Definitionsbereichs (vgl. und x > 0. Da auch y = 12 (U − x − cosx α ) > 0 (23.6.4)). Offensichtlich ist 0 ≤ α < π 2 U cos α sein. Randpunkte erh¨ alt man also nur f¨ ur α = 0. Hier ist sein muss. muss x < 1+cos α
F (x, 0) =
1 (U x 2
− 2x2 ). Diese Funktion wird maximal f¨ ur x =
1 . 4
Dann ist auch y = 2
1 , 4
und
, 0) = U , welcher kleiner als der das F¨ unfeck entartet zu einem Quadrat mit dem Inhalt F ( U 4 16 √ oben gefundene Wert 14 (2 − 3)U 2 ist. 2 23−17 Es ist xi = 30, yi = 23.5, xi yi = 152.2, xi = 220, n = 6. L¨ osen des zugeh¨ origen Gleichungssystems f¨ uhrt auf die Regressionsgerade y = 0.4957x + 1.4381. Mit f (x) = 0.4957x + 1.4381 wird f (12) ≈ 7.4 und f (7.2) ≈ 5. 23−18 Logarithmieren der Beziehung Y = cr x f¨ uhrt auf y = ln Y = ln c+x ln r (eine lineare Beziehung)
osungen zu Kapitel 24 28.24 L¨
481
und auf die neue Tabelle: xi
2
4
6
8
yi = ln Yi 0.6931 1.2528 1.7918 2.3026 2 Man erh¨ alt xi = 20, yi = 6.0403, xi yi = 35.5690, xi = 120, n = 4. Mit a = ln r, b = ln c folgt durch L¨ osen des Gleichungssystems a = 0.2684, b = 0.1682 und schliesslich c = eb = 1.1832, r = ea = 1.3079. 23−19 Das Vorgehen ist ganz analog zum Beispiel 2. in (23.7). Man erh¨ alt (mit den dortigen Beur die Laufzeit T in zeichnungen) a = 1.131, b = −2.820 und B = eb = 0.0596. Die Formel f¨ Abh¨ angigkeit von der Laufstrecke X lautet somit T = 0.0596 · X 1.131 . Es folgt T (800) = 114.46 s, T (1500) = 233.03 s. (Die effektiven Rekordzeiten betragen 117.95 s bzw. 238.20 s.)
(28.24) L¨osungen zu Kapitel 24 24−1 a) Es ist fx (x, y) = 2xy + 2y 3 + 1, fy (x, y) = x2 + 6xy 2 . Mit f (1, −1) = −1, fx (1, −1) = alt man die Ebenengleichung z = −1 − 3(x − 1) + 7(y + 1) oder −3 und fy (1, −1) = 7 erh¨ −3x + 7y − z + 9 = 0. 1 +x . Mit g(2, 1) = 52 , gx (2, 1) = 34 und gy (2, 1) = b) Es ist gx (x, y) = y1 − xy2 , gy (x, y) = −x y2 3 5 3 − 2 erh¨ alt man die Ebenengleichung z = 2 + 4 (x−2)− 32 (y −1) oder (z.B.) 3x−6y −4z +10 = 0.
ache (bzw. zur Tangentialebene) gegeben durch 24−2 Gem¨ ass (24.2) ist ein Normalenvektor n0 zur Fl¨ n0 = (−fx (x0 , y0 ), −fy (x0 , y0 ), 1). n0 mit n = (−2, −4, 1), dass im a) Wegen fx (x, y) = 2x, fy (x, y) = 2y zeigt ein Vergleich von Punkt mit x0 = 1, y0 = 2 und damit z0 = 5 die Tangentialebene normal zu n steht. b) Der Ebenengleichung entnimmt man sofort einen Normalenvektor n1 = (−3, 4, 2). Um mit n0 vergleichen zu k¨ onnen, muss die z–Koordinate = 1 sein. Wir betrachten daher den Normalenvektor n = (− 32 , 2, 1) . Da ein Punkt mit positiver z–Koordinate gesucht ist, l¨ osen wir die Gleichung wie folgt nach z auf:z = g(x, y) = 15 − 3x2 − 2y 2 . Es folgt gx (x, y) = −3x/ 15 − 3x2 − 2y 2 , gy (x, y) = −2y/ 15 − 3x2 − 2y 2 . Ein Vergleich von n0 und n ergibt nun die Beziehungen −
(∗)
3x 3 = , 2 15 − 3x2 − 2y 2
2=
2y 15 − 3x2 − 2y 2
.
Einfaches Umformen f¨ uhrt auf die Gleichungen 7x2 + 2y 2 = 15 und 3x2 + 3y 2 = 15, die linear in x2 und in y 2 sind. Aufl¨ osen ergibt x2 = 1 und y 2 = 4. Den Beziehungen (∗) ist die Vorzeichenwahl zu entnehmen, n¨ amlich x = −1 und y = 2. Ferner ist dann z = 2. 1 Δx + 45 Δy. 5 2 + 1) folgt dg = 35 Δx.
24−3 a) Mit fx (x, y) = 1/(x + y 2 ) und fy (x, y) = 2y/(x + y 2 ) folgt df = b) Mit gx (x, y) = gy (−2, 2) = 0.)
3/(y 2
+ 1) und gy (x, y) =
(8 − 8y 2
− 6xy)/(y 2
(Es ist
24−4 Mit fx = z(x + yz)exz + exz , fy = zexz und fz = x(x + yz)exz + yexz folgt fx (0, 1, −1) = 2, fy (0, 1, −1) = −1, fz (0, 1, −1) = 1 und damit df = −0.08. √ r2 h, M = πr r 2 + h2 . Daraus folgt 24−5 Es ist V = π 3 2r 2 + h2 πrh dM = π √ Δr + √ Δh . r 2 + h2 r 2 + h2 2 h+2rΔrΔh+(Δr)2 Δh . (Δr) Mit ΔV = V (r +Δr, h+Δh)−V (r, h) ist ferner ΔV −dV = π 3 dV =
2π π rhΔr + r 2 Δh, 3 3
osungen der Aufgaben 28. L¨
482
24−6 Die partiellen Ableitungen sind Ar = 21 (α − sin α), Aα = r2 (1 − cos α). Damit wird dA = 1 (α − sin α)Δr + r2 (1 − cos α)Δα. Wir gehen analog zu (24.4.1) vor und setzen r = 50, α = 2 70π/180, |Δr| ≤ 1, |Δα| ≤ π/180. Man findet (unter Verwendung der “Dreiecksungleichung”) < 0.428. |ΔA| ≈ 4 24−7 Es sei d der Durchmesser. Dann ist A = π( d2 )2 und R = ρ πd 2. 4ρ 8ρ 4ρ 8ρ a) Es ist R = πd 2 , Rd = − πd3 . Damit wird dR = πd2 Δ− πd3 Δd. Wie in (24.1.1) setzen wir − 8 nun (Masseinheiten beachten!) ρ = 1.7 · 10 , = 0.5, |Δ| ≤ 0.001, d = 0.002, |Δd| ≤ 0.0002. < 5.465 · 10−4 . Wir finden so |ΔR| ≈ 4 b) Wenn ρ nun auch noch als variabel aufgefasst wird, dann ist Rρ = πd 2 . Zum in a) bestimm4ρ 8ρ 4 ten Audruck f¨ ur dR kommt noch ein Summand hinzu: dR = πd2 Δρ + πd 2 Δ − πd3 Δd. Mit
< 6.261 · 10−4 . |Δρ| ≤ 0.05 · 10−8 erhalten wir |ΔR| ≈
(28.25) L¨osungen zu Kapitel 25 Abk¨ urzungen: I1: Erste Integration (nach y) ergibt eine Funktion F (x). I2: Zweite Integration (der Funktion F (x) nach x) liefert das gesuchte Gebietsintegral D .
1 x−y dy = −ex−1 + ex = F (x). I2: 02 F (x) dx = e2 − e + e1 − 1 = 4.0387. 0 e √ 8 4 2− 15 = 0.4876. b) I1: 01 x x2 + y dy = 23 x(x2 +1)3/2 − 23 x4 = F (x). I2: 01 F (x) dx = 15
25−1 a) I1:
π/2 x(cos(x + y) dy = x sin(x + π ) − x sin x = F (x). I2: 0π F (x) dx = c) I1: 0 2
π
−x cos(x + π ) + sin(x + π ) + x cos x − sin x = −2 − π = −5.1416. (Partielle Integration). 2 2 0
25−2 a) I1: b) I1:
√x 0
(x2 + 2y) dy = x3/2 + x = F (x). I2:
x2 1
2.0343. 25−3 a) I1: b) I1:
√1 + √1 y x
4 0
F (x) dx =
104 . 5
2
dy = x3/2 + 2x − x−1/2 − 2 = F (x). I2:
1
F (x) dx = − 25
√
2+
13 5
=
x2 x2 1 3 3 0 F (x) dx = − 4 . 1/x y 2 dy = −1 + x = F (x). I2: 1+x x3
(x2 +y) dy = − 12 x6 −x5 +x3 + 32 x2 +x+ 12 = F (x). I2:
1 0
F (x) dx =
127 84
= 1.5119.
25−4 a) Das Dreieck ist begrenzt durch y = 0 und y = 3x im Intervall 0 ≤ x ≤ 1. . I1: 03x (x4 y 2 + 1) dy = 9x7 + 3x = F (x). I2: 01 F (x) dx = 21 8 b) Aus der Ellipsengleichung folgt −2 ≤ x ≤ 2, und das gesuchte Gebiet ist durch α(x) = − 13 (4 − x2 ) und β(x) = 1 (4 − x2 ) mit −2 ≤ x ≤ 1 begrenzt. 3 β (x ) I1: α(x) (x + y) dy = 2x 13 (4 − x2 ) = F (x). 1 1 2 I2: − 2 F (x) dx = −2 (Substitution u = 3 (4 − x )).
y x −2
1
28.25 L¨ osungen zu Kapitel 25
483 y
4 − x2
25−5 a) Die Gleichung = 3x hat die L¨ osungen −4 und 1. Das Gebiet D hat somit die nebenstehende Gestalt. Damit die Idee des Volumens Sinn macht, muss z = x + 5 ≥ 0 sein, f¨ ur alle (x, y) ∈ D, was aber zutrifft, da hier x ≥ −4 ist. 2 I1: 34y−x (x + 5) dy = −x3 − 8x2 − 11x + 30 = F (x). 1 = 72.9167. I2: −4 F (x) dx = 875 12 b) Das Dreieck wird begrenzt durch y = 0 und y = 1 − x mit 0 ≤ x ≤ 1. I1: 01−x (x2 + y 2 + 1) dy = − 43 x3 + 2x2 − 2x + 43 = F (x). I2: 01 F (x) dx = 23 .
−4
x 1
484
SACHVERZEICHNIS 410 Abbildung Ableitung 47, 53, 114, 429 — Bedeutung der 1. Abl. 82 84, 92 — Bedeutung der 2. Abl. — Formeln 67, 423 — h¨ ohere 58, 129 ohere partielle 354, 360 — h¨ 350, 352, 353 — partielle — Regeln 423 260 — Umkehrfunktion 124 — Vektorfunktion 409 Absoluter Betrag 33, 346, 409 Abstand 403 Abszisse Alphabet, griechisches 421 209, 223 Anfangsbedingung 224, 329 Anfangswertproblem Approximation von Funktionen — durch eine lineare Funktion 102 307 — durch Polynome ¨ Aquivalenz 408 Arbeit 13, 136, 145 254 Arcuscosinus 255 Arcuscotangens Arcusfunktion 252 256 Arcussinus 306 Arcussinus Arcustangens 255 273 Areafunktion Beschleunigung Betrag — absoluter — Vektor Binomialkoeffizient Binomialreihe Binomische Formel Bogenmass/Grad Cosecans Cosinusreihe Cosinus Cotangens
59, 129 409 4, 28 405 305 406, 407 418 420 303 419 420
Differential — totales — vektorielles Differentialform Differentialgleichung osung — allgemeine L¨ — linear — linear homogen — linear inhomogen — linear, konstante Koeffizienten osung — linear, L¨ 230, 236, — L¨ osungsmethoden osung — numerische L¨ — Ordnung — Richtungsfeld osung — singul¨ are L¨ — spezielle L¨ osung Differentialquotient Differenz von Mengen 54, Differenzenquotient Differenzenregel 53, 58, 62, differenzierbar — partiell — total — Vektorfunktion Disjunkte Mengen Divergenz — Folge — Reihe Doppeltlog. Koordinatensystem 10, Dreiecksungleichung Durchschnitt 43, Durchschnittsgeschwindigkeit
108 381 130 390 207 223 226 227 227 234 233 329 329 214 225 241 223 54 402 124 66 429 352 386 124 402 289 291 279 409 401 124
Ebenengleichung 20, 21, 36, 37 Einheitsvektor 13 Ersatzfunktion — lineare 102, 382 — Polynom 307 Euler — Verfahren von 330 302, 414 Eulersche Zahl (e) Exponentialfunktion 258, 268, 277, 302, 413 Exponentialreihe 302 275 Exponentielle Ann¨ aherung
© Springer Nature Switzerland AG 2020 C. Luchsinger, H. H. Storrer, Einführung in die mathematische Behandlung der Naturwissenschaften I, Grundstudium Mathematik, https://doi.org/10.1007/978-3-030-40158-0
osungen zu Kapitel 25 28.25 L¨
Extremum — absolutes — relatives
485
92, 356 87, 356 88, 356
405 Fakult¨ at Fehler — absoluter 111, 383 — relativer 111, 384 Fehlerfortpflanzung 110, 383 137, 144 Fl¨ acheninhalt Folge 287 — divergent 289 288 — Grenzwert (Limes) 289 — konvergent Fourierreihe 266 Freier Vektor 5 410 Funktion — abgeleitete 53, 58 — Arcus252 — Arcuscosinus254 255 — Arcuscotangens— Arcussinus253 — Arcustangens255 273 — Area303, 419 — Cosinus— Cotangens 420 335, 410 — Definitionsbereich 53, 57, 62, 429 — differenzierbare 75 — elementare — Exponential- 258, 268, 277, 302, 413 81, 82 — fallende — graphische Darstellung 96, 336, 411 425 — Grenzwert — hyperbolische 271 — injektive 256 257 — inverse 71 — Komposition — konstante 83 — lineare, zwei Variablen 337 258, 304, 416 — Logarithmus244 — logistische — mehrere Variable 335 — Modifikationen 264 352 — partiell differenzierbare 341, 342, 345 — partielle — periodische 266 411 — Polynom279, 412 — Potenz— Potenzreihen294 — rationale 411
— — — — — — — — — — — — — — —
Sinus303, 419 157 Stammstetige 60 stetige, zwei Variable 348 151 st¨ uckweise stetige Tangens420 418 trigonometrische 257 Umkehrunendlich oft differenzierbare 58 vektorwertige 117 71 Verkettung 81, 82 wachsende 259 Wurzelzusammengesetzte 71 252 zyklometrische
394, Gebietsintegral 2, Geschwindigkeit 43, — Durchschnitts— Momentan— WachstumsGeschwindigkeitsvektor 2, Gleichungen osung — Numerische L¨ Grad/Bogenmass Graph — Funktion von zwei Variablen — Umkehrfunktion Grenzwert — einseitig — Folge 47, — Funktion — Funktion von zwei Variablen Griechisches Alphabet
397 124 124 44 44 124
Halblog. Koordinatensystem Halbwertszeit Hauptsatz
276 270 160
Idealisierung Implikation Integral — bestimmtes — Doppel— Gebiets— mehrdimensionales — unbestimmtes — uneigentliches 1. Art — uneigentliches 2. Art
63 407
322 418 411 336 257 50 288 425 346 421
140, 142 394, 397 394, 397 394 171 320 314
Sachverzeichnis
486
— Vektorfunktion Integraltabelle Integrand Integration — numerische — partielle — Substitution Integrationsgrenzen — Vertauschung Integrationskonstante Integrationsvariable Intervall
191 186 143 325 182 176, 178, 181 143 150 165 143 80
Keplersche Fassregel Kettenlinie 66, 70, 72, 76, Kettenregel Kleinsten Quadrate — Methode der Komposition von Funktionen Konvergenzbereich Konvergenz — Folge — Reihe Koordinatenfunktion Koordinatensystem — doppeltlogarithmisches — halblogarithmisches 24, — kartesisches — rechtwinkliges Kraftfeld Kreisbewegung Kurvendiskussion Kurvenintegral 198, 200, ange Kurvenl¨
326 272 425 368 71 294 289 291 117 279 276 403 24 193 128 96 203 147
47 Limes: Siehe Grenzwert Limes 288 — Folge 371 Lineare Regression Linearisierung 102, 382 198 Linienintegral 85 Linkskurve Logarithmische Skala 275 416 Logarithmus urlicher — nat¨ 258, 417 — Reihe 304 — Funktion 244 L¨ osung (Differentialgleichung) — allgemeine 209, 223
— singul¨ are — spezielle
241 209, 223
Maclaurinreihe Maximum: Siehe Extremum Maximum — absolutes — relatives Menge — leere Mengen — Differenz — disjunkte — Durchschnitt — Produkt — Vereinigung Methode der kleinsten Quadrate Minimum: Siehe Extremum Minimum — absolutes — relatives Mittelwert Momentangeschwindigkeit 44,
301 87 356 356 401 401 402 402 401 402 402 368 87 356 356 170 124
Newton — Methode von Niveaulinien Nullvektor Numerische Integration osung Numerische L¨ — Differentialgleichung — Gleichungen
329 322
Ordinate Ordnung Ortsvektor
403 214 4
Parameterdarstellung — Ebene — Gerade — Kurve Partialbruchzerlegung Partialsumme Partielle Ableitung Partielle Funktion Partielle Integration Periodische Funktion Polynomfunktion Potenz
322 338 6 325
21, 37 19, 34 120 187 291 350, 352, 353 341, 342, 345 182 266 411 404
osungen zu Kapitel 25 28.25 L¨
Potenzfunktion Potenzreihe Potenzreihenfunktion Produkt — kartesisches Produktregel Punkt — innerer — RandQuotientenregel Radioaktiver Zerfall Randpunkt Raum — n–dimensionaler Reaktionsgeschwindigkeit Rechenregeln — Ableitung Vektorfunktion — Ableitung — Addition von Vektoren — bestimmtes Integral — Exponentialfunktion — Grenzwerte von Funktionen — Integration — Koordinaten von Vektoren — Logarithmen — Potenzen — Potenzreihen — Skalarprodukt — Substitution — Ungleichungen — Vektorprodukt — Vielfaches eines Vektors Rechtskurve Rechtssystem Regression — lineare Regressionsgerade Reihe — Binomial— Cosinus— Divergenz — Exponential— geometrische — harmonische — Konvergenz — Logarithmus— Maclaurin-
487
412 293, 296 294 423 66, 76 80, 356 80, 356 66, 445 208, 269 80, 356 335 213 128 66, 67 10 150 414 425 165, 166 28 417 404, 414 296 15 178 408 18 12 85 17, 25 371 371 305 303 291 302 291 292 291 304 301
— Potenz— Sinus— Summe — TaylorReliefbild Restglied Richtungsfeld Riemannsche Summe Rotationsk¨ orper
293 303 291 301 339 311, 430 225 142, 197, 394 139
Schnelligkeit 2, Schraubenlinie Secans Separation der Variablen 326, Simpson-Formel — grosse Sinus Sinusreihe 14, 28, Skalarprodukt Skalar Skala — logarithmische Stammfunktion Stetigkeit — Funktion von zwei Variablen Substitution 176, Summe einer Reihe 66, Summenregel Summenzeichen Symbole, mathematische Tangens Tangente an Kurve Tangentengleichung Tangentensteigung Tangentialebene Tangentialvektor Taylorpolynom — Restglied Taylorreihe Teilmenge Teilsumme Terrassenpunkt Total differenzierbar Umgebung Umkehrfunktion — Ableitung Unbestimmtes Integral
124 119 420 236 432 327 419 303 422 12 275 157 60 347 181 291 424 406 407
420 45, 101 102 46 378, 379 125 307 311, 430 301 401 291 86 386 80, 356 257 260 171
488
Sachverzeichnis
Uneigentliches Integral — 1. Art — 2. Art Unterteilung Variation der Konstanten Vektorfeld Vektorfunktion — Ableitung — Integral Vektor — Addition — Betrag — Einheits— entgegengesetzter — freier — Komponenten — Koordinaten ange — L¨ — Null— Orts— Skalarprodukt — Subtraktion — Vektorprodukt — Vielfaches Vektorfeld Vektorfunktion — Ableitung
320 314 141 228 193 117 124 191 5 8, 28 4, 28 13 9 5 26 26 4, 28 6 4 14, 28, 422 11, 28 16, 28, 422 12, 28 193 117 124
— Integral Vektorprodukt Venn-Diagramm Vereinigung Volumen — Rotationsellipsoid orper — Rotationsk¨
191 16, 28, 422 402 402 169 139, 145
Wachstum Wachstumsgeschwindigkeit Wachstumsrate Wendepunkt Wurzelfunktion Wurzeln
210 44, 210 45, 211 85 259 405, 409
Zahlenfolge Zahl — Eulersche (e) — ganze — irrationale urliche — nat¨ — rationale — reelle Zahlenfolge Zentrum einer Potenzreihe Zerfallskonstante Zerfall — radioaktiver zyklometrische Funktion
287 302, 414 404 404 404 404 403 287 293 270 269 252