265 27 4MB
German Pages XX, 388 [392] Year 2020
Mike Scherfner Torsten Volland
Mathematik für das erste Semester Analysis und Lineare Algebra für Studierende der Ingenieurwissenschaften 2. Auflage
Mathematik für das erste Semester
Mike Scherfner · Torsten Volland
Mathematik für das erste Semester Analysis und Lineare Algebra für Studierende der Ingenieurwissenschaften 2. Auflage
Mike Scherfner Berlin, Deutschland
Torsten Volland Berlin, Deutschland
ISBN 978-3-662-61991-9 ISBN 978-3-662-61992-6 (eBook) https://doi.org/10.1007/978-3-662-61992-6 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2012, 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung/Lektorat: Andreas Rüdinger Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Einige Worte vorab Das erste Semester zeigt oft deutlich, was u ¨ber Mathematik bisher nicht gewusst (oder vergessen) wurde. Manchmal wurden schlummernde Begabungen gar nicht gef¨ordert oder gefordert und erst zum Studium wird einem klar, dass die Mathematik nicht auf dem Schulhof blieb, als man dessen Tore f¨ ur immer hinter sich ließ. Und dann ist es nat¨ urlich an Hochschulen oft so, dass noch viel mehr an Mathematik gelernt werden muss, als man auch nur zu tr¨ aumen wagte. Dieses Buch wird Ihnen im Studium zur Seite stehen. Wir behandeln die zwei wesentlichen mathematischen Themengebiete, die Ihnen zum Anfang Ihres Studiums begegnen, n¨amlich die so genannte Analysis (in einer Variablen) und Lineare Algebra. Diese bilden die Grundlage f¨ ur diverse andere Kurse — nicht nur solche in der Mathematik. Die beiden genannten Gebiete werden zumeist im ersten Semester parallel (oder auch in einem Kurs zur h¨oheren Mathematik verschmolzen) behandelt, das begr¨ undet wesentlich den Namen des Buches. Nat¨ urlich k¨onnen die Teile auch getrennt gelesen werden — Sie haben faktisch zwei B¨ ucher in einem. Nur an wenigen Stellen, wie bei den Differenzialgleichungen, gibt es explizit sichtbare Verkn¨ upfungen. Dieses Buch ist aus zwei zuvor getrennt erschienenen B¨ uchern (Lineare Algebra bzw. Analysis f¨ ur das erste Semester) entstanden, die hier in deutlich u ¨berarbeiteter Form vorliegen. Die urspr¨ unglichen Werke wurden sehr gut angenommen und haben zahlreiche Studierende u. a. zum Bestehen ihrer Pr¨ ufungen gebracht; dennoch haben wir uns — auch nach vielen Gespr¨ achen mit Kollegen und Studierenden — um Verbesserungen bem¨ uht. Am Ende kann es ohnehin nie allen Recht gemacht werden, denn was dem einen zu viel, ist dem anderen zu wenig; was dem einen klar erscheint, erscheint dem anderen viel zu kompliziert. Wir haben einfach versucht, Ihnen mit diesem Buch einen Begleiter zu schreiben, der Verst¨andnis f¨ ur Probleme zeigt und so gut wie (uns) m¨oglich bei den Schwierigkeiten des ersten Semesters hilft. Denn oft entscheidet sich bereits hier, ob es f¨ ur Sie im Studium eine Zukunft gibt oder nicht. Vor dem eigentlichen Start m¨ochten wir Ihnen genauer beschreiben, an was
vi
Einige Worte vorab
und wen wir beim Verfassen gedacht haben.
Fu ¨ r wen ist dieses Buch? Dieses Buch richtet sich prim¨ar an Studierende der Ingenieurwissenschaften im ersten Semester an Universit¨aten und Fachhochschulen, nach unseren Erfahrungen profitieren aber auch durchaus Studierende der Informatik vom Inhalt. Dabei ist es gleichfalls gut als Einstieg f¨ ur angehende Lehrer geeignet. Der ¨ Ubergang zum Bachelor als erstem akademischen Grad hat zu zahlreichen Verwirrungen und Irrungen gef¨ uhrt, was leider auch die Studierenden erdulden m¨ ussen. Dadurch bleibt, teils auch in der mathematischen Ausbildung der Ingenieure, weniger Zeit, um alles bis ins Detail exakt zu pr¨ asentieren. Dies finden wir bedauerlich, versuchen aber trotzdem das Beste aus der verbleibenden Zeit zu machen. Die Stoffauswahl richtet sich daher wesentlich nach dem, was der Ingenieur in seinen Mathematikveranstaltungen geboten bekommt. Wie es dort u ¨blich ist, wird viel Wert auf Beispiele, Rechnungen und Verfahren gelegt. Wir haben uns aber bem¨ uht, die Sachverhalte plausibel zu machen, was h¨ aufig auch die Idee f¨ ur den Beweis (oder diesen selbst) einschließt. Es war lange Zeit die Tradition von Lehrb¨ uchern der Mathematik, die Resultate im Textfluss zu pr¨ asentieren, sodass sich das eigentliche mathematische Resultat ganz nat¨ urlich ergab und man am Gedankengang teilhaben konnte. Diese Idee ist auch hier aufgenommen worden; es soll sich alles im Fluss erlernen (und erleben) lassen, das Buch soll freundlicher Erkl¨ arer sein, nicht strenger Oberlehrer. Der Wert des Buches liegt auch darin begr¨ undet, dass das Wort trivial“ nicht ” zu finden sein wird (auf das Entdecken im nachfolgenden Text setzen wir eine hohe Belohnung aus). Viele Begr¨ undungen sind eher intuitiv und weniger formal. Das ist keine Unterlassung, sondern Absicht; Gleichungsw¨ usten in Buchform gibt es bereits genug. Sie k¨onnen das Buch gerne auch zur Hand nehmen, wenn Sie nicht im ersten Semester sind. Wir betonen die Eignung f¨ ur Erstsemester nur, weil wir einen m¨oglichst sanften Zugang bieten.
Unser Ziel Es gibt kein Buch, das Sie sich unter das Kopfkissen legen, um dann nach einigen N¨achten wissend zu erwachen. Wir m¨ochten aber beweisen, dass Mathematik kein Buch mit sieben Siegeln ist. Sicher ist Mathematik ein anspruchsvolles Gesch¨aft, jedoch keines, was auch nur die geringste Angst berechtigt aufkommen l¨asst.
Inhalt und Aufbau
vii
In unserem Buch gibt es kein Kapitel, dem nicht eine Motivation vorangestellt wurde. Was einen motiviert oder nicht, das ist allerdings sehr individuell; wir hoffen jedenfalls, das Kommende durch einleitende Worte leichter annehmbar zu machen. Vor dem richtigen Start gibt es auch noch eine Vorbereitung, die Sie von der Schule abholt und Wesentliches von dem liefert, was Sie eventuell verpasst, vergessen oder gar nicht gelernt haben. In einem Buch f¨ ur Studierende der Ingenieurwissenschaften erwarten viele, dass es unz¨ahlige Anwendungsaufgaben gibt, die sich direkt mit der Praxis befassen. Immerhin geht es um mathematische Grundlagen f¨ ur die verschiedensten Studieg¨ange wie Maschinenbau, Biotechnologie, Verfahrenstechnik, Elektrotechnik, etc. Wir wollten jedoch der Tatsache Rechnung tragen, dass es gerade am Anfang des Studiums schwer genug ist, sich zu fokussieren. Und in den meisten F¨allen m¨ usste man f¨ ur interessante Anwendungsaufgaben weit ausholen, was vom mathematischen Kern ablenken w¨ urde. Das ist der Grund, warum das Buch am Ende doch ein ziemlich (rein) mathematisches bleibt. Nat¨ urlich h¨ atten wir weitere begeisternde Themen nehmen k¨onnen, in die Numerik einf¨ uhren und viele Seiten mit ingenieurwissenschaftlicher Praxis f¨ ullen. Letztendlich wollen — und m¨ ussen — die allermeisten Studierenden zum Schluss der Mathematikkurse eine Klausur bestehen und/oder im Semester Hausaufgaben l¨ osen. Und das ist dann nun einmal rein mathematischer Natur. Als Mathematiker und Naturwissenschaftler w¨ urden wir gerne jeden Tag Mehr Begeisterung und Durch” halteverm¨ogen, liebe Studierende, wir haben da noch was!“ schreien. Aber wir m¨ ussen auch keine Pr¨ ufungen mehr ablegen und begreifen, dass Studienord¨ nungen, Arbeit neben dem Studium zum Uberleben und neue Knechtschaften (wie die der Bachelor-Studieng¨ange) ihren Tribut fordern. Daher halten wir uns hier wesentlich an die Weisheit, dass sich der Magen auch mit zu viel gutem Essen verderben l¨asst.
Inhalt und Aufbau Wir behandeln die Standardthemen der Analysis f¨ ur eine Variable und der Linearen Algebra. Diese Auswahl orientiert sich an der Tatsache, dass an den meisten Hochschulen gerade diese Themen an den Anfang gestellt werden. Die Reihenfolge der Hauptteile richtet sich danach, dass das Denken bez¨ uglich einer Variable aus der Schule recht vertraut und vergleichsweise unkompliziert ist. ¨ Der Ubergang zu mehreren Dimensionen erscheint oft sehr abstrakt, muss aber in der Linearen Algebra vollzogen werden. In der Zukunft erwartet Sie dann ¨ die Analysis in mehreren Variablen, wo zahlreiche Uberlegungen aus den hier behandelten Themen offensichtlich zusammenfließen. Ein erstes Treffen findet bereits beim Thema Differenzialgleichungen statt. Die Behandlung selbiger ist durchaus nicht u ur ein Buch zum ersten Semester, jedoch lernt man hier ¨blich f¨ bereits viel u ber das Zusammenspiel der hier behandelten Disziplinen und Sie ¨ werden die Tragweite der Konzepte (z. B. das der Linearit¨ at) erkennen.
viii
Einige Worte vorab
Mathematiker und Physiker werden das Fehlen von Themen (mit Recht) bedauern und auch den Studierenden der Ingenieurwissenschaften k¨ onnen wir nicht alles bieten, was wir wollten (oder aus der Sicht einiger sollten); ein solches Werk bleibt immer ein Spagat (mit mehr als zwei Beinen) zwischen den Notwendigkeiten des Studienplanes, den W¨ unschen der Studierenden, der Dozenten, der gegebenen Zeit und dem eigenen Anspruch. Und letzterer ist dann meist nur durch eine st¨andig wachsende Seitenzahl befriedigt, die jede L¨ ucke zu schließen vermag — aber auch jeden Rahmen sprengen w¨ urde. Wir werden in diesem Buch zahlreiche Beispiele betrachten, die das Erlernte greifbar machen. Wir haben uns bem¨ uht, die ersten Beispiele stets einfach zu halten. Was zuvor in der Theorie gemacht wurde, soll gleich verstehbar in den Beispielen umgesetzt werden. Am Ende eines jeden Kapitels stehen Aufgaben, an die sich sofort die vollst¨ andigen L¨osungen anschließen, damit Sie sofort pr¨ ufen k¨onnen, ob Sie Weg und Ergebnis gefunden haben. Die Aufgaben sind dabei manchmal einfach (es m¨ ussen ja auch die Grundlagen verstanden werden), teils aber auch anspruchsvoll und ben¨ otigen neben Rechenfertigkeiten auch Verst¨andnis. Am Ende jedes Kapitels finden Sie jeweils noch einige ausgew¨ ahlte Fragen, die in dieser Art aus einer (m¨ undlichen) Pr¨ ufung stammen k¨ onnten. Es gibt keine angeschlossenen Antworten, denn Sie finden alles im Text zuvor. Beherrschen Sie n¨amlich etwas nicht, so wollen wir Sie beabsichtigt wieder zum Lesen bringen. Bitte beachten Sie, dass wir die Aufgaben nicht als Zusatz sehen, sondern als bedeutenden Teil des Buches: Es gibt n¨amlich einem gewaltigen Unterschied zwischen dem Kennen und dem K¨onnen. Wie bereits erw¨ahnt, finden Sie am Anfang eine Vorbereitung. Es handelt sich dabei um eine kleine (aber n¨ utzliche) Sammlung von Dingen, die vor dem eigentlichen Start gewusst werden sollten. Nicht alles davon werden wir in diesem Buch verwenden. Aber es hilft Ihnen sicher beim Studienanfang und bei anderen Mathematikveranstaltungen. Viele B¨ ucher enden einfach mit dem Stoff, unseres mit Ideen und Tipps zu den Pr¨ ufungen, die vor Ihnen liegen. Ferner bieten wir zur realistischen Vorbereitung m¨ogliche Klausuraufgaben. Ihnen wird auffallen, dass Definitionen, Beispiele und S¨ atze farblich kenntlich gemacht wurden. Wir m¨ochten damit erreichen, dass Sie die — sagen wir es bildlich — tragenden Teile des Ger¨ usts (z. B. zur direkten Vorbereitung auf einen Test oder zur Auffrischung von Gelerntem) schnell finden. Ein mathematisches Ger¨ ust taugt aber nichts ohne die verbindenden (und erkl¨ arenden) Elemente, die sich wesentlich im restlichen Text befinden. Wir hoffen, dass Sie dieses Buch als eine Art pers¨ onlichen Begleiter annehmen k¨onnen; so haben wir uns nach Kr¨aften bem¨ uht, den Stoff freundlich und verbindlich zu vermitteln.
Inhalt und Aufbau
ix
In die nun vorliegende zweite Auflage haben wir zahlreiche Verbesserungen im Detail eingef¨ ugt, Aufgaben erg¨anzt, an Grafiken gefeilt und nat¨ urlich auch Fehler korrigiert, die wir und aufmerksame Leser (wir danken Ihnen sehr daf¨ ur!) fanden.
Dank Einige liebe Menschen in unserem Umfeld hatten etwas weniger von uns, weil wir uns Zeit f¨ ur dieses Buch genommen haben. Danke, dass Ihr das erduldet habt! Wir bedanken uns bei Herrn Ferus, dessen Skripte zum Thema Inspiration und Hilfe waren. Wir bedanken uns ferner bei den Herren Epp und Sch¨ onfeld f¨ ur ihre Hilfe bei den Graphiken. Den Herren Seiler und Rambau danken wir f¨ ur ihr Skript zur Linearen Algebra, das in seinen verschiedenen Evolutionsstufen oft motivierender Richtungsgeber war. Ferner geht unser Dank an Stefan Born f¨ ur charismatische und konstruktive Bemerkungen zur Mathematik und Restwelt, gleichfalls an Patrick Tischendorf, der als Student der Angewandten Informatik das Buch gelesen und hilfreiche Anmerkungen gemacht hat. Mike Scherfner, Torsten Volland
Inhaltsverzeichnis
Einige Worte vorab
v
Analysis
1
1 Worum geht es in der Analysis?
3
2 Ein wenig Vorbereitung
5
2.1
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.2
Ein Vorrat an Buchstaben . . . . . . . . . . . . . . . . . . . .
5
2.3
Vom richtigen Umgang mit der Aussagenlogik . . . . . . . . .
7
2.4
Vollst¨andige Induktion . . . . . . . . . . . . . . . . . . . . . .
10
2.5
Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.5.1 Ein kleiner Zoo wichtiger Mengen . . . . . . . . . . . .
13
2.5.2 Wie aus bekannten Mengen neue entstehen . . . . . . .
14
2.6
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.7
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
3 Reelle und komplexe Zahlen
23
3.1
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3.2
Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
xii
Inhaltsverzeichnis
3.2.1 Rechnen mit Ungleichungen . . . . . . . . . . . . . . . .
24
Summen und Produkte . . . . . . . . . . . . . . . . . . . . . .
26
3.3.1 Fakult¨at und Binomialkoeffizient . . . . . . . . . . . . .
27
Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . .
29
3.4.1 Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . .
32
3.5
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
3.6
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
3.3
3.4
4 Abbildungen und Funktionen
41
4.1
Motivation und Definitionen . . . . . . . . . . . . . . . . . . .
41
4.2
Einige Eigenschaften von Abbildungen . . . . . . . . . . . . .
42
4.3
Komposition von Abbildungen . . . . . . . . . . . . . . . . . .
47
4.4
Darstellung von Funktionen . . . . . . . . . . . . . . . . . . .
49
4.5
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
4.6
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
¨ 5 Wichtige Funktionen im Uberblick
55
5.1
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
5.2
Polynome und rationale Funktionen . . . . . . . . . . . . . . .
55
5.2.1 Polynome . . . . . . . . . . . . . . . . . . . . . . . . . .
55
5.2.2 Rationale Funktionen . . . . . . . . . . . . . . . . . . .
56
Sinus, Kosinus und Tangens . . . . . . . . . . . . . . . . . . .
60
5.3.1 Einige Additionstheoreme . . . . . . . . . . . . . . . . .
63
Exponentialfunktion und Logarithmus . . . . . . . . . . . . . .
63
5.4.1 Potenz- und Logarithmusgesetze . . . . . . . . . . . . .
65
5.5
Weitere wichtige Funktionen . . . . . . . . . . . . . . . . . . .
66
5.6
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
5.3
5.4
Inhaltsverzeichnis
5.7
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xiii 69
6 Folgen
75
6.1
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
6.2
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
6.3
Konvergenz und Divergenz . . . . . . . . . . . . . . . . . . . .
76
6.4
Rechenregeln f¨ ur Folgen . . . . . . . . . . . . . . . . . . . . . .
80
6.5
Das Monotoniekriterium . . . . . . . . . . . . . . . . . . . . .
81
6.6
Was noch u ¨ber Folgen bekannt sein sollte . . . . . . . . . . . .
82
6.7
Das H¨aufungspunktprinzip und mehr . . . . . . . . . . . . . .
83
6.8
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
6.9
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
7 Reihen
91
7.1
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
7.2
Grundlegendes zu Reihen . . . . . . . . . . . . . . . . . . . . .
92
7.3
Eigenschaften von Reihen . . . . . . . . . . . . . . . . . . . . .
94
7.4
Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . .
95
7.4.1 Majorantenkriterium . . . . . . . . . . . . . . . . . . .
96
7.4.2 Wurzelkriterium . . . . . . . . . . . . . . . . . . . . . .
97
7.4.3 Quotientenkriterium . . . . . . . . . . . . . . . . . . . .
98
7.4.4 Leibniz-Kriterium . . . . . . . . . . . . . . . . . . . . .
99
7.5
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
100
7.6
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
100
8 Stetigkeit
105
8.1
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
105
8.2
Grundlagen zur Stetigkeit . . . . . . . . . . . . . . . . . . . . .
106
xiv
Inhaltsverzeichnis
8.3
Zusammensetzung stetiger Funktionen . . . . . . . . . . . . .
109
8.4
Der Zwischenwertsatz . . . . . . . . . . . . . . . . . . . . . . .
110
8.5
Supremum, Infimum, Maximum und Minimum . . . . . . . . .
112
8.6
Maximum und Minimum f¨ ur stetige Funktionen . . . . . . . .
113
8.7
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
114
8.8
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
114
9 Differenziation
119
9.1
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
119
9.2
Grundlagen zur Differenziation . . . . . . . . . . . . . . . . . .
120
9.3
Rechenregeln f¨ ur Ableitungen . . . . . . . . . . . . . . . . . .
122
9.4
Der Mittelwertsatz und Folgerungen daraus
. . . . . . . . . .
125
9.5
H¨ohere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . .
127
9.6
Ausflug: Sinus, Kosinus und Exponentialfunktion . . . . . . .
128
9.6.1 Schwingung eines Pendels . . . . . . . . . . . . . . . . .
129
9.6.2 Eigenschaften von Sinus und Kosinus . . . . . . . . . .
130
9.6.3 Exponentialfunktion . . . . . . . . . . . . . . . . . . . .
131
9.7
Die Regel von l’Hospital . . . . . . . . . . . . . . . . . . . . .
132
9.8
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
134
9.9
L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
134
10 Potenzreihen
139
10.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
139
10.2 Grundlegendes zu Potenzreihen . . . . . . . . . . . . . . . . .
139
10.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
143
10.4 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
144
11 Taylorpolynome, Taylorreihen und Extremwerte
149
xv
Inhaltsverzeichnis
11.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
149
11.2 Taylorpolynom und Taylorreihe . . . . . . . . . . . . . . . . .
150
11.2.1 Das Taylorpolynom . . . . . . . . . . . . . . . . . . . .
150
11.2.2 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . .
153
11.2.3 Fehlerabsch¨atzung . . . . . . . . . . . . . . . . . . . . .
156
11.3 Lokale Extrema differenzierbarer Funktionen . . . . . . . . . .
159
11.3.1 Zur Berechnung lokaler Extrema . . . . . . . . . . . . .
159
11.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
161
11.5 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
162
12 Integration
167
12.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
167
12.2 Grundlagen zur Integration . . . . . . . . . . . . . . . . . . . .
168
12.3 Der Hauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . .
171
12.4 Wichtige Regeln zur Integration . . . . . . . . . . . . . . . . .
174
12.4.1 Substitutionsregel . . . . . . . . . . . . . . . . . . . . .
174
12.4.2 Partielle Integration . . . . . . . . . . . . . . . . . . . .
175
12.4.3 Integration rationaler Funktionen . . . . . . . . . . . .
177
12.5 Das uneigentliche Integral . . . . . . . . . . . . . . . . . . . .
179
12.5.1 Integration unbeschr¨ankter Funktionen . . . . . . . . .
181
12.5.2 Unbeschr¨ankte Integrationsgrenzen
. . . . . . . . . . .
182
12.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
186
12.7 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
187
13 Ausblick: Fourierreihen
195
13.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
195
13.2 Grundlagen zu Fourierreihen . . . . . . . . . . . . . . . . . . .
196
xvi
Inhaltsverzeichnis
13.3 Komplexe Darstellung der Fourierreihe . . . . . . . . . . . . .
200
Lineare Algebra
203
14 Worum geht es in der Linearen Algebra?
205
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
209
15.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
209
15.2 Vektorr¨ aume . . . . . . . . . . . . . . . . . . . . . . . . . . . .
210
15.3 Der Vektorraum der reellen Zahlen . . . . . . . . . . . . . . .
212
15.4 Der Vektorraum reellwertiger Funktionen auf R . . . . . . . .
214
15.5 Linearkombinationen . . . . . . . . . . . . . . . . . . . . . . .
215
15.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
220
15.7 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
221
16 Lineare Abbildungen und Matrizen
227
16.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
227
16.2 Grundlagen zu linearen Abbildungen . . . . . . . . . . . . . .
227
16.3 Kern und Bild . . . . . . . . . . . . . . . . . . . . . . . . . . .
229
16.4 Grundlegendes zu Matrizen . . . . . . . . . . . . . . . . . . . .
231
16.5 Rechnen mit Matrizen . . . . . . . . . . . . . . . . . . . . . . .
234
16.5.1 Multiplikation von Matrizen . . . . . . . . . . . . . . .
234
16.5.2 Vektorraumstruktur f¨ ur Matrizen . . . . . . . . . . . .
236
16.6 Besondere Matrizen . . . . . . . . . . . . . . . . . . . . . . . .
237
16.7 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
240
16.8 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
242
17 Lineare Gleichungssysteme
247
xvii
Inhaltsverzeichnis
17.1 Motivation und elementare Anwendungen . . . . . . . . . . . .
247
17.2 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
249
17.3 Gauß-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . .
250
17.3.1 Abweichungen vom Idealfall
. . . . . . . . . . . . . . .
252
17.4 Die Struktur der L¨osungsmenge . . . . . . . . . . . . . . . . .
253
17.5 Zum Invertieren von Matrizen . . . . . . . . . . . . . . . . . .
256
17.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
257
17.7 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
258
18 Determinanten
263
18.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
263
18.2 Definition und Berechnung . . . . . . . . . . . . . . . . . . . .
264
18.2.1 Berechnung f¨ ur (2 × 2)-Matrizen . . . . . . . . . . . . .
266
18.2.2 Berechnung f¨ ur (3 × 3)-Matrizen . . . . . . . . . . . . .
266
18.2.3 Dreiecksmatrizen . . . . . . . . . . . . . . . . . . . . . .
267
18.3 Geometrische Interpretation . . . . . . . . . . . . . . . . . . .
267
18.3.1 Determinante als Volumenform . . . . . . . . . . . . . .
267
18.3.2 Determinante und Orientierung . . . . . . . . . . . . .
268
18.3.3 Determinante und lineare Unabh¨ angigkeit . . . . . . . .
269
18.4 Rechenregeln f¨ ur die Determinante
. . . . . . . . . . . . . . .
271
18.5 Das Kreuzprodukt . . . . . . . . . . . . . . . . . . . . . . . . .
272
18.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
273
18.7 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
274
19 Norm und Skalarprodukt
279
19.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
279
19.2 Die Norm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
279
xviii
Inhaltsverzeichnis
19.3 Das Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . .
282
19.4 Orthonormalisierung nach Schmidt . . . . . . . . . . . . . . .
285
19.4.1 Das Verfahren . . . . . . . . . . . . . . . . . . . . . . .
287
19.5 Orthogonale Matrizen . . . . . . . . . . . . . . . . . . . . . . .
289
19.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
290
19.7 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
292
20 Basiswechsel und darstellende Matrizen
297
20.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
297
20.2 Koordinatenabbildungen und Koordinatenvektoren . . . . . .
298
20.2.1 Das Geschehen im Diagramm . . . . . . . . . . . . . . .
299
20.3 Darstellung linearer Abbildungen durch Matrizen . . . . . . .
301
20.4 Matrixtransformation bei einem Basiswechsel . . . . . . . . . .
302
20.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
305
20.6 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
306
21 Eigenwerte und Eigenvektoren
311
21.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
311
21.2 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
311
21.3 Berechnung der Eigenwerte . . . . . . . . . . . . . . . . . . . .
314
21.4 Berechnung der Eigenvektoren . . . . . . . . . . . . . . . . . .
315
21.5 Vielfachheiten . . . . . . . . . . . . . . . . . . . . . . . . . . .
316
21.6 Hauptvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . .
318
21.7 Diagonalisierbarkeit . . . . . . . . . . . . . . . . . . . . . . . .
320
21.7.1 Diagonalisierung am Beispiel . . . . . . . . . . . . . . .
323
21.8 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
324
21.9 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
325
Inhaltsverzeichnis
22 Differenzialgleichungen
xix 331
22.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
331
22.2 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
332
22.3 Umschreiben in ein System am Beispiel . . . . . . . . . . . . .
334
22.4 Einige Fragestellungen und erste Antworten . . . . . . . . . .
335
22.5 L¨osen durch Integration . . . . . . . . . . . . . . . . . . . . . .
337
22.6 Standardl¨osungsansatz I . . . . . . . . . . . . . . . . . . . . .
337
22.7 Standardl¨osungsansatz II . . . . . . . . . . . . . . . . . . . . .
339
22.8 Finden einer partikul¨aren L¨osung . . . . . . . . . . . . . . . .
341
22.9 Anfangswertprobleme . . . . . . . . . . . . . . . . . . . . . . .
342
22.10 Wronski-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . .
344
22.11 Beispiel f¨ ur nicht-lineare Differenzialgleichungen . . . . . . . .
346
22.12 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
347
22.13 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
348
Klausuraufgaben
353
23 Analysis
355
23.1 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
355
23.2 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
358
24 Lineare Algebra
367
24.1 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
367
24.2 L¨osungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
370
xx
Inhaltsverzeichnis
Vom Umgang mit Pru ¨ fungen
377
Literatur und Schlussbemerkungen
383
Index
385
Analysis
1 Worum geht es in der Analysis? Das Wort Analysis kommt aus dem Griechischen und bedeutet soviel wie Aufl¨ osung. Tats¨achlich hilft uns dies nicht wirklich beim Verst¨ andnis der aktuellen Bedeutung dieses wichtigen Teilgebietes der Mathematik. Historisch gesehen stammen die wesentlichen Grundlagen von Isaac Newton (1643 – 1727) und Gottfried Wilhelm Leibniz (1646 – 1716). Insbesondere Newton ben¨ otigte die von ihm entwickelten Methoden und Ideen, um eine mathematische Beschreibung wichtiger Naturvorg¨ange zu finden. Die wesentlichen Grundbegriffe der Analysis sind: Grenzwert, Funktion, Differenziation und Integration, zu deren Kl¨arung und Untersuchung wir z. B. auch etwas u ussen. Damit ist sicher nicht ¨ber Zahlen, Folgen und Reihen lernen m¨ die ganze (und insbesondere moderne) Analysis erfasst, die ihre Wirkung in fast allen Teilen der Mathematik entfaltet. Dennoch f¨ uhren diese Grundlagen, besonders im Bereich der Natur- und Ingenieurwissenschaften, sehr weit; auch die Wirtschaft verdankt ihr tiefe Einblicke, z. B. in die Dynamik der M¨ arkte. Die bekannten Wurzeln der Analysis reichen bis in die Zeit um 400 v. Chr. zur¨ uck und werden z. B. durch den ber¨ uhmten Denker Archimedes gen¨ ahrt. Aber auch einer der V¨ater der Anwendung mathematischer Methoden bei der Beschreibung der Natur, Galileo Galilei (1564 – 1642), hatte wesentlichen Anteil. So erkannte er u. a. den Zusammenhang zwischen dem Ableitungsbegriff und der Geschwindigkeit. Es ist wichtig zu verstehen, dass heute nahezu kein Teilgebiet der Mathematik — gerade soweit es die Anwendungen in den Natur- und Ingenieurwissenschaften betrifft — vollkommen von den anderen isoliert betrachtet werden kann. So werden wir in der Analysis an verschiedenen Stellen auch Gleichungen mit ¨ den Methoden der elementaren Algebra untersuchen und geometrische Uberlegungen anstellen. Jedoch lassen sich f¨ ur die Teilgebiete der Mathematik stets Charakteristika finden, die uns Aufschluss u ¨ber ihr Wesen geben. Wir wollen daher die obige Aufz¨ahlung der Kerninhalte der Analysis etwas genauer beleuchten.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_1
4
1 Worum geht es in der Analysis?
Der Grenzwertbegriff kann als der zentrale in der Analysis angesehen werden. Er erm¨oglicht es uns davon zu reden, dass sich (noch genauer zu bestimmende) Dinge beliebig an etwas — n¨amlich den Grenzwert — ann¨ ahern. Damit k¨ onnen wir dann Sachverhalte aus der N¨ ahe betrachten, was f¨ ur genaue Untersuchungen schon sprichw¨ortlich eine gute Idee ist. Dies kommt auch bei der Untersuchung der Stetigkeit zum Tragen, welche uns Aussagen u unge bei einer betrachteten Funktion liefert. Der praktische ¨ber Spr¨ Nutzen hier liegt z. B. in der Untersuchung einer Funktion, die den Temperaturverlauf in einem Raum zeigt. Ohne (eigentlich undenkbare) Ph¨ anomene scheint es vern¨ unftig davon auszugehen, dass die Temperatur nicht innerhalb eines kurzen Augenblicks um einige hundert Grad steigt, also einen Sprung macht. Wir k¨ onnen also erwarten, dass die beschreibende Funktion — im Wortsinn — einen stetigen Verlauf hat. Beim Differenzieren geht es in der Hauptsache um die Berechnung der Ablei¨ tung einer Funktion. Uber die Ableitung, die mit der Steigung assoziiert ist, lassen sich dann h¨aufig wieder interessante R¨ uckschl¨ usse auf die Funktion selbst ziehen. Dies klingt eventuell befremdlich, denn wozu sollten wir eine bekannte Funktion ableiten, um dann wiederum etwas u ¨ber die Funktion zu erfahren? Zum einen werden wir sehen, dass die Ableitung uns schnell n¨ utzliche Informationen liefert, die sonst m¨ uhsam erarbeitet werden m¨ ussten, aber noch bemerkenswerter ist: Die Natur gibt Informationen u ¨ber sich selbst, also u ¨ber die Sie beschreibenden Funktionen, oft nur u ¨ber die Ableitungen dieser Funktionen preis! Und daraus haben wir dann die eigentliche Funktion zu (re)konstruieren, also das uns interessierende Verhalten der Natur, oder auch eines technischen Vorganges. Schließlich kommen wir dann zur Integralrechnung, durch die wir u. a. Fl¨ achen bestimmen k¨onnen. Auch dies hat großen Wert f¨ ur die Praxis. Zeichnen wir n¨ amlich die Geschwindigkeit eines Fahrrades als Funktionsgraph u ¨ber der Zeitachse auf, so entspricht die Fl¨ache unter diesem Graphen — zwischen zwei Zeitpunkten auf der Zeitachse — gerade der Strecke, welche wir auf dem Fahrrad von einem Zeitpunkt zum anderen zur¨ uckgelegt haben. Endlich gelangen wir dann zum so genannten Hauptsatz der Differenzial- und Integralrechnung. Dieser manifestiert, dass Integrale u ¨ber so genannte Stammfunktionen berechnet werden k¨onnen. Was an dieser Stelle wie Kl¨ ange aus der Ferne erscheint, verkn¨ upft die Differenzial- mit der Integralrechnung auf wunderbare Weise. Es gibt noch mehr Interessantes aus der und u ¨ber die Analysis zu berichten, dazu aber mehr in den einzelnen Kapiteln.
2 Ein wenig Vorbereitung
2.1
Motivation
Die Mathematik mit ihrer Symbolik, die am Anfang recht abstrakt erscheinen mag, kann als Sprache aufgefasst werden, mit deren Hilfe Aussagen, Definitionen und andere wichtige und sch¨one Dinge formuliert werden k¨ onnen. Allerdings m¨ ussen wir zuerst die grundlegenden Sprachkenntnisse (Grammatik, Vokabeln etc.) erwerben, bevor wir uns unterhalten k¨ onnen. Am Anfang ist es auch schon gut, einer Unterhaltung folgen zu k¨ onnen, wie sie dieses Lehrbuch bietet. Diese Vorbereitung liefert eine kurze Zusammenfassung wichtiger Begriffe und Sachverhalte, deren Kenntnis in den nachfolgenden Kapiteln vorausgesetzt wird. Wir ahnen, dass auf dem Weg von der Schule zur Uni, der tats¨ achlich bei einigen lang war, einige Dinge verloren gegangen sind. Wir werden diese gemeinsam mit Ihnen wiederfinden, Bekanntes neu betrachten und auch Neues entdecken. Teils werden wir intuitiv beginnen, dann aber stets zum Exakten kommen.
2.2
Ein Vorrat an Buchstaben
Der Satz von Pythagoras wird oft auf die bloße Formel a2 + b2 = c2 reduziert. Die Bedeutung von a, b und c als die Seitenl¨angen eines rechtwinkligen Dreiecks wird dabei unterschlagen. Der Wiedererkennungseffekt beruht zu einem großen Teil auf der steten Verwendung der gleichen Symbole f¨ ur die Seitenl¨ angen. So w¨ urden nur Wenige f 2 + x2 = n2 als den Satz von Pythagoras identifizieren. Andere mathematische Formulierungen bestehen aus sehr viel mehr Gr¨ oßen, seien es Variablen, Konstanten, Mengen, Elemente verschiedener Mengen oder Funktionen. Um diese besser auseinander halten und somit eine Formel schneller verstehen zu k¨ onnen, haben sich gewisse — nicht immer, aber oft eingehaltene — Konventionen ergeben. So werden beispielsweise die Buchstaben i, j, k, l, m, n gerne f¨ ur nat¨ urliche Zahlen verwendet, a,b, c, d f¨ ur reelle Zahlen und f , © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_2
6
2 Ein wenig Vorbereitung
g, h f¨ ur Funktionen. Nat¨ urlich ist der Vorrat an lateinischen Zeichen dadurch schnell ersch¨opft und es wird oft auf das griechische Alphabet zur¨ uckgegriffen. Dies ist Grund genug, um die griechischen Buchstaben einmal vorzustellen. In folgender Tabelle sind die griechischen Klein- und Großbuchstaben aufgef¨ uhrt. Bei einigen Buchstaben wie dem rho sind sogar zwei Kleinbuchstaben notiert, die in etwa einer Druck- und Schreibschriftvariante entsprechen. alpha beta gamma delta epsilon zeta eta theta
α β γ δ , ε ζ η θ, ϑ
A B Γ Δ E Z H Θ
iota kappa lambda my ny xi omikron pi
ι κ λ μ ν ξ o π
I K Λ M N Ξ O Π
rho sigma tau ypsilon phi chi psi omega
ρ, σ, ς τ υ φ, ϕ χ ψ ω
P Σ T Υ Φ X Ψ Ω
Wir werden in diesem Buch nicht alle griechischen Buchstaben verwenden und verlangen auch nicht, sie und ihre Verwendung in mathematischen Formeln auswendig zu lernen. Letzteres ergibt sich vielmehr beim Verstehen und Anwenden der Mathematik von selbst. Außerdem ist es angenehm, Formeln vorlesen zu k¨onnen, wozu nat¨ urlich die Namen der Symbole ben¨ otigt werden. Hin und wieder werden auch viele, sehr ¨ahnliche mathematische Objekte auf ¨ einmal verwendet. In solchen F¨allen wird die Ahnlichkeit durch die Verwendung gleicher Buchstaben, die allerdings in verschiedenen Ausf¨ uhrungen vorkommen, ausgedr¨ uckt. So k¨onnten beispielsweise a, a ˜, a ˆ drei reelle Zahlen bezeichnen. Ist bei den Objekten eine Reihenfolge wichtig, werden Indizes verwendet:
a 1 , a2 , a3 , . . . , an ,
wobei n eine nat¨ urliche Zahl sein soll. Letztere Schreibweise wird uns in diesem Buch sehr h¨ aufig begegnen und die Anzahl der Objekte bzw. den letzten Index n werden wir nicht weiter konkretisieren, damit die Formeln und Aussagen allgemein bleiben. Um sp¨ atere Missverst¨andnisse zu vermeiden, sei allerdings erw¨ ahnt, was mit obiger Aufz¨ahlung bei z. B. n = 2 gemeint ist: n¨amlich a1 , a2 und nicht etwa a1 , a2 , a3 , a2 . Bei n = 1 besteht die Aufz¨ahlung lediglich aus dem ersten Element a1 und bei n = 0 aus gar keinem — auch das kommt in Spezialf¨ allen vor.
2.3 Vom richtigen Umgang mit der Aussagenlogik
2.3
7
Vom richtigen Umgang mit der Aussagenlogik
Im Alltag ist es u upfen. Teils ¨blich und wichtig, Aussagen miteinander zu verkn¨ sind die Folgerungen aus bestimmten Aussagen allerdings fragw¨ urdig (Werbung und Politik gelten als gute Beispielgeber). In der Mathematik darf uns das nicht passieren! Aussagen m¨ ussen ordentlich und eindeutig verkn¨ upft werden und wenn eine Aussage aus einer anderen folgt oder zwei Aussagen gar ¨ aquivalent sind, muss dies auch wirklich bewiesen werden. Als strenges Hilfsmittel zur Formulierung soll daher alles auf den Regeln der Aussagenlogik basieren. In dieser werden Aussagen verkn¨ upft und im Folgenden halten wir uns an die hier eingef¨ uhrte Strenge. Eine Aussage ist dabei ein Satz in umgangssprachlicher oder mathematischer Formulierung, der einen Sachverhalt beschreibt, dem als Wahrheitswert stets 1“ (wahr) oder 0“ (falsch) zugeordnet werden kann. Eine Aussage kann dabei ” ” stets nur einen Wahrheitswert annehmen, der allerdings außerhalb der Mathematik vom Betrachter abh¨angen kann. Mathematik macht Spaß! ist ein Beispiel. (Wir bitten den Leser aber an dieser Stelle, die 1“ zu z¨ ucken. ” Danke!) Wenn wir in Zukunft ein und“ zwischen zwei Aussagen verwenden — als Zei” chen ∧ — so ist unsere Grundlage die folgende Wahrheitstabelle, in der A1 und A2 Aussagen sind. Die letzte Spalte gibt dann den Wahrheitswert der verkn¨ upften Aussage A1 und A2“ an: ” A1 wahr wahr falsch falsch
A2 wahr falsch wahr falsch
A1 und A2 wahr falsch falsch falsch
Oder“ — als Symbol ∨ — hat folgende Werte: ” A1 wahr wahr falsch falsch
A2 wahr falsch wahr falsch
A1 oder A2 wahr wahr wahr falsch
8
2 Ein wenig Vorbereitung
Die Implikation“ (→) gen¨ ugt der Tabelle: ” A1 wahr wahr falsch falsch
A2 wahr falsch wahr falsch
A1 impliziert A2 wahr falsch wahr wahr
F¨ ur die Implikation verwenden wir auch das Synonym es folgt“ und das Sym” bol ⇒, sofern nicht reine mathematische Logik betrieben wird. ¨ Ferner gibt es auch die Aquivalenz“ (↔ bzw. ⇔): ” A1 wahr wahr falsch falsch
A2 wahr falsch wahr falsch
A1 ¨aquivalent A2 wahr falsch falsch wahr
Als letztes Symbol f¨ uhren wir die Negation“ (¬) ein, die den Wahrheitswert ” einer Aussage einfach in das Gegenteil ¨andert: A wahr falsch
nicht A falsch wahr
Wir m¨ochten noch etwas zur Implikation bemerken, was insbesondere bei der Beweisf¨ uhrung n¨ utzlich ist, und machen uns zuerst klar, dass folgende Aussage gilt, wie wir anhand der Wahrheitstabellen leicht u ufen k¨ onnen (bitte ¨berpr¨ machen Sie das auch!): (A1 → A2 )
↔
(¬A2 → ¬A1 ) .
Warum hilft dies beim F¨ uhren von Beweisen? Weil wir nun wissen, wie ein Widerspruchsbeweis gemacht wird. Denn anstatt Aus A1 folgt A2“ l¨ asst sich ”¨ das Gleiche ist, auch Aus ¬A2 folgt ¬A1“ zeigen, was wegen der Aquivalenz ” aber manchmal einfacher, sofern es den Beweis betrifft. Wir werden davon sp¨ater Gebrauch machen. Ferner wird die Implikation oft (aus Versehen, aus Faulheit oder mutwillig) ¨ mit der Aquivalenz verwechselt. So haben Sie in der Schule eventuell Folgendes gesehen, was wir hier in zwei Varianten pr¨asentieren:
9
2.3 Vom richtigen Umgang mit der Aussagenlogik
i) x = 1
⇒
x2 = 1,
ii) x = 1
⇔
x2 = 1.
Was ist richtig? Nat¨ urlich nur i), denn x2 = 1 wird auch von x = −1 erf¨ ullt. Wie Sie sehen, haben wir hier ⇒“ und ⇔“ verwendet, was f¨ ur den mathematischen ” ” Hausgebrauch u ¨blich ist. (Der Logiker bevorzugt →“ und ↔“.) ” ” ¨ Das Verh¨altnis zwischen Implikation und Aquivalenz wird vielmehr durch folgende Aussage beschrieben, die wir im Aufgabenteil beweisen werden: ((A1 → A2 ) ∧ (A2 → A1 ))
↔
(A1 ↔ A2 ) .
Zum Abschluss wollen wir noch ein kleines logisches R¨ atsel l¨ osen, das wir wesentlich von R. Smullyan u ¨bernommen haben (Logik-Ritter und andere Schurken; ein Buch, das viel u ¨ber Logik auf unterhaltsame Weise lehrt): Wir stellen uns eine Welt vor, in der ein Mensch entweder stets l¨ ugt oder stets die Wahrheit sagt. In einer kleinen Vorstadt ist ein Mord passiert und Kommissar G. Scheit sucht nun das Haus des Hauptverd¨ achtigen Herrn M. auf. Dieser o¨ffnet und der Kommissar muss nun erst einmal feststellen, ob Herr M. ein L¨ ugner ist oder nicht. Eine direkte Frage Sind Sie ein L¨ ugner?“ w¨ urde in ” jedem Fall die Antwort Nein“ ergeben und nichts n¨ utzen. Doch Kommissar ” Scheit ist erfahren und fragt geradeheraus: Sind Sie und Ihre Frau L¨ ugner?“ ” Herr M. stutzt einen Moment und antwortet: Wir sind beide L¨ ugner.“ Ein ” L¨acheln huscht u ¨ber das Gesicht des Kommissars, denn nun weiß er Bescheid und wird Herrn M. in K¨ urze verhaften. Doch schauen wir uns anhand einer Tabelle genauer an, was aus der Antwort von Herrn M. gefolgert werden kann, wenn kein Kommissar in der N¨ ahe ist, daf¨ ur aber ein Buch u ur die Aussage: Herr M. ¨ber Aussagenlogik. A1 steht f¨ ” ur: Frau M. sagt die Wahrheit.“ Herrn M.s Antsagt die Wahrheit.“ und A2 f¨ ” wort ist die Aussage (¬A1 ∧ ¬A2 ). Wenn Herr M. immer die Wahrheit sagt, muss auch diese Aussage wahr sein, wenn er stets l¨ ugt, ist auch diese Aussage falsch. Somit sind die Aussagen A1 und (¬A1 ∧ ¬A2 ) ¨ aquivalent, d. h. (A1 ↔ (¬A1 ∧ ¬A2 )) ist eine wahre Aussage und dies bekommen wir nur in der dritten Zeile der folgenden Tabelle heraus, nach der Herr M. ein L¨ ugner und seine Frau keine L¨ ugnerin ist: A1 wahr wahr falsch falsch
A2 wahr falsch wahr falsch
¬A1 falsch falsch wahr wahr
¬A2 falsch wahr falsch wahr
¬A1 ∧ ¬A2 falsch falsch falsch wahr
A1 ↔ (¬A1 ∧ ¬A2 ) falsch falsch wahr falsch
10
2.4
2 Ein wenig Vorbereitung
Vollst¨ andige Induktion
Wollen wir die G¨ ultigkeit einer Aussage — beispielsweise einer Formel — f¨ ur alle nat¨ urlichen Zahlen beweisen, so steht uns hierf¨ ur das Verfahren der vollst¨andigen Induktion zur Verf¨ ugung. Dabei betrachten wir die Aussage kurzzeitig f¨ ur jede nat¨ urliche Zahl n ∈ N separat und nennen sie A(n). Bei der Aussage ur alle n ∈ N n ≤ n2 f¨ w¨are beispielsweise A(0): 0 ≤ 02 und A(42): 42 ≤ 422 . Das Prinzip der vollst¨andigen Induktion k¨onnen wir uns durch eine (unendliche) Aneinanderreihung von Dominosteinen veranschaulichen, die wir zu Fall bringen wollen. Jeder Dominostein steht f¨ ur ein A(n). Um alle Steine umzustoßen, m¨ ussen wir den ersten Stein umschubsen und die Steine m¨ ussen nah genug beieinander stehen, sodass jeder Stein durch seinen Vorg¨ anger mit umgerissen wird. ¨ Ubertragen auf den Formalismus mit den Aussagen heißt dies: • Induktionsanfang: Wir m¨ ussen zeigen, dass A(0) gilt (der 1. Stein f¨ allt . . . ) • Induktionsschritt: außerdem, dass f¨ ur jedes n die Implikation (A(n) → A(n+ 1)) gilt (. . . und reißt alle weiteren mit sich um). Im obigen Beispiel h¨atten wir also mit 0 ≤ 02 den Induktionsanfang gezeigt. Der Induktionsschritt ist schon etwas schwieriger: Wir setzen die G¨ ultigkeit von ur ein nicht n¨aher konkretisiertes n voraus — das nennen A(n), also von n ≤ n2 f¨ wir Induktionsvoraussetzung, in der folgenden Rechnung mit IV“ abgek¨ urzt — ” und m¨ ussen daraus die G¨ ultigkeit von A(n+1), also von n+1 ≤ (n+1)2 folgern: (n + 1)2 = n2 + 2n + 1 IV
≥ n + 2n + 1
= (n + 1) + 2n ≥n+1 Beim mit IV gekennzeichneten Rechenschritt haben wir die Induktionsvoraussetzung eingesetzt. Der Induktionsanfang muss nicht unbedingt bei n = 0 liegen. Gilt eine Aussage nur f¨ ur alle n ≥ n0 mit einem festen n0 > 0, so k¨ onnen wir auch mit A(n0 ) beginnen und den Induktionsschritt A(n) ⇒ A(n + 1) f¨ ur alle n ≥ n0 zeigen. Obiges Beispiel k¨onnen wir auch etwas umformulieren zu n < n2 f¨ ur alle n ≥ 2 ,
11
2.5 Mengen
womit der Induktionsanfang dann bei n0 = 2 l¨age. Nach dem, was wir im Kapitel u onnen wir ¨ber Aussagenlogik gelernt haben, k¨ die vollst¨andige Induktion folgendermaßen zusammenfassen: ur alle n ≥ n0 )) (A(n0 ) ∧ (A(n) → A(n + 1) f¨
→
(A(n) f¨ ur alle n ≥ n0 )
Beispiel Wir wollen die Formel 0 + 1 + 2 + . . . + n =
n(n+1) 2
f¨ ur alle n ∈ N beweisen.
Der Induktionsanfang liegt offensichtlich bei n0 = 0. Die linke Seite von A(0) besteht nur aus einem Summanden, n¨amlich 0. Die rechte Seite ergibt ebenfalls 0 · (0 + 1) =0. 2 F¨ uhren wir nun den Induktionsschritt durch. Nehmen wir also an, A(n), also sei wahr f¨ ur eine beliebige, aber feste Zahl n ∈ N. 1 + 2 + . . . + n = n(n+1) 2 Dann folgt f¨ ur die Summe bis n + 1: IV
1 + 2 + . . . + n + (n + 1) = = = = = Das ist aber gerade A(n + 1).
2.5
n(n + 1) + (n + 1) 2 n(n + 1) 2(n + 1) + 2 2 n(n + 1) + 2(n + 1) 2 (n + 2)(n + 1) 2 (n + 1)((n + 1) + 1) 2
Mengen
Die von Georg Cantor (1845 – 1918) begr¨ undete Mengenlehre bildet einen der Grundpfeiler der modernen Mathematik: Ohne sie geht gar nichts. So wird der Begriff Menge“ bereits in der Schule behandelt und z. B. mit nat¨ urlichen oder ” reellen Zahlen gearbeitet. Diese sind dann Elemente der Menge der nat¨ urlichen bzw. reellen Zahlen.
Definition (Menge, Element einer Menge) Eine Menge ist eine Zusammenfassung von bestimmten, wohlunterschiedenen
12
2 Ein wenig Vorbereitung
Objekten unserer Anschauung oder unseres Denkens zu einem Ganzen. Die Objekte heißen Elemente der Menge. Ist ein Objekt x ein Element einer Menge M , so wird daf¨ ur x∈M geschrieben. Ist x kein Element von M , dann x∈ /M . Vielleicht kommt Ihnen jetzt die Frage in den Sinn, warum wir hier auf kryptische Art von Objekten reden und nicht einfach von Zahlen? Der Grund ist, dass es wirklich beliebig ist, welche Objekte wir zu Mengen zusammenfassen. Denn es ist durchaus auch m¨oglich, die Menge der Funktionen mit einer Nullstelle zu untersuchen und diese besteht nun gar nicht aus Zahlen. . . Mengen lassen sich durch explizite Aufz¨ahlung definieren, z. B. M := {1, π, 173} , aber auch durch das Angeben einer bestimmten Eigenschaft E f¨ ur die Elemente der Menge: M := {x | x hat die Eigenschaft E} , was sich folgendermaßen liest: M ist die Menge aller x, f¨ ur die gilt: x hat die ” Eigenschaft E.“ Ein konkreteres Beispiel f¨ ur eine Menge ist G := {x | x ist eine ganze Zahl zwischen −1 und 4} . Das Symbol :=“ deutet immer an, dass es sich um eine Definition handelt. ” Die Eigenschaft x ist eine ganze Zahl zwischen −1 und 4“ liefert die folgenden ” Elemente in expliziter Aufz¨ahlung: G = {0,1,2,3} ; hier ist das reine Gleichheitszeichen gerechtfertigt, denn definiert ist die Menge bereits. Weiterhin ist f¨ ur die Elemente einer Menge a priori keine Reihenfolge ausgezeichnet. So ist beispielsweise {2,10,16} = {10,16,2} . Was bisher gemacht wurde, ist nun wirklich nicht schwer. Dennoch war es gut, einen Blick darauf zu werfen, wie Mengen definiert werden, denn nat¨ urlich geht es auch komplizierter. Wir werden davon Gebrauch machen (m¨ ussen). So beschreibt beispielsweise die Menge R := {(x, y) | 1 ≤ x2 + y 2 ≤ 9; x, y reell} den folgenden Kreisring in der Ebene (links):
13
2.5 Mengen
Wie ist das zu verstehen? Nun, (x, y) bedeutet, dass es sich um ein Zahlenpaar handelt (also jeweils einen Punkt im Koordinatensystem in der Ebene), das wir dann noch genauer beschreiben. Der Ausdruck x2 + y 2 ist gleich einer Zahl r2 , wie wir durch den Satz von Pythagoras wissen (vgl. rechte Skizze). Wenn nun ein r fest gew¨ahlt wurde, z. B. r = 2, so liefert die Gleichung x2 + y 2 = r2 = 4 alle Punkte, die zum Kreis mit dem Radius 2 um den Ursprung geh¨ oren. Da nun 1 ≤ x2 + y 2 ≤ 9 gelten soll, werden also alle Kreise mit Radien von 1 bis 3 durchlaufen. Das ergibt den skizzierten Kreisring. Dabei ist nat¨ urlich bedacht worden, dass x und y reelle Zahlen sind, denn nur so k¨ onnen sie kontinuierlich“ ” alle Werte annehmen.
2.5.1
Ein kleiner Zoo wichtiger Mengen
Welches sind nun die Mengen, die einem bei den Mathematikveranstaltungen st¨ andig begegnen? Hier die wichtigsten: • ∅: Leere Menge. Sie enth¨alt keine Elemente, also ∅ = {}. Auch wenn dies f¨ ur einige absurd erscheinen mag, gerade in ihrer Leere ist sie besonders wertvoll und wird zur Beschreibung verschiedenster Sachverhalte ben¨ otigt. • N: Menge der nat¨ urlichen Zahlen, also N = {0,1,2,3, . . .}. • Z: Menge der ganzen Zahlen, also Z = {. . . , −3, −2, −1,0,1,2,3, . . .}. • Q: Menge der rationalen Zahlen, also derjenigen, die sich als Bruch q ∈ Z darstellen lassen.
p q
mit p,
• R: Menge der reellen Zahlen, also der rationalen und irrationalen. Die irrationalen Zahlen sind die Zahlen, die sich nicht als Bruch (wie √ bei den rationalen Zahlen angegeben) darstellen lassen. Beispiele daf¨ ur sind 2 oder π. • C: Menge der komplexen Zahlen, also aller Zahlen der Form x + iy. Dabei ist i die imagin¨are Einheit (mit der Eigenschaft i2 = −1) und x und y sind reelle Zahlen.
14
2 Ein wenig Vorbereitung
Zusammenh¨angende Teilabschnitte der reellen Zahlen sind Intervalle, auf denen sich ein Großteil der in diesem Buch vorgestellten Analysis abspielt. Von ihnen gibt es folgende Typen, wobei hier stets a ≤ b gilt f¨ ur a, b ∈ R: • offene Intervalle: ]a, b[ := {x ∈ R | a < x < b}, • abgeschlossene Intervalle: [a, b] := {x ∈ R | a ≤ x ≤ b}, • halboffene Intervalle: ]a, b] := {x ∈ R | a < x ≤ b} oder [a, b[ := {x ∈ R | a ≤ x < b}. Zeigt die eckige Klammer zum Element, also [a“ oder b]“, so ist dieses in der ” ” Menge enthalten, im anderen Fall gerade nicht. Gleichg¨ ultig, um welches der drei Intervallarten es sich handelt, nennen wir die Punkte a und b Randpunkte des Intervalls. Wenn der Randpunkt nicht zum Intervall geh¨ ort, kann dieser sogar ±∞ (plus oder minus unendlich) sein und wir haben es mit so genannten uneigentlichen Intervallen zu tun: ] − ∞, b] := {x ∈ R | x ≤ b} ] − ∞, b[ := {x ∈ R | x < b} [a, +∞[ := {x ∈ R | a ≤ x} ]a, +∞[ := {x ∈ R | a < x} ] − ∞, +∞[ := R Anstelle der vom Element weg zeigenden eckigen Klammern werden in der Literatur teils auch zum Element zeigende runde Klammern verwendet. So ist (a, b] = ]a, b] und [a, b) = [a, b[. Es gibt noch viele weitere interessante Mengen, die allerdings an dieser Stelle zu weit f¨ uhren w¨ urden. Zu den nat¨ urlichen Zahlen wollen wir noch bemerken, dass es durchaus Mathematiker gibt, welche die 0 nicht f¨ ur eine nat¨ urliche Zahl halten. Wir sehen das anders und haben daf¨ ur auch die Deutsche IndustrieNorm, DIN 5473, auf unserer Seite!
2.5.2
Wie aus bekannten Mengen neue entstehen
Aus bekannten Mengen k¨onnen durch Vereinigung (∪), Schnitt (∩) und Differenz (\) neue gebildet werden: A ∪ B := {x | x ∈ A oder x ∈ B} , A ∩ B := {x | x ∈ A und x ∈ B} , A\B := {x | x ∈ A und x ∈ / B} .
15
2.5 Mengen
Das hier verwendete oder“ (siehe auch den Abschnitt u ¨ber Aussagenlogik) ” schließt nicht aus, dass x ein Element von beiden Mengen A und B ist! Zur Veranschaulichung dieser Mengenoperationen k¨ onnen wir die so genannten Venn-Diagramme heranziehen (siehe Abbildung). Diese Diagramme stellen jedoch kein logisches Argument dar und d¨ urfen deshalb nicht verwendet werden, um Aussagen u upfungen zu beweisen! ¨ber Mengen oder Mengenverkn¨
Vereinigung A ∪ B
Schnitt A ∩ B
Differenz A\B
Mengen k¨onnen auch in anderen Mengen enthalten sein: Es ist A ⊆ B (gelesen: A ist Teilmenge von B“), wenn aus x ∈ A folgt, dass ” x ∈ B ist. Aus dieser Definition k¨onnen wir sehen, dass jede Menge Teilmenge von sich selbst ist: A ⊆ A. Wir sprechen von einer echten Teilmenge A einer Menge B, wenn A nicht B ist und schreiben dann A ⊂ B. Beispielsweise sind alle Intervalle bis auf ] − ∞, +∞[ echte Teilmengen von R.
Beispiel Seien M1 := {2,10,16}, M2 := {2,10,15,16,21} und M3 := {0,2,4,6, . . .}. Dann gilt beispielsweise M1 ⊂ M2 ,
M1 ⊂ M3
und
M2 M3 .
Weiterhin ist M1 ∩ M2 = M1 ,
M2 \ M3 = {15,21}
und
M1 ∪ M2 = M2 .
16
2 Ein wenig Vorbereitung
Die Notation ist in der Literatur nicht einheitlich. Manchmal steht ⊂ einfach f¨ ur Teilmenge (ohne echt“ sein zu m¨ ussen), und das Symbol bezeichnet ” echte Teilmengen. Vereinigen und schneiden lassen sich nat¨ urlich auch mehr als zwei Mengen. Wie A ∪ B ∪ C gebildet wird, oder gar (A ∪ B ∪ C) ∩ (A ∪ B), sollte allerdings nach den obigen Ausf¨ uhrungen klar sein. Im folgenden Satz formulieren wir einige Rechenregeln f¨ ur Mengenoperationen:
Satz Seien A, B und C Mengen. Dann gilt: A∩B =B∩A
A∪B =B∪A A ∪ (B ∪ C) = (A ∪ B) ∪ C A ∩ (B ∩ C) = (A ∩ B) ∩ C A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
Assoziativit¨ at
Distributivit¨ at
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
A ∩ (A ∪ B) = A
A ∪ (A ∩ B) = A
Adjunktivit¨ at
A∩A=A
A∪A=A C\(A ∪ B) = (C\A) ∩ (C\B) C\(A ∩ B) = (C\A) ∪ (C\B)
Kommutativit¨ at
Idempotenz
Regeln von de Morgan
Wir empfehlen Ihnen, diese Rechenregeln an einigen Beispielen nachzuvollziehen. Beispielhaft werden wir die erste Formel der Adjunktivit¨ at genauer betrachten: Die Gleichheit zweier Mengen beweisen wir, indem wir zeigen, dass jedes Element der ersten Menge auch in der zweiten enthalten ist und jedes Element der zweiten in der ersten. Dann gibt es n¨ amlich kein Element, worin sich die beiden Mengen unterscheiden und folglich sind sie gleich. F¨ ur ein beliebiges x ∈ A ∩ (A ∪ B) gilt x ∈ A ∩ (A ∪ B)
⇒
(x ∈ A) ∧ (x ∈ A ∪ B)
⇒
x∈A,
womit die erste Richtung bewiesen w¨are. F¨ ur ein beliebiges x ∈ A gilt anderer-
17
2.6 Aufgaben
seits x∈A
⇒
(x ∈ A) ∨ ((x ∈ A) ∧ (x ∈ B))
⇒
((x ∈ A) ∨ (x ∈ A)) ∧ ((x ∈ A) ∨ (x ∈ B))
⇒
(x ∈ A) ∧ ((x ∈ A) ∨ (x ∈ B))
⇒
(x ∈ A) ∧ (x ∈ A ∪ B)
⇒
x ∈ A ∩ (A ∪ B)
Wir f¨ uhren eine abk¨ urzende (und praktische) Schreibweise f¨ ur Vereinigungen bzw. Schnitte beliebig vieler Mengen ein: n
Ai := A1 ∪ A2 ∪ . . . ∪ An ;
i=1 n
Ai := A1 ∩ A2 ∩ . . . ∩ An .
i=1
Es kommt auch vor, dass wir aus einem Vorrat von bereits durchnummerierten Mengen A1 , A2 , A3 , . . . einige ausw¨ahlen und diese dann vereinen bzw. schneiden wollen, beispielsweise alle Ak , deren Index k eine Primzahl ist. Um dies zu notieren, f¨ uhren wir die so genannte Indexmenge I ein, welche alle relevanten Indizes enth¨alt — in unserem Beispiel I := {k | k ist eine Primzahl} — und schreiben Ai bzw. Ai . i∈I
i∈I
Wenn Sie misstrauisch sind, ist Ihnen aufgefallen, dass wir im Beispiel mit den Primzahlen sogar unendlich viele Mengen vereint bzw. geschnitten haben, denn es gibt auch unendliche viele Primzahlen. Dies ist nicht nur f¨ ur Vereinigungen und Schnitte von Mengen m¨oglich, sondern auch f¨ ur Summen und Produkte von Zahlen. Im Kapitel u ¨ber Folgen werden wir uns eingehender mit der Unendlichkeit befassen und im Kapitel u ¨ber Reihen werden wir unseren Blick vor allem auf die unendliche Summe richten.
2.6
Aufgaben
1. Beweisen Sie folgende Aussage mithilfe der Wahrheitstabellen: ((A1 → A2 ) ∧ (A2 → A1 )) 2. Vereinfachen Sie den Ausdruck a f¨ ur a > 0.
√ a2 a 3 √ 3 a
↔
(A1 ↔ A2 ) .
18
2 Ein wenig Vorbereitung
3. Beweisen Sie mit vollst¨andiger Induktion die Summenformel 1 2 + 2 2 + 3 2 + . . . + n2 =
n (n + 1)(2n + 1) . 6
4. Schreiben Sie f¨ ur A := {x ∈ R | x > 4}
und
B := {x ∈ R | x ≤ 5}
die Mengen A ∪ B, A ∩ B, A\B und B\A in m¨ oglichst einfacher Form auf. 5. Welche Mengen werden durch folgende Notationen beschrieben?
]k, k + 1[ ,
k∈Z
k∈N\{0}
1 [0, ] , k
∞
{x ∈ R | xk ∈ N}
k=1
Bei der zweiten und dritten Aufgabe handelt es sich bei der Angabe, welche Indizes ber¨ ucksichtigt werden, um alternative Notationen: Die ∞ ∞ Schreibweisen und bedeuten dasselbe, gleichfalls und k=1 k=1 k∈N\{0} . k∈N\{0}
2.7
Lo ¨sungen
1. Wir stellen dazu eine Wahrheitstabelle auf, wobei wir Terme der Aussage abk¨ urzen: L1 := (A1 → A2 ) L2 := (A2 → A1 ) R := (A1 ↔ A2 ) A1 wahr wahr falsch falsch
A2 wahr falsch wahr falsch
L1 wahr falsch wahr wahr
L2 wahr wahr falsch wahr
L1 ∧ L2 wahr falsch falsch wahr
R wahr falsch falsch wahr
Die letzten beiden Spalten zeigen, dass beide Seite unserer Aussage gleich sind. ¨ 2. Zur besseren Ubersicht formen wir die Wurzelterme in die Exponential√ 1 n schreibweise a = a n um: √ 1 a 2 a3 a2 (a3 ) 2 a √ = a 1 3 a a3
19
2.7 L¨ osungen
und l¨osen die Nennerterme durch Vorzeichenwechsel der entsprechenden Exponenten a1n = a−n auf: 1
1
= aa2 (a3 ) 2 a− 3 Sodann k¨onnen wir alle Exponenten in einem zusammenfassen: 1
1
= a1+2+3· 2 − 3 25
=a6 3.
n (n + 1)(2n + 1) . 6 Induktionsanfang: F¨ ur n0 = 1 steht auf der linken Seite 12 und auf der rechten 1 (1 + 1)(2 · 1 + 1) = 1 . 6 Beide Seiten stimmen u ¨berein. Induktionsschritt: Wir nehmen an, A(n), also 12 + 22 + 32 + . . . + n2 = n ur eine beliebige, aber feste Zahl n ∈ N\{0}. 6 (n + 1)(2n + 1) sei wahr f¨ Dann m¨ ussen wir f¨ ur die Summe bis n + 1 zeigen: IV n 12 + 22 + 32 + . . . + n2 + (n + 1)2 = (n + 1)(2n + 1) + (n + 1)2 6 .. . n+1 = ((n + 1) + 1)(2(n + 1) + 1) 6 Dies direkt durch Umformen des ersten in den letzten Term zu zeigen, ist nicht einfach. Doch da wir genau wissen, wo wir hin wollen, k¨ onnen wir auch von beiden Seiten zu rechnen beginnen und uns in der Mitte treffen: n n 2 (n + 1)(2n + 1) + (n + 1)2 = 2n + 3n + 1 + n2 + 2n + 1 6 6 2 3 3 2 1 = n + n + n + n2 + 2n + 1 6 6 6 2 3 9 2 13 = n + n + n+1 6 6 6 12 + 22 + 32 + . . . + n2 =
Von der anderen Seite gerechnet, ergibt: n+1 n+1 2 ((n + 1) + 1)(2(n + 1) + 1) = 2n + 7n + 6 6 6 1 3 2n + 9n2 + 13n + 6 = 6 Offensichtlich sind beide Ausdr¨ ucke gleich. Damit haben wir aus A(n) auch A(n + 1) gefolgert.
20
2 Ein wenig Vorbereitung
4. A ∪ B = {x ∈ R | x > 4 oder x ≤ 5} = {x ∈ R} = R A ∩ B = {x ∈ R | x > 4 und x ≤ 5} = {x ∈ R | 4 < x ≤ 5} = ]4,5] A\B = {x ∈ R | x > 4 und x > 5} = {x ∈ R | x > 5} = ]5, ∞[ B\A = {x ∈ R | x ≤ 5 und x ≤ 4} = {x ∈ R | x ≤ 4} = ] − ∞,4] Wir h¨atten auch gleich A = ]4, ∞[ und B = ] − ∞,5] als Intervalle schreiben und damit weiterrechnen k¨onnen. In obiger Notation k¨ onnen die Zwischenschritte aber besser aufgeschrieben werden. 5. Als Hilfe schreiben wir die Mengen teilweise aus: ]k, k + 1[ = . . . ∪ ] − 2, −1[ ∪ ] − 1,0[ ∪ ]0,1[ ∪ ]1,2[ . . . = R\Z k∈Z
k∈N\{0}
1 1 1 1 1 [0, ] = [0, ] ∩ [0, ] ∩ [0, ] ∩ [0, ] ∩ . . . = {0} k 1 2 3 4
Nur 0 ist Element jeder dieser Mengen. Jede andere positive Zahl wird irgendwann durch eine obere Intervallgrenze unterschritten und ist demnach nicht in diesem Intervall und somit auch nicht im Schnitt. Bei der letzten Menge sind die einzelnen Teile schon komplizierter. F¨ ur k = 1 haben wir noch {x ∈ R | x ∈ N} = N, f¨ ur k = 2 aber schon
0 1 2 3 4 {x ∈ R | 2x ∈ N} = , , , , ,... 2 2 2 2 2 und f¨ ur k = 3: {x ∈ R | 3x ∈ N} = 03 , 13 , 23 , 33 , 43 , . . . . Insgesamt durchlaufen wir damit s¨amtliche positiven Br¨ uche (und die 0) und erhalten somit als Vereinigung die Menge der nicht negativen rationalen Zahlen: ∞ k=1
{x ∈ R | xk ∈ N} = Q≥0 .
2.7 L¨ osungen
21
Fragen ¨ • Was ist der Unterschied zwischen Implikation und Aquivalenz? • Wie lauten die Wahrheitstabellen f¨ ur oder“ und und“? ” ” • Formulieren Sie das Prinzip der vollst¨andigen Induktion und erkl¨ aren Sie dies an einem Beispiel. • Definieren Sie den Begriff der Menge. • Nennen Sie Mengen, die f¨ ur die Analysis wichtig sind. • Definieren Sie den Schnitt von zwei Mengen.
3 Reelle und komplexe Zahlen
3.1
Motivation
Der Bedarf nach reellen — und sp¨ater komplexen — Zahlen wird in der Analysis oft damit begr¨ undet, bestimmte Arten von Gleichungen l¨ osen zu k¨ onnen, die zuvor nicht l¨osbar waren. So hat die Gleichung x2 = 2 unter den rationalen √ Zahlen Q keine L¨osung, unter den reellen Zahlen aber die L¨ osungen x = ± 2. Die Gleichung x2 = −2 wiederum ist nicht einmal in den reellen Zahlen l¨ osbar. Hierf¨ ur brauchen wir die komplexen Zahlen. Wir werden in diesem Kapitel nur einige ausgesuchte Aspekte der reellen Zahlen vorstellen, da Grunds¨atzliches bekannt sein sollte.
3.2
Reelle Zahlen
Die reellen Zahlen R stellen eine Vervollst¨andigung der rationalen Zahlen Q dar. W¨ahrend wir rationale Zahlen stets als Bruch ganzer Zahlen schreiben k¨ onnen, ist dies bei den nicht rationalen reellen Zahlen, also solche aus R\Q, den so genannten irrationalen Zahlen, nicht mehr m¨ oglich.
Beispiel √ 2 ist eine irrationale Zahl: √ Angenommen, 2 w¨are eine rationale Zahl. Dann ist sie als Bruch pq teilerfrem 2 der, ganzer Zahlen p, q ∈ Z darstellbar. Somit w¨ are 2 = pq , bzw. 2q 2 = p2 . © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_3
24
3 Reelle und komplexe Zahlen
Die letzte Gleichung besagt einerseits, dass p2 und damit auch p gerade Zahlen sind. Wenn p durch 2 teilbar ist, muss p2 durch 4 teilbar sein. Wiederum nach letzter Gleichung folgt dann, dass auch q durch 2 teilbar ist. Also sind p und q durch 2 teilbar und damit nicht teilerfremd, wie vorausgesetzt. Wir erhalten einen Widerspruch aus unserer Annahme. So wie nat¨ urliche, ganze und rationale Zahlen, k¨ onnen auch reelle Zahlen durch < und > geordnet werden. Zwischen je zwei irrationalen Zahlen lassen sich sowohl rationale als auch weitere irrationale Zahlen finden. Zwischen je zwei rationalen Zahlen ebenfalls.
3.2.1
Rechnen mit Ungleichungen
Obwohl den meisten das Umformen von Gleichungen in der Schule bereits ins Blut u ¨bergegangen ist, haben nicht wenige unserer Erfahrung nach Schwierigkeiten, wenn es um Ungleichungen geht. Grund genug, hier nochmal auf die wesentlichen Punkte einzugehen. Zun¨achst einmal ist der Name Ungleichung“ ” etwas ungl¨ ucklich, denn wir werden es selten mit einem = als vielmehr mit , ≤ und ≥ zu tun bekommen und bei den letzten beiden Symbolen ist sogar die Gleichheit m¨oglich. Das Umformen von Gleichungen funktioniert bei genauer Betrachtung nach dem Prinzip, dass auf beiden Seiten der Gleichung die gleiche Operation ausgef¨ uhrt wird. Wenn es sich vorher auf der linken wie der rechten Seite um die gleiche Zahl gehandelt hat, k¨onnen sie durch die Umformung nicht verschieden werden. Selbst eine Umformung wie das x auf die andere Seite bringen“ ” bedeutet, dass auf beiden Seiten x subtrahiert wird oder beide Seiten durch x geteilt werden. Die beiden Seiten von Ungleichungen hingegen sind nicht unbedingt gleich, sodass wir bei Anwendung der gleichen Operationen dar¨ uber nachdenken m¨ ussen, welchen Einfluss dies auf das Ungleichungssymbol hat. In Zweifelsf¨ allen hilft es manchmal, die beiden Seiten durch einfache Zahlen zu ersetzen, die demselben Ungleichungssymbol gen¨ ugen, und die Operation darauf anzuwenden. Wichtig dabei ist, verschiedene Varianten von Vorzeichen auszuprobieren.
Beispiel Eine der wichtigsten Ungleichungen ist die so genannte Dreiecksungleichung ||a| − |b|| ≤ |a + b| ≤ |a| + |b| . Wir werden den linken Teil n¨aher untersuchen, um sie besser zu verstehen: Zun¨achst quadrieren wir beide Seiten. Wegen der a age stehen links ¨ußeren Betr¨
25
3.2 Reelle Zahlen
und rechts nicht-negative Zahlen. F¨ ur solche bleibt das Ungleichungszeichen beim Quadrieren bestehen (Beispiel: 1 ≤ 2 und 12 ≤ 22 ). ||a| − |b||2 ≤ |a + b|2 . Beide Seiten k¨onnen wir separat vereinfachen: ||a| − |b||2 = (|a| − |b|)2 = |a|2 − 2|a||b| + |b|2 = a2 − 2|ab| + b2 bzw. |a + b|2 = (a + b)2 = a2 + 2ab + b2 . Demnach bleibt a2 − 2|ab| + b2 ≤ a2 + 2ab + b2 . Nun k¨ urzen wir auf beiden Seiten a2 und b2 , was nichts anderes bedeutet, als dass wir von beiden Seiten jeweils a2 + b2 subtrahieren. Auch diese Umformung ver¨andert das Ungleichungszeichen nicht. Es bleibt −2|ab| ≤ 2ab und nach Division durch 2 nur noch −|ab| ≤ ab . Die letzte Ungleichung k¨onnen wir sehr leicht einsehen: Ist ab > 0, steht links eine negative Zahl und rechts eine positive; ist ab = 0, so auch −|ab| und es gilt Gleichheit; f¨ ur ab < 0 ist schließlich −|ab| = ab, denn der Betrag ¨ andert das Vorzeichen und das Minuszeichen nochmals. Haben wir damit den linken Teil der Dreiecksungleichung, also ||a|−|b|| ≤ |a+b|, bewiesen? Nein, denn unser Argumentationsweg ging in die entgegengesetzte Richtung! Wir haben gezeigt, dass ||a| − |b|| ≤ |a + b|
⇒
||a| − |b||2 ≤ |a + b|2
⇒
a2 − 2|ab| + b2 ≤ a2 + 2ab + b2
⇒
−2|ab| ≤ 2ab
⇒
−|ab| ≤ ab
ist. Gebraucht h¨atten wir allerdings die Implikationen in die andere Richtung. Somit m¨ ussen wir mit −|ab| ≤ ab starten, denn dies haben wir bereits verifiziert. Gl¨ ucklicherweise funktionieren unsere Umformungsschritte auch in umgekehrter Richtung, ohne das Ungleichungszeichen zu ver¨ andern: Wir multiplizieren beide Seiten mit 2, addieren a2 + b2 auf beiden Seiten und ziehen von beiden Seiten — die nicht-negativ sind — die Wurzel: −|ab| ≤ ab
⇒
−2|ab| ≤ 2ab
⇒
a2 − 2|ab| + b2 ≤ a2 + 2ab + b2
⇒
||a| − |b||2 ≤ |a + b|2
⇒
||a| − |b|| ≤ |a + b| .
26
3.3
3 Reelle und komplexe Zahlen
Summen und Produkte
Da wir es in der Analysis h¨aufig mit Summen aus beliebig vielen Summanden zu tun haben werden, f¨ uhren wir daf¨ ur — analog zur Vereinigung und dem Schnitt von Mengen — die Schreibweise n
xk := xm + xm+1 + . . . + xn
k=m
ein, wobei m und n ganze Zahlen sind. Das Analogon f¨ ur Produkte ist n
xk := xm xm+1 . . . xn .
k=m
Die Grenzindizes m und n sind oft nicht n¨aher konkretisiert, die Schreibweise soll aber in jedem Fall m¨oglich — und sinnvoll — sein. Bei m = n besteht der Ausdruck nur aus einem einzigen Term: n
xk =
k=m
m
x k = xm
n
bzw.
k=m
xk =
k=m
m
x k = xm .
k=m
Bei m > n haben wir es mit einer leeren Summe bzw. einem leeren Produkt zu tun: n n xk = 0 bzw. xk = 1 . k=m
k=m
Dies ist eine Verabredung f¨ ur die Benutzung der Schreibweise, deren Motivation bei der Summe von 0·x = 0 (addiere x null mal) bzw. beim Produkt von x0 = 1 (multipliziere x null mal) herr¨ uhrt. Wir werden uns in der Analysis eher auf Summen als auf Produkte st¨ urzen, weshalb wir hier noch einige Rechenregeln f¨ ur Summenzeichen angeben. Wir empfehlen, diese Regeln f¨ ur Summen mit drei Summanden nachzuvollziehen. n k=m n
xk +
n k=m
axk = a
k=m n i=m n k=m
n
yk =
(xk + yk )
k=m
n
xk
k=m
xi ·
l
yj =
j=k
xk =
l k=m
n l
x i yj =
i=m j=k
xk +
n k=l+1
n l
x i yj
j=k i=m
xk , f¨ ur m ≤ l ≤ n .
27
3.3 Summen und Produkte
Da es, wie in der dritten Rechenregel aufgef¨ uhrt, bei der Multiplikation von Summen nicht auf die Reihenfolge ankommt, hat sich in der Literatur auch die folgende Schreibweise eingeschlichen:
xi yj :=
i = m, . . . , n
n l
x i yj =
i=m j=k
l n
x i yj .
j=k i=m
j = k, . . . , l
Beispiel Die geometrische Summe ist definiert als Sn (x) :=
n
x k = 1 + x + x2 + . . . + x n .
k=0
andiger Induktion Es ist (1 − x)Sn (x) = 1 − xn+1 — was wir gleich mit vollst¨ beweisen wollen — und folglich erhalten wir f¨ ur x = 1 die Summenformel Sn (x) =
1 − xn+1 . 1−x
Nun zur vollst¨andigen Induktion: Die Aussagen A(n): (1 − x)Sn (x) = 1 − xn+1 sollen f¨ ur alle n ∈ N bewiesen werden. Zun¨ achst betrachten wir den Induktionsanfang A(0): (1 − x)S0 (x) = 1 − x0+1 . Dieser ist wegen S0 (x) = x0 = 1 erf¨ ullt. F¨ ur den Induktionsschritt sei n beliebig, aber fest und wir setzen A(n), also (1 − x)Sn (x) = 1 − xn+1 voraus. Hier kommt die Schlussfolgerung auf A(n + 1): (1 − x)Sn+1 (x) = (1 − x) Sn (x) + xn+1 = (1 − x)Sn (x) + (1 − x)xn+1 = (1 − x)Sn (x) + xn+1 − xn+2 IV
= 1 − xn+1 + xn+1 − xn+2
= 1 − xn+2 = 1 − x(n+1)+1 Damit haben wir die Formel (1 − x)Sn (x) = 1 − xn+1 f¨ ur alle n ∈ N gezeigt.
3.3.1
Fakult¨ at und Binomialkoeffizient
Ein Produkt, welches uns doch hin und wieder u ¨ber den Weg laufen wird, ist n k, weshalb wir hier noch eine weitere, sehr gebr¨ auchliche Schreibweise k=1 einf¨ uhren: die Fakult¨at.
28
3 Reelle und komplexe Zahlen
Definition
(Fakult¨at)
n! :=
n
k = 1 · 2...n
f¨ ur n ∈ N, n > 0,
k=1
0! := 1 Ein Anwendungsbeispiel der Fakult¨at ist der Binomialkoeffizient.
Definition
(Binomialkoeffizient) n n! := k k!(n − k)!
f¨ ur n, k ∈ N, n ≥ k.
gelesen: n u ¨ber k“. ”
Dieser gibt die Anzahl ahlen. der M¨oglichkeiten an, k Zahlen aus n auszuw¨ die ber¨ u chtigten 13 983 816, die M¨ o glichkeiten, beim Beispielsweise ergibt 49 6 Lotto sechs aus 49 auszuw¨ahlen. Das Pascalsche Dreieck gibt uns eine M¨oglichkeit, Binomialkoeffizienten ohne Fakult¨aten zu berechnen. Jede Zeile beginnt und endet mit 1 und jeder weitere Eintrag ergibt sich als Summe der beiden schr¨ ag dar¨ uber stehenden Zahlen. Der Binomialkoeffizient nk ist nun der (k + 1)te Eintrag in der (n + 1)ten Zeile. n=0 1 n=1 1 1 n=2 1 2 1 n=3 1 3 3 1 n=4 1 4 6 4 1 .. .. . .
Beispiel Die binomische Formel (a+b)2 = a2 +2ab+b2 hat nicht nur den Namensanfang mit dem Binomialkoeffizienten gemeinsam. Ein Blick auf das Pascalsche Dreieck verr¨at, dass dort in Zeile n = 2 die Koeffizienten stehen: n=2
1
2
1
,
1 · a2 + 2 · ab + 1 · b2 .
Und das ist kein Zufall, denn folgende Formel, der Binomische Satz , stellt eine
29
3.4 Komplexe Zahlen
Verallgemeinerung obiger Formel auch f¨ ur h¨ohere Exponenten dar: n n n−k k n a b . (a + b) = k k=0
Wir testen die Verallgemeinerung f¨ ur n = 2: 2 2 2−k k (a + b)2 = b a k k=0 2 2−1 1 2 2−2 2 2 2−0 0 a b + a b a b + = 1 2 0 2 2 0 2 1 1 2 0 2 a b + a b + a b = 0 1 2 = 1 · a2 · 1 + 2 · a · b + 1 · 1 · b 2 = a2 + 2ab + b2 . F¨ ur negative b ergibt sich automatisch die zweite bimonische Formel (a − b)2 = a2 − 2ab + b2 .
3.4
Komplexe Zahlen
Das Quadrat einer reellen Zahl ist nicht negativ. Um beispielsweise die Gleichung x2 = −1 zu l¨osen, brauchen wir eine Erweiterung der reellen Zahlen: die komplexen Zahlen C. Als komplexe Zahlen bezeichnen wir Zahlen der Form a + bi mit a, b ∈ R. Die Gr¨oße i ist dabei durch die Gleichung i2 = −1 charakterisiert. Wir nennen a den Realteil und b den Imagin¨arteil von z := a + bi und schreiben daf¨ ur kurz Re z := a
und
Im z := b .
Real- und Imagin¨ arteil sind somit reelle Zahlen, was beim Imagin¨ arteil gerne vergessen wird. Nur durch Hinzunahme von i u ¨berschreiten wir die Grenzen der reellen Zahlen. Ist b = 0, bleibt nur noch der Realteil u ¨brig: a + 0i = a ∈ R. Die reellen Zahlen sind also in den komplexen enthalten: R ⊂ C. Addition und Subtraktion von komplexen Zahlen funktionieren, wie wir es von reellen Zahlen kennen, nur dass wir das Ergebnis wieder in der Form a + bi schreiben: (a + bi) + (c + di) = (a + c) + (b + d)i (a + bi) − (c + di) = (a − c) + (b − d)i .
30
3 Reelle und komplexe Zahlen
Auch die Multiplikation gehorcht analogen Rechengesetzen wie die der reellen Zahlen (a + bi)(c + di) = (ac − bd) + (ad + bc)i . Dies entspricht dem gew¨ohnlichen Ausmultiplizieren reeller Zahlen, wobei wir lediglich i2 = −1 eingesetzt haben. Hier sehen wir noch die Vorgehensweise bei der Division: a + bi (a + bi)(c − di) ac + bd bc − ad = = 2 + 2 i. c + di (c + di)(c − di) c + d2 c + d2 F¨ ur den Kehrwert einer komplexen Zahl reduziert sich dies zu 1 a − bi a −b = = 2 + 2 i. a + bi (a + bi)(a − bi) a + b2 a + b2 Drehen wir das Vorzeichen des Imagin¨arteils einer komplexen Zahl z um, erhalten wir die so genannte komplex konjugierte Zahl z¯. z = a + bi
⇒
z¯ := a − bi .
Zur Veranschaulichung der komplexen Zahlen stellen wir uns eine Ebene mit zwei sich rechtwinklig schneidenden Koordinatenachsen vor (das Ganze nennen wir Kartesisches Koordinatensystem). Auf die Abzisse (x-Achse) tragen wir die Realteile und auf die Ordinate (y-Achse) die Imagin¨ arteile von komplexen Zahlen ein. Entsprechend nennen wir die Achsen reelle bzw. imagin¨ are Achse. Auf diese Weise erhalten wir f¨ ur jede komplexe Zahl einen Punkt in der Ebene (siehe Bild); der Koordinatenursprung entspricht der Zahl 0+0i, auf der reellen Achse befinden sich die reellen Zahlen a + 0i.
i Im z z = a + bi
bi
Re z
a
−bi
z¯ = a − bi
Als Betrag |z| einer komplexen Zahl z bezeichnen wir den Abstand des Punktes vom Koordinatenursprung. Nach dem Satz von Pythagoras ist dies: |z| := a2 + b2 .
31
3.4 Komplexe Zahlen
F¨ ur reelle Zahlen a gibt uns diese Gleichung auch an, wie der Betrag zu berechnen ist: √ |a| = a2 . Zur Addition zweier komplexer Zahlen zeichnen wir einfach die Strecken vom Koordinatenursprung zu beiden Punkten ein und verschieben eine Strecke an das Ende der anderen. Beide Strecken hintereinander f¨ uhren zum Ergebnispunkt der Addition. Entsprechend ist die Strecke zwischen zwei komplexen Zahlen z1 und z2 eine Verschiebung von z2 − z1 aus dem Ursprung. Der Betrag |z2 − z1 | gibt somit den Abstand von z1 und z2 an. Mit dieser Anschauung k¨onnen wir leicht den zweiten Teil |a + b| ≤ |a| + |b| der Dreiecksungleichung — die u ur komplexe Zahlen gilt — ver¨brigens auch f¨ stehen (siehe Seite 24): Dazu betrachten wir in der komplexen Ebene das Dreieck mit den Eckpunkten 0, a und −b ∈ C. Die Strecke von −b nach a hat die L¨ange |a − (−b)| = |a + b|. Gehen wir einen Umweg von −b u ¨ber 0 nach a, legen wir die L¨ange | − b| = |b| und danach die L¨ ange |a| zur¨ uck, insgesamt also |a| + |b|. Als Umweg ist dies also gr¨oßer als |a + b|. Dies gilt nat¨ urlich auch f¨ ur reelle Zahlen als Teilmenge der komplexen. Die komplexe Konjugation, also der Vorzeichenwechsel des Imagin¨ arteils, entspricht einer Spiegelung an der reellen Achse. Damit ergeben sich bereits anschaulich die ersten beiden der folgenden Rechenregeln f¨ ur die komplexe Konjugation: z¯ = z , z1 + z2 = z1 + z2 , z 1 · z2 = z 1 · z 2 , 1 1 = , z z¯ z z¯ = |z|2 ∈ R Die restlichen Rechenregeln werden wir im folgenden Abschnitt u ¨ber Polarkoordinaten verstehen. Stellen wir die zuletzt aufgef¨ uhrte Formel u ¨brigens nach 1 z um, erhalten wir 1 z¯ = 2 , z |z| was der weiter oben stehenden Formel f¨ ur den Kehrwert entspricht. Eine Eigenschaft, welche bei der Erweiterung der reellen Zahlen zu den komplexen verloren geht, ist die Anordenbarkeit. Bei den reellen Zahlen k¨ onnen wir klar sagen, welche Zahl die gr¨oßere und welche die kleinere ist, und somit mit Ungleichungen arbeiten. Bei komplexen Zahlen — Punkten in der Ebene — ist dies nicht mehr m¨oglich.
32
3.4.1
3 Reelle und komplexe Zahlen
Polarkoordinaten
Komplexe Zahlen lassen sich nicht ausschließlich durch Angabe von Real- und Imagin¨arteil beschreiben. Eine geometrisch interessante Alternative bieten die Polarkoordinaten, bei denen wir uns auf den Abstand vom Koordinatenursprung und auf den Winkel von der positiven reellen Achse konzentrieren.
i Im z z = reiϕ b = r sin ϕ ϕ Re z a = r cos ϕ
So kann jede komplexe Zahl in der Form z = r(cos ϕ + i sin ϕ) dargestellt werden. Diese Darstellung ist f¨ ur r > 0 und ϕ ∈ [0, 2π[ eindeutig und wir k¨onnen auch jede komplexe Zahl bis auf 0 auf diese Weise angeben. (0 k¨ onnen wir nat¨ urlich mit r = 0 realisieren, nur geht uns dabei die Eindeutigkeit der Darstellung verloren.) Mit der Eulerformel eiϕ = cos ϕ + i sin ϕ ist sogar eine k¨ urzere Schreibweise m¨oglich: z = reiϕ . Im Kapitel u ¨ber wichtige Funktionen werden wir Sinus, Kosinus und die Exponentialfunktion ex n¨aher betrachten. Nun werden Sie sich vielleicht fragen, wozu man komplexe Zahlen auf unterschiedliche Arten darstellen sollte. Jede Notation hat ihre Vor- und Nachteile und abh¨angig davon, was gerade betrachtet wird, ist die eine oder die andere Notation hilfreich. Die Multiplikation komplexer Zahlen ist beispielsweise in
33
3.5 Aufgaben
Polarkoordinaten einfacher und auch anschaulicher (wobei wir hier auf Ihre Rechenfertigkeiten aus der Schule vertrauen): z1 · z2 = r1 eiϕ1 · r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) = r1 r2 (cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 )) . Aus dem Ergebnis k¨onnen wir sehen, dass sich die Betr¨ age multiplizieren und die Winkel addieren. Mit der Multiplikation geht auch das Potenzieren schnell: z n = rn (cos(nϕ) + i sin(nϕ)) . Die Addition hingegen ist in Polarkoordinaten ungleich schwieriger, weshalb wir dort, wenn m¨oglich, auf die kartesische Darstellung zur¨ uckgreifen.
Beispiel Wir bestimmen die n-ten Einheitswurzeln, also diejenigen komplexen Zahlen ullen. Zun¨ achst muss der z = r(cos ϕ + i sin ϕ), welche die Gleichung z n = 1 erf¨ Betrag von z eins sein: r = 1. Potenzieren in Polarkoordinaten ergibt: 1 + i · 0 = z n = cos(nϕ) + i sin(nϕ) ⇔
cos(nϕ) = 1 und sin(nϕ) = 0 .
Damit muss nϕ ein Vielfaches von 2π sein. Es gibt also genau n verschiedene L¨osungen der Gleichung z n = 1, die so genannten n-ten Einheitswurzeln cos
2kπ n
+ i sin
2kπ n
, k = 1, . . . n .
Wollen wir die Wurzeln aus einer anderen Zahl w ∈ C berechnen, also die Gleichung z n = w l¨osen, so gen¨ ugt uns in Zukunft eine Wurzel aus z. Durch Multiplikation mit den Einheitswurzeln erhalten wir alle weiteren L¨ osungen, denn beim Potenzieren wird der Einheitswurzelterm zu 1.
3.5
Aufgaben
1. Berechnen Sie
42 √ k=1
k−
√
k−1 .
34
3 Reelle und komplexe Zahlen
2. Betrachten wir das Pascalsche Dreieck, so sehen wir, dass pro Zeile (außer der obersten) die Summe der einzelnen Eintr¨ age, mit wechselndem Vorzeichen versehen, Null ergibt. 1 1 1 1 1
−4
−3
−2
−1 +1 −1
+3 −4
+6 .. .
=0 =0 =0 +1 = 0 .. .
F¨ ur die n-te Zeile mit n > 1 mit den Eintr¨ agen a0 , . . . , an−1 ist dies also n−1
(−1)k ak = 0 .
k=0
Beweisen Sie dies f¨ ur alle Zeilen des Pascalschen Dreiecks außer der ersten. 3. Berechnen Sie folgende Spezialf¨alle binomischer Formeln f¨ ur komplexe Zahlen: (a + bi)2 ,
(a − bi)2 ,
(a + bi)(a − bi) .
4. Beweisen Sie folgende Formeln f¨ ur den Real- und Imagin¨ arteil komplexer Zahlen: z − z¯ z + z¯ , Im z = . Re z = 2 2i 5. Formen Sie folgende komplexe Zahlen in Polarkoordinaten um: 3 + 3i ,
1−i ,
−1 .
Beschreiben Sie den geometrischen Effekt der Multiplikation einer komplexen Zahl mit i. 6. Welche auf beliebige komplexe Zahlen z = a + bi anzuwendende Rechenoperationen entsprechen • der Spiegelung an der reellen Achse, • der Spiegelung an der imagin¨aren Achse, • der Spiegelung am Koordinatenursprung? Bestimmen Sie deren Qua7. Seien a1 , . . . , an die n-ten Einheitswurzeln. n drate a21 , . . . , a2n sowie das Produkt k=1 ak aller ak .
35
3.6 L¨ osungen
3.6
L¨ osungen
¨ 1. Um einen Uberblick zu erhalten, schreiben wir die ersten und letzten Summanden explizit auf:
42 √
k−
√
√ √ √ √ √ √ k − 1 =( 1 − 0) + ( 2 − 1) + ( 3 − 2)+
k=1
√ √ √ √ √ √ . . . + ( 40 − 39) + ( 41 − 40) + ( 42 − 41) .
Dabei f¨allt auf, dass sich jeweils der erste Teil eines Summanden mit dem ¨ zweiten Teil des darauf folgenden Summanden aufhebt. Ubrig bleiben √ lediglich der zweite Teil des ersten Summanden (− 0) und der erste Teil √ des letzten Summanden ( 42):
42 √
k−
√
√ √ √ k − 1 = − 0 + 42 = 42 .
k=1
(Diese Arten von Summen, bei denen sich aufeinander folgende Summanden teilweise oder auch ganz aufheben, werden aus verst¨ andlichen Gr¨ unden Teleskopsummen genannt.)
2. Jede Zeile des Dreiecks (außer der ersten) berechnet sich vollst¨ andig aus der vorherigen. Wir betrachten die Berechnung der (n + 1)-ten Zeile mit age wir mit a0 bis den Werten b0 bis bn aus der n-ten Zeile, deren Eintr¨ an−1 bezeichnen. Die bk ergeben sich im Pascalschen Dreieck aus den ak wie folgt:
b0 := a0 ,
bn := an−1 ,
bk := ak−1 + ak f¨ ur k = 1, . . . , n − 1 .
36
3 Reelle und komplexe Zahlen
Damit gilt n
(−1)k bk = b0 +
k=0
n−1
(−1)k bk + (−1)n bn
k=1
= a0 +
n−1
(−1)k (ak−1 + ak ) + (−1)n an−1
k=1
= a0 +
n−1
k
(−1) ak +
k=1
=
n−1
(−1)k ak +
k=0
=
=
n−1
(−1)k ak−1 + (−1)n an−1
k=1 n
(−1)k ak−1
k=1
(−1)k ak +
n−1
k=0
k=0
n−1
n−1
k=0
n−1
(−1)k ak −
(−1)k+1 ak (−1)k ak
k=0
=0 Wir h¨atten dies auch mit vollst¨andiger Induktion zeigen k¨ onnen. Allerdings ist dies ein wenig komplizierter, weshalb wir die obige Methode gew¨ahlt haben. 3. (a + bi)2 = a2 + b2 i2 + 2abi = a2 − b2 + 2abi , (a − bi)2 = a2 + b2 i2 − 2abi = a2 − b2 − 2abi , (a + bi)(a − bi) = a2 − b2 i2 = a2 + b2 . 4. Als komplexe Zahl kann z in der Form z = a+bi und z¯ = a−bi geschrieben werden. Damit gilt dann z + z¯ a + bi + a − bi 2a = = = a = Re z 2 2 2 und
a + bi − (a − bi) 2bi z − z¯ = = = b = Im z . 2i 2i 2i
5. F¨ ur die Polarkoordinatenschreibweise m¨ ussen wir L¨ ange und Winkel der Zahl in der komplexen Ebene ermitteln. Die L¨ a nge — oder Betrag — √ einer Zahl z := a + bi ist durch r = a2 + b2 gegeben (Pythagoras). Die Winkel k¨onnen wir leicht ermitteln, indem wir uns die Zahlen in der komplexen Ebene eingezeichnet vorstellen.
37
3.6 L¨ osungen
• 3 + 3i hat einen Betrag von r = 45◦ , also ϕ = π4 . Damit ist
√ √ 32 + 32 = 3 2 und einen Winkel von
√ π 3 + 3i = 3 2 ei 4 . √ • 1 − i hat einen Betrag von r = 12 + (−1)2 = 2 und einen Winkel von −45◦ , also ϕ = − π4 . Damit ist 1−i= • −1 hat einen Betrag von r = 180◦ , also ϕ = π. Damit ist
√
π
2 e−i 4 .
(−1)2 + 02 = 1 und einen Winkel von −1 = eiπ .
Der Winkel ist nat¨ urlich nicht eindeutig, sondern kann sich um additive onlicher Vorliebe Vielfache von 360◦ , also 2π unterscheiden. Je nach pers¨ wird sich ϕ in der Literatur im Bereich [0,2π[ oder auch ] − π, +π] aufhalten. Somit k¨onnten wir auch √ 7π 1 − i = 2 ei 4 schreiben. Die komplexe Zahl i hat einen Betrag von r = 1 und einen Winkel von ϕ = π2 . Multiplizieren wir eine beliebige komplexe Zahl z := reiϕ mit i, so erhalten wir π
π
π
iz = ei 2 reiϕ = rei 2 +iϕ = rei( 2 +ϕ) . Das Ergebnis iz hat damit den gleichen Betrag r wie z, der Winkel ist allerdings um π2 , also 90◦ gr¨oßer. Die Multiplikation einer komplexen Zahl mit i bewirkt also lediglich eine Drehung um 90◦ in mathematisch positiver Richtung. 6. • Die Spiegelung an der reellen Achse entspricht einem Vorzeichenwechsel der Imagin¨arteils, also der komplexen Konjugation: z → z¯ . • Die Spiegelung an der imagin¨aren Achse entspricht einem Vorzeichenwechsel des Realteils: z → −¯ z. • Die Spiegelung am Koordinatenursprung schließlich entspricht einem Vorzeichenwechsel von Real- und Imagin¨ arteil, also von ganz z: z → −z .
38
3 Reelle und komplexe Zahlen
7. Als n-te Einheitswurzeln haben die ak in Polarkoordinaten die Gestalt a k = ei
2kπ n
.
Beim Quadrieren verdoppelt sich lediglich der Winkel, also der Exponent von e. (Die L¨ange w¨ urde sich quadrieren, allerdings haben die ak als Einheitswurzeln ohnehin L¨ange 1.) Damit ist a2k = ei
2·2k·π n
,
also a21 = a2 , a22 = a4 , a23 = a6 , usw., wobei an+k = ak gilt. Das Quadrat einer n-ten Einheitswurzel ist also wieder eine n-te Einheitswurzel. (Diese Aussage l¨asst sich sogar auf beliebige nat¨ urliche Exponenten erweitern.) Bei ungeradem n erwischen wir beim Quadrieren aller ak wiederum alle n Einheitswurzeln. Beispielsweise ist f¨ ur n = 3 a21 = a2 ,
a22 = a1 ,
a23 = a3 .
Bei geradem n erwischen wir nur die ak mit geradem k, diese aber daf¨ ur doppelt. Beispiel f¨ ur n = 4: a21 = a2 ,
a22 = a4 ,
a23 = a2 ,
a24 = a4 .
Das Produkt der ak ist n k=1
ak =
n
ei
2kπ n
= ei
2kπ n
= ei
2 n (n+1)π 2 n
= ei(n+1)π = (−1)n+1 ,
k=1
wobei das Summenzeichen ebenso wie das Produktzeichen von 1 bis n ¨ l¨auft. Der Ubersichtlichkeit halber haben wir die Grenzen dort weggelasn sen. Die Summenformel kennen wir bereits: k=1 k = n2 (n + 1).
3.6 L¨ osungen
39
Fragen • Ist jede rationale Zahl eine reelle? Finden Sie eventuell Gegenbeispiele? • Was besagt die Dreiecksungleichung? K¨onnen Sie die Bedeutung skizzieren? • Definieren Sie das Produkt- und Summenzeichen. • Was ist die geometrische Summe? Bestimmen Sie ihren Wert f¨ ur beliebiges n ∈ N. • Was ist der Binomialkoeffizient und wo kommt er zur Berechnung vor? • Geben Sie Imagin¨ar- und Realteil einer komplexen Zahl z an und skizzieren Sie diese. • Wie lauten die Grundrechenregeln f¨ ur komplexe Zahlen? • Gibt es einen Zusammenhang zwischen reellen und komplexen Zahlen? • Was ist komplexe Konjugation anschaulich? • Geben Sie die Polarkoordinatendarstellung komplexer Zahlen an. • Welche geometrische Bedeutung hat die Multiplikation komplexer Zahlen?
4 Abbildungen und Funktionen
4.1
Motivation und Definitionen
H¨ aufig wird mit Zuordnungsvorschriften zwischen Mengen gearbeitet. Solche Zuordnungen sind oft von zentraler Bedeutung bei der Beschreibung physikalischer Vorg¨ange. So soll beispielsweise von einem fallenden Stein die Zuordnungsvorschrift h zu jedem Zeitpunkt t die H¨ohe h(t) des Steins liefern. In der Mathematik sprechen wir allgemein von Abbildungen:
Definition (Abbildung, Definitionsbereich, Wertebereich) Eine Abbildung f von einer Menge A in eine Menge B — wir schreiben f : A → B — ordnet jedem Element x ∈ A genau ein Element y ∈ B zu. Wir schreiben hierf¨ ur f (x) = y oder f : x → y. A heißt Definitionsbereich, B heißt Wertebereich der Abbildung.
Besteht der Wertebereich aus reellen oder komplexen Zahlen, also B ⊆ R oder B ⊆ C, so sprechen wir auch von einer Funktion (auf A). Beispiele aus der Schule sind f : R → R mit f (x) := x, f (x) := 3x + x2 oder f (x) := sin(πx).
(Bildmenge, Urbildmenge) Definition Seien A und B Mengen und f : A → B eine Abbildung. F¨ ur Teilmengen X ⊆ A und Y ⊆ B definieren wir: f (X) := {f (x) | x ∈ X} ⊆ B , f
−1
(Y ) := {x ∈ A | f (x) ∈ Y } ⊆ A .
f (X) heißt Bildmenge oder Bild von X und f −1 (Y ) heißt Urbildmenge oder Urbild von Y bez¨ uglich f . In folgender Abbildung sind die Begriffe schematisch veranschaulicht. F¨ ur ein © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_4
42
4 Abbildungen und Funktionen
gegebenes y ∈ B nennen wir jedes x ∈ A mit x ∈ f −1 ({y}) einen Urbildpunkt von y.
Bildmenge und Urbildmenge
4.2
Einige Eigenschaften von Abbildungen
Es ist nicht immer so, dass jedes Element des Wertebereichs B einer Abbildung von dieser getroffen“ wird. So kann es durchaus auch Elemente y ∈ B geben, ” die keine Urbildpunkte haben, d. h. f −1 ({y}) = ∅. Geh¨ ort jedoch zu jedem y ∈ B wenigstens ein Urbild, wird der Definitionsbereich auf den gesamten Wertebereich abgebildet und f (A) = B. In diesem Fall sprechen wir von einer surjektiven Abbildung. Eine andere wichtige Eigenschaft, die eine Abbildung haben kann, betrifft ebenfalls die Anzahl der Urbilder. Gibt es f¨ ur jedes y ∈ f (A) nur eines, enth¨ alt also f −1 ({y}) genau ein Element, so sprechen wir von einer injektiven Abbildung. Diesen Sachverhalt k¨onnen wir auch dadurch ausdr¨ ucken, dass keine zwei verschiedenen Elemente des Definitionsbereichs von f auf ein und dasselbe Element abgebildet werden. Gibt es zu jedem Element des Wertebereiches genau einen Urbildpunkt, so ist die Abbildung surjektiv und injektiv. In diesem Fall sprechen wir von einer bijektiven Abbildung.
4.2 Einige Eigenschaften von Abbildungen
43
Wir stellen uns vor, dass f der Vermittler ist, der jeweils durch ein Element x aus A den Auftrag bekommt, einem Element aus B einen Eimer Wasser u ¨ber den Kopf zu gießen. Surjektiv bedeutet dann, dass alle Elemente von B nass sind. Es kann dabei beispielsweise sein, dass ein (armes) b ∈ B drei Eimer u ¨ber den Kopf bekommt. Wichtig ist nur: Alle b sind nass. Injektivit¨ at garantiert, das jedes b aus B h¨ochstens einen Eimer zugewiesen“ bekommt. Es kann aber ” am Ende noch trockene Elemente von B geben, aber keines wurde mehrmals begossen. Bijektiv heißt nun also: Jedes b bekommt genau aus einem Eimer Wasser ab. Wir fassen zusammen:
Definition (surjektiv, injektiv, bijektiv) Sei f : A → B eine Abbildung. f heißt • surjektiv, wenn f (A) = B, • injektiv, wenn f¨ ur alle x, y ∈ A mit x = y gilt: f (x) = f (y), • bijektiv, wenn f injektiv und surjektiv ist. Die Bedingung der Injektivit¨at kann auch so formuliert werden: F¨ ur alle x, y ∈ A mit f (x) = f (y) muss x = y gelten. In der folgenden Abbildung werden die Begriffe veranschaulicht.
44
4 Abbildungen und Funktionen
Der Reihenfolge nach: surjektiv, aber nicht injektiv; injektiv, aber nicht surjektiv; bijektiv
F¨ ur die Eigenschaft einer Abbildung, injektiv oder surjektiv zu sein, ist nicht nur die formale Zuordnungsvorschrift x → f (x) wichtig — Definitions- und Wertebereich sind ebenfalls von entscheidender Bedeutung! Dies wird auch an den folgenden Beispielen deutlich:
Beispiel • Die Funktion f1 : [0,1] → R ,
x → x
ist injektiv, denn f¨ ur alle x, y ∈ [0,1] mit x = y gilt hier offensichtlich f1 (x) = x = y = f1 (y) ist. Es ist allerdings f1 ([0,1]) = [0,1] = R, also ist f1 nicht surjektiv (und damit auch nicht bijektiv). • Die Funktion f2 : [0,1] → [0,1] ,
x → x
ist jedoch surjektiv und damit bijektiv. • Die Funktion f3 : R → R ,
x → x2
ist nicht injektiv, da beispielsweise f3 (2) = 4 = f3 (−2) ist. Sie ist auch nicht surjektiv, da beispielsweise −1 keinen Urbildpunkt hat. Die Abbildung f4 : [0, ∞[ → [0, ∞[ ,
x → x2
ist jedoch bijektiv. Eine wichtige Eigenschaft bijektiver Abbildungen ist, dass zu jedem Element des Wertebereichs ein eindeutig bestimmtes Urbild geh¨ ort. Diese Zuordnungsvorschrift definiert also eine neue Abbildung, die so genannte Umkehrabbildung
45
4.2 Einige Eigenschaften von Abbildungen
oder Inverse. Wie an den vorigen Beispielen ersichtlich wird, k¨ onnen wir jede Abbildung f: A→B durch Einschr¨anken des Wertebereiches auf die Bildmenge des Definitionsbereichs surjektiv machen“: ” f˜: A → f (A) , x → f (x) , sodass wir die Inverse auch f¨ ur injektive Abbildungen sinnvoll konstruieren k¨ onnen.
(Umkehrabbildung, Inverse) Definition Sei f : A → B eine injektive Abbildung. Die Abbildung f −1 : f (A) → A mit f −1 (y) = x
⇔
f (x) = y
f¨ ur alle y ∈ f (A) und x ∈ A heißt Umkehrabbildung oder Inverse von f .
Die Umkehrabbildung ist nicht zu verwechseln mit der Urbildmenge, obwohl dasselbe Formelzeichen verwendet wird! Allerdings gilt nat¨ urlich f¨ ur bijektive Abbildungen f −1 ({y}) = {f −1 (y)} . (Das f −1 auf der linken Seite geh¨ort zur Urbildmenge, das auf der rechten Seite ist die Umkehrfunktion.)
Beispiel Die Umkehrfunktion (wie Umkehrabbildungen von Funktionen auch genannt werden) von f4 : [0, ∞[ → [0, ∞[ , x → x2 ist die Quadratwurzel f4−1 : [0, ∞[ → [0, ∞[ ,
x →
√ x.
Wir wollen noch auf einige Eigenschaften von Funktionen eingehen, auf die wir in den weiteren Kapiteln Bezug nehmen werden.
46
4 Abbildungen und Funktionen
Definition (beschr¨ankt, unbeschr¨ankt, untere Schranke, obere Schranke) Eine Funktion f : D → R heißt beschr¨ankt, wenn es Zahlen M , N ∈ R gibt, sodass f¨ ur alle x ∈ D M ≤ |f (x)| ≤ N gilt. In diesem Fall heißen M untere Schranke und N obere Schranke von f . Gibt es solch ein M oder N nicht, nennen wir f unbeschr¨ ankt. Die Funktion f : R → R, f (x) := x ist unbeschr¨ ankt. Auf dem Definitionsbereich D := [−3,5] ist f beschr¨ankt mit der unteren Schranke M = −3 und der oberen Schranke N = 5.
Definition ((streng) monoton wachsend / fallend) Eine Funktion f : D → R heißt monoton wachsend, wenn f¨ ur alle x1 , x2 ∈ D mit x1 < x2 gilt f (x1 ) ≤ f (x2 ) . f heißt monoton fallend, wenn f¨ ur alle x1 , x2 ∈ D mit x1 < x2 gilt f (x1 ) ≥ f (x2 ) . f heißt streng monoton wachsend bzw. streng monoton fallend, wenn statt ≤ bzw. ≥ sogar < bzw. > gilt. Die Funktion f (x) := x2 ist auf D1 := ] − ∞, 0] streng monoton fallend und auf D2 := [0, ∞[ streng monoton wachsend.
Definition (gerade, ungerade) Eine Funktion f : D → R heißt gerade, wenn f¨ ur alle x ∈ D auch −x ∈ D ist und gilt f (−x) = f (x) . f heißt ungerade, wenn f¨ ur alle x ∈ D auch −x ∈ D ist und gilt f (−x) = −f (x) . Die beiden Eigenschaften bedeuten anschaulich, dass der Funktionsgraph einer geraden Funktionen spiegelsymmetrisch bzgl. der Ordinate (also der y-Achse) ist, und der Funktionsgraph einer ungeraden Funktion punktsymmetrisch bzgl. des Koordinatenursprungs ist. F¨ ur den ersten Fall k¨onnen wir einfach an eine Parabel denken, also den Graphen der Funktion f : R → R mit f (x) := x2 :
47
4.3 Komposition von Abbildungen
F¨ ur den ungeraden Fall stellen Sie sich beispielsweise eine Gerade durch den Ursprung vor, exemplarisch w¨ahlen wir den Graphen der durch g : R → R mit g(x) := x gegebenen Winkelhalbierenden.
Definition (periodisch, Periodenl¨ange) Eine Funktion f : R → R heißt periodisch, wenn es eine Zahl p ∈ R gibt, sodass f¨ ur alle x ∈ R gilt: f (x + p) = f (x) . Die kleinste dieser Zahlen p heißt Periodenl¨ange oder einfach Periode von f . Die bereits aus der Schule bekannten Funktionen f : R → R, f (x) := sin x und g : R → R, g(x) := cos x sind beide periodisch mit der Periode 2π, kurz 2π-periodisch.
4.3
Komposition von Abbildungen
Manche Abbildungen sind u art, d. h. wir haben zwei ¨ber einen Umweg“ erkl¨ ” Abbildungen f : A → X und g : X → B, und suchen die Abbildung h, bei der wir auf ein x ∈ A zun¨achst f und anschließend g loslassen“, sodass h(x) = ” g(f (x)). Das Ergebnis ist die Komposition h = g ◦ f , eine Abbildung, die von A nach B abbildet: f /X A g
h=g◦f
B
Umgangssprachlich formuliert: f frisst zuerst x und was f dann ausspuckt, wird wiederum von g gefressen. Klingt unsch¨on, ist aber pr¨ agnant. Der Wertebereich von f muss allerdings nicht unbedingt mit dem Definitionsbereich von g u ¨bereinstimmen, damit die Komposition wohldefiniert ist. Es
48
4 Abbildungen und Funktionen
gen¨ ugt, wenn f (A) im Definitionsbereich von g enthalten ist, damit der Ausdruck g(f (x)) f¨ ur alle x ∈ A sinnvoll ist.
Definition (Komposition, Hintereinanderausf¨ uhrung, Verkettung) Seien f : A → X und g : Y → B Abbildungen mit f (A) ⊆ Y . Wir definieren die Komposition (auch Hintereinanderausf¨ uhrung oder Verkettung genannt) von f und g als die Abbildung (g ◦ f ) : A → B (lies: g Kringel f“ oder g nach f“) mit ” ” (g ◦ f )(x) = g(f (x)) f¨ ur alle x ∈ A.
Die Komposition von Abbildungen
Was geschieht, wenn wir eine Abbildung mit ihrer Umkehrabbildung verketten? Jene war definiert durch f −1 (y) = x ⇔ f (x) = y Es kommt bei der Komposition also wieder der Startpunkt heraus: (f −1 ◦ f )(x) = f −1 (f (x)) = f −1 (y) = x bzw. (f ◦ f −1 )(y) = f (f −1 (y)) = f (x) = y . Die Umkehrabbildung macht sozusagen den Schaden“, den f angestellt hat, ” wieder r¨ uckg¨angig.
49
4.4 Darstellung von Funktionen
Beispiel Seien die Abbildungen x → 1 − x2
f1 : [−1,1] → R , und g1 : [0, ∞[ → R ,
x →
√ x
gegeben. Es gilt f1 ([−1,1]) = [0,1] ⊆ [0, ∞[ , sodass die Hintereinanderausf¨ uhrung von g1 nach f1 erkl¨art ist: g1 ◦ f1 : [−1,1] → R , x → 1 − x2 . F¨ ur die Abbildungen f2 : R → R ,
x → 2x
und g2 : R → R ,
x → 3x − 1
ist die Hintereinanderausf¨ uhrung in beiden Reihenfolgen m¨ oglich; das Ergebnis ist jedoch verschieden: g2 ◦ f2 : R → R , bzw. f2 ◦ g2 : R → R ,
x → 3 · 2x − 1 x → 23x−1 .
Wie wir am letzten Beispiel gesehen haben, ist die Komposition von Abbildungen im Allgemeinen nicht kommutativ, d. h. es gilt nicht f ◦ g = g ◦ f f¨ ur alle Abbildungen. Einige erf¨ ullen die Kommutativit¨ at wie beispielsweise f mit f −1 , aber halt nicht alle. Die Komposition ist jedoch assoziativ, es gilt also h ◦ (g ◦ f ) = (h ◦ g) ◦ f , sodass wir einfach h ◦ g ◦ f schreiben k¨ onnen. Gehen wir also den Umweg u ¨ber mehrere Mengen, A
f1
/ X1
f2
/ X2
f3
/ ...
fn
/ Xn
fn+1
/B ,
schreiben wir f¨ ur die Komposition fn+1 ◦ fn ◦ · · · ◦ f2 ◦ f1 .
4.4
Darstellung von Funktionen
Die graphische Darstellung von Funktionen soll die Beziehungen zwischen dem Definitions- und dem Wertebereich aufzeigen. Sind Definitions- und Wertebereich Teilmengen von R, stellen wir u ¨blicherweise den Funktionsgraph dar,
50
4 Abbildungen und Funktionen
indem wir in ein kartesisches Koordinatensystem u ¨ber jeden Punkt des Definitionsbereiches den Bildpunkt eintragen. Da eine Funktion jedem Urbildpunkt genau einen Bildpunkt zuordnet, verl¨auft der Funktionsgraph von links nach rechts, ohne umzukehren. Er kann unterbrochen sein (in Bereichen, die nicht zum Definitionsbereich geh¨oren), pl¨otzliche Spr¨ unge und Ecken aufweisen oder stark ansteigen und j¨ah wieder abfallen, aber nie darf es mehrere Punkte direkt u ¨bereinander geben. Bei Graphen injektiver Funktionen d¨ urfen keine zwei Urbildpunkte den gleichen Bildpunkt haben. Eine Spiegelung an der Winkelhalbierenden des ersten bzw. dritten Quadranten vertauscht die beiden Achsen und liefert uns den Funktionsgraphen der Umkehrabbildung der Funktion. Wollen wir Funktionen mit Definitions- und Wertebereich in C darstellen, ist das oben beschriebene Verfahren u ¨ber den Funktionsgraphen nicht mehr angebracht. Wir br¨ auchten eine komplexe Ebene u ¨ber jedem Punkt des Definitionsbereches und w¨ urden insgesamt den Funktionsgraphen in einem vierdimensionalen Raum zeichnen m¨ ussen! Eine Alternativmethode besteht darin, ein Gitter im Definitionsbereich zu betrachten und in einer zweiten Graphik das Bild des Gitters einzuzeichnen. Die Verzerrung des Bildgitters im Vergleich zum Originalgitter vermittelt einen gewissen, wenn auch nicht umfassenden Eindruck der Funktion.
Darstellung der komplexen Funktion f (z) := z −
4.5
1 z
Aufgaben
1. Gegeben sei die Funktion f : R → R, f (x) := −x2 + 2 , deren Funktionsgraph eine nach unten offene Parabel zeigt. Bestimmen Sie f ([0,3]), f (] − ∞,0[) und f −1 ({1}).
51
4.6 L¨ osungen
2. Bestimmen Sie, falls m¨oglich, die Umkehrfunktionen von f1 : R → R, f1 (x) := 3x − 2 f2 : [1,3] → R, f2 (x) := 3x − 2 g1 : R → R, g1 (x) := 2x2 + 1 g2 : [0, ∞[ → R, g2 (x) := 2x2 + 1 . 3. Schreiben Sie f¨ ur die Funktionen f (x) := x2
f : R → [0, ∞[ , g : R → R,
g(x) := x − 3
h : [0, ∞[→ [0, ∞[ ,
h(x) :=
√ x
folgende Hintereinanderausf¨ uhrungen samt Definitionsbereich und Wertebereich auf: f ◦g ,
g◦f ,
h◦f ,
f ◦h ,
h◦g ,
g◦g◦h ,
f ◦g◦h .
Der Definitionsbereich soll dabei der maximal m¨ ogliche in R sein und der Wertebereich soll so gew¨ahlt werden, dass die Hintereinanderausf¨ uhrung surjektiv ist. Welche Hintereinanderausf¨ uhrung ist zudem noch injektiv? 4. Stellen Sie die Funktion f (x) := gender Funktionen f¨ ur x > 0 dar: g(x) :=
x x+1
1 , x
als Hintereinanderausf¨ uhrung fol-
h(x) := x + 1 .
5. Seien f1 , f2 gerade und g1 , g2 ungerade Funktionen. Leiten Sie die entsprechenden Symmetrieeigenschaften (gerade bzw. ungerade) folgender Hintereinanderausf¨ uhrungen her: f 1 ◦ f2 ,
4.6 1.
g1 ◦ g 2 ,
f1 ◦ g 2 ,
g1 ◦ f 2 .
L¨ osungen f : R → R, f (x) := −x2 + 2 . Als Parabel weist der Graph von f keine Spr¨ unge auf. Im Intervall [0,3] ist f (streng) monoton fallend und daher ist f ([0,3]) = [f (3), f (0)] = [−7,2] . Im Intervall ] − ∞,0[ ist f streng monoton wachsend, also f (] − ∞,0[) = ] − ∞,2[ .
52
4 Abbildungen und Funktionen
Als Parabel kann f zu jedem Punkt maximal zwei Urbildpunkte haben. Die Gleichung −x2 + 2 = 1 liefert f −1 ({1}) = {−1, +1} . 2. Eine einfache Methode, die Umkehrfunktion zu bestimmen, besteht darin f (x) durch y zu ersetzen und dann die Funktionsgleichung nach x aufzul¨osen. Falls die Ausgangsfunktion nur injektiv und nicht bijektiv ist, m¨ ussen wir zudem noch den Definitionsbereich der Umkehrfunktion bestimmen. f1 ist eine bijektive Funktion, womit wir uns lediglich auf die Funktionsgleichung konzentrieren k¨onnen: 1 (y + 2) 3 1 f1−1 : R → R, f1−1 (y) := (y + 2) 3
f1 (x) = y = 3x − 2
⇔
x=
f2 ist zwar injektiv, aber zur Surjektivit¨at m¨ ussen wir den Wertebereich auf W := f2 ([1,3]) einschr¨anken. Da f2 eine monoton wachsende Funktion ist und auch zwischendurch keine Funktionswerte ausl¨ asst, ergibt sich der Wertebereich zu: W = [f2 (1), f2 (3)] = [3 · 1 − 2, 3 · 3 − 2] = [1,7] . Somit ist
1 (y + 2) . 3 g1 ist nicht injektiv, denn beispielsweise ist g1 (−1) = 2 · (−1)2 + 1 = 2 · 12 +1 = g1 (+1). Es gibt hierzu also keine Umkehrfunktion. Eingeschr¨ ankt auf den Definitionsbereich [0, ∞[ wird g1 allerdings injektiv. f2−1 : [1,7] → [1,3], f2−1 (y) :=
F¨ ur g2 ergibt sich
2
g2 (x) = y = 2x + 1
⇔
x=
sodass die Umkehrfunktion g2−1 :
[1, ∞[→ [0, ∞[,
1 (y − 1) , 2
g2−1 (y)
:=
1 (y − 1) 2
lautet. 3. f ◦ g : R → [0, ∞[ ,
(f ◦ g)(x) = f (x − 3) = (x − 3)2
(g ◦ f )(x) = g(x2 ) = x2 − 3 √ h ◦ f : R → [0, ∞[ , (h ◦ f )(x) = h(x2 ) = x2 = |x| √ √ 2 f ◦ h : [0, ∞[→ [0, ∞[ , (f ◦ h)(x) = f ( x) = x = x g ◦ f : R → [−3, ∞[ ,
53
4.6 L¨ osungen
(Obwohl das Ergebnis von f ◦ h auf ganz R definiert w¨ are, wird der Definitionsbereich durch den von h eingeschr¨ ankt.) h ◦ g : [3, ∞[ → [0, ∞[ ,
(h ◦ g)(x) = h(x − 3) =
√
x−3
(Bei h ◦ g mussten wir den Definitionsbereich von g weiter einschr¨ anken, denn f¨ ur x < 3 ist das Ergebnis nicht definiert.) g ◦ g ◦ h : [0, ∞[→ [−6, ∞[ , √ √ √ √ (g ◦ g ◦ h)(x) = g(g( x)) = g( x − 3) = x − 3 − 3 = x − 6 f ◦ g ◦ h : [0, ∞[→ [0, ∞[ , √ √ √ (f ◦ g ◦ h)(x) = f (g( x)) = f ( x − 3) = ( x − 3)2 . Injektiv sind f ◦ h, h ◦ g und g ◦ g ◦ h. Bei den anderen Hintereinanderausf¨ uhrungen sorgt das Quadrat daf¨ ur, dass Funktionswerte doppelt angenommen werden wie beispielsweise (f ◦ g ◦ h)(4) = 1 = (f ◦ g ◦ h)(16). 4. f (x) =
x =g x+1
x+1 x
1 1 =g 1+ =g h = g(h(g(x))) x x
Demnach ist f = g ◦ h ◦ g. 5. Die Eigenschaften der fi und gi lauten ausgeschrieben: fi (−x) = fi (x) ,
gi (−x) = −gi (x) .
Damit folgt f¨ ur die Hintereinanderausf¨ uhrungen: (f1 ◦ f2 )(−x) = f1 (f2 (−x)) = f1 (f2 (x)) = (f1 ◦ f2 )(x) (g1 ◦ g2 )(−x) = g1 (g2 (−x)) = g1 (−g2 (x)) = −g1 (g2 (x)) = −(g1 ◦ g2 )(x) (f1 ◦ g2 )(−x) = f1 (g2 (−x)) = f1 (−g2 (x)) = f1 (g2 (x)) = (f1 ◦ g2 )(x) (g1 ◦ f2 )(−x) = g1 (f2 (−x)) = g1 (f2 (x)) = (g1 ◦ f2 )(x) . Somit ist g1 ◦ g2 ungerade und alle anderen Hintereinanderausf¨ uhrungen gerade.
54
4 Abbildungen und Funktionen
Fragen • Was sind Definitions- und Wertebereich? • Was ist die Urbildmenge? Fertigen Sie zur Erkl¨ arung eine Skizze an. • Finden Sie drei Beispiele f¨ ur surjektive Abbildungen, die nicht injektiv sind und umgekehrt. • Was ist die Inverse einer Funktion und wann ist diese u ¨berhaupt definiert? • Nennen Sie je zwei Beispiele f¨ ur beschr¨ankte und unbeschr¨ ankte Funktionen. • Was sind monoton wachsende Funktionen? Gibt es Funktionen, die wachsend und fallend zugleich sind? • Zeichnen Sie ein Diagramm, durch das die Komposition von Abbildungen gegeben wird.
5 Wichtige Funktionen im ¨ Uberblick
5.1
Motivation
Wir werden nun einen Blick auf diverse Funktionen werfen, die in den Ingenieurund Naturwissenschaften immer wieder vorkommen. Wichtige ihrer Eigenschaften werden wir kennen lernen bzw. aus der Schule rekapitulieren, die sp¨ ater teils ¨ noch genauer beleuchtet werden. Dieses Kapitel hat einen Ubersichtscharakter (angereichert mit einigen Beispielen). Wir verzichten daher auf die strenge Form einer Aneinanderreihung von Definitionen und begleiten Sie auf eine Art Besichtigungstour; es ist die Ruhe vor dem Sturm.
5.2 5.2.1
Polynome und rationale Funktionen Polynome
Polynome sind als Funktionen der Form p(x) :=
n
a k x k = a0 + a 1 x + a 2 x 2 + · · · + a n x n
k=0
bekannt. Dabei k¨ onnen die Koeffizienten ak reelle oder komplexe Werte annehmen. Als Bausteine von Polynomen k¨onnen wir die so genannten Monome xk betrachten. Der h¨ochste auftretende Koeffizient (hier n, falls an = 0) wird als der Grad von p bezeichnet. Einen wichtigen Satz wollen wir hier benennen, dessen Beweis wesentlich dem allseits bekannten Carl Friedrich Gauß (1777 – 1855) zugeschrieben wird; er liefert interessante — und oft verwendete — Aussagen u ¨ber die Nullstellen von Polynomen.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_5
56
¨ 5 Wichtige Funktionen im Uberblick
Satz F¨ ur jedes komplexe Polynom p(x) := an xn + . . . + a1 x + a0 vom Grad n gibt es eine eindeutige Zerlegung p(x) = an (x − x1 )(x − x2 ) . . . (x − xn ) = an
n
(x − xk )
k=1
ussen dabei nicht notwendigerweise verin n Linearfaktoren (x − xk ). Die xk m¨ schieden sein. Insbesondere hat jedes Polynom vom Grad n genau n komplexe Nullstellen (mit Vielfachheiten gez¨ahlt). (Fundamentalsatz der Algebra) n Lassen wir f¨ ur ein Polynom p(x) := k=0 ak xk mit ausschließlich reellen Koeffizienten ak f¨ ur x auch komplexe Zahlen zu, so ist mit jeder Nullstelle x0 auch deren konjugiert komplexe Zahl x0 eine Nullstelle: p(x0 ) =
n
ak x0 k =
k=0
n
ak xk0 =
k=0
n
ak xk0 = 0 = 0 .
k=0
Anders ausgedr¨ uckt treten die Nullstellen von Polynomen mit rein reellen Koeffizienten stets in komplex konjugierten Paaren auf. Bei reellen Nullstellen ergibt die komplexe Konjugation nat¨ urlich nichts Neues. Das hier gewonnene Wissen erspart uns in vielen F¨allen unn¨otige Rechenarbeit. Bei komplexen Nullstellen zerf¨allt nun das Polynom u. a. in die Faktoren (x−x0 ) und (x − x0 ). Multiplizieren wir diese wieder miteinander, ergeben sich rein reelle, quadratische Terme: (x − x0 )(x − x0 ) = x2 − (x0 + x0 )x + x0 x0 = x2 − 2 Re(x0 )x + |x0 |2 . Verbinden wir diese Erkenntnis mit dem Fundamentalsatz der Algebra, so kann jedes reelle Polynom in reelle lineare und reelle quadratische Faktoren zerlegt werden: m ˜ m (x − xj )kj (x2 + bj x + cj )lj . p(x) = an j=1
j=m+1
Diesmal haben wir mit den kj und lj die Vielfachheiten der einzelnen Faktoren ausgeschrieben.
5.2.2
Rationale Funktionen
Den Bruch zweier Polynome f (z) := p(z) q(z) nennen wir rationale Funktion. Die Nullstellen von f sind identisch mit denen des Z¨ ahlerpolynoms p. An den Nullstellen des Nennerpolynoms q hingegen ist f nicht definiert. Solche Punkte nennen wir Pole.
57
5.2 Polynome und rationale Funktionen
Polynomdivision In vielen F¨allen ist die Darstellung einer rationalen Funktion unn¨ otig kompliziert, denn ¨ahnlich wie zwei reelle Zahlen k¨onnen wir auch Polynome dividieren. Nur h¨oren wir erst einmal auf, wenn der Rest (das Restpolynom) nach einem Divisionsschritt einen kleineren Grad als das Nennerpolynom hat. Was hier passiert, sehen wir bereits ersch¨opfend an folgendem Beispiel. Wir m¨ ochten zuvor allerdings noch bemerken, dass Leonhard Euler (1707 – 1783), der großartige Mathematiker aus der Schweiz, die Polynomdivision auf wunderbare Weise in seinem Buch Vollst¨andige Anleitung zur Algebra“ erl¨ autert. ”
Beispiel (x3 + 2x2 + 3x + 4) : (x − 1) = x2 + 3x + 6 + −(x3 − x2 )
10 x−1
3x2 + 3x + 4 −(3x2 − 3x) 6x + 4 −(6x − 6) 10
Partialbruchzerlegung Nun wollen wir uns auf die Zerlegung des Restterms konzentrieren. Auf den ersten Blick mag die M¨ uhe groß und das Ergebnis nicht wirklich einfacher erscheinen, aber dies wird uns sp¨ater die M¨oglichkeit geben, beliebige rationale Funktionen zu integrieren. Der Rest einer Polynomdivision ist eine rationale Funktion r(z) := p(z) q(z) , deren Z¨ahlerpolynom p einen niedrigeren Grad aufweist als das Nennerpolynom q. Wir zerlegen q in seine Faktoren q(x) = a
m j=1
(x − aj )kj
n
(x2 + bj x + cj )lj ,
j=m+1
indem wir dessen Nullstellen bestimmen. Ziel der Partialbruchzerlegung ist es, den Restterm in eine Summe mehrerer Br¨ uche zu zerlegen, deren Z¨ ahler und Nenner daf¨ ur m¨oglichst geringe Grade haben. Wenige Kriterien, die wir bald
58
¨ 5 Wichtige Funktionen im Uberblick
kennen lernen werden, geben uns die M¨oglichkeit, die Zerlegung zu erraten“, ” wobei nur noch einige unbekannte Koeffizienten berechnet werden m¨ ussen. Wir zeigen dies zun¨achst an einigen einfachen Beispielen:
Beispiel
A1 A2 x+3 • F¨ ur r(x) := (x−2) ahlen (raten) wir den Ansatz r(x) = x−2 + (x−2) 2 w¨ 2 . Die beiden Darstellungen f¨ ur r setzen wir gleich und machen einen so genannten Koeffizientenvergleich:
x+3 A2 A1 A1 (x − 2) + A2 + = = (x − 2)2 x − 2 (x − 2)2 (x − 2)2 ⇒
x + 3 = A1 (x − 2) + A2 = A1 x + (A2 − 2A1 )
⇒
1 = A1
⇒
A1 = 1 und
Somit ist r(x) :=
x+3 (x−2)2
3 = A2 − 2A1
und
=
A2 = 5
1 x−2
+
5 (x−2)2 .
Die Durchf¨ uhrung eines Koeffizientenvergleichs bedeutet also, dass die Koeffizienten verglichen werden, die vor x0 (= 1), x1 , x2 , . . . auf der jeweiligen Seite vom Gleichheitszeichen stehen. 2
+3 ahlen wir den Ansatz r(x) = • F¨ ur r(x) := (x2x+x+2) 2 w¨ Es folgt mit Koeffizientenvergleich:
B1 x+C1 x2 +x+2
+
B2 x+C2 (x2 +x+2)2 .
x2 + 3 B2 x + C2 B 1 x + C1 + 2 = 2 2 2 (x + x + 2) x + x + 2 (x + x + 2)2 (B1 x + C1 )(x2 + x + 2) + B2 x + C2 = (x2 + x + 2)2 ⇒
x2 + 3 = (B1 x + C1 )(x2 + x + 2) + B2 x + C2 = B1 x3 + (B1 + C1 )x2 + (2B1 + C1 + B2 )x + (2C1 + C2 )
⇒
0 = B1 ,
1 = B 1 + C1 ,
⇒
B1 = 0 ,
C1 = 1 ,
Somit ist r(x) :=
x2 +3 (x2 +x+2)2
0 = 2B1 + C1 + B2
B2 = −1 und =
1 x2 +x+2
+
und
3 = 2C1 + C2
C2 = 1
−x+1 (x2 +x+2)2 .
Wir stellen also stets einen Ansatz in der Form, die wir uns als Ziel w¨ unschen, alt der Ansatz die auf. F¨ ur jeden Faktor (x − a)k des Nennerpolynoms q enth¨ Terme A1 A2 Ak + + ... + x − a (x − a)2 (x − a)k
59
5.2 Polynome und rationale Funktionen
und f¨ ur jeden Faktor (x2 + bx + c)k des Nennerpolynoms q enth¨ alt der Ansatz die Terme B 1 x + C1 B2 x + C2 B k x + Ck + 2 + ... + 2 . 2 2 x + bx + c (x + bx + c) (x + bx + c)k
Nach dieser Vorschrift f¨ ugen wir f¨ ur jeden Faktor von q dem Ansatz weitere Summanden hinzu. Aber Vorsicht: Die unterschiedlichen Summanden m¨ ussen auch unterschiedliche Unbekannte im Z¨ahler enthalten. Dann bringen wir s¨ amtliche Summanden des Ansatzes auf den gleichen Nenner, also auf q. Schließlich setzen wir den Restterm r und den Ansatz gleich und berechnen mittels Koeffizientenvergleich der Z¨ahlerpolynome die Unbekannten. Das war eventuell etwas schwer zu durchschauen, aber keine Sorge, die n¨ achste Berechnung bringt es nochmals in praktischer Form auf den Punkt:
Beispiel Wir wollen den Prozess an einem etwas komplexeren Beispiel veranschaulichen, indem wir die rationale Funktion
f (x) :=
x4 (x2 − 1)2
zerlegen. Da der Grad des Z¨ahlerpolynoms nicht kleiner als der des Nennerpolynoms ist (beide Grade sind 4), brauchen wir zun¨ achst eine Polynomdivision:
(x4
) : (x4 − 2x2 + 1) = 1 +
−(x4 − 2x2 + 1)
2x2 − 1 x4 − 2x2 + 1
2x2 − 1 2
−1 Nun zur Partialburchzerlegung des Restterms r(x) = x42x −2x2 +1 . Die Faktorisierung des Nenners sehen wir bereits teilweise in der Ausgangsfunktion: q(x) = x4 − 2x2 + 1 = (x2 − 1)2 = (x + 1)2 (x − 1)2 . Demnach wird der Ansatz f¨ ur die Partialburchzerlegung die Form
r(x) =
A2 B2 B1 A1 + + + x + 1 (x + 1)2 x − 1 (x − 1)2
60
¨ 5 Wichtige Funktionen im Uberblick
haben. Es folgt: 2x2 − 1 A2 B2 A1 B1 = + + + (x + 1)2 (x − 1)2 x + 1 (x + 1)2 x − 1 (x − 1)2 A1 (x + 1)(x − 1)2 + A2 (x − 1)2 + B1 (x + 1)2 (x − 1) + B2 (x + 1)2 = (x + 1)2 (x − 1)2 2x2 − 1 = A1 (x + 1)(x − 1)2 + A2 (x − 1)2
⇒
+ B1 (x + 1)2 (x − 1) + B2 (x + 1)2 = A1 (x3 − x2 − x + 1) + A2 (x2 − 2x + 1) + B1 (x3 + x2 − x − 1) + B2 (x2 + 2x + 1) = (A1 + B1 )x3 + (−A1 + A2 + B1 + B2 )x2 + (−A1 − 2A2 − B1 + 2B2 )x + (A1 + A2 − B1 + B2 ) ⇒
0 = A1 + B1 ,
2 = −A1 + A2 + B1 + B2 ,
0 = −A1 − 2A2 − B1 + 2B2 und − 1 = A1 + A2 − B1 + B2 3 1 3 1 und B2 = ⇒ A1 = − , A2 = , B1 = 4 4 4 4 Somit ist 1 f (x) = 1 + 4
−3 1 1 3 + + + x + 1 (x + 1)2 x − 1 (x − 1)2
.
5.3
Sinus, Kosinus und Tangens
Schwingungsprozesse tauchen besonders in der Physik und in den Ingenieurwissenschaften sehr h¨aufig auf. Grund genug, die sie beschreibenden Funktionen mit eigenen Namen — Sinus und Kosinus (sin und cos) — zu versehen und n¨ aher zu untersuchen. Die Funktionsgraphen sehen wir in den folgenden Bildern. f (x) 1
−2π
−
3π 2
−π
−
π 2
−1
π 2
π
x 3π 2
2π
61
5.3 Sinus, Kosinus und Tangens
f (x) 1
−2π
−
3π 2
−π
−
π 2
π 2
π
x 3π 2
2π
−1 Oben der Sinus, unten der Kosinus
Weiterhin stellen wir fest, dass beide Funktionen durch Verschieben (um ineinander u ¨bergehen, 2π-periodisch sind und folgende Nullstellen haben:
π 2)
• sin t = 0 f¨ ur t = kπ, k ∈ Z,
• cos t = 0 f¨ ur t =
π 2
+ kπ, k ∈ Z.
Manchmal schreiben wir auch sin(t) bzw. cos(t), um das Argument t noch deutlicher zu machen, was aber zumeist nur sinnvoll ist, wenn das Argument etwas l¨anger ist, z. B. bei sin(4πt − 2). Es gilt die Gleichung sin2 t + cos2 t = 1 ,
die auch als Eulergleichung (nach Euler wurde vieles, teils nicht immer eindeutig, benannt) bekannt ist. Aus den behandelten Funktionen k¨onnen wir eine neue konstruieren, den Tangens: tan t :=
sin t . cos t
Dieser hat die gleichen Nullstellen wie der Sinus und sein gest¨ uckeltes“ Bild ” ergibt sich daraus, dass der Kosinus nat¨ urlich die bereits erw¨ ahnten Nullstellen hat.
62
¨ 5 Wichtige Funktionen im Uberblick
f (x) 5 3 1 −2π
−
3π 2
−π
−
π 2
−2
π 2
π
x 3π 2
2π
−4 −6 Tangens
Ferner die Kehrwertfunktion des Tangens, der Kotangens cot t :=
1 tan t :
f (x) 5 3 1 −2π
−
3π 2
−π
−
π 2
−2
π 2
π
3π 2
2π
x
−4 −6
Kotangens
F¨ ur die hier eingef¨ uhrten Funktionen gelten die so genannten Additionstheoreme, die oft n¨ utzlich sind.
63
5.4 Exponentialfunktion und Logarithmus
5.3.1
Einige Additionstheoreme
sin(x + y)
=
sin x cos y + sin y cos x
sin(x − y)
=
sin x cos y − sin y cos x
cos(x + y)
=
cos x cos y − sin x sin y
cos(x − y)
=
tan(x + y)
=
tan(x − y)
=
cos x cos y + sin x tan x + tan y = 1 − tan x tan y tan x − tan y = 1 + tan x tan y
sin y sin(x + y) cos(x + y) sin(x − y) cos(x − y)
Von diesen finden wir in diversen Formelsammlungen noch deutlich mehr. Aber bitte beachten Sie, dass sich viele dieser Gleichungen durch das herleiten lassen, was wir noch u ¨ber die dortigen Darstellungen des Sinus und Kosinus lernen.
5.4
Exponentialfunktion und Logarithmus
Mit der Exponentialfunktion haben Sie bereits mehrfach im Mathematikunterricht gerechnet, und damit war dort ex mit einem reellen Exponenten x gemeint und e = 2,71828 . . . ist die Eulersche Zahl. Damit haben Sie nicht die ganze Wahrheit erfahren, wie wir sp¨ater genauer sehen werden, denn es gibt noch Verborgenes, was von Bedeutung ist. So wird die allgemeine Potenz ax f¨ ur eine reelle Zahl a gerade u ¨ber die Exponentialfunktion definiert, womit sich dann f¨ ur a = e der Kreis unangenehm schließt, ohne dass wirklich etwas beantwortet ¨ wurde. Daf¨ ur ist aber hier nicht der richtige Ort, wir hatten ja einen Uber¨ blick angek¨ undigt und keine tiefen Uberlegungen. Daher pochen wir auf die Anwendung der intuitiven Verwendung der Dinge und begn¨ ugen uns mit der ber den Funktionsgraphen. Erinnerung an ex u ¨
64
¨ 5 Wichtige Funktionen im Uberblick
f (x) 20 18 16 14 12 10 8 6 4 2 x −3
−2
−1 0 1 Exponentialfunktion
2
3
Die Umkehrfunktion der Exponentialfunktion f (x) := ex ist der so genannte nat¨ urliche Logarithmus f −1 (x) = ln x, es gilt also eln x = x
ln ex = x .
und
f (x) 7 6 5 4 3 2 1
−2
−1
x 1
2
3
4
5
6
7
−2
Exponential- und Logarithmusfunktion
Hier erkennen wir sehr gut, dass eine Spiegelung an der Winkelhalbierenden zur Umkehrfunktion auf graphischem Wege f¨ uhrt.
65
5.4 Exponentialfunktion und Logarithmus
Die allgemeine Potenz ax mit a > 0 wird u ¨ber die Exponentialfunktion definiert: ax := ex ln a . Die Umkehrfunktion von ax ist der Logarithmus zur Basis a und wird mit loga x notiert. Wie bereits angek¨ undigt, ist die Definition der allgemeinen Potenz u ¨ber die Exponentialfunktion nur sinnvoll, wenn wir die Exponentialfunktion nicht wieder als Spezialfall der allgemeinen Potenz definieren, sondern irgendwo anders herbekommen. Eine M¨oglichkeit werden wir im Kapitel u ¨ber Potenzreihen kennen lernen.
5.4.1
Potenz- und Logarithmusgesetze
In Ihrem bisherigen Leben haben Sie bereits oft damit arbeiten m¨ ussen, aber es schadet zur Abrundung dieses Kapitels nicht, einige u bliche Regeln in kom¨ pakter Form zu listen. F¨ ur nat¨ urliche Exponenten und beliebiges a ∈ R kennen wir: an := a · a ·a · · · a . n Faktoren
Seien a, b > 0 und r, s ∈ R: a0 = 1 (speziell auch 00 = 1), 1 a−s = s , a ar+s = ar as , ar ar−s = s , a (ar )s = ars , (ab)r = ar br ,
a r ar = r . b b Seien a, x, y > 0: loga xy = loga x + loga y , loga xy = y loga x , x loga = loga x − loga y . y Diese Rechenregeln gelten speziell f¨ ur die Exponentialfunktion bzw. den nat¨ urlichen Logarithmus.
66
5.5
¨ 5 Wichtige Funktionen im Uberblick
Weitere wichtige Funktionen
¨ Uber die Exponentialfunktion lassen sich durch Umstellen der Eulerformel eix = cos x + i sin x Sinus und Kosinus konstruieren: 1 ix 1 ix e − e−ix e + e−ix . und cos x = sin x = 2i 2 Das ist sehr n¨ utzlich, denn rechnen wir mit den komplexen Exponenten ix wie gewohnt, dann ergeben sich z. B. die Additionstheoreme sehr leicht.
Beispiel Wir zeigen cos(x + y) = cos x cos y − sin x sin y unter Verwendung bekannter Potenzregeln, dabei nennen wir die rechte Seite R, die linke L: 1 ix 1 e − e−ix eiy − e−iy R = eix + e−ix eiy + e−iy + 4 4 1 i(x+y) i(x−y) i(−x+y) e +e +e + e−i(x+y) = 4 1 i(x+y) e − ei(x−y) − ei(−x+y) + e−i(x+y) + 4 1 i(x+y) e + e−i(x+y) = 2 =L ¨ Ahnlich definieren wir die Funktionen Sinus Hyperbolicus sinh und Kosinus Hyperbolicus cosh u ¨ber 1 x 1 x e − e−x e + e−x . und cosh x := sinh x := 2 2 f (x) 25 20 15 10 5 x −4
−3
−2
−1−5 −10 −15 −20 −25 −30
1
2
3
4
67
5.5 Weitere wichtige Funktionen
f (x) 25 20 15 10 5 x −4 −3 −2 −1 1 2 3 4 Oben der Sinushyperbolicus, unten der Kosinushyperbolicus
Durch Umformen erhalten wir ein Analogon zur Eulerformel: ex = cosh x − sinh x . F¨ ur die Umkehrfunktionen Arcussinus und Arcuskosinus haben wir: arcsin := sin−1
und
arccos := cos−1
f (x) π 2 x −1
1 −
π 2 f (x) π
π 2 x −1
0
1
Oben der Arcussinus, unten der Arcuskosinus
68
¨ 5 Wichtige Funktionen im Uberblick
bzw. Areasinus Hyperbolicus und Areakosinus Hyperbolicus: arsinh := sinh−1
und
arcosh := cosh−1 .
f (x) 4
2
x −20
−15
−10
−5
5
10
15
20
−2
−4
f (x) 4
2
x
0 0
5
10
15
20
Oben der Areasinus Hyperbolicus, unten der Areakosinus Hyperbolicus
5.6
Aufgaben
1. Berechnen Sie alle (reellen und komplexen) Nullstellen von P (x) := x3 − (1 + 2i)x2 − (1 − 2i)x + 1 . 2. Zerlegen Sie folgendes Polynom in seine Linearfaktoren: P (x) := x5 − 3x4 + 3x3 − 3x2 + 2x . Hinweis: Das Polynom hat eine Nullstelle bei x0 = i. 3. F¨ uhren Sie eine Partialbruchzerlegung des folgenden Bruches durch: x4 − 3x3 − x2 + 11x − 4 . x2 − x − 6
69
5.7 L¨ osungen
4. Bestimmen Sie f¨ ur beliebige n ∈ N den Wert der Summe n k=1
1 . ln 1 + k
5. Beweisen Sie die Additionstheoreme sin(x + y) = sin x cos y + cos x sin y cos(x + y) = cos x cos y − sin x sin y mit Hilfe der Darstellung von Sinus und Kosinus u ¨ber die Exponentialfunktion.
5.7
L¨ osungen
1. Bei quadratischen Polynomen k¨onnten wir mit der p-q-Formel arbeiten. Der h¨ochste Exponent ist hier aber nicht zwei, sondern drei, sodass wir die erste Nullstelle erraten m¨ ussen. Ein bew¨ ahrtes Vorgehen (besonders in Klausuren) ist das Testen von 0, 1, −1 und vielleicht noch ±i und ±2. Wir setzen also nacheinander diese Zahlen in das Polynom ein und sobald wir die erste Nullstelle gefunden haben, k¨ onnen wir mit der p-q-Formel weiterarbeiten. P (0) = 03 − (1 + 2i)02 − (1 − 2i)0 + 1 = 1 = 0 , P (1) = 13 − (1 + 2i)12 − (1 − 2i)1 + 1 = 1 − 1 − 2i − 1 + 2i + 1 = 0 . Somit ist 1 eine Nullstelle des Polynoms. Nun teilen wir P durch (x − 1) und arbeiten mit dem quadratischen Polynom weiter. (x3 − (1 + 2i)x2 − (1 − 2i)x + 1) : (x − 1) = x2 − 2ix − 1 −(x3 −
x2 ) −2ix2 − (1 − 2i)x + 1 −(−2ix2 +
2i x) −x + 1 −(−x + 1) 0
Die Polynomdivision muss ohne Rest aufgehen, sonst w¨ are 1 keine Nullstelle von P . Auf das Ergebnis wenden wir nun die p-q-Formel (mit p = −2i, q = −1) an: x2 − 2ix − 1 = 0 ⇔ x1,2 = i ± (i)2 + 1 = i
70
¨ 5 Wichtige Funktionen im Uberblick
Damit sind 1, i und nochmals i die Nullstellen von P . Das Polynom k¨onnen wir somit folgendermaßen zerlegen: P (x) = (x − 1)(x2 − 2ix − 1) = (x − 1)(x − i)(x − i) . 2.
P (x) := x5 − 3x4 + 3x3 − 3x2 + 2x . Von der Vorgehensweise her ist es egal, ob wir die Nullstellen oder die Linearfaktoren eines Polynoms bestimmen, denn jede Nullstelle λ entspricht im Komplexen einem Linearfaktor (x − λ). Der Hinweis, dass i eine Nullstelle ist, gibt uns also schon den ersten der f¨ unf Linearfaktoren: (x − i). Weiterhin hat das Polynom ausschließlich reelle Koeffizienten, sodass mit i auch i = −i Nullstelle und somit (x + i) Linearfaktor ist. Ein Blick auf das Polynom liefert uns als dritten Linearfaktor x, denn x kann einfach ausgeklammert werden: P (x) := x5 − 3x4 + 3x3 − 3x2 + 2x = x x4 − 3x3 + 3x2 − 3x + 2 . Teilen wir den letzten Faktor durch (x − i) und (x + i), bleibt noch ein quadratisches Polynom, welches wir mit Hilfe der p-q-Formel zerlegen k¨onnen. Doch anstatt die beiden Polynomdivisionen hintereinander durchzuf¨ uhren, ist es einfacher, gleich durch (x − i)(x + i) = (x2 + 1) zu teilen: (x4 − 3x3 + 3x2 − 3x + 2) : (x2 + 1) = x2 − 3x + 2 −(x4
+ x2 ) −3x3 + 2x2 − 3x + 2
−(−3x3
− 3x) 2x −(2x
2 2
+2 + 2) 0
Schließlich sind die beiden restlichen Nullstellen 1 und 2: 9 3 1 3 p=−3,q=2 2 −2= ± , ⇔ x1,2 = ± x − 3x + 2 = 0 2 4 2 2 sodass die Zerlegung von P in Linearfaktoren so aussieht: P (x) := x5 − 3x4 + 3x3 − 3x2 + 2x = x(x − i)(x + i)(x − 1)(x − 2) . W¨are die Aufgabe gewesen P im Reellen so weit wie m¨ oglich zu zerlegen, m¨ ussten wir nur noch die komplexen Linearfaktoren (x − i) und (x + i) miteinander multiplizieren: P (x) := x5 − 3x4 + 3x3 − 3x2 + 2x = x(x2 + 1)(x − 1)(x − 2) .
71
5.7 L¨ osungen
3. Bei diesem Bruch m¨ ussen wir zun¨achst eine Polynomdivision durchf¨ uhren, da das Z¨ahlerpolynom einen h¨oheren Grad hat als das Nennerpolynom: (x4 − 3x3 − x2 + 11x − 4) : (x2 − x − 6) = x2 − 2x + 3 + −(x4 − x3 − 6x2 )
2x + 14 x2 − x − 6
−2x3 + 5x2 + 11x − 4 −(−2x3 + 2x2 + 12x) 3x2 − x − 4 −(3x2 − 3x − 18) 2x + 14 Das Nennerpolynom faktorisieren wir zu x2 − x − 6 = (x + 2)(x − 3) . Den Restterm zerlegen wir mit dem Ansatz 2x + 14 A B = + −x−6 x+2 x−3
x2
und rechnen weiter B(x + 2) A(x − 3) + (x + 2)(x − 3) (x − 3)(x + 2) Ax − 3A + Bx + 2B = x2 − x − 6 (A + B)x + (2B − 3A) = x2 − x − 6 =
Koeffizientenvergleich ergibt A+B =2 , ⇒
A = −2 ,
2B − 3A = 14
B=4
womit wir die Partialbruchzerlegung 2x + 14 2 4 =− + −x−6 x+2 x−3
x2
erhalten und die Zerlegung der anf¨anglichen rationalen Funktion lautet 2 x4 − 3x3 − x2 + 11x − 4 4 = x2 − 2x + 3 + − . 2 x −x−6 x−3 x+2
72
¨ 5 Wichtige Funktionen im Uberblick
4. Wir bedienen uns hierzu der Logarithmusregel ln ab = ln a − ln b. Dazu fassen wir das Argument des Logarithmus zu einem Bruch zusammen: n k=1
1 ln 1 + k
= =
n k=1 n
ln
k+1 k
(ln(k + 1) − ln(k))
k=1
Ausgeschrieben sieht diese Summe so aus: (ln 2−ln 1)+(ln 3−ln 2)+(ln 4−ln 3)+. . .+(ln n−ln(n−1))+(ln(n+1)−ln n) und es f¨allt auf, dass sich jeweils der erste Term eines Summanden mit dem zweiten Term des nachfolgenden Summanden aufhebt. Es handelt sich also um eine Teleskopsumme. Von der gesamten Summe bleiben also nur − ln 1 des ersten Summanden sowie ln(n + 1) des letzten Summanden u ¨brig, wobei der erstgenannte sogar 0 ist. Somit ist n k=1
1 = ln(n + 1) . ln 1 + k
5. Wir setzen die Formeln sin x =
1 ix e − e−ix 2i
und
cos x =
1 ix e + e−ix 2
links und rechts in die Additionstheoreme ein: sin(x + y) = sin x cos y + cos x sin y 1 iy 1 ix 1 i(x+y) e e − e−ix e + e−iy − e−i(x+y) = ⇔ 2i 2i 2 1 iy 1 ix e + e−ix e − e−iy + 2 2i 1 i(x+y) e + ei(x−y) − ei(−x+y) − ei(−x−y) ⇔ ei(x+y) − e−i(x+y) = 2 1 i(x+y) e − ei(x−y) + ei(−x+y) − ei(−x−y) + 2
1 2ei(x+y) − 2ei(−x−y) ⇔ ei(x+y) − e−i(x+y) = 2
5.7 L¨ osungen
73
und cos(x + y) = cos x cos y − sin x sin y 1 1 iy 1 i(x+y) ⇔ e eix + e−ix e + e−iy + e−i(x+y) = 2 2 2 1 iy 1 ix e − e−ix e − e−iy − 2i 2i 1 i(x+y) e + ei(x−y) + ei(−x+y) + ei(−x−y) ⇔ ei(x+y) + e−i(x+y) = 2 1 − 2 ei(x+y) − ei(x−y) − ei(−x+y) + ei(−x−y) 2i
1 2ei(x+y) + 2ei(−x−y) ⇔ ei(x+y) + e−i(x+y) = 2
74
¨ 5 Wichtige Funktionen im Uberblick
Fragen • Was ist ein Polynom? • L¨asst sich jedes Polynom in Linearfaktoren zerlegen? • Was l¨asst sich allgemein u ¨ber den Definitionsbereich rationaler Funktionen sagen? • Erkl¨aren Sie an einem Beispiel Polynomdivision und Partialbruchzerlegung. • Erkl¨aren Sie den Zusammenhang zwischen Sinus, Kosinus und Tangens. Fertigen Sie Skizzen an und benennen Sie die Nullstellen. • Woraus lassen sich die Additionstheoreme zumeist einfach herleiten? • Wie lautet der Zusammenhang zwischen Logarithmus und Exponentialfunktion? • Kennen Sie weitere wichtige Funktionen?
6 Folgen
6.1
Motivation
Welche Zahl kommt nach 1, 2, 4, 8, 16, 32? Wer kennt nicht die Zahlenspiele, bei denen eine Zahlenfolge (hier vorerst naiv betrachtet), von der nur die ersten paar Glieder gegeben sind, nach einem bestimmten Rechenschema weitergef¨ uhrt werden soll? In der Mathematik setzen wir nicht zwingend eine kluge Formel voraus, aus der die einzelnen Folgenglieder berechnet werden. Es sind auch v¨ ollig beliebige Folgen erlaubt, weshalb das n¨achste Folgenglied unseres Beispiels auch 42, anstatt der zu vermutenden 64, lauten kann. Andererseits m¨ ussen wir im weiteren Verlauf Folgen mathematisch korrekt aufschreiben, mit ihnen rechnen und ihre Eigenschaften bestimmen, weshalb wir es haupts¨ achlich mit expliziten Berechnungsvorschriften zu tun haben werden. Aber wof¨ ur werden diese Folgen verwendet? Wir werden Folgen wesentlich daf¨ ur verwenden, um uns u ummern ¨ber die Begriffe Konvergenz und Divergenz zu k¨ und Konsequenzen daraus abzuleiten. W¨achst also z. B. eine Folge gegen einen Wert, der nicht u ¨berschritten wird? Kommt Sie einem Wert beliebig nahe? Ist sie eventuell immer gleich einem festen Wert? Was heißt es eigentlich, dass eine Folge von Zahlen einem Wert beliebig nahe kommt? Sp¨ ater werden unsere Ergebnisse Hilfsmittel sein, um sich gewissermaßen mit Folgen an bestimmte Werte anzuschleichen“. Folgen werden wir als Grundlage erkennen, die wir ” z. B. f¨ ur Begriffe wie Stetigkeit und Differenzierbarkeit ben¨ otigen.
6.2
Grundlagen
Definition (Folge) Eine reelle bzw. komplexe Folge (xn ) ist eine Abbildung von N nach R bzw. C. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_6
76
6 Folgen
Jedem Index n ∈ N wird dabei eine reelle bzw. komplexe Zahl xn zugeordnet. Hier klingt es eventuell u ¨berraschend, dass eine Folge eine Abbildung sein soll, wo wir doch eigentlich vermutet haben, dass die einzelnen Glieder einer Folge wirklich in der in der Motivation gegebenen Form aufgelistet werden k¨ onnen; jedenfalls endlich viele der Folgenglieder. Wir schreiben eine Folge aber auch nicht in der f¨ ur Funktionen typischen Schreibweise f (n) := 1 − n1 auf, sondern in der Form xn := 1 − n1 . Der Zahl n = 1 wird hier x1 = 1 − 11 = 0 zugeordnet, der Zahl 2 der Wert x2 = 1 − 12 = 12 usw. Das ergibt dann in einer Auflistung wie oben gerade 0, 12 , . . . Wir m¨ ussen noch beachten, dass die Folge an sich geschrieben in Klammern wird, also wie in der Definition, beispielsweise 1 − n1 . Schreiben wir diese ohne Klammern, meinen wir gew¨ohnlich die einzelnen Folgenglieder, also die xn selbst, wie gerade verwendet. Einige Autoren schreiben statt (xn ) auch (xn )n∈N . Das ist sehr korrekt, aber f¨ ur den Alltag auch etwas lang. Ohne den Zusatz m¨ ussen wir allerdings beachten, dass f¨ ur n = 0 in unserer Folge xn = 1 − n1 das Folgenglied x0 gar nicht definiert ist! In solchen F¨ allen d¨ urfen wir die Folge auch sp¨ater, etwa bei n = 1 beginnen lassen, ohne dies explizit zu erw¨ ahnen. Dabei ist es unserer Wahl u ¨berlassen, ob wir als Index n, k oder z. B. auch i verwenden (also (xn ), (xk ), ...). Es gibt auch so genannte Teilfolgen. So lassen sich aus der Folge (xn ) mit xn := n1 beispielsweise die Folgenglieder mit geradem Index aussortieren, was 1 geschieht. dann durch x2n = 2n Wenn wir offen lassen wollen, ob die Folgenglieder in R oder in C liegen, schreiben wir abk¨ urzend K anstelle der beiden Mengen.
6.3
Konvergenz und Divergenz
Definition (Konvergenz, Grenzwert, Nullfolge) Eine Folge (xn ) heißt konvergent gegen einen Grenzwert a ∈ K, wenn es zu jedem ε > 0 ein N ∈ N gibt, sodass f¨ ur alle Indizes n ≥ N die Ungleichung |xn − a| < ε gilt. Wir schreiben in diesem Fall lim xn = a
n→∞
(gelesen: Limes von xn f¨ ur n gegen unendlich.“) oder auch ” xn → a . Eine Folge mit Grenzwert 0 heißt Nullfolge.
77
6.3 Konvergenz und Divergenz
Die Ungleichung |xn − a| < ε k¨onnen wir im Reellen, also f¨ ur K = R, auch umformulieren zu xn ∈ ]a − ε, a + ε[ , denn der Betrag gibt ja den Abstand zwischen xn und a an. Eine Folge ist demnach konvergent gegen a, wenn sich in jedem noch so kleinen Intervall um a fast alle Folgenglieder befinden. Die Phrase fast alle“ wollen wir im ” Folgenden immer wieder gebrauchen und meinen stets das Gleiche wie in der Definition, n¨amlich dass es anfangs durchaus Ausreißer geben kann, sp¨ ater — mit Index oberhalb eines N ∈ N — aber nicht mehr. Dies ist nat¨ urlich nur f¨ ur unendlich viele Teilnehmer (die xn ) sinnvoll. Man sagt daf¨ ur auch, dass sich in jeder noch so kleinen Umgebung von a alle bis auf endlich viele Folgenglieder befinden. Die Bedeutung dieser Beschreibung ist in der folgenden Skizze gut zu erkennen: unendlich viele Folgenglieder z }| { a−
a
a+
xn
endlich viele Folgenglieder
Wir m¨ ussen uns dar¨ uber im Klaren sein, dass diese Definition sowohl f¨ ur reelle, als auch f¨ ur komplexe Folgen berechtigt ist. Bei der Untersuchung auf einen Grenzwert kommt n¨amlich der Betrag vor, es kommt also nicht zu sonderbaren Dingen wie einem komplexwertigen Epsilon. Alles wird durch den Betrag ¨ am Ende wieder auf reelle Zahlen reduziert und die Berechnungen und Uberlegungen zu Grenzwerten bleiben gleich. Wie w¨ urde die Skizze im Komplexen aussehen? Es folgen einige n¨ utzliche Bemerkungen, die wir uns merken m¨ ussen. • Den Begriff der Umgebung fasst der Mathematiker h¨ aufig noch genauer und spricht dann bei ]a − ε, a + ε[ von einer ε−Umgebung des Punktes a. Dabei ist stets ε > 0. • Ist eine Folge konvergent, so ist ihr Grenzwert eindeutig. Es erscheint sinnvoll, neben dem Begriff der Konvergenz einen weiteren anzugeben, n¨amlich den des H¨aufungspunktes. Betrachten wir hierzu die Folge (xn ) mit xn := (−1)n , welche zwischen den Werten −1 und +1 hin und her springt. Sie nimmt die beiden Werte geh¨auft“, also unendlich oft, an, was uns ” zur Motivation des Begriffs dienen soll. Allerdings handelt es sich bei keinem
78
6 Folgen
der beiden Werte um einen Grenzwert, sondern eben nur um H¨ aufungspunkte: Ein H¨aufungspunkt a einer Folge (xn ) liegt vor, wenn in jeder Umgebung von a unendlich viele Folgenglieder liegen. Das ist ¨aquivalent dazu, dass a der Grenzwert einer Teilfolge (xnk ) ist. Bitte u ¨berlegen Sie genau, was der Unterschied zu einem Grenzwert ist. Davon gibt es n¨amlich genau einen! Bei H¨ aufungspunkten muss das nicht so sein. Das f¨allt aber nur auf, wenn man die Definitionen unter der Lupe des Verstandes fixiert betrachtet und wirklich alle Worte auf die Goldwaage legt. So ist das in der Mathematik. Bei der Folge xn := (−1)n hatten wir gesehen, dass diese zwei H¨ aufungspunkte hat: −1 und +1. Den gr¨oßten und kleinsten H¨ aufungspunkt einer Folge manifestieren wir ab jetzt durch den Limes superior (lim) und den Limes inferior (lim). Also: lim((−1)n ) = +1 und lim((−1)n ) = −1 .
Beispiel Standardbeispiel: xn :=
1 n
ist eine Nullfolge. Es gilt also 1 =0. n→∞ n lim
Zum Beweis sei ein beliebig kleines ε > 0 vorgegeben. Wir w¨ ahlen f¨ ur N ∈ N ur alle n ≥ N aus der Definition eine nat¨ urliche Zahl gr¨oßer als 1ε . Dann gilt f¨ 1 1 1 |xn − 0| = = ≤
1 . ε
Nun m¨ ussen wir N nur noch dazwischen setzen: n ≥ N > 1ε . √ Ein weiteres Beispiel bietet die Folge xn := n a mit einem festen a > 1. Wir wollen zeigen, dass diese Folge, unabh¨angig von a, den Grenzwert 1 hat. Sei dazu wiederum ein beliebig kleines ε > 0 vorgegeben. Wir suchen ein N ∈ N, sodass f¨ ur alle Indizes n ≥ N die Ungleichung |xn − 1| =
√ n
a−1 1 auch die Wurzel √ √ n a > 1 ist. Zur Vereinfachung der Rechnung setzen wir yn := n a − 1 und formen um: √ yn = n a − 1 √ ⇒ n a = 1 + yn n 2 n y + . . . + ynn ≥ nyn ⇒ a = (1 + yn ) = 1 + nyn + 2 n a ⇒ yn ≤ n √ a ⇒ na−1≤ n Somit k¨onnen wir
a N
< ε, also N > √ n
a ε
a−1≤
w¨ahlen und f¨ ur alle n ≥ N folgt a a ≤ 1, dies ∞ geht als na f¨ allerdings langsamer als n! und dies wird noch von nn u ¨bertroffen. Diese Reihenfolge der Konvergenzgeschwindigkeit bedeutet, dass wir beim Teilen einer langsamer gegen ∞ gehenden Folge durch eine in diesem Vergleich schneller gegen ∞ gehende Folge den Grenzwert Null bekommen. Dies ist nicht damit n zu verwechseln, dass 2n+10 stets gr¨oßer ist als z. B. n, und dennoch geht 2n+10 gegen 12 . Diverse Grenzwerte von Folgen sind bekannt und sollten beherrscht werden. Die Beweise sind teils nicht in einer Zeile erledigt, was jedoch die Bedeutung keinesfalls schm¨alert. Hier also einige Grenzwerte, an die wir uns erinnern sollten: • F¨ ur |b| < 1 gilt bn → 0 n • 1 + na → ea • F¨ ur positives a gilt a1/n → 1 und n1/n → 1 Jedoch gilt (n!)1/n → ∞.
6.7
Das H¨ aufungspunktprinzip und mehr
Eng mit diesem Kapitel verbunden ist das so genannte H¨ aufungspunktprinzip, das Folgendes besagt:
Satz Haben wir im Intervall [a, b] ⊂ R eine Folge (xn ) gegeben, d. h. xn ∈ [a, b] f¨ ur alle n ∈ N, dann existiert in diesem Intervall wenigstens ein H¨ aufungspunkt ξ ∈ [a, b] von (xn ). Wir betrachten f¨ ur die Erkl¨arung eine Folge im Intervall [0,1] (alle anderen Intervalle sind auch m¨oglich, aber bereits an diesem einfachen Intervall ist das Verfahren in voller Sch¨onheit zu erkennen). Wir teilen nun dieses Intervall in zehn Teilintervalle gleicher L¨ange, die dann mit 0,0 bis 0,9 beginnen. In jedem der so entstandenen Intervalle liegen entweder unendlich viele Glieder der betrachteten Folge oder nur endlich viele. W¨ ahlen wir nun ein Intervall aus, das unendlich viele Folgenglieder enth¨alt, dann beginnt dieses mit einer der Zahlen in der obigen Aufz¨ahlung, also z. B. der Zahl 0, a1 .
84
6 Folgen
Dieses Prozedere k¨onnen wir stets wieder fortf¨ uhren und erhalten eine weitere Dezimalstelle eines Punktes (Dezimalstelle, da wir ja von [0,1] ausgingen und bei jedem Schritt wieder eine Unterteilung in zehn Teile vornahmen), also insgesamt ein ξ := 0, a1 a2 a3 . . . . Dieses ξ ist dann nat¨ urlich ein H¨aufungspunkt, denn in jeder noch so kleinen ε-Umgebung liegen nach Konstruktion unendlich viele Punkte der Folge. Zugegeben, das m¨ ussen wir auf uns wirken lassen. Und eventuell sollten Sie sich ein Bild dazu anfertigen. Aber in diesem hier vorgestellten Prinzip liegen ungeahnte M¨oglichkeiten, die uns sp¨ater noch sehr n¨ utzlich sein werden.
6.8
Aufgaben
1. Zeigen Sie mit Hilfe der Definition f¨ ur Konvergenz, dass die Folge k 1 − 2 eine Nullfolge ist. 2. Zeigen Sie mit Hilfe der Rechenregeln f¨ ur konvergente Folgen, dass √ lim k a k→∞
f¨ ur beliebige Werte a ∈ R mit 0 < a < 1 gegen den Grenzwert 1 konvergiert. Hinweis: F¨ ur a > 1 haben wir den gleichen Grenzwert bereits √ in einem Beispiel erhalten. F¨ ur a = 1 ist die Folge k a konstant 1, hat also ebenfalls diesen Grenzwert. Nach dieser Aufgabe wissen wir, dass der Grenzwert 1 f¨ ur alle a > 0 ist. 3. Bestimmen Sie, wenn m¨oglich, die Grenzwerte folgender Folgen: 2 2 (k + 1)(2k − 3)(k + 2) 3 + 2k k −1 k −k , . , , 2k 2 + 3 k3 k2 k+3 4. Welche der folgenden Folgen sind beschr¨ ankt, monoton wachsend bzw. monoton fallend? 2 −k 1 , k −k . , 1− (sin k) , e k Was ergibt jeweils das Monotoniekriterium?
5. Beschreiben Sie den Verlauf der komplexen Folge k1 eik . Gegen welchen Grenzwert konvergiert die Folge? Begr¨ unden Sie Ihre Wahl. 6. Welches sind die H¨aufungspunkte der Folge sin kπ unden Sie Ihre 2 ? Begr¨ Antwort.
85
6.9 L¨ osungen
6.9
L¨ osungen
1. Der Grenzwert von Nullfolgen ist 0. Demnach m¨ ussen wir zu gegebenem ε > 0 ein N ∈ N finden, sodass f¨ ur alle k > N die Absch¨ atzung k k 1 1 − 0 = 1), so setzen wir es einfach auf 0, denn es soll ja eine nat¨ urliche Zahl sein: − log2 ε , ε < 1 N := 0 , ε≥1 F¨ ur k > N folgt im ersten Fall k − log2 ε 1 1 < = 2log2 ε = ε . 2 2 Der zweite Fall, also ε ≥ 1, ist nicht weiter interessant, da f¨ ur alle k > 1 k 1 1 zur¨ uck, indem wir den Kehrwert von a ins Spiel bringen: lim
k→∞
√ k
1 a = lim k→∞
k
1 a
.
Aus dem im Hinweis erw¨ahnten Beispiel wissen wir bereits k 1 =1, lim k→∞ a
86
6 Folgen
denn mit 0 < a < 1 ist
1 a
> 1. Schließlich ist
1 lim
k→∞
3.
k2 − k 2k 2 + 3
,
k
1 a
1
=
1 a
k
lim
k→∞
(k + 1)(2k − 3)(k + 2) k3
1 =1. 1
=
,
3 + 2k k2
,
k2 − 1 k+3
.
Wir k¨ urzen die Br¨ uche derart, dass die einzelnen Summanden in Z¨ ahler und Nenner konvergieren (bei der ersten Aufgabe k¨ urzen wir also k 2 ): 1 − k1 k2 − k = lim , 2 k→∞ 2k + 3 k→∞ 2 + 32 k lim
denn so k¨onnen wir die Rechenregeln f¨ ur konvergente Folgen anwenden: 1 k→∞ k lim 32 k→∞ k
lim 1 − lim
=
k→∞
lim 2 +
k→∞
1−0 2+0 1 = . 2
=
ochste Exponent beim Bei der zweiten Aufgabe k¨ urzen wir k 3 , da 3 der h¨ Laufindex k ist (diese Vorgehensweise funktioniert, solange wir es mit rationalen Funktionen in k zu tun haben). 1 k3 (k
+ 1)(2k − 3)(k + 2) 1 1 1 + k 2 − k3 1 + k2 = lim k→∞ 1 1 3 2 2 − lim 1 + lim = 1 + lim k→∞ k k→∞ k k→∞ k
(k + 1)(2k − 3)(k + 2) = lim k→∞ k→∞ k3 lim
= (1 + 0)(2 − 0)(1 + 0) =2. Bei der dritten Aufgabe k¨ urzen wir k 2 : 3 + 2k = lim k→∞ k→∞ k2 lim
= lim
k→∞
=0.
3 k2
+ 1
2 k
3 2 + lim k 2 k→∞ k
87
6.9 L¨ osungen
Bei der vierten Aufgabe k¨ urzen wir ebenfalls k 2 : 1 − 12 k2 − 1 = lim 1 k3 . k→∞ k + 3 k→∞ k + k2 lim
An dieser Stelle sehen wir bereits, dass der Nenner gegen 0 geht, der Z¨ahler aber gegen 1, sodass diese Folge insgesamt divergiert. 4. Die Sinusfunktion ist durch −1 und +1 beschr¨ ankt, wodurch selbiges auch f¨ ur die Folge (sin k) gilt. Die Folge ist weder monoton wachsend, noch fallend, was wir bereits an den ersten Folgengliedern sehen: sin 1 > 0 , sin 4 < 0 , sin 7 > 0 . −k ist monoton fallend, weil die Funktion f (x) := e−x moDie Folge e noton fallend ist. Daher ist die Folge nach oben hin durch ihr erstes Folgenglied beschr¨ankt. Nach unten ist die Folge durch Null beschr¨ ankt, da die Exponentialfunktion f¨ ur reelle Argumente stets positive Werte liefert. Die Folge 1 − k1 ist nach unten durch 0 und nach oben durch 1 beschr¨ankt. Sie ist monoton wachsend. Die ersten Folgenglieder von k 2 − k sind 0, 0, 2, 6, . . . , wobei der (positive) quadratische Term mit fortschreitendem k eine immer gr¨ oßere Rolle spielt als der (negative) lineare Term. Daher ist die Folge monoton wachsend und nach unten durch 0 beschr¨ankt. Nach oben ist sie allerdings unbeschr¨ankt. Nach dem Monotoniekriterium konvergieren die Folgen e−k und 1 − k1 . ¨ Uber die anderen beiden Folgen sagt das Monotoniekriterium gar nichts. 5. Die komplexe Folge ist bereits in Polarkoordinaten angegeben. Der Term 1 ahrend eik die k gibt die Entfernung des Folgenglieds vom Ursprung an, w¨ Information u alt. Letzterer nimmt ¨ber den Winkel — n¨amlich k — enth¨ ◦ ◦ von Folgenglied zu Folgenglied stets um 1 — das entspricht 1· 360 2π ≈ 115 — zu. Der Abstand vom Ursprung bildet allerdings eine Nullfolge, sodass sich die Folge insgesamt spiralf¨ormig dem Ursprung entgegenbewegt. Es handelt sich somit um eine Nullfolge. 6. Schauen wir uns die Folge etwas genauer an, indem wir die ersten Folgenglieder aufschreiben: a0 = sin 0 = 0 π a1 = sin = 1 2 2π =0 a2 = sin 2 3π = −1 a3 = sin 2
88
6 Folgen
Von da an wiederholen sich die Folgenwerte, da die Folge genau eine Periodenl¨ange des Sinus durchschritten hat. Somit werden 0, +1 und −1 von jeweils unendlich vielen Folgengliedern angenommen, was diese drei Zahlen zu H¨aufungspunkten der Folge macht. Genauer ist (a2k ) eine Teilfolge (konstant 0) mit Grenzwert 0, (a4k+1 ) eine Teilfolge (konstant 1) mit Grenzwert 1 und (a4k+3 ) eine Teilfolge (konstant −1) mit Grenzwert −1.
6.9 L¨ osungen
Fragen • Was ist eine Folge? Nennen Sie Beispiele. • Wie ist die Konvergenz einer Folge definiert? • Was ist eine Nullfolge? • Was ist eine ε−Umgebung eines Punktes? • Definieren Sie den Limes superior. • Welche Anzahl von H¨aufungspunkten hat eine konvergente Folge? • Nennen Sie drei wichtige Rechenregeln f¨ ur konvergente Folgen. • Was besagt das Monotoniekriterium? • Formulieren Sie das H¨aufungspunktprinzip.
89
7 Reihen
7.1
Motivation
Stellen wir uns den Finallauf u ¨ber 400m bei den olympischen Spielen vor und blicken gedanklich auf den Favoriten: Beim Startschuss wird dieser aus den Bl¨ ocken springen und nach etwa 44 Sekunden u ahn¨ber die Ziellinie laufen; ¨ liches ist regelm¨aßig bei Sport¨ ubertragungen zu sehen und niemand wundert sich dar¨ uber, dass ein L¨aufer das Ziel erreicht. Aber wie k¨ onnte das ein mathematisch interessierter Sportler sehen? Wir machen als solcher ein Gedankenexperiment, bei dem wir zuerst die H¨ alfte der Gesamtstrecke, also 200m, laufen. Danach bleibt von den verbleibenden 200m wiederum die H¨alfte zu laufen, also 100m, dann die H¨ alfte dieser Strecke, also 50m. Wenn wir diesen (unendlichen) Teilungsprozess weiter verfolgen, dann d¨ urften wir nie das Ziel erreichen, denn von der jeweiligen Reststrecke verbleibt immer wieder eine H¨alfte, die zu laufen ist. 25 m Start 50 m
100 m
200 m
Kann die Mathematik helfen? Nun, eigentlich ist durch die einzelnen Streckenabschnitte eine Folge gegeben (bei der wir auf das Hinzuf¨ ugen der Meterangabe verzichten), n¨amlich a0 = 200, a1 = 100, a2 = 50 usf. Wenn wir die so gefundenen Werte addieren, kommen wir der 400 sehr nahe, aber erreichen wir diese auch wirklich? Die Antwort lautet ja, sonst w¨ are mit unserer Mathematik si© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_7
92
7 Reihen
cher etwas kaputt, wir kommen auf die Berechnung noch zur¨ uck. Wir sehen ¨ an diesen Uberlegungen aber bereits einige Dinge, die uns in diesem Abschnitt weiter besch¨aftigen werden, denn behandeln wir Reihen, denken wir an eine unendliche Summation von Folgengliedern, in unserem Fall den ak . Neben der Beantwortung von Fragen mit philosophischem Hintergrund interessieren wir uns aber auch aus rein mathematischen Gr¨ unden f¨ ur solche unendlichen Summationen. Wollen wir z. B. die Fl¨ ache unter dem Graphen einer Funktion berechnen, so ergibt sich — unter Verwendung von Rechtecken zur Approximation des wirklichen Fl¨acheninhaltes — folgendes Bild: f (x)
a
b
x
Durch das Verkleinern der Grundseiten der Rechtecke machen wir die Ann¨ aherung an die Fl¨ache unter f von a bis b immer besser und mit etwas Gl¨ uck erhalten wir im Grenzwert den wirklichen Fl¨acheninhalt unter f : n
Fk →
k=0
∞
Fk .
k=0
Grenzwerte dieser Form nennen wir unendliche Reihen oder einfach nur Reihen.
7.2
Grundlegendes zu Reihen
Es stehen nun bereits einige Begriffe im Raum, die exakt gefasst werden m¨ ussen.
Definition (Partialsumme, Reihe, konvergent, absolut konvergent) F¨ ur eine (reelle oder komplexe) Folge (ak ) heißt Sn :=
n k=0
ak
93
7.2 Grundlegendes zu Reihen
n-te Partialsumme. Die Folge der Partialsummen heißt Reihe und wird als ∞
ak
k=0
notiert. Falls die Folge der Partialsummen (Sn ) konvergiert, wird die Reihe konvergent genannt, und ihr Wert ist gegeben durch: ∞
ak := lim
n→∞
k=0
n
ak .
k=0
Wenn sogar die Reihe der Absolutbetr¨age ∞
|ak |
k=0
konvergiert, so heißt die Reihe absolut konvergent.
Bitte beachten Sie, dass f¨ ur den Wert und die Reihe selbst die gleiche Schreibweise verwendet wird. Was eine Partialsumme ist, wirkt auf den ersten Blick oft sonderbar und Sie fragen sich vielleicht, ob dies denn in dieser Form gemacht werden muss. Die Antwort ist: Die Begriffe Konvergenz und Divergenz f¨ ur Reihen k¨ onnen wir einfach von Folgen u ¨bernehmen. Der Wert einer Reihe ist der Grenzwert der Folge der Partialsummen. ¨ Tats¨achlich haben wir also unsere Uberlegungen zu Reihen durch die Einf¨ uhrung von Partialsummen auf die bereits bekannten Folgen zur¨ uckgef¨ uhrt, es ist also keine g¨anzlich neue Theorie n¨otig. Wir wollen, trotz einer gewissen Vertrautheit, nochmal einen zweiten Blick auf das werfen, was eine Partialsumme eigentlich ist: Es handelt sich bei Sn einfach nur um die Summe der ersten n Folgenglieder ak . Erinnern wir uns an das Beispiel der 400m Runde. Dort ist dann S0 = a0 = 200, S1 = a0 + a1 = 300, S2 = a0 + a1 + a2 = 350 usf. Auch aus diesem Beispiel ersehen wir sofort, dass die Sn wirklich eine Folge bilden.
Beispiel Wie wir bereits gelernt haben, hat die geometrische Summe den Wert Sn (x) =
n k=0
Wegen x
n+1
xk =
1 − xn+1 . 1−x
→ 0 f¨ ur |x| < 1 ist die geometrische Reihe ∞ k=0
1 − xn+1 n→∞ 1−x
xk = lim Sn (x) = lim n→∞
94
7 Reihen
f¨ ur x ∈ ] − 1,1[ definiert und hat als Ergebnis ∞
xk =
k=0
1 . 1−x
Die bisher bei Reihen verwendeten ak sind hier also gleich xk . Darf dies sein, wo doch die ak eine Folge mit bestimmten Zahlen bilden und im xk eine Variable x steckt? Ja, denn das x kann zwar beliebig gew¨ahlt werden, ist dann aber (nach dieser Wahl) f¨ ur die nachfolgenden Betrachtung fest und damit bilden die xk tats¨achlich eine Folge wie bisher. Mit der geometrischen Reihe k¨onnen wir den L¨aufer aus der Motivation n ∞ endlich n ∞ zum Ziel bringen: 200 + 100 + 50 + ... = n=0 200 · 12 = 200 · n=0 12 = 200 · 1−1 1 = 400. 2
Beispiel Auch die Dezimalschreibweise reeller Zahlen k¨ onnen wir mit Hilfe der Reihen ∞ beschreiben. So kann jede reelle Zahl als Dezimalbruch ± k=0 ck 10m−k mit ck ∈ {0, . . . , 9} und m ∈ Z dargestellt werden, was nachstehend exemplarisch demonstriert wird: 31,25 = 3 · 101 + 1 · 100 + 2 · 10−1 + 5 · 10−2 . Somit werden reelle Zahlen mit Grenzwerten von Partialsummen identifiziert. Vielleicht ist Ihnen bereits das folgende Ph¨anomen begegnet: 9 · 0, 9 = 10 · 0, 9 − 0, 9 = 9, 9 − 0, 9 = 9 , also ist 0, 9 = 1. Aber wieso sollten nicht zwei Reihen den gleichen Grenzwert haben?
7.3 Sind
Eigenschaften von Reihen ∞ k=0
ak und
∞
k=0 bk ∞ k=0
konvergent und λ ∈ C, so sind auch die Reihen (ak + bk )
und
∞ k=0
λak
95
7.4 Konvergenzkriterien
konvergent und haben die Werte ∞
(ak + bk ) =
k=0 ∞
∞
k=0 ∞
λak = λ
k=0
7.4
ak +
∞
bk ,
k=0
ak .
k=0
Konvergenzkriterien
Eine notwendige Bedingung f¨ ur die Konvergenz einer Reihe
∞ k=0
ak ist
lim ak = 0 .
k→∞
Formal k¨onnen wir das einsehen, weil ak = Sk − Sk−1 und lim (Sk − Sk−1 ) = lim Sk − lim Sk−1 = 0 ,
k→∞
k→∞
k→∞
denn auch durch das Abziehen der 1 beim Index der Folge der Partialsummen geht diese gegen den gleichen Grenzwert wie Sk . ∞ So ist die Reihe k=0 (−1)k mit Sicherheit divergent. Von der geometrischen ∞ ur |x| < 1 konvergent ist und daher Reihe k=0 xk wissen wir bereits, dass sie f¨ muss f¨ ur solche x auch limk→∞ xk = 0 sein. F¨ ur |x| ≥ 1 hingegen ist (xk ) keine Nullfolge und die Reihe divergiert. Doch Vorsicht: Bilden die Summanden der Reihe eine Nullfolge, heißt dies noch nicht, dass die Reihe auch konvergiert!
Beispiel Die so genannte harmonische Reihe hat die Gestalt ∞ 1 . k
k=1
Diese Reihe ist ein Standardbeispiel f¨ ur eine divergente Reihe, die auf den ersten Blick konvergent erscheint. Wir werden die Divergenz etwas sp¨ ater im Kapitel u ¨ber Integration zeigen, da sich mit Hilfe der Integration leichter argumentieren l¨asst. Wir stellen nun eine Reihe n¨ utzlicher hinreichender Kriterien vor. Alle ben¨ otigten Voraussetzungen geben wir in m¨oglichst einfacher Form an und verzichten daf¨ ur auf die allgemeinsten Fassungen. Sie sollten daher im Hinterkopf behalten, dass die Voraussetzungen der folgenden S¨ atze auch etwas abgeschw¨ acht
96
7 Reihen
¨ werden k¨onnen: Uberall, wo wir etwas f¨ ur alle k ∈ N gefordert haben, gen¨ ugt auch f¨ ur alle k ∈ N mit k ≥ K. Der Anfang einer Reihe spielt f¨ ur deren Konvergenz nicht die geringste Rolle. Was wir bisher u ur reelle und komplexe Reihen. ¨ber Reihen gelernt haben, gilt f¨ Dies trifft auch f¨ ur die ersten drei der nachstehenden Kriterien zu, denn es geht dort stets um Betr¨age, die f¨ ur die Berechnungen verwendet werden (dies allerdings nicht beim Leibniz-Kriterium, was daher f¨ ur reelle Reihen reserviert bleibt). Und was ist der Betrag einer komplexen Zahl? Selbstverst¨ andlich eine reelle Zahl. Mit entsprechenden Rechenbeispielen werden wir uns daher zur¨ uckhalten, denn es gibt dabei nichts, was uns u onnte. Erst bei den so ¨berraschen k¨ genannten Potenzreihen wird es wieder interessanter, den komplexen Fall eingehender zu begutachten. Wie wir bereits kurz zuvor gelernt haben, divergiert die harmonische Reihe. F¨ ur die Konvergenz von Reihen muss daher etwas gefordert werden, was u ¨ber das bloße Vorkommen einer Nullfoge hinter dem Summenzeichen hinaus geht. Und genau davon handeln die folgenden Kriterien.
7.4.1
Majorantenkriterium
Satz ∞ ∞ Sei k=0 ak die zu untersuchende Reihe und sei k=0 ck eine weitere Reihe, von der wir bereits wissen, dass ur alle ∞sie absolut konvergent ist. Gilt dann f¨ k ∈ N |ak | ≤ |ck |, so ist auch k=0 ak absolut konvergent und es gilt ∞ k=0
|ak | ≤
∞
|ck | .
k=0
∞ Die Vergleichsreihe k=0 |ck | nennen wir in dem Fall konvergente Majorante, da sie gr¨oßere Summanden hat und dennoch konvergiert. Dieses Kriterium spricht f¨ ur sich selbst; es enth¨alt genau das, was alleine aus seiner Namensgebung zu erwarten war und sich locker so formulieren l¨ asst: Wenn wir nach der Konvergenz einer Reihe fragen und bereits eine Reihe konvergiert, die gr¨ oßer“ ” ist, dann konvergiert die fragliche Reihe erst recht. Mathematisch verh¨alt es sich wie folgt. Die Folge der Partialsummen Sn := n |ak | der Betr¨age ist monoton wachsend, außerdem ist sie unter den Vorausk=0
97
7.4 Konvergenzkriterien
setzungen des Satzes auch beschr¨ankt durch den Wert der Majorante, denn |ak | ≤ |ck |
⇒
n
|ak | ≤
k=0
n
|ck | ≤
k=0
∞
|ck | .
k=0
Wir k¨onnen also erfolgreich unser Wissen u ¨ber das Monotoniekriterium aus dem Kapitel u ¨ber Folgen anwenden und die Konvergenz der Sn folgern. Hier zeigt sich erneut deutlich, welch großen Nutzen wir aus der Einf¨ uhrung der Folge der Partialsummen ziehen; nun sollten diese ihren vermeintlichen Schrecken verloren haben.
Beispiel
k ∞ Wir untersuchen die Reihe k=0 sin2 k mit dem Majorantenkriterium. Es ist k also ak = sin2 k und wir sch¨atzen folgendermaßen ab: sin k k | sin k| k 1 k < . |ak | = = 2 2 2 ∞ ur |x| < 1 gegen Weiterhin wissen wir, dass die geometrische Reihe k=0 xk f¨ 1 1 konvergiert, hier speziell f¨ u r x := gegen 2. Somit konvergiert auch die 1−x 2 untersuchte Reihe absolut mit k k ∞ ∞ ∞ k sin k | sin k| 1 ≤ < =2. 2 2 2 k=0
k=0
k=0
In der ersten Auflage des Buches stand in diesem Beispiel noch jeweils ≤ statt K . k→∞
Damit wird aus der Reihe eine endliche Summe und diese konvergiert nat¨ urlich immer.
7.6 L¨ osungen
103
Fragen • Was ist der Zusammenhang zwischen Reihen und Folgen? • Definieren Sie den Begriff der Partialsumme. • Nennen Sie Beispiele f¨ ur konvergente und divergente Reihen. • Wie u ufen Sie Reihen auf Konvergenz? Nennen Sie explizite Krite¨berpr¨ rien. • Was ist eine alternierende Reihe? • Was ist absolute Konvergenz? Ist jede absolut konvergente Reihe konvergent?
8 Stetigkeit
8.1
Motivation
Wenn etwas stetig“ verl¨auft, so verheißt dies im umgangssprachlichen Ge” brauch, dass es keine Br¨ uche, Spr¨ unge oder Risse gibt. Diese Vorstellung finden wir wieder, wenn wir an den Verlauf einer Funktion denken: Der Funktionsgraph soll f¨ ur ein bestimmtes Intervall, in welchem die Funktion die mathematischen Bedingungen, die an den Begriff der Stetigkeit gekn¨ upft werden, in einem Zug gezeichnet werden k¨onnen. Wichtige Funktionen, die wir bereits gesehen haben, wie der Sinus oder der Kosinus, erf¨ ullen diese Forderung augenscheinlich auf den gesamten reellen Zahlen. In diesem Kapitel werden wir sehen, wie wir unsere Vorstellung mit Mitteln der Mathematik fassen k¨onnen. Stetigkeit ist auch der erste Schritt zu — nennen wir es poetisch — sch¨ onen“ ” Funktionen. Damit sind solche gemeint, die keinen zu wilden oder gar zerrissenen Verlauf haben (was noch zu konkretisieren ist). Der n¨ achste Schritt wird dann bei den differenzierbaren Funktionen vollzogen, die sich als automatisch stetig erweisen werden. Diese d¨ urfen dann, im Gegensatz zu stetigen Funktionen, nicht einmal das haben, was wir uns allgemein als Ecken oder Kanten vorstellen, wir kommen darauf auch im Kapitel zur Differenziation zur¨ uck. Stetige Funktionen bieten uns aber auch eine Besonderheit im Hinblick auf Maxima und Minima. Solche werden wir lernen zu identifizieren, denn z. B. f¨ ur eine die Leistung einer Turbine beschreibende Funktion sind sie von großer Bedeutung. Denken wir abschließend an etwas Praktisches, an ein Flugzeug und die Funktion, welche die Flugh¨ohe in Abh¨angigkeit der Flugzeit angibt. Diese H¨ ohenfunktion sollte (unbedingt) stetig sein. W¨are sie es nicht, was w¨ urde dann ein Passagier erleben, der in diesem Flugzeug sitzt? Welches Ph¨ anomen w¨ are denkbar, damit die H¨ohe von einer Sekunde auf die andere um einige hundert Meter springt? Damit scheint der Begriff der Stetigkeit auch das Potential zu haben, © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_8
106
8 Stetigkeit
eine Funktion in gewissen Bereichen auf ihre Plausibilit¨ at in den Anwendungen zu pr¨ ufen.
8.2
Grundlagen zur Stetigkeit
Wir wollen die Stetigkeit nun mit mathematischer Strenge einf¨ uhren. Dazu ist es n¨otig, die Funktion an den uns interessierenden Stellen genau zu betrachten. Dazu m¨ ussen wir diesen Stellen beliebig nahe kommen. Wenn wir uns also einem Punkt x ˜ aus dem Definitionsbereich der Funktion beliebig n¨ ahern wollen, machen wir dies nach bereits bekannten Methoden, n¨ amlich u ¨ber Grenzwerte von Folgen. Diese k¨onnen im Allgemeinen von der linken oder rechten Seite aus zum interessierenden Punkt kommen. Weiterhin ist es wichtig, dass unsere gefundenen Ergebnisse allgemein gelten und nicht von wenigen konkreten Folgen abh¨angig sind. Die nachstehende Definition ist der Startpunkt f¨ ur unsere weiteren Gedanken hierzu.
Definition (linksseitiger und rechtsseitiger Grenzwert) Sei f : D → R eine Funktion, D ⊂ R der Definitionsbereich und sei x ˜ ∈ R. Wenn f¨ ur alle in D verlaufenden Folgen (xk ) mit xk < x ˜ und xk → x ˜ die Bildfolgen (f (xk )) stets gegen den gleichen Wert y˜ konvergieren (vorausgesetzt, es gibt mindestens eine solche Folge), so heißt y˜ linksseitiger Grenzwert von f f¨ ur x gegen x ˜. Wir schreiben dann lim f (x) = y˜ .
x˜ x
Wenn f¨ ur alle in D verlaufenden Folgen (xk ) mit xk > x ˜ und xk → x ˜ die Bildfolgen (f (xk )) stets gegen den gleichen Wert z˜ konvergieren (vorausgesetzt, es gibt mindestens eine solche Folge), so heißt z˜ rechtsseitiger Grenzwert von f f¨ ur x gegen x ˜. Wir schreiben dann lim f (x) = z˜ .
x˜ x
Der Wert x ˜ muss dabei nicht im Definitionsbereich von f liegen. Allerdings soll er durch Folgen im Definitionsbereich als Grenzwert erreicht werden k¨ onnen. Dies ist beispielsweise bei Intervallgrenzen der Fall: F¨ ur D := ]0,1[ w¨ are x ˜∈ [0,1] m¨oglich. Gibt es im Definitionsbereich von f auch uneigentlich konvergente Folgen, also solche mit xk → +∞ oder xk → −∞, so k¨onnen wir auch x ˜ = +∞ bzw.
107
8.2 Grundlagen zur Stetigkeit
x ˜ = −∞ w¨ahlen und mit lim f (x)
und
x→+∞
lim f (x)
x→−∞
das Verhalten von f im Unendlichen betrachten.
Beispiel Die Funktion f (x) := x1 ist f¨ ur alle x = 0 definiert. Der links- und rechtsseitige Grenzwert gegen x ˜ := 0 ist lim f (x) = −∞
und
x0
lim f (x) = +∞ .
x0
Im Unendlichen verh¨alt sich f folgendermaßen: lim f (x) = lim f (x) = 0 .
x→−∞
x→+∞
f (x) 4 3 2 1 x −8
−6
−4
−2
−1
2
4
6
8
−2 −3 −4
Stimmen rechts- und linksseitiger Grenzwert u onnen wir die Ein¨berein, so k¨ ˜ bzw. xk > x ˜ auch weglassen und alle Folgen mit xk → x ˜ schr¨ankungen xk < x im Definitionsbereich betrachten. Die Bildfolgen konvergieren dann allesamt gegen den gleichen Wert und wir k¨onnen lim f (x) = y˜
x→˜ x
schreiben.
108
8 Stetigkeit
Beispiel Sei f : R → R, f (x) := x2 . Dann gilt f¨ ur jede Nullfolge (xk ) in R lim f (xk ) = lim x2k = 0 ,
k→∞
k→∞
also insgesamt lim f (x) = 0 .
x→0
(Stetigkeit) Definition Sei f : D → R, D ⊂ R der Definitionsbereich und sei x ˜ ∈ D. f heißt in x ˜ stetig, falls der Grenzwert lim f (x) existiert und x→˜ x
x) lim f (x) = f (˜
x→˜ x
gilt. Ist f in allen Punkten des Definitionsbereichs stetig, so heißt f stetig auf ganz D. ˜ ergibt sich die Schreibweise F¨ ur Folgen mit xk → x lim f (xk ) = f ( lim xk ) .
k→∞
k→∞
Wir k¨onnen uns also merken, dass bei stetigen Funktionen der Limes aus dem Funktionsargument herausgezogen werden darf. Wir betrachten noch einmal das Bild der Funktion f (x) := x1 aus obigem Beispiel. Hier stellt sich die Frage nach der Stetigkeit im Nullpunkt nicht! Sie ist hier gar nicht definiert. Um zu zeigen, dass f in einem Punkt x ˜ nicht stetig ist, gen¨ ugt es, zwei gegen x ˜ ˜ und yk → x ˜ zu finden, deren Bildfolgen nicht den konvergente Folgen xk → x gleichen Grenzwert haben: lim f (xk ) = lim f (yk ) .
k→∞
k→∞
˜, aber lim f (xk ) Alternativ gen¨ ugt auch eine divergente Bildfolge, also xk → x k→∞
existiert nicht. Diverse wichtige Funktionen sind auf ganz R stetig. Dazu geh¨ oren Polynome f (x) := an xn + an−1 xn−1 + . . . + a1 x + a0 , die Exponentialfunktion f (x) := ex sowie Sinus f (x) := sin x und Kosinus f (x) := cos x. Der Logarithmus f (x) := ln x ist zumindest auf seinem gesamten Definitionsbereich R+ stetig. Die Funktion f (x) := x1 ist in x = 0 nicht definiert, sonst aber u ¨berall stetig.
109
8.3 Zusammensetzung stetiger Funktionen
Beispiel x Wir untersuchen die Funktion f (x) := |x| im Punkt x ˜ := 0. Der linksseitige Grenzwert ist x = −1 , lim f (x) = lim x0 x0 −x der rechtsseitige ist lim f (x) = lim
x0
x0
x = +1 . +x
¨ Es ist f¨ ur viele Uberlegungen unproblematisch, wenn eine Funktion nicht auf dem ganzen untersuchten Intervall stetig ist. Dabei kommt ein n¨ utzlicher Begriff ins Spiel: Eine Funktion f heißt auf [a, b] st¨ uckweise stetig, wenn f f¨ ur alle x ∈ [a, b] — mit Ausnahme von endlich vielen Stellen — stetig ist. Wir m¨ochten am Ende noch einen Funktionsverlauf zum Nachdenken zeigen: f (x) 4 3 2 1 x −2
−1
0
1
2
Ist diese Funktion in Null stetig? Sind links- und rechtsseitiger Grenzwert gleich? Das wohl nicht. Und nach der Anschauung erf¨ ullt die Funktion das, was wir intuitiv unstetig nennen. Aber Achtung: Es k¨ onnte sein, dass die Funktion in Null gar nicht definiert ist, dann er¨ ubrigt sich die Frage nach Stetigkeit. Sie scheint zumindest st¨ uckweise stetig. Es lohnt sich nach diesen Gedanken offensichtlich immer, die Voraussetzungen genau zu beachten und alles weitere mathematisch streng zu pr¨ ufen. Durch den Graphen selbst bekommen wir nur Hinweise.
8.3
Zusammensetzung stetiger Funktionen
Wenn bereits Funktionen als stetig bekannt sind, lassen sich daraus wieder neue stetige Funktionen konstruieren. Umgekehrt l¨ asst sich mit der Hilfe der folgenden Regeln f¨ ur die Zusammensetzung von Funktionen sagen, ob diese wieder stetig sind. Dies bringt klare Vorteile, denn wer m¨ ochte schon in jedem
110
8 Stetigkeit
(vermeintlich neuen) Fall die allgemeinen Grenzwertuntersuchungen anstellen? Wir bieten nun wichtige Fakten in kompakter Form:
Satz Summen, Differenzen, Produkte, Quotienten und Kompositionen stetiger Funk tionen sind (dort wo definiert) stetig. Da wir den Stetigkeitsbegriff auf den der Konvergenz von Folgen aufgebaut haben, ergeben sich diese Resultate aus dem Gelernten u ¨ber die Konvergenz von Folgen. Wir wollen daher nur die letzte Aussage kl¨ aren. Seien dazu f1 : D1 → R und f2 : D2 → R stetige Funktionen auf Dk ⊆ R und sei f1 (D1 ) ⊆ D2 . Dann gilt f¨ ur alle Folgen (xk ) in D1 : lim (f2 ◦ f1 )(xk ) = lim f2 (f1 (xk )) k→∞ = f2 lim f1 (xk ) k→∞ = f2 f1 lim xk k→∞ = f2 ◦ f1 lim xk .
k→∞
(weil f2 stetig ist) (weil f1 stetig ist)
k→∞
Somit ist die Hintereinanderausf¨ uhrung f2 ◦ f1 : D1 → R stetig.
Beispiel Nach dem letzten Satz wird nochmals deutlich, dass Polynome stetig sind. Aber auch f¨ ur rationale Funktionen gilt das, denn diese sind ja der Quotient von Polynomen.
8.4
Der Zwischenwertsatz
Folgendes k¨onnen wir uns leicht vorstellen: Sind f¨ ur eine stetige Funktion f auf ihrem Funktionsgraphen zwei Punkte mit (a, f (a)) und (b, f (b)) bezeichnet, dann wird die Funktion auf dem Intervall [a, b] (auf dem sie definiert sein soll) alle Funktionswerte zwischen f (a) und f (b) annehmen. W¨ are ein Wert y ∈ [f (a), f (b)] nicht dabei, dann m¨ usste es einen Sprung im Funktionsgraphen geben, der daf¨ ur verantwortlich ist. Dies w¨are dann aber ein Widerspruch zur Stetigkeit von f .
111
8.4 Der Zwischenwertsatz
f (x) f (b) Hier nimmt f alle Werte an f (a) x a
b
Das ist sehr plausibel, dennoch wollen wir in diesem Fall auf eine konkrete Herleitung nicht verzichten, weil wir dadurch viele weitere n¨ utzliche Dinge lernen k¨onnen. Wir ben¨otigen daf¨ ur das (bereits im Kapitel zum Thema Folgen behandelte) H¨aufungspunktprinzip: F¨ ur eine Folge reeller Zahlen (xn ) in einem abgeschlossenen Intervall [a, b] kann durch fortgesetztes Unterteilen des Intervalls ein H¨ aufungspunkt konstruiert werden, indem in jedem Schritt ein Intervall ausgew¨ ahlt wird, das unendlich viele Folgenglieder enth¨alt. Nun w¨ahlen wir stets das am weitesten rechts liegende der infrage kommenden Intervalle. Damit erhalten wir den oberen H¨ aufungspunkt oder Limes superior der Folge lim xk . W¨ahlen wir hingegen das erste infrage kommende Intervall, dann f¨ uhrt dies zum unteren H¨aufungspunkt bzw. Limes inferior lim xk . Diese Konstruktion k¨onnen wir auch f¨ ur beliebige Teilmengen eines Intervalls durchf¨ uhren, und nicht nur wie bisher auf Folgen. Haben wir dann M ⊆ [a, b] gegeben, teilen wir [a, b] in z. B. zehn Intervalle und w¨ ahlen aus diesen Intervallen jenes aus, welches am weitesten rechts auf der Zahlengeraden liegt und noch unendlich viele Punkte aus M enth¨alt. Durch die Wiederholung dieses Verfahrens, wie beim H¨aufungspunktprinzip beschrieben, erhalten wir wieder einen H¨aufungspunkt, diesmal von M , und zwar durch das hier beschriebene Vorgehen den oberen. Analog k¨onnen wir den unteren H¨ aufungspunkt von M erhalten. Das hier gezeigte Vorgehen wird uns sogleich bei der Erkl¨ arung des folgenden Satzes n¨ utzlich sein.
Satz Seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion mit f (a) < 0 und f (b) > 0. Dann hat f mindestens eine Nullstelle, d. h. es existiert ein β ∈ [a, b] mit f (β) = 0. (Nullstellensatz)
112
8 Stetigkeit
Wir betrachten dazu M := {x ∈ [a, b]|f (x) < 0} ⊆ [a, b]. Dann existiert ein oberer H¨aufungspunkt β ∈ [a, b] von M mit f (β) ≤ 0. Wir zeigen, dass β eine Nullstelle von f ist: Angenommen f (β) < 0, dann w¨ are f aufgrund der Stetigkeit auch in einer ε-Umgebung um β kleiner als Null, also auch f¨ ur ein x ˜ > β. Dies ist dann aber ein Widerspruch dazu, dass β oberer H¨ aufungspunkt ist. Dieser Satz ist n¨ utzlich, wir k¨onnen uns aber noch eine Erweiterung u ¨berlegen: urlich auch, alSei daf¨ ur f (b) > f (a) und c ∈ [f (a), f (b)]. (f (b) < f (a) geht nat¨ les verl¨auft dann analog.) Dann hat die auf [a, b] definierte Hilfsfunktion g(x) := f (x)−c eine Nullstelle β, weil g(a) = f (a)−c < 0 und g(b) = f (b)−c > 0. Daraus folgt dann offensichtlich f (β) = c und damit der nachstehend aufgef¨ uhrte Satz.
Satz Jede stetige Funktion f : [a, b] → R nimmt alle Werte zwischen f (a) und f (b) an. (Zwischenwertsatz)
8.5
Supremum, Infimum, Maximum und Minimum
Wir werden hier einige Grundlagen vorstellen, die uns noch einige Male besch¨ aftigen werden, insbesondere auch bei der Differenziation.
Definition (Maximum, Minimum, Supremum, Infimum) Sei f : D → R. 1. Wir sagen, f nimmt in x ˜ ∈ D das (globale) Maximum an, wenn gilt: f (˜ x) ≥ f (x)
f¨ ur alle x ∈ D,
Schreibweise: f (˜ x) = max f (x). x∈D
Gilt sogar > anstelle des ≥, so sprechen wir von einem strengen Maximum. 2. Wir sagen, f nimmt in x ˜ ∈ D das lokale Maximum an, falls ein ε > 0 existiert, sodass gilt: f (˜ x) ≥ f (x)
f¨ ur alle x ∈ D mit |x − x ˜| < ε.
113
8.6 Maximum und Minimum f¨ ur stetige Funktionen
3. y˜ ∈ R ∪ {±∞} heißt Supremum von f , wenn gilt: i) y˜ ≥ f (x) f¨ ur alle x ∈ D, ii) es existiert eine Folge (xn ) mit Werten in D mit lim f (xn ) = y˜. n→∞
Schreibweise: y˜ = sup f (x). x∈D
Analog dazu werden Minimum (min), lokales Minimum und Infimum (inf) von f definiert. • Jede Funktion hat ein Supremum und ein Infimum. (Dies k¨ onnen wir wie im Beweis des Nullstellensatzes mit dem H¨aufungspunktprinzip f¨ ur Mengen einsehen. Wie m¨ ussten wir dann die Menge M definieren?) • Nicht jede Funktion nimmt ein Maximum oder Minimum an, was wir z. B. an der auf den gesamten reellen Zahlen definierten Funktion f (x) = x sehen. • Jedes globale Maximum ist auch Supremum und lokales Maximum. Ein lokales Maximum muss allerdings kein globales Maximum sein, denn es k¨ onnen (jenseits der in der Definition beschriebenen ε-Umgebung) noch gr¨ oßere Wer¨ te vorkommen. Entsprechende Uberlegungen gelten nat¨ urlich auch f¨ ur Minima.
8.6
Maximum und Minimum fu ¨ r stetige Funktionen
Es gibt im Zusammenhang mit stetigen Funktionen eine Besonderheit, die nicht ¨ nur bei theoretischen Uberlegungen wichtig ist.
Satz Eine stetige Funktion f : [a, b] → R nimmt ihr Maximum und Minimum an.
Wir werden den Beweis f¨ ur das Maximum f¨ uhren (f¨ ur das Minimum verl¨ auft der Beweis wieder analog), denn hierbei sehen wir sehr gut, wie einige bekannte Begriffe wieder vorkommen und erlernte Methoden wirken. Sei also f : [a, b] → R eine stetige Funktion und y˜ = sup f. K¨onnen wir ein x ˜ ∈ [a, b] mit f (˜ x) = y˜ x∈[a,b]
konstruieren, dann ist schon alles erledigt, da y˜ ≥ f (x) f¨ ur alle x ∈ [a, b]. Nach der Definition des Supremums wissen wir von der Existenz einer Folge (xn ) in [a, b] mit lim f (xn ) = y˜. Die Folge (xn ) selbst muss nicht konvern→∞ gieren, aber sie ist durch die Intervallgrenzen beschr¨ ankt und enth¨ alt somit
114
8 Stetigkeit
nach dem H¨aufungspunktprinzip eine konvergente Teilfolge (xnk ) mit Grenzwert x ˜ ∈ [a, b]. Da die Bildfolge (f (xk )) konvergent gegen y˜ ist, konvergiert auch deren Teilfolge (f (xnk )) gegen y˜. Da f stetig ist, gilt f (˜ x) = f lim xnk = lim f (xnk ) = y˜ . k→∞
k→∞
Der Beweis ist eventuell nicht so leicht zu verdauen, insbesondere die Sache mit dem H¨aufungspunktprinzip und der Teilfolge sollten Sie f¨ ur sich nochmals genau kl¨aren und vielleicht auch in den entsprechenden Abschnitten des Buches erneut nachsehen. Wenn Ihnen das momentan zu schwer erscheint, genießen Sie wenigstens das Resultat. Das garantiert uns unter den gegebenen Voraussetzungen also tats¨achlich Maximum und Minimum.
8.7
Aufgaben
1. Bestimmen Sie den maximalen Definitionsbereich D ⊆ R der folgenden Funktion sowie die links- und rechtsseitigen Grenzwerte an s¨ amtlichen Randpunkten: 1 f (x) := e cos x . 2. F¨ ur welche a ∈ R ist die Funktion ln(ax) f (x) := x2 −1 x−1
, x≥1 , x 0. N¨aher m¨ ussen wir noch den Punkt x0 = 1 auf Stetigkeit untersuchen. Hier m¨ ussen der links- und rechtsseitige Grenzwert von f u ¨bereinstimmen. Der linksseitige Grenzwert ist lim f (x) = lim f2 (x) = lim x + 1 = 2
x1
x1
x1
und der rechtsseitige lim f (x) = lim f1 (x) = lim (ln a + ln x) = ln a + ln 1 = ln a .
x1
x1
x1
Setzen wir diese gleich und l¨osen nach a auf, erhalten wir, dass f lediglich f¨ ur a = e2 auf R stetig ist. 3. Da x1 f¨ ur x gegen 0 gegen ±∞ geht, m¨ ussen wir das Grenzverhalten von Sinus, Tangens und Sinus Hyperbolicus im Unendlichen betrachten. Da Sinus und Tangens (nicht konstante) periodische Funktionen sind, k¨ onnen wir verschiedene Nullfolgen (xk ) und (yk ) finden, sodass (f (xk )) und (f (yk )) wie auch (g(xk )) und (g(yk )) gegen unterschiediche Werte konvergieren, womit wir gezeigt h¨atten, dass f und g in 0 nicht stetig erg¨ anzt werden k¨onnen. F¨ ur Sinus Hyperbolicus gilt bereits limx→∞ sinh x = ∞, sodass auch h nicht stetig erg¨anzt werden kann.
116
8 Stetigkeit
4. Polynome sind stetig. F¨ ur die Existens einer Nullstelle ben¨ otigen wir nach dem Zwischenwertsatz also nur noch, dass das Polynom sowohl negative als auch positive Werte annimmt. In der Notation des Zwischenwertsatzes sieht das so aus: Ist f (a) = f1 < 0 und f (b) = f2 > 0, so existiert f¨ ur ur den Wert 0, ein x0 zwischen jeden Wert zwischen f1 und f2 , also auch f¨ a und b mit f (x0 ) = 0, unsere gesuchte Nullstelle. Dass jedes Polynom dritten Grades negative wie auch positive Werte annimmt, sehen wir am besten in der Form
a1 a2 a0 f (x) = x3 a3 + + 2+ 3 . x x x Hier sind n¨amlich die letzten drei Terme in den Klammern Nullfolgen (f¨ ur x gegen ∞ und gegen −∞), sodass der Term x3 a3 das Vorzeichen bestimmt, wenn |x| nur hinreichend groß ist. Und f¨ ur solch große x haben x3 a3 und (−x)3 a3 unterschiedliche Vorzeichen. 5. Nat¨ urlich gibt es Gegenbeispiele zu dieser Aussage, obwohl sich die meisten Leute unter Unstetigkeit wahrscheinlich Graphen mit Sprungstellen vorstellen. Ein Gegenbeispiel haben wir bereits kennen gelernt: sin x1 , x = 0 f (x) := 0 , x=0 ist unstetig in 0, ihr Graph enth¨alt aber keine L¨ ucken, wie man sie sich gemeinhin vorstellt. Vielmehr oszilliert der Graph in der N¨ ahe von x = 0 so stark zwischen −1 und +1 hin und her, dass er jedem Wert zwischen −1 und +1 auf der y-Achse beliebig nahe kommt.
8.8 L¨ osungen
117
Fragen • Was sind links- und rechtsseitige Grenzwerte? • Definieren Sie Stetigkeit und unterst¨ utzen Sie Ihre Erl¨ auterung mit Skizzen. • Wann sind Kompositionen von Funktionen sicher stetig? • Was besagt der Zwischenwertsatz? Zeigen Sie Kernpunkte in einer Skizze. • Definieren Sie die Begriffe Supremum und lokales Minimum. • Was garantiert, dass eine Funktion auf einem abgeschlossenen Intervall ein Maximum hat? • Was ist der Unterschied zwischen Maximum und Supremum?
9 Differenziation
9.1
Motivation
Die Variable in den Natur- und Ingenieurwissenschaften ist die Zeit. Beschreibt die Funktion f (t) einen Prozess in Abh¨angigkeit von der Zeit t, so bleibt der Ablauf des Prozesses nur dann konstant (f (t) ≡ const), wenn keine Ver¨ anderun¨ gen auftreten. Treten allerdings Anderungen auf (steigt oder f¨ allt die Funktion also), so weiß man durch deren Bestimmung auch, was f¨ ur zuk¨ unftige Zeiten ¨ passiert: Die Anderungen sind es ja gerade, die das Geschehen widerspiegeln. ¨ In der Mathematik heißt es, dass die momentane Anderung von f (t), ausgedr¨ uckt u ¨ber ihre so genannte Steigung, durch die Ableitung — anders gesagt: das Differenzieren — bestimmt wird. Um diese zu verstehen, betrachten wir das folgende Bild, welches die Sekante zwischen zwei Punkten an einem Funktionsgraphen darstellt, deren Steigung wir einfach berechnen k¨ onnen.
f (x)
f (x)
Sekante
f (x0 )
x x0
x
Gleichung der Sekante: Δf Δx x + b mit Δf := f (x) − f (x0 ) und Δx := x − x0 . ¨ Die Steigung Δf der Sekante gibt die Anderung von f pro Δx an. M¨ ochten Δx wir aber nun nicht die Steigung der Sekante wissen, sondern die Steigung der © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_9
120
9 Differenziation
Tangente in x0 , so muss Δx immer kleiner werden. Wir m¨ ussen daher den Grenzwert x → x0 betrachten und kommen dadurch zum eigentlichen Kern des Differenzierens, wie es bildlich begreifbar ist:
f (x) Tangente
Sekanten
f (x) f (x0 )
x x0
x
Was passiert also? Der eine (uns von der Steigung her interessierende) Punkt ucken mit dem anderen Punkt immer n¨ aher x0 wird nicht ver¨andert und wir r¨ an x0 heran. Die auftretenden Sekanten gehen dann — im Laufe des Grenzwertprozesses — in die Tangente u ¨ber. Wir sehen, dass sich der Hauptgedanke des Differenzierens, n¨ amlich das Bestimmen der Steigung einer Funktion in einem Punkt, quasi von selbst motiviert. ¨ Die Frage nach der Steigung f¨ uhrt n¨amlich direkt auf die hier gemachten Uberlegungen und es ist heute kaum noch zu verstehen, welch grandiose Leistung diese Entdeckungen f¨ ur Leibniz, Newton und die Mathematisierung der Natur bedeuteten.
9.2
Grundlagen zur Differenziation
Die zuvor gegebene Motivation enth¨alt eigentlich alles, was wir zum Verst¨ andnis ben¨otigen. Die einzige Aufgabe bleibt, das in den Skizzen dargestellte Vorgehen zu formalisieren, was in der folgenden Definition geschieht. Bitte betrachten Sie zum Verst¨andnis nochmals genau die obige Skizze!
(Differenzierbarkeit, Ableitung) Definition Sei f : I → R eine Funktion, definiert auf einem Intervall I ⊆ R. f ist in x0 ∈ I differenzierbar, wenn der Grenzwert f (x0 ) := lim
x→x0
f (x) − f (x0 ) x − x0
(Differenzialquotient)
121
9.2 Grundlagen zur Differenziation
existiert. f (x0 ) heißt dann Ableitung von f in x0 . Die Funktion f heißt differenzierbar auf I, wenn f in allen x0 ∈ I differenzierbar ist. ¨ Nach unseren Uberlegungen gibt die Ableitung also die Steigung von f im ¨ betrachteten Punkt an und beschreibt somit die lokale Anderung von f . • Eine alternative Schreibweise — mit der sich zumeist etwas besser rechnen l¨asst — ist f (x + h) − f (x) . f (x) := lim h→0 h Woher dies kommt, sehen wir im folgenden Bild:
f (x) Tangente
Sekanten
f (x + h) f (x)
x x
x+h
Was hat sich zu unserem vorherigen Bild ver¨ andert? Nichts (von Substanz). Der betrachtete Punkt heißt diesmal einfach x anstatt x0 . Das x0 konnten wir nat¨ urlich vorher auch frei im betrachteten Bereich w¨ ahlen, aber nun einfach ein x zu betrachten befreit uns vom Diktat, das ganze immer x0 zu nennen. Ferner wurde der Abstand von unserem hier untersuchten Punkt x einfach h genannt. Alles bleibt also gleich, nur die Bezeichnungen sind etwas bequemer geworden. df • H¨aufig schreiben wir statt f auch dx oder, wenn f von der Zeit abh¨ angt, f˙ (diese Schreibweise wird von den Physikern sehr gerne verwendet). Dabei haben wir f bzw. f an der Stelle von f (x) bzw. f (x) geschrieben. Dies ist keine Unterlassung, sondern einfach nur eine gebr¨ auchliche Abk¨ urzung.
• In der Definition wird alles auf einem Intervall I betrachtet. Zumeist wird dies als offen angenommen bzw. gew¨ahlt, weil das in der Theorie Vorteile bringt. In den Naturwissenschaften ist dadurch — Ausnahmen best¨ atigen nur diese Regel — eigentlich kein Ungemach zu erwarten. Es kann allerdings
122
9 Differenziation
auch sein, dass wir an der Differenzierbarkeit auf einer Menge interessiert sind, die nicht aus einem St¨ uck besteht, wie wir es uns als Intervall vorstellen k¨onnen. Eine Funktion kann auch auf solchen Mengen differenzierbar sein. Analog zu st¨ uckweise stetigen Funktionen sprechen wir auch von st¨ uckweise differenzierbaren Funktionen.
Beispiel Sei f : R → R, f (x) := x2 . Es gilt f (x + h) − f (x) (x + h)2 − x2 2hx + h2 = = = 2x + h h h h und somit ist f (x) = lim 2x + h = 2x . h→0
Die Funktion f (x) := |x| ist in x0 := 0 nicht differenzierbar, denn |0 + h| − |0| |h| = h h ist f¨ ur h → 0 nicht konvergent.
Manchmal wollen wir noch etwas mehr als nur Differenzierbarkeit. Aus theoretischen Gr¨ unden ist es n¨amlich teils notwendig, dass die Ableitung einer Funktion auch wieder angenehme Eigenschaften hat. Den Fall mehrfach differenzierbarer Funktionen werden wir noch behandeln. Oft gen¨ ugt es aber, wenn die Ableitung einer Funktion wenigstens stetig ist:
Definition (stetig differenzierbar) Eine Funktion f heißt stetig differenzierbar, wenn f existiert und f selbst wieder eine stetige Funktion ist. Die von uns wesentlich behandelten Funktionen (wie Exponentialfunktion, Polynome, Sinus, ...) sind stetig differenzierbar, Ausnahmen sind tats¨ achlich selten. Dennoch ist es beim Beweis von S¨atzen wirklich vielfach n¨ otig, diese Eigenschaft zu fordern, damit alles klappt.
9.3
Rechenregeln fu ¨ r Ableitungen
Wollen wir mit differenzierbaren Funktionen arbeiten, sind h¨ aufig einige Regeln von Vorteil, durch welche das Rechnen erleichtert wird. Diese stellen wir hier, wesentlich ohne Beweis, zusammen.
123
9.3 Rechenregeln f¨ ur Ableitungen
Wenn f und g differenzierbar sind, so sind auch die folgenden Funktionen — wo die Ausdr¨ ucke definiert sind — differenzierbar und deren Ableitungen sehen folgendermaßen aus: (f + g) (x) = f (x) + g (x)
(c · f ) (x) = c · f (x)
(Linearit¨ at)
(f · g) (x) = f (x) · g(x) + f (x) · g (x) f f (x) · g(x) − f (x) · g (x) (x) = g g 2 (x)
(Produktregel)
(f ◦ g) (x) = f (g(x)) · g (x) 1 (f −1 ) (x) = −1 f (f (x))
(Kettenregel)
(Quotientenregel)
(Ableitung der Umkehrfunktion)
Hierbei ist c eine konstante reelle Zahl. Die Regeln haben also Namen, die Sie sich dringend merken sollten, denn sie tauchen immer wieder auf. Die ersten beiden Eigenschaften sind Hauptthema der Linearen Algebra und besagen, dass es sich beim Differenzieren um eine lineare Abbildung (auf der Menge der differenzierbaren Funktionen) handelt. Die letzte Gleichung, welche uns oft eine immense Rechenersparnis bietet, wollen wir herleiten. Dazu differenzieren wir beide Seiten der Gleichung f (f −1 (x)) = x, die ja die Umkehrfunktion f −1 einer Funktion f charakterisiert (f −1 nimmt dabei die Rolle von g in oben aufgef¨ uhrter Kettenregel ein) und wir starten mit (f (f −1 (x))) = (x) . Nach der Kettenregel ist f (f −1 (x)) · (f −1 ) (x) = 1, und es folgt durch Umstellen
(f −1 ) (x) =
1 . f (f −1 (x))
Wir wollen dies gleich an einem Beispiel u ¨ben.
Beispiel Wir berechnen die Ableitung der Wurzelfunktion, indem wir sie als Umkehr-
124
9 Differenziation
funktion von f (x) := x2 wahrnehmen: √ f −1 (x) = x f (x) = 2x ⇒
(f −1 ) (x) =
1 1 √ = √ f ( x) 2 x
In Klausuren soll es vorkommen, dass Sie bestimmte Ableitungen im Kopf (oder in Ihren Unterlagen — wenn zur Klausur erlaubt) haben sollten. Daher geben wir Ihnen einige weitere Ableitungen an:
Beispiel
(tan x) =
sin x cos x
=
cos2 x + sin2 x cos2 x
= 1 + tan2 x 1 1 (arctan x) = = tan (arctan x) 1 + tan2 (arctan x) 1 = 1 + x2 1 1 1 = = (arcsin x) = cos(arcsin x) sin (arcsin x) 2 1 − sin (arcsin x) 1 1 − x2 1 1 1 = (arsinh x) = = cosh(arsinh x) sinh (arsinh x) 1 + sinh2 (arsinh x) =√
=√
1 1 + x2
Bitte versuchen Sie, diese Ableitungen zu verstehen. An dieser Stelle wird es auch sp¨atestens Zeit daran zu erinnern, dass die Aufgaben integraler Bestand¨ teil dieses Buches sind. Dort finden Sie weitere Ubungen zum Ableiten, die vollst¨andig gel¨ost sind und einfach nicht umgangen werden sollten. Es geht n¨amlich noch immer um den Unterschied zwischen dem Kennen und dem Beherrschen des Stoffes. Wir m¨ochten abschließend noch eine wichtige Bemerkung machen, deren Kenntnis Sie vor vielen Problemen bewahren kann.
9.4 Der Mittelwertsatz und Folgerungen daraus
125
Sei f : D → R eine auf D ⊂ R differenzierbare Funktion. Dann gilt f¨ ur alle y ∈ D die folgende Rechnung: f (x) − f (x0 ) (x − x0 ) x − x0 f (x) − f (x0 ) · lim (x − x0 ) = lim x→x0 x→x0 x − x0 = f (x0 ) · 0 = 0.
lim (f (x) − f (x0 )) = lim
x→x0
x→x0
Dies besagt aber gerade, dass lim f (x) = f (x0 ) gilt und wir erhalten als x→x0
wichtiges Resultat: Jede differenzierbare Funktion ist stetig. Ferner k¨ onnen wir uns nun gut vorstellen, dass differenzierbare Funktionen keine, nennen wir es z. B. bei der Betragsfunktion so, Ecken oder Kanten haben d¨ urfen, um die Kriterien f¨ ur Differenzierbarkeit anschaulich zu erf¨ ullen. Leider wird dieser Zusammenhang oft nicht gekannt oder vergessen. Das darf nicht passieren; insbesondere sollten Sie sich merken, dass die Umkehrung nicht gilt. Es gibt also durchaus u ¨berall stetige Funktionen, die nicht u ¨berall differenzierbar sind. Wir werden nachfolgend ein Beispiel behandeln, zu dem wir beabsichtigt keine Skizze zeigen. Manchmal ist es n¨ amlich hilfreich, sich ein eigenes Bild im Kopf zu machen, das wir allerdings textlich unterst¨ utzen.
Beispiel Denken Sie an die Betragsfunktion f (x) = |x|. Diese besteht nur aus den Teilen der beiden Winkelhalbierenden in der oberen Halbebene des Koordinatensystems und ist stetig in allen Punkten von R, was inzwischen klar sein sollte. Aber was passiert zum Nullpunkt hin, wenn wir die Tangentensteigungen f¨ ur den linken Ast betrachten? Die Tangenten verlaufen parallel zu diesem Ast, haben also die Steigung −1, f¨ ur den anderen Ast haben wir hingegen die Steigung +1. Offensichtlich ist also der linksseitige Grenzwert des Differenzialquotienten ungleich dem rechtsseitigen, egal, wie nahe wir dem Ursprung kommen. Folglich liegt f¨ ur x = 0 keine Differenzierbarkeit vor.
9.4
Der Mittelwertsatz und Folgerungen daraus
Wir betrachten folgendes Bild:
126
9 Differenziation
f (x) Tangente mit der Steigung f (ξ)
Sekante mit der Steigung
f (b)−f (a) b−a
x a
ξ
b
F¨ ur Intervalle [a, b] im Definitionsbereich einer Funktion scheint es immer einen Punkt ξ ∈ ]a, b[ zu geben, f¨ ur den die Tangente an den Funktionsgraphen parallel zur Sekante durch die zu den Intervallr¨andern geh¨ orenden Punkte ist. Nat¨ urlich ist dies kein Beweis! Dennoch k¨onnen wir uns den Spaß machen und beliebige andere (differenzierbare) Funktionen zeichnen, die gefundene Aussage bleibt gleich.
Satz Sei f : I → R differenzierbar auf I. Sind a, b ∈ I, a < b, beliebig, so existiert ein ξ ∈ ]a, b[ mit f (b) − f (a) f (ξ) = . b−a (Mittelwertsatz der Differenzialrechnung)
Hieraus ergibt sich der folgende Satz:
Satz Sei M ≥ 0. Ist |f (x)| < M f¨ ur alle x ∈ [a, b], so gilt |f (b) − f (a)| < M (b − a) . (Schrankensatz)
Dies ist sehr einfach einzusehen, wenn man den Mittelwertsatz akzeptiert und die Voraussetzung |f (x)| < M beachtet. Dann gilt f (b) − f (a) b − a = |f (ξ)| < M .
127
9.5 H¨ ohere Ableitungen
Mit dem Mittelwertsatz l¨asst sich noch ein weiterer Satz leicht zeigen, der vielfach verwendet werden kann, da er die Monotonie einer Funktion einfach aus dem Bilden der Ableitung erkennbar macht. Und der Wissenschaftler interessiert sich nun mal h¨aufig daf¨ ur, ob eine Funktion monoton w¨ achst (z. B. die Brottosozialprodukts-Funktion) oder monoton f¨ allt (z. B. die KerntemperaturFunktion eines u ¨berhitzten Reaktor-Brennstabes).
Satz Sei f : I → R differenzierbar auf dem Intervall I und sei f (x) > 0 f¨ ur alle x ∈ I. Dann gilt f¨ ur a, b ∈ I a 0, so muss also auch f (b) − f (a) > 0 gelten. Ist f negativ, so (a) . Aus b − a > 0 folgt damit f (b) − f (a) < 0, was den Beweis des auch f (b)−f b−a Monotoniekriteriums beschließt.
Gilt lediglich f (x) ≤ 0 bzw. f (x) ≥ 0, so k¨onnen wir mit der gleichen Arguur alle x ∈ I, mentation f (a) ≤ f (b) bzw. f (a) ≥ f (b) folgern. Ist f (x) = 0 f¨ so folgt damit, dass f auf I konstant ist. Das ist das so genannte Konstanzkriterium. Dieses findet besonders in der Physik h¨ aufig Anwendung, weil hier alleine u ¨ber die Kenntnis der Ableitung nahezu alles u ¨ber die Funktion gesagt wird und in der Physik oft Aussagen u ber die Ableitung bekannt sind, nicht ¨ aber u ber die Funktion selbst. Denken wir z. B. daran, dass die Geschwindigkeit ¨ (Ableitung der Funktion des Ortes) eines Teilchens gleich Null ist, dann erkennen wir jetzt sofort, dass der Ort selbst sich nicht ¨ andert; die ihn beschreibende Funktion bleibt n¨amlich nach dem Konstanzkriterium konstant.
9.5
H¨ ohere Ableitungen
Ist eine Funktion f differenzierbar, und ist ihre Ableitung f wiederum differenzierbar, so erh¨alt man durch erneutes Differenzieren die so genannte zweite Ableitung: df d2 f d = . f := (f ) = dx dx dx2
128
9 Differenziation
Ist die zweite Ableitung wieder differenzierbar, so k¨ onnen wir die dritte Ableitung bilden und so fort. Falls die Funktion insgesamt k-mal differenzierbar ist, erhalten wir die k-te Ableitung f (k) =
dk f . dxk
ufunEs kommt h¨aufig vor, dass f k anstatt f (k) geschrieben wird (zumeist in Pr¨ gen). Das ist aber grob verwirrend, denn die Klammern um das k herum sind gerade deshalb da, um Verwechselungen mit der Potenz zu vermeiden. Es bleibt die Frage, was die 0-te Ableitung ist? Sie wird als f (0) := f definiert, also als die Funktion selbst.
Beispiel Hat man in einer physikalischen Anwendung eine zweimal differenzierbare Funktion f¨ ur die Position eines Teilchens x(t) von der Zeit t gegeben — auch als Ortsfunktion bezeichnet — so nennen wir die erste Ableitung die Geschwindigkeit des Teilchens v(t) = x(t). ˙ Die zweite Ableitung heißt Beschleunigung: a(t) = v(t) ˙ =x ¨(t). Die u ¨blichen Formelzeichen ergeben sich durch velocity und acceleration.
Wir kommen sp¨ater, insbesondere bei den Taylorpolynomen und Extremwerten, noch auf h¨ohere Ableitungen zur¨ uck. Dort werden wir dann auch noch diverse Beispiele zur Berechnung sehen.
9.6
Ausflug: Sinus, Kosinus und Exponentialfunktion
Wir hatten bereits bemerkt, dass es bei der Untersuchung des Geschehens in Natur und Technik oft vorkommt, dass uns dessen Beschreibung nur u ¨ber eine Funktion und ihre Ableitung(en) gelingt. So interessieren uns bei einem Teilchen (wie oben bereits behandelt) zumeist die Position (die Ortsfunktion), die Geschwindigkeit (Ableitung der Ortsfunktion) und die Beschleunigung, die dieses erf¨ahrt (Ableitung der Ableitung der Ortsfunktion). Suchen wir nun die Ortsfunktion selbst, sind uns aber u ¨ber eine Gleichung (oder eine Messung)
9.6 Ausflug: Sinus, Kosinus und Exponentialfunktion
129
nur die Ableitungen der gesuchten Ortsfunktion zug¨ anglich, m¨ ussen wir genau diese Gleichung verwenden, um unser Ziel zu erreichen. Bei der mathematischen Beschreibung nat¨ urlicher Prozesse treten sehr h¨ aufig solche so genannten Differenzialgleichungen auf. Dies sind also — wir fassen zusammen — Gleichungen, in denen eine zu bestimmende Funktion zusammen mit ihren Ableitungen vorkommt oder gar nur Ableitungen der Funktion selbst. Dies zeigen wir im Folgenden exemplarisch und stellen damit den Sinus und Kosinus auf eine fe¨ ste mathematische Grundlage. F¨ ur weitere Uberlegungen verweisen wir auf die Kapitel zum Thema Differenzialgleichungen im Teil zur Linearen Algebra. Bitte beachten Sie, dass unsere Ausf¨ uhrungen im hier gesetzten Rahmen l¨ uckenhaft bleiben m¨ ussen. So machen wir u. a. in heimlicher Stille vom Existenz- und Eindeutigkeitssatz f¨ ur gew¨ohnliche Differenzialgleichungen Gebrauch, der hier eigentlich nicht Thema ist. Dennoch halten wir unseren Ansatz f¨ ur voll vertretbar, denn durch das Akzeptieren einiger mathematischer Tatsachen wird klar, was sonst nur mit einem deutlich gr¨oßeren Apparat erreichbar gewesen w¨ are, der an dieser Stelle wohl mehr verschleiert als enth¨ ullt. Es handelt sich aber an dieser Stelle wirklich nur um einen Ausflug, der uns neue Einsichten bietet, ohne dass wir am Ausflugsort verweilen m¨ochten.
9.6.1
Schwingung eines Pendels
Wir betrachten ein Federpendel idealisiert, d. h. ohne St¨ orungen wie Reibung, mit der Masse m und der Federkonstanten k.
m
Die Kraft F bei der Auslenkung y(t) des Pendels ist proportional zu y(t) und zu k, also F (t) = −ky(t) (das Vorzeichen entspringt wesentlich einer Konvention). Durch das zweite Newtonsche Gesetz folgt F = m¨ y und damit m¨ y (t) + ky(t) = 0 f¨ ur alle t. Dies ist eine so genannte Differenzialgleichung (homogen, linear, zweiter Ordnung; mehr dazu im entsprechenden Kapitel). Da hier ein Pendel beschrieben wird ist klar, dass eine periodische L¨osungsfunktion y(t) zu erwarten ist.
130
9 Differenziation
Wir behandeln ab jetzt den einfachen Fall m = k = 1, also y¨(t) + y(t) = 0 f¨ ur alle t. Wichtig f¨ ur die Bewegung des Pendels sind • die Anfangsauslenkung y(0) und • die Anfangsgeschwindigkeit y(0) ˙ Sind die Anfangswerte vorgegeben, so hat das so genannte Anfangswertproblem — also die Differenzialgleichung zusammen mit den Anfangswerten — genau eine L¨osung, wie aus der Therorie der Differenzialgleichungen gelernt werden kann. Wir w¨ahlen besonders einfache Anfangswerte y(0) = 0 ,
y(0) ˙ = 1 einerseits und andererseits
y(0) = 1 ,
y(0) ˙ =0.
Die L¨osungsfunktionen nennen wir y(t) = sin t
9.6.2
bzw.
y(t) = cos t .
Eigenschaften von Sinus und Kosinus
Bitte beachten Sie, dass unsere Aussagen erneut wesentlichen Gebrauch von der Theorie der Differenzialgleichungen machen. Erschrecken Sie also nicht, wenn Ihnen einige — als Fakten pr¨asentierte — Aussagen neu erscheinen. Nach der Differenzialgleichung, die Sinus und Kosinus erf¨ ullen, gilt (Punkte an den Funktionen bedeuten Ableitungen) (sin) (t) = − sin t
und
(cos) (t) = − cos t
(9.1)
und nach den Anfangswerten sin 0 = 0 ,
(sin) (0) = 1
und
cos 0 = 1 ,
(cos) (0) = 0 .
Leiten wir jeweils beide Seiten von (9.1) ab, sehen wir, dass die Ableitung g(t) := (sin) (t) von Sinus und die Ableitung h(t) := (cos) (t) von Kosinus die gleiche Differenzialgleichung erf¨ ullen wie Sinus und Kosinus auch. Ihre Anfangswerte sind ˙ = (sin) (0) = − sin 0 = 0 sowie g(0) = (sin) (0) = 1 und g(0) ˙ = (cos) (0) = − cos 0 = −1. h(0) = (cos) (0) = 0 und h(0)
9.6 Ausflug: Sinus, Kosinus und Exponentialfunktion
131
g(t) erf¨ ullt also das gleiche Anfangswertproblem wie cos t und muss mit diesem ¨ identisch sein. Ahnlich erf¨ ullt h(t) das gleiche Anfangswertproblem wie − sin t und muss damit identisch sein. Wir haben somit herausgefunden, dass (sin) (t) = cos t
und
(cos) (t) = − sin t .
Ebenso erf¨ ullt − sin(−t) das gleiche Anfangswertproblem wie sin t und cos(−t) erf¨ ullt das gleiche wie cos t. Somit gilt auch sin(−t) = − sin t
(Sinus ist ungerade),
cos(−t) = cos t
(Kosinus ist gerade).
Die Ableitung von sin2 t + cos2 t ist (nach der Kettenregel oder Produktregel, ganz wie Sie wollen) 2 sin t cos t + 2 cos t(− sin t) = 0. Somit ist sin2 t + cos2 t konstant und diese Konstante k¨onnen wir bei t = 0 bestimmen, denn daf¨ ur kennen wir bereits die Werte: sin2 0 + cos2 0 = 02 + 12 = 1. Also gilt f¨ ur alle t∈R sin2 t + cos2 t = 1 . Wir wollen unsere Untersuchungen nicht zu weit f¨ uhren und gehen nun zur¨ uck zum Anfang unserer Betrachtungen zu Sinus und Kosinus, nach denen diese Funktionen als L¨ osungen einer Schwingungsgleichung periodisch sein m¨ ussen; die Periode ist hier jeweils 2π. Auch dies l¨asst sich nat¨ urlich beweisen. F¨ ur die Funktiongraphen und einige andere Informationen der genannten Funktionen verweisen wir Sie zur¨ uck auf das Kapitel u ¨ber wichtige Funktionen.
9.6.3
Exponentialfunktion
Noch eine weitere Funktion l¨asst sich in diesem Ausflug genauer behandeln: Die Exponentialfunktion ist die Funktion, welche sich beim Ableiten selbst reproduziert, also die Differenzialgleichung y − y = 0 erf¨ ullt. Diese ist die Funktion im Bereich der Ingenieur- und Naturwissenschaften, welche bei Wachstums- und Zerfallsprozessen die Hauptrolle spielt. Wiederum erhalten wir durch Vorgabe von Anfangswerten, diesmal y(0) = 1, eine eindeutige L¨osungsfunktion des Anfangswertproblems, n¨ amlich y(x) = exp x = ex .
132
9.7
9 Differenziation
Die Regel von l’Hospital
Inzwischen haben wir nun gute Kenntnisse im Bereich des Ableitens und wissen bereits einiges u ahigkeiten. ¨ber die Anwendungsm¨oglichkeiten der erworbenen F¨ Es gibt aber noch ein wenig mehr, das wir wissen sollten, n¨ amlich eine einfache Regel zum Berechnen von Grenzwerten von Verh¨ altnissen. Wenn wir n¨ amlich lim
x→x0
f (x) g(x)
berechnen m¨ochten, aber sowohl die Z¨ahler- als auch die Nennerfunktion gegen 0 gehen, was erwarten wir dann? Existiert dennoch ein Grenzwert? Wie untersuchen wir dies? Nun, wir machen von dem Erlernten u ¨ber die Bedeutung der Ableitung Gebrauch: Nahe bei x0 werden f und g durch ihre Tangenten mit Steigungen f (x0 ) bzw. g (x0 ) approximiert. Je n¨ aher wir also an diesen Punkt x0 kommen, desto weniger Unterschied gibt es zwischen den Funktionen und der Approximation. Demnach k¨onnen wir einsehen, dass auch das Verh¨ altnis der Funktionen im Grenzwert dem Verh¨altnis ihrer Tangenten an x0 entspricht. Und letzteres ist sehr einfach zu bestimmen: Die Tangentengleichungen sind tf (x) = f (x0 )(x − x0 )
und
tg (x) = g (x0 )(x − x0 ) ,
denn die Ableitungen geben ja gerade die Steigungen der Funktionen in x0 an und nach unserer Voraussetzung haben beide Funktionen bei x0 eine Nullstelle. F¨ ur das Verh¨altnis der Tangenten folgt: lim
x→x0
tf (x) f (x0 )(x − x0 ) f (x0 ) f (x0 ) = lim = lim = . tg (x) x→x0 g (x0 )(x − x0 ) x→x0 g (x0 ) g (x0 )
Wir k¨onnen also in solch einem Fall die Funktionen durch ihre Ableitungen ersetzen. Diesen Sachverhalt hat Guillaume Fran¸cois Antoine, Marquis de l’Hospital (1661 – 1704) herausgefunden und exakt bewiesen, dessen Satz nun folgt, nat¨ urlich in einer pr¨aziseren und allgemeineren Variante als wir ihn gerade erdacht haben.
Satz Seien f, g : I → R auf dem offenen Intervall I differenzierbar, und f¨ ur x 0 ∈ R gelte entweder lim f (x) = lim g(x) = 0 x→x0
x→x0
oder lim f (x), lim g(x) ∈ {±∞}.
x→x0
x→x0
ur alle x in einer Umgebung von x0 und Ferner sei g (x) = 0 f¨ lim
x→x0
f (x) =α g (x)
mit α ∈ R ∪ {±∞}.
133
9.7 Die Regel von l’Hospital
Dann gilt lim
x→x0
f (x) = α. g(x)
(Regel von l’Hospital)
Den Fall, in dem f und g gegen unendlich gehen, haben wir oben indirekt behandelt, denn er ergibt sich, wenn wir die Kehrwerte der Funktionen betrachten: 1 f (x) g(x) = lim 1 . lim x→x0 g(x) x→x0 f (x) Mit f (x), g(x) → ∞ gehen nun sowohl der Z¨ ahler gegen 0 und das kennen wir bereits.
1 g(x)
wie der Nenner f (x) x→x0 g(x)
In der Formulierung des Satzes sehen wir weiterhin, dass wir lim direkt durch
f (x0 ) g (x0 )
f (x) , x→x0 g (x)
ersetzen d¨ urfen, sondern durch lim
1 f (x)
nicht
und das auch
nur, wenn jener Term definiert ist. Dennoch kommt diese Regel tats¨ achlich oft auch bei Berechnungen in der Praxis vor. Viele Grenzwerte bekommt man ohne ihre Verwendung gar nicht heraus; also dringend merken.
Beispiel • Wir starten mit einem Standardbeispiel: cos x sin x = lim = cos(0) = 1 lim x→0 x x→0 1 • Das Prinzip ist schon aus dem Satz selbst klar. Wir wollen daher noch etwas (nicht offensichtliches) untersuchen, was uns auch neue Einblicke beim Bilden einer speziellen Ableitung liefert. Wir betrachten lim xx
x0
und machen zuerst folgende Umformung xx = ex·ln x . Da die Exponentialfunktion stetig ist, k¨onnen wir den Limes in den Exponenten ziehen und uns auf diesen konzentrieren: ln x x · ln x = 1 . x
Z¨ahler und Nenner divergieren hier f¨ ur den betrachteten Grenzwert und nach l’Hospital folgt: 1 ln x lim 1 = lim x1 = lim −x = 0. x0 x0 − 2 x0 x x Insgesamt ist limx0 xx = e0 = 1.
134
9.8
9 Differenziation
Aufgaben
1. Berechnen Sie die Ableitung des nat¨ urlichen Logarithmus g(x) := ln x, indem Sie die Funktion als Umkehrabbildung der Exponentialfunktion f (x) := ex auffassen. 2. Zeigen Sie, dass die Ableitung einer geraden Funktion ungerade ist und dass die Ableitung einer ungeraden Funktion gerade ist. 3. Differenzieren Sie die Funktionen √ √ x f1 (x) := 1 − cos x , f2 (x) := ln x , f3 (x) := e(e ) , f4 (x) := arccos x . 4. Zeigen Sie mit Hilfe des Mittelwertsatzes ex ≥ 1 + x . 5. Die Exponentialfunktion y(x) := ex gen¨ ugt dem Anfangswertproblem y = y ,
y(0) = 1 .
Leiten Sie daraus die Eigenschaften e−x = her.
1 ex
sowie ex > 0 f¨ ur alle x ∈ R
Hinweis: Betrachten Sie die Hilfsfunktion f (x) := y(x)y(−x). ¨ 6. Uberpr¨ ufen Sie jeweils, ob die Voraussetzungen f¨ ur den Satz von l’Hospital erf¨ ullt sind und berechnen Sie die Grenzwerte: 1 − cos x , sin x sinh x , lim x→∞ cosh x ln x , lim x→1 x − 1
lim
x→0
9.9
1 − cos x sin x2 x lim x→∞ sinh x ln x lim , k > 0. x→∞ xk lim
x→0
L¨ osungen
1. Es ist g = f −1 und damit g (x) = f −1 (x) =
1 1 1 1 = = ln x = . f (f −1 (x)) f (g(x)) e x
2. Gerade Funktionen f sind durch die Gleichung f (−x) = f (x) charakterisiert. Leiten wir diese Gleichung ab: −f (−x) = f (x) ,
135
9.9 L¨ osungen
so erhalten wir die charakterisierende Gleichung f¨ ur ungerade Funktionen. f ist also ungerade. Differenzieren wir andererseits die Gleichung g(−x) = −g(x), welche ungerade Funktionen beschreibt, so erhalten wir −g (−x) = −g (x) , was uns nach K¨ urzen des Vorzeichens g als gerade Funktion u uhrt. ¨berf¨ √ 3. Vorweg zur Erinnerung die Ableitung der Wurzelfunktion: ( x) = 2√1 x . √
1 sin x = √ · (1 − cos x) = √ 2 1 − cos x 2 1 − cos x √ √ 1 1 1 1 f2 (x) = ln x = √ · x =√ · √ = 2x x x 2 x
x x x x f3 (x) = e(e ) = e(e ) · (ex ) = e(e ) · ex = e(e +x)
f1 (x) =
1 − cos x
f4 (x) = (arccos x) =
1 cos (arccos x)
=
1 − sin(arccos x)
−1 −1 =√ = 2 1 − x2 1 − cos (arccos x)
4. F¨ ur x < 0 w¨ahlen wir die Intervallgrenzen beim Mittelwertsatz zu a := x und b := 0:
⇒
1 − ex e 0 − ex = 0−x −x ξ x − xe = 1 − e
⇒
ex = 1 + xeξ
eξ =
Schließlich ist f¨ ur negative x xeξ > x. F¨ ur x > 0 w¨ahlen wir die Intervallgrenzen beim Mittelwertsatz zu a := 0 und b := x:
⇒
ex − 1 e x − e0 = x−0 x xeξ = ex − 1
⇒
ex = 1 + xeξ
eξ =
Schließlich ist wiederum f¨ ur positive x: xeξ > x. Fehlt noch der Fall x = 0, wo Gleichheit herrscht: e0 = 1 + 0 . 5. Wir leiten zun¨achst einmal die Hilfsfunktion ab: f (x) = y (x)y(−x) + y(x)(−y (−x)) = y(x)y(−x) − y(x)y(−x) = 0 .
136
9 Differenziation
Somit ist f konstant und mit dem Anfangswert erhalten wir die Konstante f (0) = y(0)y(−0) = 1. Wir haben also den ersten Teil der Aufgabe gezeigt, denn e−x = y(−x) =
1 1 = x . y(x) e
Angenommen, es g¨abe ein x0 > 0 mit y(x0 ) ≤ 0. Nach dem Zwischenwertsatz g¨abe es dann eine Nullstelle b mit 0 < b ≤ x0 . Falls es mehrere solcher Nullstellen gibt, nehmen wir die kleinste, sodass y auf dem Intervall [0, b[ positiv ist. (Beachten Sie, dass y differenzierbar und damit auch stetig ist.) Der Mittelwert sagt nun aber ein ξ ∈ ]0, b[ mit y (ξ) =
−1 y(b) − y(0) = 0 f¨ ur alle x > 0. F¨ ur x < 0 ergibt sich die Behauptung dann einfach daraus, dass wir bereits wissen: e−x = e1x Der Fall x = 0 ist schließlich durch den Anfangswert direkt geregelt.
6. Um die Voraussetzungen des Satzes von l’Hospital zu pr¨ ufen, vergleichen wir jeweils die Grenzwerte von Z¨ahler und Nenner: lim (1 − cos x) = lim sin x = 0
x→0
x→0
lim (1 − cos x) = lim sin x2 = 0
x→0
x→0
lim sinh x = lim cosh x = ∞
x→∞
x→∞
lim x = lim sinh x = ∞
x→∞
x→∞
lim ln x = lim (x − 1) = 0
x→1
x→1
lim ln x = lim xk = ∞
x→∞
x→∞
Demnach sind u ullt und wir d¨ urfen versu¨berall die Voraussetzungen erf¨ chen, die Grenzwerte u ber die Ableitungen von Z¨ a hler und Nenner zu ¨
137
9.9 L¨ osungen
bestimmen: 1 − cos x sin x 0 = lim = =0 x→0 x→0 cos x sin x 1 1 − cos x sin x lim = lim = ? (siehe unten) x→0 sin x2 x→0 2x cos x2 sinh x cosh x = lim =? (siehe unten) lim x→∞ cosh x x→∞ sinh x x 1 = lim =0 lim x→∞ sinh x x→∞ cosh x 1 ln x = lim x = 1 lim x→1 x − 1 x→1 1 1 ln x 1 x lim k = lim = lim =0 k−1 x→∞ x x→∞ kx x→∞ kxk lim
Beim zweiten Bruch haben wir nach der Anwendung des Satzes von l’Hospital ¨ahnliche Schwierigkeiten wie zuvor, denn die Ableitungen von Z¨ahler und Nenner konvergieren beide gegen 0: lim (sin x) = lim 2x cos x2 = 0 .
x→0
x→0
Somit erf¨ ullt der Bruch der Ableitungen erneut die Voraussetzungen des Satzes von l’Hospital und wir k¨onnen einfach den Satz noch einmal anwenden: lim
x→0
1 − cos x sin x cos x 1 = lim = lim = . x→0 2x cos x2 x→0 2 cos x2 − 4x2 sin x2 sin x2 2
Beim dritten Bruch bringt uns selbst nochmaliges Anwenden des Satzes von l’Hospital nicht weiter. Wir erhalten lediglich, womit wir begonnen haben. Vielleicht hilft uns die Darstellung der Hyperbolicusfunktionen mit der Exponentialfunktion weiter: 1 x −x 1 − e−2x ) sinh x 2 (e − e = lim = lim 1 x =1. lim −x ) x→∞ cosh x x→∞ x→∞ (1 + e−2x ) 2 (e + e
138
9 Differenziation
Fragen • Was ist eine Sekante, was eine Tangente? • Wie ist der Differenzialquotient einer Funktion definiert? • Wann existiert f¨ ur eine Funktion keine Ableitung? • Kennen Sie stetig differenzierbare Funktionen? • Was besagt die Kettenregel? • Skizzieren Sie die Aussagen des Mittelwertsatzes und nennen Sie seine Voraussetzungen. • Beweisen Sie den Schrankensatz. • Wie ist die dritte Ableitung einer entsprechend oft differenzierbaren Funktion definiert? • Was wissen Sie u ¨ber Differenzialgleichungen und ihre Anwendung bei Schwingungsph¨anomenen? • Was steckt als Idee hinter der Regel von l’Hospital?
10 Potenzreihen
10.1
Motivation
Durch Potenzreihen stellen wir hier eine nat¨ urliche Verallgemeinerung der zuvor bereits betrachteten Reihen vor. Es handelt sich dabei allerdings nicht um die Befriedigung eines puren Abstraktionswunsches, sondern um etwas wirklich N¨ utzliches. Der Mathematiker empfindet alleine bei der Betrachtung solcher Objekte Freude, als Anwender ist aber noch mehr interessant. So wird sich zeigen, dass die Potenzreihen den Schl¨ ussel zur Approximation von Funktionen darstellen. So lassen sich zahlreiche unhandliche Funktionen durch Potenzrei¨ hen darstellen, was dann viele Uberlegungen vereinfacht. Dies wird bei den danach behandelten Taylorreihen besonders deutlich, die ein h¨ ochst wichtiger Spezialfall von Potenzreihen sind.
10.2
Grundlegendes zu Potenzreihen
(Potenzreihe) ∞ Eine Reihe der Form ak (x − x0 )k mit ak , x, x0 ∈ K heißt Potenzreihe mit
Definition
k=0
Entwicklungspunkt x0 .
Beispiel Die einfachste und zugleich eine der wichtigsten Potenzreihen kennen wir bereits mit der geometrischen Reihe ∞
xk .
k=0
Hier ist der Entwicklungspunkt x0 = 0, das x ist wirklich eine reelle Variable © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_10
140
10 Potenzreihen
und alle Koeffizienten sind ak = 1.
Eine Potenzreihe definiert uns eine Funktion in x, die u ¨berall dort definiert ist, wo die Potenzreihe konvergiert. Letzteres ist zumindest immer im Entwicklungspunkt der Fall, denn hier ist P (x0 ) =
∞ k=0
ak (x0 − x0 )k =
∞
ak 0k = a0 00 = a0 .
k=0
Wir wollen mit Hilfe des Quotientenkriteriums versuchen, weitere Konvergenzpunkte zu finden. Das klingt auf den ersten Blick vielleicht u ¨berraschend, denn bisher hatten wir bei den Konvergenzuntersuchung mittels der Konvergenzkriterien f¨ ur Reihen keine Variablen im Spiel. Wir vertrauen aber darauf, dass die Kriterien gut funktionieren und wir die Variable bei einer Untersuchung nicht verlieren. Durch Umsetzung dieser Idee kommen wir auf die folgenden Koeffizienten, welche wir beim Quotientenkriterium untersuchen m¨ ussen: bk := ak (x − x0 )k . Damit gilt bk+1 ak+1 (x − x0 )k+1 ak+1 = = bk ak (x − x0 )k ak |x − x0 | . Somit sind die Voraussetzungen des Quotientenkriteriums f¨ ur alle x mit ak+1 |x − x0 | < 1, lim k→∞ ak also mit
ak =: R |x − x0 | < lim k→∞ ak+1
ur fast alle k ∈ N. Damit erf¨ ullt. Ist hingegen |x − x0 | > R, so ist bk+1 bk > 1 f¨ k¨onnen die bk nicht einmal mehr eine Nullfolge bilden und die Reihe muss divergieren. Zusammenfassend haben wir Folgendes gezeigt:
Satz ∞ Sei P (x) := k=0 ak (x − x0 )k eine Potenzreihe und ak . R := lim k→∞ ak+1 Dann konvergiert die Potenzreihe f¨ ur alle x mit |x − x0 | < R und divergiert f¨ ur alle x mit |x − x0 | > R.
141
10.2 Grundlegendes zu Potenzreihen
Da die obigen Untersuchungen auch f¨ ur komplexe Potenzreihen gelten, also f¨ ur x ∈ C, konvergiert eine Potenzreihe innerhalb eines Kreises mit Radius R um x0 in der komplexen Ebene und divergiert außerhalb des Kreises. Aus diesem Grund wird R Konvergenzradius genannt. F¨ ur |x − x0 | = R k¨onnen wir keine allgemeinen Aussagen treffen. Dies muss von Fall zu Fall separat untersucht werden. Wir wollen uns nun noch zwei Beispiele ansehen, wobei das erste besonders ausf¨ uhrlich nochmals auf die Erl¨auterung eingeht, die zu obigem Satz gef¨ uhrt hat.
Beispiel
∞
Wir untersuchen die Potenzreihe 1 . k2k
k=1
xk k2k
als reelle Potenzreihe. Hier ist x0 = 0
F¨ ur jedes x ∈ R stellt dies eine gew¨ ohnliche Reihe mit den Reiund ak = xk k hengliedern bk := ak (x − x0 ) = k2k dar. Anwenden des Quotientenkriteriums liefert:
bk+1 bk =
|x|k+1 (k+1)2k+1 |x|k k2k k+1
k2k |x| k |x| (k + 1)2k+1 |x| |x| k −−−−→ = 2 k + 1 k→∞ 2 =
Das Quotientenkriterium ist also erf¨ ullt — und damit die Potenzreihe konvergent — falls |x| < 2 gilt. Nun sind f¨ ur die Randpunkte des Konvergenzintervalls, also f¨ ur |x| = 2, zwei F¨alle zu unterscheiden: • x = 2: Die Potenzreihe ist an dieser Stelle die harmonische Reihe
∞ k=1
1 k,
also
divergent. • x = −2: Die Potenzreihe ist an dieser Stelle die alternierende harmonische ∞ (−1)k Reihe k , welche nach dem Leibniz-Kriterium konvergiert. k=1
F¨ ur |x| > 2 stellen wir fest, dass die Reihenglieder keine Nullfolge bilden und die Potenzreihe deshalb divergiert.
142
10 Potenzreihen
Beispiel ∞ Die reelle Potenzreihe P (x) := k=1 k1 xk hat den Entwicklungspunkt x0 = 0 und den Konvergenzradius 1 k+1 k =1. R = lim 1 = lim k→∞ k→∞ k k+1 Die Randpunkte des Konvergenzkreises (bzw. des Konvergenzintervalls) sind −1 und +1. Bei x := −1 wird die Potenzreihe zur alternierenden harmonischen Reihe, welche konvergent ist. Bei x := +1 wird sie zur divergenten harmonischen Reihe. Insgesamt konvergiert die Potenzreihe also genau auf dem Intervall [−1,1[ . ¨ Wir m¨ ussen beachten, dass nach unseren Uberlegungen auch R = ∞ zul¨ assig ist. Dies ist ein besonders wichtiger Fall, denn damit haben wir durch diverse Potenzreihen auf ganz R bzw. C definierte Funktionen gegeben. Ferner ist von gr¨oßter Bedeutung, dass zahlreiche Funktionen durch Potenzreihen gegeben sind, wie nachstehend angegeben. Die gerade erw¨ahnten (sehr wichtigen) Funktionen sind jeweils f¨ ur alle x ∈ R gegeben und werden im Beispiel pr¨asentiert. Z. B. f¨ ur die Exponentialreihe ist sehr leicht zu berechnen, dass der Konvergenzradius R = ∞ ist. Beachten Sie bitte ferner, dass die folgenden Gleichungen tats¨ achlich auch als Definitionen f¨ ur die genannten Funktionen zu sehen sind. Auch auf andere Art und Weise wie u ¨ber die Differenzialgleichungen, erhalten wir diese Funktionen. Aber am Ende handelt es sich bei allen Darstellungen wirklich immer um die gleichen Funktionen mit den gleichen Eigenschaften, z. B. denen der Periodizit¨ at f¨ ur Sinus und Kosinus. Nun aber endlich zu den Darstellungen der Funktionen als Potenzreihe:
Beispiel
1. Die Exponentialreihe: ex = exp(x) =
∞ xn x2 x3 =1+x+ + + ··· n! 2! 3! n=0
2. Die Sinusreihe: sin(x) =
∞ n=0
(−1)n
x2n+1 x x3 x5 = − + − ··· (2n + 1)! 1! 3! 5!
143
10.3 Aufgaben
3. Die Kosinusreihe: cos(x) =
∞
(−1)n
n=0
x2n x0 x2 x4 = − + − ··· (2n)! 0! 2! 4!
Welchen Entwicklungspunkt x0 haben wir hier verwendet? Richtig, x0 = 0.
n=1
n=2
n=3
n=4
n=5
n=6
Exponentialfunktion und die Ann¨ aherung ihrer Potenzreihe f¨ ur verschiedene Summanden (x0 = 0)
Wir werden bei den Taylorreihen, also schon im folgenden Kapitel, sehen, wie wir die obigen Darstellungen schon ganz alleine dadurch erhalten, dass wir unser Wissen aus der Schule u ¨ber die Exponentialfunktion, den Sinus und Kosinus anwenden; der Kreis wird sich dann also in gewisser Weise schließen.
10.3
Aufgaben
1. Bestimmen Sie die Entwicklungspunkte und Konvergenzradien folgender Potenzreihen: ∞ (x − 1)k k=1
k
,
∞ k=0
k
(−2x) ,
∞ xk k=0
k!
.
2. Von einer Potenzreihe mit Entwicklungspunkt x0 = 2 sei bekannt, dass sie bei x = −1 absolut konvergiere und bei x = −3 divergiere. Folgern Sie das Konvergenzverhalten der Potenzreihe an den Punkten −2, 2, 5 und 8.
144
10 Potenzreihen
3. Untersuchen Sie die komplexe Potenzreihe ∞
xk
k=0
auf Konvergenz. Gehen Sie besonders auf die Randpunkte des Konvergenzkreises ein. 4. Den Konvergenzradius haben wir u ¨ber das Quotientenkriterium definiert. Leiten Sie analog dazu eine Formel f¨ ur den Konvergenzradius mit Hilfe des Wurzelkriteriums her. ∞ ∞ ˜0 )k mit be5. F¨ ur zwei Potenzreihen k=0 ak (x − x0 )k und k=0 bk (x − x ur alle k > K. Was bedeutet liebigen Entwicklungpunkten gelte ak ≤ bk f¨ das f¨ ur die Konvergenzradien der beiden Potenzreihen? Begr¨ unden Sie Ihre Antwort.
10.4
Lo ¨sungen
k ∞ 1. Bei der Reihe k=1 (x−1) ist der Entwicklungspunkt x0 = 1. Weiterhin k ist ak = k1 und damit der Konvergenzradius 1 ak = lim k = lim k + 1 = 1 . R := lim k→∞ ak+1 k→∞ 1 k→∞ k k+1
Die zweite Reihe schreiben wir erst einmal in die Standardform um: ∞ k=0
(−2x)k =
∞
(−2)k xk .
k=0
Nun k¨onnen wir leicht erkennen, dass der Entwicklungspunkt x0 = 0 und ak = (−2)k sind. Daraus folgt f¨ ur den Konvergenzradius k ak = lim 2 = 1 . R := lim k+1 k→∞ ak+1 k→∞ 2 2 ∞ k Bei der dritten Reihe k=0 xk! ist ebenfalls der Entwicklungspunkt x0 = 1 , sodass 0. ak = k! 1 ak (k + 1)! k! = lim = lim (k + 1) = ∞ . R := lim = lim 1 k→∞ ak+1 k→∞ k→∞ k→∞ k! (k+1)! 2. Da die Potenzreihe bei x = −1 konvergiert, muss dieser Punkt innerhalb oder am Rand des Konvergenzintervalls liegen. Der Abstand des Punktes vom Entwicklungspunkt ist 3, also ist der Konvergenzradius R ≥ 3. Die
145
10.4 L¨ osungen
Divergenz der Reihe bei x = −3 gibt uns eine obere Schranke f¨ ur den Konvergenzradius: R ≤ 5. Somit konvergiert die Reihe im Intervall ]−1,5[, speziell bei 2, absolut. Außerhalb des Intervalls [−3,7], beispielsweise bei 8, divergiert die Reihe hingegen. Ungewiss bleiben die Bereiche [−3, −1] und [5,7], da wir nicht wissen, wie viel davon zum Konvergenzintervall geh¨ort. Wir k¨onnen somit keine Aussage u ¨ber das Konvergenzverhalten in den Punkten −2 und 5 machen. Von x = 5 wissen wir zwar, dass er, wenn nicht innerhalb des Konvergenzintervalls, dann zumindest an dessen Rand liegt. Doch k¨onnen wir andererseits das Konvergenzverhalten an den Randpunkten nicht pauschal vorhersagen. 3. Entwicklungspunkt und Konvergenzradius von komplexen Potenzreihen ergeben sich genauso wie bei reellen Potenzreihen. Der Entwicklungs∞ punkt von k=0 xk ist x0 = 0 und ak = 1, sodass sich ein Konvergenzradius von R = 1 ergibt. Die Potenzreihe konvergiert also schonmal innerhalb des Einheitskreises {x ∈ C | |x| < 1} absolut und divergiert außerhalb auf {x ∈ C | |x| > 1}. Die Menge der Randpunkte {x ∈ C | |x| = 1} m¨ ussen wir extra untersuchen. Solch ein x in die Potenzreihe eingesetzt f¨ uhrt dazu, dass die Summanden xk der Reihe s¨ amtlich auf dem Einheitskreis liegen. Insbesondere bilden die Summanden keine Nullfolge, was eine notwendige Bedingung f¨ ur die Konvergenz einer Reihe ist. Somit divergiert die Potenzreihe auch auf dem Kreisrand, also auf ganz {x ∈ C | |x| ≥ 1}. 4. Die Koeffizienten f¨ ur die Betrachtungen bez¨ uglich des Wurzelkriteriums sind wiederum bk := ak (x − x0 )k . Es ist k |bk | = k |ak (x − x0 )k | = k |ak ||x − x0 | . Die Voraussetzungen des Quotientenkriteriums sind f¨ ur alle x mit lim
k→∞
k
|ak ||x − x0 | < 1,
also mit 1 =: R |x − x0 | < lim k→∞ k |ak | erf¨ ullt. Ist hingegen |x−x0 | > R, so ist k |bk | > 1 und damit auch |bk | > 1 f¨ ur fast alle k ∈ N. Damit k¨onnen die bk keine Nullfolge bilden und die Reihe muss divergieren. Der Konvergenzradius kann somit auch u ¨ber die Formel 1 R = lim k→∞ k |ak | berechnet werden.
146
10 Potenzreihen
5. Wir verwenden das Majorantenkriterium f¨ ur Reihen. Dieses haben wir zwar nicht explizit f¨ ur Potenzreihen formuliert, aber Potenzreihen stellen lediglich eine spezielle Form von Reihen dar, welche noch von einer Variablen x abh¨angt. Setzen wir f¨ ur x bestimmte Werte ein, so erhalten wir normale“ Reihen, auf die wir das Majorantenkriterium anwenden ” k¨onnen: ∞ k ˜ Seien R der Konvergenzradius von k=0 ak (x−x0 ) und R derjenige von ∞ k b (x − x ˜ ) . Wir w¨ a hlen beliebig x und x ˜ mit 0 1 1 k=0 k |x1 − x0 | = |˜ x1 − x ˜0 | . x1 soll also den gleichen Abstand vom Entwicklungspunkt x0 der er˜0 der zweiten Reisten Reihe haben wie x ˜1 vom Entwicklungspunkt x he. An diesen beiden Stellen vergleichen wir die beiden Reihen, also ∞ ∞ k x1 − x ˜0 )k , mit dem Majorantenkritek=0 ak (x1 − x0 ) und k=0 bk (˜ rium: F¨ ur die Summanden gilt ak (x1 − x0 )k = |ak ||x1 − x0 |k ≤ |bk ||˜ x1 − x ˜0 |k = bk (˜ x1 − x ˜ 0 )k . ∞ k Nach dem Majorantenkriterium k=0 ak (x − x0 ) im ∞konvergiert somit k Punkt x = x1absolut, wenn k=0 bk (x − x ˜0 ) im Punkt x = x ˜1 absolut ∞ konvergiert. k=0 ak (x − x0 )k kann aber durchaus noch in weiter vom Entwicklungspunkt entfernten Punkten konvergieren. Insgesamt haben ˜ gezeigt. wir damit R ≥ R
10.4 L¨ osungen
147
Fragen • Definieren Sie eine allgemeine komplexe Potenzreihe. • Nennen Sie Standardbeispiele. • Was l¨asst sich an den R¨andern des Konvergenzintervalles u ¨ber die Konvergenz der Potenzreihe aussagen? • Erkl¨aren Sie die Berechnung des Konvergenzradius u ¨ber das Quotientenkriterium. • Wie lautet die Kosinusreihe?
11 Taylorpolynome, Taylorreihen und Extremwerte
11.1
Motivation
Der Begriff der Taylorreihe begegnete uns bereits kurz in der Motivation zum letzten Kapitel. Die tiefe Bedeutung der nach Brook Taylor (1685 – 1731) benannten Reihen zeigte sich erst Jahre nach seinem Tod. Ihr Wert liegt wesentlich darin begr¨ undet, dass bereits das Taylorpolynom (¨ uber dem Summenzeichen steht dann nicht ∞, sondern eine endliche nat¨ urliche Zahl n) unter gewissen Voraussetzungen eine zuvor sehr viel kompliziertere Funktion appro¨ ximiert. Viele Uberlegungen in der Physik und Mathematik sind dadurch erst m¨ oglich geworden. Stellen wir uns also vor, dass wir zur Beschreibung eines Prozesses eine Funktion gefunden haben, die in keiner Weise dazu animiert, mit ihr arbeiten zu wollen. Auch weitere Berechnungen erscheinen mit ihr aussichtslos, denn Sie ist einfach zu kompliziert. Genau in solchen F¨allen, die h¨ aufiger auftreten als allgemein gedacht, kommt das Taylorpolynom ins Spiel, denn mit diesem k¨ onnen wir — unter gewissen Voraussetzungen — ein simples Polynom zur weiteren Betrachtung verwenden, welches der eigentlichen Funktion selbst sehr nahe kommt. Nat¨ urlich ist allgemein ein Fehler zu erwarten, der den Unterschied zwischen der Funktion und dem Taylorpolynom ausmacht. Dieser wird aber im g¨ unstigen Fall sehr klein und l¨asst sich absch¨atzen. Wenn das alles gut klappt, haben wir nur noch Polynome zu untersuchen. Und diese (samt ihrer Eigenschaften) kennen wir recht gut. Das Taylorpolynom ist, was wirklich auf den ersten Blick unerwartet scheint, direkt mit dem Auffinden von Extremwerten (insbesondere Maxima und Minima) von Funktionen verkn¨ upft. Daher wurden diese auch nicht im Abschnitt zur Differenziation behandelt. Dass Funktionen Maxima und Minima haben k¨onnen, welche am gezeichneten Funktionsgraphen meist gut erkennbar sind, ist allgemein bekannt. Wichtig f¨ ur © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_11
150
11 Taylorpolynome, Taylorreihen und Extremwerte
uns ist aber ihre Bedeutung, die kaum zu hoch eingesch¨ atzt werden kann, interessieren wir uns doch in den Natur- und Ingenieurwissenschaften daf¨ ur, wo z. B. der h¨ochste Wirkungsgrad bei einer Verbrennungsmaschine liegt (Maximum) oder welcher Weg die k¨ urzeste Zeit erlaubt (Minimum).
11.2
Taylorpolynom und Taylorreihe
11.2.1
Das Taylorpolynom
Um zum Taylorpolynom zu kommen, m¨ ussen wir erst einige Vor¨ uberlegungen anstellen. Dazu berechnen wir zuerst h¨ohere Ableitungen einer bestimmten ¨ Funktion, was wir gleich als weitere Ubung betrachten k¨ onnen: Sei x0 ∈ R und k ∈ N. Dann ist die Funktion f : R → R, f (x) = (x − x0 )k , beliebig oft differenzierbar, und es gilt:
f (x) = (x − x0 )k f (x) = k(x − x0 )k−1 .. . f (k−1) (x) = k(k − 1)(k − 2) · · · 3 · 2 · (x − x0 ) f (k) (x) = k(k − 1)(k − 2) · · · 3 · 2 · 1 =: k! f (k+1) (x) = 0 .. . An der Stelle x = x0 gilt, dass alle Ableitungen bis auf f (k) (x0 ) verschwinden. Wir k¨onnen dies auch in der folgenden Form notieren: f (i) (x0 ) = δik k! f¨ ur alle i ∈ N, wobei wir
δij :=
1 falls i = j 0 falls i = j
definieren. Dies ist das in vielen F¨allen praktische Kronecker-Symbol , benannt nach dem deutschen Mathematiker Leopold Kronecker (1823 – 1891). Die Darstellung f (i) (x0 ) = δik k! soll Sie keineswegs verwirren. Es handelt sich dabei einfach nur um eine zusammenfassende Schreibweise, durch die man das Ergebnis einer l¨angeren Rechnung in komprimierter Weise angeben kann.
151
11.2 Taylorpolynom und Taylorreihe
Betrachten wir aber nun ein beliebiges Polynom der Form p(x) = a0 + a1 (x − x0 ) + . . . + an (x − x0 )n =
n
ak (x − x0 )k
k=0
mit a0 , . . . , an , x0 ∈ R. Mit Hilfe des Ergebnisses der ersten Rechnung k¨ onnen wir die i-te Ableitung von p an der Stelle x0 berechnen (i ≤ n) und erhalten n
p(i) (x0 ) =
ak δik k! = ai i! .
k=0
Wir nennen den Index nun wieder k und erhalten die Gleichung ak =
p(k) (x0 ) . k!
und durch Einsetzen in die Ausgangsgleichung p(x) =
n
ak (x−x0 )k schließlich
k=0
p(x) =
n p(k) (x0 ) k=0
k!
(x − x0 )k .
Bisher haben wir nur eine Rechnung durchgef¨ uhrt und einen Ausdruck f¨ ur die Koeffizienten eines Polynoms unter Verwendung des Polynoms selbst gefunden. Haben wir die Situation nicht einfach verschlimmert, viel Rechnung f¨ ur nichts? Nein! Wir haben einen tieferen Zusammenhang gefunden, denn die ak bei der Darstellung eines Polynoms sind nur vermeintlich ganz frei; bei genauer Betrachtung sind diese aber durch die Ableitungen von p(x) an der Stelle x0 gegeben. Final k¨onnen wir die Frage stellen, ob sich diese Idee nicht auch f¨ ur andere Funktionen eignet? Wir versuchen dies und schreiben in Analogie f¨ ur n-mal differenzierbare Funktionen: f (x) =
n f (k) (x0 )
k!
k=0
n (x − x0 )k + Rf,x (x). 0
Dabei nennt man die Summe n Tf,x 0
:=
n f (k) (x0 ) k=0
k!
(x − x0 )k
das Taylorpolynom n-ter Ordnung von f mit Entwicklungspunkt x0 und der n heißt Restglied. Das Taylorpolynom stellt eine Approximation der Term Rf,x 0 Funktion durch Polynome dar; das Restglied gibt dabei den Fehler an, der bei dieser N¨aherung gemacht wird. Dieser Fehler ist zu erwarten, denn wenn die Gleichung (wie oben gesehen) f¨ ur Polynome gerade exakt ist, also das Restn glied verschwindet (Rf,x = 0), dann w¨are das f¨ ur andere Funktionen wohl zu 0
152
11 Taylorpolynome, Taylorreihen und Extremwerte
viel verlangt. Der folgende Satz fasst zusammen, was u ¨ber das Taylorpolynom gewusst werden sollte.
Satz Sei f : I → R eine auf dem Intervall I ⊆ R n-mal differenzierbare Funktion. Dann ist f¨ ur x 0 , x ∈ I f (x) =
n f (k) (x0 ) k=0
k!
n (x − x0 )k + Rf,x (x) 0
und f¨ ur das Restglied gilt: n Rf,x (x) 0 =0 (x − x0 )n
lim
1.
x→x0
2.
n Rf,x (x) = 0
f (n+1) (ξ) (x − x0 )n+1 (n + 1)!
f¨ ur ein ξ ∈ R zwischen x und x0 , falls f sogar (n + 1)-mal stetig differenzierbar ist.
In Punkt 2 des obigen Satzes finden wir die Lagrange’sche Darstellung des Restglieds. Es gibt noch andere Varianten der Darstellung des Restgliedes, welche wir aber in diesem Buch nicht behandeln. Dass das Taylorpolynom eine Approximation der Funktion in einem Punkt (n¨amlich x0 ) darstellt, l¨asst sich schon f¨ ur einen einfachen Fall leicht einsehen. Betrachten wir dazu das Taylorpolynom der ersten Ordnung mit Restglied, dann ist f (x) =
1 f (k) (x0 ) k=0
k!
1 (x − x0 )k + Rf,x (x) 0
1 (x) . = f (x0 ) + f (x0 )(x − x0 ) + Rf,x 0
Nahe bei x0 bekommen wir daraus f (x) ≈ f (x0 )(x − x0 ) + f (x0 ) , denn das Restglied geht ja hier gegen Null. Auf der rechten Seite steht eine Geradengleichung. Wir sehen daher, dass in diesem Taylorpolynom der ersten Ordnung bereits die Approximation der Funktion durch eine Gerade (die Tangente) erfolgt. Versuchen Sie doch einmal, aus einer Taylorapproximation den Zwischenwertsatz zu gewinnen. Tipp: Verwenden Sie explizit das Restglied und eine niedrige Ordnung, die sich schon direkt daraus ergibt, welche Ableitung im Zwischenwertsatz vorkommt.
153
11.2 Taylorpolynom und Taylorreihe
11.2.2
Die Taylorreihe
¨ Der Ubergang vom Taylorpolynom zur Taylorreihe wird durch das Ersetzen des n durch ein ∞ u ¨ber dem Summenzeichen realisiert:
Definition (Taylorreihe) Der Ausdruck ∞ f (k) (x0 ) k!
k=0
(x − x0 )k
heißt Taylorreihe der Funktion f (x), die hierbei beliebig oft differenzierbar sein muss. Folgende Fragen scheinen offensichtlich: 1. F¨ ur welche x konvergiert die Taylorreihe? 2. Wenn Konvergenz vorliegt, stimmt die durch die Taylorreihe definierte Funktion dann mit der Ausgangsfunktion u ¨berein? Die erste Frage ist u ¨ber den Konvergenzradius recht leicht im individuellen Fall zu beantworten, denn die Taylorreihe ist ja gerade ein Spezialfall einer (k) Potenzreihe, wie wir sie bereits behandelt haben. Hier ist n¨ amlich ak = f k!(x0 ) . Eine ersch¨opfende Beantwortung der zweiten Frage u ¨ber bestimmte Kriterien ist nicht leicht. Fest steht aber, dass wir zu einer beliebig oft differenzierbaren Funktion eine Taylorreihe angeben k¨onnen. Dass diese nicht notwendigerweise gegen die Funktion konvergieren muss, zeigt das folgende Beispiel:
Beispiel f (x) :=
0 e−1/x
falls x ≤ 0 falls x > 0
ist auf ganz R beliebig oft stetig differenzierbar und die Ableitungen in jedem Punkt x ≤ 0 sind alle Null. Die Taylorreihe um den Nullpunkt ist also die Nullfunktion, und stimmt in keiner Umgebung der Null mit der Funktion u ¨berein. Wir werden nun Taylorreihen exemplarisch berechnen und erkennen dabei einiges wieder, was wir bereits zuvor entdeckt hatten:
154
11 Taylorpolynome, Taylorreihen und Extremwerte
Beispiel Wir betrachten f (x) = ex um den Entwicklungspunkt x0 = 0. Beim Ableiten ur alle k ∈ N gilt. ¨andert sich die Funktion nicht, sodass f (k) (0) = f (0) = 1 f¨ Somit ist die Taylorreihe der Exponentialfunktion ∞ 1 k x . k!
k=0
Beispiel Interessieren wir uns f¨ ur die Taylorreihe von f (x) = sin x um den Entwicklungsussen wir zuerst die Ableitungen des Sinus in x0 berechnen: punkt x0 = 0, m¨ f (0) = cos 0 = 1 f (0) = − sin 0 = 0 f (0) = − cos 0 = −1 f (4) (0) = sin 0 = 0 Bei weiteren Ableitungen wiederholt sich obiges immer wieder, also entf¨ allt bei der Taylorreihe jeder zweite Summand. Wir erhalten sin x =
∞ (−1)k 2k+1 x . (2k + 1)!
k=0
Analog erhalten wir als Taylorreihe des Kosinus, wieder mit x0 = 0, cos x =
∞ (−1)k k=0
(2k)!
x2k .
Wir haben bei unseren Berechungen stets den Entwicklungpunkt x0 = 0 verwendet. Dies ist bei Aufgaben oft der Fall, denn es ist einfach damit zu rechnen. Welche Bedeutung hat aber der Entwicklungspunkt? Es ist der Punkt, f¨ ur den unsere Approximation gut funktioniert. Das Restglied wird ja gerade in der N¨ahe von x0 verschwindend klein; entfernt davon ist dies allgemein nicht zu erwarten. Wollen wir also eine gute Approximation einer Funktion an einem bestimmten Punkt haben, m¨ ussen wir diesen als Entwicklungspunkt w¨ ahlen. Bitte machen Sie sich f¨ ur obige Beispiele klar, dass wir damit gleichfalls auch wissen, wie die Taylorpolynome der hier betrachteten Funktionen aussehen. Warum? Na, wir haben beim Taylorpolynom doch anstatt der Reihe (also der
155
11.2 Taylorpolynom und Taylorreihe
unendlichen Summation) nur eine endliche Summe (bis zu einer bestimmten nat¨ urlichen Zahl n) zu betrachten. Was hinter dem Summenzeichen steht bleibt gleich. Wir m¨ochten nun in Bildern zeigen, wie gut die Approximation schon bei kleiner Ordnung des Taylorpolynoms ist.
1
−π
− π2
π 2
π
π 2
π
π 2
π
−1 1
−π
− π2 −1 1
−π
− π2 −1
Von oben: Taylor-Polynom der Ordnung 1, der Ordnung 3 und 5, jeweils f¨ ur den Sinus (x0 = 0)
Zur Veranschaulichung der Bedeutung des Entwicklungspunktes nochmals Graphiken f¨ ur die gleiche Funktion, allerdings mit x0 = 1:
156
11 Taylorpolynome, Taylorreihen und Extremwerte
1
−π
− π2
π 2
π
π 2
π
−1 1
−π
− π2 −1
−2
Von oben: Taylor-Polynom der Ordnung 1 und 3, jeweils f¨ ur den Sinus (x0 = 1)
Wir k¨onnen erkennen, dass die Approximation wirklich stets dort gut funktioniert, wo wir den Entwicklungspunkt gew¨ahlt haben.
11.2.3
Fehlerabsch¨ atzung
Eine Anwendung des Taylorpolynoms ist es, den Funktionswert einer komplizierten Funktion mittels ihres Taylorpolynoms n¨ aherungsweise zu berechnen. Dabei m¨ochten wir allerdings eine Aussage u at unserer N¨ aherung, ¨ber die Qualit¨ d. h. u onnen. Wir haben im vo¨ber die Gr¨oße des gemachten Fehlers, treffen k¨ rigen Abschnitt bereits die Lagrange’sche Darstellung des Restglieds kennen gelernt: Rn (x) =
f (n+1) (ξ) (x − x0 )n+1 (n + 1)!
mit ξ zwischen x und x0 .
Diese eignet sich hervorragend f¨ ur solche Fehlerabsch¨ atzungen.
Beispiel Wir wollen das Taylorpolynom erster Ordnung verwenden, um ohne techni√ sche Hilfsmittel Wurzeln zu berechnen. Wir w¨ ahlen also f (x) := x mit der 1 Ableitung f (x) = 12 x− 2 und erhalten als Taylorpolynom 1 1 Tf,x (x) = f (x0 ) + √ (x − x0 ) . 0 2 x0
11.2 Taylorpolynom und Taylorreihe
157
Um dies f¨ ur unsere Rechnung zu nutzen, empfiehlt es sich nat¨ urlich, als Entwicklungspunkt x0 eine Zahl nahe x zu w¨ahlen, deren Wurzel wir kennen. Damit erhalten wir beispielsweise √ 1 1 1 4,2 ≈ Tf,4 (4,2) = 4 + √ (4,2 − 4) = 2 + · 0,2 = 2,05 , 4 2 4 √ √ 1 1 1 · 6 = 6,5 . 42 ≈ Tf,36 (42) = 36 + √ (42 − 36) = 6 + 12 2 36 Zur Absch¨atzung des gemachten Fehlers ben¨otigen wir die zweite Ableitung von 3 f : f (x) = − 14 x− 2 . Der Restterm l¨asst sich also folgendermaßen darstellen: 1 Rf,x (x) = 0
1 1 3 f (ξ)(x − x0 )2 = − ξ − 2 (x − x0 )2 . 2 8
Bei der Fehlerabsch¨atzung ist interessant, wie weit wir schlimmstenfalls vom tats¨achlichen Wert abweichen, egal ob nach oben oder nach unten. Wir suchen also eine obere Schranke f¨ ur den Betrag des Restterms. Wegen des negativen 1 Exponenten beim ξ wird unser berechnetes Rf,x (x) betraglich f¨ ur kleines ξ 0 besonders groß. In den beiden Beispielen ist dies 1 1 Rf,4 (4,2) = 1 ξ − 32 (0,2)2 ≤ 1 · 4− 32 · 1 = = 0,000625 , 8 8 52 8 · 8 · 25 1 Rf,36 (42) = 1 ξ − 32 62 ≤ 1 · 36− 32 · 62 = 1 < 1 = 0,025 . 8 8 48 40 Da der Restterm negativ ist, wissen wir zudem, dass der tats¨ achliche Wert niedriger ist als unser berechneter. Wir k¨onnen somit folgende Intervalle angeben, in denen die Wurzel liegt: 4,2 ∈ [2,05 − 0,000625, 2,05] = [2,049375, 2,05] , √ 42 ∈ [6,5 − 0,025, 6,5] = [6,475, 6,5] . Nun k¨onnen Sie nat¨ urlich fragen, wo genau die praktische Anwendbarkeit des Wurzelziehens ohne Taschenrechner oder Computer liegt, wenn wir davon absehen, auf Parties Leute zu beeindrucken. Was aber durchaus h¨ aufig vorkommt, ist eine physikalische Gr¨oße zu messen und daraus eine andere zu berechnen. Bedingt durch die technische Natur des Messinstrumentes werden Sie einen gewissen Messfehler nicht ausschließen k¨onnen. Wie aber u agt sich dieser ¨bertr¨ Fehler auf die errechnete Gr¨oße? Die Vorgehensweise ist im Prinzip die gleiche oße und wie zuvor im Beispiel. Wir stellen uns vor, x0 sei die gemessene Gr¨ x die tats¨achliche. Die Genauigkeit des Messinstrumentes gibt den maximalen Abstand von x0 zu x an, etwa |x − x0 | ≤ M . Und die Wurzelfunktion f liefert ¨ uns die aus dem Messwert zu errechnende Gr¨ oße. Mit den Uberlegungen aus dem Beispiel k¨onnen wir dann den Fehler bei der errechneten Gr¨ oße wie folgt
158
11 Taylorpolynome, Taylorreihen und Extremwerte
absch¨atzen:
1 |f (x) − f (x0 )| = f (x0 ) + Rf,x 0 1 1 3 ≤ √ (x − x0 ) + ξ − 2 (x − x0 )2 2 x0 8 1 M −3 ≤ √ + (x0 − M ) 2 M 2 , 2 x0 8
vorausgesetzt, dass x0 > M . Da das Taylorpolynom auf Ableitungen der Funktion basiert und die Ableitungen der Wurzelfunktion f¨ ur x 0 immer gr¨ oßer werden, wird unsere Approximation in diesem Bereich immer ungenauer. Interessant ist manchmal nicht der absolute Fehler wie oben berechnet, sondern der relative Fehler, also das Verh¨altnis von Fehler zu tats¨ achlichem Wert. Auch hierzu wollen wir ein Beispiel rechnen:
Beispiel Wir wollen das Volumen einer Kugel aus ihrem gemessenen Radius berechnen. Die Anforderung ist, das Kugelvolumen mit einer Genauigkeit von ±1% zu bestimmen. Wie groß darf dann der relative Fehler beim Messen des Radius sein? Die Formel f¨ ur das Kugelvolumen und dessen Ableitung nach dem Radius sind 4 3 πr , V (r) = 4πr2 . 3 Wir sind faul und wollen uns Rechenarbeit sparen. Daher betrachten wir lediglich das Taylorpolynom erster Ordnung und unterschlagen sogar das Restglied (was wir durch das ≈ anstelle des = kennzeichnen): V (r) =
V (r) ≈ V (r0 ) + V (r0 )(r − r0 ) ⇔
V (r) − V (r0 ) ≈ V (r0 )(r − r0 )
⇔
(r − r0 ) ≈
V (r) − V (r0 ) V (r0 ) V (r) − V (r0 ) = · . V (r0 ) V (r0 ) V (r0 )
F¨ ur den relativen Fehler erhalten wir: 4 3 (r − r0 ) V (r0 ) V (r) − V (r0 ) 1 3 πr0 · = 1% · ≈ = %. r0 V (r0 ) r0 V (r0 ) r0 · 4πr02 3
Wir d¨ urfen somit den Radius mit einem Fehler von ± 13 % messen, sollten aber im Hinterkopf behalten, dass dies auch nur eine ungef¨ ahre Schranke f¨ ur den Fehler ist, da wir den Fehlerterm nicht ber¨ ucksichtigt haben. Sie sehen also, dass wir mit der Absch¨atzung des Restterms ein wichtiges Instrument zur Hand haben, wenn es um Fragen der Messgenauigkeit bzw. der Eingrenzung von Fehlern geht.
11.3 Lokale Extrema differenzierbarer Funktionen
11.3
159
Lokale Extrema differenzierbarer Funktionen
Recht schnell k¨onnen wir den Finger auf h¨ochste“ bzw. tiefste“ Stellen eines ” ” Funktionsgraphen halten. Dabei gibt es aber z. B. folgende Probleme: • Ist der Graph in einer Skalierung gezeichnet, die wirklich alle Stellen dieser Art zeigt? • K¨onnte nicht bei allen gew¨ahlten Skalierungen etwas u ¨bersehen werden und reicht die Aufl¨osung u ur das Aufzeigen solcher Stellen? ¨berhaupt f¨ • Muss u ¨berhaupt ein Graph gezeichnet werden? Es ist also n¨otig, ein mathematisches Verfahren zu erarbeiten, durch das die Extrema der gegebenen Funktion im Definitionsbereich bestimmt werden k¨ onnen.
11.3.1
Zur Berechnung lokaler Extrema
F¨ ur unsere Untersuchungen nahe bei einem Punkt (von links und rechts), haben wir bisher erfolgreich mit Folgen gearbeitet, wir denken z. B. an Untersuchungen zur Stetigkeit. Um die Existenz solcher konvergenter Folgen zu garantieren, m¨ ussen wir folglich auf beiden Seiten des Punktes noch einen Bereich haben, der f¨ ur gegen den Punkt konvergente Folgen Raum bietet, was sich durch eine um den Punkt existierende ε-Umgebung garantieren l¨ asst. Als erste Frage wollen wir beantworten, welche Eigenschaften Punkte haben m¨ ussen, die als Kandidaten f¨ ur Extremwerte taugen und gehen zuerst davon aus, dass eine betrachtete Funktion in x0 ein lokales Maximum annimmt. Dann gibt es nach der Definition des lokalen Maximums eine ε-Umgebung O von x0 mit f (x0 ) − f (x) ≥ 0 f¨ ur alle x ∈ O. Nun existieren Folgen in O, die (von links ur den links- bzw. rechtsseitigen bzw. rechts) gegen x0 konvergieren, sodass f¨ Grenzwert des Differenzenquotienten gilt: lim
f (x0 ) − f (x) ≥0 x0 − x
lim
f (x0 ) − f (x) ≤ 0. x0 − x
xx0
und xx0
Dadurch erhalten wir f (x0 ) = lim
x→x0
f (x0 ) − f (x) = 0. x0 − x
160
11 Taylorpolynome, Taylorreihen und Extremwerte
F¨ ur ein Minimum verl¨auft alles analog. Wir fassen unsere Untersuchung in einem Satz zusammen:
Satz Sei f : D → R eine differenzierbare Funktion und O ⊆ D eine ε-Umgebung von x0 . Hat f in x0 ein lokales Minimum oder Maximum, dann gilt die Gleichung f (x0 ) = 0. ¨ Es bleibt uns die Uberlegung, wann genau ein Maximum oder Minimum vorliegt. Dazu verwenden wir die Approximation nach Taylor. Eingangs erw¨ ahnten wir, dass dies das Mittel zum Zweck ist, tats¨achlich geh¨ oren demnach unsere Gedanken dazu in dieses Kapitel.
Satz Sei D ⊆ R, f : D → R eine n-mal differenzierbare Funktion (n > 0) und x0 ∈ O (O wie in vorigen Satz) mit f (x0 ) = . . . = f (n−1) (x0 ) = 0, f (n) (x0 ) = 0. Dann gilt: 1. Ist n gerade, so gilt: a) f nimmt an der Stelle x0 ein lokales Maximum an, falls f (n) (x0 ) < 0. b) f nimmt an der Stelle x0 ein lokales Minimum an, falls f (n) (x0 ) > 0. 2. Ist n ungerade, so nimmt f an der Stelle x0 weder ein Minimum noch ein Maximum an.
Warum ist das so? Wir gehen hier vom Fall f (n) (x0 ) < 0 aus (der andere verl¨auft analog). Aus dem Konvergenzverhalten des Restglieds bei der Approximation durch Taylor folgt, unter Beachtung der Voraussetzungen des Satzes (nur f (n) (x0 ) sollte ja ungleich Null sein), f (n) (x0 ) n (x − x0 )n + Rf,x (x) 0 n! f (x) − f (x0 ) f (n) (x0 ) lim 0. D. h. es gilt f (x) − f (x0 ) ≤ 0. 2. Ist n ungerade, so muss f (x) − f (x0 ) bei x0 ebenso wie (x − x0 )n das Vorzeichen wechseln — andernfalls w¨are
f (n) (x0 ) n!
= 0.
Wir werden den Satz zur Verdeutlichung an Beispielen demonstrieren.
Beispiel Sei
f : [−2,2] → R, f (x) = x2 − 2x + 5.
ur die zweite Ableitung gilt f (x) = 2. F¨ ur die Ableitung gilt f (x) = 2x − 2, f¨ Die einzige Nullstelle der Ableitungsfunktion ist x = 1, und dort gilt f (1) = 2 > 0. Also liegt dort ein lokales Minimum mit f (1) = 4 vor. An den Punkten x = ±2 gilt f (−2) = 13 und f (2) = 5. Da die Funktion auf dem Intervall [−2,1[ streng monoton f¨allt (f (x) < 0) und auf dem Intervall ]1,2] streng monoton steigt (f (x) > 0), muss die Funktion an den Stellen x = ±2 ein lokales Maximum annehmen. Ein Vergleich der Funktionswerte liefert, dass die Funktion f bei x = 1 das globale Minimum y = 4 und bei x = −2 das globale Maximum y = 13 annimmmt. Achtung! In der Schule wurden die Kriterien h¨ aufig etwas reduziert gelehrt. Man sollte u ¨ber die Nullstellen der ersten Ableitung die kritischen Stellen finden und diese dann in die zweite Ableitung einsetzen. Je nach Vorzeichen des Ergebnisses lag dann ein Maximum oder Minimum vor. Das funktioniert manchmal, aber ist nach Obigem nicht die ganze Weisheit. Bitte berechnen Sie daher nach dem gerade angegebenen Verfahren (aus einigen Schulen) die Extrema von f (x) = x4 , danach mit dem hier demonstrierten Verfahren (es f¨ uhrt uns auf ein Minimum). Sie werden u ¨berrascht sein.
11.4
Aufgaben
1. Berechnen Sie sin π6 u ¨ber ein Taylorpolynom von sin x um den Entwicklungspunkt x0 := 0 mit einer Genauigkeit von 0,05. 2. Bestimmen Sie die Taylorreihe von f (x) := ln(x + 1) im Entwicklungspunkt x0 := 0 sowie deren Konvergenzintervall. Zeigen Sie weiterhin, dass
162
11 Taylorpolynome, Taylorreihen und Extremwerte
die Taylorreihe im Intervall ] − 12 , +1] gegen f konvergiert. 3. Was ist das Taylorpolynom n-ten Grades eines Polynoms maximal n-ten Grades? 4. Differenzieren Sie die Taylorreihen von sin x und cos x. 5. Bestimmen Sie s¨amtliche lokalen Extrema von f : ]0, ∞[ → R
11.5
,
f (x) :=
1 ln x x
Lo ¨sungen
1. Um zu wissen, wie weit das Taylorpolynom zu entwickeln ist, sch¨ atzen (n+1) n+1 wir den Fehlerterm sin(n+1)!(ξ) π6 − 0 ab. Dieser soll nach Aufga " " benstellung nicht gr¨oßer als 0,05 sein. Dabei ist ξ ∈ 0, π6 , was wir hier aber nicht verwenden, denn beim Sinus und dessen Ableitungen bietet es sich an, gegen 1 abzusch¨atzen: sin(n+1) (ξ) π n+1
π n+1 1 −0 . ≤ (n + 1)! 6 (n + 1)! 6 Wir probieren einige n: π n+1 n=0: n=1: n=2:
6
(n + 1)! π n+1 6
(n + 1)! π n+1 6
(n + 1)!
π 1 = = =
6
1! π 2 6
2! π 3 6
3!
π 3 1 > > 6 6 2 3 2 1 > 6 = > 0,05 2! 8 =
=
π3 4 43 4 < = 0,05 < 4 = 4 6 6 81 80
Bei n = 2 halten wir also definitiv die geforderte Fehlerschranke ein. Vielleicht h¨atten wir das auch schon bei besserer Absch¨ atzung f¨ ur ein kleineres n eingesehen, aber das soll uns hier nicht weiter k¨ ummern. Das Taylorpolynom zweiten Grades um den Entwicklungspunkt x0 = 0 und aherung: ausgewertet bei x = π6 liefert uns somit die gesuchte N¨ sin
π π 1 π2 π π ≈ sin 0 + cos 0 · − sin 0 · = 0 + + 0 = ≈ 0,52 . 6 6 2 36 6 6
Der genaue Wert w¨are sin π6 = 0,5. 2. Die k-te Ableitung von f ist f (k) (x) = (−1)k+1
(k − 1)! , (x + 1)k
163
11.5 L¨ osungen
(zur Erinnerung: 0! := 1), ausgewertet am Entwicklungspunkt x0 = 0 f (k) (0) = (−1)k+1 (k − 1)! . (Die Formel f¨ ur die k-te Ableitung m¨ ussten wir streng genommen noch beweisen, sinnvollerweise mit vollst¨andiger Induktion; dies ist nun aber nicht das Thema und wird daher vernachl¨ assigt.) Die Taylorreihe um x0 = 0 ist demnach T0 (x) = f (0) +
∞ f (k) (0)
k!
k=1
xk =
∞ (−1)k+1 k=1
k
xk .
k limk→∞ k+1
Ihr Konvergenzradius ist = 1. Sie konvergiert nicht bei x = −1 (harmonische Reihe), wohl aber bei x = +1 (alternierende harmonische Reihe), insgesamt also auf ] − 1, +1]. Der Fehlerterm ist (k+1) x k+1 f (ξ) k+1 1 Rk (x) = x = . (k + 1) ξ + 1 (k + 1)! x F¨ ur festes x ∈ ]− 12 , +1] und f¨ ur beliebiges ξ zwischen x und 0 ist ξ+1 ≤1 und somit limk→∞ Rk (x) = 0. Das bedeutet, dass dort die Taylorreihe gegen f konvergiert. 3. Zun¨achst einmal ist die Taylorreihe n-ten Grades ein Polynom der Form Tn,x0 (x) =
n f (k) (x0 ) k=0
k!
(x − x0 )k .
Die Ableitungen sind (j) (x) = Tn,x 0
n f (k) (x0 ) k=j
(k − j)!
(x − x0 )k−j ,
j = 0, . . . , n ,
ausgewertet am Entwicklungspunkt x = x0 fallen alle Summanden bis auf den ersten weg: (j) Tn,x (x0 ) = 0
n f (k) (x0 ) k=j
(k − j)!
(x0 − x0 )k−j = f (j) (x0 ) .
Das Taylorpolynom und seine ersten n Ableitungen stimmen somit im Entwicklungspunkt mit f und dessen Ableitungen u ¨berein. Ist f ein Polynom maximal n-ten Grades, so ist p := f − Tn,x0 ein Polynom maximal n-ten Grades, welches mit seinen ersten n Ableitungen in x0 Null ist. Damit ist p das Nullpolynom und das Taylorpolynom stimmt nicht nur im Entwicklungspunkt, sondern u ¨berall mit f u ¨berein. Diese Betrachtung ist unabh¨angig vom Entwicklungspunkt. Damit sind die Taylorpolynome zu unterschiedlichen Entwicklungspunkten gleich (nur anders dargestellt), solange f ein Polynom ist.
164
11 Taylorpolynome, Taylorreihen und Extremwerte
4. Sinus und Kosinus haben folgende Taylorreihen mit Entwicklungspunkt x0 = 0 mit Konvergenz auf ganz R: sin x =
∞ (−1)k 2k+1 x , (2k + 1)!
cos x =
k=0
∞ (−1)k k=0
(2k)!
x2k .
Diese d¨ urfen wir innerhalb ihres Konvergenzintervalls, also auf ganz R, differenzieren und erhalten als Ableitungen: ∞ ∞ (−1)k (−1)k 2k 2k sin x = (2k + 1)x = x = cos x , (2k + 1)! (2k)!
cos x =
k=0 ∞
k=0
∞
∞
k=1
k=0
(−1)k (−1)k+1 (−1)k (2k)x2k−1 = x2k−1 = x2k+1 (2k)! (2k − 1)! (2k + 1)!
k=1 ∞
=−
k=0
k
(−1) x2k+1 = − sin x . (2k + 1)!
Der Summand f¨ ur k = 0 der Taylorreihe des Kosinus ist konstant und fiel daher beim Ableiten weg. Durch eine Indexverschiebung haben wir schließlich die Form der Sinustaylorreihe hergestellt. 5. Zun¨achst berechnen wir die Ableitung mit der Quotientenregel: f (x) =
1 x
· x − ln x · 1 1 − ln x = . x2 x2
Diese hat genau eine Nullstelle, und zwar bei ln x = 1, also x = e. Als n¨achstes m¨ ussen wir verifizieren, dass dort wirklich ein Maximum oder Minimum vorliegt. Dazu ben¨otigen wir die zweite Ableitung (wieder mit der Quotientenregel): f (x) =
− x1 · x2 − (1 − ln x)2x 2 ln x − 3 = . 4 x x3
Diese werten wir bei x = e aus: f (e) =
2 ln e − 3 −1 = 3 1) ,
1 dx = ln(x − a) , x−a 2x + b dx = (x2 + bx + c)k
#
(x2 + bx + c)−k (2x + b)dx
(x2 + bx + c)−k+1 −k + 1 −1 = 2 (k − 1)(x + bx + c)k−1 =
# x2 #
(f¨ ur k > 1) ,
2x + b dx = ln(x2 + bx + c) , + bx + c ⎞ x + 2b ⎠, arctan ⎝ 2 c − b4 ⎛
1 1 dx = 2 x + bx + c c−
# (x2
b2 4
2x + b 1 dx = k + bx + c) (k − 1)(4c − b2 )(x2 + bx + c)k−1 # 1 2(2k − 3) + dx (k − 1)(4c − b2 ) (x2 + bx + c)k−1
(f¨ ur k > 1) .
Dabei sind a, b, c geeignete reelle Zahlen, also solche, f¨ ur welche die Ausdr¨ ucke stets definiert sind. Die letzte Gleichung liefert uns nicht sofort ein Ergebnis, weil auch auf der rechten Seite wieder unser Integral steht, nur mit kleinerem Exponenten. Deshalb m¨ ussen wir diese Gleichung ggf. mehrfach hintereinander anwenden, jedesmal mit einem um 1 kleineren k und so den Exponenten auf k = 1 senken. Im letzten Schritt k¨onnen wir f¨ ur k = 1 die vorletzte Gleichung mit dem Arcustangens verwenden. Exemplarisch wollen wir die vorletzte Gleichung herleiten. Dazu erinnern wir
179
12.5 Das uneigentliche Integral
an die Ableitung des Arcustangens (arctan x) =
1 1 1 = = , tan (arctan x) 1 + x2 1 + tan2 (arctan x)
da wir sie gleich als Stammfunktion brauchen. Wir betrachten den Fall, dass der Nenner x2 + bx + c keine reellen Nullstellen hat (sonst k¨ onnte er ja bei der Partialbruchzerlegung weiter zerlegt werden), sondern ein komplex konjugiertes onnen wir x2 + bx + c auch Paar x0 und x0 von komplexen Nullstellen. So k¨ folgendermaßen schreiben: x2 +bx+c = (x−x0 )(x−x0 ) = x2 −(x0 +x0 )x+x0 x0 = x2 −2 Re(x0 )x+|x0 |2 , also ist b = −2 Re(x0 ) und c = |x0 |2 = Re(x0 )2 + Im(x0 )2 . Damit formen wir den Nenner so um, dass er sich bequem zur Ableitung des Arcustangens hin substituieren l¨asst: 2
x2 − 2 Re(x0 )x + |x0 |2 = (x − Re(x0 )) + Im(x0 )2 2 x − Re(x0 ) 2 = Im(x0 ) +1 . Im(x0 ) Mit der Substitution y := ist somit
#
x − Re(x0 ) , Im(x0 )
1 dx = 2 x + bx + c =
= = =
=
12.5
dy 1 = dx Im(x0 )
#
1 dx − 2 Re(x0 )x + |x0 |2 # 1 1 dx
2 Im(x0 )2 x−Re(x0 ) + 1 Im(x0 ) # 1 1 dy Im(x0 ) y2 + 1 1 arctan y Im(x0 ) x − Re(x0 ) 1 arctan Im(x0 ) Im(x0 ) ⎞ ⎛ x + 2b 1 ⎠ . arctan ⎝ b2 b2 c− 4 c− 4 x2
Das uneigentliche Integral
Das uneigentliche Integral kommt in vielen Anwendungen vor. Zur Behandlung wird wieder der Grenzwertbegriff n¨otig sein, denn solche Integrale m¨ ussen u ¨ber diesen auf ihre Konvergenz hin untersucht werden.
180
12 Integration
Woher kommt aber die Notwendigkeit f¨ ur diesen Integralbegriff? Neben den Anwendungen k¨onnen wir dies recht einfach anhand der Frage beantworten, ob die Fl¨ache unter einem Funktionsgraphen ausl¨ auft“, also unendlich groß wird, ” wenn der Graph z. B. nicht die x-Achse schneidet. Folgendes Bild macht alles etwas deutlicher. Wir sehen darin die Funktion x1 aufgezeichnet. Wenn wir die Fl¨ache zur Null hin berechnen wollen, scheint diese unendlich groß zu werden, gleichfalls, wenn wir z. B. von 1 bis ins Unendliche integrieren wollen (es ist nat¨ urlich nur ein Ausschnitt zu sehen).
f (x) 20 15 10 5 x
0 0
1
2
Aber aufgepasst! Schon bei Reihen haben wir gesehen, dass wir uns nicht auf ¨ grobe Uberlegungen verlassen k¨onnen, der Schein kann tr¨ ugen. Im n¨ achsten Bild sehen wir die Graphen der Funktionen x1 (oberer Graph) und x12 (unterer Graph), beginnend bei x = 1:
181
12.5 Das uneigentliche Integral
f (x) 1.00 0.75 0.50 0.25 x
0 1
2
3
4
5
Wenn wir hier von 1 bis ins Unendliche integrieren, so konvergiert die Fl¨ ache unter dem Graphen von x12 , nicht aber unter x1 . Das war nicht zu erwarten, denn auch hier scheint die Fl¨ache unendlich groß zu werden, selbst wenn der Graph schnell n¨aher an die x-Achse kommt. Wirklich erreicht wird sie an keiner Stelle.
12.5.1
Integration unbeschr¨ ankter Funktionen
Betrachten Sie #1 0
1 dx . x
amlich der unteren) Hier ist der Integrand x1 an einer der Integrationsgrenzen (n¨ kritisch, d. h. unbeschr¨ankt. In solchen F¨allen n¨ ahern wir uns an diese Grenze an und definieren dabei #b
#b f (x)dx := lim
f (x)dx
ξa
a
#b
ξ
bzw.
#ξ f (x)dx := lim
f (x)dx ,
ξb
a
je nachdem, ob die untere oder obere Grenze kritisch ist.
a
182
12 Integration
Beispiel #1 0
1 dx = lim ξ0 x
#1
1 1 dx = lim ln xξ = lim (ln 1 − ln ξ) = lim (− ln ξ) = ∞ , ξ0 ξ0 ξ0 x
ξ
somit existiert dieses Integral nicht. F¨ ur 0 < a < 1 ist hingegen #1 0
1 1 x1−a 1 1 lim 1 − ξ 1−a = . dx = lim = a ξ0 1 − a ξ x 1 − a ξ0 1−a
Befindet sich die kritische Stelle x0 des Integranden innerhalb der Integrationsgrenzen, teilen wir den Integrationsbereich in zwei Teilst¨ ucke auf: #b
#ξ f (x)dx := lim
f (x)dx + lim
ξx0
a
#b f (x)dx .
ξx0
a
ξ
Bei mehreren kritischen Stellen zerlegen wir den Integrationsbereich entsprechend mehrfach.
12.5.2
Unbeschr¨ ankte Integrationsgrenzen
Betrachten wir hierf¨ ur #∞ 1
1 dx . x
Der Integrand ist aus dem vorigen Abschnitt bekannt, allerdings gibt es f¨ ur die untere Grenze kein Problem wie zuvor. Da wir u ¨ber die Existenz aufgrund der oberen Grenze nichts wissen, muss gesagt werden, was damit gemeint ist, n¨amlich #∞ #b f (x)dx := lim f (x)dx . b→∞
a
a
Nur wenn der Grenzwert existiert, ist das entsprechende uneigentliche Integral definiert. Analog definieren wir das uneigentliche Integral, bei dem die untere
183
12.5 Das uneigentliche Integral
Integrationsgrenze unendlich ist: #b
#b f (x)dx := lim
f (x)dx .
a→−∞
−∞
a
Beispiel #∞ 1
1 dx = lim b→∞ x
#b 1
b 1 dx = lim ln x1 = lim (ln b − ln 1) = lim ln b = ∞ , b→∞ b→∞ b→∞ x
somit existiert dieses Integral nicht. F¨ ur a > 1 ist hingegen #∞ 1
b 1 1 1 1 = 1 lim . dx = lim − 1 = b→∞ (1 − a)xa−1 1 xa 1 − a b→∞ ba−1 a−1
Sind beide Grenzen unendlich, wird also u ¨ber ganz R integriert, so teilen wir R einfach in zwei Integrationsbereiche und verwenden die obigen Definitionen: #∞
#b f (x)dx :=
−∞
#∞ f (x)dx +
−∞
f (x)dx b
#b
#c f (x)dx + lim
= lim
a→−∞
f (x)dx .
c→∞
a
b
Erst wenn beide Teilintegrale existieren, ist das gesamte Integral definiert. Wir m¨ ussen hier selbstverst¨andlich darauf achten, dass wir mit b nicht eine kritische Stelle w¨ahlen. (∞ Oft wird behauptet, dass beispielsweise das Integral −∞ xdx = 0 sei, weil der Integrand ungerade ist und sich, vom Ursprung gleichermaßen in beide Richtungen ausgehend, positive und negative Integralanteile genau aufheben. Doch Vorsicht: Starten wir nicht genau vom Ursprung oder integrieren wir nicht gleich schnell“ in positive und negative Richtung, k¨ onnten wir jeden beliebigen ” Wert erzeugen. Das widerspricht aber g¨anzlich unserem Grenzwertbegriff. Nat¨ urlich k¨onnen die behandelten Typen uneigentlicher Integrale beliebig kombiniert werden, so ist z. B. # ∞ 1 dx 3−1 x −∞
184
12 Integration
m¨oglich. Hier haben wir unbeschr¨ankte Integrationsgrenzen und einen Integranden mit einer kritischen Stelle bei 1. Aber hier ist selbstverst¨ andlich alles auf die behandelten F¨alle reduzierbar und wir k¨onnen das Integral folgendermaßen aufteilen, wobei x0 < 1 < x1 ist: #∞ −∞
1 dx = lim a→−∞ x3 − 1
#x0 a
1 dx + lim b1 x3 − 1
#x1 + lim
c1 c
#b x0
1 dx + lim d→+∞ x3 − 1
1 dx x3 − 1 #d x1
1 dx . x3 − 1
Wir liefern am Ende noch ein Beispiel mit Praxisbezug, bei dem wir einige ¨ physikalische Uberlegungen einfließen lassen.
Beispiel Wir betrachten eine Rakete auf der Oberfl¨ache eines Planeten mit dem Radius R. Ist es m¨oglich, eine solche Rakete mit nur einer endlichen Menge an Treibstoff beliebig weit ins All zu bef¨ordern? Diese Frage ist durchaus berechtigt und scheint zuerst negativ beantwortet werden zu m¨ ussen. Denn durch eine endliche Menge an Treibstoff kann die Rakete u ¨ber ihre Triebwerke nur eine endliche Arbeit gegen das Gravitationsfeld des Planeten verrichten. Dieses nimmt mit steigender H¨ohe zwar quadratisch ab, da es sich auf eine quadratisch gr¨ oßer werdende Kugeloberfl¨ache verteilt, allerdings wird es nie wirklich Null. Es wird also immer ein wenig an unserem Flugobjekt gezerrt“. Die Rakete soll also von der ” H¨ ohe R (Oberfl¨ache des Planeten) beliebig weit ins All bef¨ ordert werden. Die auf die Rakete wirkende Kraft auf der Oberfl¨ache des Planeten ist mg, wobei m die Masse der Rakete ist und g die Gravitationskonstante des Planeten. Die Kraft in Abh¨angigkeit vom Abstand r der Rakete zum Planetenmittelpunkt ist 2 dann mg Rr2 . Multiplizieren wir diese Kraft mit dem (infinitesimal kleinen) Weg dr, so haben wir die Arbeit, welche die Rakete auf diesem winzigen St¨ uck dr verrichten muss, wenn sie den Planeten verl¨asst. Die gesamte, von der Rakete zu verrichtende Arbeit erhalten wir durch (unendliche) Summation der Arbeit 2 mg Rr2 dr, was genau folgendem Integral entspricht: #
∞
mg R
R2 dr = mgR2 lim ρ→∞ r2
#
ρ
1 dr 2 R r ρ 1 = −mgR2 lim ρ→∞ r R 1 1 − = −mgR2 lim ρ→∞ ρ R = mgR .
185
12.5 Das uneigentliche Integral
Und das ist endlich! Was muss das f¨ ur eine Erleichterung f¨ ur die Pioniere der Weltraumforschung gewesen sein!
Reihen und Integrale Wir kommen hier auf Reihen zur¨ uck und nutzen beim folgenden Satz, dass das bestimmte Integral gerade u ¨ber den Grenzwert von Reihen definiert wurde, wodurch u ¨ber die Richtigkeit des Satzes eigentlich schon alles gesagt ist. Satz Sei f : [1, ∞[ → R eine stetige monoton fallende und positive Funktion. Die Reihe ∞
f (n)
n=1
konvergiert genau dann, wenn #
∞
f (x)dx 1
konvergiert. (Integralvergleichskriterium)
Beispiel Im letzten Beispiel haben wir gesehen, dass #∞ 1
1 dx = ∞ . x
Nach dem Integralvergleichskriterium divergiert ∞ also die harmonische Reihe. Klar ist dadurch aber gleichfalls, dass z. B. n=1 n12 konvergiert. Das Bild verdeutlicht das Geschehen nochmals f¨ ur die harmonische Reihe; die Rechteckfl¨achen entsprechen gerade den Summanden dieser Reihe.
186
12 Integration
f (x)
f (x) =
1 x
x
12.6
Aufgaben
1. Berechnen Sie
(
g (x) g(x) dx.
(Logarithmische Ableitung)
2. Berechnen Sie folgende Stammfunktionen: # # # cos x sin xdx , x sin xdx , cos2 xdx ,
#
x2 + x dx . x2 + 2
3. Berechnen Sie folgende Integrale: #2 1
1 dx , x3
#π
#2 sin(λx)dx ,
0
√ x x − 1dx .
1
4. Fassen Sie tabellarisch zusammen, f¨ ur welche a ∈ R die uneigentlichen Integrale #1 #∞ 1 1 dx bzw. dx xa xa 0
1
existieren und welche Werte sie annehmen. Stellen Sie die dazu notwendigen Berechnungen an. ¨ 5. Uberpr¨ ufen Sie, ob folgende uneigentlichen Integrale existieren und berechnen Sie ggf. ihren Wert: #∞ 1
1 dx , x(x + 1)2
#2 0
1 dx , x−1
#1 0
1 √ dx , 1 − x2
#∞ −∞
1 dx . 1 + x2
187
12.7 L¨ osungen
6. In Kapitel 12.4.3 haben wir folgende Formel f¨ ur das Integral rationaler Funktionen kennen gelernt: # 2x + b 1 dx = (x2 + bx + c)k (k − 1)(4c − b2 )(x2 + bx + c)k−1 # 1 2(2k − 3) + dx (f¨ ur k > 1) (k − 1)(4c − b2 ) (x2 + bx + c)k−1 (a) Berechnen Sie f¨ ur den Nennerterm f (x) := x2 + bx + c die Ableitun gen: f , f und (f )2 .
f (b) Bestimmen Sie mithilfe dieser Ableitungen f k−1 . (c) Leiten Sie daraus obige Integralformel her.
12.7
L¨ osungen
1. Der Begriff Logarithmische Ableitung“ deutet schonmal einen Zusam” menhang zum Logarithmus an. Wie genau dieser Zusammenhang aussieht, verr¨at uns die Substitutionsregel: #t
g (x) dx = g(x)
a
#t
1 g (x)dx = g(x)
a
g(t) #
1 dg = ln g(t) − ln g(a) g
g(a)
oder auch #t
g (x) dx = g(x)
a
#t a
1 dg dx = g(x) dx
g(t) #
1 dg = ln g(t) − ln g(a) . g
g(a)
Damit ist der nat¨ urliche Logarithmus eine Stammfunktion der logarithmischen Ableitung: # g (x) dx = ln g(x) + c . g(x) 2.
#
# cos x sin xdx = sin x sin x − sin x cos xdx # 1 ⇒ cos x sin xdx = sin2 x + c 2 # # x sin xdx = x(− cos x) − 1(− cos x)dx # = −x cos x + cos xdx = −x cos x + sin x + c
188
12 Integration
#
cos2 xdx =
# ⇒ #
#
cos x cos xdx # = sin x cos x − sin x(− sin x)dx # = sin x cos x + 1 − cos2 x dx # = sin x cos x + x − cos2 xdx
cos2 xdx =
x2 + x dx = x2 + 2
1 (sin x cos x + x) + c 2
#
x−2 dx x2 + 2 # # # 1 2x 1 = 1dx + dx − 2 dx 2 2 2 x +2 x +2 x 1 1 = x + ln x2 + 2 − 2 √ arctan √ 2 2 2 √ x 1 2 = x + ln x + 2 − 2 arctan √ 2 2 1+
3. #2 1
1 dx = x3 = = = =
#π 0
#2
x−3 dx
1
2 1 −2 x −2 1 2 1 −2x2 1 1 1 − −8 −2 3 8
π 1 sin(λx)dx = − cos(λx) λ 0 1 = − (cos(λπ) − cos 0) λ 1 = − (cos(λπ) − 1) λ
189
12.7 L¨ osungen
#2
#2
√
x x − 1dx = 1
1
x(x − 1) 2 dx 1
2 #2 3 3 2 2 = x (x − 1) 2 − 1 · (x − 1) 2 dx 3 3 1 1
2 3 5 2 2 2 x(x − 1) 2 − · (x − 1) 2 = 3 3 5 1 22 2 = 2− 3 35 16 = 15
4. Wir unterscheiden drei F¨alle, in denen wir zun¨ achst einmal die Stammfunktion bestimmen und so notieren, dass der Exponent von x positiv ist: # 1 −1 1 dx = = +c , a>1: xa −(a − 1)xa−1 (a − 1)xa−1 # 1 a=1: dx = ln x + c , xa # x1−a 1 +c . dx = a1: 0
1 dx = lim b0 xa
#1
1 dx xa
b
1 −1 = lim b0 (a − 1)xa−1 b −1 −1 − = lim b0 a − 1 (a − 1)ba−1 =∞
#∞ 1
1 dx = lim b→∞ xa
#b 1
1 dx xa
b −1 = lim b→∞ (a − 1)xa−1 1 −1 −1 = lim − b→∞ (a − 1)ba−1 a−1 1 = a−1
190
12 Integration
#1 a=1: 0
1 dx = lim b0 xa
#1
1 dx xa
b 1
= lim ln x|b b0
= lim (0 − ln b) b0
=∞ #∞ 1
1 dx = lim b→∞ xa
#b 1
1 dx xa b
= lim ln x|1 b→∞
= lim (ln b − 0) b→∞
=∞ #1 a1 a=1 a 0) 2
13.3 Komplexe Darstellung der Fourierreihe
Fragen • Was ist die gemeinsame Idee f¨ ur Taylor- und Fourierreihen? • Wann verwenden Sie Fourierreihen? • Wie lautet die Definition der (komplexen) Fouriereihe? • Wann entspricht die Fouriereihe der Ausgangsfunktion? • Was ist bei der Berechnung von ungeraden Funktionen zu beachten?
201
Lineare Algebra
14 Worum geht es in der Linearen Algebra? Die beiden Worte in Lineare Algebra“ k¨onnen wir isoliert betrachten und fest” stellen, dass linear“ vom lateinischen linea“ stammt, was so viel wie gerade ” ” ” Linie“ heißt. Algebra“ kommt vom arabischen al-jabr“ und bedeutet in etwa ” ” Zusammenf¨ ugen gebrochener Teile“. Aus moderner Sichtweise ließe sich also ” aus den beiden Worten folgern, dass wir es mit geraden Linien und dem Rechnen mit Variablen zu tun haben, um daraus neue Ergebnisse zu erhalten. Das ist aber zu kurz gesprungen. Wir sollten vielmehr die Begrifflichkeit Lineare ” Algebra“ als ein mathematisches Teilgebiet auffassen, in dem es — um nur das Wesentliche zu nennen — um das Folgende geht:
• L¨osung und Untersuchung linearer Gleichungssysteme, • Vektoren und Vektorr¨aume, • Abstands- und Winkelmessung, • Eigenwerte und -vektoren.
Bei der Behandlung dieser Begriffe werden Sie zahlreiche Hilfsmittel kennen lernen wie z. B. Matrizen, Determinanten, lineare Abbildungen, lineare Unabh¨angigkeit, Skalarprodukte und einiges mehr. All dies braucht Sie nicht zu verwirren oder Ihnen gar Angst zu machen. Wir werden Sie auf dem Weg zu den neuen Dingen hilfreich begleiten. Allerdings geht keine Wanderung durch das Gebirge ohne M¨ uhe. Aber Training hilft stets, das Ganze leichter zu bew¨ altigen. Bei dieser Gelegenheit wollen wir nochmals die Bedeutung der Aufgabensammlungen zu jedem Kapitel betonen. Zu den Begriffen aus obiger Aufz¨ahlung wollen wir einige Bemerkungen machen: © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_14
206
14 Worum geht es in der Linearen Algebra?
Lineare Gleichungssysteme sind Systeme von Gleichungen der Art x1 + 2x3 = 14 3x1 + 2x2 − 4x3 = 5 . Die einzelnen Gleichungen — allgemein mit n Unbekannten (die wir im Folgenden auch gerne Variablen nennen) — haben also stets die Gestalt a1 x1 + a2 x2 + a3 x3 + . . . + an−1 xn−1 + an xn = b. Die ai sind dabei reelle oder komplexe Zahlen, die xi die Unbekannten und b ist ebenfalls eine reelle oder komplexe Zahl, die Inhomogenit¨ at genannt wird. Interessant ist dabei z. B., ob es u ¨berhaupt L¨osungen gibt, wie diese aussehen und ob sie sogar eindeutig sind. Die entsprechenden Beurteilungs- und Berechnungsmethoden hierf¨ ur werden wir erlernen. Lineare Gleichungssysteme w¨aren nutzlos, k¨onnten wir mit ihnen nicht Fragen des Alltags l¨osen. Ein Eimer-Fabrikant kann z. B. die folgende Fragestellung formulieren: Er hat 10 Einheiten Kunststoff und 12 Einheiten Metall. Ein großer Eimer aus dem Produktionssortiment ben¨ otigt zur Herstellung 3 Einheiten Kunststoff und 1 Einheit Metall, f¨ ur einen kleinen Eimer braucht er 1 Einheit Kunststoff und 1 Einheit Metall. Welche Anzahl großer und kleiner Eimer kann er produzieren, ohne dass Reste anfallen? Als lineares Gleichungssystem erhalten wir 3x1 + x2 = 10 x1 + x2 = 12 . Dabei ist dann x1 die Anzahl der großen, x2 die der kleinen Eimer. Um die L¨osung k¨ ummern wir uns erst einmal nicht. Vektoren haben Sie in der Schule meist als Pfeile in der Ebene behandelt, die zu bestimmten Punkten im Koordinatensystem zeigen. In der Physik wurde dieser Begriff dann z. B. verwendet, um Kr¨afte zu beschreiben oder um durch die L¨ange des Vektors und seine Richtung die Geschwindigkeit eines Balles anzugeben. Der Begriff des Vektors ist damit aber noch lange nicht genau gekl¨ art. Mathematiker suchen nach allgemeinen Strukturen, die dann gesonderte Namen bekommen. Elemente einer Menge, die sich in diese Strukturen einf¨ ugen und die Menge in gewisser Weise nicht verlassen (k¨ onnen), bilden dann eine Gesamtheit, die h¨aufig als Raum bezeichnet wird. So gibt es auch eine spezielle Struktur, der die Vektoren gen¨ ugen; das Ganze wird Vektorraum genannt. Vektoren sind dann nicht mehr ausschließlich Pfeile“. Vielmehr werden wir ler” nen, dass auch Funktionen und andere Objekte Vektoren in einem Vektorraum sein k¨onnen.
14 Worum geht es in der Linearen Algebra?
207
Werden auf einem Tisch oder im uns umgebenden Raum zwei Punkte miteinander verbunden, so am einfachsten mit einer geraden Linie. Nun k¨ onnen wir die Frage stellen, wie lang diese Verbindungslinie ist. Liegen zwei Geraden vor: Wie groß ist der Winkel zwischen beiden? Dies sind Fragen nach der Abstands- und Winkelmessung. Die Lineare Algebra stellt uns hierf¨ ur Hilfsmittel zur Verf¨ ugung, die wir dann Norm und Skalarprodukt nennen. So werden wir einfach zwei Punkte mit einem Vektor verbinden, welcher genau auf der Verbindungslinie liegt, und seine L¨ange messen, indem wir die Norm des Vektors berechnen. Die Richtung verschiedener Geraden wird dann wieder durch Vektoren beschrieben. Mit dem Skalarprodukt k¨ onnen wir den Winkel zwischen ihnen berechnen und damit auch den Winkel zwischen Geraden. Wir wollen noch bemerken, dass sich Vektoren auch in der Welt der Computer finden, so sind u. a. bestimmte Datenstrukturen (wir denken beispielsweise an Arrays in den verschiedensten Programmiersprachen) mit Vektoren assoziiert. ¨ Eigenwerte sind etwas ganz Besonderes. Sie werden uns bei zahlreichen Uberlegungen hilfreich sein und die Arbeit vereinfachen. Dar¨ uber hinaus sind sie aber auch f¨ ur sich betrachtet interessant. Wir k¨ onnen einfach verstehen, was ein Eigenwert ist. Betrachten wir hierzu als Beispiel die folgende Gleichung, wobei f (x) eine Funktion ist und λ ∈ R. Auf der linken Seite stehe die erste df Ableitung der Funktion, also ( dx (x) = f (x)): df (x) = λf (x). dx Diese Gleichung mag kompliziert erscheinen. Aber es gibt einfache L¨ osungen. ur jedes beliebige λ ∈ R: So ist f (x) := eλx eine L¨osung f¨ df d eλx (x) = = λeλx . dx dx Gleichungen dieser Art — die wir noch allgemeiner betrachten werden — heißen Eigenwertgleichungen und λ Eigenwert zum Eigenvektor eλx . Ihre allgemeine Form ist Lv = λv , wobei wir unter L hier naiv etwas verstehen wollen, was auf den Vektor v wirkt“. In unserem Beispiel ist L einfach die erste Ableitung und v := f (x). ” Die Funktion f (x) = eλx sieht sicher nicht so aus, wie Sie es von Vektoren aus der Schule vielleicht kennen. Dies soll uns aber jetzt nicht weiter st¨ oren, denn wir werden u ¨ber den Zusammenhang noch einiges erfahren. Neben der reinen innermathematischen Anwendung von Eigenwerten haben diese auch in den Naturwissenschaften eine große Bedeutung. So werden durch bestimmte Abbildungen — die dann z. B. Namen wie Hamilton-Operator“ tra” gen — physikalische Systeme beschrieben, deren Eigenwerte beispielsweise die diskreten Energiezust¨ande eines Atoms repr¨asentieren. Dies ist hier nat¨ urlich
208
14 Worum geht es in der Linearen Algebra?
sehr vage formuliert und es erwartet niemand, dass Sie dies an dieser Stelle bereits fassen k¨onnen. Dazu sind sicherlich auch noch ein paar Semester Physik n¨otig. Aber das Beispiel gibt einen Ausblick auf das, was die Methoden und Grundideen der Linearen Algebra in ihrer Weiterentwicklung leisten k¨ onnen. Es ist gut zu wissen, dass es noch einiges hinter dem Horizont gibt. Ein weiterer interessanter Zusammenhang mit den Naturwissenschaften ist durch das so genannte Superpositionsprinzip gegeben. Physikalisch bedeutet dies, dass die Summe zweier Zust¨ande eines Systems auch wieder ein Zustand des Systems ist. So kann sich eine Gitarrensaite in bestimmten Schwingungszust¨anden befinden. Lassen sich diese geeignet mathematisch durch Funktionen beschreiben, so ist unter bestimmten Voraussetzungen die Summe der Funktionen wieder die Beschreibung eines Schwingungszustandes der Saite. Differenzialgleichungen, welche ein Wesentliches Element bei der Beschreibung von Ph¨anomenen in Naturwissenschaft und Technik sind, bilden den Teil, der Analysis und Lineare Algebra zusammenfließen l¨ asst. Wie der Name sagt, geht es hierbei auch um das Differenzieren. Wir wollen Sie ein erstes Mal mit Differenzialgleichungen bekannt machen. Eigentlich ist es sogar das zweite Mal, denn die bereits oben betrachtete Gleichung df (x) = λf (x), dx die wir auch in der (bei Differenzialgleichungen h¨ aufig verwendeten) Form f (x) − λf (x) = 0 schreiben k¨onnen, ist eine Differenzialgleichung. Eine solche zeichnet sich dadurch aus, dass sie eine gesuchte Funktion und deren Ableitung(en) — teils gar nur diese — enth¨alt. Hier kommt neben der Funktion f (x) nur die erste Ableitung f (x) vor. Gesucht ist hier also ein f (x), durch welches die Gleichung erf¨ ullt wird. Eine L¨osung hatten wir bereits erw¨ ahnt: f1 (x) = eλx . Offensichtλx lich ist aber auch f2 (x) = 2e eine L¨osung (zur Unterscheidung nennen wir ufen, dass auch nicht beide f , sondern f1 und f2 ). Sie k¨onnen leicht u ¨berpr¨ f1 + f2 eine L¨osung ist. Das Faszinierende ist nun, dass sich diese Struktur (Multiplikation mit einer Konstanten ergibt eine neue L¨osung ebenso wie die Addition zweier L¨ osungen) auch bei den oben angesprochenen linearen Gleichungssystemen findet! Auch dort sind, wenn wie bei den Differenzialgleichungen bestimmte Bedingungen erf¨ ullt sind, Summen von L¨osungen wieder L¨ osungen. Das ist der Grund, warum wir im Rahmen der Linearen Algebra gerne einen Blick auf Differenzialgleichungen werfen: Es liegt an den gemeinsamen Strukturen.
15 Vektorr¨ aume und lineare Unabh¨ angigkeit
15.1
Motivation
Vieles im t¨aglichen Leben l¨asst sich durch eine Zahl beschreiben: So hat der Januar 31 Tage und ein Byte sind acht Bit. Hierbei handelt es sich um so genannte skalare Gr¨oßen. Dar¨ uber hinaus gibt es jedoch Dinge, die sich nicht alleine durch eine Zahl beschreiben lassen, sondern bei denen auch eine Richtung von Bedeutung ist; Beispiele kommen h¨aufig aus der Physik. So bewegt sich eine Kugel beim Billard mit einer bestimmten Geschwindigkeit. Diese hat einen bestimmten Wert, auch Betrag genannt, aber auch eine Richtung, die von Bedeutung ist:
Gleiches gilt auch f¨ ur die Kraft, bei deren Wirkung es ebenfalls auf Betrag und Richtung ankommt. Wir sprechen, sofern Betrag und Richtung kennzeichnend sind, von einem Vektor, der gew¨ohnlich als Pfeil gezeichnet wird. Wir werden jedoch sehen, dass das bisher Geschriebene nur die halbe Wahrheit ist, denn Vektoren sind viel mehr, n¨amlich Elemente von Mengen, auf denen zuvor eine besondere Struktur festgelegt wurde. Dies f¨ uhrt zum Begriff des Vektorraumes. Ein solcher kann z. B. als Elemente auch Funktionen mit bestimmten Eigenschaften enthalten. Zur Darstellung solcher Vektoren versagt dann aber die einfache Vorstellung in Form von Pfeilen. Unsere bisherige Herangehensweise ist vornehmlich physikalisch motiviert. Es © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_15
210
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
l¨ asst sich aber auch ganz einfach die Frage stellen: Wie erreichen wir Punkte im Raum“? Beispielsweise so: ”
y xo ∈ R
z
x1 ∈ R2 x2
⎛ ⎞ x1 ⎝x2 ⎠ ∈ R3 x3 y
x2 x 0
xo
x 0
x
x1
Es ist klar, dass der Begriff Raum hier intuitiv verwendet wurde, denn offensichtlich haben wir nur die g¨angige Anschauung bem¨ uht und Vektoren als Pfeile in allseits bekannte Koordinatensysteme eingezeichnet. Dabei f¨ allt auf, dass die mathematische Darstellung der Vektoren einfach dadurch geschieht, dass die Koordinaten (die Sie nach Projektion des Vektors auf die Koordinatenachsen ablesen k¨onnen) einfach in Klammern geschrieben werden, wie oben geschehen. Dabei sehen wir das erste Mal die Bezeichnung R2 und R3 , was wir vorerst als Ebene“ und Raum“ verstehen wollen. Sp¨ater wird klar werden, dass es sich ” ” dabei um so genannte reelle Vektorr¨aume handelt. Wir wollen dann auch wissen, ob sich eine Menge von Vektoren bereits durch wenige Vektoren vollst¨andig beschreiben l¨asst. Die Hilfsmittel daf¨ ur sind f¨ ur sich bereits interessant und n¨ utzlich.
15.2
Vektorr¨ aume
Mehrfach sprachen wir u ¨ber Mengen mit einer besonderen Struktur. Es geht dabei im Wesentlichen darum, dass eine Menge betrachtet und durch Eigenschaften, die definieren, was mit den Elementen der Menge gemacht werden darf, festgelegt wird. Die dabei verwendeten Operationen d¨ urfen nicht aus der Menge herausf¨ uhren. Die Mathematiker reden bei Mengen mit einer Struktur dann allgemein von R¨aumen“. Wir machen uns dies mit einem Bild intuitiv ” klar: Betrachten wir einen Kreis und zeichnen in diesen, wie unten, den Radius an verschiedenen Stellen ein. Betrachten wir diese Radien als zwei Vektoren (als Pfeile visualisiert) und addieren sie mithilfe eines eingezeichneten Parallelogrammes, so zeigt der Ergebnisvektor aus dem Kreis heraus.
211
15.2 Vektorr¨ aume
v + w v
v w
w
0
0
Das wollen wir nicht! Betrachten wir hingegen zwei Vektoren wie oben in der gesamten Ebene (die nat¨ urlich in alle Richtungen unendlich weit ausgedehnt ist), so bleiben wir auch nach Addition der Vektoren in der Ebene. Wir definieren gleich den f¨ ur die Lineare Algebra bedeutsamen Vektorraum. F¨ ur diese und auch f¨ ur folgende Definitionen spielen die reellen (R) oder komplexen Zahlen (C) eine Rolle und um nicht alles einmal f¨ ur R und einmal f¨ ur C formulieren zu m¨ ussen, hat sich die Bezeichnung K als Stellvertreter f¨ ur beide Mengen etabliert. Auch wir wollen darauf nicht verzichten. Das K stammt u ¨brigens vom so genannten K¨orper, ebenfalls eine Menge mit einer besonderen Struktur. R und C sind in weiten Teilen der Mathematik die wichtigsten K¨orper. Wir wollen hier allerdings nicht n¨aher auf diese Struktur eingehen und widmen uns nun dem Vektorraum:
Definition (Vektorraum) Gelten f¨ ur eine Menge V die unten stehenden Eigenschaften 1. bis 8. f¨ ur alle x, y , z ∈ V und alle μ, λ ∈ K, so heißt die Menge V zusammen mit den Rechenoperationen +“ und ·“ K-Vektorraum. ” ” 1. (x + y ) + z = x + (y + z)
(Assoziativit¨ at der Addition)
2. x + 0 = x und x + (−x) = 0 (Nullvektor) 3. x + y = y + x
(Kommutativit¨at)
4. λ · (μ · x) = (λμ) · x
(Assoziativit¨at der Multiplikation mit Skalaren)
5. λ · (x + y ) = λ · x + λ · y ,
(λ + μ) · x = λ · x + μ · x
(Distributivit¨ at)
6. 1 · x = x 7. λ · x ∈ V 8. x + y ∈ V
212
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
• Die Elemente eines Vektorraumes sind nicht immer, wie bereits erw¨ ahnt, Pfeile“ bzw. als solche darstellbar. Diese Art der Visualisierung ist n¨ utzlich, ” jedoch nicht allgemein anwendbar. • Wir haben oben absichtlich +“ und ·“ mit Anf¨ uhrungszeichen geschrieben, ” ” denn unter dem Plus“ bzw. Mal“ verstehen wir hier allgemein nicht mehr ” ” ¨ die Rechenoperationen, welche f¨ ur reelle Zahlen bekannt sind. Ahnlichkeiten gibt es, jedoch m¨ ussen die verwendeten Rechenoperationen nachfolgend stets erst definiert werden. Bis dahin sind die verwendeten Symbole einfach Platzhalter, die konkretisiert werden m¨ ussen. • Durch die Punkte 1. bis 8. haben wir nun die erw¨ ahnte Struktur gegeben, die uns zum einen sagt, was wir mit den Elementen machen d¨ urfen. Zum anderen sagen uns die Punkte 7. und 8., dass wir beim Anwenden der Operationen nicht aus V herausgelangen k¨onnen. Wir k¨onnen uns gut vorstellen, dass all dies sehr technisch und vom Himmel ” fallend“ erscheint. Wir werden die Situation durch ein Beispiel entspannen:
Beispiel Denken wir uns anstelle der Vektoren x und y einfach reelle Zahlen x und y. Dann ist alles, was bei den Punkten 1. bis 6. steht, einfach nur das, was Sie schon immer u ¨ber das Rechnen mit reellen Zahlen wussten. In gewisser Weise wird die zugrunde liegende Idee nur verallgemeinert. Was ist aber die Rolle von 7. und 8.? Nun, wenn wir eine reelle Zahl mit einer anderen multiplizieren oder zwei reelle Zahlen miteinander addieren, so ist das Ergebnis wieder eine reelle Zahl. Die beiden Rechenoperationen f¨ uhren also nicht aus der Menge hinaus. Folgerung: Die reellen Zahlen R mit der gew¨ohnlichen Multiplikation und Addition bilden einen R-Vektorraum. (Sie haben es bisher nur nicht gewusst.) Sehen Sie sich die Vektorraumdefinition unter diesem Aspekt noch einmal an.
15.3
Der Vektorraum der reellen Zahlen
Wir sind nun ger¨ ustet, um ein weiteres Beispiel zu betrachten. Es ist eines der bedeutsamsten, da sich Betrachtungen in komplizierteren Vektorr¨ aumen oft auf solche in diesem Beispiel zur¨ uckf¨ uhren lassen, wie wir noch im Abschnitt zum Basiswechsel sehen werden. Wir f¨ uhren hier den so genannten Rn ein; dieser ist ein Vektorraum, wie wir unter Verwendung der sogleich vorgestellten Rechenoperationen mit den Punkten
213
15.3 Der Vektorraum der reellen Zahlen
1. bis 8. leicht nachpr¨ ufen k¨onnen. Seine Vektoren haben die Gestalt ⎛ ⎞ x1 ⎜ x2 ⎟ ⎜ ⎟ x1 , x2 , . . . , xn ∈ R . x := ⎜ . ⎟ , ⎝ .. ⎠ xn urliche Zahl n im Exponenten Die Zahlen xi heißen Koordinaten von x. Die nat¨ von Rn gibt die Anzahl der Koordinaten seiner Vektoren an. Ein spezieller Vektor ist der Nullvektor: ⎛ ⎞ 0 ⎜ 0 := ⎝ .. ⎟ .⎠ . 0 Wir sagen nun, welche Rechenoperationen hier verwendet werden: Addition von Vektoren: ⎛
⎞ ⎛ ⎞ ⎛ ⎞ x1 y1 x 1 + y1 ⎜ x 2 ⎟ ⎜ y2 ⎟ ⎜ x 2 + y2 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ .. ⎟ + ⎜ .. ⎟ := ⎜ ⎟ ; .. ⎝ . ⎠ ⎝.⎠ ⎝ ⎠ . xn
yn
x n + yn
Multiplikation mit Skalaren: ⎞ ⎛ ⎞ λx1 x1 ⎜ λx2 ⎟ ⎜ x2 ⎟ ⎜ ⎟ ⎜ ⎟ λ · ⎜ . ⎟ := ⎜ . ⎟ . ⎝ .. ⎠ ⎝ .. ⎠ ⎛
xn
λxn
Diese beiden Operationen sind Vektorraumoperationen, wie sie in der Definition verwendet wurden.
Beispiel ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 3 1 6 1 7 2 · ⎝2⎠ + ⎝1⎠ = ⎝4⎠ + ⎝1⎠ = ⎝5⎠ . 1 0 2 0 2 Wir k¨onnen in diesem Abschnitt statt Elementen aus R auch komplexe Zahlen verwenden und erhalten so Cn , den Vektorraum der Vektoren mit n komplexen Koordinaten.
214
15.4
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
Der Vektorraum reellwertiger Funktionen auf R
Wir m¨ ussen zugeben, dass das letzte Beispiel f¨ ur einen Vektorraum weder spektakul¨ar noch schwierig war. Dies nimmt ihm allerdings nichts von seiner immensen Bedeutung! Dennoch m¨ochten wir noch ein deutlich abstrakteres Beispiel vorstellen, welches weit von der Anschauung entfernt ist, denn Sie sollten keineswegs in dem Glauben bleiben, dass Vektoren stets als Pfeile — wie in der Schule — zu visualisieren sind. Betrachten wir als Beispiel die Menge aller Funktionen f : R → R. Wir zeigen im Folgenden, dass diese Menge zusammen mit der Addition (f + g)(x) := f (x) + g(x) und der Multiplikation mit Skalaren λ ∈ R (λ · f )(x) := λf (x) die Vektorraumeigenschaften erf¨ ullt. Der Trick dabei ist, dass durch die gerade gemachten Definitionen die beiden Rechenoperationen auf ihre Entsprechungen in R zur¨ uckgef¨ uhrt werden, womit sich das Nachpr¨ ufen der Punkte 1. bis 6. der Vektorraumdefinition er¨ ubrigt, als Beispiel f¨ uhren wir dennoch die erste Vektorraumeigenschaft aus. Nach der definierten Addition ist ((f + g) + h)(x) = (f + g)(x) + h(x) = f (x) + g(x) + h(x) = f (x) + (g + h)(x) = (f + (g + h))(x) , are. womit die erste Vektorraumeigenschaft nachgewiesen w¨ Interessant bleibt die Abgeschlossenheit der Menge bez¨ uglich dieser Rechenoperationen: Sind f¨ ur s¨amtliche Funktionen f , g : R → R sowie f¨ ur alle λ ∈ R λ·f
und
f +g
wieder Funktionen von R nach R? λ · f ordnet jedem x ∈ R die Zahl λf (x) ∈ R und f + g ordnet jedem x ∈ R die Zahl f (x) + g(x) ∈ R zu. Somit h¨ atten wir auch die Abgeschlossenheit eingesehen. ¨ Dass dies auch mal schief gehen kann, k¨onnen wir bei der Uberpr¨ ufung, ob diese Menge auch ein C-Vektorraum ist, sehen. Die Frage lautet also: Ist die Menge aller Funktionen f : R → R ein C-Vektorraum? F¨ ur λ sind somit alle komplexen Zahlen zugelassen, z. B. λ = i, und λf (x) = if (x) ist mitnichten eine reellwertige Funktion, solange es sich bei f nicht um die Nullfunktion handelt. Dem gegen¨ uber ist die Menge der Funktionen f : C → C sehr wohl ¨ ein C-Vektorraum. Uberlegen Sie bitte, ob diese Menge auch ein R-Vektorraum ist.
215
15.5 Linearkombinationen
15.5
Linearkombinationen
Die von uns verwendeten Operationen sind die Addition von Vektoren und die Multiplikation mit Skalaren. Durch diese erhalten wir aus bekannten Vektoren neue. Diese Vorgehensweise erheben wir nun zum Prinzip, n¨ amlich zu dem der Linearkombination:
Definition (Linearkombination) Sei V ein K-Vektorraum; ein Vektor v ∈ V heißt Linearkombination der Vektoren v1 , . . . , vk ∈ V , wenn er sich folgendermaßen mit λ1 , . . . , λk ∈ K darstellen l¨asst: k v = λ1v1 + . . . + λkvk λivi . =: i=1
Sprechweise: v l¨asst sich aus v1 , . . . , vk linear kombinieren.
Beispiel
2 0 6 Der Vektor v = soll aus v1 = und v2 = linear kombiniert 5 1 0 werden: 1 1 0 6 v = 5 · + · = 5v1 + v2 . 1 0 3 3 Wir sehen sofort, dass hier λ1 = 5 und λ2 =
Eine m¨ogliche Frage: Ist
0 0 1
durch
1 0 0
und
1 3
ist.
0 1 0
linear kombinierbar?
Test: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 1 0 λ1 ⎝0⎠ = λ1 ⎝0⎠ + λ2 ⎝1⎠ = ⎝ 0 ⎠ + ⎝λ2 ⎠ 1 0 0 0 0 0 = λ1 + 0 ⇔ 0 = 0 + λ2 1=0+0
(geht nicht!)
Wir haben also gelernt, wie sich bestimmte Vektoren aus bereits bekannten Vektoren konstruieren (linear kombinieren) lassen. Was entsteht nun aber, wenn wir
216
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
eine vorgegebene Menge von Vektoren betrachten und aus diesen alle m¨ oglichen Linearkombinationen bilden? Zuerst soll definiert werden, was dies mathematisch bedeutet:
Definition (lineare H¨ ulle, Spann) Sei V ein K-Vektorraum. Der Spann (oder die lineare H¨ ulle) der Vektoren v1 , . . . , vk ∈ V ist die Menge aller Vektoren, die sich aus v1 , . . . , vk linear kombinieren lassen: Span {v1 , . . . , vk } := {v = λ1v1 + . . . + λkvk | λ1 , . . . , λk ∈ K} . Es ist dabei kein Fehler, dass wir hier Span“ anstelle von Spann“ schreiben, ” ” sondern einfach eine zumeist verwendete Konvention. Einige Autoren schreiben z. B. auch L {v1 , . . . , vk }. Wir wollen ein Beispiel besonderer Art geben, indem wir auf die Visualisierung zur¨ uckgreifen: Span{↑, } = R2 . Warum ist das so? Zeichnen wir die beiden Vektoren auf ein Blatt Papier, so k¨onnen wir durch einige Skizzen schnell sehen, dass wir durch Linearkombinationen der beiden Vektoren wirklich jeden Punkt auf dem Blatt erreichen, denn dies bedeutet ja gerade, die einzelnen Vektoren zu strecken (Multiplikation mit Skalaren) und diese aneinander zu legen (Addition von Vektoren). Bedenken Sie dabei bitte, dass die Richtung eines Vektors hier umgekehrt werden kann, wenn er mit (−1) multipliziert wird. Da wir auch ohne Probleme beliebig weit u ¨ber das Blatt zeichnen k¨onnen, wird klar, dass wir auch beliebig weit davon entfernte Punkte erreichen k¨onnen. Als Ergebnis erhalten wir damit die ganze Ebene, also den R2 . Wir n¨ahern uns nun der Antwort auf die Frage, ob zur Beschreibung eines Vektorraumes unendlich viele Vektoren n¨otig sind. Dazu betrachten wir die folgende Definition.
Definition (Erzeugendensystem) Eine Familie v1 , . . . , vk ∈ V eines Vektorraumes V heißt Erzeugendensystem von V , wenn gilt: Span {v1 , . . . , vk } = V . In Worten: Die Vektoren v1 , . . . , vk spannen den Vektorraum V auf.
217
15.5 Linearkombinationen
Beispiel
x1 x2
= x1
1 0 + x2 , 0 1
also spannen (10) und (01) den gesamten R2 auf. Was zuvor λ1 und λ2 hieß, haben wir hier einfach x1 und x2 genannt, weil dies zur Beschreibung der Koordinaten eines Vektors u ¨blich ist. Die beiden zuletzt genannten Vektoren haben also die Eigenschaft, dass aus ihnen die gesamte Ebene aufgespannt werden kann. Nehmen wir nur einen der beiden Vektoren, geht das nicht. So k¨onnen wir durch x1 (10) nur die reelle Zahlengerade erhalten und auch die Linearkombinationen von (10) und z. B. (30) liefern nichts anderes.
Definition (linear abh¨angig, linear unabh¨angig) angig, Sei V ein K-Vektorraum. Die Vektoren v1 , . . . , vk ∈ V heißen linear abh¨ wenn es λ1 , . . . , λk ∈ K gibt, von denen mindestens eines ungleich Null ist, und folgende Gleichung erf¨ ullt wird: λ1v1 + . . . + λkvk = 0 . Das heißt, dass es eine Linearkombination gibt, in der sich die Vektoren genau gegeneinander aufheben. Die Vektoren heißen linear unabh¨angig, wenn aus λ1v1 + . . . + λkvk = 0 folgt, dass λ1 = . . . = λk = 0 gilt.
Definition (Basis, Dimension) Ein linear unabh¨angiges Erzeugendensystem eines Vektorraumes heißt Basis. Die Anzahl der Vektoren in einer Basis heißt Dimension und die Dimension eines Vektorraumes V wird mit dim V bezeichnet. Wir merken uns: Alle Basen eines Vektorraumes haben die gleiche Anzahl an Basisvektoren; die Dimension ist somit sinnvoll definiert. Wir werden hier, ohne dies im Folgenden gesondert zu bemerken, stets nur Vektorr¨ aume endlicher Dimension behandeln. Nat¨ urlich gibt es auch zahlreiche interessante Dinge u ¨ber den Fall unendlicher Dimension zu berichten. Dies ist aber hier nicht unser Anliegen, sondern es wird im Rahmen der Funktionalanalysis“ behandelt, einem weiteren Teilgebiet der ” Mathematik.
218
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
Beispiel ⎛ ⎞ 1 ⎜0⎟ ⎜ ⎟ ⎜0⎟ ⎜ ⎟ ⎜ .. ⎟ =: e1 , ⎜.⎟ ⎜ ⎟ ⎝0⎠ 0
⎛ ⎞ 0 ⎜1⎟ ⎜ ⎟ ⎜0⎟ ⎜ ⎟ ⎜0⎟ =: e2 , . . . , ⎜ ⎟ ⎜.⎟ ⎝ .. ⎠ 0
⎛ ⎞ 0 ⎜0⎟ ⎜ ⎟ ⎜ .. ⎟ ⎜.⎟ ⎜ ⎟ =: en . ⎜0⎟ ⎜ ⎟ ⎝0⎠ 1
Diese n Vektoren e1 , . . . , en bilden die so genannte Standardbasis des Rn , was den Rn zu einem n-dimensionalen Vektorraum macht. Wir wollen kurz obige Definition der Basis hierf¨ ur nachpr¨ ufen. • e1 , . . . , en sind linear unabh¨angig: Aus dem Gleichungssystem λ1e1 +. . .+λnen = 0 folgt λ1 ·1 = 0 (erste Zeile), λ2 · 1 = 0 (zweite Zeile), . . . , λn · 1 = 0 (letzte Zeile). Insgesamt sind somit alle λk = 0 f¨ ur 1 ≤ k ≤ n. • e1 , . . . , en bilden ein Erzeugendensystem des Rn : n n Zun¨achst einmalsind e1 , . . . , en ∈ R . Ein beliebiger Vektor v ∈ R hat v1 n die Gestalt v = ... , kann also als Linearkombination v = k=1 vkek der vn
Vektoren e1 , . . . , en geschrieben werden. Somit spannen e1 , . . . , en ganz Rn auf.
Definition (Untervektorraum) Eine nichtleere Teilmenge T eines K-Vektorraums V heißt Teilraum oder Untervektorraum (UVR), wenn gilt: 1. f¨ ur alle x, y ∈ T ⊂ V folgt x + y ∈ T ; 2. f¨ ur alle x ∈ T und λ ∈ K folgt λx ∈ T . Wichtig bei obiger Definition des Untervektorraumes ist nat¨ urlich, dass T auch wirklich Teilmenge eines Vektorraumes V ist. Die Definition zielt n¨ amlich darauf ab, dass T selbst wieder ein eigenst¨andiger Vektorraum ist, also die Vektorraumeigenschaften 1. bis 8. erf¨ ullt. Die grundlegenden Rechenregeln 1. bis 6. gelten f¨ ur alle Vektoren von V , also erst recht f¨ ur alle von T , da T Teilmenge
219
15.5 Linearkombinationen
ist. Die Eigenschaften 7. und 8. — die Abgeschlossenheit bzgl. +“ und ·“ ” ” — gew¨ahrleisteten, dass die beiden Rechenoperationen nicht aus der Menge herausf¨ uhren. Dies muss f¨ ur die kleinere Menge T nicht mehr unbedingt gelten und wird daher in der Definition des Untervektorraumes gefordert.
Beispiel ⎧ ⎛ ⎞ ⎫ ⎨ x ⎬ • T := ⎝y ⎠ x, y ∈ R ist ein UVR des R3 . ⎩ ⎭ 0
z R3
R2 x (Das obige Bild ist mathematisch nicht exakt, denn der R2 selbst liegt nat¨ urlich nicht als blaues Rechteck herum. Es handelt sich lediglich um eine die Anschauung unterst¨ utzende Skizze.) • T := {0} ist UVR von Kn . • T := (xx12 ) ∈ R2 | x1 = x2 ist UVR des R2
x2
R2
0
T
x1
• Eine Gerade, die nicht durch den Ursprung geht, ist kein UVR (wir sprechen dann aber von einem so genannten affinen Unterraum).
220
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
x2 T R
2
0
x1
Warum nicht? • Die Menge der differenzierbaren Funktionen f : R → R bildet einen UVR des R-Vektorraums aller Funktionen von R nach R. Denn die Summe zweier differenzierbarer Funktionen sowie reelle Vielfache differenzierbarer Funktionen sind wiederum differenzierbar. Ein sehr leicht zu u ufendes Kriterium bei der Untersuchung einer Men¨berpr¨ ge im Hinblick auf die Untervektorraumeigenschaften ist das Folgende: Jeder Untervektorraum U eines Vektorraumes V enth¨ alt den Nullvektor. Erf¨ ullt eine Menge also nicht einmal diese Bedingung, so k¨ onnen wir uns weitere Anstrengungen ersparen. Zun¨achst m¨ ussen wir diese Behauptung allerdings einmal (und dann nie wieder) als Folgerung der Untervektorraumdefinition untersuchen. In der Definition steht F¨ ur alle x ∈ T und λ ∈ R folgt λx ∈ T .“ Nehmen ” wir uns also irgendein x ∈ T und w¨ahlen λ = 0. Falls T wirklich ein Untervektorraum ist, gilt damit 0 · x ∈ T . Das Element 0 · x ist aber der Nullvektor 0. Schließlich k¨onnen wir der linearen Abh¨angigkeit bzw. Unabh¨ angigkeit ein wenig mehr Anschauung verleihen. Lineare Abh¨angigkeit zweier Vektoren bedeutet nichts anderes, als dass die beiden Vektoren Vielfache voneinander sind. Sie liegen also in einem eindimensionalen Untervektorraum. Lineare Abh¨ angigkeit bei drei Vektoren bedeutet entsprechend, dass alle drei Vektoren in einem ein- oder zweidimensionalen Untervektorraum — einer Ursprungsgeraden oder -ebene — liegen.
15.6
Aufgaben
1. Stellen Sie, wenn m¨oglich, die Vektoren ⎛ ⎞ ⎛ ⎞ 0 1 a) v = ⎝1⎠ , b) v = ⎝ 0 ⎠ , 2 −1
⎛ ⎞ 1 c) v = ⎝1⎠ 1
221
15.7 L¨ osungen
als Linearkombination der Vektoren ⎛ ⎞ ⎛ ⎞ 0 1 2 = ⎝2⎠ , w 1 = ⎝1⎠ , w 1 1
⎛ ⎞ 1 w 3 = ⎝1⎠ 0
dar. oglichen Kann ein Vektor w i weggelassen werden, ohne die Menge der m¨ Linearkombinationen zu verringern? ¨ 2. Uberpr¨ ufen Sie, welche der folgenden Mengen Untervektorr¨ aume sind. (a) W1 := {(x, y) ∈ R2 | x2 = y} (b) W2 := {(x1 , x2 , x3 , x4 ) ∈ R4 | x1 + x4 = 2x2 } (c) W3 := {(x1 , x2 , x3 ) ∈ R3 | x2 = 0} (d) W4 := [0,1] × R (e) W5 := {0} × R ¨ 3. Uberpr¨ ufen Sie, ob die folgende Menge ein Vektorraum ist. n k W := p : R → R | p(x) = a k x , ak ∈ R , k=0
also die Menge aller Polynome, deren Grad — d. h. gr¨ oßter auftretender Exponent — maximal n ist. Hierbei ist n eine feste nat¨ urliche Zahl. Finden Sie dann eine Basis zu W und u ufen Sie f¨ ur Ihre Wahl die ¨berpr¨ entsprechenden Eigenschaften. ¨ 4. Uberlegen Sie, unter welchen Voraussetzungen eine Ebene im Raum einen Untervektorraum bildet. Wie sieht dies bei Geraden im Raum aus? 5. Finden Sie diejenigen Zahlen α ∈ R, f¨ ur die folgende Vektoren eine Basis des R3 bilden. ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 2 0 ⎝1⎠ , ⎝ 0 ⎠ , ⎝α + 1⎠ . 1 −2 1
15.7
L¨ osungen
1. Die Vektoren sind sehr einfach gew¨ahlt, sodass schlichtes Probieren zu den Linearkombinationen f¨ uhrt. Bei komplizierteren Vektoren hilft das L¨osen von linearen Gleichungssystemen (siehe Kapitel 17). In Teil a) hilft die Null in der ersten Komponente von v . Um diese auch in der Linearkombination zu erhalten, stehen uns lediglich Kombinationen der Form v = aw 1 + b(w 2 − w 3 ) zur Verf¨ ugung. Dabei f¨ allt auf, dass w 2 − w 3 = w 1
222
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
ist (merken!). Also gingen, wenn u ¨berhaupt, nur Linearkombinationen der Form v = cw 1 ; diese Gleichung stimmt offensichtlich nicht. An dieser Stelle k¨onnen wir bereits die Frage am Schluss der Aufgabe beantworten. Wegen w 2 − w 3 = w 1 kann jeder der drei Vektoren w i in Linearkombinationen weggelassen und durch die anderen beiden ersetzt werden. Dies machen wir uns f¨ ur die Betrachtungen in b) und c) nat¨ urlich zunutze und verzichten dabei auf, sagen wir, w 3 . Es interessieren also nur noch Linearkombinationen der Form 2 . v = aw 1 + bw In Teil b) ben¨otigen wir f¨ ur die 1 in der ersten Komponente, dass b = 1 ist. Um die zweite Komponente zu Null zu bekommen, muss dann a = −2 sein, also v = −2w 1 + w 2 . In dieser Gleichung stimmt auch
1 die dritte Komponente, sodass dies eine Linearkombination von v = 0 darstellt. −1 ˇIn Teil c) kommen wir mit genau der gleichen Vorgehensweise wie in b) zu einem Widerspruch in der
1dritten Komponente, somit gibt es keine Linearkombination f¨ ur v = 1 . 1
2. Bei der Untersuchung der Unterraumeigenschaft einer Menge sollte zun¨achst gepr¨ uft werden, ob der Nullvektor in der Menge enthalten ist. Dies ist ein sehr leicht zu testendes Kriterium. Ohne Nullvektor kann eine Menge kein Untervektorraum mehr sein. (a) Wegen 02 = 0 ist (00) ∈ W1 . Allerdings sollte das Quadrat beim x misstrauisch machen. Also testen wir die zwei definierenden Unterraumeigenschaften, i. v , w ∈ W1 ⇒ v + w ∈ W1 und ii. v ∈ W1 ⇒ λv ∈ W1 , zun¨achst einmal an zwei konkreten Vektoren aus der Menge, beispielsweise (11) und (24). Deren Summe ist (35), kein Vektor von W1 . Somit ist W1 kein Untervektorraum. (b) Auch W2 enth¨alt den Nullvektor. Tests konkreter Vektoren wie zuvor werden diesmal nicht zum Widerspruch f¨ uhren. Also versuchen wir, die Unterraumeigenschaften f¨ ur alle Vektoren von W2 nachzuweisen. ur deren Komponenten v1 + v4 = Seien dazu v , w ∈ W2 . Es gilt also f¨ ur die 2v2 und w1 + w4 = 2w2 . Die entsprechenden Gleichungen f¨ Summe v + w (v1 + w1 ) + (v4 + w4 ) = 2(v2 + w2 ) und f¨ ur die Multiplikation mit Skalaren λv (λv1 ) + (λv4 ) = 2(λv2 )
223
15.7 L¨ osungen
k¨onnen daraus direkt gefolgert werden. Da wir keine konkreten Werte f¨ ur v und w vorausgesetzt haben, sind die Vektorraumeigenschafullt und W2 ist somit ein Untervekten f¨ ur alle Vektoren von W2 erf¨ torraum. (c) Hier ist die Vorgehensweise die gleiche wie zuvor. W3 ist ebenfalls ein Untervektorraum. (d) In W4 sind die Vektoren nur in der ersten Komponente eingeschr¨ ankt. Diese muss zwischen 0 und 1 liegen. Hierbei ist schnell einzusehen, dass die Addition und Multiplikation mit Skalaren leicht aus der Menge herausf¨ uhren. Ein konkretes Gegenbeispiel ist 1 1 ∈ / W4 . ∈ W4 , aber 2 · 2 2 W4 ist somit kein Untervektorraum. (e) Bei W5 ist dies nicht der Fall und wir m¨ ussen die Vektorraumeigenschaften wieder f¨ ur alle Vektoren von W5 zeigen. Seien dazu v , ur v + w als auch w ∈ W5 , also v1 = w1 = 0. Offensichtlich ist sowohl f¨ f¨ ur λv die erste Komponente Null. Da dies die einzige Bedingung der Menge ist, gelten die Unterraumeigenschaften f¨ ur W 5 . 3. Die Eigenschaften 1. bis 6. der Vektorraumdefinition k¨ onnen stets auf die entsprechende Eigenschaft in R zur¨ uckgef¨ uhrt werden. Interessant sind die 7. und 8. Vektorraumeigenschaft. Das sind die gleichen wie bei der Untervektorraumdefinition: die Abgeschlossenheit bzgl. Addition und Multiplikation mit Skalaren. Nun ist die Summe zweier Polynome wieder ein Polynom und das λ-Fache ebenfalls. Weiterhin erh¨ oht sich dabei der Grad der Polynome nicht, somit ist W unter diesen Operationen abgeschlossen. Mit einer Basis von W soll jedes Polynom maximal n-ten Grades dargestellt werden k¨onnen. Mit P0 (x) := 1 k¨ onnen alle Polynome nullten Grades (Konstante Funktionen) linear kombiniert werden. Mit P0 (x) und P1 (x) := x k¨onnen alle Polynome bis zum ersten Grad linear kombiniert werden. Allgemein dient {1, x, x2 , x3 , . . . , xn } als ein Erzeugendensystem der Menge W . Außerdem ist dieses System linear unabh¨angig, denn keines der Monome — so heißen obige Grundbausteine der Polynome — kann durch die anderen dargestellt werden. Somit haben wir eine Basis von W gefunden. 4. Da der Nullvektor Element eines jeden Untervektorraums ist, k¨ onnen allenfalls Ursprungsebenen Untervektorr¨aume sein. Elemente x einer solchen Ebene erf¨ ullen die Ebenengleichung x = 0 + tv1 + sv2
224
15 Vektorr¨ aume, lineare Unabh¨ angigkeit
und daran k¨onnen die beiden Untervektorraumeigenschaften leicht nachgewiesen werden. Somit sind alle Ursprungsebenen Untervektorr¨ aume. Geraden im Raum verhalten sich ¨ahnlich. Nur Ursprungsgeraden sind Untervektorr¨aume. 5. Jede Basis des R3 besteht aus drei linear unabh¨ angigen Vektoren. Andererseits bilden je drei linear unabh¨angige Vektoren des R3 eine Basis. Insgesamt m¨ ussen wir also lediglich testen, f¨ ur welche α die gegebenen Vektoren linear unabh¨angig sind. Nach der Definition der linearen Unabh¨angigkeit muss aus der Gleichung ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 2 0 0 λ1 ⎝1⎠ + λ2 ⎝ 0 ⎠ + λ3 ⎝α + 1⎠ = ⎝0⎠ 1 −2 1 0 ur die erste Komponente der Gleichung, 2λ2 = λ1 = λ2 = λ3 = 0 folgen. F¨ 0 folgt bereits λ2 = 0. Eingesetzt in die dritte Komponente ergibt sich λ1 + λ3 = 0, also λ1 = −λ3 . Beides setzen wir in die zweite Komponente mit dem Parameter α ein und erhalten −λ3 + λ3 (α + 1) = λ3 α = 0 . Somit folgt auch λ3 = 0, also die lineare Unabh¨ angigkeit, falls α = 0 ist. F¨ ur α = 0 sind die Vektoren linear abh¨angig.
15.7 L¨ osungen
225
Fragen • Definieren Sie den Vektorraum der reellen Zahlen und den Vektorraum der reellwertigen Funktionen auf R. • Kennen Sie weitere Vektorr¨aume? • Definieren Sie den Begriff der linearen Unabh¨ angigkeit. • Was bedeutet es mathematisch, dass ein Vektor v0 von den Vektoren v1 , . . . , vn linear abh¨angig ist? • Was ist der Unterschied zwischen einer Basis und einem Erzeugendensystem? • Ist die lineare H¨ ulle einer Anzahl von Vektoren eines Vektorraumes V immer ein Untervektorraum von V ? • Geben Sie zwei unterschiedliche Untervektorr¨ aume des R4 an. • Wie wird die Dimension eines Untervektorraumes bestimmt?
16 Lineare Abbildungen und Matrizen
16.1
Motivation
Ein Schl¨ usselbegriff in der Linearen Algebra ist derjenige der linearen Abbildung. Die Definition findet sich weiter unten und erst mit dieser k¨ onnen wir dann wirklich verstehen, worum es geht. Feststellen l¨ asst sich aber, dass Sie bereits lineare Abbildungen kennen; so stellt z. B. das Differenzieren eine lineare Abbildung dar. Der hier behandelte Begriff ist vorerst einfach nur theoretisch motiviert, allerdings wird die sp¨atere Anwendung der linearen Abbildungen im Bereich von Eigenwerten, linearen Gleichungssystemen etc. zahlreiche motivierende Beispiele liefern. Die linearen Abbildungen k¨onnen zwar exakt angegeben werden, aber mit der reinen Abbildungsvorschrift l¨asst sich in vielen F¨ allen nicht komfortabel und u ¨bersichtlich rechnen. Es w¨are daher sch¨on, eine einfachere Darstellung der linearen Abbildungen zu bekommen. Dies gelingt mithilfe der so genannten Matrizen, welche ein u ¨bersichtliches Schema der Abbildungsvorschrift darstellen. Dieses lernen wir hier kennen und wenden es sp¨ ater u. a. bei linearen Gleichungssystemen an, welche sich unter Verwendung der Matrizen sehr u ¨bersichtlich und kompakt aufschreiben lassen.
16.2
Grundlagen zu linearen Abbildungen
Definition (lineare Abbildung) Eine Abbildung L : V → W zwischen zwei K-Vektorr¨ aumen V und W heißt linear, wenn f¨ ur alle x, y ∈ V und alle λ ∈ K gilt: © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_16
228
16 Lineare Abbildungen und Matrizen
• L(x + y ) = L(x) + L(y ), • L(λx) = λL(x). Die hier genannten Bedingungen m¨ ussen also stets bei einer Abbildung u ¨berpr¨ uft werden, damit diese linear genannt werden kann. H¨ aufig wird versucht, einfach nur auf die Definition zu starren und zu erkennen, ob die Bedingungen erf¨ ullt sind. Es bleibt einem aber nichts anderes u achlich die ¨brig, als tats¨ Forderungen zu u ufen. Wir wollen dies an einem einfachen Fall u ¨berpr¨ ¨ben.
Beispiel Sei L : R3 → R2 mit L
x1 x2 x3
:= (xx13 ). Dann ist
⎛
⎞ ⎛ ⎞ ⎛ ⎞ x1 y1 x 1 + y1 x1 y x1 + y 1 ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ L( x2 + y2 ) = L x2 + y2 = = + 1 x 3 + y3 x3 y3 x3 y3 x 3 + y3 ⎛ ⎞ ⎛ ⎞ x1 y1 = L ⎝x2 ⎠ + L ⎝y2 ⎠ x3 y3 sowie ⎛
⎞ ⎛ ⎞ x1 λx1 x λx1 ⎝ ⎠ ⎝ ⎠ L(λ x2 ) = L λx2 = =λ 1 λx3 x3 x3 λx3 ⎛ ⎞ x1 = λL ⎝x2 ⎠ . x3
Beispiel Gegenbeispiel: Sei f : R → R mit f (x) := x2 . Hier ist f (x + y) = (x + y)2 = x2 + 2xy + y 2 = x2 + y 2 . Die Gleicheit gilt nur f¨ ur die Wahl spezieller Werte f¨ ur x und y, aber nicht allgemein!
229
16.3 Kern und Bild
Es gibt noch eine recht interessante Eigenschaft linearer Abbildungen, die wir zeigen wollen; dabei ist L : V → W und x ∈ V : L(0) = L(0 · x) = 0 · L(x) = 0. Bitte beachten Sie, dass auf der linken Seite der Nullvektor aus V abgebildet wird, auf der rechten Seite allerdings der Nullvektor aus W steht. Dies ist klar, da wir wissen, von wo aus die Abbildung L wohin abbildet, allerdings wird dies oft u at verwendet. ¨bersehen. Bei der Berechnung oben wurde nur die Linearit¨ Fazit: Der Nullvektor wird durch lineare Abbildungen stets wieder auf den Nullvektor abgebildet. Wie in der Motivation angesprochen, wollen wir noch genauer die Ableitung einer Funktion untersuchen. Dazu betrachten wir Funktionen f , g : R → R, die d (gelesen: d differenzierbar sind, und bezeichnen die Ableitung einfach mit dx ” nach d x“). Dann haben wir bereits gelernt, dass bei Summen jeder Summand getrennt abgeleitet werden darf: d d d (f (x) + g(x)) = f (x) + g(x) , dx dx dx und dass konstante Faktoren von der Ableitung unber¨ uhrt bleiben: d d (λf (x)) = λ f (x) . dx dx d Dies bedeutet aber gerade, dass dx , also das Ableiten, eine lineare Abbildung ist. Ebenso ist das Integral eine lineare Abbildung, was Sie bitte selbst pr¨ ufen.
16.3
Kern und Bild
Im Zusammenhang mit linearen Abbildungen gibt es zwei wichtige Begriffe, die wir nun pr¨asentieren m¨ochten.
Definition (Kern, Bild) Sei L : V → W eine lineare Abbildung. Dann heißt die Menge ! Kern L := x ∈ V | Lx = 0 der Kern von L und die Menge Bild L := L(V ) = {Lx ∈ W | x ∈ V } das Bild von L.
230
16 Lineare Abbildungen und Matrizen
Der Kern einer linearen Abbildung L : V → W ist ein Untervektorraum von V , das Bild ist ein Untervektorraum von W .
Beispiel Sei f : R2 → R2 , (x, y) → (x − y, y − x). Kern L ist besonders leicht zu erhalten, denn nach der Abbildungsvorschrift f¨ ur unser f kommt gerade dann Null als Wert heraus, wenn x und y gleich sind. Wir erhalten also die gezeichnete Gerade durch den Ursprung (Winkelhalbierende). Dass diese Gerade durch den Ursprung geht, verdeutlicht nochmals, dass es sich bei Kern L tats¨achlich um einen Untervektorraum des R2 handelt. y
Kern L
x
Bild L
y
x
Um Bild L zu erhalten, gibt es verschiedene M¨oglichkeiten; eine einfache ist: Die beiden Komponenten von f (x, y) unterscheiden sich offensichtlich nur durch ihr Vorzeichen, beispielsweise f (1,0) = (1, −1). Sie sind also von der Gestalt (z, −z) und befinden sich somit auf der in der rechten Skizze eingezeichneten Winkelhalbierenden. Da es sich beim Bild um einen Untervektorraum handelt, muss auch jeder Punkt der Winkelhalbierenden erreicht werden. Finden Sie unter Zuhilfenahme des n¨achsten Satzes noch eine andere Erkl¨ arung? Das Bild einer linearen Abbildung gibt Aufschluss dar¨ uber, was die Abbildung einem eigentlich im Bildraum, hier also dem Vektorraum W , liefert. Wie wir im Beispiel gesehen haben, ist dies teils sehr einfach geometrisch darstellbar. Der Kern einer linearen Abbildung ist die L¨ osungsmenge spezieller linearer Gleichungssysteme, die wir sp¨ater behandeln werden. Wir wollen uns nochmals u ¨berlegen, ob etwas u ¨ber den Kern, das Bild und den Zusammenhang zur Dimension gesagt werden kann. Das Bild entspricht ja gerade dem, was nach Anwendung der linearen Abbildung L erhalten wird. Das Bild ist auch ein Vektorraum (Untervektorraum von W ) und hat somit auch eine Dimension. Beim Abbilden durch L geht aber auch einiges in gewisser Weise verloren. Es kann durchaus passieren, dass ein Vektor — und alle seine Vielfachen — durch L auf den Nullvektor abgebildet wird. Dieser befindet sich dann gerade im Kern von L, kann folglich im Bild nicht mehr dazu dienen,
231
16.4 Grundlegendes zu Matrizen
die Dimension zu erh¨ohen. Was also einerseits im Bild verloren geht, taucht im Kern wieder auf. Wir verstehen damit den folgenden Satz:
Satz Sei L : V → W eine lineare Abbildung. Dann gilt dim V = dim(Kern L) + dim(Bild L). (Dimensionssatz)
Im zuvor betrachteten Beispiel sehen wir sofort, dass der Satz (nat¨ urlich) erf¨ ullt ist, denn die lineare Abbildung dort bildet vom R2 auf den R2 ab und die Dimension von Kern L und Bild L ist jeweils 1.
Definition (Defekt, Rang) Die Dimension des Kerns einer linearen Abbildung wird auch als Defekt Def L := dim(Kern L) bezeichnet, die Dimension des Bildes einer linearen Abbildung als Rang Rang L := dim(Bild L) . Obiger Satz lautet damit dim V = Def L + Rang L .
16.4
Grundlegendes zu Matrizen
Bevor wir Matrizen anwenden und mit ihnen rechnen, betrachten wir deren Definition:
Definition ((m × n)-Matrix, Zeilenindex, Spaltenindex) F¨ ur aij ∈ K, i ∈ {1, . . . , m}, j ∈ {1, . . . , n} heißt ⎛ ⎞ a11 a12 . . . a1n ⎜ a21 a22 . . . a2n ⎟ ⎜ ⎟ A := ⎜ . .. .. ⎟ =: (aij ) = (aij )i=1,...,m; ⎝ .. . . ⎠ am1 am2 . . . amn
j=1,...,n
232
16 Lineare Abbildungen und Matrizen
eine Matrix vom Format (m × n) mit Eintr¨agen aus K. Kurz: (m × n)-Matrix oder auch (m, n)-Matrix. Der erste Index, hier i genannt, heißt Zeilenindex, der zweite Spaltenindex.
Definition (M (m × n, K)) ur alle i und j wird als Die Menge aller (m × n)-Matrizen mit aij ∈ K f¨ M (m × n, K)
notiert. Beispiele daf¨ ur sind: ⎛ ⎞ i ⎝ 2 ⎠ ∈ M (3 × 1, C) , 3+i
2 0
1 1
∈ M (2 × 2, R) .
Eine sehr wichtige Matrix ist die Einheitsmatrix : ⎛ ⎞ 1 0 ... 0 ⎜ .. ⎟ ⎜0 1 .⎟ ⎟ , En ∈ M (n × n, R) . En := ⎜ ⎜. ⎟ .. ⎝ .. . 0⎠ 0 ... 0 1 Beim Rechnen mit Matrizen (siehe den folgenden Abschnitt) u ¨bernimmt die Einheitsmatrix die Rolle der 1 bei den reellen Zahlen. Beispielsweise hat die
1 0 0 (3 × 3)-Einheitsmatrix die Gestalt E3 = 0 1 0 . Wir bemerken noch, dass 001 statt En h¨aufig auch einfach nur E geschrieben wird, wenn die Dimension klar ist. Teils findet sich in der Literatur auch In bzw. I. Bis hier handelt es sich bei einer Matrix nur um ein Schema. Seine Bedeutung wird dadurch klar, dass jede lineare Abbildung als Matrix dargestellt werden kann. Zusammen mit den Rechenregeln f¨ ur Matrizen wird dann deutlich, dass es durch die Darstellung linearer Abbildungen als Matrizen viel einfacher ist, mit diesen zu rechnen. Ferner ist die Matrixdarstellung u ¨bersichtlicher und wir k¨onnen schon jetzt manifestieren, dass wir beim Arbeiten mit linearen Abbildungen fast ausschließlich an Matrizen denken. Der nachstehende Satz erkl¨art sich eigentlich von selbst: Wenn wir mit L ein Element v ∈ V nach W abbilden, dann l¨asst sich L(v ) eindeutig als Linearkombination von Basiselementen aus W darstellen. Dies gilt nat¨ urlich auch dann, wenn wir Basisvektoren von V abbilden.
16.4 Grundlegendes zu Matrizen
233
Satz Seien V und W zwei K-Vektorr¨aume mit Basen {v1 , . . . , vn } und {w 1, . . . , w m} und sei L : V → W eine lineare Abbildung. Dann gibt es eindeutig bestimmte Zahlen a1j , . . . , amj ∈ K, sodass L(vj ) = a1j w 1 + . . . + amj w m gilt.
Die letzte Gleichung l¨asst sich nun f¨ ur alle vj mit j = 1, . . . ,n aufschreiben und wir erhalten dann aus den aij genau eine Matrix, wie wir sie zum Anfang dieses Unterabschnittes definiert haben. Die Koeffizienten zum j-ten Basisvektor vj bilden folglich die j-te Spalte der Matrix (aij ). Wir versuchen mit dem folgenden Beispiel zum gerade formulierten Satz alles noch klarer zu machen, sodass es in Zukunft kein Problem mehr sein sollte, aus gegebenen linearen Abbildungen die zugeh¨origen Matrizen zu basteln.
Beispiel Seien V := R2 mit der Standardbasis und L : V → V durch x+y L(x, y) := 2y ¨ gegeben. Diese Abbildung ist linear (was Sie als Ubung nachpr¨ ufen sollten). Als Basiselemente w¨ahlen wir 1 0 1 = und v2 = w 2 = , v1 = w 0 1 da V = W gilt. Nun ist nach obigem Satz 0 1 1 a11 + , )= = a11 w 1 + a21 w 2 = L(v1 ) = L( 0 a21 0 0 also a11 = 1 und a21 = 0. Ferner ist 0 0 1 a12 + )= = a12 w 1 + a22 w 2 = , L(v2 ) = L( 0 a22 1 2 also a12 = 1 und a22 = 2. Insgesamt folgt, dass die lineare Abbildung L durch die Matrix 1 1 A= 0 2 repr¨asentiert wird. Sie k¨onnen, wenn Sie unserer Rechnung nicht trauen (was allerdings unbegr¨ undet w¨are), gerne nachrechnen, dass gilt: x L(x, y) = A . y
234
16 Lineare Abbildungen und Matrizen
Wie ein Vektor mit einer Matrix multipliziert wird, ist im n¨ achsten Abschnitt erkl¨art. Als Merkregel k¨onnen wir festhalten: In der j-ten Spalte stehen die Koeffizienten des Bildes des j-ten Basisvektors. Nachdem wir jetzt wissen, was eine Matrix ist, und gelernt haben, wie sich zu jeder linearen Abbildung die zugeh¨orige Matrix angeben l¨ asst, k¨ onnen wir die Begriffe Rang, Bild, Kern und Defekt gleichberechtigt f¨ ur Matrizen verwenden. Der Begriff des Ranges ist von besonderer Bedeutung, daher der folgende Satz, der eine Beziehung zwischen den Spalten bzw. Zeilen einer Matrix herstellt, die jeweils als Vektoren (Spalten- bzw. Zeilenvektoren) aufgefasst werden k¨ onnen.
Satz Der Rang einer Matrix, also der Rang der durch die Matrix repr¨ asentierten Linearen Abbildung, ist gleich der Anzahl ihrer linear unabh¨ angigen Spaltenvektoren, was wiederum gleich der Anzahl ihrer linear unabh¨ angigen Zeilenvektoren ist.
16.5
Rechnen mit Matrizen
16.5.1
Multiplikation von Matrizen
Wenn eine Matrix eine lineare Abbildung darstellen soll, m¨ ussen wir wissen, wie art ist. Zu diesem Zweck Matrizen auf Vektoren des Kn wirken, wie also Av erkl¨ werden wir eine Multiplikation zwischen Matrix und Vektor definieren und sie schlicht Matrix-Vektor-Multiplikation nennen. Allerdings sei an dieser Stelle daran erinnert, dass Vektoren des Kn auch als Matrizen, n¨ amlich als (n × 1)Matrizen, aufgefasst werden k¨onnen. Daher definieren wir die Multiplikation von Matrizen auch gleich allgemein. Wir werden diese noch mehrfach anwenden.
Definition (Matrixprodukt, Matrix-Vektor-Produkt) Seien zwei Matrizen A := (aij ) ∈ M (m × n, K) und B := (bjk ) ∈ M (n × p, K) gegeben. Dann ist das Matrixprodukt definiert als ⎞ ⎛ n aij bjk ⎠ . AB = A · B := ⎝ j=1
i=1...m, k=1...p
Das Matrix-Vektor-Produkt Av ist als Spezialfall des Matrixproduktes erkl¨ art, indem v als (n × 1)-Matrix aufgefasst wird und an die Stelle von B tritt.
16.5 Rechnen mit Matrizen
235
Einzelne Indizes sind nur deshalb unterstrichen, um deren Zusammengeh¨ origkeit deutlicher zu machen. Wir geben zu, dass es sehr un¨ ubersichtlich ist, nach dieser Definition hier zu rechnen, denn die Vorschrift scheint doch etwas kompliziert zu sein (wenn sie es auch eigentlich gar nicht ist, nachdem einmal wirklich mit ihr gerechnet wurde). Wir geben dennoch schematisch ein Beispiel. Dieses verdeutlicht, dass eigentlich immer nur die Zeilen (beginnend mit der ersten Zeile) der linken Matrix auf die Spalten (beginnend mit der ersten Spalte) der rechten Matrix gelegt werden. Die aufeinander gelegten“ Eintr¨ age werden ” dann einfach multipliziert und die Ergebnisse mit den anderen entstehenden Termen addiert. Beispielsweise sieht das Matrixprodukt f¨ ur (2 × 2)-Matrizen so aus: a11 a12 b11 b12 a11 · b11 + a12 · b21 a11 · b12 + a12 · b22 · = a21 a22 b21 b22 a21 · b11 + a22 · b21 a21 · b12 + a22 · b22 und das Matrix-Vektor-Produkt a11 a12 v a11 · v1 + a12 · v2 · 1 = . a21 a22 v2 a21 · v1 + a22 · v2 Nat¨ urlich kann der Ergebnisvektor dieser Matrix-Vektor-Multiplikation wieder mit einer Matrix multipliziert werden. D. h. nach der Abbildung durch die erste Matrix erfolgt die Abbildung durch die zweite. Erinnern wir uns daran, dass jeder linearen Abbildung bzgl. einer Basis eindeutig eine Matrix zugeordnet werden kann, so wird klar, dass das Matrixprodukt genau der Hintereinanderausf¨ uhrung der zugeh¨origen linearen Abbildungen entspricht. Daf¨ ur ist es wichtig, dass die Produktbildung mehrerer Matrizen — im Sinne des ersten der folgenden Punkte — nicht von der Reihenfolge abh¨ angt. F¨ ur von ihrer Zeilen- und Spaltenzahl her passende“ Matrizen A, B, C und ” f¨ ur λ ∈ K gilt: • (AB)C = A(BC) • A(B + C) = AB + AC • A(λB) = λ(AB) = (λA)B • (AB)T = B T AT
(Definition der transponierten Matrix auf Seite 238)
• AEn = Em A = A Bei der letzten Gleichung ist A eine Matrix mit m Zeilen und n Spalten. Es ist nicht schwer, diese einzelnen Punkte zu beweisen. Es m¨ ussen nur die Definitionen der Rechenoperationen beachtet werden. Dann ist klar, dass die Behauptungen stimmen. Es ist auch eine gute Idee, die Punkte nur f¨ ur Matrizen aus M (2 × 2, R) zu beweisen, denn die Bildungsvorschriften zu den Rechenoperationen sind ja f¨ ur alle anderen Matrizen die gleichen. Interessant ist noch, den
236
16 Lineare Abbildungen und Matrizen
Fall der Matrizen aus M (1 × 1, R) zu untersuchen. Hier handelt es sich n¨ amlich nur um reelle Zahlen. Welche Gestalt hat in diesem Fall die Einheitsmatrix?
Beispiel Das Matrixprodukt
⎛ 0 2 ⎝ · 3 1 0
2 0
⎞ 4 4⎠ 2
2 1 1
ist nicht erkl¨art!
Beispiel ⎛
⎛
2 ⎝0 0
0 4 0
⎞ ⎛ 0 1 0⎠ · ⎝0 6 0
0 3 0
⎞ 0 0⎠ 5
⎞ 2·1+0+0 2·0+0·3+0 2·0+0+0·5 0+4·3+0 0 + 0 · 4 + 0 · 5⎠ = ⎝0 · 1 + 4 · 0 + 0 0·1+0+6·0 0+0·3+6·0 0+0+6·5 ⎛ ⎞ 2 0 0 = ⎝0 12 0 ⎠ 0 0 30
16.5.2
Vektorraumstruktur fu ¨ r Matrizen
Definition (Matrixsumme, Multiplikation mit Skalaren) Seien A := (aij ), B := (bij ) ∈ M (m × n, K) und λ ∈ K. Dann definieren wir Matrixsumme und Multiplikation mit Skalaren: A + B := (aij + bij ) λA := (λaij )
237
16.6 Besondere Matrizen
Beispiel −
1 2 1 2 −1 −2 = −1 = , 3 4 3 4 −3 −4 0 1 3 2 3 3 + = . 2 0 0 0 2 0
F¨ ur A, B, C ∈ M (m × n, K) und λ, μ ∈ K gelten — wie auch f¨ ur Vektoren — folgende Rechenregeln, wobei im zweiten Punkt 0 die (m × n)-Matrix ist, deren Eintr¨age alle 0 ∈ K sind: • (A + B) + C = A + (B + C) • A + 0 = A und A + (−A) = 0 • A+B =B+A • λ(μA) = (λμ)A • λ(A + B) = λA + λB • 1 · A = A mit 1 ∈ K. Die Matrizen mit den Operationen der Addition von Matrizen und Multiplikation mit Skalaren bilden einen Vektorraum, wie sich aus Obigem leicht erkennen l¨asst. Wer es nicht glaubt, der schlage bitte schnell im Abschnitt u ¨ber Vektorr¨aume nach und u ufe die Punkte, die zur Erf¨ ullung der Vektorraum¨berpr¨ eigenschaften n¨otig sind.
16.6
Besondere Matrizen
In Theorie und Praxis treten h¨aufig besondere Matrizen auf, von denen wir nun einige wichtige Vertreter vorstellen m¨ochten: Zun¨achst sind das quadratische Matrizen; das sind solche mit gleicher Zeilenund Spaltenzahl, darunter: • Einheitsmatrix (die haben wir bereits kennen ⎛ 1 0 ... ⎜ ⎜0 1 En := ⎜ ⎜. .. ⎝ .. . 0 ... 0
gelernt): ⎞ 0 .. ⎟ .⎟ ⎟ ⎟ 0⎠ 1
238
16 Lineare Abbildungen und Matrizen
• Diagonalmatrix : ⎛ ⎜ ⎜ (aij ) = (aii ) := ⎜ ⎜ ⎝
• obere (untere) Dreiecksmatrix : ⎛ ⎞ ∗ ....... ∗ ⎜ .. ⎟ ⎜0 . . . .⎟ ⎜ ⎟ ⎜. .⎟ .. ⎝ .. . .. ⎠ 0 ... 0 ∗
a11
0
0 .. .
a22
0
...
... .. 0
⎛ bzw.
.
∗ ⎜ .. ⎜. ⎜ ⎜. ⎝ .. ∗
⎞ 0 .. ⎟ . ⎟ ⎟ ⎟ 0 ⎠ ann
0 .. .
... ..
. .......
⎞ 0 .. ⎟ .⎟ ⎟ ⎟ 0⎠ ∗
( *“ bedeutet, dass an dieser Stelle beliebige Zahlen stehen k¨ onnen.) ”
Definition (transponierte Matrix) Aus A := (aij ) ergibt sich die transponierte Matrix durch AT := (aij )T := (aji ) . Zeilen und Spalten werden also vertauscht. Geschrieben wird auch At statt AT . Es gilt (AB)T = B T AT .
(invertierbar, Inverse) Definition Eine quadratische Matrix A ∈ M (n × n, K) heißt invertierbar, wenn ein B ∈ M (n × n, K) existiert mit AB = En (= BA) . F¨ ur die Matrix B wird dann A−1 geschrieben und diese heißt Inverse von A.
Beispiel Eine (2 × 2)-Matrix A = ac db ist genau dann invertierbar, wenn ad − bc = 0 gilt. Die Inverse hat dann die Gestalt 1 d −b −1 . A = ad − bc −c a
239
16.6 Besondere Matrizen
Zum Invertieren gr¨oßerer Matrizen k¨onnen wir den so genannten Gauß-Algorithmus verwenden. Diesen lernen wir aber erst im Abschnitt u ¨ber lineare Gleichungssysteme kennen; dort kommen wir dann auf das Invertieren zur¨ uck.
Definition (symmetrisch, antisymmetrisch, orthogonal) A ∈ M (n × n, K) heißt symmetrisch, falls gilt: A = AT ,
d. h. (aij ) = (aji ).
A heißt antisymmetrisch, falls gilt: d. h. (aij ) = −(aji ).
A = −AT ,
A ∈ M (n × n, R) heißt orthogonal, falls gilt: AT A = En ,
also AT = A−1 .
Beispiel ⎛
1 A = ⎝2 3
2 0 4
⎞ ⎛ 3 0 4⎠ , B = ⎝−1 5 −2
1 0 3
⎛ 1 ⎞ √ 2 ⎜ 02 ⎠ −3 , C = ⎝ 0 − √1
2
√1 3 √1 3 √1 3
⎞
√1 6 − √26 ⎟ ⎠ √1 6
.
Die Matrix A ist symmetrisch, B ist antisymmetrisch und C ist orthogonal.
Definition (adjungiert, selbstadjungiert, unit¨ ar) F¨ ur A ∈ M (n × n, C) heißt A∗ := AT ,
also (a∗ij ) = (aji )
zu A adjungierte Matrix. Gilt A = A∗ , so heißt A selbstadjungiert. A ∈ M (n × n, C) heißt unit¨ar, falls gilt: A∗ A = En ,
also A∗ = A−1 .
240
16 Lineare Abbildungen und Matrizen
Bitte beachten Sie die formale Verwandtschaft unit¨ arer Matrizen im Komplexen und orthogonaler Matrizen im Reellen.
Beispiel Die adjungierte Matrix von 1 −i A= ist i 2
∗
A =
womit A selbstadjungiert ist. F¨ ur 0 1 B= i 0
ist
1 −i
i 2
B∗ =
=
−i 2
1 i
=A,
0 −i 1 0
,
was B zu einer unit¨aren Matrix macht.
Die zuletzt aufgef¨ uhrten Matrizen sind f¨ ur sich gesehen nur begrenzt interessant, allerdings tauchen sie in S¨atzen und Anwendungen der Mathematik wieder auf. So werden uns die selbstadjungierten und symmetrischen Matrizen bei der Diagonalisierung erneut begegnen. Bitte denken Sie bei diesen speziellen Matrizen immer auch an lineare Abbildungen und nicht nur an Schemata, bei denen Zeilen- und Spalten-Gymnastik durchgef¨ uhrt wird. So werden wir sp¨ater noch zu orthogonalen Abbildungen kommen (lineare Abbildungen mit speziellen Eigenschaften), die mit den hier vorgestellten orthogonalen Matrizen assoziiert sind.
16.7
Aufgaben
1. (a) Welche der folgenden Abbildungen sind linear? i. L(x, y) = x + y ii. L(x, y, z) = x iii. L(x) = 1 x ) iv. L(x, y) = (−y x+1 v. L(x, y) = y x ) vi. L(x) = (2x ¨ (b) Uberpr¨ ufen Sie weiterhin die elementaren Funktionen sin x, cos x, x2 , ex , ln x auf Linearit¨at. 2. Eine Abbildung L : R → R2 sei linear und bilde 1 auf den Vektor (32) ab. Bestimmen Sie L(−3). Wie viele verschiedene Abbildungen mit dieser Eigenschaft gibt es?
241
16.7 Aufgaben
3. (a) Betrachten Sie die Abbildung, welche jede auf ganz R differenzierbare Funktion f : R → R auf ihre Ableitung f abbildet. Bestimmen Sie den Kern dieser linearen Abbildung. (b) Zeigen Sie, dass die Abbildung, welche ein Polynom maximal zweiten Grades P (x) = ax2 + bx + c auf seine Koeffizienten (a, b, c) abbildet, linear auf dem Vektorraum der Polynome maximal zweiten Grades ist. Was ist das Bild dieser Abbildung? 4. (a) Bestimmen Sie die Formate folgender Matrizen und berechnen Sie alle m¨ oglichen Produkte von je zwei dieser Matrizen: A=
0 1
1 0
, B=
1 0
2 1
3 2
⎛
⎞ 2 3⎠ . 1
1 , C = ⎝2 3
Fassen Sie kurz zusammen, was mit einer Matrix geschieht, wenn sie mit der Matrix A multipliziert wird. (b) Begr¨ unden Sie, weshalb die f¨ ur reelle und komplexe Zahlen gebr¨ auchA liche Schreibweise B f¨ ur Matrizen keinen Sinn macht. 5. (a) Invertieren Sie — falls m¨oglich — folgende Matrizen: A=
1 2
2 1
, B=
2 1
2 1
, C=
2 1
0 . 1
(b) Bestimmen Sie die Inverse der Drehmatrix ⎛
cos φ R = ⎝ sin φ 0
− sin φ cos φ 0
⎞ 0 0⎠ . 1
Hinweis: Der Name dieser Matrix stammt von ihrer Eigenschaft, alle Vektoren, die von der rechten Seite an die Drehmatrix multipliziert werden, um den Winkel φ um die z-Achse zu drehen. 6. F¨ ur welche reellen Werte von α ist die Matrix 2 α A= 1 3 (a) invertierbar, (b) symmetrisch, (c) antisymmetrisch, (d) selbstadjungiert?
242
16 Lineare Abbildungen und Matrizen
16.8
L¨ osungen
1. (a) Zum Pr¨ ufen der Linearit¨at einer Abbildung m¨ ussen wir die beiden Eigenschaften L(v + w) = L(v ) + L(w) L(λv ) = λL(v ) aus der Definition linearer Abbildungen testen. F¨ ur Linearit¨ at m¨ ussen die Eigenschaften dabei f¨ ur alle v , w und λ nachgewiesen werden, wohingegen f¨ ur Nichtlinearit¨at ein einziges Gegenbeispiel gen¨ ugt. i. L(x + x ˜, y + y˜) = (x + x ˜) + (y + y˜) = (x + y) + (˜ x + y˜) = L(x, y) + L(˜ x, y˜) und L(λx, λy) = λx + λy = λ(x + y) = λL(x, y), ii. L(x + x ˜, y + y˜, z + z˜) = x + x ˜ = L(x, y, z) + L(˜ x, y˜, z˜) und L(λx, λy, λz) = λx = λL(x, y, z), iii. L(x + x ˜) = 1, aber L(x) + L(˜ x) = 1 + 1 = 2. Dies ist ein Gegenbeispiel.
x˜ x+˜ x x iv. L(x + x ˜, y + y˜) = −(y+˜ x, y˜) y = L(x, y) + L(˜ y ) = (−y ) + −˜ und
x λx L(λx, λy) = −(λy) = λ (−y ) = λL(x, y),
x)+1 v. L(x + x ˜, y + y˜) = (x+˜ , aber y+˜ y x+2 x+1 x˜+1 L(x, y) + L(˜ x, y˜) = y + y˜ = x+˜ y+˜ y . Hier haben wir wieder ein Gegenbeispiel.
x+˜ x x x ˜ ) = L(x) + L(˜ x) und vi. L(x + x ˜) = 2(x+˜ x) = (2x) + (2˜ x
λx x L(λx) = 2(λx) = λ (2x ) = λL(x). Somit sind alle Abbildungen außer iii. und v. linear. (b) Von den genannten Elementarfunktionen ist keine linear. Gegenbeispiele sind • • • • •
sin( 12 π) = 1, aber 12 sin(π) = 0, cos(0 + 0) = 1, aber cos(0) + cos(0) = 1 + 1 = 2, (1 + 1)2 = 22 = 4, aber 12 + 12 = 1 + 1 = 2, e3·0 = 1, aber 3e0 = 3 · 1 = 3, ln(3 · 1) = ln(3) = 0, aber 3 ln(1) = 3 · 0 = 0.
2. Wegen der Linearit¨at kann L(−3) auf den bekannten Wert L(1) zur¨ uckgef¨ uhrt werden: 3 −9 L(−3) = L(−3 · 1) = −3L(1) = −3 = . 2 −6
243
16.8 L¨ osungen
Diese Vorgehensweise funktioniert sogar f¨ ur jeden Wert λ 3 L(λ) = L(λ · 1) = λL(1) = λ , 2 sodass die Abbildung allein durch die gegebenen Eigenschaften (Linearit¨at und der Wert von L(1)) eindeutig bestimmt ist. 3. (a) Der Kern dieser Abbildung besteht aus allen Funktionen, deren Ableitung die Nullfunktion ist. Dies sind genau alle konstanten Funktionen f (x) = konst. (b) Wir betrachten zwei m¨oglichst allgemein gehaltene Polynome und deren Bildvektoren P (x) = ax2 + bx + c P˜ (x) = a ˜x2 + ˜bx + c˜
→ →
(a, b, c) (˜ a, ˜b, c˜) .
Die Summe der Polynome wird auf die Summe ihrer Bildvektoren abgebildet: (P + P˜ )(x) = (a + a ˜)x2 + (b + ˜b)x + (c + c˜) → (a + a ˜, b + ˜b, c + c˜) = (a, b, c) + (˜ a, ˜b, c˜). Dies ist die erste Eigenschaft in der Definition linearer Abbildungen. Weiterhin wird das λ-Fache eines Polynoms auf das λ-Fache seines Bildvektors abgebildet: λP (x) = λax2 + λbx + λc
→
(λa, λb, λc) = λ(a, b, c).
Dies ist die zweite Eigenschaft in der Definition linearer Abbildungen. Das Bild dieser Abbildung ist R3 , denn zu jedem Vektor (u, v, w) ∈ R3 gibt es ein Polynom, welches auf diesen Vektor abgebildet wird, n¨amlich das Polynom ux2 + vx + w. 4. (a) Beim Format wird die Zeilenzahl vor der Spaltenzahl genannt. A ist eine (2 × 2)-Matrix, B eine (2 × 3)-Matrix und C eine (3 × 2)Matrix. Beim Multiplizieren zweier Matrizen muss die Spaltenzahl der links stehenden Matrix mit der Zeilenzahl der rechts stehenden u ¨bereinstimmen. Demnach sind nur die Produkte A · A, A · B, C · A, B · C, C · B m¨oglich. 0 1 0 1 1 0 2 • A =A·A= = 1 0 1 0 0 1 0 1 1 2 3 0 1 2 • A·B = = 1 0 0 1 2 1 2 3 ⎛ ⎞ ⎛ ⎞ 1 2 2 1 0 1 • C · A = ⎝2 3⎠ = ⎝3 2⎠ 1 0 3 1 1 3
244
16 Lineare Abbildungen und Matrizen
⎛ ⎞ 1 2 1 2 3 ⎝ 14 11 ⎠ 2 3 = • B·C = 0 1 2 8 5 3 1 ⎛ ⎞ ⎛ ⎞ 1 2 1 4 7 1 2 3 • C · B = ⎝2 3⎠ = ⎝2 7 12⎠ 0 1 2 3 1 3 7 11
Aus den ersten drei Punkten ist zu erkennen, dass die Multiplikation der Matrix A von der linken Seite an eine Matrix eine Vertauschung der Zeilen bewirkt und die Multiplikation von rechts eine Vertauschung der Spalten. A (b) Bei reellen und komplexen Zahlen bedeutet der Ausdruck B , dass 1 −1 von B multipliziert wird. die Zahl A mit der Inversen B = B Allerdings ist hier die Reihenfolge der Multiplikation — A B1 oder 1 B A — nicht angegeben, was bei Zahlen auch nicht notwendig ist. Die Reihenfolge spielt aber bei der Multiplikation von Matrizen eine Rolle. AB −1 ist nicht immer gleich B −1 A. Somit ist der Ausdruck A ur Matrizen nicht eindeutig. B f¨
5. (a) A−1 =
1 −3
1 −2
−2 1
, C −1 =
1 2
1 −1
0 . 2
Beim Invertieren der Matrix B m¨ ussten wir durch Null teilen. Somit ist die Matrix B nicht invertierbar. (b) Einfach ausgedr¨ uckt wird der Effekt einer Matrix von deren Inverse wieder r¨ uckg¨angig gemacht. Eine Drehung um einen Winkel φ wird durch eine Gegendrehung um den gleichen Winkel, also eine Drehung um −φ, neutralisiert. Die Drehachse bleibt dabei die gleiche. Somit ist ⎛ ⎞ ⎛ ⎞ cos(−φ) − sin(−φ) 0 cos φ sin φ 0 R−1 = ⎝ sin(−φ) cos(−φ) 0⎠ = ⎝− sin φ cos φ 0⎠ 0 0 1 0 0 1 die Inverse zur Matrix R.
6. (a) Die Inverse einer (2 × 2)-Matrix −1
A
a c
1 = ad − bc
b d
d −c
kann durch −b a
berechnet werden. Invertierbar ist solch eine Matrix also genau dann, wenn der Ausdruck ad − bc = 0 ist. F¨ ur A ist dies 2 · 3 − α · 1 = 0
⇔
α = 6 .
(b) Symmetrisch ist A lediglich f¨ ur α = 1, denn nur daf¨ ur ist A = AT .
16.8 L¨ osungen
245
(c) Antisymmetrisch ist A f¨ ur kein α. (d) Selbstadjungiertheit ist f¨ ur reelle Matrizen das Gleiche wie Symmetrie.
246
16 Lineare Abbildungen und Matrizen
Fragen • Was ist eine lineare Abbildung? • Geben Sie drei Beispiele linearer Abbildungen an. • Worauf wird der Nullvektor eines Vektorraumes V durch eine lineare Abbildung L : V → W zwischen Vektorr¨aumen abgebildet? • Formulieren Sie den Dimensionssatz f¨ ur lineare Abbildungen. • Geben Sie Beispiele von Elementen aus M (n × m, C) f¨ ur verschiedene n, m ∈ N an. • Wie l¨asst sich f¨ ur eine lineare Abbildung L : V → W zwischen Vektorr¨aumen bei vorgegebenen Basen von V und W die zugeh¨ orige Matrixdarstellung finden? • Was ist der Rang einer Matrix? • Welche Bedeutung hat der Rang von Matrizen bei der Matrizenmultiplikation? • Welche besonderen Typen von Matrizen kennen Sie?
17 Lineare Gleichungssysteme
17.1
Motivation und elementare Anwendungen
Lineare Gleichungssysteme ( Lineares Gleichungssystem“ werden wir durch ” LGS abk¨ urzen) kommen sehr h¨aufig vor. So ist es eine elementare Aufgabe f¨ ur M¨obelmanufakturen, die Anzahl von Tischen und St¨ uhlen zu errechnen, die sich mit einem gewissen Lagerbestand von Holz, Schrauben und Metallbeschl¨agen herstellen lassen. Bevor mit dem Zusammenbau begonnen wird, sollten wir genau berechnen, was im Einzelfall fehlen mag. Jeder Koch ben¨ otigt, kann er sich nicht auf Erfahrungen st¨ utzen, eigentlich ein lineares Gleichungssystem, um zu wissen, wie viele Gerichte er aus seinen Zutaten zaubern kann. Es gibt noch viele weitere Beispiele, z. B. aus der Regelungstechnik oder dem Ermitteln bestimmter Kenngr¨oßen in elektrischen Schaltungen. Wir betrachten als Beispiel 2x1 + 2x2 = 2 −x1 + 6x2 = −1. Das Gleichungssystem wird, um es zu l¨osen, in eine so genannte erweiterte Koeffizientenmatrix umgeformt: 2 2 2 −→ −1 6 −1 In diesem Schema wird das LGS in folgenden Einzelschritten modifiziert: Die Zeilen werden vertauscht: −→
−1 2
6 −1 2 2
zu Zeile 2 wird zweimal Zeile 1 addiert: −1 6 −1 −→ 0 14 0 © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_17
248
17 Lineare Gleichungssysteme
Zeile 2 wird durch 14 geteilt (normiert): −→
−1 0
6 −1 1 0
von Zeile 1 wird sechsmal Zeile 2 subtrahiert: −1 0 −1 −→ 0 1 0 und schließlich wird Zeile 1 mit (−1) multipliziert: −→
1 0
0 1 1 0
Die erweiterte Koeffizientenmatrix wird nun wieder in ein LGS umgeschrieben, welches nun aber wirklich sehr u ¨berschaubar ist und den Namen daher nur noch aus formalen Gr¨ unden verdient: x1 = 1 x2 = 0 Verwendet wurden so genannte elementare Zeilenoperationen: • Tauschen von Zeilen, • Addition eines (ggf. negativen) Vielfachen einer Zeile zu einer anderen, • Multiplikation einer Zeile mit einer Zahl ungleich Null. Diese Operationen ¨andern nicht die so genannte L¨ osungsmenge (sp¨ ater genauer behandelt) des Gleichungssystems und sie gen¨ ugen, um jedwedes lineare Gleichungssystem zu l¨osen, solange es u ¨berhaupt l¨osbar ist. Ein Gleichungssystem mit m Gleichungen und m Variablen kann unter gewissen Voraussetzungen in die Form ⎞ ⎛ 1 0 . . . 0 c1 ⎟ ⎜ .. ⎜0 1 . c2 ⎟ ⎟ ⎜ ⎜. . ⎟ , .. . ⎝ .. . 0 . ⎠ 0 . . . 0 1 cm also mit der Einheitsmatrix im linken Teil, u uhrt werden, woran die ein¨berf¨ deutige L¨osung x1 = c1 , . . . , xm = cm direkt abgelesen werden kann. Dies l¨asst sich als Idealfall bezeichnen. Tritt dieser nicht ein, so ergibt sich ein etwas anderes System, welches allerdings auch einfach zu behandeln ist.
249
17.2 Grundlagen
Beispiel 3x1 + 6x2 = 9 4x1 + 8x2 = 12
−→ −→
3 4
6 9 8 12
−→
1 4
2 3 8 12
−→
1 0
2 3 0 0
x1 + 2x2 = 3 0=0
In diesem Beispiel kommen wir nicht auf obige Idealform, vereinfacht hat sich das LGS aber dennoch. Die letzte Zeile schr¨ankt die Menge der L¨ osungen nicht ein, denn 0 = 0“ ist einfach eine wahre Aussage. Es verbleibt also die erste ” Gleichung, welche unendlich viele Belegungen f¨ ur x1 und x2 liefert, die das Gleichungssystem l¨osen, und zwar in der Abh¨angigkeit x1 = 3 − 2x2 . Eine konkrete L¨osung ergibt sich also durch konkretes W¨ahlen von x2 und anschließendem Berechnen von x1 . Angenommen, wir erhalten als letzte Matrix nach Umformungen 1 0 1 . 0 01 Was bedeutet das? 0 = 1! Also hat das urspr¨ ungliche LGS, aus dem diese erweiterte Koeffizientenmatrix entstanden ist, keine L¨ osung.
17.2
Grundlagen
Nachdem wir uns nun schon recht intensiv mit der Handhabung und L¨ osung linearer Gleichungssysteme besch¨aftigt haben, wollen wir das Ganze nun noch mathematisch exakt behandeln.
Definition (lineares Gleichungssystem, Inhomogenit¨ at, Koeffizienten, homogen, inhomogen) Ein System der Form a11 x1 + a12 x2 + . . . + a1n xn = b1 .. .. . . am1 x1 + am2 x2 + . . . + amn xn = bm mit ajk , bj ∈ K heißt lineares Gleichungssystem mit m Gleichungen und n Unbekannten (Variablen). Die bj heißen Inhomogenit¨ aten des LGSs, die ajk Koeffizienten. Sind alle bj = 0, so heißt das LGS homogen, sonst inhomogen.
250
17 Lineare Gleichungssysteme
Die linke Seite eines solchen LGSs k¨onnen wir in einem Matrix-Vektor-Produkt und die rechte Seite in einem Vektor zusammenfassen. Dadurch entsteht dann die u ¨bersichtlichere Schreibweise ⎞⎛ ⎞ ⎛ ⎞ ⎛ x1 b1 a11 a12 . . . a1n ⎜ .. .. .. ⎟ ⎜ .. ⎟ = ⎜ .. ⎟ ⎝ . . . ⎠⎝ . ⎠ ⎝ . ⎠ am1
am2
...
amn
xn
bm
oder kurz Ax = b. Die Matrix b A := (ajk ) heißt Koeffizienten- oder Systemma1 trix und der Vektor b := .. Inhomogenit¨atsvektor. . bm
Weiterhin wird beim Rechnen mit linearen Gleichungssystemen, um Schreibarbeit zu sparen, gerne auf den Vektor x verzichtet, da alle wichtigen Infor¨ mationen bereits in A und b stehen. Ubrig bleibt die so genannte erweiterte Koeffizientenmatrix ⎞ ⎛ a11 a12 . . . a1n b1 ⎜ .. .. .. ⎟ . (A|b) := ⎝ ... . . . ⎠ am1 am2 . . . amn bm Im motivierenden Beispiel wird aus dem linearen Gleichungssystem 2x1 + 2x2 = 2 −x1 + 6x2 = −1. die erweiterte Koeffizientenmatrix −→
2 −1
2 2 . 6 −1
(L¨ osungsvektor, L¨osungsmenge) Definition x heißt L¨osungsvektor des LGSs, wenn seine Komponenten x1 , . . . , xn alle Gleichungen des LGSs erf¨ ullen. Die Menge aller L¨osungsvektoren heißt L¨ osungsmenge des LGSs. Der Kern einer linearen Abbildung L, den wir bereits behandelt haben, ist die L¨osungsmenge des LGSs L(x) = 0.
17.3
Gauß-Algorithmus
Es geht uns nun darum, ein LGS in Form der erweiterten Koeffizientenmatrix in eine m¨oglichst einfache Gestalt zu bringen, aus der wir die L¨ osung ersehen
17.3 Gauß-Algorithmus
251
k¨onnen. Die im ersten Abschnitt eingef¨ uhrten elementaren Zeilenoperationen — Tauschen von Zeilen, Addition eines Vielfachen einer Zeile zu einer anderen, Multiplikation einer Zeile mit einer Zahl ungleich Null — sind gerade die Operationen des Gauß-Algorithmus, an dessen Ende ein durch bloßes Hinsehen zu l¨ osendes LGS steht. Der erw¨ahnte Idealfall ⎛ ⎞ 1 0 . . . 0 c1 ⎜ ⎟ .. ⎜0 1 . c2 ⎟ ⎜ ⎟ ⎜. . ⎟ .. . ⎝ .. . 0 . ⎠ 0 . . . 0 1 cm sollte dabei als zu erstrebendes Ziel nie aus den Augen verloren werden. Grob werden beim Gauß-Algorithmus folgende Punkte abgearbeitet: • Alle Eintr¨age unterhalb von a11 werden Null. Dies geschieht, indem auf die zugeh¨origen Zeilen ein geeignetes Vielfaches der ersten Zeile addiert wird. • Alle Eintr¨age unterhalb von a22 werden Null. Dies geschieht, indem auf die zugeh¨origen Zeilen ein geeignetes Vielfaches der zweiten Zeile addiert wird. • Auf diese Weise werden nacheinander die Eintr¨ age unterhalb s¨ amtlicher aii Null. • Alle Eintr¨age oberhalb von ann werden Null. Dies geschieht, indem auf die zugeh¨origen Zeilen ein geeignetes Vielfaches der n-ten Zeile addiert wird. • Alle Eintr¨age oberhalb von an−1,n−1 werden Null. Dies geschieht, indem auf die zugeh¨origen Zeilen ein geeignetes Vielfaches der (n − 1)-ten Zeile addiert wird. • Auf diese Weise werden nacheinander die Eintr¨ age oberhalb s¨ amtlicher aii Null. • Schließlich werden noch die aii zu 1 normiert, indem die entsprechende Zeile mit a1ii multipliziert wird. Diese Reihenfolge versichert uns, dass bereits erzeugte Nulleintr¨ age bis zum Ende des Gauß-Algorithmus bestehen bleiben. So machen sp¨ atere Umformungen die Bem¨ uhungen der vorherigen nicht zunichte. Es ist aber ratsam, f¨ ur eventuelle Zwischenschritte flexibel zu bleiben und sich nicht stur an diese Auflistung zu halten. So kann ein Zeilentausch zur rechten Zeit oder ein zwischenzeitliches Skalieren einer Zeile Br¨ uche vermeiden, mit denen es sich schlecht weiterrechnen l¨asst.
252
17 Lineare Gleichungssysteme
Beispiel So sind ⎞ 3 1 1 0 8 ⎠ ⎝0 5 3 3 0 2 0 3 − 13 0 ⎞ ⎛ 1 2 3 0 ⎝3 1 1 0⎠ → 4 2 1 0 ⎛
⎛ 3 ⎝1 4
1 2 2
⎞ 1 0 3 0⎠ 1 0
⎞ 1 2 3 0 ⎝0 −5 −8 0⎠ 0 −6 −11 0 ⎛
beides korrekte Vorgehensweisen, die letzte — mit dem anf¨ anglichen Zeilentausch — ist aber deutlich angenehmer zu rechnen. Im ersten Fall wird die Multiplikation der zweiten und dritten Zeile mit 3 wenigsten die weiteren Schritte erleichtern. Auch k¨onnte ein aii = 0 sein, was es unm¨oglich macht, damit darunter stehende Eintr¨age zu Null zu transformieren. In einem solchen Fall kann ebenfalls ein Tausch dieser Zeile mit einer darunter liegenden helfen, sodass das neue aii = 0 ist. Weiterhin k¨onnen durchaus Zeilen der Art 0 · · · 0 | 1 entstehen, bevor der Gauß-Algorithmus beendet wurde. Der Widerspruch einer solchen Zeile besagt, dass das LGS gar keine L¨osung hat, womit eine Weiterf¨ uhrung des GaußAlgorithmus u ussig wird. ¨berfl¨
17.3.1
Abweichungen vom Idealfall
Abgesehen von einem vorzeitigen Abbruch des Gauß-Algorithmus gibt es im Grunde nur zwei Situationen, in denen das Ergebnis des Algorithmus vom Idealfall abweicht. Diese treten jedoch sehr h¨ aufig auf, sodass es ratsam ist, sich mit ihnen vertraut zu machen. Zum einen kann — wie bereits erw¨ahnt — ein aii = 0 sein. Sind auch alle darunter stehenden Eintr¨age (aki mit k > i) Null, k¨ onnen wir diese Spalte nicht weiter vereinfachen und m¨ ussen unser Gl¨ uck mit der n¨ achsten versuchen. Wichtig dabei ist, bei der n¨achsten Spalte mit der gleichen Zeile wie zuvor weiterzuarbeiten, also nicht mit ai+1, i+1 , sondern mit ai, i+1 . Beispiele sind ⎛
1 ⎜0 ⎝
0 1
0
0
⎞ c1 ⎠ c2 , 0 c3 ∗ ∗
⎛
1
⎜ ⎝0 0
∗ 0 0
0 c1 ⎞ 1 c2 ⎠ , 0 c3
wobei die ∗-Eintr¨age beliebige Zahlen bezeichnen, die durch den Gauß-Algorithmus nicht weiter vereinfacht werden. Die beschriebene Situation kann nat¨ urlich
253
17.4 Die Struktur der L¨ osungsmenge
auch bei mehreren Spalten auftreten, wie ⎛ 1 0 ∗ 0 0 ⎜0 1 ∗ 0 0 ⎜ ⎜ ⎜0 0 0 1 0 ⎜ ⎜0 0 0 0 1 ⎝ 0 0 0 0 0
bei ∗ ∗ ∗ ∗ 0
⎞ c1 c2 ⎟ ⎟ ∗ c3 ⎟ . ⎟ ∗ c4 ⎠ 0 c5
∗ ∗
Mit diesem Beispiel sind wir auch schon bei der zweiten, vom Idealfall abweichenden Situation angelangt. Diese liegt vor, wenn das LGS mehr Gleichungen als Unbekannte bzw. mehr Unbekannte als Gleichungen hat. In diesem Fall muss der Idealfall, der ja nur von quadratischen Matrizen ausgeht, um einige Nullzeilen bzw. um einige Spalten erweitert werden. Einfache Beispiele sind ⎞ ⎛ 1 0 c1 c1 1 0 ∗ ⎝0 1 c2 ⎠ bzw. . 0 1 ∗ c2 0 0 c3
17.4
Die Struktur der L¨ osungsmenge
Nachdem wir uns ausf¨ uhrlich mit der linken Seite der erweiterten Koeffizientenmatrix besch¨aftigt haben, wenden wir uns nun der Bestimmung der L¨ osungen sowie der Struktur dieser L¨osungsmenge zu. Letztere hat — Sie werden es ahnen — mit Vektorr¨aumen zu tun. Doch zun¨achst zur L¨ osungsbestimmung. Als Beispiel betrachten wir ⎞ ⎛ 1 0 2 0 0 3 4 c1 ⎜0 1 5 0 0 6 7 c2 ⎟ ⎜ ⎟ ⎜0 0 0 1 0 8 9 c3 ⎟ ⎜ ⎟ ⎝0 0 0 0 1 10 11 c4 ⎠ 0 0 0 0 0 0 0 c5 aus dem vorigen Abschnitt, denn dort treten im Grunde alle Sonderf¨ alle auf. Die ∗-Eintr¨age haben wir durch fortlaufende Zahlen ersetzt, um nachfolgende Umformungen klarer zu machen. Wer m¨ochte, kann die erweiterte Koeffizientenmatrix wieder in ein normales LGS umwandeln. In unserem Beispiel w¨ are dies x1
+ 2x3
+ 3x6 + 4x7 = c1
x2 + 5x3
+ 6x6 + 7x7 = c2 x4
+ 8x6 + 9x7 = c3 x5 + 10x6 + 11x7 = c4 0
= c5 .
254
17 Lineare Gleichungssysteme
Die Bestimmung der L¨osungsmenge verl¨auft zeilenweise. Etwaige Nullzeilen liefern uns entweder eine wahre Aussage und k¨onnen u ¨bersprungen werden oder sie liefern einen Widerspruch, wonach das LGS gar keine L¨ osung hat. Nichtnullzeilen (solche mit nicht ausschließlich Nullen als Eintr¨ age) werden nach der ersten Variablen aufgel¨ost. In unserem Beispiel erhalten wir — vorausgesetzt c5 = 0 — Formeln f¨ ur x1 , x2 , x4 und x5 in Abh¨angigkeit der u ¨brigen Variablen sowie der rechten Seite: x1 = c1 − 2x3 − 3x6 − 4x7 x2 = c2 − 5x3 − 6x6 − 7x7 x 4 = c3
− 8x6 − 9x7
x 5 = c4
− 10x6 − 11x7
Wir erhalten also durch eine Wahl von x3 , x6 und x7 eine L¨ osung und die gesamte L¨osungsmenge, indem x3 , x6 und x7 jeweils ganz K durchlaufen. Die L¨osungsmenge k¨onnen wir also schreiben als ⎛ ⎞ ⎛ ⎛ ⎞ ⎞ ⎛ ⎞ ⎛ ⎞ −2 −3 −4 c1 x1 ⎜−5⎟ ⎜ −6 ⎟ ⎜ −7 ⎟ ⎜x2 ⎟ ⎜c2 ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ ⎜1⎟ ⎜ 0 ⎟ ⎜ 0 ⎟ ⎜x 3 ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ L= ⎜ ⎜x4 ⎟ = ⎜c3 ⎟ +x3 ⎜ 0 ⎟ +x6 ⎜ −8 ⎟ +x7 ⎜ −9 ⎟ x3 , x6 , x7 ∈ K . ⎜0⎟ ⎜−10⎟ ⎜−11⎟ ⎜x5 ⎟ ⎜c4 ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝0⎠ ⎝ 1 ⎠ ⎝ 0 ⎠ ⎝x 6 ⎠ ⎝ 0 ⎠ 0 x7 0 0 1 Ist diese L¨osungsmenge ein Vektorraum? In unserem Beispiel m¨ ussen wir diese Frage mit Nein beantworten. L ist nur dann ein Vektorraum, wenn alle ci = 0 sind, wenn wir es also mit einem homogenen LGS zu tun haben. Eine Basis dieses homogenen L¨ osungsraumes w¨ are ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ −2 −3 −4 ⎜−5⎟ ⎜ −6 ⎟ ⎜ −7 ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ 1 ⎟ ⎜ 0 ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 ⎟ , ⎜ −8 ⎟ , ⎜ −9 ⎟ . ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜−10⎟ ⎜−11⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝0⎠ ⎝ 1 ⎠ ⎝ 0 ⎠ 0 0 1 Dieser Sachverhalt gilt allgemein f¨ ur beliebige lineare Gleichungssysteme:
Satz Sei r der Rang der (m × n)-Matrix A. Dann hat A nach Anwendung des GaußAlgorithmus genau r Zeilen, die nicht ausschließlich Nulleintr¨ age enthalten. Weiterhin ist der L¨osungsraum des homogenen LGSs Ax = 0, also der Kern von A, ein (n − r)-dimensionaler Untervektorraum des Kn . Eine Basis dieses
255
17.4 Die Struktur der L¨ osungsmenge
homogenen L¨osungsraumes erhalten wir, wie im obigen Beispiel demonstriert, durch den Gauß-Algorithmus. Durch Linearkombinationen dieser so genannten L¨ osungsbasisvektoren kann jede weitere L¨osung des homogenen LGSs linear kombiniert werden. F¨ ur eine (n × n)-Matrix A : Kn → Kn mit maximalem Rang folgt aus dem Dimensionssatz n = dim Kn = dim(Bild A) + dim(Kern A) = n + dim(Kern A) , daher enth¨alt der Kern der Matrix einzig den Nullvektor! Die Vektorraumstruktur f¨ ur die L¨osungsmenge homogener LGSe liefert uns das so genannte Superpositionsprinzip (welches uns bereits im Teil zur Analysis bzgl. seiner physikalischen Bedeutung begegnet ist):
Satz Linearkombinationen von L¨osungen eines homogenen LGSs Ax = 0 sind wieder L¨ osungen. Weiterhin sehen wir an unserem Beispiel, dass sich die L¨ osungsmenge des inhomogenen LGSs von der des homogenen lediglich durch die Addition eines konstanten Vektors — im Beispiel (c1 , c2 ,0, c3 , c4 ,0,0)T — unterscheidet. Bemerkenswert ist, dass dieser Vektor selbst auch eine L¨ osung des inhomogenen LGSs ist. Somit k¨onnen wir uns die L¨osungsmenge des inhomogenen LGSs als einen aus dem Ursprung heraus verschobenen Vektorraum vorstellen.
z
xP
y x Der Vektor (c1 , c2 ,0, c3 , c4 ,0,0)T spielt dabei keine besondere Rolle. Statt dieses Vektors kann genauso gut jeder andere L¨osungsvektor des inhomogenen LGSs herhalten.
256
17 Lineare Gleichungssysteme
Satz Sei xP eine beliebige L¨osung des inhomogenen LGSs Ax = b und sei LH der L¨osungsraum des zugeh¨origen homogenen LGSs Ax = 0. Dann ist xP + LH := {xP + xH | xH ∈ LH } die gesamte L¨osungsmenge des inhomogenen LGSs. Oft wird auch einfach xH statt LH f¨ ur die allgemeine homogene L¨osung geschrieben und xH + xP f¨ ur die allgemeine inhomogene L¨osung.
L¨osungen des inhomogenen LGSs werden auch spezielle bzw. partikul¨ are L¨ osungen genannt, woher die Bezeichnung xP stammt. Wesentliches aus dem Satz ist schnell bewiesen, denn nach dessen Voraussetzungen gilt (wobei wir uns an die Linearit¨atseigenschaften der Matrix A erinnern) A(xH + xP ) = AxH + AxP = 0 + b , und andererseits unterscheiden sich zwei inhomogene L¨ osungen nur durch eine homogene L¨osung: A(xP1 − xP2 ) = AxP1 − AxP2 = b − b = 0 . Interessant ist, dass wir einen analogen Satz wie den vorherigen bei den linearen Differenzialgleichungen erneut finden. Diese Gleichheit der Strukturen bildet das gemeinsame Dach, unter dem die vermeintlich unterschiedlichen Gebiete ein warmes Pl¨atzchen finden.
17.5
Zum Invertieren von Matrizen
Wie im Abschnitt u ¨ber lineare Abbildungen besprochen, eignet sich der GaußAlgorithmus zur Invertierung von (nat¨ urlich quadratischen) Matrizen. Dazu wenden wir den Algorithmus auf die erweiterte Matrix (A | E) an, bis auf der linken Seite die Einheitsmatrix steht. Auf der rechten Seite erhalten wir dann die Inverse von A: (A | E)
Gauß
−→
(E | A−1 ) .
257
17.6 Aufgaben
Beispiel
1 2
Wir invertieren die Matrix A =
2 : 1
1 2 1 0 1 2 1 0 → 2 1 0 1 0 −3 −2 1 2 1 2 1 0 1 0 − 13 3 → − 13 0 1 23 − 13 0 1 32
→
Somit ist die inverse Matrix A
−1
1 =− 3
1 −2
−2 . 1
Ist es nicht m¨oglich, auf der linken Seite die Einheitsmatrix zu erzeugen, so ist A nicht invertierbar. Haben wir erst einmal die Inverse berechnet, k¨ onnen wir jedes LGS der Form Ax = b , also mit beliebiger rechter Seite, einfach durch Aufl¨ osen nach x l¨ osen: Ax = b
⇔
x = A−1b .
Lineare Gleichungssysteme mit invertierbaren Matrizen haben somit immer eine eindeutige L¨osung.
17.6
Aufgaben
1. Berechnen Sie mithilfe des Gauß-Algorithmus s¨ amtliche L¨ osungen des homogenen und der beiden inhomogenen linearen Gleichungssysteme −x − 2y = 0 2x + 4y = 0
,
−x − 2y = −1 2x + 4y = 3
,
−x − 2y = −1 2x + 4y = 2
und zeichnen Sie alle L¨osungsmengen in ein Koordinatensystem. 2. L¨osen Sie das lineare Gleichungssystem f¨ ur beliebige rechte Seiten. ⎛ ⎞ 1 2 −3 ⎝−1 2 1 ⎠ x = b . 1 −2 0
258
17 Lineare Gleichungssysteme
3. F¨ ur welche Werte von α ∈ R hat das lineare Gleichungssystem x + y x + 2y 3x + y
+ − +
z 2z α2 z
= = =
2 2 2α
keine, eine bzw. unendlich viele L¨osungen? ¨ 4. Uberpr¨ ufen Sie mithilfe des Gauß-Algorithmus, ob die Vektoren ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 1 v1 = ⎝2⎠ , v2 = ⎝−1⎠ , v3 = ⎝0⎠ , 2 3 2 linear abh¨angig oder linear unabh¨angig sind. 5. L¨osen Sie folgende nicht quadratische lineare Gleichungssysteme. ⎛ ⎞ ⎛ ⎞ −1 2 1 1 −1 −3 0 x = und ⎝−2 3⎠ x = ⎝2⎠ . −2 2 1 2 1 1 0
17.7
L¨ osungen
1. Der Gauß-Algorithmus angewendet auf das homogene Gleichungssystem: −x − 2y = 0 x + 2y = 0 −1 −2 0 1 2 0 → → → 2 4 0 0 0 0 2x + 4y = 0 0=0. Die zweite Zeile 0 = 0 ist f¨ ur alle x und y erf¨ ullt. Die erste Zeile kann in osungsdie Geradengleichung y = − 12 x umgeformt werden. Somit ist die L¨ menge im homogenen Fall die Ursprungsgerade (ein eindimensionaler Untervektorraum des R2 ) mit Steigung − 12 . Dieses kleine Gleichungssystem h¨atten wir ohne den Gauß-Algorithmus schneller umformen k¨ onnen, bei ¨ gr¨oßeren Systemen geht aber ohne ihn schnell die Ubersicht verloren. Der Gauß-Algorithmus besteht beim inhomogenen System aus den gleichen Umformungen, nur mit einer anderen rechten Seite. −x − 2y = −1 2x + 4y = 3
→
...
→
x + 2y = 1 0=1.
Dies ergibt einen Widerspruch und somit keine L¨ osung f¨ ur das erste inhomogene System. Beim zweiten inhomogenen System tritt kein Widerspruch auf: −x − 2y = −1 2x + 4y = 2
→
...
→
x + 2y = 1 0=0.
259
17.7 L¨ osungen
Die L¨osungsmenge ist wiederum eine Gerade y = − 12 x + 12 , diesmal allerdings keine Ursprungsgerade, sondern eine Gerade parallel zu der des homogenen Gleichungssystems. Dieses Ph¨anomen l¨asst sich folgendermaßen verallgemeinern: Die L¨ osungsmenge eines inhomogenen, linearen Gleichungssystems ist entweder die leere Menge oder eine parallele Verschiebung des homogenen L¨ osungsraumes. 2. Wir wenden den Gauß-Algorithmus f¨ ur beliebige rechte pr¨asentiert durch den Vektor (a, b, c). ⎞ ⎞ ⎛ ⎛ ⎛ 1 2 −3 a 1 2 −3 a 1 ⎝−1 2 1 b ⎠ → ⎝0 4 −2 b + a⎠ → ⎝0 1 −2 0 c 0 −4 3 c − a 0
Seiten an, re-
2 4 0
⎞ −3 a −2 b + a⎠ 1 c+b
Um das Gleichungssystem noch einfacher l¨ osen zu k¨ onnen, erzeugen wir nun auch in den Eintr¨agen oberhalb der Diagonalen Nullen. ⎛ ⎞ ⎛ ⎞ 1 2 −3 a 1 2 0 a + 3(c + b) → ⎝0 4 0 b + a + 2(c + b)⎠ → ⎝0 4 0 b + a + 2(c + b)⎠ 0 0 1 c+b 0 0 1 c+b ⎛ 1 → ⎝0 0
0 4 0
⎞ 0 a + 3(c + b) − 12 (b + a + 2(c + b)) ⎠ b + a + 2(c + b) 0 c+b 1
Teilen wir schließlich noch die zweite Zeile durch 4 und ordnen die Eintr¨age auf der rechten Seite, so ergibt sich das Gleichungssystem 1 a+ 2 1 y = a+ 4 z =b+c
x=
3 b + 2c 2 3 1 b+ c 4 2
bzw.
⎛ ⎞ ⎛1 x 2 ⎝y ⎠ = ⎝ 1 4 0 z
3 2 3 4
1
⎞⎛ ⎞ a 1⎠ ⎝ ⎠ b . 2 1 c 2
Letzteres ist u ¨brigens die Inverse zur Ausgangsmatrix. 3. Bei Parametern im Gleichungssystem m¨ ussen wir darauf achten, dass die Umformungsschritte auch f¨ ur alle Werte des Parameters definiert sind. ⎞ ⎞ ⎛ ⎛ 2 1 1 1 1 1 1 2 ⎝1 2 −2 2 ⎠ → ⎝0 1 0 ⎠ −3 2 2 0 −2 α − 3 2α − 6 3 1 α 2α ⎛ ⎞ 1 1 1 2 −3 0 ⎠ → ⎝0 1 2 0 0 α − 9 2α − 6 Interessant ist nun die letzte Zeile, also die Gleichung (α2 − 9)z = 2α − 6.
260
17 Lineare Gleichungssysteme
• F¨ ur α = −3 ist die linke Seite Null, die rechte aber nicht. Hierf¨ ur gibt es daher keine L¨osungen. • F¨ ur α = +3 sind beide Seiten Null und damit die Variable z frei w¨ ahlbar. Hierf¨ ur gibt es unendlich viele L¨osungen. • α = ±3 hingegen liefert stets eine eindeutige L¨ osung. 4. Nach der Definition der linearen Unabh¨angigkeit muss aus der Gleichung λ1v1 + λ2v2 + λ3v3 = 0 folgen, dass alle λi = 0 sind. Dabei handelt es sich um ein lineares Gleichungssystem mit den λi als Unbekannten. Diese k¨onnen wir mit dem Gauß-Algorithmus berechnen. ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ 1 0 1 1 0 1 0 λ1 ⎝2⎠ + λ2 ⎝−1⎠ + λ3 ⎝0⎠ = 0 → ⎝2 −1 0 0⎠ 2 3 2 2 3 20 ⎞ ⎞ ⎛ ⎛ 1 0 1 0 1 0 1 0 → ⎝0 −1 −2 0⎠ → ⎝0 −1 −2 0⎠ 0 3 0 0 0 0 −6 0 Da nach Anwendung des Gauß-Algorithmus keine Nullzeile auftritt, gibt es eine eindeutige L¨osung, n¨amlich λ1 = λ2 = λ3 = 0. Somit sind die drei Vektoren linear unabh¨angig. 5. Der Gauß-Algorithmus f¨ ur das erste Gleichungssystem: 1 −1 −3 0 1 −1 −3 0 1 −1 → → −2 2 1 2 0 0 −5 2 0 0
−3 0 1 − 25
Aus der letzten Gleichung folgt z = − 25 . In der n¨ achsth¨ oheren (der ersten) Zeile kommen gleich zwei Variablen dazu, sodass wir eine davon — sagen wir y — frei w¨ahlen k¨onnen. Sind wir nur an einer einzigen L¨ osung interessiert, empfiehlt es sich, einen besonders einfachen Wert wie 0 f¨ ur y einzusetzen. Wollen wir allerdings die gesamte L¨ osungsmenge, so m¨ ussen wir y unbestimmt lassen. Nach x aufgel¨ost ergibt sich x = y + 3z = y − 65 . Somit ist die L¨osungsmenge ⎧⎛ ⎫ ⎞ ⎨ y − 65 ⎬ ⎝ y ⎠ ∈ R3 y ∈ R . ⎩ ⎭ − 25 Der Gauß-Algorithmus f¨ ur das zweite Gleichungssystem: ⎞ ⎞ ⎛ ⎛ ⎛ −1 2 1 −1 2 1 −1 2 ⎝−2 3 2⎠ → ⎝ 0 −1 0⎠ → ⎝ 0 −1 1 10 0 3 1 0 0
⎞ 1 0⎠ 1
Nun haben wir in der dritten Zeile einen Widerspruch (0 · y = 1) und somit ist die L¨osungsmenge die leere Menge. Vorsicht: Auch wenn die zweite Zeile ¨ahnlich wie die dritte aussieht, stellt die zweite keinen Widerspruch dar. Ausgeschrieben lautet sie n¨ amlich −z = 0, was f¨ ur z = 0 erf¨ ullt ist.
17.7 L¨ osungen
261
Fragen • Was ist ein inhomogenes lineares Gleichungssystem? • Gibt es Probleme des Alltags, die sich mit der Hilfe linearer Gleichungssysteme behandeln lassen? • Welche Operationen sind beim Gauß-Algorithmus gestattet? • Sind Linearkombinationen von L¨osungen eines LGSs stets wieder L¨ osungen? Oder ist es von Bedeutung, ob das LGS homogen ist oder nicht? • Was wissen Sie u ¨ber die Struktur der L¨osungsmenge eines LGSs? • Wie k¨onnen quadratische Matrizen invertiert werden?
18 Determinanten
18.1
Motivation
Wir haben Matrizen bisher als Schema zur Darstellung linearer Abbildungen oder linearer Gleichungssysteme kennen gelernt. Eine weitere, oft verwendete Betrachtungsweise ist die Zusammenfassung mehrerer Vektoren — meist einer Basis — zu einer Matrix, indem einfach jeder Vektor in eine Spalte der Matrix geschrieben wird. So erhalten wir beispielsweise aus der Standardbasis des R3 die (3×3)-Einheitsmatrix ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 0 1 0 0 ⎝0⎠ , ⎝1⎠ , ⎝0⎠ → ⎝0 1 0⎠ . 0 0 1 0 0 1 ¨ Ahnlich wie zuvor k¨onnen wir dann durch Untersuchungen der Matrix R¨ uckschl¨ usse auf die Eigenschaften der Vektoren ziehen. Das Praktische ist nun, dass wir aus der Berechnung einer einzigen Gr¨oße, der Determinante, eine Vielzahl von Eigenschaften ableiten k¨onnen. In diesem Zusammenhang interessieren uns die folgenden grundlegenden und auch anschaulichen Eigenschaften: • Lineare Unabh¨ angigkeit. Die kennen wir bereits, doch werden wir eine ¨ einfachere Uberpr¨ ufungsm¨oglichkeit kennen lernen, als sie das L¨ osen linearer Gleichungssysteme bietet. • Orientierung. Dieses Konzept ist im R3 als Rechte-Hand-Regel veranschaulicht. Die Determinante gibt uns einerseits die M¨ oglichkeit der einfachen Bestimmung der Orientierung und andererseits die M¨ oglichkeit der Verallgemeinerung in den Rn . • Volumenberechnung. Welches Volumen hat ein Quader im Rn , dessen Kanten durch n Vektoren gegeben sind? Dies ist nicht alles, was die Determinante vermag. Eine sehr wichtige Anwendung der Determinante besteht in der Berechnung von Eigenwerten linearer © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_18
264
18 Determinanten
Abbildungen und wird uns somit in dem Kapitel zu diesem Thema noch einmal begegnen.
18.2
Definition und Berechnung
Die Definition der Determinante ist recht komplex und ben¨ otigt zuvor die Einf¨ uhrung der so genannten Streichungsmatrix . Ist die Definition allerdings erst einmal verstanden, erm¨oglicht sie eine einigermaßen einfache Berechnung. Bei vielen Betrachtungen werden wir es mit quadratischen Matrizen zu tun haben; nur f¨ ur solche ist die Determinante definiert.
Definition (Streichungsmatrix) Sei A ∈ M (n × n, K) mit n > 1. Dann kann aus A durch Streichen der i-ten Zeile und j-ten Spalte die so genannte Streichungsmatrix ⎞ ⎛ a11 . . . a 1j . . . . . . . . a1n .. .. ⎟ ⎜ .. ⎜ . . . ⎟ ⎟ ⎜ ⎜ .. .. .. ⎟ ⎜ . . . ⎟ Sij (A) := ⎜ ⎟ ∈ M (n − 1 × n − 1, K) ⎜ ai1 . . . aij . . . . . . . . ain ⎟ ⎟ ⎜ ⎜ . .. .. ⎟ ⎝ .. . . ⎠ an1
...
a nj
........
ann
gewonnen werden.
Definition (Determinante) Sei n > 1. Die Determinante det : M (n × n, K) → K ist definiert durch det A :=
n
(−1)i+1 ai1 det Si1 (A) .
i=1
F¨ ur A = (a11 ) ∈ M (1 × 1, K) = K gilt det A := a11 . ⎛ a11 . . . a1n a11 .. ⎜ . . .. .. statt det ⎝ ... . an1 . . . ann an1 geschrieben.
Es wird oft ⎞ . . . a1n .. ⎟ .. . . ⎠ ...
ann
Die Determinante einer quadratischen Matrix ist also u ¨ber die Determinanten kleinerer quadratischer Matrizen definiert. Letztere werden mit der gleichen
265
18.2 Definition und Berechnung
Definition wiederum auf noch kleinere Matrizen zur¨ uckgef¨ uhrt. Schließlich landen wir bei (1 × 1)-Matrizen, f¨ ur die unsere Definition ohne weitere Umwege einen Wert f¨ ur die Determinante liefert. Dieses Konzept, in einer Definition wieder auf die Definition zu verweisen, wird Rekursion genannt. Schauen wir uns nun die Definition genauer an, wobei wir die Vorzeichen vorerst vernachl¨assigen. Es wird jedes Element der ersten Matrixspalte mit der Determinante der Streichungsmatrix multipliziert, die durch Streichen jener Zeile und Spalte entsteht, zu denen das aktuelle Element geh¨ ort. Schließlich wird alles summiert. Der Term (−1)i+1 verursacht dabei einen Vorzeichenwechsel eines jeden zweiten Summanden. Nun stellt sich vielleicht die Frage, was an der ersten Spalte einer Matrix so besonders ist, dass gerade sie zur Definition einer so praktischen Gr¨ oße wie der Determinante benutzt wird. In der Tat kann durch einige Rechnerei eine entsprechende Formel f¨ ur die Determinante hergeleitet werden, in der anstelle der ersten Spalte eine beliebige Spalte oder Zeile der Matrix durchlaufen wird. Diese Formeln sind als Laplace’scher Entwicklungssatz zusammengefasst:
det A = det A =
n
(−1)i+k aik det Sik (A)
(Entwicklung nach der i-ten Zeile)
(−1)i+k aik det Sik (A)
(Entwicklung nach der k-ten Spalte)
k=1 n i=1
Welcher der Summanden sein Vorzeichen ¨andert, kann folgendem Schachbrettmuster entnommen werden: + − + . . . − + − . . . + − + . . . . . .. .. . . .. . . . Die Minuszeichen stehen hier f¨ ur einen Vorzeichenwechsel. Der Vorteil dieses Satzes liegt darin, sich zur Determinantenberechnung einer gegebenen Matrix die Zeile oder Spalte auszusuchen, welche am wenigsten Rechenaufwand verspricht. Dies ist typischerweise die Zeile oder Spalte mit den meisten Nullen, denn so entfallen viele Determinantenberechnungen der Streichungsmatrizen.
Beispiel Enth¨alt eine quadratische Matrix eine Nullzeile oder -spalte, so ist deren Determinante bei Entwicklung nach dieser Zeile oder Spalte Null.
266
18 Determinanten
Beispiele sind
a b d e 0 0
a c f = 0 und d g 0
0 c 0 f = 0 . 0 i
Wenn sich die Nullen nicht gerade wie in diesem Beispiel in einer Zeile oder Spalte konzentrieren, macht diese Strategie allerdings erst bei gr¨ oßeren Matrizen Sinn. F¨ ur (2 × 2)- und (3 × 3)-Matrizen ergeben sich aus der Definition separate Determinantenformeln, die wir im Folgenden herleiten wollen.
18.2.1
Berechnung fu ¨ r (2 × 2)-Matrizen
Wir berechnen einer nicht n¨ aher konkretisierten (2 × 2) die Determinante a11 a12 Matrix A = direkt nach der Definition (Entwicklung nach der a21 a22 ersten Spalte): det A =
2
(−1)i+1 ai1 det Si1 (A)
i=1
= (−1)2 a11 det S11 (A) +(−1)3 a21 det S21 (A) = a22
= a12
= a11 a22 − a21 a12 . Dies kann in folgendem Schema zusammengefasst werden: · ·
18.2.2
· ·
· = ·
· ·
−
·
·
·
·
Berechnung fu ¨ r (3 × 3)-Matrizen
F¨ ur den ebenso h¨ aufigen Fall der (3 wir auf die gleiche ⎞ ⎛× 3)-Matrizen berechnen a11 a12 a13 Weise die Determinante von B = ⎝a21 a22 a23 ⎠: a31 a32 a33 a det B = a11 22 a32
a12 a23 − a 21 a32 a33
a12 a13 + a 31 a22 a33
a13 a23
= a11 (a22 a33 − a32 a23 ) − a21 (a12 a33 − a32 a13 ) + a31 (a12 a23 − a22 a13 ) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a31 a22 a13 − a32 a23 a11 − a33 a21 a12
267
18.3 Geometrische Interpretation
¨ Auch hier hilft ein Schema als Merkhilfe, der Ubersichtlichkeit wegen ohne Indizes. Daf¨ ur schreiben wir die ersten beiden Spalten noch einmal hinten an die Matrix. Die Terme zu den schr¨ag nach unten zeigenden Pfeilen werden addiert, jene zu den schr¨ag nach oben zeigenden werden subtrahiert. a d g
b e h
a c f = d g i
b e h
c f
a
i
d
g
b
a
b Ac Aa Ab
e − d
e
f
d
e
g
h
i
g
h
h
Diese Determinantenberechnung heißt Regel von Sarrus.
18.2.3
Dreiecksmatrizen
Matrizen, die oberhalb bzw. unterhalb der Diagonalen ausschließlich Nullen als Eintr¨age haben, werden obere bzw. untere Dreiecksmatrizen genannt. Deren Determinante ist besonders leicht zu berechnen, unabh¨ angig von der Gr¨ oße der Matrix. In diesen F¨allen ist n¨amlich die Determinante lediglich das Produkt der Diagonalelemente: a11 ∗ . . . ∗ a11 0 . . . 0 .. .. . 0 a22 . . . . ∗ a22 . . . . = . = a11 · a22 · . . . · ann . . . . .. .. .. .. .. .. ∗ 0 0 . . . 0 ann ∗ . . . ∗ ann ¨ Pr¨ ufen Sie dies als Ubung zum Laplaceschen Entwicklungssatz eigenst¨ andig nach!
18.3
Geometrische Interpretation
18.3.1
Determinante als Volumenform
Wir erw¨ahnten bereits, Matrizen hier auch als Zusammenfassung von Vektoren — ihrer Spaltenvektoren — betrachten zu wollen. Unter dieser Sichtweise erh¨ alt die Determinante eine sehr anschauliche Bedeutung. Die Determinante gibt n¨ amlich ein Volumen an. • F¨ ur reelle (3 × 3)-Matrizen spannen die drei Spaltenvektoren ein so genanntes Parallelepiped auf. Ein Parallelepiped ist vorstellbar als schiefer W¨ urfel, dessen Kanten durch die Spaltenvektoren gegeben sind. Die Seitenfl¨ achen eines Parallelepipeds sind Parallelogramme, gegen¨ uber liegende Seiten sind
268
18 Determinanten
parallel zueinander. Es gilt: Das Volumen des Parallelepipeds, welches von den Vektoren v1 , v2 , v3 ∈ R3 aufgespannt wird, ist gleich |det(v1 , v2 , v3 )|. (Beachten Sie den Betrag, denn die Determinante kann durchaus auch negativ sein.) • F¨ ur reelle (2×2)-Matrizen sieht die Sache ganz ¨ ahnlich aus. Die zwei Spaltenvektoren spannen diesmal nur ein (zweidimensionales) Parallelogramm auf und ein zweidimensionales Volumen nennen wir normalerweise Fl¨ acheninhalt. Wiederum gilt: Der Fl¨ acheninhalt des Parallelogramms, welches von den Vektoren v1 , v2 ∈ R2 aufgespannt wird, ist gleich |det(v1 , v2 )|. • Der Vollst¨andigkeit halber soll hier noch der Fall der (1 × 1)-Matrizen aufgelistet werden: Die L¨ ange der Strecke, welche von dem Vektor v1 ∈ R aufgespannt wird, ist gleich |det(v1 )|. Auch f¨ ur h¨ohere Dimensionen kann ein analoger Sachverhalt formuliert werden, ¨ wird aber in der Praxis seltener ben¨otigt. Dennoch ist es eine gute Ubung, ein 4 Parallelepiped im R oder h¨oher, das von entsprechend vielen Vektoren aufgespannt wird, als Menge aufzuschreiben. Linearkombinationen werden dabei behilflich sein.
18.3.2
Determinante und Orientierung
Das Vorzeichen der Determinante haben wir zur Volumenbestimmung nicht gebraucht. Wir k¨onnen diese zus¨atzliche Information nutzen, um die Orientierung der Vektoren zu bestimmen. Im R2 ist eine Orientierung durch den Uhrzeigersinn gegeben, im R3 durch die Rechte-Hand-Regel (mehr dazu gleich). Um den Zusammenhang zwischen Orientierung und Vorzeichen der Determinante zu erkennen, berechnen wir zun¨achst das Vorzeichen einiger Determinanten: 1 0 = +1 , 0 1 = −1 . 0 1 1 0 Bei der Matrix mit positiver Determinante kann der erste Spaltenvektor durch Drehung entgegen dem Uhrzeigersinn (das ist der mathematisch positive Drehsinn) schneller in Richtung des zweiten Spaltenvektors gedreht werden als mit dem Uhrzeigersinn. Bei negativer Determinante ist dies genau umgekehrt. Anders ausgedr¨ uckt befinden sich bei festem ersten Spaltenvektor v1 ∈ R2 alle Vektoren v2 ∈ R2 mit positiver Determinante det(v1 , v2 ) > 0 links von v1 , (genauer links von der von v1 aufgespannten Geraden, wenn man in Richtung v1 schaut.) Alle v2 mit negativer Determinante befinden sich rechts.
269
18.3 Geometrische Interpretation
An (3 × 3)-Matrizen testen wir einige 1 0 0 0 0 0 1 0 = +1 , 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 = −1 , 1 0 0 1 0 0 0
mehr: 1 0 = +1 , 0 0 0 = −1 , 1
0 1 0 0 0 1 = +1 , 1 0 0 0 0 1 0 1 0 = −1 . 1 0 0
Sie k¨onnen leicht u ufen, dass die Spaltenvektoren der Matrizen mit posi¨berpr¨ tiver Determinante der Rechte-Hand-Regel gen¨ ugen. D. h. die Lagen der drei Vektoren — von links nach rechts — k¨onnen durch Daumen, Zeige- und Mittelfinger der rechten Hand dargestellt werden (vgl. hierzu die Bilder in Kapitel 19.4). Die Spaltenvektoren der Matrizen mit negativer Determinante gen¨ ugen hingegen einer Linke-Hand-Regel. Halten wir die ersten beiden Spaltenvektoren v1 , v2 ∈ R3 fest, befinden sich alle Vektoren v3 ∈ R3 mit positiver Determinante det(v1 , v2 , v3 ) > 0 auf der gleichen Seite der durch v1 und v2 aufgespannten Ebene. Alle v3 mit negativer Determinante auf der anderen Seite. Diese Ergebnisse haben wir zwar nur durch einige wenige Beispielmatrizen hergeleitet, sie gelten aber f¨ ur beliebige (2×2)- bzw. (3×3)-Matrizen. Somit haben wir mit der Determinante ein einheitliches Kriterium zur Charakterisierung der Orientierung an der Hand. Dies wollen wir nutzen, um die Orientierung etwas mathematischer zu definieren.
Definition (positiv/negativ orientiert) Die n Vektoren v1 , . . . , vn ∈ Rn in angegebener Reihenfolge heißen • positiv orientiert, falls det(v1 , . . . , vn ) > 0 und • negativ orientiert, falls det(v1 , . . . , vn ) < 0 ist.
18.3.3
Determinante und lineare Unabh¨ angigkeit
Die Beziehung zwischen der linearen (Un-)Abh¨ angigkeit und dem Wert der Determinante werden wir ebenfalls mithilfe unserer Anschauung herleiten, zumindest in den wichtigen F¨allen des zwei- und dreidimensionalen Raumes. Wie kann die lineare Abh¨angigkeit zweier Vektoren in der Ebene anschaulich charakterisiert werden?
270
18 Determinanten
Nun, die Vektoren sind genau dann linear abh¨angig, wenn sie in die gleiche — oder entgegengesetzte — Richtung weisen, d. h. wenn sie Vielfache voneinander sind. Anderenfalls sind sie linear unabh¨angig und spannen somit die gesamte Ebene auf. Schauen wir uns an, welche Determinante eine Matrix hat, deren Spaltenvektoren linear abh¨angig sind: a b
λa λb
= a · λb − b · λa = 0 .
Umgekehrt sind Determinanten von Matrizen mit linear unabh¨ angigen Spaltenvektoren ungleich Null. Erinnern wir uns an die Determinante als Maß des Fl¨acheninhaltes des durch die beiden Spaltenvektoren aufgespannten Parallelogramms, so macht dies durchaus Sinn. Linear abh¨ angige Vektoren zeigen in die gleiche Richtung. Somit ist das von ihnen aufgespannte Parallelogramm degeneriert und hat einen Fl¨acheninhalt von Null. Und wie sieht die lineare Abh¨angigkeit dreier Vektoren im R3 aus? Hier sind die Vektoren genau dann linear abh¨ angig, wenn sie in der gleichen Ursprungsebene liegen. (Dies schließt nat¨ urlich den Fall mit ein, dass alle drei Vektoren Vielfache voneinander sind.) Das von diesen drei Vektoren aufgespannte Parallelepiped liegt dann ebenfalls in der Ebene und hat ein Volumen von Null. Somit gilt auch hier, dass die Determinante von Matrizen mit linear abh¨angigen Spaltenvektoren Null ergibt. Bei linear unabh¨ angigen Spaltenvektoren ist die Determinante hingegen ungleich Null. Dieser Sachverhalt l¨asst sich auf beliebige Dimension und gar auf komplexwertige Matrizen erweitern. Der folgende Satz geht darauf ein. Er verbindet gleichzeitig viele der uns bereits bekannten Matrixgr¨ oßen und zeigt, wie eng die Beziehungen zwischen diesen sind. Satz ¨ Es sei A ∈ M (n × n, K). Dann gelten folgende Aquivalenzen: det A = 0 ⇔
Die Spalten (Zeilen) von A sind linear unabh¨ angig.
⇔ ⇔
Rang A = n Kern A = {0}
⇔
A−1 existiert.
18.4 Rechenregeln f¨ ur die Determinante
18.4
271
Rechenregeln fu ¨ r die Determinante
Die Determinantenfunktion erf¨ ullt weiterhin eine ganze Reihe brauchbarer Eigenschaften. Je mehr Sie davon beherrschen, desto leichter werden Determinantenberechnungen fallen, denn durch die Anwendung der folgenden Punkte zur rechten Zeit kann die Rechnung erheblich vereinfacht werden. Dementsprechend sind die aufgef¨ uhrten Eigenschaften teilweise redundant, einige Eigenschaften folgen gar direkt aus anderen. Sie wurden dennoch genannt, um sie f¨ ur Berechnungen besser verf¨ ugbar zu machen. Teilweise kommen Determinanten von n Vektoren des Kn vor. Gemeint ist dabei die Determinante der Matrix, die diese n Vektoren als Spaltenvektoren hat. Dank Punkt 5 gelten diese Punkte allerdings genauso, wenn anstelle der Spalten die Zeilen der Matrix betrachtet werden. Seien A, B ∈ M (n × n, K), a1 , . . . , an und b1 , . . . , bn ∈ Kn Spaltenvektoren. Seien ferner c ∈ Kn und λ ∈ K. Dann gilt: 1. det(a1 , . . . , ak , . . . , al , . . . , an ) = − det(a1 , . . . , al , . . . , ak , . . . , an ); das Vertauschen zweier Spalten — oder Zeilen — ¨ andert lediglich das Vorzeichen. Die Determinante ist alternierend. 2. det(a1 , . . . , ak , . . . , ak , . . . , an ) = 0, gleiche Spalten — oder Zeilen — ergeben Null als Determinante. Dies ist eine direkte Folgerung des vorigen Punktes. 3. det(a1 , . . . , ak−1 , (ak + λc) , ak+1 , . . . , an ) = det(a1 , . . . , ak−1 , ak , ak+1 , . . . , an ) + λ det(a1 , . . . , ak−1 , c , ak+1 , . . . , an ), dies ist die Linearit¨atseigenschaft, allerdings f¨ ur eine Spalte (oder Zeile), w¨ahrend die anderen nicht ver¨andert werden. Die Determinante ist in jeder Spalte — oder Zeile — linear. 4. det(a1 , . . . , ak−1 , (ak + λal ), ak+1 , . . . , an ) = det(a1 , . . . , ak−1 , ak , ak+1 , . . . , an ). Addieren eines Vielfachen einer Spalte — oder Zeile — zu einer anderen a¨ndert die Determinante nicht.
272
18 Determinanten
5. det A = det AT , wegen dieser Gleichheit k¨onnen wir die Aussagen 1. bis 4. auch auf Zeilen u ¨bertragen, denn beim Transponieren werden ja aus Zeilen Spalten und aus Spalten Zeilen. 6. det(AB) = det A · det B. 7.
1 , falls A invertierbar ist; det A dies ist eine direkte Folgerung aus dem vorigen Punkt und aus det E = 1. det A−1 =
18.5
Das Kreuzprodukt
Bisher haben wir definiert, was die Summe zweier Vektoren und das Produkt eines Skalars mit einem Vektor ist. Das Kreuzprodukt gibt uns nun eine M¨ oglichkeit, zwei Vektoren miteinander zu multiplizieren. Es ist allerdings nur f¨ ur Vektoren des R3 definiert, bietet dort aber eine sch¨one geometrische Interpretation. Sp¨ ater werden wir mit dem Skalarprodukt ein weiteres Produkt von Vektoren kennen lernen, das g¨anzlich anders aussieht als das Kreuzprodukt.
Definition (Kreuzprodukt) Seien x, y ∈ R3 . Dann ist das Kreuzprodukt definiert durch ⎞ ⎛ x 2 y3 − x 3 y 2 x × y := ⎝x3 y1 − x1 y3 ⎠ x 1 y2 − x 2 y 1 oder durch
x1 x × y := x2 x 3
y1 y2 y3
e1 e2 . e3
Letzteres ist dabei nur als Rechenschema und Merkhilfe zu verstehen und soll den Bezug zur Determinante herstellen. Vektoren und Zahlen in derselben Matrix machen ansonsten keinen Sinn. Berechnen wir die Determinante beispielsweise mit der Regel von Sarrus, so erhalten wir x1 y1 e1 x2 y2 e2 = x1 y2e3 + x3 y1e2 + x2 y3e1 − x3 y2e1 − x1 y3e2 − x2 y1e3 , x3 y3 e3
273
18.6 Aufgaben
was dem Kreuzprodukt aus der ersten Formel entspricht. Was ergibt sich aus der Determinantendarstellung f¨ ur y × x? Da die Determinante alternierend ist, d. h. bei Vertauschen zweier Spalten ihr Vorzeichen a¨ndert, muss dies auch f¨ ur das Kreuzprodukt gelten: y × x = −x × y . Die meisten der folgenden Fakten u ¨bertragen sich ebenso leicht von den Determinanteneigenschaften auf das Kreuzprodukt. • x × y steht senkrecht auf x und y ; • ||x×y || ist der Fl¨acheninhalt des von x und y aufgespannten Parallelogramms; (Definition und Einsichten hierzu im n¨achsten Kapitel) • y × x = −x × y ; das Kreuzprodukt ist alternierend; • (ax + by ) × z = a(x × z) + b(y × z), x × (ay + bz) = a(x × y ) + b(x × z); das Kreuzprodukt ist in beiden Eing¨angen linear; • (x, y , x × y ) gen¨ ugen der Rechte-Hand-Regel. Das Kreuzprodukt kommt in der Physik h¨aufig vor. Bekannte Beispiele sind die Winkelgeschwindigkeit ω mit der Gleichung v = ω × r sowie die Lorentz-Kraft F = q(v × B).
18.6
Aufgaben
1. Berechnen Sie die Determinanten folgender Matrizen. ⎛ ⎞ −4 −3 −2 1 2 1⎠ . A= , B = ⎝−1 0 3 4 2 3 4 2. Berechnen Sie die Determinante von ⎛ 1 2 ⎜2 2 A=⎜ ⎝3 1 0 3 mithilfe der Laplace-Entwicklung.
0 3 0 1
⎞ 3 0⎟ ⎟ 2⎠ 6
274
18 Determinanten
3. Beschreiben Sie die Menge aller Vektoren v , welche die Gleichung ⎛
⎞ ⎛ ⎞ −1 0 v × ⎝ 2 ⎠ = ⎝0⎠ 0 5 l¨osen.
0 4. Bestimmen Sie alle Vektoren in Richtung 2 , die zusammen mit den 1 beiden Vektoren ⎛ ⎞ ⎛ ⎞ 1 −2 v1 = ⎝2⎠ , v2 = ⎝−1⎠ , 0 1 ein Parallelepiped mit einem Volumen von 3 aufspannen. ¨ 5. Uberpr¨ ufen Sie mithilfe von Determinanten, ob die Vektoren ⎛ ⎞ 2 v1 = ⎝2⎠ , 1
⎛
⎞ 3 v2 = ⎝−1⎠ , 0
⎛ ⎞ 2 v3 = ⎝1⎠ , 1
linear abh¨angig oder linear unabh¨angig sind.
18.7
L¨ osungen
1. 1 2 = 1 · 4 − 2 · 3 = −2 det A = 3 4 −4 −3 −2 1 det B = −1 0 2 3 4 = (−4) · 0 · 4 + (−3) · 1 · 2 + (−2) · (−1) · 3 − 2 · 0 · (−2) − 3 · 1 · (−4) − 4 · (−1) · (−3) =0
(mit der Regel von Sarrus)
2. Um Rechenaufwand zu sparen, suchen wir uns eine Zeile oder Spalte mit m¨oglichst vielen Nullen, hier die dritte Spalte. Nach dieser Spalte entwickeln wir die Determinante und alle Untermatrizen, die mit einer Null multipliziert werden, brauchen wir gar nicht erst hinzuschreiben. Die anderen 3×3-Untermatrizen werden wir ebenfalls nach Laplace entwickeln
275
18.7 L¨ osungen
(die erste nach 1 2 det(A) = 3 0
der ersten Spalte, die zweite nach der zweiten Zeile). 2 0 3 2 3 0 1 0 2 3 1 6 1 2 3 1 2 3 = 0 · . . . − 3 · 3 1 2 + 0 · . . . − 1 · 2 2 0 3 1 2 0 3 6 2 3 1 3 1 2 2 3 − 1 −2 · +2· = −3 1 · −3· 3 2 3 6 3 6 1 2
= −3 (1 · 0 − 3 · 3) − 1 (−2 · 1 + 2 · (−7)) = 27 + 16 = 43 3. Bei dieser Aufgabe argumentieren wir mit den Eigenschaften des Kreuzproduktes.
0 Zum einen steht der Ergebnisvektor 0 des Kreuzproduktes senkrecht 5 auf den beiden anderen Vektoren, also speziell senkrecht auf v . Da der Ergebnisvektor in Richtung der z-Achse zeigt, muss v in der xy-Ebene liegen. Zum anderen gibt die L¨ange des Ergebnisvektors, hier achenin 5, den Fl¨ −1 halt des Parallelogramms an, welches von v und 2 aufgespannt wird. 0 Solche Parallelogramme gibt es unendlich viele, wie in der Skizze zu sehen. Die variable Seite, gegeben durch v , endet jeweils auf einer fixen Geraden. y v = (−0, 5, 6, 0)T
(−1, 2, 0)T v = (2, 1, 0)T x xy-Ebene
v = (3, −1, 0)T
v = (4, −3, 0)T
Einen utzvektor dieser Geraden erhalten wir, indem wir den Vektor
St¨ −1 in der xy-Ebene um 90 Grad im Uhrzeigersinn (die Richtung er2 0
276
18 Determinanten
gibt sich daraus, dass das Kreuzprodukt der Rechte-Hand-Regel gen¨ ugt) 2 drehen: 1 . 0
y
(−1, 2, 0)T A=5
v = (2, 1, 0)T
xy-Ebene x
√ Diese beiden Vektoren haben jeweils die L¨ ange 5, womit das von ihnen aufgespannte Quadrat den richtigen Fl¨ acheninhalt hat. Somit ist die L¨osungsmenge
2
−1 ! v = 1 + t 2 | t ∈ R . 0
0
4. Das Volumen eines Parallelepipeds k¨onnen wir durch die Determinante der Matrix mit den drei Vektoren
0 als Spalten bestimmen. Die gesuchten Vektoren sollen in Richtung 2 zeigen, sie haben also die Gestalt v = 1
0 λ 2 . Somit m¨ ussen wir lediglich die Gleichung 1
| det(v , v1 , v2 )| = 3 nach λ aufl¨ osen. Es ist 0 1 det(v , v1 , v2 ) = λ 2 2 1 0
−2 −1 = λ(0 + (−1) + 0 − (−4) − 2 − 0) = λ . 1
Somit gibt osungsvektoren es einzig die L¨osungen λ = ±3, was zu den L¨ 0 6 v = ± f¨ uhrt. 3
5. Die Determinante einer Matrix gibt uns Auskunft u ¨ber die lineare (Un-)abh¨angigkeit ihrer Spalten bzw. Zeilen. 2 3 2 2 −1 1 = −2 + 3 + 0 − (−2) − 6 − 0 = −3 = 0 . 1 0 1 Somit sind die drei Vektoren linear unabh¨ angig. Bei Null als Ergebnis w¨aren die Vektoren linear abh¨angig.
18.7 L¨ osungen
277
Fragen • Was besagt der Laplacesche Entwicklungssatz? • F¨ ur welche Anwendungen l¨asst sich die Determinante verwenden und welche geometrische Interpretation l¨asst sich angeben? • Wie berechnet man mit der Regel von Sarrus die Determinante von (3×3)Matrizen? • Was k¨onnen Sie folgern, wenn die Determinante einer Matrix A ungleich Null ist? • Geben Sie Regeln f¨ ur das Rechnen mit Determinanten an. • Wie wird das Kreuzprodukt definiert?
19 Norm und Skalarprodukt
19.1
Motivation
Egal ob Ingenieur, Physiker oder Mathematiker: L¨ angen- und Winkelmessungen sind von elementarer Bedeutung. Denken Sie nur an GPS-Navigation im Auto, das Navigieren von Schiffen und Flugzeugen, die Reichweite eines Radiosenders oder gar Lichtbrechung, bei der Einfallswinkel eine besondere Rolle ¨ spielen: Uberall treten diese Begriffe auf. Klar, im Alltag k¨ onnen wir daf¨ ur teils Maßband und Geodreieck verwenden. Aber diese beiden Utensilien lassen sich nicht in einen beliebigen Vektorraum mitnehmen. Welche L¨ ange ein Pfeil (Vektorbegriff aus der Schule) hat, kann leicht gemessen werden. Gleiches gilt f¨ ur den Winkel zwischen zwei einfachen Vektoren, die auf das Papier gezeichnet wurden. Aber z. B. auch Polynome, die einen Vektorraum bilden, d¨ urfen linear unabh¨angig sein. Anschaulich heißt das f¨ ur uns, dass der Winkel“ zwischen ” ihnen nicht Null ist. Aber wie messen wir diesen und welche L¨ ange hat eigentlich ein Polynom? Mit Lineal und Winkelmesser in der Hand werden wir das nicht ermitteln k¨ onnen. Dazu brauchen wir also wieder etwas Theorie, die wir hier behandeln werden. Dabei wird uns beruhigen, dass die definierten und abgeleiteten Begriffe nach dem modelliert sind, was wir uns ohnehin als sinnvoll denken bzw. aus dem Alltag kennen.
19.2
Die Norm
Wir starten in diesem Teil mit der Norm:
Definition (Norm) Sei V ein K-Vektorraum. Eine Abbildung · : V → R+
,
v → v
heißt Norm, wenn gilt: © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_19
280
19 Norm und Skalarprodukt
1. v ≥ 0 f¨ ur alle v ∈ V und v = 0 ⇔ v = 0 2. v + w ≤ v + w f¨ ur alle v , w ∈V
(positive Definitheit);
(Dreiecksungleichung);
3. αv = |α|v f¨ ur alle α ∈ K und alle v ∈ V . Ein normierter Vektorraum ist ein Paar (V, · ), bestehend aus einem Vektorraum und einer Norm. (Der Punkt zwischen den Normstrichen ist nur ein Platzhalter f¨ ur die einzusetzenden Vektorraumelemente.) Wenn wir die einzelnen Forderungen an eine Norm ansehen, erkennen wir, dass diese in gewisser Weise verallgemeinert, was gew¨ ohnlich unter L¨ ange“ ” verstanden wird. So besagt 1. im Wesentlichen, dass die L¨ ange nicht negativ sein kann. Warum wir 2. Dreiecksungleichung nennen, ist im n¨ achsten Beispiel sehr gut zu sehen. Dieses besagt grob formuliert, dass es auf direktem Wege schneller zum Ziel geht als u ¨ber einen Umweg; dies wird aus der folgenden ur sich. Hier u Skizze klar. Punkt 3 spricht eigentlich f¨ ¨berlassen wir es daher Ihnen, das ganze in Worte zu fassen. Insgesamt steckt also in der Definition wirklich die Grundidee dessen, was von einer L¨angenmessung erwartet wird. Allerdings haben wir nun einen verallgemeinerten Begriff, der auch f¨ ur beliebige Vektorr¨ aume funktioniert. Wir k¨ onnen aber nicht erwarten, dass die Norm eines Elementes des Vektorraumes der differenzierbaren Funktionen eine L¨ange ist, die sich in Metern ausdr¨ ucken l¨ asst. Dennoch werden wir sehen, welche n¨ utzlichen Dinge sich mit der Norm anstellen lassen.
Beispiel Die so genannte Standardnorm: Wir betrachten auf dem Rn 1 x := x21 + . . . + x2n 2 . Der Einheitskreis K im R2 ist dann K = x ∈ R2 | x = 1 , denn nach dem Satz von Pythagoras ist x21 + x22 = 1, also x = 1. Ist das wirklich eine Norm? Ja, denn 1. x ≥ 0 aufgrund der Quadrate; ferner ist offensichtlich nur f¨ ur x = (0 . . . 0)T = 0 die Norm x = 0. 2. . x+ y y
x
/* .
281
19.2 Die Norm
Hier sehen Sie die G¨ ultigkeit der Dreiecksgleichung f¨ ur den zweidimensionalen Fall und es ist leicht zu erkennen, woher sie ihren Namen hat. Aufgrund der Struktur ist klar, dass sich in h¨ oheren Dimensionen nichts ultigkeit von 2. f¨ ur die hier definierte Norm f¨ uhren ¨andert, was zur Ung¨ k¨onnte. Es ist aber auch nicht schwer, einen formalen Beweis zu f¨ uhren. Wir machen dies einfach f¨ ur x, y ∈ R, da hier die Beweisidee besonders gut sichtbar wird. Es ist zu zeigen, dass x + y ≤ x + y. Wir wenden einen Trick an, denn mit den hinter der Norm verborgenen Wurzeln m¨ochte niemand wirklich rechnen. Es gibt hierf¨ ur einfach keine h¨ ubschen Rechenregeln. Daher quadrieren wir beide Seiten und es bleibt zu zeigen √ √ x 2 + y 2 ≤ ( x 2 + y 2 ) 2 = x2 + y 2 + 2 x 2 y 2 . Der letzte Term ist offensichtlich gr¨oßer oder gleich Null, die rechte Seite ist also tats¨achlich gr¨oßer. Bitte denken Sie nicht, dass wir hier nur aus Gr¨ unden der Einfachheit einen Spezialfall bewiesen haben, denn das Verstehen von Mathematik l¨auft h¨aufig u ¨ber Prinzipien und Grundideen, die alles weitere einfach(er) machen. Die Grundidee haben wir hier gesehen. ¨ Nach unserer Uberlegung kommen n¨amlich nach dem Potenzieren einfach ¨ auf der rechten Seite Terme dazu, die f¨ ur ein Ubergewicht sorgen. 3. 1 αx = α2 x21 + . . . + α2 x2n 2 1 = α2 x21 + . . . + x2n 2 n 12 √ 2 2 = α xi i=1
= |α|x .
Beispiel Hier definieren wir die Maximumsnorm im Rn : xmax := max {|x1 |, . . . , |xn |} . Es ist interessant sich zu u ¨berlegen, wie der Einheitskreis“ bzgl. dieser Norm ” aussieht. K = x ∈ R2 | xmax = 1
282
19 Norm und Skalarprodukt
y
1 x 1
Bitte u ¨berlegen Sie selbst, warum das so ist; die Skizze sollte Tipp genug sein. Hier ist 1. erf¨ ullt, denn bei der Definition wird jeweils das Maximum der Betr¨ age der Komponenten genommen, weshalb keine Werte kleiner als Null m¨ oglich sind und Null selbst nur dann vorkommen kann, wenn alle Komponenten Null sind, was nur f¨ ur den Nullvektor gilt. Da die Dreiecksungleichung f¨ ur Betr¨ age von reellen Zahlen gilt, gilt sie auch hier, womit 2. erf¨ ullt ist. Weil sich aus den Betr¨agen das α herausziehen l¨asst und dann auch vor das Maximum (max), ist 3. erf¨ ullt. Es handelt sich also wirklich um eine Norm. Wenn sich also in Zukunft (z. B. in einer Klausur) eine Abbildung darum be¨ wirbt, eine Norm zu sein, m¨ ussen zur Uberpr¨ ufung des Kandidaten strikt die Punkte 1.–3. untersucht werden, dann ist die Entscheidung gefallen. Wir haben die Erfahrung gemacht, dass in Klausuren oder bei Aufgaben lange auf die vermeintliche Norm gestarrt wird, ohne dass dies ein Ergebnis liefert. Es hilft also nur das wirkliche Pr¨ ufen und Aufschreiben; so schwer ist es meist wirklich nicht.
19.3
Das Skalarprodukt
Mit der Norm haben wir schon einen wichtigen Begriff kennen gelernt, mit dem wir Untersuchungen in normierten Vektorr¨aumen durchf¨ uhren k¨ onnen. Es gibt noch einen anderen wesentlichen Begriff, der uns einerseits die Winkelmessung erm¨oglicht, andererseits als eine Art Vorstufe zur Norm betrachtet werden kann. Wir merken uns schon jetzt, dass jedes Skalarprodukt eine Norm induziert (aber nicht umgekehrt). Bei den Skalarprodukten m¨ ussen wir unterscheiden, ob wir einen R- oder C-Vektorraum betrachten. Im ersten Fall heißt das Skalarprodukt euklidisch, im zweiten Fall unit¨ar.
Definition
(euklidisches Skalarprodukt)
283
19.3 Das Skalarprodukt
Sei V ein R-Vektorraum. Eine Abbildung ·, · : V × V → R heißt (euklidisches) Skalarprodukt, wenn f¨ ur alle u, v , w ∈ V und alle λ ∈ R gilt: 1. u, v + w = u, v + u, w 2. v , w = w, v 3. v , v ≥ 0 und v , v = 0 ⇔ v = 0 4. v , λw = λv , w Ein Paar (V, ·, · ), bestehend aus einem R-Vektorraum und einem euklidischen Skalarprodukt, heißt euklidischer Vektorraum. Aus 2. und 4. folgt: < λv, w >= λ < v, w >.
Beispiel Wir betrachten die Vektoren x, y ∈ Rn . x, y := x1 y1 + . . . + xn yn heißt Standardskalarprodukt. Die Eigenschaften sind schnell gepr¨ uft: 1. u, v + w = u1 (v1 + w1 ) + . . . + un (vn + wn ) = u1 v1 +u1 w1 +. . .+un vn +un wn = u1 v1 +. . .+un vn +u1 w1 +. . .+un wn = u, v + u, w 2. Die G¨ ultigkeit ergibt sich aus der Tatsache, dass v1 w 1 + . . . + v n w n = w1 v 1 + . . . + w n v n ist. 3. Es gilt v , v = v12 + . . . + vn2 , wodurch auch dieser Punkt klar ist. ¨ 4. Hier hilft, wie immer bei der Uberpr¨ ufung der Eigenschaften von Skalarprodukten, das Ausschreiben: v , λw = v1 λw1 + . . . + vn λwn = λ(v1 w1 + . . . + vn wn ) = λv , w . 1
x, x = x21 + . . . + x2n , also x = x, x 2 . Die Standardnorm wird also vom Standardskalarprodukt induziert.
284
19 Norm und Skalarprodukt
Wie das Skalarprodukt im Komplexen aussieht, sehen wir in der folgenden Definition. Die Unterschiede zum euklidischen Fall sind nicht groß. Es ist interessant zu sehen, was beim Einsetzen ausschließlich reeller Gr¨ oßen in das unit¨ are Skalarprodukt passiert (wobei der letzte Satz als Aufforderung zu verstehen ist, dies auch wirklich selbst zu machen).
Definition (unit¨ares Skalarprodukt) Sei V ein C-Vektorraum. ·, · : V × V → C heißt (unit¨ ares) Skalarprodukt, wenn f¨ ur alle u, v , w ∈ V und alle λ ∈ C die Punkte 1., 3. und 4. wie zuvor in der Definition gelten, jedoch statt 2. gilt: 2.
v , w = w, v .
Ein Paar (V, ·, · ), bestehend aus einem C-Vektorraum und einem unit¨ aren Skalarprodukt, heißt unit¨arer Vektorraum. Aus 2. und 4. folgt diesmal: λv , w = w, λv = λ w, v = λv , w . Wir hatten bereits zuvor bemerkt, dass sich aus jedem Skalarprodukt eine Norm basteln l¨asst. Dies geschieht (im euklidischen und unit¨ aren Fall) u ¨ber folgende Gleichung: x := x, x . Wenn wir die Definitionen von Skalarprodukt und Norm nochmals genau betrachten, erkennen wir schnell, dass das Skalarprodukt gerade dazu geschaffen scheint, zu einer Norm zu f¨ uhren. Beachten Sie hierzu nochmals gesondert die Punkte 3. und 4. in der Definition des Skalarproduktes. Verwendung findet beim Nachweis auch die Cauchy-Schwarzsche-Ungleichung, die wir allerdings nicht beweisen wollen: |v , w | ≤ v w Aus dieser Ungleichung folgt f¨ ur v , w ∈ Rn : −1 ≤
v , w ≤1 v w
und wir k¨onnen aus dem Skalarprodukt den Kosinus berechnen: v , w = v w cos (v , w) . Der in den Kosinus eingesetzte Winkel ist also der zwischen den Vektoren v und w. Die letzte Gleichung k¨onnen wir nun nach dem Term mit dem Kosinus umstellen. Dann muss von beiden Seiten nur noch der Arcuskosinus genommen werden und es ergibt sich der Winkel; wir hatten ja am Anfang und in der ¨ Uberschrift versprochen, dass wir hier das Berechnen von Winkeln und L¨ angen lernen.
19.4 Orthonormalisierung nach Schmidt
285
Anstatt v , w wird auch h¨aufig die Schreibweise v ·w verwendet. Einige Autoren lassen sogar den Punkt weg, was wir aber f¨ ur etwas zu locker halten. Am Ende bleibt es Geschmackssache. Allerdings muss klar sein, was gemeint ist.
19.4
Orthonormalisierung nach Schmidt
Betrachten Sie bitte Daumen, Zeige- und Mittelfinger Ihrer rechten oder linken Hand. Diese drei Finger lassen sich so halten, dass zwischen ihnen ein Winkel von 90 Grad ist. Dies ist eine einfache Visualisierung eines kartesischen Koordinatensystems, in welchem wir gew¨ohnlich denken, wenn wir z. B. Punkte im Raum darstellen m¨ochten. Die Festlegung der Achsenbezeichnungen in den Abbildungen ist allerdings willk¨ urlich.
Alle anderen Koordinatensysteme — d. h. solche, bei denen die Achsen keine
286
19 Norm und Skalarprodukt
rechten Winkel miteinander einschließen — scheinen uns irgendwie schief zu sein. Selbst durch die optischen Eindr¨ ucke des t¨ aglichen Lebens sind wir ein wenig auf rechte Winkel geeicht. Es ist leicht nachzurechnen, dass die zuvor behandelten Vektoren der Standardbasis des R3 , n¨ amlich e1 , e2 und e3 , paarweise jeweils einen rechten Winkel einschließen. Sie bilden ja auch das Grundger¨ ust f¨ ur ein kartesisches Koordinatensystem. Wir stellen hiermit fest, dass wir am liebsten an rechte Winkel denken, insbesondere, wenn wir Messungen vornehmen wollen und daf¨ ur ein einfaches Bezugssystem verwenden. H¨ aufig richten sich Vektoren allerdings nicht nach unseren W¨ unschen und stehen in unsch¨ onen (nicht rechten) Winkeln zueinander, was es zu beheben gilt. Dabei denkt der Mathematiker nicht nur an Vorteile beim Zeichnen, es steckt viel mehr dahinter. So sind nicht nur die Geometer ganz verr¨ uckt danach, sich an jedem Punkt ein Koordinatensystem zu denken, dessen Achsen rechtwinklig (orthogonal ) zueinander sind. Wenn wir nun an unsere Standardbasis im R3 denken, so haben diese drei Vektoren noch eine sch¨one Eigenschaft: Sie haben alle die Norm (L¨ange) 1 bez¨ uglich der Standardnorm, wie sich sofort nachrechnen l¨ asst. Das ist noch luxuri¨oser, als einfach nur orthogonal zu sein. Wir sprechen dann von orthonormal , denn die Vektoren sind orthogonal und normiert. Zum Normieren muss ein Vektor durch seine Norm geteilt werden, wir sehen sp¨ ater mehr dazu. Nachdem wir Ihnen nun hoffentlich ausreichend erl¨ autert haben, dass orthonormale Vektoren besonders sch¨on sind, wollen Sie sicher auch wissen, ob nun auch beliebige Vektoren — und dazu braucht es wahrscheinlich etwas Gewalt — orthonormiert werden k¨onnen. Wir k¨ onnen Sie beruhigen, denn dies macht das Orthonormalisierungsverfahren von Schmidt (manchmal auch nach Gram und Schmidt benannt). Vor dem eigentlichen Verfahren ben¨ otigen wir allerdings noch etwas Theorie, durch die das zuvor Gesagte exakter wird.
Definition (Orthogonalbasis, Orthonormalbasis) Sei V ein K-Vektorraum mit einer Basis {b1 , . . . , bn }. Diese heißt Orthogonalbasis, wenn gilt: bi , bj = 0 falls i = j. Sie heißt Orthonormalbasis (ONB), wenn gilt: 1 falls i = j bi , bj = δij := 0 falls i = j. Wenn v , w orthogonal zueinander sind, schreiben wir auch: v ⊥w. uhrte KroneckerDas hier verwendete Symbol δij ist das bereits zuvor eingef¨ Symbol. Wir werden es hier nicht weiter verwenden. Da es sich allerdings einer großen Beliebtheit unter Mathematikern erfreut (es wurde ihm sogar eine Internetseite gewidmet), sollte es hier seinen Auftritt haben.
287
19.4 Orthonormalisierung nach Schmidt
Sind die bi orthogonal zueinander, aber so, dass nicht alle die L¨ ange 1 haben, liegt eine Orthogonalbasis vor. Es galt (und gilt noch immer) v , w = v w cos (v , w) . Daher: v ⊥ w ⇔ v , w = 0. Der Nullvektor 0 ist zu allen Vektoren orthogonal.
Beispiel und
1 0 , =1·0+0·1=0 0 1
2 1 2 2 0 2 2 2·2 2 · cos π = 1 · 1 · 0 = 0 . 0 1 2
19.4.1
Das Verfahren
Seien die linear unabh¨angigen Vektoren v1 , . . . , vn gegeben. • Der erste Vektor v1 wird lediglich normiert: u1 :=
v1 . v1
• Der zweite Vektor v2 wird bzgl. des ersten orthogonalisiert, also u∗2 := v2 − v2 , u1 u1 und wiederum normiert: u2 :=
u∗2 . u∗2
ur die n¨achsten Schritten verallgemeinern wir den vorigen Punkt lediglich: • F¨ Seien dazu u1 , . . . , ul bereits konstruiert, so wird der n¨ achste Vektor vl+1 zu den bisher konstruierten orthogonalisiert: u∗l+1 := vl+1 −
l
vl+1 , uj uj
j=1
und wiederum normiert: ul+1 :=
u∗l+1 . u∗l+1
288
19 Norm und Skalarprodukt
Wir wollen nun kurz zeigen, welche Idee hinter diesem Verfahren steckt: F¨ ur einen Vektor w mit w = 1 gilt x − x, w w
⊥
w
f¨ ur alle x ∈ V ,
denn x − x, w w, w = x, w − x, w w, w = x, w − x, w w, w = x, w − x, w w 2=0. = 1
Einen anderen Weg zur Erleuchtung bietet (hoffentlich) die folgende Skizze:
x
x − x, w w
x, w w
Das in der Skizze eingezeichnete Geradenst¨ uck wird von w aufgespannt. Aus der Kosinusformel x, w = xw cos (x, w) = x cos (x, w) ist ersichtlich, dass der auf dem Geradenst¨ uck eingezeichnete Vektor durch x, w w gegeben ist. Somit wird bei der Orthogonalisierung von x bzgl. w der Anteil von x, welcher in Richtung von w zeigt, gerade subtrahiert (also x − ¨ x, w w). Ubrig bleibt der senkrecht zu w stehende Anteil von x.
Beispiel Orthonormalisiere
1 , v1 = 0
1 v2 = . 1
Wir wollen nicht behaupten, dass dieses Beispiel schwierig ist. Sch¨ on daran ist allerdings, dass wir schon hier erahnen k¨onnen, was das Ergebnis sein muss,
289
19.5 Orthogonale Matrizen
damit wir Vertrauen in das Orthonormalisierungsverfahren von Schmidt fassen ¨ k¨onnen. Mehr Aufwand wird in den Ubungsaufgaben zu betreiben sein. Wenden wir nun aber zuerst hier an, was zuvor gelernt wurde: • u1 =
v1 v1
=
v1 1
1 = . 0
• Nun erfolgt die Orthogonalisierung u∗2 = v2 − v2 , u1 u1 1 1 1 1 1 1 0 = − , = −1· = 1 1 0 0 1 0 1 und schließlich das Normalisieren u2 =
u∗2 = u∗2
0 . 1
Das ist nun wirklich das, was zu erwarten war!
19.5
Orthogonale Matrizen
In Kapitel 16.6 u ¨ber besondere Matrizen hatten wir bereits kurz orthogonale Matrizen vorgestellt und u ¨ber die Gleichung AT A = En definiert. Diese wollen wir nun etwas genauer untersuchen. Zun¨ achst bemer¨ ken wir, um die folgenden Uberlegungen u ¨bersichtlicher zu gestalten, folgenden formalen Rechenzusammenhang zwischen dem Transponieren und dem Standardskalarprodukt: , v , w = v T · w wobei die rechte Seite der Gleichung als Matrixmultiplikation der einzeiligen bzw. einspaltigen Matrizen zu verstehen ist. Damit k¨ onnen wir leicht berechnen, wie sich das Standardskalarprodukt zweier Vektoren ¨ andert, wenn jene durch eine orthogonale Matrix A abgebildet werden: = v T AT Aw = v T En w = v Av , Aw = (Av )T · (Aw)
T
·w = v , w .
Da das Standardskalarprodukt die Standardnorm induziert, werden also von orthogonalen Matrizen weder Winkel noch L¨angen ver¨ andert! Insbesondere ist das Bild einer ONB unter einer orthogonalen Matrix wieder eine ONB.
290
19 Norm und Skalarprodukt
Beispiel Drehungen des R2 erhalten L¨angen und Winkel (alle Vektoren werden ja gleich weit gedreht). Eine Drehung um einen Winkel φ in mathematisch positivem Sinn ist gegeben durch die Drehmatrix cos φ − sin φ Rφ = . sin φ cos φ Wir wollen die Orthogonalit¨atsgleichung u ufen: ¨berpr¨ cos φ sin φ cos φ − sin φ T R φ Rφ = · − sin φ cos φ sin φ cos φ 2 2 − cos φ sin φ + sin φ cos φ cos φ + sin φ = − sin φ cos φ + cos φ sin φ sin2 φ + cos2 φ 1 0 = = E2 . 0 1
19.6
Aufgaben
1. (a) Normalisieren Sie die folgenden Vektoren: ⎛ ⎞ 1 2 , v2 = ⎝0⎠ , v1 = 1 1
⎛ ⎞ −1 v3 = ⎝ 0 ⎠ . 1
(b) Berechnen Sie den Winkel zwischen den Vektoren ⎛ ⎞ ⎛ ⎞ 2 1 v = ⎝−1⎠ und w = ⎝−1⎠ . 1 0 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 −1 3 2. Orthonormalisieren Sie die Vektoren v1 = ⎝1⎠, v2 = ⎝ 2 ⎠, v3 = ⎝1⎠. 1 0 1 ¨ 3. Uberpr¨ ufen Sie, dass ⎧ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫ 1 1 1 ⎬ ⎨ 1 1 1 b1 = √ ⎝−1⎠ , b2 = √ ⎝1⎠ , b3 = √ ⎝−1⎠ ⎩ 3 2 0 6 −2 ⎭ 1 eine Orthonormalbasis des R3 ist und berechnen Sie die Koeffizienten des ⎛ ⎞ 2 Vektors v = ⎝2⎠ als Linearkombination der Basisvektoren. 2
291
19.6 Aufgaben
4. (a) Die so genannte Betragssummennorm f¨ ur Vektoren v ∈ Rn ist definiert durch v 1 :=
n
|vk | .
k=1
Pr¨ ufen Sie daf¨ ur die Normeigenschaften. (b) Auf dem Vektorraum der stetigen Funktionen f : [0,1] → R ist das Standardskalarprodukt definiert durch #1 f, g :=
f (x)g(x) dx . 0
Pr¨ ufen Sie, ob es sich hierbei wirklich um ein Skalarprodukt handelt. 5. (a) Zeigen Sie, dass die Matrix R=
0 1
1 0
eine orthogonale Matrix ist. (b) Beschreiben Sie die Wirkung von R auf den R2 (Hinweis: R ist keine Drehung). 6. F¨ ur das Volumen eines Parallelepipeds, aufgespannt von den Vektoren ⎛
⎞ ⎛ ⎞ ⎛ ⎞ u1 v1 w1 u = ⎝u2 ⎠ , v = ⎝v2 ⎠ , w = ⎝w2 ⎠ ∈ R3 , u3 v3 w3 kennen wir bereits die Formel V (u, v , w) = | det(u, v , w)| . Zeigen Sie, dass das Volumen außerdem mittels V (u, v , w) = |u, (v × w)| berechnet werden kann.
292
19 Norm und Skalarprodukt
19.7
L¨ osungen
1. (a) Zur Normalisierung eines Vektors m¨ ussen wir diesen lediglich durch seine Norm teilen. √ 2 2 2 1 2 v1 2 = 22 + 1 2 = 5 =√ , v1 = 2 1 v1 5 1 ⎛ ⎞ ⎛ ⎞ 1 √ 2 1 2 1 v 2 = √ ⎝0⎠ , v2 = 2 ⎝0⎠ 2 = 12 + 02 + 12 = 2 v2 2 1 1 ⎛ ⎞ ⎛ ⎞ −1 2 −1 2 √ 1 v 3 = √ ⎝ 0 ⎠. , v3 = 2 ⎝ 0 ⎠ 2 = 2 v3 2 1 1 (b) Wir verwenden die Kosinusformel zur Winkelbestimmung. √ 3 3 v , w =√ √ = . cos α = v · w 2 6 2 Somit ist der Winkel
α = 30◦ .
2. Zun¨achst wird der erste Vektor normiert: ⎛ ⎞ 0 1 ⎝ ⎠ v1 1 . u1 = =√ v1 2 1 Der zweite Vektor ergibt sich nach Schmidt, indem wir v2 in die Ebene senkrecht zu u1 projizieren: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ −1 0 −1 1 2 u∗2 = v2 − v2 , u1 u1 = ⎝ 2 ⎠ − √ √ ⎝1⎠ = ⎝ 1 ⎠ 2 2 1 0 −1 und anschließend normieren: u2 =
u∗2 u∗2
⎛ ⎞ −1 1 =√ ⎝1⎠ . 3 −1
v3 muss senkrecht zu u1 und u2 projiziert werden: u∗3 = v3 − v3 , u1 u1 − v3 , u2 u2 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 3 0 −1 2 1 1 2 −3 ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ √ √ √ √ 1 − 1 1⎠ = 1 − = 2 2 3 3 1 1 −1 −1
293
19.7 L¨ osungen
und wiederum normiert werden: u3 =
u∗3 u∗3
⎛
⎞ 2 1 =√ ⎝1⎠ . 6 −1
Insgesamt bildet ⎧ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫ 0 −1 2 ⎬ ⎨ 1 1 1 √ ⎝1⎠ , √ ⎝ 1 ⎠ , √ ⎝ 1 ⎠ ⎩ 2 3 −1 6 −1 ⎭ 1 eine Orthonormalbasis. 3. Um eine Basis als Orthonormalbasis zu identifizieren, m¨ ussen wir zeigen, dass die Vektoren die L¨ange 1 haben und paarweise senkrecht zueinander sind. Aus Letzterem ergibt sich automatisch die lineare Unabh¨ angigkeit der Vektoren und drei linear unabh¨angige Vektoren des R3 bilden stets eine Basis dieses Vektorraumes. Die L¨angen- bzw. Normberechnung war bereits Gegenstand von Aufgabe 1 und soll hier nicht nochmals ausgef¨ uhrt werden. Auch sollte offensichtlich sein, dass die Skalarprodukte b1 , b2 , b1 , b3 , b2 , b3 jeweils Null sind, was die rechten Winkel zwischen den Vektoren beweist. Nun k¨onnen wir sehr einfach den Vektor v als Linearkombination der bi schreiben, denn die Koeffizienten ergeben sich durch v , bi : 2 4 −4 v = v , b1 b1 + v , b2 b2 + v , b3 b3 = √ b1 + √ b2 + √ b3 . 3 2 6 n 4. (a) Wir pr¨ ufen die drei Normeigenschaften f¨ ur v 1 := k=1 |vk | nach. v 1 ≥ 0 ist f¨ ur alle v ∈ Rn erf¨ ullt, da durch die Betr¨ age nur nichtnegative Zahlen addiert werden. Sobald auch nur eine Komponente von v ungleich Null ist, steht in der Summe ein positiver Summand; somit ist v 1 = 0 ⇔ v = 0 erf¨ ullt. Die Dreiecksungleichung u ¨bertr¨agt sich von der Dreiecksungleichung f¨ ur den Betrag: v + w 1=
n
|vk + wk | ≤
k=1
n
(|vk | + |wk |) =
k=1
n
|vk | +
k=1
1. = v 1 + w Und schließlich gilt f¨ ur alle α ∈ R und alle v ∈ V αv 1 =
n k=1
|αvk | =
n k=1
|α||vk | = |α|v 1 .
n k=1
|wk |
294
19 Norm und Skalarprodukt
(b) Nun m¨ ussen wir f¨ ur f, g :=
(1
f (x)g(x) dx die Skalarprodukteigen-
0
schaften nachweisen. # 1 # 1 f (x)(g + h)(x) dx = (f (x)g(x) + f (x)h(x)) dx f, g + h = #
0
= #
#
1
0
1
g(x)f (x) dx = g, f
0 1
0
# f, λg =
f (x)h(x) dx = f, g + f, h
0
f (x)g(x) dx = #
f, f =
1
f (x)g(x) dx + 0
f, g =
0
#
1
(f (x))2 dx ≥ 0 #
1
1
f (x)λg(x) dx = λ 0
f (x)g(x) dx = λf, g 0
Soweit, so gut. Das gr¨oßte Problem — und das ist h¨ aufig der Fall — bereitet die Eigenschaft f, f = 0 ⇔ f ≡ 0, also #
1
(f (x))2 dx = 0
⇔
0
f ≡0.
K¨onnte es nicht eine Funktion ungleich der Nullfunktion geben, deren Abweichungen von Null so gering sind, dass sie keine Auswirkung bei der Integration haben? Solche Funktionen gibt es in der Tat, beispielsweise ist f¨ ur f : [0,1] → R mit f (0) = 1 und f (x) = 0 f¨ ur x > 0 das obige Integral Null. Wir haben uns aber in der Aufgabenstellung auf stetige Funktionen eingeschr¨ankt und f¨ ur solche funktioniert dieser Trick nicht. Ein Ausreißer“ wie f (0) = 1 bedeutet n¨ amlich bei ” stetigen Funktionen, dass die Funktion in einer ganzen Umgebung um den Urbildpunkt — hier 0 — ¨ahnliche Werte annimmt wie beim Urbildpunkt selbst und damit, sei diese Umgebung auch noch so klein, wird das Integral in jedem Fall ein positives Ergebnis liefern, es sei denn, f ist wirklich u ¨berall Null. 5. (a)
T
R R=
0 1
1 0 · 0 1
1 0
=
1 0
0 = E2 1
(b) R ist eine Spiegelung des R2 an der Winkelhalbierenden: R bildet einen Vektor ( ab ) auf den Vektor ( ab ) ab. Einzig Vielfache des Vektors ( 11 ) werden auf sich selbst abgebildet. Weiterhin liegt ( 11 ) senkrecht auf der Differenz ( ab ) − ( ab ):
1 b a , − = 1(b − a) + 1(a − b) = 0 . 1 a b
295
19.7 L¨ osungen
6. Bei dieser Aufgabe m¨ ussen wir lediglich die Gleichheit det(u, v , w) = u, (v × w) nachweisen. Die rechte Seite ist ⎞ ⎛ ⎞ ⎛ u1 v2 w3 − v3 w2 u, (v × w) = ⎝u2 ⎠ , ⎝v3 w1 − v1 w3 ⎠ u3 v1 w 2 − v2 w 1 = u1 (v2 w3 − v3 w2 ) + u2 (v3 w1 − v1 w3 ) + u3 (v1 w2 − v2 w1 ) und die linke Seite u1 det(u, v , w) = u2 u 3
nach Sarrus v1 w1 v2 w2 v3 w3
= u1 v 2 w 3 + u 3 v 1 w 2 + u 2 v 3 w 1 − u 3 v 2 w 1 − u 1 v 3 w 2 − u 2 v 1 w 3 . Nun ist zu sehen, dass beide Seiten gleich sind.
296
19 Norm und Skalarprodukt
Fragen • Welche Eigenschaften hat eine Norm? • Geben Sie (wenigstens) zwei Beispiele f¨ ur eine Norm auf einem entsprechend von Ihnen gew¨ahlten Vektorraum an. • Wie lautet das Standardskalarprodukt auf dem Rn und wie erh¨ alt man auf dessen Basis die Standardnorm? • Wie lassen sich Winkel zwischen Elementen eines Vektorraumes berechnen? • Verdeutlichen Sie mit der Hilfe einer Skizze die Funktionsweise des Orthonormalisierungsverfahrens von Schmidt. • Welche besonderen Eigenschaften haben orthogonale Matrizen?
20 Basiswechsel und darstellende Matrizen
20.1
Motivation
Wir haben gelernt, dass ein Vektor stets aus den Elementen einer Basis linear kombiniert, also bez¨ uglich einer Basis dargestellt werden kann. H¨ aufig wird daf¨ ur im Rn die Standardbasis verwendet. Ihre Elemente sind zueinander orthogonal und haben alle die L¨ange 1 bez¨ uglich der Standardnorm, sie bilden also eine ONB. Mit ihnen haben wir ein komfortables und einfaches Grundger¨ ust f¨ ur ein Koordinatensystem, in welchem dann Skizzen angefertigt und Koordinaten von Vektoren angegeben werden k¨ onnen. Wir k¨onnen aber nicht immer davon ausgehen, dass diese freundliche Standardbasis f¨ ur den Rn gegeben ist, es haben ja auch andere Basen ihre Berechtigung. Ferner ist der Rn nicht der einzige Vektorraum, den es zu untersuchen gilt. Beim Vektorraum der Polynome z. B. k¨onnen wir nicht mehr aus der Anschauung heraus sagen, welche Basis denn nun am besten ist, denn wir k¨ onnen uns diese nicht einfach vorstellen. Nat¨ urlich sind wir in der Lage, nach dem zuvor Gelernten alle m¨oglichen Basen durch das Orthonormalisierungsverfahren von Schmidt zu einer ONB zu machen, aber das ist teils auch ein geh¨ origer Aufwand. Beispielsweise muss ein Ingenieur damit rechnen, dass ein Kollege seine Messungen in einem bestimmten Koordinatensystem durchf¨ uhrt, welches ihm am besten gef¨allt. Wir k¨onnen seine Ergebnisse nicht ohne weiteres f¨ ur unsere Rechnungen u ¨bernehmen, wenn wir nicht sicher sind, dass er das gleiche Koordinatensystem verwendet. Wir m¨ ussen also ohne Informationsverluste die Basis (und damit das Koordinatensystem) wechseln k¨ onnen. Dieses Beispiel ist recht grob gestrickt, beleuchtet aber doch im Kern die Notwendigkeit, nach Belieben die Basen wechseln zu k¨onnen. Dies macht uns unabh¨ angig vom Diktat einer zuvor fixierten Basis. Nachfolgend wird die Forderung nach dem Wechsel zu vermeintlich nicht attraktiven Basen besonders deutlich. Es wird sich n¨ amlich herausstellen, dass Matrizen teils dann sehr sch¨on — d. h. hier zu Diagonalmatrizen — werden, © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_20
298
20 Basiswechsel und darstellende Matrizen
wenn wir sie bzgl. der Basis darstellen, die von ihren Eigenvektoren gebildet wird. Das ist im Moment noch Zukunftsmusik, allerdings ein wesentlicher Grund daf¨ ur, dass es sich wirklich lohnt, die Basis ab und an zu wechseln. Beim Thema Matrizen haben wir nun gleich wieder einen Grund, uns u ¨ber die gew¨ahlte Basis Gedanken zu machen. Bitte rufen Sie sich ins Ged¨ achtnis, dass wir eine lineare Abbildung bez¨ uglich einer festen Basis stets eindeutig als Matrix darstellen k¨onnen. Wenn wir die gleiche lineare Abbildung nun aber bez¨ uglich einer anderen Basis darstellen? Dann m¨ ussen wir wiederum etwas andern. ¨
20.2
Koordinatenabbildungen und Koordinatenvektoren
Bevor wir zum Kern der Sache vordringen, starten wir mit einer kurzen Erinnerung. Sei V ein K-Vektorraum, dim V = n, B = {b1 , . . . , bn } eine Basis von V . Dann gilt f¨ ur alle v ∈ V : n v = λibi i=1
mit eindeutig bestimmten λi ∈ K. Daher l¨asst sich V auf Kn abbilden: F¨ ur B wie zuvor heißt ⎛ ⎞ λ1 n ⎟ ⎜ n KB : V → K , v = λibi → ⎝ ... ⎠ =: λ i=1 λn die Koordinatenabbildung von V bzgl. B. Der Vorteil der Koordinatenabbildung sollte bereits jetzt klar sein: Jedes Element eines Vektorraumes mit gegebener Basis kann mit der Hilfe dieser Abbildung zu einem einfachen Koordinatenvektor, n¨amlich dem gerade eingef¨ uhrten λ ∈ Kn , gemacht werden, egal wie kompliziert oder abstrakt der Vektorraum sein mag. Mit dem Kn befinden wir uns dann in einem recht vertrauten Gebiet. W¨ahlen wir den K-Vektorraum V jedoch zu Kn selbst, so funktioniert das Verfahren nat¨ urlich auch, aber dann muss besonders exakt darauf geachtet werden, bzgl. welcher Basis ein Vektor dargestellt ist. Weiteres in Abschnitt 20.4.
299
20.2 Koordinatenabbildungen und Koordinatenvektoren
Beispiel
1 3 Seien A = ein 3 2 1 B := b1 := 1
Element des Vektorraumes M (2 × 2, R) und 0 1 , b2 := 0 0
1 0 , b3 := 0 0
eine Basis desselben. Was ist KB (A)? Es ist 4 λ1 + λ2 λk b k = A= λ1 k=1
⇒
λ2 + λ3 λ3 + λ4
1 0 , b4 := 1 0
0 1
λ1 + λ2 = 1, λ2 + λ3 = 3, λ1 = 3, λ3 + λ4 = 2
⇒
λ1 = 3, λ2 = −2, λ3 = 5, λ4 = −3 ⎛ ⎞ 3 ⎜−2⎟ ⎟ ⇒ KB (A) = ⎜ ⎝5⎠ −3
F¨ ur eine andere Basis, 1 B := b1 := 0
z. B. 0 1 , b2 := 0 0
1 1 , b3 := 0 1
1 1 , b4 := 0 1
1 1
,
ist A=
4 k=1
⇒ ⇒ ⇒
λ 1 λ 1
λ kb k =
λ 1 + λ 2 + λ 3 + λ 4 λ 3 + λ 4
λ 2 + λ 3 + λ 4 λ 4
+ λ 2 + λ 3 + λ 4 = 1, λ 2 + λ 3 + λ 4 = 3, λ 3 + λ 4 = 3, λ 4 = 2
= −2, λ 2 = 0, λ 3 = 1, λ 4 = 2 ⎛ ⎞ −2 ⎜0⎟ ⎟ KB (A) = ⎜ ⎝1⎠ 2
Damit ist KB (A) = KB (A) und es wird deutlich, dass das Ergebnis von der jeweils gew¨ahlten Basis abh¨angt.
20.2.1
Das Geschehen im Diagramm
Selbstverst¨andlich wollen wir solch eine Rechnung wie im vorigen Beispiel nicht f¨ ur jeden zu betrachtenden Vektor durchf¨ uhren. Vielmehr suchen wir im Folgenden die Abbildungsvorschrift, welche den Koordinatenvektor bzgl. der einen Basis B auf den Koordinatenvektor bzgl. der anderen Basis B abbildet. Auch
300
20 Basiswechsel und darstellende Matrizen
diese Abbildung ist wieder linear, wie dem folgenden Diagramm zu entnehmen ist: V KB
KB
Kn
~
S
/ Kn
Die gesuchte Abbildung S ist n¨amlich die Hintereinanderausf¨ uhrung der linearen Koordinatenabbildungen: −1 . S = KB ◦ KB
Dabei k¨onnen wir S leicht bestimmen, indem wir die Basisvektoren bk von B bzgl. der Basis B darstellen, also KB (bk ) berechnen. Denn wegen KB (bk ) = ek ist S(ek ) = KB (K −1 (ek )) = KB (bk ) B
und jeden anderen Vektor k¨onnen wir wiederum als Linearkombination der ek abbilden.
Beispiel Als Fortsetzung des vorigen Beispiels erhalten wir f¨ ur KB (bk ) ⎛
⎞ 1 ⎜−1⎟ ⎟ KB (b1 ) = ⎜ ⎝ 1 ⎠ , KB ( b 2 ) 0
⎛ ⎞ ⎛ ⎞ 0 −1 ⎜1⎟ ⎜1⎟ ⎟ ⎜ ⎟ =⎜ ⎝0⎠ , KB (b3 ) = ⎝−1⎠ , KB (b4 ) 0 1
⎛
⎞ 0 ⎜0⎟ ⎟ =⎜ ⎝−1⎠ . 1
asenDemnach wird S bzgl. der Standardbasis des R4 von folgender Matrix repr¨ tiert: ⎛ ⎞ 1 0 −1 0 ⎜−1 1 1 0⎟ ⎜ ⎟ ⎝ 1 0 −1 −1⎠ . 0 0 1 1 Wir testen dies kurz an den beiden ⎛ 1 0 −1 ⎜−1 1 1 S(KB (A)) = ⎜ ⎝ 1 0 −1 0 0 1
Koordinatenvektoren von A: ⎞⎛ ⎞ ⎛ ⎞ 0 3 −2 ⎜−2⎟ ⎜ 0 ⎟ 0⎟ ⎟ ⎜ ⎟ = ⎜ ⎟ = KB (A) . −1⎠ ⎝ 5 ⎠ ⎝ 1 ⎠ 1 −3 2
301
20.3 Darstellung linearer Abbildungen durch Matrizen
20.3
Darstellung linearer Abbildungen durch Matrizen
Wir haben bereits im Kapitel u ¨ber lineare Abbildungen gelernt, wie wir zu einer gegebenen linearen Abbildung die Matrixdarstellung finden. Wir wollen dies hier unter Verwendung der Koordinatenabbildung nochmals beleuchten und definieren, was genau unter der darstellenden Matrix verstanden wird. Dies bringt uns zuerst nichts dramatisch Neues, ist aber ein erster Schritt, wenn wir lineare Abbildungen bzgl. verschiedener Basen darstellen wollen.
Definition (darstellende Matrix) Seien L : V → V , dim V = n und B = {b1 , . . . , bn } Basis von V . Dann heißt −1 LB := KB ◦ L ◦ KB
die darstellende Matrix von L bzgl. B.
Dies f¨allt nicht vom Himmel, sondern basiert auf dem folgenden einfachen Diagramm, aus dem sich alles ablesen l¨asst: V
L
KB
Kn
/V
KB
LB
/ Kn
Beispiel Als V betrachten wir R≤2 [x], den R-Vektorraum der reellwertigen Polynome maximal zweiten Grades. Dies ist ein dreidimensionaler Vektorraum; eine Basis ist beispielsweise ! B := b1 = 1, b2 = x + 1, b3 = x2 + x . Bez¨ uglich B wollen wir nun die darstellende Matrix der linearen Abbildung L := R≤2 [x] → R≤2 [x] , ermitteln.
p(x) → x ·
dp (x) dx
302
20 Basiswechsel und darstellende Matrizen
Aus dem Diagramm zur darstellenden Matrix wird nun L
R≤2 [x] KB
R3
/ R≤2 [x] KB
LB
/ R3
wobei die Koordinatenabbildung KB die Basisvektoren von B in gegebener Reihenfolge auf die Standardbasisvektoren des R3 abbildet. Als Umkehrabbildung −1 genau das Gegenteil: macht KB KB (bi ) = ei
bzw.
−1 KB (ei ) = bi .
Nun sind die Spaltenvektoren einer Matrix genau die Bilder der Standardbasis−1 zu berechnen, brauchen wir somit nur jene vektoren. Um LB := KB ◦ L ◦ KB Vektoren durch die Hintereinanderausf¨ uhrungen zu schicken: Zun¨ achst werden −1 auf die bi abgebildet (siehe oben). Die die Standardbasisvektoren durch KB bi werden dann von L folgendermaßen verarbeitet: L(b1 ) = L(1) = x · (1) = 0 , L(b2 ) = L(x + 1) = x · (x + 1) = x , L(b3 ) = L(x2 + x) = x · (x2 + x) = 2x2 + x . Um letztlich zu berechnen, worauf diese Polynome von KB abgebildet werden, stellen wir sie als Linearkombination der bi dar, denn KB (bi ) kennen wir:
0 KB 0 = 0 · b1 + 0 · b2 + 0 · b3 −→ 0 · e1 + 0 · e2 + 0 · e3 = 0 , 0
−1 KB , x = −1 · b1 + 1 · b2 + 0 · b3 −→ −1 · e1 + 1 · e2 + 0 · e3 = 1
1 0 KB 1 · e1 − 1 · e2 + 2 · e3 = −1 . 2x2 + x = 1 · b1 − 1 · b2 + 2 · b3 −→ 2
Zusammengesetzt erhalten wir f¨ ur die ⎛ 0 LB = ⎝0 0
darstellende Matrix ⎞ −1 1 1 −1⎠ . 0 2
20.4
Matrixtransformation bei einem Basiswechsel
Wir sind in gewisser Weise beim Finale, denn wir sehen auf der Grundlage der bisherigen m¨ uhevollen Arbeit gleich, wie der Basiswechsel konkret durch-
303
20.4 Matrixtransformation bei einem Basiswechsel
gef¨ uhrt wird. Wir fassen dazu die Diagramme aus 20.2.1 und 20.3 zusammen und vervollst¨andigen das Ergebnis noch. Wir erhalten: L
V KB1
Kn
KB2
} Kn
/V KB1
LB1
/ Kn
S
KB2
! / Kn
S LB2
Offensichtlich ist wie zuvor −1 S = KB2 ◦ KB , 1
was sich sofort aus dem Diagramm ersehen l¨asst. Aus dem unteren Teil n / Kn K = LB1 S −1
S
Kn
! / Kn
LB2
lesen wir ab:
LB2 = S ◦ LB1 ◦ S −1 .
Ist nun eine Matrix X als lineare Abbildung bzgl. einer Basis B1 gegeben und wollen wir sehen, wie die entsprechende Matrix Y f¨ ur eine Basis B2 aussieht, so haben wir Y = SXS −1 . Die Verkn¨ upfung linearer Abbildungen wird ja gerade durch das Matrixprodukt ausgedr¨ uckt.
Beispiel Sei eine lineare Abbildung L : R2 → R2 gegeben durch ihre darstellende Matrix 0 1 M1 := 1 0 bzgl. der Standardbasis B1 des R2 . Wie lautet die darstellende Matrix M2 von L bzgl. der Basis
2 1 B2 := b1 = , b2 = ? 0 1 Obiges Diagramm wird zu S −1
R2
>R
2 M1
/ R2 S
M2
/ R2
304
20 Basiswechsel und darstellende Matrizen
und M2 werden wir durch das Matrixprodukt M2 = SM1 S −1 berechnen, zun¨achst aber zu den Matrizen S und S −1 : Ein Koordinatenvektor ( ab ) bzgl. der Basis B2 entspricht bzgl. der Standardbasis B1 dem Koordinatenvektor 2 1 2a + b 2 1 a a +b = = . 0 1 b 0 1 b Diese Abbildung der Koordinatenvektoren bzgl. der unterschiedlichen Basen wird gerade von S −1 bewirkt, wir erhalten also 1 − 12 2 1 −1 2 . und daraus S = S = 0 1 0 1 Schließlich erhalten wir 1 0 − 12 M2 = 2 0 1 1
1 0
2 0
1 1
1 =
− 12 1
2
0
0 2
1 −1 = 1 2
0 . 1
Wir k¨onnen also ohne Probleme die Basis verwenden, die sinnvoll ist oder uns aufgezwungen wird. Damit haben wir das Wesentliche geschafft und auch bereits einiges an Rechnungen zu diesem Thema gesehen. Insbesondere haben wir die Matrix S schon in einem konkreten Fall ermittelt. Alle Zutaten sind vorhanden. Allerdings erscheint der Patient (die letzte Gleichung) noch etwas blutleer. In diesem Zustand wollen wir ihn an dieser Stelle — ohne b¨ ose Absicht — belassen, denn schon im n¨achsten Abschnitt geht es um die bereits versprochene Diagonalisierung, womit wir dann frisches Leben in die zuletzt gesehene Gleichung bringen. In Ihnen regt sich vielleicht die Frage, warum unsere Abbildung L in den Diagrammen stets von V nach V — jeweils mit der gleichen Basis versehen — geht. Dies muss nicht so sein! Sie kann auch durchaus von V in einen anderen Vektorraum W abbilden. Wir werden daher abschließend das entsprechende Diagramm f¨ ur den allgemeineren Fall vorstellen. Mit dem bisher Gelernten ist es kein Problem, die entsprechenden Gleichungen f¨ ur einen Basiswechsel aufzustellen. Sie m¨ ussen nur wie zuvor den Abbildungspfeilen folgen. /W
L
V
KB ˜
KB1
Kn
KB2
1
˜ B
LB1
/ Kn˜
KB ˜
2
1
K
}
˜ S
S
n
˜ B
LB2 2
! / Kn˜
305
20.5 Aufgaben ˜
Bi Dabei ist LB die darstellende Matrix der Abbildung L : V → W f¨ ur den Fall, i ˜ dass V die Basis Bi und W die Basis Bi hat. Ferner lesen wir mit Freude und Leichtigkeit ab: ˜2 ˜1 B −1 = S˜ LB . LB B1 S 2
20.5
Aufgaben
1. Bestimmen Sie jeweils den Koordinatenvektor von p: K → K
,
p(x) = 3x2 − 4x + 2
(aufgefasst als Vektor im Vektorraum der Polynome maximal zweiten Grades) bez¨ uglich der Basis (a) B1 = q1 (x) = x2 , q2 (x) = x, q3 (x) = 1 , (b) B2 = q1 (x) = (x + 1)2 , q2 (x) = x, q3 (x) = 1 , (c) B3 = q1 (x) = x2 + x, q2 (x) = x + 1, q3 (x) = 1 + x2 . 2. Bestimmen Sie die darstellende Matrix LBi der linearen Abbildung x + 3y L : R2 → R2 , L(x, y) = 2x − y bez¨ uglich folgender Basen
1 0 , (Standardbasis), (a) B1 = 0 1
1 2 (b) B2 = , , 1 1
−1 0 , . (c) B3 = 0 1 Berechnen Sie weiterhin die Determinanten dieser darstellenden Matrizen. 3. Eine lineare Abbildung L : R2 → R2 sei gegeben durch ihre darstellende Matrix
1 2 1 1 bez¨ uglich der Basis B = , . LB = −2 3 1 −1 Auf welche Vektoren werden die Standardbasisvektoren (10) und (01) durch L abgebildet? Wie lautet die Abbildungsvorschrift von L?
306
20 Basiswechsel und darstellende Matrizen
4. Die Drehung im R3 um einen Winkel α um die z-Achse ist eine lineare Abbildung. Diese ist gegeben durch die Matrix ⎛ ⎞ cos α − sin α 0 R = ⎝ sin α cos α 0⎠ (darstellende Matrix bzgl. der Standardbasis). 0 0 1 Bestimmen Sie eine Drehung um den gleichen Winkel um die Achse, deren 1 Richtung durch den Vektor 1 gegeben ist. 1
20.6
L¨ osungen
1. Zur Berechnung des Koordinatenvektors m¨ ussen wir p als Linearkombination der jeweiligen Basisvektoren darstellen. (a) In diesem Fall ist die Linearkombination offensichtlich: p(x) = 3 · x2 + (−4) · x + 2 · 1 .
3 Somit ist der Koordinatenvektor KB1 (p) = −4 . 2
(b) Wir suchen die Darstellung p(x) = 3 · x2 + (−4) · x + 2 · 1 !
= a · (x + 1)2 + b · x + c · 1 = a · x2 + (2a + b) · x + (a + c) · 1. Koeffizientenvergleich ergibt a=3, b = −4 − 2a = −10 , c = 2 − a = −1 ,
und der Koordinatenvektor lautet KB2 (p) =
3 −10 −1
.
(c) p(x) = 3 · x2 + (−4) · x + 2 · 1 !
= a · (x2 + x) + b · (x + 1) + c · (1 + x2 ) = (a + c) · x2 + (a + b) · x + (b + c) · 1 Koeffizientenvergleich ergibt a+c=3 a + b = −4 b+c=2
3 2 5 b=− 2 9 c= 2
a=− ⇒
307
20.6 L¨ osungen
und der Koordinatenvektor lautet KB3 (p) =
−1,5 −2,5 4,5
.
2. Wir bearbeiten alle drei F¨alle gleichzeitig. Die erste Spalte der darstellenden Matrix erhalten wir, indem wir den ersten Basisvektor durch L abbilden und das Ergebnis als Koordinatenvektor schreiben: 1 1 (a) L(1,0) = , das entspricht dem Koordinatenvektor ; 2 2 4 −2 (b) L(1,1) = , das entspricht dem Koordinatenvektor ; 1 3 1 −1 , das entspricht dem Koordinatenvektor . (c) L(−1,0) = −2 −2 Die zweite Spalte der darstellenden Matrix erhalten wir, indem wir den zweiten Basisvektor durch L abbilden und das Ergebnis als Koordinatenvektor schreiben: 3 3 (a) L(0,1) = , das entspricht dem Koordinatenvektor ; −1 −1 1 5 ; (b) L(2,1) = , das entspricht dem Koordinatenvektor 2 3 3 −3 , das entspricht dem Koordinatenvektor . (c) L(0,1) = −1 −1 Nun m¨ ussen wir nur noch die darstellenden Matrizen aus den jeweiligen Koordinatenvektoren zusammensetzen: 1 3 , mit det(LB1 ) = −7; (a) LB1 = 2 −1 −2 1 , mit det(LB2 ) = −7; (b) LB2 = 3 2 1 −3 , ebenfalls mit det(LB3 ) = −7. (c) LB3 = −2 −1 Die Determinante hat in allen drei F¨allen den gleichen Wert. Dieses Ph¨anomen l¨asst sich verallgemeinern: Die Determinante der darstellenden Matrix ist unabh¨angig von der Wahl der Basis, bez¨ uglich der die darstellende Matrix angegeben wird. Die Determinante ist vielmehr eine Gr¨oße der linearen Abbildung selbst.
1 3. Die Koordinatenvektoren zu (10) und (01) bez¨ uglich der Basis B sind 21 2
1 und −21 . Diese werden durch die darstellende Matrix auf die Koordi2 natenvektoren 1 3 1 1 1 2 1 2 −2 2 2 2 = und = 1 1 1 5 −2 3 − − −2 3 2 2 2 2
308
20 Basiswechsel und darstellende Matrizen
abgebildet. Daraus erhalten wir schließlich die gesuchten Bildvektoren: 3 1 1 1 1 1 5 1 2 −3 + = und − − = . 1 2 2 1 2 −1 2 1 2 −1 Zusammengefasst ist 2 L(1,0) = 1
und
L(0,1) =
−3 2
und wegen der Linearit¨at von L k¨onnen wir daraus die gesamte Abbildungsvorschrift ableiten: 2 −3 2x − 3y L(x, y) = x · L(1,0) + y · L(0,1) = x · +y· = . 1 2 x + 2y 4. F¨ ur diese Aufgabe w¨ahlen wir uns zun¨achst ein passendes Koordinatensystem (bzw. eine geeignete Basis), indem wir das alte Koordinatensystem derart kippen, dass die z-Achse auf die neue Drehachse f¨ allt. Dabei m¨ ussen sowohl die Orientierung der Basisvektoren als auch die Eigenschaft, orthonormal zu sein, erhalten bleiben. Und welche Methode w¨ are geeigneter zur Konstruktion einer solchen als das Orthonormalisierungsverfahren nach Schmidt aus dem vorigen Kapitel? Wir verwenden das Verfahren wie dort beschrieben, allerdings drehen wir die Nummerierung um, da in der Aufgabenstellung der letzte Basisvektor vorgegeben ist und nicht der erste. Als neue Basis ergibt sich dann ⎧ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫ 1 −1 1 ⎬ ⎨ 1 1 1 B := b1 := √ ⎝ 0 ⎠ , b2 := √ ⎝ 2 ⎠ , b3 := √ ⎝1⎠ . ⎩ 2 −1 6 −1 3 1 ⎭ ¨ Bitte rechnen sie dies als Ubung selbst noch einmal nach und u ¨berzeugen Sie sich davon, dass diese Basis wirklich positiv orientiert ist. (W¨ are dies nicht so, m¨ ussten wir noch die Reihenfolge der letzten beiden Basisvektoren vertauschen.) Die gesuchte Drehmatrix wird recht kompliziert aussehen. Relativ einfach ist hingegen die darstellende Matrix bez¨ uglich der Basis B. Diese hat n¨amlich die gleiche Gestalt wie die Matrix, welche um die z-Achse dreht, denn die ei sind ja die Koordinatenvektoren der bi bzgl. B. Somit ist LB = R. uglich Nun m¨ ussen wir nur noch die Abbildungsvorschrift von LB = R bez¨ der Basis B bestimmen. Im entsprechenden Diagramm R3
LE =?
S
R3
~ LB =R
/ R3 `
S −1
/ R3
309
20.6 L¨ osungen
ist dies S −1 RS, wobei sich S −1 aus den bi zusammensetzt, da unsere Ausgangsbasis die Standardbasis ist: ⎞ ⎛ 1 ⎞ ⎛ 1 −1 −1 √ √ √1 √ √ 0 2 ⎜ −12 √2 ⎜ 2 √26 √13 ⎟ −1 ⎟ √ und S = ⎝ √ S −1 = ⎝ 0 6 3⎠ 6 6 6⎠ −1 √ 2
−1 √ 6
√1 3
√1 3
√1 3
√1 3
S muss hier gl¨ ucklicherweise nicht durch Invertieren von S −1 berechnet werden, sondern lediglich durch Transponieren, denn S −1 ist aufgrund unserer Konstruktion eine orthogonale Matrix (siehe Kapitel 16.6). Schließlich ist LE = S −1 RS ⎛ 2 cos√α + 1 1⎝ = − cos α + √3 sin α + 1 3 − cos α − 3 sin α + 1
und L(x, y, z) = LE
x y z
√ − cos α − 3 sin α + 1 2 cos√α + 1 − cos α + 3 sin α + 1
die gesuchte Drehung.
√ ⎞ − cos α + √3 sin α + 1 − cos α − 3 sin α + 1⎠ 2 cos α + 1
310
20 Basiswechsel und darstellende Matrizen
Fragen • Was ist ein Koordinatenvektor, wie berechnet man einen solchen und was ist zu seiner Berechnung u otig? ¨berhaupt im Vorfeld n¨ • Zeigen Sie anhand eines Diagramms, wie die darstellende Matrix einer linearen Abbildung L : V → V berechnet wird. • Wie ergibt sich jeweils eine der in diesem Diagramm vorkommenden Abbildungen als Komposition der anderen Abbildungen? • Verdeutlichen Sie Ihr beschriebenes Vorgehen an einem Beispiel. • Wie ¨andert sich die darstellende Matrix bei einem Basiswechsel?
21 Eigenwerte, Eigenvektoren und Diagonalisierbarkeit
21.1
Motivation
Neben der Determinante sind Eigenwerte und Eigenvektoren die wichtigsten Charakteristika linearer Abbildungen. Auf Eigenvektoren wirken lineare Abbildungen besonders einfach, n¨amlich lediglich als Streckung oder Stauchung. Dies macht es uns m¨oglich, eine lineare Abbildung durch die Bestimmung ihrer Eigenwerte und Eigenvektoren sehr einfach zu veranschaulichen. Entsprechend vereinfacht sich auch die Matrixrepr¨ asentation einer linearen Abbildung, wenn wir eine Basistransformation bez¨ uglich ihrer Eigenvektoren vornehmen. Beispielsweise wird durch die beiden Matrizen 1 2 −3 0 A= und B = 4 −1 0 3 die gleiche lineare Abbildung dargestellt, wobei Matrix B bez¨ uglich ihrer Eigenvektoren dargestellt ist. Die genaue Vorgehensweise dieser Transformation werden wir im Abschnitt u ¨ber Diagonalisierung notieren. Dazu empfehlen wir allerdings, sich die Erkenntnisse aus dem Kapitel u ¨ber Basiswechsel und darstellende Matrizen wieder ins Ged¨achtnis zu rufen.
21.2
Grundlagen
Definition (Eigenwert, Eigenvektor) Seien V ein K-Vektorraum und L : V → V linear. Eine Zahl λ ∈ K heißt Eigenwert (EW) von L zum Eigenvektor (EV) v , wobei v = 0 ist, wenn Lv = λv
(Eigenwertgleichung)
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_21
312
21 Eigenwerte und Eigenvektoren
ist, also wenn v durch L auf das λ-Fache von sich selbst abgebildet wird.
Der Nullvektor wird bei der Eigenvektordefinition ausgenommen, denn er w¨ urde obige Eigenwertgleichung f¨ ur jedes λ ∈ K erf¨ ullen. Es ist jedoch f¨ ur die nachfolgende Theorie wichtig, dass jedem Eigenvektor ein eindeutiger Eigenwert zugeordnet werden kann.
Beispiel R≤n [x] haben wir bereits als den R-Vektorraum der reellwertigen Polynome vom maximalen Grad n kennen gelernt. Seine Vektoren haben die Form p(x) = an xn + an−1 xn−1 + . . . + a1 x + a0 ,
a0 , . . . , a n ∈ R .
Die Standardbasis des R≤n [x] wird von den Monomen pk (x) = xk gebildet. Sei auf diesem Vektorraum eine lineare Abbildung L : R≤n [x] → R≤n [x] definiert durch dp , p ∈ R≤n [x] . L(p) := x · dx Bitte u ufen Sie kurz die Linearit¨atseigenschaften sowie die Abgeschlos¨berpr¨ senheit der Abbildung (d. h, dass jedes Polynom maximal n-ten Grades auf dp ist ein Polynom maximal n-ten Grades abgebildet wird). Zur Erinnerung: dx lediglich eine andere Schreibweise f¨ ur p . Wir untersuchen nun die Abbildung L auf Eigenvektoren und betrachten dazu die Monome pk (x) = xk : L(pk ) = x(kxk−1 ) = kxk = kpk
f¨ ur k > 0, und
L(p0 ) = x · 0 = 0 · p0 .
ater genauer Somit ist pk Eigenvektor von L zum Eigenwert k. Wie wir sp¨ sehen werden, hat die Matrix zu L bez¨ uglich dieser Standardbasis die besonders einfache Gestalt ⎛ ⎞ 0 0 ... 0 ⎜ .. ⎟ ⎜0 1 .⎟ ⎜ ⎟ . ⎜. ⎟ .. ⎝ .. . 0⎠ 0 ... 0 n Nat¨ urlich ist mit v auch αv , α = 0, Eigenvektor zum gleichen Eigenwert, denn auch daf¨ ur gilt aufgrund der Linearit¨at obige Gleichung L(αv ) = αLv = αλv = λ(αv ) . Somit geh¨ort zu einem Eigenwert λ gleich ein ganzer Untervektorraum von Eigenvektoren, der so genannte Eigenraum zum Eigenwert λ.
313
21.2 Grundlagen
Definition (Eigenraum) Sei V ein K-Vektorraum, L : V → V linear und λ Eigenwert von L. Dann heißt Vλ := {v ∈ V | Lv = λv } ⊂ V Eigenraum von L zum Eigenwert λ. Die Dimension dim (Vλ ) des Eigenraumes wird als geometrische Vielfachheit des Eigenwertes λ bezeichnet. Wir werden sp¨ater erneut etwas zur geometrischen Vielfachheit sagen. Gibt es gar mehrere linear unabh¨angige Eigenvektoren v1 , . . . , vk zum gleichen Eigenwert λ, so sind s¨amtliche Linearkombinationen dieser Vektoren ebenfalls Eigenvektoren zu λ und der Eigenraum ist gleich dem Spann der vi . Anders herum sind Eigenvektoren zu unterschiedlichen Eigenwerten linear unabh¨ angig. Geometrisch bedeutet die Eigenwertgleichung nichts anderes als eine Streckung bzw. Stauchung von v um den Faktor λ. Hat λ ein negatives Vorzeichen, kommt noch eine Richtungsumkehr hinzu. All dies u agt sich auf den gesamten ¨bertr¨ Eigenraum von λ.
Beispiel Sei V ein euklidischer Vektorraum, also ein R-Vektorraum mit Standardskalarprodukt. Lineare Abbildungen L : V → V mit der Eigenschaft Lv , Lv = v , v
f¨ ur alle v ∈ V
werden als so genannte orthogonale Abbildungen bezeichnet. Definieren wir wie u ¨blich durch das Skalarprodukt eine Norm v 2 := v , v , so wird aus dieser Eigenschaft die L¨angenerhaltung Lv = v
f¨ ur alle v ∈ V .
Anschaulich erf¨ ullen sowohl Drehungen als auch Spiegelungen diese Bedingung. Die Drehmatrix ⎛ ⎞ cos φ − sin φ 0 R = ⎝ sin φ cos φ 0⎠ 0 0 1 als Drehung des R3 um die z-Achse haben wir bereits in den Aufgaben zum Kapitel u ¨ber Matrizen kennen gelernt. Wir wollen nun zeigen, dass als Eigenwerte f¨ ur orthogonale Abbildungen nur λ = ±1 in Frage kommen: Sei λ ein beliebiger Eigenwert einer orthogonalen Abbildungen L und sei v zugeh¨origer Eigenvektor. Dann ist Lv , Lv = λv , λv = λ2 v , v , also λ2 = 1, bzw. λ = ±1.
314
21 Eigenwerte und Eigenvektoren
0 Bei obiger Drehmatrix R w¨are beispielsweise v = 0 Eigenvektor zum Eigen1 wert λ = +1. Andere reelle Eigenwerte hat R nicht. Wir bemerken hier noch, dass eine Abbildung genau dann orthogonal ist, wenn sie linear und ihre Matrixdarstellung bez¨ uglich einer Orthonormalbasis eine orthogonale Matrix ist.
21.3
Berechnung der Eigenwerte
Wir gehen im Folgenden davon aus, dass die zu untersuchende lineare Abbildung durch eine Matrix A ∈ M (n × n, K) dargestellt wird. Die Eigenwertgleichung lautet dann Av = λv und ist ein lineares Gleichungssystem. Mit solchen kennen wir uns bereits bestens aus, ein wenig problematisch ist lediglich der Parameter λ in der Gleichung. Diesen gilt es zun¨achst zu ermitteln, ehe wir mit dem Gauß-Algorithmus L¨ osungsvektoren — in diesem Fall also Eigenvektoren — berechnen. F¨ ur welche λ hat die Eigenwertgleichung L¨osungen neben dem Nullvektor? Zur Beantwortung dieser Frage stellen wir die Eigenwertgleichung ein wenig um: Av = λv ⇔ Av − λv = 0 ⇔ (A − λE)v = 0 . (Im letzten Schritt musste die Einheitsmatrix E hinzugef¨ ugt werden, damit der Term innerhalb der Klammern definiert ist.) Wir suchen also jene Parameter λ, f¨ ur welche die Matrix (A − λE) einen Kern hat, der nicht nur aus dem Nullvektor besteht. Dies ist beispielsweise ¨ aquivalent zu Rang(A − λE) < n oder auch — und damit k¨ onnen wir weiterarbeiten — zu det(A − λE) = 0 . Der Determinantenterm PA (λ) := det(A−λE) wird charakteristisches Polynom genannt und ergibt ausgerechnet tats¨achlich ein Polynom n-ten Grades in λ. Die Nullstellen des charakteristischen Polynoms liefern also die Eigenwerte von A.
Beispiel Sei A = ( 01 10 ). Das charakteristische Polynom von A ist 0 1 λ 0 −λ 1 det(A − λE) = − = = λ2 − 1. 1 0 0 λ 1 −λ
21.4 Berechnung der Eigenvektoren
Seine Nullstellen, und damit die Eigenwerte von A, sind λ1,2 = ±1.
315
Koordinatentransformationen haben auf die Eigenwertberechnung keinen Einfluss, denn die charakteristischen Polynome der Matrizen A und B = SAS −1 sind gleich PB (λ) = det(SAS −1 − λE) = det(SAS −1 − λSES −1 ) = det(S(A − λE)S −1 ) = det S · det(A − λE) · det S −1 = det(A − λE) = PA (λ) . Das sollte auch so sein, denn A und B = SAS −1 stellen schließlich die gleiche lineare Abbildung dar und Eigenwerte sind u ¨ber die lineare Abbildung definiert. Auch durch Transponieren der Matrix ¨andert sich das charakteristische Polynom nicht: PA (λ) = PAT (λ) .
21.4
Berechnung der Eigenvektoren
Ist ein Eigenwert λ gefunden, so berechnen sich die zugeh¨ origen Eigenvektoren v u ¨ber (A − λE)v = 0 .
Beispiel F¨ ur A = ( 01 10 ) haben wir im vorigen Beispiel die Eigenwerte λ1,2 = ±1 ermittelt. F¨ ur λ1 = +1 wollen wir noch den zugeh¨origen Eigenvektor berechnen. Aus dem Gleichungssystem (A − 1E)v = 0 wird mithilfe des Gauß-Algorithmus −1 1 0 −1 1 0 → . 1 −1 0 0 0 0 Die L¨osungen haben die Form x = y oder v = (xx) = x (11), sodass der L¨ osungsraum also von einem Vektor aufgespannt wird. Als Eigenvektor erhalten wir v1 = (11) bzw. alle Vielfachen davon. Die Dimension des Eigenraumes kann man bei quadratischen Matrizen sehr einfach anhand der Nullzeilen nach Anwendung des Gauß-Algorithmus ablesen,
316
21 Eigenwerte und Eigenvektoren
denn jede Nullzeile bedeutet, dass ein Parameter frei gew¨ ahlt werden kann, was wiederum unmittelbar zu einem (weiteren) Basisvektor f¨ uhrt. Somit ist die Anzahl der Nullzeilen gleich der Dimension des Eigenraumes. Eine Nullzeile bedeutet, dass der L¨osungsraum, also der Eigenraum, eindimensional ist. Die geometrische Vielfachheit ist somit 1. Entstehen durch Anwendung des GaußAlgorithmus k Nullzeilen, so gibt es auch k linear unabh¨ angige Eigenvektoren zum entsprechenden Eigenwert.
21.5
Vielfachheiten
Wir wissen bereits, dass Eigenvektoren zu unterschiedlichen Eigenwerten linear unabh¨angig sind und dass es mehrere linear unabh¨ angige Eigenvektoren zum gleichen Eigenwert geben kann. W¨ unschenswert ist der Fall, dass wir eine ganze Basis finden, die nur aus Eigenvektoren besteht. In einem solchen Fall w¨are die lineare Abbildung lediglich aus Skalierungen unterschiedlicher St¨ arke zusammengesetzt. Wir werden nun etwas genauer untersuchen, was u ¨ber die Anzahl linear unabh¨angiger Eigenvektoren ausgesagt werden kann. Ist λ0 eine Nullstelle des charakteristischen Polynoms, so kann letzteres — oglich – in die Form durch Ausklammern von (λ − λ0 ) so oft wie m¨ PA (λ) = (λ − λ0 )k q(λ) u uhrt werden. q(λ) ist dabei wieder ein Polynom, allerdings ohne λ0 als ¨berf¨ Nullstelle, sonst k¨onnte (λ − λ0 ) noch einmal ausgeklammert werden. Der auf diese Weise bestimmte Exponent k heißt algebraische Vielfachheit von λ. Sind auch komplexe Eigenwerte zugelassen, so kann jedes Polynom in lineare Faktoren zerlegt werden und die Summe aller Eigenwerte, entsprechend ihrer Vielfachheiten gez¨ahlt, ist genau n. Im Reellen k¨onnen allenfalls quadratische Faktoren wie beispielsweise (λ2 + 1) als nicht mehr weiter zu faktorisierende Reste u ¨brig bleiben.
Beispiel 0 1 Das charakteristische Polynom von A = −1 0 ist 0 −1
1 λ − 0 0
0 −λ = λ −1
1 = λ2 + 1 . −λ
Im Reellen ist dies nicht zu faktorisieren und es gibt keine Eigenwerte. Im Komplexen hingegen ist λ2 + 1 = (λ + i)(λ − i) und A hat die komplexen Eigenwerte λ1,2 = ±i.
317
21.5 Vielfachheiten
Generell gilt, dass bei reellwertigen Matrizen komplexe Eigenwerte stets mit ihrem konjugiert komplexen Partner (in obigem Beispiel ±i) auftreten. Weiter gibt es zu jedem Eigenwert mindestens einen linear unabh¨ angigen Eigenvektor. Die Anzahl linear unabh¨angiger Eigenvektoren kann anhand der Nullzeilen nach Anwendung des Gauß-Algorithmus zur Eigenvektorberechnung abgelesen werden. Diese (bereits zuvor schon definierte) Zahl heißt geometrische Vielfachheit des Eigenwertes λ und ist gem¨aß dem folgenden Satz beschr¨ ankt:
Satz Sei g die geometrische Vielfachheit eines Eigenwertes und k dessen algebraische Vielfachheit. Dann ist 1≤g≤k .
Gibt es also n verschiedene Eigenwerte, so gibt es auch n linear unabh¨ angige Eigenvektoren, einen zu jedem Eigenwert. Insgesamt ergibt das also eine Basis des Ausgangsvektorraumes aus Eigenvektoren. F¨ ur Eigenwerte λ mit algebraischer Vielfachheit k > 1 k¨ onnen wir zwei F¨ alle unterscheiden: 1. Der Gauß-Algorithmus liefert k Nullzeilen und somit auch k linear unabh¨angige Eigenvektoren zum Eigenwert λ. Dann ist der k-fache Eigenwert λ so gut wie“ k verschiedene Eigenwerte. ” 2. Die Eigenwertgleichung liefert zu λ weniger als k linear unabh¨ angige Eigenvektoren. Diesen Fall betrachten wir im n¨ achsten Abschnitt genauer.
Beispiel Die Matrix A = (20 12) hat das charakteristische Polynom 2 − λ 1 det(A − λE) = = (2 − λ)2 . 0 2 − λ Also ist λ = 2 ein zweifacher Eigenwert (algebraische Vielfachheit ist 2). Aber A − 2E =
0 0
1 0
hat nur eine Nullzeile. Deshalb gibt es nur einen linear unabh¨ angigen Eigenvektor zu λ = 2, n¨amlich (10) oder Vielfache davon.
318
21.6
21 Eigenwerte und Eigenvektoren
Hauptvektoren
Ist f¨ ur einen Eigenwert die algebraische Vielfachheit gr¨ oßer als die geometrische, so wird es keine Basis aus Eigenvektoren geben. Allerdings k¨ onnen sie durch Hinzunahme anderer Vektoren zu einer Basis erg¨ anzt werden. Die fehlenden Eigenvektoren m¨ ussen durch andere Vektoren ersetzt werden. Solche Ersatz” vektoren“ finden wir, indem wir die Eigenwertgleichung verallgemeinern, wie im Folgenden beschrieben. Jeder Eigenvektor v von A zum Eigenwert λ erf¨ ullt nicht nur die Eigenwertgleichung (A − λE)v = 0 , sondern damit erst recht die Gleichung (A − λE)kv = 0
(Hauptvektorgleichung),
wobei k die algebraische Vielfachheit des Eigenwertes λ ist. L¨ osungen der Hauptvektorgleichung heißen Hauptvektoren. Ein Eigenvektor v wird bereits bei Exponent 1 von (A − λE) auf den Nullvektor abgebildet, also auch f¨ ur k > 1, denn (A − λE)kv = (A − λE)k−1 (A − λE)v = (A − λE)k−10 = 0 . Somit sind Eigenvektoren unter anderem Hauptvektoren (oder Hauptvektoren eine Verallgemeinerung von Eigenvektoren). Des Weiteren kann es aber noch L¨osungen der Hauptvektorgleichung geben, die nicht Eigenvektoren sind. Der folgende Satz gibt uns dar¨ uber Gewissheit, dass es — zumindest im Komplexen — stets eine Basis aus Hauptvektoren gibt.
Satz Zu einer k-fachen Nullstelle des charakteristischen Polynoms existieren genau k linear unabh¨angige Hauptvektoren. Diese sind allesamt L¨ osungen der Hauptvektorgleichung (A − λE)kv = 0 .
Die Berechnung einer Basis aus Hauptvektoren geschieht folgendermaßen: F¨ ur jeden Eigenwert λ berechnen wir die Eigenvektoren mithilfe der Eigenwertgleichung (A − λE)v = 0 . Ist die algebraische Vielfachheit k von λ gr¨oßer als die geometrische, heben wir den Exponenten von (A − λE) um eins an und l¨ osen das Gleichungssystem (A − λE)2v = 0 .
319
21.6 Hauptvektoren
Neben den bereits gefundenen Eigenvektoren kann es hierzu weitere Hauptvektoren geben. Dies ist dann der Fall, wenn die Anzahl der Nullzeilen nach Anwendung des Gauß-Algorithmus im Vergleich zum vorigen Gleichungssystem (mit Exponent 1) angestiegen ist. F¨ ur jede hinzugekommene Nullzeile k¨ onnen wir unsere Basis um einen Hauptvektor erg¨anzen, wobei wir lediglich beachten m¨ ussen, dass sie mit den bisherigen Basisvektoren linear unabh¨ angig sind. Insgesamt ben¨otigen wir zum Eigenwert λ so viele Basisvektoren wie die algebraische Vielfachheit von λ betr¨agt. Haben wir noch nicht genug, erh¨ ohen wir den Exponenten von (A − λE) weiter und l¨osen nacheinander (A − λE)lv = 0 , f¨ ur l = 3, 4, . . . , k, bis wir genug Hauptvektoren f¨ ur die Basis gefunden haben. Obiger Satz gibt uns dabei die Versicherung, dass wir bis zum Exponenten k f¨ undig werden sollten.
Beispiel Wir wollen die Eigen- und Hauptvektoren der Matrix ⎛ ⎞ 2 1 0 M := ⎝0 2 1⎠ 0 0 2 berechnen: Das charakteristische Polynom ist (2 − λ)3 , womit wir mit λ = 2 einen dreifachen Eigenwert vorliegen haben. Zur Berechnung der zugeh¨ origen Eigenvektoren ben¨otigen wir nicht einmal den Gauß-Algorithmus: ⎞ ⎛ ⎞ ⎛ 0 1 0 0 1 0 0 A − 2E = ⎝0 0 1⎠ bzw. ⎝0 0 1 0⎠ 0 0 0 0 0 00 f¨ uhrt amlich, mit der Wahl x = 1,
1zu einem linear unabh¨angigen Eigenvektor, n¨ zu 0 . F¨ ur die Hauptvektoren bilden wir das Quadrat von A − 2E: 0
⎛
0 (A − 2E)2 = ⎝0 0
1 0 0
⎞2 ⎛ 0 0 1⎠ = ⎝0 0 0
0 0 0
⎞ 1 0⎠ 0
⎛ bzw.
0 ⎝0 0
0 0 0
1 0 0
⎞ 0 0⎠ 0
0
1 ogliche liefert uns s¨amtliche Linearkombinationen von 0 und 1 als m¨ 0 0
1 Hauptvektoren. 0 haben wir aber schon als Eigenvektor identifiziert, wo0
0 mit 1 als ein gesuchter Hauptvektor bleibt. Wir brauchen insgesamt drei 0 linear unabh¨angige Eigen- und Hauptvektoren (da 2 ein dreifacher Eigenwert
320
21 Eigenwerte und Eigenvektoren
ist), also m¨ ussen ⎛ 0 (A−2E)3 = ⎝0 0
wir noch (A − 2E)3 berechnen: ⎞⎛ ⎞ ⎛ ⎞ 0 1 0 1 0 0 0 0 0 0⎠·⎝0 0 1⎠ = ⎝0 0 0⎠ 0 0 0 0 0 0 0 0
⎛ bzw.
0 ⎝0 0
0 0 0
0 0 0
⎞ 0 0⎠ . 0
Hier ist jeder Vektor
0 eine L¨osung, linear unabh¨angig zu den bisherigen zweien ist beispielsweise 0 . Somit besteht also die Standardbasis des R3 aus Eigen1 und Hauptvektoren von M .
21.7
Diagonalisierbarkeit
Wie sieht aber nun der g¨ unstige Fall aus, in dem es eine Basis aus Eigenvektoren gibt, und welche Vorteile liefert dies? Dazu sei kurz an das Kapitel zur Koordinaten- und Basistransformation erinnert. Dort haben wir erkannt, dass eine Matrix eine lineare Abbildung immer bez¨ uglich einer gew¨ahlten Basis darstellt. Ein und dieselbe lineare Abbildung kann durch unterschiedliche Matrizen repr¨asentiert werden, indem wir die zugrunde liegende Basis wechseln. Ist die betrachtete Basis ausschließlich aus Eigenvektoren aufgebaut, hat die Matrix eine besonders einfache Gestalt, n¨amlich ⎛ ⎞ λ1 0 . . . 0 ⎜ . ⎟ ⎜ 0 λ2 . . . .. ⎟ ⎜ ⎟ , D=⎜ . ⎟ . . . . . ⎝. . . 0⎠ 0 . . . 0 λn eine Diagonalmatrix. Die Eigenwerte stehen dabei auf der Diagonalen und zwar mit der H¨aufigkeit der algebraischen Vielfachheit des Eigenwertes. Dies ist folgendermaßen einzusehen: Dem Eigenvektor vk , welchen wir als k-ten Basisvektor gew¨ahlt haben, entspricht bzgl. der Eigenvektorbasis der Koordinatenvektor ek . Der Koordinatenvektor wird durch die Diagonalmatrix auf den Koordinatenvektor Dek = λkek abgebildet, welcher dem Vektor λkvk entspricht. Somit ist trotz des zwischenzeitlichen Basiswechsels immer noch die Eigenvektoreigenschaft erf¨ ullt und das f¨ ur die gesamte Basis. Einige offensichtliche Vorteile von Diagonalmatrizen bestehen darin, dass Multiplikation, Addition und Determinantenbildung sehr einfach sind. Leider ist eine Diagonalisierung aber nicht immer m¨oglich, immerhin wird eine Basis aus Eigenvektoren ben¨otigt und die gibt es, wie wir gelernt haben, nicht immer.
321
21.7 Diagonalisierbarkeit
Definition (diagonalisierbar) Eine Matrix A ∈ M (n × n, K) heißt diagonalisierbar, falls ein invertierbares S ∈ M (n × n, K) existiert, sodass die Matrix D = SAS −1 eine Diagonalmatrix ist. (Offenbar ist dann umgekehrt A = S −1 DS.)
Diese Definition mag etwas kompliziert erscheinen, sie entspricht aber lediglich der Existenz einer Basistransformation wie oben beschrieben. Ist die betrachtete Matrix A bereits diagonal, k¨ onnen S und S −1 als Einheitsmatrix gew¨ahlt werden. Dann ist D = A und die Bedingung in der Definition erf¨ ullt. Somit sind diagonale Matrizen diagonalisierbar – dies war nat¨ urlich zu erwarten, jedoch aus der Definition nicht ganz offensichtlich. Um eine Diagonalisierung durchzuf¨ uhren, ben¨ otigen wir die Transformationsmatrizen. S −1 setzt sich dabei aus der neuen Basis — aufgefasst als Spaltenvektoren — zusammen und S ist die Inverse von S −1 . Dazu sehen wir uns noch einmal das entsprechende Diagramm aus dem Kapitel u ¨ber Basistransformationen an:
S
Kn
−1
n K =
A
/ Kn S
D
! / Kn
Starten wir mit ek — das entspricht dem Koordinatenvektor des k-ten Eigenvektors bzgl. der Eigenvektorbasis — unten links und folgen dem oberen Diagrammverlauf, so wird dieser Vektor zun¨achst durch S −1 auf die k-te Spalte von S −1 , also auf den k-ten Eigenvektor vk , abgebildet. vk wird weiter von A auf λkvk abgebildet und jener Vektor durch S auf λkek — was wiederum dem Koordinatenvektor von λkvk bzgl. der Eigenvektorbasis entspricht. Entlang des k¨ urzeren, unteren Weges wird ek einfach durch die Diagonalmatrix D auf λkek abgebildet und wir gelangen zum gleichen Ergebnis.
Beispiel Wir f¨ uhren das Beispiel aus dem Abschnitt zur Berechnung von Eigenvektoren 1 fort. Dort hatten wir v1 = 1(1) als Eigenvektor zum Eigenwert λ1 = 1 von 0 1 A = ( 1 0 ) berechnet. v2 = −1 ist Eigenvektor zum Eigenwert λ2 = −1. Somit h¨atten wir eine Basis aus Eigenvektoren. Diese schreiben wir als Spalten in eine Matrix und erhalten 1 1 S −1 = 1 −1
322
21 Eigenwerte und Eigenvektoren
und nach kurzer Invertierung 1 S= 2 Schließlich ist SAS
−1
1 1
1 −1
.
1 1 1 1 1 0 1 1 1 = = 1 0 1 −1 2 1 −1 2 1 1 0 λ1 0 = = . 0 λ2 0 −1
1 1 −1 −1 1 1
Bitte u aren, h¨ atten wir die ¨berlegen Sie, zu welchem Ergebnis wir gekommen w¨ Spalten von S −1 vertauscht. Kehrt sich in der Diagonalmatrix ebenfalls die Reihenfolge der Eigenwerte auf der Diagonalen um oder hebt sich der Effekt auf, weil sich mit S −1 auch S ¨andert? Wir wollen noch auf eine Besonderheit von symmetrischen bzw. selbstadjungierten Matrizen in Bezug auf Eigenvektoren und Diagonalisierbarkeit eingehen.
Satz Sei A ∈ M (n × n, R) eine symmetrische Matrix (d. h. A = AT ) bzw. B ∈ M (n × n, C) eine selbstadjungierte Matrix (d. h. A = A∗ := AT ). Dann gibt es im Rn eine ONB aus Eigenvektoren von A bzw. B. Ferner sind alle Eigenwerte reell. Symmetrische bzw. selbstadjungierte Matrizen sind somit nicht nur diagonalisierbar, die Eigenr¨aume liegen bez¨ uglich des Standardskalarproduktes des Rn n ¨ bzw. K sogar noch senkrecht zueinander. Nach den letzten Uberlegungen k¨ onnen wir Kriterien f¨ ur die Diagonalisierbarkeit einer Matrix zusammenfassen.
Satz Eine Matrix A ∈ M (n × n, K) ist genau dann diagonalisierbar, wenn eine Basis aus Eigenvektoren existiert. Dies ist unter anderem der Fall, wenn eine der folgenden Bedingungen erf¨ ullt ist: 1. A hat n paarweise verschiedene Eigenwerte, 2. A = AT (symmetrisch), 3. A = A∗ := AT (selbstadjungiert).
Dies sind allerdings nur hinreichende Bedingungen. Ist keiner der drei Punkte erf¨ ullt, kann die Matrix dennoch diagonalisierbar sein — oder auch nicht.
323
21.7 Diagonalisierbarkeit
21.7.1
Diagonalisierung am Beispiel
Sei die zu diagonalisierende Matrix A=
1 2
2 1
.
Bestimmen der Eigenwerte: Das charakteristische Polynom von A ist 1 − λ 2 det(A − λE) = = (1 − λ)2 − 4 = λ2 − 2λ − 3 . 2 1 − λ √ Nullstellen — und somit Eigenwerte von A — sind λ1,2 = 1 ± 1 + 3 = 1 ± 2, also λ1 = −1, λ2 = 3. Die algebraischen Vielfachheiten sind jeweils 1. Zu erwarten ist damit −1 0 D= 0 3 als Diagonalmatrix.
Berechnen der Eigenvektoren: 1 2 −1 0 2 2 − = A − λ1 E = 2 1 0 −1 2 2 2 2 0 2 2 0 → , 2 2 0 0 0 0 1 also ist v1 = −1 Eigenvektor zu λ1 . 1 2 3 0 −2 2 A − λ2 E = − = 2 1 0 3 2 −2 −2 2 0 −2 2 0 → , 2 −2 0 0 0 0 also ist v2 = ( 11 ) Eigenvektor zu λ2 . Koordinatentransformation: Die beiden Eigenvektoren ergeben, als Spaltenvektoren geschrieben, die Transformationsmatrix 1 1 . S −1 = −1 1 Deren inverse Matrix ist −1 1 S = S −1 = 2
1 1
−1 1
324
21 Eigenwerte und Eigenvektoren
und schließlich ergibt die Transformation 1 1 −1 1 2 1 1 D = SAS −1 = 2 1 −1 1 2 1 1 1 −2 0 1 1 −1 −1 3 = = 1 3 2 1 1 2 0 6 −1 0 = . 0 3
21.8
Aufgaben
1. (a) Bestimmen Sie von A=
1 3
⎛
2 −1
,
1 B = ⎝0 2
−2 −3 −1
⎞ 1 0⎠ , 2
⎛
1 C = ⎝0 1
0 2 0
⎞ 3 0⎠ −1
die Eigenwerte mitsamt deren algebraischen Vielfachheiten. (b) Welche Eigenwerte und zugeh¨orige Eigenvektoren k¨ onnen direkt aus den folgenden Matrizen abgelesen werden? Bei welchen Eigenwerten k¨onnte es neben zugeh¨origen Eigenvektoren noch Hauptvektoren geben? ⎛ ⎞ ⎛ ⎞ 1 0 2 0 1 5 1 ⎜3 −2 2 0 ⎟ 1 0 ⎟ A= , B = ⎝0 −3 1⎠ , C = ⎜ ⎝0 0 0 0 ⎠ . 2 1 0 0 2 3 0 1 −2 2. Bestimmen Sie die Eigenwerte mit deren zugeh¨ origen Eigen- und Hauptvektoren der Matrix ⎛ ⎞ 1 2 1 A = ⎝0 3 1⎠ . 1 1 2 3. Wir haben bereits die Ableitungsabbildung f → f als lineare Abbildung auf dem Vektorraum der unendlich oft differenzierbaren Funktionen kennen gelernt. Finden Sie ein Beispiel f¨ ur einen Eigenvektor (oder besser Eigenfunktion“) dieser Abbildung. ” 4. Berechnen Sie folgende Matrixprodukte a 0 1 2 1 2 a 0 a 0 c 0 , , . 0 b 3 4 3 4 0 b 0 b 0 d 5. (a) Diagonalisieren Sie, falls m¨oglich, folgende Matrizen 0 2 1 0 2 −3 A= , B= , C= . −2 4 1 2 1 −2
325
21.9 L¨ osungen
Berechnen Sie in den entsprechenden F¨ allen das Produkt D = SAS −1 . (b) Welche der folgenden Matrizen k¨onnen bereits durch bloßes Hinsehen als diagonalisierbar eingeordnet werden? 1 0 1 0 1 1 A= , B= , C= , 1 1 1 2 1 1 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 2 1 −1 2 1 −1 2 1 −2 ˜ = ⎝0 3 2 ⎠ , C˜ = ⎝ 1 2 3 ⎠ . A˜ = ⎝0 3 2 ⎠ , B 0 0 2 0 0 4 −2 3 2 Begr¨ unden Sie Ihre Wahl. 6. Bestimmen Sie alle reellen Werte α, f¨ ur welche die Matrix 1 α A= 0 1 diagonalisierbar ist.
21.9 1. (a)
L¨ osungen 1 − λ det(A − λE) = 3
2 −1 − λ
= (1 − λ)(−1 − λ) − 6 = λ2 − 7 , √ √ somit hat A die beiden Eigenwerte λ1 = − 7 und λ2 = + 7, jeweils mit algebraischer Vielfachheit 1. 1 − λ −2 1 −3 − λ 0 det(B − λE) = 0 2 −1 2 − λ = (−3 − λ)((1 − λ)(2 − λ) − 2) = (−3 − λ)(λ2 − 3λ) = (−3 − λ)λ(λ − 3), also hat B die Eigenwerte λ1 = −3, λ2 = 0 und λ3 = 3, ebenfalls mit algebraischer Vielfachheit 1. 1 − λ 0 3 2−λ 0 det(C − λE) = 0 1 0 −1 − λ = (1 − λ)(2 − λ)(−1 − λ) − 3(2 − λ) = (2 − λ)(λ2 − 4) = (2 − λ)2 (2 + λ), die Eigenwerte von C sind demnach λ1,2 = 2 mit algebraischer Vielfachheit 2 sowie λ3 = −2 mit algebraischer Vielfachheit 1.
326
21 Eigenwerte und Eigenvektoren
(b) Die Matrizen A und B sind untere bzw. obere Dreiecksmatrizen. Bei diesen stehen die Eigenwerte direkt auf der Diagonalen. Die H¨aufigkeit, mit der diese Werte dort stehen, gibt die algebraische Vielfachheit an. • Somit hat die Matrix A lediglich den Eigenwert 1 mit algebraischer Vielfachheit 2. Weiterhin ist der Standardbasisvektor e2 ein Eigenvektor, da in der zweiten Matrixspalte alle Nichtdiagonalelemente ¨ angiNull sind. Uber die Existenz eines zweiten, zu e2 linear unabh¨ gen Eigenvektors k¨onnen wir ohne weitere Untersuchungen noch nichts sagen. Es k¨onnte also noch einen Hauptvektor geben. • Die Matrix B hat die Eigenwerte 1, −3 und 2, jedweils mit algebraischer Vielfachheit 1. Mit dem gleichen Argument wie bei A k¨onnen wir den Standardbasisvektor e1 als Eigenvektor zum Eigenwert 1 identifizieren. Andere Eigenvektoren kennen wir noch nicht. Allerdings gibt es ja zu jedem Eigenwert mindestens einen (linear unabh¨angigen) Eigenvektor. Es kann aber auch nicht mehr als einen geben, da die algebraische Vielfachheit 1 ist. Hauptvektoren, die keine Eigenvektoren sind, gibt es somit f¨ ur B nicht. • C ist keine Dreiecksmatrix. Konzentrieren wir uns also zun¨ achst auf die zweite und vierte Spalte. Dort sind wiederum alle Eintr¨ age bis auf die Diagonaleintr¨age Null, wonach die Standardbasisvektoren e2 und e4 Eigenvektoren sind, jeweils zum Eigenwert −2. Dieser Eigenwert hat also mindestens eine algebraische Vielfachheit von 2. Weiterhin gibt es noch eine komplette Nullzeile, C hat also nicht vollen Rang. Anders ausgedr¨ uckt ist der Kern von C mindestens eindimensional, es gibt also neben dem Nullvektor noch weitere Vektoren v , die auf den Nullvektor, also auf 0 · v abgebildet werden. 0 ist somit ein weiterer Eigenwert und v dessen Eigenvektor. Die algebraische Vielfachheit ist mindestens 1. ¨ Uber den vierten Eigenwert k¨onnen wir nichts aussagen. W¨ are er 0 oder −2, so w¨are die entsprechende algebraische Vielfachheit um 1 gr¨oßer als oben angegeben und es k¨ onnte sogar noch einen Hauptvektor geben. 2. Das charakteristische Polynom lautet: (1 − λ)(3 − λ)(2 − λ) +2 − (3 − λ) −(1 − λ) −(1−λ)
= (1 − λ) (3 − λ)(2 − λ) − 2 = (1 − λ) λ2 − 5λ + 4 = (1 − λ)2 (4 − λ).
Berechnung des Eigenvektors zum Eigenwert 4 mithilfe des Gauß-Algorithmus: ⎛ ⎞ −3 2 1 A − 4E = ⎝ 0 −1 1 ⎠ 1 1 −2
327
21.9 L¨ osungen
⎛
2 1 −1 1 1 −2
⎞ ⎛ 0 −3 0⎠ → ⎝ 0 0 0
2 1 −1 1 5 −5
2 1 −1 1 0 0
⎞ ⎛ 0 −3 0⎠ → ⎝ 0 0 0
1 Mit der Wahl z = 1 erhalten wir als Eigenvektor 1 . −3 ⎝0 1
⎞ 0 0⎠ 0
1
Berechnung der ein genwert 1: ⎛ 0 A − E = ⎝0 1
bis zwei linear unabh¨ angigen Eigenvektoren zum Ei2 2 1
⎞ 1 1⎠ , 1
⎛
0 ⎝0 1
2 2 1
1 1 1
⎞ ⎛ 0 1 0⎠ → ⎝0 0 0
1 2 0
1 1 0
⎞ 0 0⎠ 0
Da es nur eine Nullzeile gibt, werden wir auch nur einen linear unabh¨
−1angi gen Eigenvektor finden, n¨amlich mit z = 2 den Eigenvektor v = −1 . 2
Als Letztes muss noch der Hauptvektor zum Eigenwert 1 bestimmt werden. Dazu l¨osen wir das Gleichungssystem (A − 1E)2 w = 0: ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 1 5 3 1 5 3 0 1 5 3 0 (A − E)2 = ⎝1 5 3⎠ , ⎝1 5 3 0⎠ → ⎝0 0 0 0⎠ . 1 5 3 1 5 30 0 0 00 Mit der Wahl z = 1 ist ein zu v linear unabh¨ angiger Hauptvektor gege2 ben durch w = −1 . Beliebige Linearkombinationen von v und w sind 1 ebenfalls Hauptvektoren zum Eigenwert 1.
1 −1
2 Insgesamt bilden die Vektoren 1 , −1 und −1 eine Basis aus 1 1 2 Hauptvektoren. 3. Ein Eigenvektor wird auf ein Vielfaches von sich selbst abgebildet. Wir suchen also eine Funktion f , deren Ableitung ein Vielfaches der Funktion selbst ist: f = λf . Ein solches Beispiel liefert die Exponentialfunktion, denn daf¨ ur gilt λx e = λeλx . Somit ist bzgl. der Ableitungsabbildung die Funktion f (x) = eλx ein Eigenvektor zum Eigenwert λ. 4. Multiplikation von links entspricht einer zeilenweisen Multiplikation mit den Diagonalelementen: a 0 1 2 a 2a = . 0 b 3 4 3b 4b Multiplikation von rechts entspricht einer spaltenweisen Multiplikation mit den Diagonalelementen: 1 2 a 0 a 2b = 3 4 0 b 3a 4b
328
21 Eigenwerte und Eigenvektoren
und schließlich
a 0
0 b
c 0 0 d
=
ac 0
0 bd
.
5. (a)A) Das charakteristische Polynom von A −λ 2 det(A − λE) = = (λ − 2)2 −2 4 − λ liefert den Eigenwert λ1,2 = 2 mit algebraischer Vielfachheit 2. Doch −2 2 A − λ1,2 E = −2 2 hat offensichtlich Rang 1 und damit gibt es zu diesem Eigenwert nur einen linear unabh¨angigen Eigenvektor. Zur Diagonalisierbarkeit br¨auchten wir allerdings zwei linear unabh¨ angige Eigenvektoren (eine Basis). B) Das charakteristische Polynom von B 1 − λ 0 = (1 − λ)(2 − λ) det(B − λE) = 1 2 − λ liefert die Eigenwerte λ1 = 1 und λ2 = 2, jeweils mit algebraischer Vielfachheit 1. Demnach ist B diagonalisierbar, zu jedem Eigenwert gibt es ja mindestens einen Eigenvektor und bei zwei Eigenwerten liefert uns das bereits eine Basis. Wir wissen auch schon, dass die Diagonalmatrix die Gestalt ( 10 02 ) oder ( 20 01 ) haben wird (je nach der Reihenfolge der Eigenvektoren in den Spalten ¨ von S), wollen dies zur Ubung aber noch genauer berechnen. Den Eigenvektor v1 zum Eigenwert λ1 = 1 erhalten wir durch L¨ osen des Gleichungssystems 0 0 0 1 − λ1 v = 0. v = 1 2 − λ1 1 1 1 1 1 Somit ist v1 = −1 Eigenvektor. Der Eigenvektor v2 zum Eigenwert λ2 = 2 ist L¨osung von 0 −1 0 1 − λ2 v2 = v = 0 , 1 2 − λ2 1 0 2 also v2 = (01). Beide Eigenvektoren, als Spaltenvektoren aufgefasst, ergeben die Matrix S −1 , woraus wir durch Invertieren die Matrix S berechnen 1 0 1 0 , S= . S −1 = −1 1 1 1 Die gesuchte Diagonalmatrix ergibt sich durch folgendes Produkt 1 0 1 0 1 0 1 0 = . D = SBS −1 = 1 1 1 2 −1 1 0 2
329
21.9 L¨ osungen
C) Das charakteristische Polynom von C 2 − λ −3 det(C − λE) = = (λ + 1)(λ − 1) 1 −2 − λ auch liefert die Eigenwerte λ1 = −1 und λ2 = +1. Demnach ist −1 0 C diagonalisierbar und die Diagonalmatrix hat die Gestalt 0 1 1 0 1 oder 0 −1 . Der Eigenwert λ1 = −1 hat den Eigenvektor v1 = (1), der Eigenwert λ2 = 1 hat den Eigenvektor v2 = (31). Somit ergeben sich 1 1 −3 1 3 S −1 = , S=− 1 1 2 −1 1 und als Diagonalmatrix 1 1 −1 D = SCS = − 2 −1
2 −3 1 1 −2 1
−3 1
3 −1 0 = . 1 0 1
(b) A und A˜ m¨ ussen nicht diagonalisierbar sein, es k¨ onnte n¨ amlich zum doppelten Eigenwert 1 bzw. 2 ein Hauptvektor existieren. ˜ drei verschiedene B hat zwei verschiedene Eigenwerte (1 und 2), B (2, 3 und 4), jeweils mit algebraischer Vielfachheit 1. Demnach gibt es keine Hauptvektoren; die beiden Matrizen sind diagonalisierbar. C und C˜ sind reellwertige, symmetrische Matrizen. Diese haben stets eine Basis aus Eigenvektoren und sind somit diagonalisierbar. 6. Da A eine obere Dreieicksmatrix ist, k¨onnen wir den Eigenwert 1 mit algebraischer Vielfachheit 2 direkt von der Diagonalen von A ablesen. Damit A diagonalisierbar ist, muss es zu diesem Eigenwert zwei linear unabh¨angige Eigenvektoren geben. Das bedeutet, dass das lineare Gleichungssystem (A−1·E)v = 0 einen zweidimensionalen L¨ osungsraum hat, also jeder Vektor v des R2 auf den Nullvektor abgebildet wird. Demnach muss (A − 1 · E) bereits die Nullmatrix sein. Somit ist nur f¨ ur α = 0 die Matrix A diagonalisierbar bzw. A liegt dann bereits in Diagonalgestalt vor.
330
21 Eigenwerte und Eigenvektoren
Fragen • Wie lautet die Eigenwertgleichung? • Wie wird das charakteristische Polynom berechnet und woher kommt die dazu verwendete Gleichung? • Wie berechnet man den Eigenraum zu einem Eigenwert? • Was ist die geometrische Vielfachheit eines Eigenwertes? • L¨asst sich ein Beispiel angeben, f¨ ur das die geometrische Vielfachheit eines Eigenwertes gr¨oßer ist als die algebraische? • Wie werden Hauptvektoren berechnet? • Erkl¨aren Sie das Diagonalisieren mit der Hilfe eines Diagramms. • Unter welchen Voraussetzungen ist eine quadratische Matrix diagonalisierbar?
22 Differenzialgleichungen
22.1
Motivation
Differenzialgleichungen sind von großer Bedeutung, um die verschiedensten Vorg¨ange in Natur und Technik zu beschreiben. Dazu geh¨ oren • Schwingungen und Wellen, • Diffusionsprozesse, • Wachstumsprozesse, • W¨armeleitungsvorg¨ange, • Str¨omungsph¨anomene • und vieles mehr. Eigentlich ist das tats¨achlich Motivation genug. Diese besonderen Gleichungen zeichnen sich allgemein dadurch aus, dass neben einer Funktion selbst auch ihre Ableitungen (oder nur diese) auftreten. Wir haben gesehen, dass sich hinter dem Differenzieren eine lineare Abbildung verbirgt. Dies bedeutet dann aber auch, dass die Strukturen der Linearen Algebra erneut auf dem Gebiet der Differenzialgleichungen auftauchen m¨ ussen und genau das machen sie. Wir werden sehen, dass die Struktur der L¨ osungsmenge einer Differenzialgleichung der von linearen Gleichungssystemen entspricht. Verschiedene Akteure — Analysis und Lineare Algebra — treten also auf die B¨ uhne der Mathematik und spielen das gleiche St¨ uck; wunderbar! Die ganze Tragweite der Theorie der Differenzialgleichungen in den Anwendungen wird sicher erst klar, wenn Sie die speziellen Veranstaltungen Ihres Studienganges besuchen, in denen physikalische oder z. B. wirtschaftstheoretische Themen behandelt werden. Auch die gesonderten Kurse zu Differenzialgleichungen © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_22
332
22 Differenzialgleichungen
enthalten zumeist viel u ¨ber die Anwendungen, denn wichtige Beispiele entstammen einfach aus dem Studium der Natur. Viele Teile der Mathematik fließen dann bei der theoretischen Behandlung der Differenzialgleichungen zusammen, denn sie repr¨asentieren unwegsames Gel¨ande, f¨ ur dessen Durchquerung teils schwerstes Ger¨at verwendet werden muss. Daf¨ ur gibt es jedoch spezielle Vorlesungen und auch Computeralgebrasysteme k¨onnen helfen. Vor dem Behandeln der Grundlagen wollen wir allerdings dennoch andeutend kl¨aren, woher der Zusammenhang zur Natur (aber auch Technik) kommt. Es ¨ zeugt wohl nicht von einem Hang zur Ubertreibung, wenn wir die Zeit als zentrale Gr¨oße betrachten, deren Fortschreiten die wesentlichen Ph¨ anomene u ¨berhaupt erst erfahrbar macht. Haben wir eine Funktion y(t), die von der Zeit abh¨angt und einen Vorgang in der Natur beschreibt, k¨ onnen wir f¨ ur alle Zeiten t voraussagen bzw. zur¨ uckrechnen, was passiert (ist), sofern y(t) f¨ ur diese t definiert ist. Die Natur liefert uns aber nur in den seltensten F¨ allen direkt Informationen u ¨ber die Abl¨aufe in ihr. Das meiste teilt sie uns u ¨ber ¨ Anderungen in der Zeit mit. So zerf¨allt radioaktives Material im Laufe der ¨ Zeit und ein Fadenpendel ¨andert seine Lage und Geschwindigkeit. Anderungen werden nun aber gerade durch die Ableitung einer Funktion ausgedr¨ uckt. Hier m¨ ussen wir also nach der Variablen t ableiten, was mit dy (t) bezeichnet wird, dt wof¨ ur dann meist kurz y(t) ˙ geschrieben wird, sofern t wirklich als Zeit verstanden wird. Auch h¨ohere Ableitungen k¨onnen auftreten. So ist f¨ ur eine den Ort in Abh¨angigkeit von der Zeit beschreibende Funktion x(t) der Ausdruck ¨ ¨ x(t) ˙ die Anderung des Ortes, also die Geschwindigkeit. x ¨(t) ist die Anderung ¨ ¨ der Anderung des Ortes, also die Anderung der Geschwindigkeit, die dann als Beschleunigung bekannt ist. So wusste bereits Newton, dass f¨ ur die Kraft F und die Masse m eines Probeteilchens die Gleichung F (t) = m¨ x(t) gilt; eine einfache Differenzialgleichung. Nat¨ urlich gibt es auch Funktionen, die von mehr Variablen als einer (z. B. ¨ derjenigen der Zeit) abh¨angen. Uberlegungen zu dieser Thematik u ¨berlassen wir allerdings anderen Kursen. Unser Ansatz hier ist besonders pragmatisch, denn gerade Anf¨ angern auf dem Gebiet der Differenzialgleichungen hilft es mehr, wenn die Methoden am Beispiel gesehen werden.
22.2
Grundlagen
Wir werden hier mit einem allgemein formulierten Fall gew¨ ohnlicher linearer Differenzialgleichungen beginnen. Dies dient dazu, diesen Typ in Zukunft sofort zu erkennen. Das ist wichtig, denn nur bei solchen Differenzialgleichungen greifen unsere L¨osungsmethoden. Andere Typen sind meist deutlich komplizierter. Beim ersten Teil der Definition werden wir bereits bekannte Elemente
333
22.2 Grundlagen
der Linearen Algebra verwenden, um eine kompakte Formulierung zu erm¨ oglichen. Bitte beachten Sie, dass bei der Definition unsere y — und auch deren Ableitungen — nirgends mit Potenzen ungleich 1 versehen sind oder gar der Sinus oder ¨ahnliches auf sie wirkt. Sie sind in gewisser Weise nackt. Das macht die Linearit¨at aus. Lassen sie sich nicht von Termen der Art y (k) irritieren. Dies ist nichts weiter als die bereits in der Analysis behandelte k-te Ableitung der entsprechenden Funktion. Bitte beachten Sie, dass wir im weiteren Text f¨ ur die gesuchte Funktion mal y(t), y(x) oder z. B. auch x(t) verwenden. Alle m¨ oglichen anderen Bezeichnungen sind nat¨ urlich auch m¨oglich und werden in der Literatur je nach Bedarf, Lust und Laune verwendet. Wichtig ist jedoch: Unsere Funktionen h¨ angen stets nur von einer Variablen ab. Nachfolgend werden wir die Abk¨ urzung DGL f¨ ur Differenzialgleichung verwenden.
Definition (DGL, Differenzialgleichungssystem, homogen, Inhomogenit¨ at, Koeffizienten) Sei A(t) f¨ ur jedes t ∈ R eine (n × n)-Matrix mit Eintr¨ agen aus R. Dann heißt dy (t) = A(t)y (t) + b(t) , y˙ = dt also
⎛
⎞ ⎛ y˙ 1 (t) a11 (t) ⎜ .. ⎟ ⎜ .. ⎝ . ⎠=⎝ . y˙ n (t)
an1 (t)
...
⎞⎛ ⎞ ⎛ ⎞ a1n (t) y1 (t) b1 (t) .. ⎟ ⎜ .. ⎟ + ⎜ .. ⎟ , . ⎠⎝ . ⎠ ⎝ . ⎠
...
ann (t)
yn (t)
bn (t)
gew¨ohnliches lineares Differenzialgleichungssystem erster Ordnung, b(t) ist die Inhomogenit¨at und A(t) (bestehend aus reellen Funktionen) wird Koeffizientenmatrix genannt. Ferner heißt y (n) (t) + a1 (t)y (n−1) (t) + . . . + an (t)y(t) = b(t)
(22.1)
gew¨ohnliche lineare DGL n-ter Ordnung. Ist b u ¨berall 0 bzw. b u ¨berall 0, so heißt das System bzw. die DGL homogen. Die reellen Funktionen a1 (t), . . . , an (t) heißen Koeffizienten. Die Ableitung eines Vektors (also hier die Ableitung von y (t)) ist so definiert, dass einfach alle seine Komponenten abgeleitet werden — wir werden dies bald in einem Beispiel sehen. F¨ ur h¨ohere Ableitungen ist dies analog definiert. Eine DGL der zuletzt genannten Form l¨asst sich stets in ein System wie im ersten Teil der Definition umschreiben, d. h. ein zu 22.1 geh¨ orendes System
334
22 Differenzialgleichungen
k¨ onnen wir immer untersuchen, wenn uns dies lieber ist. Wir werden allerdings prim¨ar 22.1 selbst betrachten und das zugeh¨orige System erster Ordnung nur aus theoretischen Gr¨ unden. Bitte beachten Sie, wo das n vorkommt: Aus der DGL n-ter Ordnung wird ein System erster Ordnung mit n-Zeilen! Es geht also weder etwas verloren, noch kommt etwas dazu. Nat¨ urlich kommen, z. B. in der Regelungstechnik, Systeme von DGLen erster Ordnung auch direkt vor.
22.3
Umschreiben in ein System am Beispiel
Wir haben bereits erw¨ahnt, dass sich lineare gew¨ ohnliche DGLen n-ter Ordnung in ein System erster Ordnung umschreiben lassen. Wir wollen dies hier an einem Beispiel durchf¨ uhren, denn die vermittelte Grundidee ist so besonders gut erkennbar und l¨asst sich auf Differenzialgleichungen h¨ oherer Ordnung ohne jegliche Probleme verallgemeinern. Wer das Prinzip verstanden hat, wird mit dem Verallgemeinern keine Probleme mehr haben.
Beispiel Seien a, b ∈ R und sei als Differenzialgleichung x ¨(t) + ax(t) ˙ + bx(t) = 0 gegeben. Schreiben wir nun x =: y1 und x˙ =: y2 als die Komponenten eines Vektors x(t) y1 (t) = y (t) = x(t) ˙ y2 (t) und leiten diesen ab, so erhalten wir x˙ ˙y = y˙ 1 = x˙ = . y˙ 2 x ¨ −ax˙ − bx Dies formen wir weiter so um, dass ein Differenzialgleichungssystem f¨ ur y entsteht y2 0 1 y1 y˙ = = = Ay . −ay2 − by1 y2 −b −a Nach diesem Muster wird das immer gemacht. Die hier behandelte DGL ist nicht einfach ausgedacht, sie hat eine tiefere Bedeutung. DGLen wie diese, also zweiter Ordnung, beschreiben Schwingungsph¨ anomene. Ferner ist erkennbar, dass sie einen Term ohne Ableitung, einen mit
22.4 Einige Fragestellungen und erste Antworten
335
erster Ableitung und einen mit zweiter Ableitung enth¨ alt, jeweils mit einem konstanten Faktor davor, der bei x ¨(t) einfach 1 ist. Nach dem, was wir bereits in der Motivation gesehen haben, sind also in dieser DGL Beschleunigung (¨ x(t)), Geschwindigkeit (x(t)) ˙ und Ort (x(t)) enthalten. Dies passt z. B. sehr gut auf ein Federpendel, bei dem gerade diese Gr¨oßen bestimmend sind: Die Masse am Ende eines Federpendels wird n¨amlich beschleunigt, hat eine bestimmte Geschwindigkeit und der Ort wird durch die jeweilige Auslenkung beschrieben.
m
Wundern Sie sich dar¨ uber, dass die Masse, m genannt, gar nicht in der Gleichung vorkommt? Sie ist aber doch da, wenn auch verborgen. Wir h¨ atten n¨amlich auch m¨ x(t) + a ˜x(t) ˙ + ˜bx(t) = 0 f¨ ur obige DGL schreiben k¨onnen, woraus dann nach dem Teilen durch m = 0 ˜ a ˜ b und b = m . Nach unserer Definition die obige Gleichung entsteht mit a = m am Anfang dieses Kapitels wollten wir aber vor der h¨ ochsten Ableitung eine 1 haben. Wenn nicht, so haben wir hier gesehen, passiert auch nichts Schlimmes, wir k¨onnen ja ohne Probleme die gesamte DGL durch den Faktor vor der h¨ochsten Ableitung teilen und haben dann die gew¨ unschte Form.
22.4
Einige Fragestellungen und erste Antworten
Nachdem sich die DGLen nun erstmals in Ihr Leben gedr¨ angt haben und Sie auch wissen, wozu diese gut sind, wollen wir nun einige Fragen aufwerfen, die eigentlich zwingend sind. Dies insbesondere, wenn wir an die DGLen als Beschreibung von Vorg¨angen in Natur und Technik denken. (Dabei sei bemerkt,
336
22 Differenzialgleichungen
dass in innermathematischen Problemen auch wahrlich furchtbare DGLen auftauchen k¨onnen.) Wir stehen vor folgenden wesentlichen Fragen: • Wie ist die Beschreibung eines Vorgangs durch eine DGL bzw. ein System? (Diese Beschreibung steht ganz am Anfang und ist die wesentliche Vorleistung des Intellekts.) • Existieren u ¨berhaupt L¨osungen? • Unter welchen Voraussetzungen sind diese L¨ osungen eindeutig? • Welche Eigenschaften haben die L¨osungen? Wir werden, zumindest f¨ ur den Typ der gew¨ohnlichen linearen DGLen, einige Antworten geben, wenn diese auch zumeist nicht durch einen Beweis begr¨ undet werden. Wir formulieren nun wesentliche Resultate in einem Satz. Um die Vertrautheit mit allen Formulierungen gew¨ohnlicher linearer Differenzialgleichungen zu f¨ordern, wird der Satz unter Verwendung von Differenzialgleichungssystemen aufgeschrieben. Wir erinnern uns, dass sich jede Differenzialgleichung n-ter Ordnung als System aus n Gleichungen erster Ordnung schreiben l¨ asst.
Satz Der L¨osungsraum des homogenen Differenzialgleichungssystems y˙ = A(t)y
,
A(t) ∈ M (n × n, R) (nicht die Nullmatrix)
ist ein Vektorraum der Dimension n, d. h. • Linearkombinationen von L¨osungen sind wieder L¨ osungen; • es gibt n linear unabh¨angige L¨osungen; osung die • sind y1 , . . . , yn linear unabh¨angige L¨osungen, so hat jede weitere L¨ Gestalt c1 y1 + . . . + cn yn (mit Konstanten c1 , . . . , cn aus K).
Die Vektoren y1 , . . . , yn bilden eine so genannte L¨ osungsbasis (auch Fundamentalsystem genannt). Wir betonen, dass sich nichts ¨ andert, wenn wir anstatt des Systems direkt die DGL der Ordnung n betrachten, die zu dem System gef¨ uhrt hat. Es kommen dann einfach keine Vektoren mehr vor und wir haben n linear unabh¨angige y1 , . . . , yn . Wenn wir demnach mal mehr oder weniger linear unabh¨angige L¨osungen finden als es durch die Ordnung der DGL garantiert
337
22.6 Standardl¨ osungsansatz I
¨ wird, haben wir mit Sicherheit etwas falsch gemacht oder u die ¨bersehen! Uber bereits mehrfach erw¨ahnte lineare Unabh¨angigkeit von Funktionen informiert uns sp¨ater der so genannte Wronski-Test.
22.5
L¨ osen durch Integration
Wir betrachten ein — bedeutendes aber zugleich einfaches — Beispiel. Es repr¨asentiert die Art gew¨ohnlicher DGLen, welche sich durch Integration l¨ osen lassen. Das ist so ziemlich das Beste, was uns passieren kann.
Beispiel F Wir betrachten F = m · a = m · x ¨ (Newton im einfachen Fall) bzw. x ¨= m in der bisher verwendeten Schreibweise f¨ ur DGLen. Wir nehmen an, dass F und m zeitlich konstant sind. Durch Integration erhalten wir x˙ =
F t + v0 . m
Eine weitere Integration liefert x=
F 2 t + v0 t + x0 . 2m
Es klappt somit alles ganz einfach, wenn nur die Funktion, mit welcher Ableitung auch immer, isoliert vorkommt. Sie sehen an der Rechnung oben, dass die Integration unbestimmt ist. Klar, wir haben ja keine Grenzen gegeben. Dadurch taucht allerdings stets eine Integrationskonstante auf, die wohl beachtet werden muss. Wird diese vergessen, leidet auch der physikalische Inhalt gewaltig. So haben wir nach der ersten Integration v0 f¨ ur die Anfangsgeschwindigkeit ur den Ort, um zu ber¨ ucksichtigen, dass sich unund im n¨achsten Schritt x0 f¨ ser Probeteilchen der Masse m an einem beliebigen Ort befinden kann. Ohne diese Integrationskonstanten w¨are die Beschreibung einer m¨ oglichen Realit¨ at also unvollst¨andig. Sie sehen daher, wie gut die Mathematik u at ¨ber die Realit¨ Bescheid weiß.
22.6
Standardl¨ osungsansatz I
Wir betrachten nun die L¨osungsmethode f¨ ur gew¨ ohnliche, lineare DGLen nter Ordnung mit konstanten Koeffizienten, welche homogen sind. Wenn wir von konstanten Koeffizienten sprechen meinen wir damit stets, dass die ai (t) konstant sind, also gleich einer Zahl ai ∈ R.
338
22 Differenzialgleichungen
Dies zeigen wir beispielhaft f¨ ur eine DGL dritter Ordnung y (x) + a1 y (x) + a2 y (x) + a3 y(x) = 0 , allerdings ist das Verfahren f¨ ur alle Ordnungen n ∈ N gleich. Als Ansatz verwenden wir den so genannten Exponentialansatz y(x) = eλx
,
λ∈C.
Dieser, in die DGL eingesetzt, liefert λ3 eλx + a1 λ2 eλx + a2 λeλx + a3 eλx = 0 . Nach Division durch eλx — dies ist erlaubt, da eλx nie Null werden kann – erhalten wir das so genannte charakteristische Polynom der DGL auf der linken Seite: λ3 + a 1 λ 2 + a 2 λ + a 3 = 0 . Im Komplexen hat ein Polynom 3. Grades genau drei Nullstellen λ1 , λ2 und λ3 ∈ C. L¨osungen der betrachteten DGL sind demnach y 1 = eλ 1 x ,
y2 = eλ2 x ,
y3 = eλ3 x .
Setzen wir also eine der Funktionen in die DGL ein, bekommen wir auf der rechten Seite tats¨achlich Null als Ergebnis. Die auf diese Weise erhaltenen Funktionen sind sogar linear unabh¨angig, solange die λi verschieden sind. Zur ¨ Uberpr¨ ufung der linearen Unabh¨angigkeit von Funktionen brauchen wir keine neue Theorie, denn die von uns betrachteten Funktionen sind stets wieder Elemente eines Vektorraumes und alles bleibt wie gehabt. Die Bezeichnung charakteristisches Polynom ist bereits bei der Berechnung von Eigenwerten aufgetaucht. (Die doppelte Verwendung der Bezeichnung ist nicht zuf¨allig.) Nun kommen wir zu einem sehr wichtigen Punkt: Die Ableitung war nach ¨ unseren Uberlegungen eine lineare Abbildung. D. h. im vorliegenden Fall der homogenen DGL, dass auch Linearkombinationen der drei L¨ osungen wieder L¨osungen sein m¨ ussen: yH (x) = c1 eλ1 x + c2 eλ2 x + c3 eλ3 x . Das gleiche Prinzip kennen wir bereits von homogenen linearen Gleichungssystemen. Entsprechend haben wir die L¨osung yH genannt, weil es sich um die allgemeine L¨osung der homogenen DGL handelt. Wir gingen hier davon aus, dass f¨ ur unser charakteristisches Polynom wirklich nur Nullstellen mit der Vielfachheit 1 vorkommen. Das muss jedoch nicht sein. Die L¨osungen sehen dann etwas komplizierter aus, wir kommen im n¨ achsten Abschnitt auf diesen Fall zur¨ uck.
339
22.7 Standardl¨ osungsansatz II
Beispiel Wir untersuchen hier y¨(t) + 5y(t) ˙ + 2y(t) = 0 . Diese DGL ist linear, homogen und hat nur konstante Koeffizienten, sie kann d2 durch den Exponentialansatz gel¨ost werden. Es folgt (mit dt ur die zweite 2 f¨ Ableitung nach der Zeit)
⇒
d2 λt d (e ) + 5 (eλt ) + 2eλt = 0 dt2 dt λ2 eλt + 5λeλt + 2eλt = 0 .
Teilen durch eλt ergibt
λ2 + 5λ + 2 = 0
und Aufl¨osen liefert √ 1 −5 + 17 2 √ 1 −5 − 17 . λ2 = 2
λ1 =
Die allgemeine L¨ osung yH folgt dann wieder aus dem Bilden aller Linearkombinationen der beiden L¨osungen: 1
yH = c1 e 2 (−5+
√ 17)t
1
+ c2 e 2 (−5−
√ 17)t
.
22.7
Standardl¨ osungsansatz II
Wir wollen unseren Standardl¨osungsansatz f¨ ur lineare homogene DGLen mit konstanten Koeffizienten weiter ausbauen. Zuvor haben wir bemerkt, dass es auch F¨alle gibt, bei denen es in gewisser Weise nicht gen¨ ugend Nullstellen des charakteristischen Polynoms gibt. Damit ist gemeint, dass Nullstellen mehrfach vorkommen. Dies ist z. B. dann der Fall, wenn das charakteristische Polynom (λ − 1)2 w¨are, bei dem dann λ1 = 1 eine doppelte Nullstelle sein w¨ urde. Bei dieser Problematik hilft der folgende Satz, den wir im Anschluss insbesondere deshalb beweisen, weil Ideen aus der Linearen Algebra eingehen, die wir bereits kennen.
Satz Ist λ1 eine k-fache Nullstelle des charakteristischen Polynoms, welches nach Einsetzen von y(t) = eλt in die DGL y (n) (t) + a1 y (n−1) (t) + . . . + an y(t) = 0
340
22 Differenzialgleichungen
mit konstanten Koeffizienten entsteht, so sind die Funktionen y1 = eλ1 t , y2 = teλ1 t , . . . , yk = tk−1 eλ1 t linear unabh¨angige L¨osungen.
Den Beweis dieses Satzes teilen wir in zwei Teile auf: die lineare Unabh¨ angigkeit und die L¨osungseigenschaft. • Sei c0 eλ1 t +c1 teλ1 t +. . .+ck−1 tk−1 eλ1 t = 0. Diese Gleichung ist ¨ aquivalent zu ochstens k − 1 Nullstellen c0 + c1 t + . . . + ck−1 tk−1 = 0. Da dieses Polynom h¨ hat, diese Gleichung aber f¨ ur alle t gelten muss, folgt c0 = . . . = ck−1 = 0. Also sind eλ1 t , . . . , tk−1 eλ1 t linear unabh¨angig. ¨ • Zur besseren Ubersicht bei den folgenden Rechnungen nehmen wir das Bilden der Ableitung als lineare Abbildung D wahr: D : y → y˙ , j
Dann ist D y = y
(j)
D − λ : y → y˙ − λy .
und unsere DGL wird zu
Dn y+a1 Dn−1 y+. . .+an−1 Dy+an y = (Dn +a1 Dn−1 +. . .+an−1 D+an )y = 0 . Das charakteristische Polynom der DGL kann nach der Voraussetzung des Satzes in λn + a1 λn−1 + . . . + an−1 λ + an = (λ − λ1 )k (λ − λ2 ) . . . (λ − λm ) zerlegt werden. Die gleiche Zerlegung k¨onnen wir auf den DGL-Ausdruck u ¨bertragen: Dn + a1 Dn−1 + . . . + an−1 D + an = (D − λ1 )k (D − λ2 ) . . . (D − λm ) , sodass die DGL nun (D − λ1 )k (D − λ2 ) . . . (D − λm )y = 0 lautet. Wir berechnen nun exemplarisch (D − λ1 )k yk , woraus klar wird, was der Ausdruck selbst ergibt: (D − λ1 )(tk−1 eλ1 t ) = (k − 1)tk−2 eλ1 t + tk−1 λ1 eλ1 t − λ1 tk−1 eλ1 t = (k − 1)tk−2 eλ1 t , (D − λ1 )2 (tk−1 eλ1 t ) = (D − λ1 )((k − 1)tk−2 eλ1 t ) = (k − 2)(k − 1)tk−3 eλ1 t und schließlich (D − λ1 )k−1 (tk−1 eλ1 t ) = 1 · 2 · . . . · (k − 2)(k − 1)t0 eλ1 t = ceλ1 t , (D − λ1 )k (tk−1 eλ1 t ) = (D − λ1 )(ceλ1 t ) =0.
341
22.8 Finden einer partikul¨ aren L¨ osung
Die zus¨atzlichen Faktoren (D − λ2 ) bis (D − λm ) werden an diesem Ergebnis atten. Ist der Exponent nichts a¨ndern, womit wir yk als L¨osung identifiziert h¨ des Faktors t kleiner als k − 1, so wird der Ausdruck nur noch schneller Null, womit auch die L¨osungseigenschaft der anderen yj gezeigt w¨ are.
22.8
Finden einer partikul¨ aren L¨ osung
Was passiert aber nun bei inhomogenen DGLen? Diese erscheinen in der Praxis sehr h¨aufig. Denken Sie z. B. an einen Schwingkreis, der in jedem Radio und jeder Quarzuhr vorhanden ist, um nur wenige Bespiele zu nennen. Dieser wird durch eine Differenzialgleichung zweiter Ordnung beschrieben und der Schwingkreis wird z. B. durch den aus der Physik sicher bekannten Term sin(ωt) angeregt, wobei ω die Kreisfrequenz bezeichnet. Wir haben dann eine DGL der Form x ¨(t) + ax(t) ˙ + bx(t) = sin(ωt) .
Satz Sei yP eine L¨osung der inhomogenen DGL y˙ = A(t)y + b(t) und yH die allgemeine L¨osung der zugeh¨origen homogenen DGL y˙ = A(t)y . Dann ist die allgemeine L¨osung dieser inhomogenen DGL gegeben durch y = yH + yP . yP wird auch partikul¨are oder spezielle L¨osung genannt.
Auch hier k¨onnen wir wieder die zum System f¨ uhrende DGL der Ordnung n betrachten und erhalten y = yH + yP . Wir werden uns zum Finden einer partikul¨aren L¨ osung mit einem einfach zu durchschauenden Verfahren vertraut machen, welches allerdings sehr wirkungsvoll ist. Es wird als intelligentes Raten oder auch Ansatz vom Typ der rechten Seite bezeichnet. Zuvor erinnern wir uns noch an das, was gesucht wird: Die L¨osung einer inhomogenen DGL hatte die Form y=
yH
allg. homog. Lsg.
+
yP
.
eine partik. Lsg.
Die allgemeine homogene L¨osung k¨onnen wir bereits finden; widmen wir uns daher der Suche nach yP .
342
22 Differenzialgleichungen
Betrachten wir eine DGL y (n) (t) + a1 y (n−1) (t) + . . . + an y(t) = b(t)
(22.2)
mit konstanten Koeffizienten, so l¨asst sich Folgendes beobachten: Setzen wir in die linke Seite von 22.2 die folgenden Formen f¨ ur y(t) ein • Polynom p(t), • p(t)ert , • p(t) sin t oder p(t) cos t, so ergibt sich als Resultat wieder eine derartige Form. Entspricht also b(t) in 22.2 selbst eine dieser Formen, so setzen wir y(t) gleichfalls so an.
Beispiel F¨ ur eine partikul¨are L¨osung der DGL y¨ − y = t verwenden wir als Ansatz ein allgemeines Polynom ersten Grades y(t) = at + b ,
y˙ = a ,
y¨ = 0 .
Einsetzen in die DGL ergibt 0 − (at + b) = t , somit ist a = −1 und b = 0 und yP (t) = −t ist eine partikul¨are L¨osung.
22.9
Anfangswertprobleme
Betrachten wir ein Pendel, so h¨angt seine Position nach einer Zeit t mit Sicherheit auch davon ab, welche Anfangsgeschwindigkeit und Position es zum Start gehabt hat. Wir ben¨otigen somit offensichtlich weitere Informationen, wenn wir eine L¨osung einer DGL — welche unser Problem beschreibt — geeignet angeben wollen. Denken wir erneut an die Schwingungsgleichung, so enth¨ alt die allgemeine homogene L¨osung die beiden Konstanten c1 und c2 . M¨ ochten wir diese bestimmen, so ben¨otigen wir daf¨ ur zwei geeignete Gleichungen. Diese liefert gerade die Festlegung von zwei Anfangswerten.
343
22.9 Anfangswertprobleme
Definition (Anfangswertproblem, AWP) Sei wie zuvor y˙ (t) = A(t)y (t) + b(t) gegeben. Sei ferner f¨ ur t 0 ∈ R y (t0 ) = y0 gegeben. Wir sprechen insgesamt von einem Anfangswertproblem (AWP).
Satz Wenn nun A(t) und b(t) auf einem Intervall I ⊆ R ausschließlich stetige Einur jedes y0 genau tr¨ age aij (t) und bi (t) haben und t0 ∈ I ist, so hat das AWP f¨ eine auf ganz I definierte L¨osung. In der homogenen L¨osung der DGL tauchten Konstanten c1 , . . . , cn auf. Diese werden nun durch y0 bestimmt. Daher wird als Ergebnis eine eindeutige L¨osung gefunden. Die Theorie wurde wieder f¨ ur Systeme erster Ordnung angegeben. Alles gilt aber nat¨ urlich auch f¨ ur die von uns behandelten DGLen n-ter Ordnung.
Beispiel Wir betrachten die Differenzialgleichung ur reelles ω = 0. y¨(t) + ω 2 y(t) = 0 f¨ Der Exponentialansatz liefert:
⇔
d2 λt (e ) + ω 2 eλt = 0 dt2 λ2 eλt + ω 2 eλt = 0
⇔
λ2 + ω 2 = 0
⇔
λ = ±iω .
Wir betrachten die folgenden Anfangsbedingungen: ˙ =0. t0 = 0, y(0) = 1, y(0) Nach obiger Rechnung haben wir als L¨osung y(t) = Aeiωt + Be−iωt , also y(0) = A + B = 1
344
22 Differenzialgleichungen
und
y(0) ˙ = iωAeiω0 − iωBe−iω0 = 0 ,
damit A − B = 0. Insgesamt folgt also A = B =
1 2
und daraus:
1 iωt 1 −iωt e + e 2 2 1 1 1 1 = cos ωt + i sin ωt + cos ωt − i sin ωt 2 2 2 2 = cos ωt .
y(t) =
Im letzten Teil der Rechnung verwendeten wir die Euler-Formel.
22.10
Wronski-Test
Bei den L¨osungen einer DGL n-ter Ordnung wissen wir, dass n linear unabh¨angige L¨osungen zu erwarten sind. Der Nachweis der linearen Unabh¨ angigkeit l¨asst sich direkt mithilfe der Definition durchf¨ uhren, allerdings ist das meist etwas m¨ uhsam. Es gibt jedoch einen einfachen Test (Wronski-Test genannt), den wir nun vorstellen.
Satz Seien y1 , . . . , yn auf dem Intervall I mindestens (n − 1) mal differenzierbar und sei x0 ∈ I. Sind die Vektoren ⎛ ⎞ ⎛ ⎞ y1 (x0 ) yn (x0 ) ⎜ y1 (x0 ) ⎟ ⎜ yn (x0 ) ⎟ ⎜ ⎟ ⎜ ⎟ .. .. ⎜ ⎟ , ... , ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ . . (n−1) (n−1) (x0 ) (x0 ) y1 yn linear unabh¨angig bzw. die Determinante der (n × n)-Matrix ⎛ ⎞ ... yn (x0 ) y1 (x0 ) ⎜ y1 (x0 ) ... yn (x0 ) ⎟ ⎜ ⎟ W := ⎜ .. .. ⎟ ⎝ ⎠ . . (n−1)
y1
(x0 )
...
(n−1)
yn
(x0 )
ungleich Null, so sind die Funktionen y1 , . . . , yn auf I linear unabh¨ angig. Die aus den Vektoren gebildete Matrix W heißt Wronski-Matrix . Bitte beachten Sie, dass das x0 eine besondere Rolle spielt, die h¨ aufig falsch verstanden wird; es gen¨ ugt wirklich ein solches x0 , um mit dem obigen Satz eine Aussage u ¨ber die lineare Unabh¨angigkeit zu bekommen.
345
22.10 Wronski-Test
Der Beweis verwendet nochmals einige sch¨one Ideen, mit denen wir bereits vertraut sind: Wir betrachten zuerst die Linearkombination der Funktionen y1 , . . . , yn λ1 y1 (x) + . . . + λn yn (x) = 0, die f¨ ur alle x ∈ I gelten soll. F¨ ur die lineare Unabh¨ angigkeit m¨ ussen wir wie u ¨blich zeigen, dass aus dieser Gleichung folgt, dass alle λi = 0 sind. Um eine Beziehung zur Wronski-Matrix zu bekommen, liegt es nahe, diese Gleichung (n − 1)-mal zu differenzieren: λ1 y1 (x) + . . . + λn yn (x) = 0, λ1 y1 (x) + . . . + λn yn (x) = 0, .. . (n−1)
λ1 y1
(x) + . . . + λn yn(n−1) (x) = 0.
Alle diese Gleichungen lassen sich zu einem homogenen Gleichungssystem zusammenfassen ⎛
y1 (x) .. ⎜ ⎝ . (n−1)
y1
(x)
... ...
⎞⎛ ⎞ ⎛ ⎞ yn (x) 0 λ1 .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟ ⎠ ⎝ . ⎠ = ⎝.⎠ , . (n−1) 0 λn yn (x)
wobei die Matrix auf der linken Seite gerade die Wronski-Matrix ist. angig, Sind nun die Spaltenvektoren der Matrix an einer Stelle x0 linear unabh¨ so hat die Wronski-Matrix maximalen Rang n. Das zuvor aufgestellte LGS besitzt somit die eindeutige L¨osung λ1 = . . . = λn = 0. Dies bedeutet die lineare Unabh¨angigkeit der Funktionen y1 , . . . , yn .
Beispiel Seien y1 (x) = sin x und y2 (x) = cos x. y1 (x) y (x) 1
y2 (x) sin x cos x = = − sin2 (x) − cos2 (x) = −1 = 0 . y2 (x) cos x − sin x
Somit sind die Funktionen sin x und cos x linear unabh¨ angig. Daf¨ ur h¨ atte allerdings auch schon das Finden eines x0 , an dem die Determinante ungleich Null ist, ausgereicht, was die Kenntnis der Eulergleichung nicht einmal ver langt h¨atte. Ein Beispiel w¨are hier x0 = 0.
346
22.11
22 Differenzialgleichungen
Beispiel fu ¨ r nicht-lineare Differenzialgleichungen
Zum Abschluss wollen wir noch einen Blick hinter den Horizont der Welt der linearen DGLen werfen. Der folgende Teil behandelt in elementarer Weise in Form von DGLen das Verhalten eines Systems, in welchem sich eine Beute- (z. B. Kaninchen, mit x(t) bezeichnet) und eine R¨ auberpopulation (z. B. F¨ uchse, mit y(t) bezeichnet) begegnen. Es handelt sich hier um einen klassischen Fall, bei dem ein Geschehen in der Natur mittels DGLen modelliert wird. Die Realit¨at ist komplexer als hier idealisiert angenommen. Dennoch bekommen wir einen lehrreichen Einblick in ein weiteres (und sehr aktuelles) Gebiet der Mathematik und ihrer Anwendung. Was wird in einem solchen R¨auber-Beute-System passieren: Die Kaninchen werden sich munter vermehren, wenn sie ordentlich Futter haben und sie keiner daran hindert. Das Wachstum ist dann exponentiell, gen¨ ugt also der Differenzialgleichung x(t) ˙ = wx(t), wobei w eine Konstante ist, die als Wachstumsrate beschrieben werden kann. Kommen nun F¨ uchse ins Spiel, werden diese sich das eine oder andere Kaninchen zu Gem¨ ute f¨ uhren, was eine Verminderung von x(t) zur Folge hat, welche direkt mit der Anzahl der Begegnungen mit den R¨ aubern zusammenh¨ angt. Dies schl¨agt sich in folgender DGL nieder: x(t) ˙ = wx(t) − bx(t)y(t). Die Konstante b spiegelt dabei die H¨aufigkeit der Begegnungen zwischen Kaninchen und F¨ uchsen wider. Nun kann es passieren, dass sich die Kaninchen z. B. selbst in Rangk¨ampfe verstricken, wodurch es Todesf¨ alle geben kann; dies f¨ uhrt dann unter Verwendung der Konstanten d zur DGL x(t) ˙ = wx(t) − bx(t)y(t) − dx2 (t), denn es begegnen sich Kaninchen untereinander, und d gibt Auskunft dar¨ uber, wie gef¨ahrlich sie f¨ ur einander sind. Nun ist es kein Problem mehr, die entsprechende DGL f¨ ur die Fuchspopulation aufzustellen: ˜ 2 (t). y(t) ˙ = −wy(t) ˜ + ˜bx(t)y(t) − dy Hier sind w, ˜ ˜b und d˜ wieder Konstanten (deren Bedeutung bereits nach den vorigen Ausf¨ uhrungen klar sein sollte). Der Term −wy(t) ˜ entsteht aufgrund der Tatsache, dass die F¨ uchse ohne Nahrung von ihrer Anzahl her exponentiell abnehmen, sich allerdings durch ausreichend Futter vermehren, woraus der Term ˜bx(t)y(t) resultiert. Der letzte Ausdruck erkl¨art sich wie sein Pendant f¨ ur die Kaninchen, denn auch F¨ uchse sind nicht immer nett zueinander.
347
22.12 Aufgaben
Was f¨allt uns auf? Beide DGLen enthalten sowohl x(t) als auch y(t), bilden also ein gekoppeltes System. Das hatten wir noch nicht (es ist auch nicht wirklich einfach zu behandeln . . . ). Des Weiteren tauchen hier Quadrate auf, also liegt ein Beispiel f¨ ur einen nicht-linearen Fall vor. Die DGLen entsprechen somit gar nicht dem, was bisher behandelt wurde. Wir wollten ja auch u ¨ber den Horizont hinaus. An diesem System lassen sich noch viele weitere Dinge u ¨ber DGLen lernen, aber dies sehen Sie in einer zuk¨ unftigen mathematischen Reise.
22.12
Aufgaben
1. Schreiben Sie jeweils die Differenzialgleichung in ein System 1. Ordnung um. (a) y = ex−x0 (y − y) + (x − x0 )2 y ; (b) x2 (y + y + y + y ) = 1. 2. Betrachten Sie die Differenzialgleichung y + y = 0 . (a) Um welche Art von Differenzialgleichung handelt es sich und was k¨onnen Sie bereits u osungen sagen? ¨ber die Menge ihrer L¨ (b) Finden Sie eine L¨osungsbasis der DGL und nennen Sie den gesamten L¨osungsraum. 3. Betrachten Sie die Differenzialgleichung y + y = ex . (a) Um welche Art von Differenzialgleichung handelt es sich und was k¨onnen Sie bereits u osungen sagen? ¨ber die Menge ihrer L¨ (b) Finden Sie die allgemeine L¨osung der homogenen DGL. (c) Erraten Sie eine L¨osung der inhomogenen DGL und nennen Sie ihren gesamten L¨osungsraum. 4. Betrachten Sie die DGL y + ay + by = 0 mit Konstanten a und b. (a) Berechnen Sie das charakteristische Polynom dieser DGL. (b) Formen Sie die DGL in ein System der Gestalt y = Ay um und berechnen Sie dann das charakteristische Polynom der Matrix A. Was f¨allt Ihnen dabei auf? 5. Finden Sie jeweils die allgemeine L¨osung folgender homogener DGLen: (a) 3y + 6y + 3y = 0,
348
22 Differenzialgleichungen
(b) y − 4y + 4y = 0, (c) y − 3y + 3y − y = 0. 6. Finden Sie zu der Differenzialgleichung 2y + y + 3y = sin 2x eine partikul¨are L¨osung mithilfe des Ansatzes vom Typ der rechten Seite. Wie ist der entsprechende Ansatz bei folgenden rechten Seiten? (a) . . . = x2 e3x (b) . . . = 3 (c) . . . = sin x − 2x cos x 7. L¨osen Sie folgendes AWP: y + 3y + 2y = 0 ,
y(2) = 3, y (2) = −2 .
¨ 8. Uberpr¨ ufen Sie folgende Funktionen auf lineare (Un-)abh¨ angigkeit: f1 (x) = ex ,
f2 (x) = ex sin x ,
f3 (x) = ex cos x .
Zeigen Sie weiterhin, dass die konstante Nullfunktion (f (x) = 0 f¨ ur alle x ∈ R) zu jeder anderen Funktion linear abh¨ angig ist.
22.13
L¨ osungen
1. (a) y = ex−x0 (y − y) + (x − x0 )2 y ⇔ y = ex0 −x y + 1 − ex0 −x (x0 − x)2 y 0 y y = = ⇒ y 1 − ex0 −x (x0 − x)2 y
y ex0 −x y 1
(b) x2 (y + y + y + y ) = 1 1 ⇔ y = −y − y − y + 2 x ⎛ ⎞ ⎛ ⎞ ⎛ 0 1 y y 0 ⇒ ⎝ y ⎠ = ⎝ y ⎠ = ⎝ 0 y y −1 −1
⎞⎛ ⎞ ⎛ ⎞ 0 y 0 1 ⎠ ⎝ y ⎠ + ⎝ 0 ⎠ y −1 x−2
2. (a) Es handelt sich um eine gew¨ohnliche, lineare, homogene DGL 2. Ordnung mit konstanten Koeffizienten und der L¨ osungsraum ist ein zweidimensionaler Vektorraum.
349
22.13 L¨ osungen
(b) Der Ansatz y(x) = eλx , y (x) = λeλx , y (x) = λ2 eλx liefert nach dem Einsetzen in die DGL: eλx (λ2 + λ) = 0 ⇒
λ1 = 0 ,
λ2 = −1
⇒
{y1 (x) = e
λ1 x
y2 (x) = eλ2 x = e−x } ist L¨ osungsbasis.
=1,
L¨osungsraum ist L = {a + be−x | a, b ∈ R}. 3. (a) Es handelt sich um eine gew¨ohnliche, lineare, inhomogene DGL 1. Ordnung. Der L¨osungsraum hat die Form y(x) = yH (x) + yP (x), wobei yH die allgemeine L¨osung der homogenen DGL ist (ein eindiare L¨ osung der inhomensionaler Vektorraum) und yP eine partikul¨ mogenen DGL. (b) Der Ansatz y(x) = eλx f¨ uhrt, eingesetzt in die homogene DGL, zur Gleichung eλx (λ + 1) = 0 , osung was λ = −1 impliziert. Also ist yH (x) = ae−x die allgemeine L¨ der homogenen DGL. (c) Eine spezielle L¨osung der inhomogenen DGL ist yP (x) = 12 ex . Der gesamte L¨osungsraum ergibt sich damit zu {ae−x + 12 ex | a ∈ R}. 4. (a) Das charakteristische Polynom der DGL erhalten wir durch Einsetzen des Exponentialansatzes in die DGL: λ2 + aλ + b . (b) In ein System 1. Ordnung umgeformt lautet die DGL 0 1 y y . = −b −a y y Das charakteristische Polynom der Matrix ist 0 − λ 1 = −λ(−a − λ) − (−b) = λ2 + aλ + b . −b −a − λ Beide Polynome sind gleich. 5. Die charakteristischen Polynome erhalten wir durch Einsetzen des Exponentialansatzes y(x) = eλx . Sie und ihre Nullstellen lauten: (a) 3λ2 + 6λ + 3 = 3(λ + 1)2 , 3
2
3
2
λ1 = λ2 = −1,
2
(b) λ − 4λ + 4λ = λ(λ − 2) ,
λ1 = 0, λ2 = λ3 = 2, 3
(c) λ − 3λ + 3λ − 1 = (λ − 1) ,
λ1 = λ2 = λ3 = 1.
Somit erhalten wir als allgemeine L¨osungen
350
22 Differenzialgleichungen
(a) yH (x) = ae−x + bxe−x , (b) yH (x) = a + be2x + cxe2x , (c) yH (x) = aex + bxex + cx2 ex . 6. Der entsprechende Ansatz (mit Ableitungen) f¨ ur sin 2x als rechte Seite ist y(x) = a sin 2x + b cos 2x , y (x) = −2b sin 2x + 2a cos 2x , y (x) = −4a sin 2x − 4b cos 2x . Eingesetzt in die DGL ergibt sich (−8a − 2b + 3a) sin 2x + (−8b + 2a + 3b) cos 2x = sin 2x . Koeffizientenvergleich f¨ uhrt zu den Gleichungen −5a − 2b = 1 2a − 5b = 0 5 sin 2x − Somit ist yp (x) = − 29 DGL.
2 29
⇔
5 29 2 b=− . 29
a=−
cos 2x eine partikul¨ are L¨ osung der
(a) Ansatz y(x) = (ax2 + bx + c)e3x (b) Ansatz y(x) = a (c) Ansatz y(x) = (ax + b) sin x + (cx + d) cos x ost 7. Die DGL y +3y +2y = 0 kann wieder mit dem Ansatz y(x) = eλx gel¨ werden. F¨ ur λ ergibt sich die Gleichung (links steht das charakteristische Polynom) λ2 + 3λ + 2 = 0, also λ1 = −1 und λ2 = −2. Somit ist die allgemeine L¨osung der homogenen DGL yH (x) = ae−x + be−2x . Die Anfangswerte y(2) = 3 und y (2) = −2 setzten wir in xH ein: y(2) = ae−2 + be−4 = 3 , y (2) = −ae−2 − 2be−4 = −2 . Die eindeutige L¨osung des Gleichungssystems ist a = 4e2 und b = −e4 . Somit ist die L¨osung des AWPs y(x) = 4e2−x − e4−2x .
351
22.13 L¨ osungen
8. f1 (x) f1 (x) f (x) 1
f2 (x) f2 (x) f2 (x)
f3 (x) ex f3 (x) = ex f3 (x) ex
An der Stelle x = 0 wird dies zu 1 0 1 1 1 2
ex sin x x e (sin x + cos x) ex (2 cos x)
ex cos x x e (cos x − sin x) ex (−2 sin x)
1 1 = −1 = 0 . 0
Also sind die fi linear unabh¨angig. Achtung: W¨are die Determinante f¨ ur x = 0 Null gewesen, h¨ atte uns das noch nichts u ur ein anderes ¨ber lineare (Un-)Abh¨angigkeit gesagt, denn f¨ x k¨onnte die Determinante wieder ungleich Null sein. Die konstante Nullfunktion und eine beliebige andere Funktion g sind linear abh¨angig, denn es gilt 1·0+0·g =0 , womit wir eine Linearkombination der beiden Funktionen h¨ atten, deren Koeffizienten nicht alle Null sind und die als Ergebnis Null ergibt.
352
22 Differenzialgleichungen
Fragen • Was ist ein gew¨ohnliches lineares inhomogenes Differenzialgleichungssystem erster Ordnung mit konstanten Koeffizienten? • Schreiben Sie die Schwingungsgleichung f¨ ur ein Federpendel in ein System erster Ordnung um. • Wie lautet der Exponentialansatz? • K¨onnen Sie Differenzialgleichungen aufschreiben, die sich durch Integration l¨osen lassen? • Was ist eine partikul¨are L¨osung im Zusammenhang mit Differenzialgleichungen? • Was ist ein Fundamentalsystem? • Was k¨onnen Sie u osungen einer gew¨ ohn¨ber Linearkombinationen von L¨ lichen homogenen linearen Differenzialgleichung mit konstanten Koeffizienten sagen? • Was passiert, wenn bei den hier behandelten gew¨ ohnlichen Differenzialgleichungen eine k-fache Nullstelle des charakteristischen Polynoms vorkommt? • Wie (und f¨ ur welche Typen der Inhomogenit¨ at) findet man eine partikul¨are L¨osung? • Was ist ein Anfangswertproblem und wie formuliert man ein solches mathematisch exakt? • Wie lautet der Satz u ¨ber den Wronski-Test? • Leiten Sie die Differenzialgleichungen f¨ ur ein R¨ auber-Beute-System her.
Klausuraufgaben
23 Analysis
23.1
Aufgaben
1. Beweisen Sie mit vollst¨andiger Induktion die Summenformel n 2 n 3 k = k . k=1
k=1
2. Vereinfachen Sie folgende Terme bis zur Form a + bi: (3 + 4i)(1 − i) ,
i3 + i 2 + i + 1 ,
i+1 . 2+i
3. Berechnen Sie alle drei L¨osungen von z 3 = 1 + i mit Hilfe der dritten Einheitswurzeln. 4. Zeigen Sie f¨ ur beliebige komplexe Zahlen z ∈ C, dass z 2 = z¯2 gilt. 5. Zeigen Sie, dass f¨ ur streng monoton wachsende Funktionen f , g : R → R auch f + g streng monoton wachsend ist. 6. Bestimmen Sie den Definitionsbereich der folgenden Funktion sowie die links- und rechtsseitigen Grenzwerte an s¨amtlichen Randpunkten: f (x) := ln(sin x) . 7. Zeigen Sie, dass die Ableitung einer π-periodischen, differenzierbaren Funktion wieder π-periodisch ist. 8. Bestimmen Sie den Definitions- und den minimalen Wertebereich (Teilmengen von R) von √ f (x) := sin2 x und differenzieren Sie die Funktion. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_23
356
Klausuraufgaben
9. Berechnen Sie alle (reellen und komplexen) Nullstellen von P (x) := x3 − x2 + x − 1 . 10. Zeigen Sie ohne Berechnung von Grenzwerten, dass die Funktion f (x) :=
x3 + 2x2 − 5x − 6 −x2 − x + 6
in den Nullstellen des Nenners stetig erg¨anzt werden kann und berechnen Sie die entsprechenden Funktionswerte der stetigen Erg¨ anzung. 11. F¨ uhren Sie eine Partialbruchzerlegung des folgenden Bruches durch: 2x3 − x2 + 3x − 1 . x3 − 2x2 + x ur beliebige a ∈ R. 12. Bestimmen Sie lim (ln x − ln(x + a)) f¨ x→∞
13. Berechnen Sie den Wert der Reihe ∞ k=1
1 k(k + 1)
u ¨ber ihre Partialsummen. Hinweis: Ein hilfreicher Trick ist, die Summanden wie bei der Partialbruchzerlegung in mehrere Br¨ uche zu zerlegen. 14. Sind die folgenden Aussagen wahr oder falsch? Begr¨ unden Sie die Aussage, wenn sie wahr ist, geben Sie ein Gegenbeispiel an, wenn die Aussage falsch ist. • Beliebige Teilfolgen konvergenter Folgen sind wiederum konvergent ” gegen den gleichen Grenzwert.“ • Beliebige Teilfolgen divergenter Folgen sind wiederum divergent.“ ”
πk 15. Zeigen Sie, dass die Folge sin 2k−2 konvergiert und bestimmen Sie deren Grenzwert. ∞ 16. Seien k=0 ak absolut konvergent und (bk ) eine Nullfolge. Was l¨ asst sich u ¨ber die Konvergenz der Reihe ∞
a k bk
k=0
aussagen? 17. Untersuchen Sie folgende Reihen mit geeigneten Konvergenzkriterien: ∞ ek , kk
k=0
∞ ln k k=1
k!
.
357
Aufgaben zur Analysis
18. Setzen Sie die Funktion
x −1 mit Hilfe des Satzes von l’Hospital in x0 := 0 stetig fort und berechnen Sie die Ableitung der fortgesetzten Funktion in x0 . f (x) :=
ex
19. Setzen Sie die Funktion f : R+ → R
,
f (x) := x ln x
im Punkt x0 := 0 stetig fort. (Es ist R+ := {x ∈ R | x > 0}.) Hinweis: Hier hilft Ihnen der Satz von l’Hospital. ¨ 20. Uberpr¨ ufen Sie, ob die Voraussetzungen f¨ ur den Satz von l’Hospital erf¨ ullt sind und berechnen Sie den Grenzwert: ex − e . x→1 ln x lim
21. Untersuchen Sie die reelle Potenzreihe ∞ (x + 3)k k=0
k2
auf Konvergenz. 22. Leiten Sie die Quotientenregel aus der Produktregel her. 23. Berechnen Sie die Taylorreihe von f (x) := sinh x um den Entwicklungspunkt x0 = 0. 24. Berechnen Sie, wenn m¨oglich, #1 0
1 1 sin dx . x2 x
25. Berechnen Sie die Stammfunktionen von ex cos x. 26. Berechnen Sie das Integral #2 x ln(3x)dx . 1
358
Klausuraufgaben
23.2
L¨ osungen
1. F¨ ur k = 1 ist 1
3
3
2
k =1 =1=1 =
k=1
1
2 k
,
k=1
womit wir den Induktionsanfang gezeigt h¨ atten. F¨ ur den Induktionsschritt nehmen wir A(n) an, also 13 +23 +33 +. . .+n3 = (1+2+3+. . .+n)2 f¨ ur eine beliebige, aber feste Zahl n ∈ N\{0}. Wir zeigen f¨ ur die Summe bis n + 1: 13 + 23 + 33 + . . . + n3 + (n + 1)3 = (1 + 2 + 3 + . . . + n)2 + (n + 1)3 2 n(n + 1) = + (n + 1)3 2 n2 (n + 1)2 + (n + 1)(n + 1)2 = 4 1 2 n + 4(n + 1) (n + 1)2 = 4 1 = (n + 2)2 (n + 1)2 4 = (1 + 2 + 3 + . . . + n + (n + 1))2 IV
2. (3 + 4i)(1 − i) = 3 − 3i + 4i − 4i2 = 3 − 3i + 4i + 4 = 7 + i , i3 + i2 + i + 1 = −i − 1 + i + 1 = 0 , i+1 (i + 1)(2 − i) 2i − i2 + 2 − i 3 1 3+i = = = + i. = 2+i (2 + i)(2 − i) 4 − i2 5 5 5 3. Die dritten Einheitswurzeln sind a k = ei
2kπ 3
,
k = 1, . . . , 3 .
Mit ihrer Hilfe k¨onnen wir aus einer dritten Wurzel von 1 + i, nennen wir ullen auch b2 := a1 b1 und sie b1 , alle weiteren berechnen. Denn mit b1 erf¨ b3 := a2 b1 die zu l¨osende Gleichung: b31 = 1 + i
⇒
b32 = a31 · b31 = 1 · (1 + i) und b33 = a32 · b31 = 1 · (1 + i) .
ussen wir aber zu Fuß berechnen, am besten u b1 m¨ ¨ber die Polarkoordinaten von 1 + i. √ √ √ √ 3 Der Betrag von 1 + i ist 12 + 12 = 2, der von b1 also r = 2 = 6 2. π . Der Winkel von 1 + i ist 45◦ , also π4 , der von b1 also ϕ = 13 π4 = 12 Insgesamt ist
359
L¨ osungen zur Analysis
√ √ 2π π 3π 6 6 b2 = 2ei 3 +i 12 = 2ei 4 , √ √ 4π π 17π 6 6 b3 = 2ei 3 +i 12 = 2ei 12 .
b1 =
√ 6
π
2ei 12 ,
4. Wir schreiben z := a + bi und erhalten: z 2 = (a + bi)2 = a2 − b2 + 2abi = a2 − b2 − 2abi = (a − bi)2 = z¯2 . 5. Streng monoton wachsende Funktionen sind durch x>y
⇒
f (x) > f (y)
f¨ ur alle x, y aus dem Definitionsbereich von f charakterisiert. Setzen wir also x > y voraus, so gilt nach unserer Voraussetzung f (x) > f (y)
und
g(x) > g(y)
f¨ ur alle x, y ∈ R und somit (f + g)(x) = f (x) + g(x) > f (y) + g(x) > f (y) + g(y) = (f + g)(y) . 6. Definiert ist f (x) := ln(sin x) u ¨berall dort, wo der Sinus positive Werte annimmt, also auf D := ]2kπ, (2k + 1)π[ . k∈Z
Die Randpunkte des Definitionsbereichs sind die Randpunkte dieser Intervalle: R := {kπ | k ∈ Z} . Die Grenzwerte an den Randpunkten sind s¨ amtlich lim ln x = −∞, also x0
f¨ ur xr = 2kπ, k ∈ Z: lim f (x) = −∞
xxr
und f¨ ur xr = (2k + 1)π, k ∈ Z lim f (x) = −∞ .
xxr
7. Eine π-periodische Funktion f ist durch die Gleichung f (x + π) = f (x) charakterisiert. Differenzieren wir diese Gleichung, wobei wir auf der linken Seite die Kettenregel anwenden, ergibt sich f¨ ur f : f (x + π) · 1 = f (x) . Somit erf¨ ullt auch f die Gleichung π-periodischer Funktionen.
360
Klausuraufgaben
8. Wegen der Wurzel ist f nur auf dem Intervall [0, ∞[ definiert, der Wertebereich ist wegen des Sinus’ [0,1]. √ x f (x) = sin2 √ √ √ √ 1 = 2 sin x sin x = 2 sin x cos x · √ 2 x √ sin (2 x) √ = . 2 x 9. Der h¨ochste Exponent ist drei, sodass wir die erste Nullstelle erraten m¨ ussen. Wir setzen nacheinander leicht zu pr¨ ufende Zahlen (0, 1, −1, ±i und ±2) in das Polynom ein, bis wir die erste Nullstelle gefunden haben: P (0) = 03 − 02 + 0 − 1 = −1 P (1) = 13 − 12 + 1 − 1 = 0 . Somit ist 1 eine Nullstelle von P . Polynomdivision von P durch (x − 1) ergibt: (x3 − x2 + x − 1) : (x − 1) = x2 + 1 −(x3 − x2 ) x−1 −(x − 1) 0 Auf das Ergebnis wenden wir die p-q-Formel (mit p = 0, q = 1) an: √ x2 + 1 = 0 ⇔ x1,2 = 0 ± 0 − 1 = ±i . Damit sind 1, i und −i die Nullstellen von P . 10. Die Nullstellen des Nenners sind x1 = −3 und x2 = 2: 1 25 1 1 5 1 2 +6=− ± =− ± . −x − x + 6 = 0 ⇔ x1,2 = − ± 2 4 2 4 2 2 Setzen wir diese in den Z¨ahler ein x3 + 2x2 − 5x − 6x=−3 = 0 ,
x3 + 2x2 − 5x − 6x=2 = 0 ,
so sehen wir, dass es auch Nullstellen des Z¨ ahlers sind. Eine Polynomdivision wird also ohne Rest m¨oglich sein und ein Polynom P (x) ergeben. Damit stimmt f (x) in allen Punkten seines Definitionsbereiches mit einem Polynom P (x) u ¨bereinstimmt. Da Polynome auf ganz R stetig sind, k¨onnen wir somit auch den Bruch in x1 und x2 stetig erg¨ anzen, indem wir f (x1 ) := P (x1 ) und f (x2 ) := P (x2 ) definieren. Es ist P (x) = x3 + 2x2 − 5x − 6 : −x2 − x + 6 = −x − 1 , also f (x1 ) = −x1 − 1 = 2 und f (x2 ) = −x2 − 1 = −3.
361
L¨ osungen zur Analysis
11. Bei diesem Bruch m¨ ussen wir zun¨achst eine Polynomdivision durchf¨ uhren, da Z¨ahler- und Nennerpolynom den gleichen Grad haben: (2x3 − x2 + 3x − 1) : (x3 − 2x2 + x) = 2 + −(2x3 − 4x2 + 2x)
3x2 + x − 1 x3 − 2x2 + x
3x2 + x − 1 Das Nennerpolynom faktorisieren wir zu x3 − 2x2 + x = x(x − 1)2 . Den Restterm zerlegen wir mit dem Ansatz 3x2 + x − 1 A B C = + + x3 − 2x2 + x x x − 1 (x − 1)2 und rechnen weiter A(x − 1)2 Bx(x − 1) Cx + + x(x − 1)2 x(x − 1)2 x(x − 1)2 Ax2 − 2Ax + A + Bx2 − Bx + Cx = x(x − 1)2 (A + B)x2 + (−2A − B + C)x + A = x(x − 1)2 =
Koeffizientenvergleich ergibt A+B =3 , ⇒
A = −1 ,
−2A − B + C = 1 ,
B=4,
A = −1
C=3,
womit wir die Partialbruchzerlegung 3x2 + x − 1 1 4 3 =− + + x3 − 2x2 + x x x − 1 (x − 1)2 erhalten und die Zerlegung der anf¨anglichen rationalen Funktion lautet 2x3 − x2 + 3x − 1 1 4 3 =2− + + . 3 2 x − 2x + x x x − 1 (x − 1)2 12. Wir formen um, sodass wir den Grenzwert besser bilden k¨ onnen: x a = ln 1 − . ln x − ln(x + a) = ln x+a x+a Somit ist
lim (ln x − ln(x + a)) = ln 1 − lim
x→∞
a x→∞ x + a
= ln 1 = 0 .
362
Klausuraufgaben
13. Zun¨achst die im Hinweis erw¨ahnte Partialbruchzerlegung der Summanden: 1 1 1 = − . k(k + 1) k k+1 Eingesetzt, werden aus den Partialsummen Teleskopsummen: n k=1
1 = k(k + 1) n
k=1
1 1 − k k+1
=
1 1 n − = . 1 n+1 n+1
Der Wert der Reihe ist schließlich der Grenzwert der Partialsummen: ∞ k=1
1 1 n = lim = lim =1. k(k + 1) n→∞ k(k + 1) n→∞ n + 1 n
k=1
14. F¨ ur konvergente Folgen gilt definitionsgem¨ aß, dass in jedem noch so kleinen Intervall um den Grenzwert fast alle Folgenglieder (d. h. alle ab einem bestimmten Index) enthalten sind. Diese Eigenschaft u agt sich auch ¨bertr¨ auf Teilfolgen, womit auch alle Teilfolgen gegen diesen Grenzwert konvergieren. Bei divergenten Folgen k¨onnen wir keine pauschalen Aussagen treffen. Teilfolgen von Folgen, die gegen ±∞ gehen, werden sich ebenso verhalten. Jedoch gibt es auch andere divergente Folgen, beispielsweise (−1)k . Von dieser Folge gibt es Teilfolgen, bei denen fast alle Folgenglieder −1 sind und die dementsprechend gegen −1 konvergieren. Ebenso gibt es Teilfolgen mit +1 als Grenzwert, aber auch solche, die wiederum divergieren, onnen weil sie sich nicht zwischen −1 und +1 entscheiden k¨ wie (−1)3k . 15. Da die Sinusfunktion stetig ist, d¨ urfen wir den Limes in das Funktionsargument hineinziehen:
π πk πk lim sin = sin lim = sin . k→∞ k→∞ 2k − 2 2k − 2 2 16. Da (bk ) eine Nullfolge ist, befinden sich s¨amtliche bk ab einem bestimmten uckt, gilt: Index, sagen wir k0 , im Intervall ] − 1, +1[. Anders ausgedr¨ |bk | < 1
f¨ ur alle k ≥ k0 .
Damit ist auch |ak bk | < |ak |
f¨ ur alle k ≥ k0 ∞ und k=0 |ak | ist eine konvergente Majorante ∞ von k=0 |ak bk |, was letztere ebenfalls konvergent macht. Somit ist k=0 ak bk absolut konvergent. ∞
17. Bei
∞ ek kk
k=0
363
L¨ osungen zur Analysis
verwenden wir das Wurzelkriterium. Der Ausdruck k e k e k |ak | = = kk k konvergiert f¨ ur k → ∞ gegen 0 < 1. Somit konvergiert die Reihe absolut. Bei ∞ ln k k=1
k!
verwenden wir das Quotientenkriterium. Die Voraussetzung ak = lnk!k = 0 ist zumindest f¨ ur k > 1 erf¨ ullt, was uns aber gen¨ ugt. Nun zum Quotienten: ak+1 ak =
ln(k+1) (k+1)! ln k k!
=
ln(k + 1) k! ln(k + 1) = . (k + 1)! ln(k) (k + 1) ln(k)
Dies konvergiert f¨ ur k → ∞ gegen 0 < 1, da lim
k→∞
ln(k+1) ln(k)
= 1 ist. Nach
dem Quotientenkriterium muss dann die Reihe absolut konvergieren. 18. F¨ ur die stetige Fortsetzung berechnen wir den Grenzwert lim f (x): x→x0
lim
x→0 ex
x l H 1 1 = lim x = = 1 . x→0 e −1 1
Somit kann f in x0 = 0 durch 1 stetig fortgesetzt werden. Die fortgesetzte Funktion lautet also: f (x) x = x0 ˜ f (x) := 1 x = x0 Nun zur Ableitung von f˜ in x0 . Hier m¨ ussen wir gleich zweimal hintereinander l’ Hospital anwenden: f˜(x0 + h) − f˜(x0 ) = lim f˜ (0) = lim h→0 h→0 h
h eh −1
−1
h h − eh + 1 = lim h→0 h(eh − 1) 1 − eh l H = lim h h→0 e − 1 + heh −eh lH = lim h h→0 2e + heh −1 = 2
19. Um den Satz von l’Hospital anwenden zu k¨ onnen, formen wir f in einen Bruch um: ln x f (x) = x ln x = 1 . x
364
Klausuraufgaben
Hier gehen sowohl Z¨ahler als auch Nenner f¨ ur x 0 gegen ±∞. Es gilt nach l’Hospital lim
ln x
x0
1 x
1 x x0 − 12 x
= lim −x = 0 .
= lim
x0
Somit kann f durch f (0) := 0 in 0 stetig fortgesetzt werden. 20. Um die Voraussetzungen des Satzes von l’Hospital zu pr¨ ufen, vergleichen wir jeweils die Grenzwerte von Z¨ahler und Nenner: lim ex − e = e − e = 0 und
x→1
lim ln x = ln 1 = 0 .
x→1
Demnach sind die Voraussetzungen erf¨ ullt und wir d¨ urfen versuchen, die Grenzwerte u ¨ber die Ableitungen von Z¨ahler und Nenner zu bestimmen: ex − e ex = lim 1 = lim xex = e . x→1 ln x x→1 x→1 x lim
∞ (x+3)k 21. Der Entwicklungspunkt von ist x0 = −3 und ak = k=0 k2 sodass sich ein Konvergenzradius von
1 k2 ,
|ak | (k + 1)2 k 2 + 2k + 1 = lim = lim =1 2 k→∞ |ak+1 | k→∞ k→∞ k k2
R = lim
ergibt. Die Potenzreihe konvergiert also schonmal im Intervall ] − 4, −2[ absolut und divergiert außerhalb auf ] − ∞, −4[ ∪ ] − 2, ∞[ . Die Randpunkte x = −4 und x = −2 m¨ ussen wir extra untersuchen: Eingesetzt ergeben sich die Reihen ∞ ((−4) + 3)k k=0
und
k2
∞ ((−2) + 3)k k=0
k2
=
∞ (−1)k k=0
=
∞ (+1)k k=0
k2
k2
=
∞ 1 , k2
k=0
die beide absolut konvergieren. Somit ist die Potenzreihe auf dem abgeschlossenen Intervall [−4, −2] absolut konvergent. 22. Dazu schreiben wir den Quotienten fg zweier Funktionen als Produkt f · g1 ,
wobei g1 = g −1 = −g −2 · g = − gg2 ist. Nach der Produktregel folgt dann 1 g 1 f f g − f g f g f g 1 +f · − 2 = 2 − 2 = = f · +f · = . f· g g g g g g g g2
365
L¨ osungen zur Analysis
23. Die Ableitungen von f , ausgewertet am Entwicklungspunkt, sind f (x) = sinh x
⇒
f (0) = 0 ,
f (x) = cosh x
⇒
f (0) = 1 ,
f (x) = sinh x
⇒
f (0) = 0 ,
f (x) = cosh x
⇒ .. .
f (0) = 1 ,
Wir zeigen mit vollst¨andiger Induktion f¨ ur alle k ∈ N f (2k) (x) = sinh x
und
f (2k+1) (x) = cosh x :
Den Induktionsanfang haben wir oben schon gemacht. Seien f¨ ur den Induktionsschritt beide Gleichungen f¨ ur ein k ∈ N vorausgesetzt. F¨ ur k + 1 ergibt sich dann
f (2(k+1)) (x) = f (2k+1) (x) = cosh (x) = sinh x und
f (2(k+1)+1) (x) = f (2k+2) (x) = sinh (x) = cosh x . Daraus folgt im Entwicklungspunkt f (2k) (0) = 0 und f (2k+1) (0) = 1 und die Taylorreihe von f ist Tf,0 (x) =
∞ f (k) (0) k=0
k!
xk =
∞ k=0
1 x2k+1 . (2k + 1)!
24. Wir beginnen mit der Substitution: y := x1 , dy = − x12 dx, dx = − y12 dy: #1 0
1 1 sin dx = x2 x
#1 − ∞ #∞
=
1 2 y sin ydy y2
sin ydy 1
(Hier sehen wir, dass es sich in Wirklichkeit um ein uneigentliches Integral handelt.) #a sin ydy
= lim
a→∞ 1
= lim (− cos y|a1 ) a→∞
= lim (cos 1 − cos a) a→∞
Da lim cos a nicht definiert ist, ist das Integral ebenfalls nicht definiert. a→∞
366
Klausuraufgaben
25. Da sich der Faktor ex beim Ableiten und Integrieren nicht ¨ andert, bietet sich hier die partielle Integration an. # # x x e cos xdx = e cos x − ex (− sin x)dx . Der neue Integrand sieht ungef¨ahr wie der alte aus, was normalerweise ein schlechtes Zeichen ist. Allerdings wird der Integrand bei nochmaliger partieller Integration bis auf das Vorzeichen genau wie der alte aussehen: # # ex cos x − ex (− sin x)dx = ex cos x + ex sin xdx # x x = e cos x + e sin x − ex cos xdx . Dies k¨onnen wir ausnutzen. Anfang und Ende der Gleichungskette l¨ osen wir nach dem gesuchten Ausdruck auf: # # x x x e cos xdx = e cos x + e sin x − ex cos xdx # ⇔ 2 ex cos xdx = ex cos x + ex sin x + c˜ # 1 ⇔ ex cos xdx = ex (cos x + sin x) + c . 2
In der ersten Gleichung steht rechts und links eine Stammfunktion der gleichen Funktion. Diese k¨onnen sich um eine Konstante c˜ unterscheiden, was wir beim Umformen der Gleichung nicht vergessen d¨ urfen. 26. #2 1
2 #2 2 x 3 x2 ln(3x) − dx x ln(3x)dx = 2 2 x 1 1
2 #2 3x x = ln(3x) − dx 2 2 1 2
1
2 x 3x2 ln(3x) − 2 4 1 3·4 1 3 4 − ln 3 + = ln 6 − 2 4 2 4 9 1 = 2 ln 6 − ln 3 − . 2 4 2
=
24 Lineare Algebra
24.1
Aufgaben
1. Testen Sie, ob es sich bei W := {(x, y) ∈ R2 : x + y = 0} um einen Untervektorraum des R2 handelt. 2. Finden Sie eine Basis des R-Vektorraums W := {(x, y, z) ∈ R3 : x + y = z} und u ufen Sie f¨ ur Ihre Wahl die entsprechenden Eigenschaften. ¨berpr¨ ¨ 3. Uberpr¨ ufen Sie die folgende Abbildung L : R2 → R2 mit 3x L(x, y) := x−y auf Linearit¨ at. 2 4. Eine Abbildung L : R2 → 1R sei linear und bilde den1 Vektor 3 und den Vektor (1) auf −1 ab. Bestimmen Sie L((2)).
3 −1
auf (32)
5. Bestimmen Sie Kern und Bild der linearen Abbildung L : R2 → R3 ,
3x L(x, y) := x−y x
6. Bestimmen Sie die darstellende Matrix der linearen Abbildung L : R2 → R3 ,
3x L(x, y, z) := x−y x
bzgl. der Standardbasis. 7. Bestimmen Sie α so, dass B ⎛ 0 1 ⎝ A = −2 1 4 −2
die Inverse von A ist: ⎛ ⎞ 3 −2 2 1 ⎝ ⎠ 6 −4 3 , B= 6 0 2 0
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6_24
⎞ α −2⎠ . 1
368
Klausuraufgaben
8. Bestimmen Sie die Inverse von
⎛
3 A = ⎝1 1
0 −1 1
⎞ 0 −2⎠ 0
mit Hilfe des Gaußalgorithmus und berechnen Sie die L¨ osung des Gleichungssystems ⎛ ⎞ 2 Ax = ⎝ 1 ⎠ . −2 9. Berechnen Sie die Determinante von ⎛ 1 −2 ⎜−2 2 A=⎜ ⎝3 1 0 3
⎞ 0 3 3 0⎟ ⎟ 0 −2⎠ 1 6
mithilfe der Laplace-Entwicklung. ¨ 10. Uberpr¨ ufen Sie die Vektoren ⎛ ⎞ ⎛ ⎞ 3 3 v1 = ⎝2⎠ , v2 = ⎝−1⎠ , 1 1
⎛
⎞ 2 v3 = ⎝ 1 ⎠ , −1
auf lineare Unabh¨angigkeit. 11. Normalisieren Sie die Vektoren ⎛ ⎞ 4 ⎝ 0⎠ v1 = −3
⎛
⎞ −1 und v2 = ⎝ 2 ⎠ 2
und berechnen Sie den Kosinus des Winkels zwischen v1 und v2 . 12. Orthonormalisieren Sie die Vektoren ⎛ ⎞ ⎛ ⎞ 0 0 v1 = ⎝0⎠ , v2 = ⎝1⎠ , 1 1
⎛ ⎞ 1 v3 = ⎝1⎠ . 1
13. Bestimmen Sie die Eigenwerte mit deren zugeh¨ origen Eigen- und Hauptvektoren der Matrix ⎛ ⎞ −3 9 1 A=⎝ 0 6 0 ⎠ . −1 1 −1 14. Diagonalisieren Sie die Matrix A=
−2 5
5 −2
.
369
Aufgaben zur Linearen Algebra
15. Gegeben seien die Matrizen ⎛ ⎞ 1 2 A := ⎝−3 1⎠ 1 1
und
B :=
−1 0
2 3
1 . 1
Berechnen Sie die Matrixprodukte A · B und B · A. 16. Bestimmen Sie die allgemeine L¨osung der Differenzialgleichung y + 2y = x . Um welche Art von Differenzialgleichung handelt es sich? 17. Finden Sie eine L¨osungsbasis zur Differenzialgleichung 1 y − 3y + 6y = 4y . 2
370
Klausuraufgaben
24.2
L¨ osungen
1. Zun¨achst einmal ist W ⊂ R2 . Seien weiter (x1 , y1 ), (x2 , y2 ) ∈ W und λ ∈ R, d. h. es gilt: x1 + y1 = 0 sowie
x2 + y 2 = 0 .
Es ist (x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ) ∈ W , denn (x1 + x2 ) + (y1 + y2 ) = x1 +y1 +x2 +y2 = 0+0 = 0. Und weiter λ(x1 , y1 ) = (λx1 , λy1 ) ∈ W , denn (λx1 ) + (λy1 ) = λ(x1 + y1 ) = λ0 = 0. 2.
W := {(x, y, z) ∈ R3 : x + y = z} Da wir aus der definierenden Gleichung x + y = z zwei Parameter (z. B. x und y) frei w¨ahlen k¨onnen, erwarten wir auch eine Basis aus zwei Vektoren. Es sind v1 := (1,0,1) und v2 := (0,1,1) ∈ W . Diese sind linear unabh¨angig, denn aus v2 = λv1 folgt λ = 0 aus der ersten Komponente, aber λ = 1 aus der dritten. Weiterhin spannen v1 und v2 W auf: Dazu stellen wir einen beliebigen Vektor (x, y, z) ∈ W als Linearkombination der beiden Vektoren dar. (x, y, z) = (x, y, x + y) = (x,0, x) + (0, y, y) = x(1,0,1) + y(0,1,1) = xv1 + yv2 .
ufen die Eigenschaften 3. L operiert auf einem Vektorraum (R2 ). Wir pr¨ L(v + w) = L(v ) + L(w) L(λv ) = λL(v ) Also:
3(x + x ˜) L(x + x ˜, y + y˜) = (x + x ˜) − (y + y˜) 3x + 3˜ x = x−y+x ˜ − y˜ 3x 3˜ x = + x−y x ˜ − y˜ = L(x, y) + L(˜ x, y˜) 3(λx) L(λx, λy) = λx − λy 3x =λ x−y
und
= λL(x, y) . Die beiden Eigenschaften sind f¨ ur alle x, x ˜, y und y˜ ∈ R erf¨ ullt. Somit ist L linear.
371
L¨ osungen zur Linearen Algebra
3 und (31) dar: 4. Wir stellen (12) als Linearkombination von −1 1 3 3 =a +b . 2 −1 1 Als Gleichungssystem 3 3 1 3 → −1 1 2 −3
3 1 3 → 3 6 0
3 1 6 7
ur das Bild von (12) folgt b = 76 und 3a = 1 − 3b, also a = 13 − 76 = − 56 . F¨ unter L folgt dementsprechend 1 3 3 L( ) = L(a +b ) 2 −1 1 3 3 = aL( ) + bL( ) −1 1 3 1 =a +b 2 −1 5 3 7 1 =− + 6 2 6 −1 1 8 . =− 6 17 5. F¨ ur das Bild von L stellen wir den Ergebnisvektor um: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 3x 3x 0 3 0 ⎝x − y ⎠ = ⎝ x ⎠ + ⎝−y ⎠ = x ⎝1⎠ + y ⎝−1⎠ . x x 0 1 0
3
0 Somit ist das Bild von L der von den Vektoren 1 und −1 aufgespannte Untervektorraum des R3 .
1
0
Der Kern von L ist
⎧ ⎛ ⎞ ⎛ ⎞⎫ 3x 0 ⎬ ⎨ x Kern L = ∈ R2 : ⎝x − y ⎠ = ⎝0⎠ . ⎩ y ⎭ x 0
Aus der ersten Komponente folgt x = 0, aus der zweiten y = x, also insgesamt Kern L = 0 ⊂ R2 . 6. Es ist
⎛ ⎞ 1 L(e1 ) = L(⎝0⎠) 0 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 3 a11 ⎠ ⎝ ⎠ ⎝ ⎝ ⎠ ⎝ 0 0 ⎠, + a21 + = 1 = a11e1 + a21e2 + a31e3 = 0 0 a31 1
372
Klausuraufgaben
also a11 = 3, a21 = 1 und a31 = 1. Weiter ist ⎛ ⎞ 0 L(e2 ) = L(⎝1⎠) 0 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 0 a12 = ⎝−1⎠ = a12e1 + a22e2 + a32e3 = ⎝ 0 ⎠ + ⎝a22 ⎠ + ⎝ 0 ⎠ , 0 a32 0 0 also a12 = 0, a22 = −1 und a32 = 0 sowie ⎛ ⎞ 0 L(e3 ) = L(⎝0⎠) 1 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 0 a13 = ⎝0⎠ = a13e1 + a23e2 + a33e3 = ⎝ 0 ⎠ + ⎝a23 ⎠ + ⎝ 0 ⎠ , 0 a33 0 0 also a13 = 0, a23 = 0 und a33 = 0. Insgesamt folgt, dass die lineare Abbildung L durch die Matrix ⎛ ⎞ 3 0 0 A = ⎝1 −1 0⎠ 1 0 0 repr¨asentiert wird. 7. Matrixmultiplikation ergibt:
⎛ ⎞ 6 0 0 1⎝ 0 6 −2α + 1⎠ . AB = 6 0 0 4α + 4
Es muss also −2α + 1 = 0 und 4α + 4 = 6 gelten, woraus α = 8.
⎞ ⎛ 3 0 3 0 0 1 0 0 ⎝1 −1 −2 0 1 0⎠ → ⎝1 −1 1 1 0 0 0 1 2 0 ⎛ ⎞ ⎛ 3 0 0 1 0 0 3 0 ⎠ → ⎝1 → ⎝ 1 −1 −2 0 1 −1 0 1 0 − 12 − 12 0 ⎛ ⎞ ⎛ 3 0 0 1 0 0 3 1 0 ⎠ → ⎝0 → ⎝0 −1 −2 − 13 − 12 − 12 0 0 1 13 0 ⎛ ⎞ ⎛ 3 0 0 1 0 0 1 0 1 ⎝ ⎠ ⎝ 0 1 → 0 1 0 −3 → 0 1 − 12 − 12 0 0 1 13 0 0 ⎛
0 1 −2 0 −2 0
1 2
folgt.
⎞ 0 0 1 0⎠ 1 1 ⎞ 0 0 1 0 0 −1 −2 0 1 0 ⎠ 0 1 13 − 12 − 12 ⎞ 0 0 1 0 0 0 −1 ⎠ −1 0 13 0 1 13 − 12 − 12 ⎞ 0 0 0 13 0 1 ⎠ . 0 − 13 1 1 − 2 − 12 1 3
373
L¨ osungen zur Linearen Algebra
Somit ist
⎛ A−1 =
1 3 ⎝− 1 3 1 3
0 0 − 12
⎞ ⎛ 0 2 0 1 1 ⎠ = ⎝−2 0 6 − 12 2 −3
⎞ 0 6⎠ −3
⎛
⎞ 2 Ax = ⎝ 1 ⎠ −2
und
hat die eindeutige L¨osung ⎛ ⎛ ⎞ 2 2 1 A−1 ⎝ 1 ⎠ = ⎝−2 6 2 −2
0 0 −3
⎞⎛ ⎞ ⎛ ⎞ 0 2 4 1 6 ⎠ ⎝ 1 ⎠ = ⎝−16⎠ . 6 −3 −2 7
9. Wir entwickeln die Determinante nach der dritten Spalte, da dort die meisten Eintr¨age null sind: 1 −2 0 3 1 −2 3 1 −2 3 −2 2 3 0 = −3 · 3 1 −2 − 1 · −2 2 0 3 1 0 −2 3 0 3 1 −2 6 0 3 1 6 1 −2 −2 3 −2 2 1 −2 −3· = −3 1 · − 3· −2· 3 6 −2 2 3 6 3 1 = −3(1 · 12 − 3 · (−21)) − (3 · (−8) − 2 · (−2)) = −225 + 20 = −205 . 10. Wir pr¨ ufen die 3 3 2 −1 1 1
lineare Unabh¨angigkeit mithilfe der Determinante: 2 1 −1
= 3 · (−1)2 + 3 · 12 + 22 · 1 − 2 · (−1) · 1 − 12 · 3 − (−1) · 3 · 2 = 3 + 3 + 4 + 2 − 3 + 6 = 15 = 0 . Somit sind die Vektoren linear unabh¨angig. 11. Zur Normalisierung eines Vektors teilen wir diesen durch seine Norm: ⎛ ⎞ ⎛ ⎞ 4 √ 2 4 2 1 v1 = ⎝0⎠ v1 = 2 ⎝ 0 ⎠ 2 = 42 + 02 + (−3)2 = 25 = 5, v1 5 −3 −3 ⎛ ⎞ ⎛ ⎞ −1 2 −1 2 √ 1⎝ ⎠ v2 2 2 ⎝ ⎠ 2 . 2 v2 = = = 9 = 3, v2 3 2 2
374
Klausuraufgaben
Wir verwenden die Kosinusformel zur Winkelbestimmung. cos α =
−10 2 v1 , v2 = =− . v1 · v2 5·3 3
12. Der erste Vektor ist bereits normiert: u1 = v1 . Der zweite Vektor ergibt sich nach Schmidt, indem wir v2 in die Ebene senkrecht zu u1 projizieren: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 0 u∗2 = v2 − v2 , u1 u1 = ⎝1⎠ − 1 · ⎝0⎠ = ⎝1⎠ . 1 1 0 Auch dieser ist schon normalisiert: u2 = u∗2 . v3 muss senkrecht zu u1 und u2 projiziert werden: u∗3 = v3 − v3 , u1 u1 − v3 , u2 u2 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 0 1 = ⎝1⎠ − 1 · ⎝0⎠ − 1 · ⎝1⎠ = ⎝0⎠ 1 1 0 0 Dieser ist ebenfalls normalisiert und wir erhalten als Orthonormalbasis die Standardbasisvektoren des R3 , allerdings in umgekehrter Reihenfolge. 13. Das charakteristische Polynom lautet: det(A − λE) = (−3 − λ)(6 − λ)(−1 − λ) + 6 − λ = (6 − λ) (−3 − λ)(−1 − λ) + 1 = (6 − λ) λ2 + 4λ + 4 = (6 − λ)(−2 − λ)2 . Die Matrix hat also die Eigenwerte 6 und −2. Berechnung des Eigenvektors zum Eigenwert 6 mithilfe des Gauß-Algorithmus: ⎛ ⎞ −9 9 1 A − 6E = ⎝ 0 0 0 ⎠ −1 1 −7 ⎞ ⎞ ⎛ ⎛ −9 9 1 0 −9 9 1 0 ⎝ 0 0 0 0⎠ → ⎝ 0 0 0 0⎠ −1 1 −7 0 0 0 64 0
1 Mit der Wahl y = 1 erhalten wir als Eigenvektor 1 . 0
Berechnung der ein bis zwei linear unabh¨ angigen Eigenvektoren zum Eigenwert −2: ⎛ ⎞ −1 9 1 A + 2E = ⎝ 0 8 0⎠ , −1 1 1
375
L¨ osungen zur Linearen Algebra
⎛
−1 ⎝0 −1
9 8 1
1 0 1
⎞ ⎛ 0 −1 0⎠ → ⎝ 0 0 0
9 8 −8
1 0 0
⎞ ⎛ 0 −1 0⎠ → ⎝ 0 0 0
9 8 0
1 0 0
⎞ 0 0⎠ 0
Da es nur eine Nullzeile gibt, werden wir auch nur einen linear unabh¨ angi 1 gen Eigenvektor finden, n¨amlich mit z = 1 den Eigenvektor v = 0 . 1
Als Letztes muss noch der Hauptvektor zum Eigenwert −2 bestimmt werden. Dazu l¨osen wir das Gleichungssystem (A + 2E)2 w = 0: ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 0 64 0 0 64 0 0 0 64 0 0 (A + 2E)2 = ⎝0 64 0⎠ , ⎝0 64 0 0⎠ → ⎝0 0 0 0⎠ . 0 0 0 0 0 00 0 0 00 Mit der Wahl z = angiger Hauptvektor gege 01 ist ein zu v linear unabh¨ ben durch w = 0 . Beliebige Linearkombinationen von v und w sind 1 ebenfalls Hauptvektoren zum Eigenwert 1.
1 1
0 Insgesamt bilden die Vektoren 1 , 0 und 0 eine Basis aus Haupt0 1 1 vektoren. 14. Das charakteristische Polynom lautet: det(A − λE) = (−2 − λ)(−2 − λ) − 25 = −21 + 4λ + λ2 = (λ + 7)(λ − 3) . Berechnung des Eigenvektors zum Eigenwert -7 mithilfe des Gauß-Algorithmus: 5 5 A + 7E = 5 5 5 5 0 5 5 0 → 5 50 0 00 Mit der Wahl y = 1 erhalten wir als Eigenvektor −1 1 . Berechnung des Eigenvektors zum Eigenwert 3 mithilfe des Gauß-Algorithmus: −5 5 A − 3E = 5 −5 −5 5 0 −5 5 0 → 5 −5 0 0 00 Mit der Wahl y = 1 erhalten wir als Eigenvektor ( 11 ). Damit haben wir −1 S −1 = 1
1 1
mit der Inversen
S=
1 2
−1 1
1 . 1
376
Klausuraufgaben
Somit ergibt sich als diagonalisierte Matrix 1 −1 1 −2 5 −1 D = SAS −1 = 5 −2 1 2 1 1 1 −1 1 7 3 = −7 3 2 1 1 7 0 = . 0 3 15. Es ist
⎛
−1 8 A · B := ⎝ 3 −3 −1 5
⎞ 3 −2⎠ 2
1 1
und
B · A :=
−6 −8
1 . 4
16. Es handelt sich um eine gew¨ohnliche, lineare, inhomogene DGL 1. Ordnung. Zum L¨osen des homogenen Teils y + 2y = 0 verwenden wir den Exponentialansatz. Dieser liefert nach dem Einsetzen von y(x) = eλx , y (x) = λeλx in die DGL: eλx (λ + 2) = 0 ⇒
λ1 = −2
⇒
{y1 (x) = eλ1 x = e−2x } ist L¨ osungsbasis.
Zum Finden einer partikul¨aren L¨osung w¨ ahlen wir den Ansatz yp (x) = ax+b mit Ableitung yp (x) = a. Einsetzen in die inhomogene DGL ergibt: a + 2ax + 2b = x 1 1 ⇔ a= , b=− 2 4 1 1 ⇒ yp (x) = x − . 2 4 Die allgemeine L¨osung der DGL lautet somit y(x) =
1 1 x − + ce−2x 2 4
f¨ ur c ∈ R.
17. Das charakteristische Polynom von 1 y − 3y + 6y = 4y . 2 ist
⇔
1 3 λ − 3λ2 + 6λ = 4 2 (λ − 2)3 = 0 .
Es hat also die dreifache Null λ = 2 und somit bildet y1 (x) = e2x , y2 (x) = xe2x , y3 (x) = x2 e2x eine L¨osungsbasis der Differenzialgleichung.
Vom Umgang mit Pru ¨ fungen Irgendwann in Laufe eines Semesters schwindet die Freude am Studentenleben und Pr¨ ufungen stehen vor der T¨ ur, sei es als Klausur oder als m¨ undliche Pr¨ ufung. An vielen Institutionen ist es insbesondere bei den Ingenieuren so, dass zuerst einmal Klausuren geschrieben werden. Wenn Sie dort — hinreichend oft — durchgefallen sind, steht dann meist als letzte Chance eine m¨ undliche Pr¨ ufung an. Nachstehend wollen wir darauf eingehen, was Sie machen k¨onnen, um auch nach der Pr¨ ufung und sei es auch die letzte Chance gewesen, mit einem entspannten L¨acheln durch die Gegend zu laufen. Bitte lesen Sie diesen Abschnitt genau, denn wir haben die Erfahrung aus hunderten m¨ undlicher Pr¨ ufungen aller Art, durch unsere Klausuren wurden bereits mehrere tausend Studierende gepr¨ uft und studiert haben wir ja auch. Wir wissen also, worauf es ankommt und wo die vermeintlichen Fallen sind. Nun genug der strengen Worte, aber unsere Erfahrung zeigt, dass zu viele gute Ratschl¨age gerne u ¨berh¨ort werden, was dann oft zu großer Frustration — oder gar einer Zwangsbeendigung des Studiums — f¨ uhrt, was wir Ihnen sehr gerne ersparen m¨ochten. Der grundlegende Tipp lautet: Bereiten Sie sich ordentlich und gewissenhaft vor! Das klingt vielleicht banal und hat sich im Laufe vieler Studentenleben sicher etwas abgenutzt, wird aber tats¨achlich gerne u owe mit ¨bersehen. Es gibt sehr viele Studierende, die als L¨ wenig Vorbereitung (aber viel Selbstvertrauen) in die Pr¨ ufung gehen und dann als Maus um eine letzte Chance bitten . . . Sie sind selbst in der Lage zu erkennen, ob Sie gut vorbereitet sind! Dazu k¨ onnen Sie sich folgende Fragen stellen: • Habe ich die Hausaufgaben so gut wie m¨oglich eigenst¨ andig gel¨ ost? • Habe ich Skript und Vorlesungsmitschrift, wenn ja, nur in der Tasche oder aktiv damit gearbeitet? • Habe ich alte Klausuren aus vorherigen Kursen und Beispielaufgaben zur © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6
378
Vom Umgang mit Pr¨ ufungen
Vorbereitung gel¨ost? • Kann ich Verst¨ andnisfragen beantworten (die in einigen Klausuren in einem gesonderten Teil abgefragt werden)? • Kenne ich die Modalit¨aten f¨ ur die Pr¨ ufung (wie lange wird geschrieben; welche Hilfsmittel d¨ urfen verwendet werden; wie kann ich mich gefahrlos abmelden, wenn ich merke, es nicht zu schaffen oder krank werde; kann die Pr¨ ufung unterbrochen werden, wenn ich nach f¨ unf Minuten merke, dass ich trotz meiner Kenntnisse einen Blackout habe . . . )? • Habe ich mich vorschriftsgem¨aß f¨ ur die Pr¨ ufung angemeldet (Sie glauben gar nicht, wie viele Studierende eine Pr¨ ufung einfach so verbummeln. Und Pr¨ ufungs¨amter sind meist nicht der nette Kumpel, der es Sonderregelungen regnen l¨asst)? Nat¨ urlich, es gibt Pr¨ ufungen und Pr¨ ufer, die einem gar nicht liegen. So what? Dann nochmal. Fallen ist keine Schande, aber Liegenbleiben. Die gr¨ oßte Verantwortung liegt bei Ihnen. Lassen Sie sich von (wenn m¨ oglich guten) anderen Studierenden abfragen und verbringen Sie auch gerne in einer Lerngruppe einige Zeit. Und bitte, fragen Sie die f¨ ur Ihren Kurs Verantwortlichen aus. Diese haben immer eine Sprechstunde, die ein einzigartiges Angebot f¨ ur eine Art Gratisfragestunde ist.
Welcher Pru ¨ fer? Wir betonen: Sie k¨onnen grunds¨atzlich davon ausgehen, dass alle Pr¨ ufer fair und objektiv sind, das Ergebnis also von Ihnen abh¨ angt. Ja, wir wissen, dass es auch unter uns ein paar schwarze — oder zumindest dunkler erscheinende — Schafe gibt. Wenn Sie eine Klausur schreiben m¨ ussen, dann haben Sie zumeist keine Wahl, denn der Chef der Veranstaltung ist f¨ ur die Klausur verantwortlich. U. a. aus Zeitgr¨ unden macht es meist wenig Sinn, einfach ein Semester zu warten, bis ein anderer Chef die Klausur stellt, der k¨ onnte Ihnen dann am Ende auch gar nicht liegen . . . . Bei m¨ undlichen Pr¨ ufungen ist das anders, da stehen meist mehrere Pr¨ ufer zur Verf¨ ugung. Dort ist dann gew¨ ohnlich auch ein Beisitzer dabei, der u. a. die abgefragten Themen protokolliert, um gewisse Nachvollziehbarkeit der Pr¨ ufung zu gew¨ahrleisten. Niemand, der ordentlich vorbereitet ist, wird durchfallen, auch wenn die studentische Ger¨ uchtek¨ uche so etwas behaupten mag. W¨ ahlen Sie so fr¨ uh wie m¨oglich einen Pr¨ ufer aus und gehen in seine Sprechstunde. Achten Sie darauf, ob Sie mit dem Pr¨ ufer gut und ungezwungen ins Gespr¨ach kommen (z. B. u ber den Ablauf der Pr¨ ufung) oder ob seine Art die ¨ sowieso schon vorhandene Aufgeregtheit in der Pr¨ ufung noch verst¨ arken w¨ urde.
Pr¨ ufungsangst?!
379
Die Vorbereitung Grundlegende Regeln haben wir bereits oben genannt und gehen daher nochmals gesondert auf den Fall ein, dass Sie ihre letzte Chance wahrnehmen m¨ ussen. Nachdem Sie durch die entsprechenden Pr¨ ufungsklausuren gefallen sind, gibt Ihnen die m¨ undliche Pr¨ ufung nun die M¨ oglichkeit zu zeigen, dass Sie den Stoff doch beherrschen. Fallen Sie auch durch dieses Netz, so ist im Regelfall jeglicher Hochschulstudiengang mit ¨ahnlichen (oder h¨ oheren) Mathematikanspr¨ uchen in Deutschland verwehrt. Wollen Sie in Ihrem Studiengang bleiben, machen Sie sich bewusst, dass Sie diese Herausforderung meistern m¨ ussen und nehmen dies als Motivation, zu lernen wie noch nie zuvor. Eine m¨ undliche Pr¨ ufung ist u ¨blicherweise theoretischer als eine Klausur. Lernen Sie nach dem Skript und der Vorlesungsmitschrift, rechnen Sie die Hausaufgaben noch einmal durch. Je sicherer Sie in dem Pr¨ ufungsstoff sind, desto weniger nerv¨os werden Sie sp¨ater in der Pr¨ ufung sein. Im Unterschied zu Klausuren wird neben dem Rechnen auch viel Wert auf die Formulierung von Definitionen und S¨ atzen sowie auf deren Anschauung gelegt. Nochmals: Gehen Sie oft (und nicht erst in der letzten Woche vor der Pr¨ ufung) in die Sprechstunde(n), um Fragen und Verst¨ andnisprobleme zu kl¨ aren. Das hat viele Vorteile: • Der Pr¨ ufer sieht, dass Sie sich M¨ uhe bei der Vorbereitung geben; • Sie bekommen ein Gef¨ uhl daf¨ ur, was dem Pr¨ ufer wichtig ist; • die Scheu, mit dem Pr¨ ufer zu reden, wird beseitigt. Wenn es zu der Veranstaltung einen Assistenten gibt, kann dieser mit Ihnen in seiner Sprechstunde sicher gerne eine Pr¨ ufung simulieren. Lassen Sie sich dann in ¨ahnlichem Stil von (mathematisch) f¨ ahigen Studierenden abfragen. W¨ahlen Sie daf¨ ur jemanden, der selbst in dem Thema sicher achste Party zu geist und mit dem die notwendige Disziplin (nicht auf die n¨ hen oder bei einem Bier u ¨ber den Sinn des Lebens zu philosophieren) aufrecht erhalten werden kann.
Pru ¨ fungsangst?! Klausuren und m¨ undliche Pr¨ ufungen gelten an der Universit¨ at und Fachhochschule als eine etablierte Methode der Leistungsermittlung, mit denen jeder Studierende fr¨ uher oder sp¨ater konfrontiert wird. Bei vielen Studierenden steigt jedoch die Anspannung in oder vor der Pr¨ ufung derart, dass die in der Pr¨ ufung erbrachten Leistungen entscheidend verschlechtert werden oder sogar die Pr¨ ufung
380
Vom Umgang mit Pr¨ ufungen
abgebrochen werden muss. Diese Pr¨ ufungsangst sollte daher nicht auf die leichte Schulter genommen werden. Gerade wenn es sich bei der bevorstehenden Pr¨ ufung um den letzten Versuch handelt, ist der Druck besonders hoch. Also ganz wichtig: Wenn Sie Probleme mit Pr¨ ufungsangst haben, dann lassen Sie sich vorher gut beraten. Eigentlich haben alle Universit¨ aten und Fachhochschulen einen psychologischen Dienst. Dort sind Profis, die Antworten haben. Scheuen Sie sich nicht davor, diese zu konsultieren. Es gibt leider zu viele, die ¨ behandelbare Angste haben, es sich aber zu sp¨ at eingestehen oder gar ganz ignorieren. Es w¨are mehr als schlimm, wenn Ihr Studium und ein Teil Ihrer Zukunft daran scheiterte, dass Sie sich nicht helfen lassen!
Zur schriftlichen Pru ¨ fung Hier ist es ganz wichtig, dass Sie sich die Aufgaben genau ansehen. Es zwingt Sie keiner dazu (und Sie sollten das selbst auch nicht machen), mit der ersten Aufgabe zu beginnen und dann alle ihrer Nummer nach zu l¨ osen. Daher bitte erst eine Aufgabe nehmen, die Ihnen gut liegt. Dann ist die erste Aufregung weg und was Ihnen vorher unl¨osbar schien, ist dann meist nicht mehr so dramatisch. Die L¨osungen einiger Aufgaben leben davon, dass Sie wirklich exakt lesen, was eigentlich gefordert wird, manchmal verbergen sich gar kleine Tipps in den Aufgabenstellungen. Es mag aber auch immer mal eine Aufgabe geben, die Sie nicht l¨ osen k¨ onnen. Das ist kein Drama. Nutzen Sie die Zeit dann besser zur Perfektionierung der L¨ osungen zu den anderen Aufgaben. Wenn am Ende noch Zeit verbleibt, geben ¨ Sie nicht vor dem eigentlichen Ende ab. Uberpr¨ ufen Sie lieber Ihre Rechnungen, denn auch fl¨ uchtige Fehler werden mit einem kleinen Punktabzug bestraft, was sich durchaus summieren kann. Bereiten Sie sich vor, indem Sie bereits zur Klausur ausreichend Papier mitbringen, auf dem Name und Matrikelnummer stehen oder was sonst noch wichtig sein mag wie z. B. der Dozent und Kurs. Das Versehen der Seiten mit einer Nummer macht Ihnen und den Korrektoren die Orientierung leichter. Alles das tr¨agt dazu bei, dass Sie die Klausur ruhiger und strukturierter angehen k¨ onnen. Wie oft ist es uns schon passiert, dass ein Student am n¨ achsten Tag mit einem Blatt kam, das er aus einem Versehen heraus nicht abgegeben hat. Es gab sicher F¨alle, in denen das die Wahrheit war. Bewerten l¨ asst sich das aber dennoch nicht. Solche F¨alle gilt es zu verhindern. Und noch eine Bitte: Schreiben Sie so ordentlich wie m¨oglich, denn hier kommt Psychologie ins Spiel! Stellen Sie sich dazu vor, dass Sie bereits acht Stunden in einem Raum mit vielen anderen gesessen haben, auf einem unbequemen Holzstuhl und dann ein gewaltiges Geschmiere vor sich haben. M¨ochten Sie dann darin noch nach guten Ideen suchen, wenn Sie nicht mal die Schrift anst¨andig lesen k¨ onnen?
Zur m¨ undlichen Pr¨ ufung
381
Nach der Korrektur gibt es gew¨ohnlich eine Einsicht in die Klausur. Bitte z¨ ahlen Sie hier die vergebenen Punkte und schauen Sie nach, ob wirklich alles korrigiert wurde! Es kommt nicht so selten vor, dass im Gefecht langer Korrektursessions einzelne kleine Teile — auch wegen des miesen Schriftbildes — u ¨bersehen werden. Und wenn es dann am Ende nicht geklappt hat? Seien Sie ehrlich zu sich. Wenn von 40 Punkten 20 zum Bestehen erreicht werden m¨ ussen und Sie 19 haben, so fehlt Ihnen — um unseren lieben Kollegen Paul Peters zu zitieren — genau genommen nicht ein Punkt, sondern es fehlen eigentlich 21. Klingt komisch (oder gar gemein), ist aber so, nur anders betrachtet. Dann nicht verzagen, beim n¨achsten Versuch sind Sie dann hoffentlich genug gewarnt und schaffen es!
Zur mu ¨ ndlichen Pru ¨ fung Eine m¨ undliche Pr¨ ufung findet gew¨ohnlich im B¨ uro des Pr¨ ufers statt. Zugegen ist neben Pr¨ ufling und Pr¨ ufer meist noch ein Beisitzer, welcher das Protokoll f¨ uhrt. Eine gewisse Nervosit¨at kann wahrscheinlich niemand vermeiden, doch falls die Panik derart groß sein sollte, dass Sie sich zur Pr¨ ufung außerstande f¨ uhlen, sollten Sie dies dem Pr¨ ufer zu Beginn mitteilen; dann kann die Pr¨ ufung verlegt werden. (In solchen F¨allen sollten Sie allerdings den oben stehenden Hinweis u ufungsangst beherzigen.) ¨ber Pr¨ Die m¨ undliche Pr¨ ufung l¨auft gew¨ohnlich so ab, dass der Pr¨ ufer Ihnen eine Frage zum Thema stellt, die Sie dann auf einem Blatt Papier beantworten k¨ onnen. Bei kleineren Problemen mit der Aufgabe wird er etwas helfen. Bald kommt dann die n¨achste Frage, oft u ¨ber ein anderes Thema, um ein breites Gebiet abzudecken. Das geht so lange, bis die Zeit um ist (was subjektiv sehr rasch geht) und dann werden Sie meist gebeten, vor der T¨ ur zu warten, damit Pr¨ ufer und Beisitzer die Note festlegen k¨onnen. Diese wird Ihnen dann mit einer kleinen Begr¨ undung mitgeteilt und dann ist alles (hoffentlich gut) u ¨berstanden. Einige Pr¨ ufer u ¨berlassen Ihnen auch die Wahl des Einstiegsthemas. Es ist also sinnvoll, vorher zu u ¨berlegen, welches Thema Ihnen liegt. Versuchen Sie nicht, mit einem schwierigen Einstiegsthema Eindruck zu schinden, welches Sie doch nicht gut k¨onnen. W¨ahlen Sie immer ein Kapitel, welches Sie souver¨ an beherrschen. Die m¨ undliche Pr¨ ufung ist keine Klausur; Sie sind der Aufgabenstellung nicht hilflos ausgeliefert, sondern k¨onnen (und sollten) es dem Pr¨ ufer sagen, wenn onnen. Sie einen Teil der Aufgabe nicht verstehen oder l¨ osen k¨ Außerdem herrscht nicht ein solcher Zeitdruck wie in einer Klausur, also hetzen Sie nicht.
382
Vom Umgang mit Pr¨ ufungen
Wichtig ist, dass Sie dem Pr¨ ufer Feedback liefern, also lassen Sie ihn an Ihren ¨ Uberlegungen teilhaben. So kann er Ihnen helfen, falls Sie auf dem Holzweg sind. Haben Sie zu einer gestellten Aufgabe gar keinen Plan, geben Sie dies nicht erst nach zehnmin¨ utigem Herumraten zu. So bleibt Zeit, um Ihr Wissen auf anderen Gebieten zu demonstrieren.
Literatur und Schlussbemerkungen Wohl kein neues Buch zu den hier behandelten Themen kann vom mathematischen Inhalt her etwas wirklich Neues bieten, denn es handelt sich wesentlich um Standardstoff, der zum Studienanfang geh¨ort. Aufgabe der Autoren ist es, das Ganze gegebenenfalls neu zu beleuchten, sinnvoll zu ordnen und allem einen eigenen Stil zu geben, der m¨oglichst viele Vorteile beim Verstehen und Lernen bringt. Wir profitierten dabei von anderen Autoren, Kollegen, Studierenden und Kritikern (die teils sogar zur konstruktiven Sorte geh¨ orten). Einige der B¨ ucher unten sind Standardwerke, aus anderen lernten wir selbst, andere sollten Sie vielleicht gesehen haben, wenn Sie mehr Mathematik brauchen und m¨ochten; zur Orientierung gibt es kurze Kommentare: • A. Beutelspacher, Lineare Algebra (Vieweg+Teubner, 2006) Ein Buch, welches einen verbindlichen und freundlichen Stil hat. •
Der Bronstein“. ” Sagen Sie nichts. Uns ist klar, dass sich dies nicht wirklich als vollst¨ andige Literaturempfehlung verwenden l¨asst. Aber begeben Sie sich bitte selbst auf die Suche. Das Buch gab es u ¨ber die Jahre von vielen Verlagen, in vielen Sprachen und abenteuerlichen Papierqualit¨aten. Aber der Ingenieur muss es haben, alle anderen sollten. Jeder Mitarbeiter einer wissenschaftlichen ¨ Buchhandlung m¨ usste es aus dem Armel ziehen k¨ onnen. Leider ist im Jargon der Nutzer diese Buches der Name des zweiten Autors verloren gegangen: K. A. Semendjajew.
• R. Courant, Vorlesungen u ¨ ber Differential- und Integralrechnung, Bd. 1 (Springer, 1969) Ein Klassiker. Es halten sich Ger¨ uchte, nach denen dieses Buch zu großen Teilen von Studierenden geschrieben wurde. Wie auch immer, der auf dem Titel genannte Mathematiker ist einer der großen seines Faches gewesen, dem die Mathematik und Physik viel zu verdanken haben. Es liest sich eher wie ein Roman als wie ein Lehrbuch. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6
384
Literatur und Schlussbemerkungen
• G. Fischer, Lineare Algebra (Vieweg+Teubner, 2005) Ein absolutes Standardwerk. N¨ uchtern, wie Mathematik nun einmal sein kann. Aber lehrreich! • D. Ferus, Skript zur Analysis I f¨ ur Ingenieure (TU Berlin, 2007) Ein Skript, dass die Lehre f¨ ur Ingenieure an der TU Berlin stark gepr¨ agt hat, viele Beweise enth¨alt und Erkl¨arungen auf auch didaktisch hohem Niveau bietet. Einer der Autoren (M. Scherfner) hat nach diesem Skript Vorlesungen gehalten, was auch pr¨agend f¨ ur das vorliegende Buch war. (Ein Skript zur Linearen Algebra von Herrn Ferus ist kaum noch zu bekommen und wird auch leider nicht mehr verwendet.) • D. Ferus, Skript zu Differentialgleichungen f¨ ur Ingenieure (TU Berlin, 2007) Es gilt das, was zum anderen Skript von Herrn Ferus geschrieben wurde. • V. Mehrmann, J. Rambau, R. Seiler, Skript zur Linearen Algebra f¨ ur Ingenieure (TU Berlin, 2008) Dieses Werk wurde von R. Seiler begonnen und war auch erste inhaltliche Grundlage f¨ ur ein System mit dem Namen Mumie“, bei dem mit Com” puterunterst¨ utzung eine Erg¨anzung der Lehre erfolgt. Nach diesem Skript wird aktuell an der TU Berlin gelesen, sodass wir auch aus diesem Werk Anregungen bekommen haben. • O. Forster, Analysis 1 (Vieweg+Teubner, 2006) Ein absolutes Standardwerk. N¨ uchtern, wie Mathematik nun einmal sein kann. Aber lehrreich, wenn es auch teils an eine Definition-Satz-BeweisSammlung erinnert, dem Buch von Fischer nicht ganz un¨ ahnlich. • H. Heuser, Lehrbuch der Analysis 1 (Vieweg+Teubner, 2006) Ein wenig die moderne Variante des Courant, die viele Anwendungsbeispiele enth¨alt. • K. J¨ anich, Lineare Algebra (Springer, 2002). Ein Buch mit Teilen f¨ ur Mathematiker und Physiker, das teils pfiffige Erkl¨arungen bietet. • F. Reinhardt, H. Soeder, dtv-Atlas Mathematik, Bd. 1 & 2 (dtvVerlag, 1998) Es ist nicht immer auf dem neuesten Stand, was z. B. Bezeichnungen angeht. Allerdings ist es ein kleines R¨atsel, wie so viel wichtige Mathematik h¨ ubsch pr¨asentiert in zwei so kleine B¨ande passt; es kann gar als gute Strandlekt¨ ure empfohlen werden.
Index Abbildung, 41 abgeschlossene Intervalle, 14 Ableitung, 120 h¨ohere, 128 absolut konvergente Reihe, 93 Additionstheoreme, 63 adjungierte Matrix, 239 alle bis auf endlich viele, 77 Alternierend, 99 alternierende harmonische Reihe, 99 Anfangswertproblem, 343 Ansatz vom Typ der rechten Seite, 341 antisymmetrische Matrix, 239 Approximation durch Taylorpolynom, 151 Aussage, 7 Aussagenlogik, 7
Dezimalbruchentwicklung, 94 diagonalisierbar, 321 Diagonalmatrix, 238 Differenz von Mengen, 14 Differenzialgleichungen, 331 Differenzialgleichungssystem, 333 Differenzialquotient, 120 Differenzierbarkeit, 120 Dimensionssatz, 231 Divergenz, 79 Drehmatrix, 290 Dreiecksmatrix, 238 Dreiecksungleichung, 24, 31
charakteristisches Polynom einer DGL, 338 einer quadratischen Matrix, 314
Eigenraum, 312 Eigenvektor, 311 Eigenwert, 311 Eigenwertgleichung, 311 Einheitsmatrix, 232 Einheitswurzeln, 33 Element einer Menge, 11 Entwicklungspunkt, 139, 151 Epsilon-Umgebung, 77 erweiterte Koeffizientenmatrix, 247 euklidischer Vektorraum, 283 euklidisches Skalarprodukt, 283 Eulerformel, 32 Eulergleichung, 61 Existenz- und Eindeutigkeitssatz, 129 Exponentialansatz, 338 Exponentialfunktion, 63, 131
darstellende Matrix, 301 de Morgan, 16 Defekt, 231 Definitionsbereich, 41 Determinante, 264
Fakult¨ at, 28 fast alle, 77 Folge, 75 monoton fallend, 82 monoton wachsend, 82
Basiswechsel, 297 Beschleunigung, 128 beschr¨ankt, 81 bestimmte Divergenz, 79 Betrag, 30 bijektiv, 43 Bild, 41, 229 Bildmenge, 41 Binomialkoeffizient, 28 Binomischer Satz, 28
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. Scherfner und T. Volland, Mathematik für das erste Semester, https://doi.org/10.1007/978-3-662-61992-6
386 Fourierreihe, 196 Fundamentalsatz der Algebra, 56 Fundamentalsystem, 336 Funktion, 41 beschr¨ankt, 46 gerade, 46 monoton fallend, 46 monoton wachsend, 46 periodisch, 47 unbeschr¨ankt, 46 ungerade, 46 Funktionsgraph, 49 ganze Zahlen, 13 Gauß-Algorithmus, 250 geometrische Reihe, 93 geometrische Summe, 27 Geschwindigkeit, 128 gew¨ohnliche DGL, 333 Grenzwert, 76 linksseitiger, 106 rechtsseitiger, 106 griechisches Alphabet, 6 halboffene Intervalle, 14 harmonische Reihe, 95 H¨aufungspunkt, 77 oberer und unterer, 111 H¨aufungspunktprinzip, 83 Hauptsatz der Differenzial- und Integralrechnung, 172 Hauptvektoren, 318 Hauptvektorgleichung, 318 Hintereinanderausf¨ uhrung, 48 homogene DGL, 333 homogenes LGS, 249 Imagin¨arteil, 29 Induktion vollst¨andige, 10 Infimum, 113 inhomogene DGL, 333 inhomogenes LGS, 249 Inhomogenit¨at, 249, 333 injektiv, 43 Integral
Index
unbestimmt, 172 uneigentliches, 179 Integralvergleichskriterium, 185 Integration Rechenregeln, 171 integrierbare Funktionen, 170 intelligentes Raten, 341 Intervall abgeschlossen, 14 halboffen, 14 offen, 14 uneigentlich, 14 Inverse, 45 inverse Matrix, 238 Invertieren von Matrizen, 256 Kartesisches Koordinatensystem, 30 Kern, 229 Kettenregel, 123 Koeffizienten, 333 komplexe Konjugation, 30 Rechenregeln, 31 komplexe Zahlen, 13, 29 Polarkoordinaten, 32 Komposition, 47, 48 Konstanzkriterium, 127 konvergente Majorante, 96 konvergente Reihe, 93 Konvergenz, 76 Konvergenzgeschwindigkeit, 83 Konvergenzradius, 141 Koordinaten, 213 Koordinatenabbildung, 298 Koordinatenvektor, 298 Kosinus, 60 Kosinus Hyperbolicus, 66 Kreuzprodukt, 272 Kronecker-Symbol, 150 l’Hospital, 133 Laplacescher Entwicklungssatz, 265 leere Menge, 13 Leibniz-Kriterium, 99 Limes superior und inferior, 78, 111 linear abh¨ angig, 217 linear unabh¨ angig, 217
387
Index
lineare Abbildung, 227 lineare H¨ ulle, 216 lineares Gleichungssystem, 249 Linearkombination, 215 Logarithmische Ableitung, 186 Logarithmus, 64 Rechenregeln, 65 lokales Maximum, 112 lokales Minimum, 112 L¨osungsbasis, 336 L¨osungsmenge, 250 L¨osungsraum, 336 Majorantenkriterium, 96 Matrix, 231 Maximum, 112 differenzierbarer Funktionen, 160 Maximumsnorm, 281 Menge, 11 Adjunktivit¨at, 16 Assoziativit¨at, 16 Differenz, 14 Distributivit¨at, 16 Idempotenz, 16 Kommutativit¨at, 16 leere Menge, 13 Rechenregeln, 16 Regeln von de Morgan, 16 Schnitt, 14 Teilmenge, 15 Vereinigung, 14 Minimum, 112 differenzierbarer Funktionen, 160 Minorantenkriterium, 101 Mittelwertsatz der Differenzialrechnung, 126 Mittelwertsatz der Integralrechnung, 173 Monotonie, 46, 82 Monotoniekriterium, 82, 127 nat¨ urliche Zahlen, 13 Norm, 279 Nullfolge, 76 Nullstellensatz, 111 Nullvektor, 211
obere Schranke, 46 offene Intervalle, 14 Orientierung, 268 orthogonal, 286 orthogonale Abbildungen, 313 orthogonale Matrix, 239, 289, 314 orthonormal, 286 Orthonormalisierungsverfahren, 285 Partialsumme, 93 partielle Integration, 176 partikul¨ are L¨ osung, 256, 341 Pascalsches Dreieck, 28 Periodenl¨ ange, 47 Periodizit¨ at, 47 Pol, 56 Polarkoordinaten, 32 Polynom, 55 Grad, 55 Potenzrechenregeln, 65 Potenzreihe, 139 Produktregel, 123 Quotientenkriterium, 98 Quotientenregel, 123 Randpunkt eines Intervalls, 14 Rang, 231 rationale Funktion, 56 rationale Zahlen, 13 Realteil, 29 reelle Zahlen, 13 Regel von l’Hospital, 133 Regel von Sarrus, 267 Regeln von de Morgan, 16 Reihe, 93 Reihenkonvergenz notwendige Bedingung, 95 Rekursion, 265 Restglied, 151 Lagrange’sche Darstellung, 152, 156 Riemann-integrierbar, 168 Schnitt von Mengen, 14 Schrankensatz, 126 selbstadjungierte Matrix, 239
388 Sinus, 60 Sinus Hyperbolicus, 66 Skalarprodukt, 282 Spaltenindex, 231 Spann, 216 spezielle L¨osung, 256, 341 Stammfunktion, 171 Standardbasis, 218 Standardl¨osungsansatz, 337, 339 Standardnorm, 280 Standardskalarprodukt, 283 stetig differenzierbar, 122 Streichungsmatrix, 264 Struktur der L¨osungsmenge, 253 st¨ uckweise differenzierbar, 122 st¨ uckweise stetig, 109 Substitutionsregel, 174 Summe geometrische, 27 Summenzeichen Rechenregeln, 26 Superpositionsprinzip, 255 Supremum, 113 surjektiv, 43 symmetrische Matrix, 239 Tangens, 61 Taylorpolynom, 151 Taylorreihe, 153 Teilmenge, 15 Teleskopsumme, 35, 72 transponierte Matrix, 238 Umkehrabbildung, 45 Umkehrfunktion Ableitung, 123 Umschreiben in ein System, 334 uneigentliche Intervalle, 14 uneigentliche Konvergenz, 79 Ungleichungen, 24 unit¨are Matrix, 239 unit¨arer Vektorraum, 284 unit¨ares Skalarprodukt, 284 untere Schranke, 46 Untervektorraum, 218 Urbild, 41
Index
Urbildmenge, 41 Urbildpunkt, 42 Vektorraum, 211 der reellen Zahlen, 212 der reellwertigen Funktionen, 214 Vektorraumoperationen, 213 Vereinigung von Mengen, 14 Verkettung, 48 Vielfachheit algebraische, 316 geometrische, 313, 317 vollst¨andige Induktion, 10 Wahrheitstabelle, 7 Wahrheitswert, 7 Wertebereich, 41 Wronski-Matrix, 344 Wronski-Test, 344 Wurzelkriterium, 97 Zeilenindex, 231 Zwischenwertsatz, 112