377 49 6MB
German Pages 462 [473] Year 2019
Rolf Brigola
Fourier-Analysis und Distributionen Eine Einführung mit Anwendungen
edition swk
Texte in der edition swk
Rudolf Rupp, Benedikt Plümper Komplexe Potentiale
Rolf Brigola Fourier-Analysis und Distributionen Eine Einführung mit Anwendungen
Norbert Ortner, Peter Wagner Distribution-Valued Analytic Functions Theory and Applications
In Deutschland versandkostenfrei erhältlich im Shop der Edition unter http://www.publish-books/editionswk
edition swk ist eine Reihe in der gemeinnützigen Stiftung Studium, Wissenschaft, Kunst (www.stiftung-swk.de/edition-swk), die in Zusammenarbeit mit dem Hamburger Verlag tredition erscheint. Der tredition Verlag verlegt mit den TREDITION CLASSICS auch die größte Klassiker-Buchreihe der Welt. Kooperationspartner für tredition sind hierbei u.a. die „Gutenberg-Projekte“. Diese Literatur-Projekte erhalten einen Teil der Verkaufserlöse als Unterstützung für ihre Arbeit.
Rolf Brigola
Fourier-Analysis und Distributionen Eine Einführung mit Anwendungen
edition swk
Prof. Dr. Rolf Brigola Technische Hochschule Nürnberg Georg-Simon-Ohm Fakultät Angewandte Mathematik, Physik und Allgemeinwissenschaften Keßlerplatz 12 90489 Nürnberg
© Rolf Brigola, 2012 Erschienen in der edition swk (www.stiftung-swk.de/edition-swk) Verlag & Druck: tredition GmbH, Halenreie 40-44, 22359 Hamburg
ISBN: 978-3-7497-2789-6 (Paperback) ISBN: 978-3-7497-2726-1 (Hardcover)
4. erweiterte Auflage 2019 Mathematics Subject Classification (2010): 42-01 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Angaben sind im Internet über http://dnb.d-nb.de abrufbar. Das Werk, einschließlich seiner Teile, ist urheberrechtlich geschützt. Jede Verwertung ist ohne Zustimmung des Verlags und des Autors unzulässig. Dies gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Umschlaggestaltung: Carsten Thomas, TH Nürnberg Georg-Simon-Ohm (Hardcover) und Tamara Pulkert, Nürnberg (Paperback). Der Umschlag des Hardcover-Buches zeigt die Formeln für die diskrete Fouriertransformation und eine Fundamentallösung für einen Differentialoperator P (∂) (vgl. Abschnitt 11.8), sowie Ausschnitte von Dirichletkernen. Auf dem Paperback-Umschlag sind Äquipotentialflächen im Halbraum y > 0 zu sehen, die von zwei Punktladungen −q und 2q erzeugt sind (vgl. Abschnitt 8.4). Das Potential ist eine reguläre Distribution mit Singularitäten an den Orten der Ladungen. Die zweite Grafik zeigt ein mit 16-QAM moduliertes WLAN-Amplitudenspektrum wie bei IEEE 802.11g (vgl. Abschnitt 11.2)
v
Vorwort Vorwort zur vierten Auflage Bei dieser Neuauflage habe ich das Buch um eine Reihe von Beispielen und Übungsaufgaben erweitert. Der Theorieteil beträgt mit ca. 180 Seiten weniger als die Hälfte des Textes, während der überwiegende Anteil typischen Anwendungsbeispielen, Übungsaufgaben und deren Lösungen gewidmet ist. Die Abschnitte über diskrete Fouriertransformationen und lineare Filter habe ich nochmals überarbeitet und einen Abschnitt über Anwendungen von Abtastverfahren hinzugefügt, um damit einen möglichst einfachen Einstieg in die weiterführende moderne Signalverarbeitung zu bieten. Für die Bearbeitung der Aufgaben, insbesondere für numerische Berechnungen, empfehle ich ein Computeralgebra-System wie Mathematica, Maple, Matlab oder frei verfügbare Alternativen. Auch für diese Neuauflage gilt meinen Kollegen Rudolf Rupp, TH Nürnberg, und Peter Singer, TH Ingolstadt, großer Dank für ihre Unterstützung. Ich hoffe, mit dem Text interessierten Leserinnen und Lesern eine ausreichende Unterstützung beim theoretischen Zugang zur Fourier-Analysis zu geben und auch zu den zahllosen Anwendungen, die unseren Alltag vielfach und zunehmend durchdringen. Nürnberg, im Sommer 2019
Rolf Brigola
Vorwort zur ersten Auflage Fourier-Analysis und Distributionentheorie sind fundamentale mathematische Werkzeuge bei der Beschreibung vieler technisch-naturwissenschaftlicher Probleme, zum Beispiel in der Mechanik, in der Elektrotechnik, in der Signaltheorie, Nachrichten- und Regelungstechnik. Der vorliegende Text wendet sich an angehende Mathematiker, Ingenieure und Naturwissenschaftler, die grundlegende mathematische Modellbildungen und Methoden der Fourier-Analysis kennenlernen und in Anwendungsproblemen umsetzen wollen. Er ist entstanden aus Vorlesungen für Studenten der Elektro- und Nachrichtentechnik ab dem vierten Semester an der Georg-Simon-Ohm-Hochschule Nürnberg und ersetzt in dieser überarbeiteten und erweiterten Fassung das Buch des Autors zum gleichen Thema, das 1996 beim inzwischen nicht mehr selbständig existierenden Vieweg-Verlag erschienen war und seit langem vergriffen ist. Das Buch richtet sich an engagierte Studenten mittlerer Semester in einem technisch-naturwissenschaftlichen Bachelor-Studiengang oder in einem beginnenden Master-Studium. Als Vorkenntnis wird ein üblicher Grundkurs über Differential- und Integralrechnung vorausgesetzt. Das Buch ist gegliedert in Kapitel mit mathematischen Grundlagen über Fourierreihen, Distributionen und Fouriertransformationen, denen jeweils eine Auswahl typischer Anwendungsbeispiele folgt. Die heute auch in den Ingenieur-Disziplinen gebräuchlichen Grundlagen der Distributionentheorie vereinfachen viele Betrachtungen und Rechnungen
vi
Vorwort
bei physikalisch-technischen Fragestellungen und machen sie zu einem guten Teil überhaupt erst möglich. Fourierreihen und Anwendungen auf elektrische Netzwerke bilden hierzu das erste anschauliche Beispielmaterial. Die Abschnitte über Anwendungsbeispiele können je nach Interessenlage weitgehend unabhängig voneinander gelesen werden. Neben einem Einstieg in die Grundtypen linearer partieller Differentialgleichungen und in Prinzipien der linearen Systemtheorie und Signalverarbeitung wird ein Einblick in numerische Aspekte für die praktische Anwendung der erlernten Methoden eröffnet. Diesem Ziel dienen die Abschnitte über die diskrete Fourierund Wavelettransformation mit ihren Anwendungen in der Signalverarbeitung und der Abschnitt über die Grundidee der Finiten Elemente. Ich habe versucht, die dargelegten Grundbegriffe zwar mit einem Minimum an mathematischer Theorie zu entwickeln, dabei aber die notwendigen Konvergenz- und Stetigkeitsbegriffe, die für eine tragfähige Anwendung erforderlich sind, soweit zu vermitteln, dass lernende Studierende über rein formale Handhabungen von Transformationsregeln, Dirac-Impulsen etc. hinauskommen und eine Kalkül-Sicherheit im Umgang mit Distributionen und Fouriertransformationen erreichen können. Ich hoffe, Studierende technischnaturwissenschaftlicher Ausrichtung mit dieser Einführung in die Lage zu versetzen und anzuregen, die erarbeiteten Kenntnisse in die Praxis umzusetzen und nach Bedarf mit weiterführender Literatur zu vertiefen. Eine Auswahl der verwendeten Quellen und Hinweise auf weiterführende Werke und heute leicht zugängliche Originalarbeiten findet man im Literaturverzeichnis. Für anregende Diskussionen bei der Entstehung des Buches gilt mein Dank meinem akademischen Lehrer Professor D. Kölzow sowie meinen Freunden und Kollegen S. Bolz, R. Rupp, J. Steinbach und E. Wermuth in Nürnberg, E. Novak in Jena, D. Meintrup und P. Singer in Ingolstadt. Großen Dank habe ich insbesondere zu richten an Professor E. Albrecht, Saarbrücken, und meinen Kollegen H. Leinfelder, Nürnberg und Pilsen, für neuere Ergebnisse ihrer Arbeit, die nach meiner Kenntnis bisher noch nicht in anderen Lehrbüchern erschienen sind. Dies sind die Sätze von E. Albrecht über Faltungsdarstellungen kausaler zeitinvarianter linearer Systeme in Kapitel 10 und die elementaren Beweise des Satzes von Malgrange-Ehrenpreis in Abschnitt 11.8 und des Fundamentalsatzes der Algebra in Anhang A in der Darstellung von H. Leinfelder. Gleichfalls danke ich meinen Studenten, die mit hoher Motivation und konstruktiver Kritik in den Vorlesungen und Seminaren, die dem Buch zugrunde liegen, mitgearbeitet haben. Herrn H. Heinze danke ich für seine vielfältige Unterstützung beim Buchsatz mit LATEX. Ein wichtiger Teil des Buches sind die Übungsaufgaben, die ernsthafte Leser selbständig bearbeiten sollten. Die meisten Aufgaben dienen der Festigung der vermittelten Inhalte und der Einübung einer soliden Rechentechnik. Manche Aufgaben habe ich mit einem ⋆ versehen. Diese Aufgaben sind vornehmlich für Mathematiker unter den Lesern gedacht und zeigen bisweilen Aspekte, auf die sonst im Text nicht näher eingegangen wird. Zur Kontrolle sind Lösungen oder Lösungshinweise für alle Aufgaben in Anhang C angegeben. Weitere Übungen und Beispiele, die mit dem Computeralgebrasystem Maple oder dem Numeriksystem Matlab gerechnet sind, kann man bei Interesse auf den im Internet leicht zu recherchierenden Seiten des Autors finden. Nürnberg, im Sommer 2012 Rolf Brigola
vii
Inhaltsverzeichnis Vorwort
v
Inhaltsverzeichnis
vii
1
Einführung 1.1 Geschichtliches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Das Problem der schwingenden Saite . . . . . . . . . . . . . . . . . .
2
Trigonometrische Polynome, Fourierkoeffizienten 2.1 Darstellungen trigonometrischer Polynome . . . . . . 2.2 Die Fourierkoeffizienten trigonometrischer Polynome . 2.3 Dirichlet-Kerne . . . . . . . . . . . . . . . . . . . . . 2.4 Zusammenfassung über trigonometrische Polynome .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
7 . 7 . 8 . 11 . 13
Fourierreihen 3.1 Die erste Fourierreihe . . . . . . . . . 3.2 Grundlegende Sätze über Fourierreihen 3.3 Das Spektrum periodischer Funktionen 3.4 Übungsaufgaben . . . . . . . . . . . .
3
4
5
1 1 2
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
15 15 22 26 30
Rechnen mit Fourierreihen 4.1 Symmetrie-Eigenschaften, Linearität, Ähnlichkeit . 4.2 Translationen im Zeit- und im Frequenzbereich . . 4.3 Die Ableitung von Fourierreihen . . . . . . . . . . 4.4 Integration von Fourierreihen . . . . . . . . . . . 4.5 Asymptotisches Verhalten der Fourierkoeffizienten 4.6 Spektrum und Leistung, Parseval-Gleichung . . . . 4.7 Übungsaufgaben . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
31 31 35 37 38 39 43 44
Anwendungsbeispiele für Fourierreihen 5.1 Beste Approximation im quadratischen Mittel . . . . . 5.2 Periodische Faltung, Anwendung auf lineare Systeme . 5.3 Die Potentialgleichung auf einer Kreisscheibe . . . . . 5.4 Lösung für das Problem der schwingenden Saite . . . 5.5 Der Approximationssatz von Weierstraß . . . . . . . . 5.6 Das 1/f -Theorem von Wiener . . . . . . . . . . . . . 5.7 Einführung in die diskrete Fouriertransformation . . . 5.8 Übungsaufgaben . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
47 47 50 54 58 62 63 66 101
. . . .
. . . .
. . . .
. . . .
. . . .
viii
Inhaltsverzeichnis
6 Zur Konvergenz von Fourierreihen 6.1 Der Satz von Dirichlet . . . . . . . . . . . . . . 6.2 Der Satz von Fejér, Konvergenz von Glättungen . 6.3 Die Parseval-Gleichung . . . . . . . . . . . . . 6.4 Fourierreihen für Funktionen mehrerer Variablen 6.5 Gründe für den Übergang zu Distributionen . . . 6.6 Übungsaufgaben . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
107 107 109 115 116 121 123
7 Grundzüge der Distributionentheorie 7.1 Beschreibung von Funktionen durch Mittelwerte . . . . . 7.2 Testfunktionen . . . . . . . . . . . . . . . . . . . . . . . 7.3 Der δ-Impuls . . . . . . . . . . . . . . . . . . . . . . . . 7.4 Distributionen . . . . . . . . . . . . . . . . . . . . . . . 7.5 Rechnen mit Distributionen . . . . . . . . . . . . . . . . 7.6 Testfunktionen und Distributionen mit mehreren Variablen 7.7 Tensorprodukt und Faltung . . . . . . . . . . . . . . . . . 7.8 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
125 125 128 129 135 141 155 158 169
8 Anwendungsbeispiele für Distributionen 8.1 Periodische Distributionen sind verallgemeinerte Fourierreihen . 8.2 Lineare Differentialgleichungen mit konstanten Koeffizienten . 8.3 Anwendung auf lineare elektrische Netzwerke . . . . . . . . . 8.4 Räumliche Potentialprobleme . . . . . . . . . . . . . . . . . . 8.5 Die Grundidee der Finiten Elemente . . . . . . . . . . . . . . . 8.6 Distributionelle Lösung der Schwingungsgleichung . . . . . . . 8.7 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . 8.8 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
173 173 180 191 195 205 219 221 223
9 Die Fouriertransformation 9.1 Darstellung von Funktionen durch harmonische Schwingungen 9.2 Fouriertransformation reellwertiger Funktionen . . . . . . . . . 9.3 Gibbs-Phänomen und Glättung . . . . . . . . . . . . . . . . . . 9.4 Rechnen mit Fouriertransformationen . . . . . . . . . . . . . . 9.5 Die Fouriertransformation für temperierte Distributionen . . . . 9.6 Fouriertransformation von Faltungen . . . . . . . . . . . . . . 9.7 Fouriertransformation quadratisch integrierbarer Funktionen . . 9.8 Die Fouriertransformation für Funktionen mehrerer Variablen . 9.9 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
227 227 230 234 235 242 254 261 264 270
10 Grundlagen über Lineare Filter 10.1 Signale . . . . . . . . . . . . . . . . . . . . . 10.2 Translationsinvariante lineare Systeme . . . . . 10.3 Analoge lineare Filter, Stetigkeit und Kausalität 10.4 Analoge Filter mit rationalen Frequenzgängen . 10.5 Periodische Signale, stationäre Filterantwort . 10.6 Diskrete lineare Filter, z-Transformation . . . . 10.7 Übungsaufgaben . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
273 273 276 277 287 294 298 323
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
ix 11 Weitere Anwendungsbeispiele für die Fouriertransformation 11.1 Der Abtastsatz von Shannon . . . . . . . . . . . . . . . . . . . 11.2 Sampling als Grundlage digitaler Übertragungstechnik . . . . . 11.3 Die Heisenbergsche Unschärferelation . . . . . . . . . . . . . . 11.4 Zeit-Frequenz-Analyse, gefensterte Fouriertransformationen . . 11.5 Zeitfenster bei der diskreten Fouriertransformation . . . . . . . 11.6 Anfangswertprobleme für stabile zeitinvariante lineare Systeme 11.7 Anfangswertprobleme für Wellen- und Wärmeleitungsgleichung 11.8 Der Satz von Malgrange-Ehrenpreis . . . . . . . . . . . . . . . 11.9 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
327 327 330 343 349 357 363 364 369 377
12 Ausblicke auf weiterführende Konzepte 379 12.1 Hilberträume, spezielle vollständige Orthonormalsysteme . . . . . . . 379 12.2 Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 A Der Residuensatz und der Fundamentalsatz der Algebra
405
B Hilfsmittel aus der Integrationstheorie
411
C Lösungen zu den Übungsaufgaben
423
Literaturverzeichnis
449
Symbolverzeichnis und physikalische Größen
457
Index
459
1
1
Einführung
1.1 Geschichtliches Trigonometrische Reihen der Form ∞ a0 X an cos(nωt) + bn sin(nωt) , + 2 n=1
unter geeigneten Bedingungen an die dargestellten Funktionen und die Reihenkoeffizienten später Fourierreihen genannt, wurden historisch erstmals benutzt zur Beschreibung periodischer Vorgänge in der Astronomie und zur Behandlung der Bewegungsgleichung einer schwingenden Saite. Schon D. Bernoulli (1700-1782) vertrat 1753 die Auffassung, dass sich „jede“ Schwingungsform einer Saite als Überlagerung einer Grundschwingung mit einer Kreisfrequenz ω und Oberschwingungen mit den Frequenz-Vielfachen nω darstellen lasse. Der französische Mathematiker Jean Baptiste Joseph Fourier (1768-1830) benutzte 1807 solche trigonometrischen Reihen zur Darstellung von Lösungen der Wärmeleitungsgleichung. Für einen Stab der Länge l mit der Temperaturleitfähigkeit k, dessen Enden auf der Temperatur Null gehalten werden, wird die Temperatur u(x,t) in x ∈ [0,l] zur Zeit t ≥ 0 durch folgende homogene partielle Differentialgleichung beschrieben: ∂2u ∂u (x,t) = k 2 (x,t) ∂t ∂x u(x,0) = f (x)
(keine Energiezufuhr von außen) (Anfangstemperaturverteilung f ) (die Enden des Stabes sind eisgekühlt).
u(0,t) = u(l,t) = 0 Die Fouriersche Reihenlösung lautete u(x,t) =
∞ X
2
bn e−k(nπ/l) t sin
n=1
2 bn = l
ˆl 0
f (y) sin
nπ x , l
nπ y dy . l
Da Fourier noch sehr anschaulich argumentierte, stieß seine Theorie der Wärmeausbreitung auf Vorbehalte und Bedenken, die erst nach jahrzehntelanger, doch letztlich äußerst fruchtbarer Diskussion ausgeräumt werden konnten. Die exakte Klärung der mathematischen Grundbegriffe für die Aussagen Fouriers geht wesentlich zurück auf Arbeiten des Mathematikers P. L. Dirichlet (1805-1859). Nach Ablauf fast eines Jahrhunderts war dann klar, dass Fouriers Arbeit wichtige Impulse für viele Teilbereiche der Mathematik gegeben hatte. Fragestellungen der Fourier-Analysis, d.h. der Darstellung von Funktionen durch harmonische Schwingungen, führten Dirichlet zum modernen Funktionsbegriff, standen am
2
1 Einführung
Beginn der Mengenlehre G. Cantors (1845-1918), und waren Ausgangspunkte der Maßund Integrationstheorie von B. Riemann (1826-1866) und H. Lebesgue (1875-1941). Die Funktionalanalysis und die moderne numerische Mathematik erhalten bis heute starke Anregungen aus der Theorie der Fourierreihen für ihre abstrakten Begriffe und die dadurch neu entstandenen Methoden zur Lösung konkreter Anwendungsprobleme. Schon mit der Diskussion der Fourierschen Ideen begann auch ihr Triumphzug in den Ingenieur- und Naturwissenschaften, wo sie bis heute zu den wirkungsvollsten mathematischen Hilfsmitteln zählen. Zur Erklärung der Grundgedanken von Bernoulli und Fourier behandeln wir zunächst das Problem der schwingenden Saite. Die Saitenschwingung kann als elementares Beispiel eines akustischen Signals aufgefasst werden, aus dem schon wesentliche Grundbegriffe für viele Anwendungsgebiete der Fourier-Analysis entwickelt werden können.
1.2 Das Problem der schwingenden Saite Hierzu betrachten wir die kräftefreie Bewegung einer an zwei Enden eingespannten, homogenen dünnen Saite der Länge l. Wie wird sich die Saite bewegen, wenn sie aus ihrer Ruhelage ausgelenkt und dann losgelassen wird? Um die Frage rechnerisch behandeln zu können, führen wir ein Koordinatensystem ein und bezeichnen die transversale Auslenkung der Saite an der Stelle x zur Zeit t mit u(x,t). u(x,0) = f (x) 0
x
l
Gesucht wird eine zweimal stetig differenzierbare Funktion u(x,t) auf [0,l] × R+ 0 , welche die Randbedingungen u(0,t) = u(l,t) = 0 für t ≥ 0,
und die Anfangsbedingungen
u(x,0) = f (x) ∂u (x,t) = g(x) lim t→0+ ∂t
für 0 ≤ x ≤ l, f (0) = f (l) = 0, für 0 ≤ x ≤ l, g(0) = g(l) = 0
erfüllt. „Loslassen“ bedeutet im Beispiel, dass g = 0 ist auf [0,l]. Um u(x,t) auch für Zeiten t > 0 bestimmen zu können, entnehmen wir aus der Physik, dass die Funktion u(x,t) bei kräftefreier Bewegung für kleine transversale Auslenkungen näherungsweise der eindimensionalen Wellengleichung genügt: 2 ∂2u 2∂ u = c ∂t2 ∂x2
(0 < x < l, t > 0),
mit den vorgenannten Rand- und Anfangsbedingungen.
1.2 Das Problem der schwingenden Saite
3
Die Konstante c2 = P/̺ ist dabei der Quotient aus der Spannung P und der Massendichte ̺ der Saite. P ist der Quotient aus Spannkraft F und Saiten-Querschnittsfläche A. Die Konstante c hat damit die physikalische Dimension einer Geschwindigkeit. Nimmt man nun zusätzlich an, dass u(x,t) von der Form u(x,t) = v(x) · w(t)
(Trennung der Variablen)
ist, so folgt durch Einsetzen in die Wellengleichung v w¨ = c2 v ′′ w. d2 v dv d2 w dw und v ′′ = . und v ′ = ,w ¨= 2 dt dx dt dx2 2 2 Division durch c vw (unter der Voraussetzung c vw 6= 0) ergibt dann
Dabei benutzen wir die Notation w˙ =
w ¨ v ′′ = . c2 w v Weil die linke Seite eine Funktion nur von t ist und nicht von x abhängt, kann auch die rechte Seite nicht von x abhängen, muss mithin konstant sein. Gibt man der Konstanten den Namen λ, so erhält man zwei gewöhnliche lineare Differentialgleichungen v ′′ − λv = 0 w ¨ − λc2 w = 0 und Nebenbedingungen v(0) = v(l) = 0 v(x)w(0) = f (x) v(x) lim w(t) ˙ = g(x) t→0+
(0 ≤ x ≤ l)
(0 ≤ x ≤ l).
(1.1) (1.2) (1.3)
Zur Erinnerung an gewöhnliche lineare Differentialgleichungen bestimmen wir die Lösungen von v ′′ − λv = 0: Der Ansatz v(x) = esx führt auf die Gleichung esx (s2 − λ) = 0. Da immer esx 6= 0 ist, erhält man Lösungen durch Bestimmung der Nullstellen des charakteristischen Polynoms P (s) = s2 − λ. Die Nullstellen des charakteristischen Polynoms P (s) = s2 − λ sind √ λ>0 ± λ 0 √ falls λ = 0 ±j −λ λ < 0. Dabei bezeichnet j die komplexe Einheit mit j 2 = −1. Für Leser, die an Stelle von j die in der Mathematik sonst übliche Bezeichnung i, i2 = −1, gewohnt sind, sei bemerkt, dass j 2 = −1 die in der Literatur zur Elektrotechnik und Signalverarbeitung weit verbreitete Notation ist, weil dort der Buchstabe i als Bezeichnung für die Stromstärke fest vergeben ist. Man vergleiche hierzu etwa die Standardwerke von O. Föllinger (2008), K.-D. Kammeyer, A. Dekorsy (2018) oder A. Papoulis (1987). Mathematiker als Leser kommen mit dieser Notationsvariante im Text sicher leicht zurecht.
4
1 Einführung √
1. Fall: λ > 0: Nehmen wir an, eine der Lösungen v(x) = c1 e λ·x +c2 e− die Randbedingungen. Dann gilt für die entsprechenden c1 und c2 c1 e
√ λ·0 √
√
λ·0
√ − λ·l
erfüllt
= c1 + c2 = 0,
+c2 e = 0. 1 √ 6= 0, ergibt sich c1 = c2 = 0, d.h. nur die Null− λ·l
c1 e
λ·l
+c2 e−
√ λ·x
1 √ e λ·l e Lösung kommt in Frage. Diese erfüllt aber nicht die Anfangsbedingung (1.2) für f 6= 0 und bleibt daher außer Betracht.
Weil aber det
2. Fall: λ = 0: c1 + c2 x = 0 für x = 0 und x = l ergibt auch hier c1 = c2 = 0, also wieder eine Lösung der homogenen Differentialgleichung v ′′ − λv = 0, die nicht unseren Anfangsbedingungen genügt. 3. Fall: λ < 0: Dann ist die allgemeine Lösung von v ′′ − λv = 0 gegeben durch √ √ v(x) = c1 cos( −λ · x) + c2 sin( −λ · x). Um die Randbedingungen zu erfüllen, müssen c1 ,c2 so gewählt werden, dass √ √ √ √ 0 = c1 cos( −λ·0)+c2 sin( −λ·0) und 0 = c1 cos( −λ·l)+c2 sin( −λ·l) √ gelten, also √ c1 = 0 und c2 sin( −λ · l) = 0. Dies ist möglich für beliebige 2 c2 ∈ R und −λ · l = n · π, n ∈ Z, also für λ von der Form λn = − (nπ/l) , n ∈ Z. Zusammenfassend können wir sagen, dass für jedes n ∈ N die Funktionen nπ x , (cn ∈ R beliebig) vn (x) = cn sin l
Lösungen von v ′′ − λn v = 0 sind, welche der Randbedingung (1.1) genügen. 2 Anschließend bestimmt man für jeden Wert λn = − (nπ/l) die allgemeine Lösung von 2 w ¨ − λn c w = 0 und erhält ganz analog die Lösungen cnπ cnπ wn (t) = an cos t + bn sin t . l l Mit dem Ansatz u(x,t) = v(x)w(t) ergibt sich als n-te Eigenschwingung der Saite nπ cnπ cnπ un (x,t) = sin x an cos t + bn sin t l l l
(n ∈ N; die Faktoren cn von vn sind den Faktoren an ,bn zugeschlagen). Die n-te Eigenschwingung besitzt die Kreisfrequenz ωn = cnπ/l. Durch Einsetzen in die Anfangsbedingungen sieht man, dass eine Eigenschwingung un (x,t) eine Lösung des Problems ist, wenn gilt: nπ nπ cnπ x und g(x) = bn sin x . f (x) = an sin l l l
1.2 Das Problem der schwingenden Saite
5
Trigonometrische Polynome, d.h. Linearkombinationen der Form f (x) =
N X
an sin
n=1
nπ x l
und g(x) =
N nπ X cnπ bn sin x l l n=1
sind im mathematischen Modell Näherungen für die exakten Anfangsbedingungen der Saitenschwingung. Die resultierende Linearkombination von Eigenschwingungen mit den Koeffizienten an und bn der Anfangsbedingungen u(x,t) =
N X
sin
n=1
cnπ cnπ nπ x an cos t + bn sin t l l l
ist dann eine Näherungslösung für die exakte Saitenauslenkung. Um gute Näherungen für verschiedene physikalische Bedingungen zu erhalten, möchte man möglichst allgemeine Anfangsbedingungen f und g behandeln können. Je mehr trigonometrische Funktionen man zur Nachbildung von f und g verwendet, desto bessere Näherungen wird man erwarten dürfen. Man setzt daher f und g als unendliche trigonometrische Reihen an, f (x) =
∞ X
an sin
n=1
nπ x l
und g(x) =
∞ nπ X cnπ bn sin x , l l n=1
und versucht, eine Lösung durch Überlagerung unendlich vieler Eigenschwingungen in der Form ∞ cnπ cnπ nπ X x an cos t + bn sin t u(x,t) = sin l l l n=1
zu finden. Wenn die Reihe gegen eine hinreichend glatte Funktion konvergiert, stellt sie einen möglichen Bewegungsablauf mit den Randbedingungen u(0,t) = u(l,t) = 0 dar. Die Größen an und bn sind dadurch bestimmt, dass die Anfangsbedingungen erfüllt sein sollen. Sie haben die gleiche physikalische Einheit wie u(x,t). Einsetzen der Reihe in die Anfangsbedingungen ergibt bei gliedweiser Differentiation und Vertauschung der Grenzwertbildung t → 0+ mit der Reihen-Grenzwertbildung: u(x,0) =
∞ X
n=1 ∞ X
an sin
nπ x = f (x), l
nπ cnπ ∂u (x,t) = bn sin x = g(x). t→0+ ∂t l l n=1 lim
An diesem Punkt nun erheben sich zwangsläufig folgende Fragen, um das Problem endgültig zu lösen: Frage 1: Welche Funktionen f und g auf [0,l] können überhaupt durch trigonometrische Reihen dargestellt werden? Es war Bernoullis und Fouriers Grundgedanke, dass durch geeignete Wahl der unendlich vielen Koeffizienten an und bn nahezu jede praktisch relevante Funktion als Überlagerung harmonischer Schwingungen nachgebildet werden könne. Damit wäre das Saitenproblem mit der Reihenmethode für nahezu „beliebige“ Anfangsbedingungen zu lösen.
6
1 Einführung
Frage 2: Wenn man davon ausgehen kann, dass gegebene Funktionen f und g solche Darstellungen als trigonometrische Reihen besitzen, wie kann man dann die dafür notwendigen Koeffizienten an und bn berechnen? Erst mit der Angabe dieser Koeffizienten wäre das Schwingungsproblem explizit gelöst. Frage 2 wird in den beiden folgenden Kapiteln beantwortet. Dabei ist auch das Problem zu lösen, ob die errechnete Reihendarstellung für die gesuchte Funktion u(x,t) tatsächlich eine eindeutige, zweimal differenzierbare Lösung des Ausgangsproblems ist. Die obige Lösung wurde ja errechnet aufgrund der Annahme der sehr speziellen Form der Lösung u(x,t) = v(x)w(t) mit getrennten Variablen. Außerdem hat man einmal gelernt, dass man Funktionenreihen nicht ohne weiteres gliedweise differenzieren und Grenzwertbildungen vertauschen darf, was wir aber bei der Lösungsberechnung unterstellt haben. Dieses Problem führt deshalb auf Frage 3: In welchem Sinn – abhängig von den Anfangsbedingungen f und g – konvergiert überhaupt die trigonometrische Reihe zur Darstellung von u(x,t)? Ist die Reihe eigentlich zweimal gliedweise differenzierbar? Ist die vorgelegte Lösung der Anfangsrandwertaufgabe für die Schwingungsgleichung eindeutig? Diese Fragen zeigen direkt die Bedenken, die man Anfang des 19. Jahrhunderts Fouriers Lösungsansatz entgegenbringen musste. Eine Konvergenztheorie für unendliche Reihen wurde erst zu Fouriers Zeiten um 1821 von A. L. Cauchy (1789-1857) entwickelt. Befriedigende Aussagen über die Lösbarkeit linearer, partieller Differentialgleichungen ergaben sich erst gegen Mitte des 20. Jahrhunderts mit der Behandlung solcher Probleme im Rahmen der Theorie der verallgemeinerten Funktionen oder, wie man auch sagt, der Distributionen. Zur schrittweisen Beantwortung der aufgeworfenen Fragen beginnen wir im nächsten Abschnitt mit einigen Grundlagen über trigonometrische Polynome. Dabei erweisen sich vielfach Darstellungen mit Hilfe der komplexen Zahlen als sehr nützlich. Lesern, die bisher im Wesentlichen nur mit der reellen Analysis vertraut sind, seien daher die Abschnitte über komplexe Zahlen und komplexe Elementarfunktionen zum Beispiel in den Lehrbüchern von K. Meyberg, P. Vachenauer (2001) vorab zur Lektüre empfohlen. Auch eine Formelsammlung wie die von L. Råde, B. Westergren (2000) kann sehr hilfreich sein. Wir werden insbesondere die komplexe Exponentialfunktion und ihre enge Verbindung mit den trigonometrischen Funktionen laufend benutzen. Vertiefte Kenntnisse über die Theorie komplexer Funktionen werden im Folgenden nicht vorausgesetzt. Der Residuensatz, auf den in Kapitel 10 im Zusammenhang mit der z-Transformation Bezug genommen wird, ist im Anhang des Buches formuliert. Dort findet sich auch eine elementare Herleitung des Fundamentalsatzes der Algebra, den wir mehrfach im weiteren Verlauf verwenden werden. Zu Referenzen im Text – wie oben K. Meyberg, P. Vachenauer (2001) – sei an dieser Stelle angemerkt, dass Namensangaben, gefolgt von einer Jahreszahl in Klammern, sich stets auf Quellen beziehen, die im Literaturverzeichnis am Ende des Buches zu finden sind. Die Angabe A. L. Cauchy (1789-1857) ist dagegen keine Literaturreferenz, sondern gibt die Lebenszeit von Cauchy an, hier dem Jahr der französischen Revolution bis zur ersten Weltwirtschaftskrise 1857.
7
2
Trigonometrische Polynome, Fourierkoeffizienten
2.1 Darstellungen trigonometrischer Polynome Als trigonometrisches Polynom der Periode T bezeichnet man eine Funktion f mit Werten in R oder C der Gestalt N
f (t) =
a0 X + (an cos(nω0 t) + bn sin(nω0 t)) 2 n=1
mit N ∈ N, t ∈ R, ω0 = 2π/T . Für rechnerische Zwecke ist meist eine komplexe Darstellung nützlicher. Mit der komplexen Einheit j, j 2 = −1, und den Formeln für Real- und Imaginärteil von ejnω0 t 1 jnω0 t e + e−jnω0 t = ℜ ejnω0 t , 2 1 jnω0 t j e sin(nω0 t) = − e−jnω0 t = − ejnω0 t − e−jnω0 t = ℑ ejnω0 t 2j 2
cos(nω0 t) =
folgt durch Einsetzen mit b0 = 0
N 1 j j a0 X 1 jnω0 t −jnω0 t jnω0 t −jnω0 t + an e + an e − bn e + bn e f (t) = 2 2 2 2 2 n=1 N N X X an − jbn an + jbn ejnω0 t + e−jnω0 t = 2 2 n=0 | n=1 | {z } {z } =cn
=
N X
=c−n
cn ejnω0 t +
n=0
−1 X
cn ejnω0 t =
n=−N
N X
cn ejnω0 t .
n=−N
Die Konstanten cn bzw. an und bn heißen Fourierkoeffizienten von f . Für N N X a0 X + (an cos(nω0 t) + bn sin(nω0 t)) = cn ejnω0 t f (t) = 2 n=1 n=−N
gelten daher folgende Umrechnungsformeln zwischen den Fourierkoeffizienten: an − jbn , 2 b0 = 0,
cn =
an + jbn , 2 a0 = 2c0 ,
c−n =
an = cn + c−n ,
bn = j(cn − c−n ).
8
2 Trigonometrische Polynome, Fourierkoeffizienten
2.2 Die Fourierkoeffizienten trigonometrischer Polynome Berechnung der Fourierkoeffizienten Die Antwort auf die Frage nach der Berechnung der Fourierkoeffizienten ergibt sich aus folgenden Orthonormalitätsrelationen für die trigonometrischen Funktionen: Für alle n,k ∈ Z gilt mit der konjugiert komplexen Funktion ejkω0 t = e−jkω0 t zu ejkω0 t 2 (j = −1) ˆT 1 1 für n = k jnω0 t jkω0 t e e dt = 0 für n 6= k, T 0
denn ˆT
e
jnω0 t −jkω0 t
e
dt =
ˆT
1 dt = T
für k = n;
0
0
ˆT
ej(n−k)ω0 t dt =
1 e|j(n−k)·2π −1 = 0 für k 6= n. {z } j(n − k)ω0 1
0
Wenn f (t) von der Form f (t) =
N X
ck ejkω0 t ist, so berechnet man ck durch
k=−N
ck =
1 T
ˆT
f (t) e−jkω0 t dt ,
0
denn 1 T
ˆT
T
−jkω0 t
f (t) e
0
ˆ N 1 X dt = cn ejnω0 t e−jkω0 t dt = ck . T n=−N 0 | {z } T für n = k 0 sonst
Hieraus folgt für die Berechnung der Fourierkoeffizienten an , bn , n = 1, . . . ,N : 1 a0 = c0 = 2 T
ˆT
1 T
ˆT
f (t) dt
0
an = cn + c−n =
0
j bn = j(cn − c−n ) = T
ˆT 0
2 f (t) e−jnω0 t + ejnω0 t dt = T | {z } 2 cos(nω0 t)
2 f (t) e−jnω0 t − ejnω0 t dt = T | {z } −2j sin(nω0 t)
ˆT
f (t) cos(nω0 t) dt
0
ˆT 0
f (t) sin(nω0 t) dt.
2.2 Die Fourierkoeffizienten trigonometrischer Polynome
9
Gleichheit trigonometrischer Polynome, Koeffizientenvergleich Setzt man für je zwei stetige T -periodische Funktionen f : R → C und g : R → C 1 hf |gi = hf (t)|g(t)i = T
ˆT
f (t)g(t) dt ,
0
so ist dadurch ein inneres Produkt im Vektorraum V der stetigen T -periodischen Funktionen definiert. Es hat die gleichen Eigenschaften wie das Skalarprodukt für Vektoren im Rn oder Cn und gestattet, geometrische Begriffe wie Orthogonalität von Vektoren auf Funktionen zu übertragen. Für stetige T -periodische Funktionen f , g und h gelten hf + g|hi = hf |hi + hg|hi
hf |g + hi = hf |gi + hf |hi hαf |gi = αhf |gi (α ∈ C) (β ∈ C)
hf |βgi = βhf |gi hf |gi = hg|f i
hf |f i ≥ 0 hf |f i = 0 ⇐⇒ f (t) = 0 für alle t ∈ [0,T ]. 1 für n = k Daher zeigen die Orthonormalitätsrelationen hejnω0 t | ejkω0 t i = , dass die 0 für n 6= k Funktionen ejnω0 t n∈Z ein linear unabhängiges Funktionensystem im Vektorraum V bilden (ω0 = 2π/T ). Der Untervektorraum der T -periodischen trigonometrischen Polynome bis zum Grad N besitzt damit die Dimension 2N + 1 und er wird aufgespannt von den Funktionen ejnω0 t , −N ≤ n ≤ N , ω0 = 2π/T . Sie bilden eine Orthonormalbasis dieses Untervektorraumes bezüglich des oben eingeführten inneren Produktes. Der k-te Fourierkoeffizient ck eines T -periodischen trigonometrischen Polynoms f ist in dieser Schreibweise 1 gegeben durch ck = hf (t)| ejkω0 t i
(ω0 = 2π/T ).
Die Fourierkoeffizienten sind daher gerade die Koordinaten des Polynoms bezüglich dieser Orthonormalbasis. Sie sind eindeutig bestimmt, mit anderen Worten, f (t) =
N X
k=−N
N
ck ejkω0 t =
a0 X + (an cos(nω0 t) + bn sin(nω0 t)) = 0 2 n=1
für alle t genau dann, wenn alle ck = 0 bzw. alle an = bn = 0 sind. 1
Die Schreibweise f (t) wird hier wie in allem Folgenden nicht nur für den Wert einer Funktion f bei t verwendet, sondern häufig auch zur Notation einer Funktion oder später Distribution f , um den Parameter t mit anzugeben. Trotz dieser ambivalenten Notation – an Stelle von f oder etwa f (.) – erkennt man die Bedeutung leicht aus dem jeweiligen Zusammenhang.
10
2 Trigonometrische Polynome, Fourierkoeffizienten
Zwei T -periodische trigonometrische Polynome sind also genau dann gleich, wenn alle ihre Fourierkoeffizienten beim Koeffizientenvergleich übereinstimmen. Die Formel für die Fourierkoeffizienten zeigt außerdem, dass jedes T -periodische trigonometrische Polynom f vom Grad N folgende Integraldarstellung besitzt: 1 f (t) = T
ˆT 0
mit DN (t − s) =
f (s)DN (t − s) ds
N X
ejkω0 (t−s) .
k=−N
Reellwertige trigonometrische Polynome, komplexe Amplituden, Polarform Für reellwertige T -periodische trigonometrische Polynome gilt f (t) = f (t), also f (t) =
N X
ck ejkω0 t =
k=−N
N X
k=−N
c−k e−jkω0 t =
N X
ck e−jkω0 t = f (t)
k=−N
mit ω0 = 2π/T . Koeffizientenvergleich zeigt: f ist reellwertig genau dann, wenn ck = c−k
(−N ≤ k ≤ N ).
Wegen ck = |ck | ej arg(ck ) und arg(c−k ) = − arg(ck ) für k 6= 0 erhält man dann f (t) = c0 +
N X
k=1
= c0 +
N X
k=1
|ck | ej(kω0 t+arg(ck )) +
N X
k=1
|c−k | e−j(kω0 t−arg(c−k ))
|ck | · 2 ℜ ej(kω0 t+arg(ck )) ;
es gilt deshalb für diesen Fall die Darstellung in Polarform f (t) = c0 + 2 ·
N X
k=1
|ck | cos(kω0 t + arg(ck )).
Die komplexen Fourierkoeffizienten beinhalten die Information über die Amplituden und über die Phasen der am Aufbau von f beteiligten Teilschwingungen. Man bezeichnet daher die Größen ck als komplexe Amplituden. C-wertige trigonometrische Polynome kann man darstellen als zirkuläre Schwingungen (wie auf S. 13 unten), als Ortskurve in C, durch getrennte Darstellung von Real- und Imaginärteil oder durch Betrags- und Phasen-Verlauf. Anzahl der Nullstellen trigonometrischer Polynome Ein T -periodisches trigonometrisches Polynom vom Grad N > 0 f (t) =
N X
k=−N
ck ejkω0 t
2π ω0 = T
2.3 Dirichlet-Kerne
11
mit |cN | + |c−N | 6= 0 entsteht durch die Substitution z = ejω0 t aus der rationalen Funktion F (z) =
N X
ck z k =
k=−N
c−N + c−N +1 z + . . . + cN z 2N . zN
f hat daher wegen |z| = 1 höchstens 2N Nullstellen pro Periode T . Insbesondere folgt hieraus, dass zwei trigonometrische Polynome P und Q vom Grad N , die in [0,T [ an 2N + 1 Stellen übereinstimmen, identisch sind. Denn P − Q hat höchstens den Grad N , aber mehr als 2N Nullstellen in [0,T [, d.h. P − Q ist Null (vgl. Fundamentalsatz der Algebra im Anhang).
2.3 Dirichlet-Kerne Wir betrachten das trigonometrische Polynom DN (t) =
N X
ejkt . Diese Funktion heißt
k=−N
Dirichlet-Kern vom Grad N , und spielt eine entscheidende Rolle bei der Antwort auf die Frage 1 aus Abschnitt 1.2 nach der Darstellbarkeit von Funktionen durch trigonometrische Reihen. Nach der Polardarstellung gilt für t ∈ R DN (t) =
N X
ejkt = 1 + 2 cos(t) + 2 cos(2t) + . . . + 2 cos(N t).
k=−N
Man bemerkt, dass DN eine gerade Funktion ist. Wir substituieren z = ejt und benutzen für z 6= 1 die bekannte Formel für die Summe der geometrischen Reihe 2N X z 2N +1 − 1 . zk = z−1 k=0
Für t 6= 2πn, n ∈ Z ergibt sich damit: DN (t) =
N X
k=−N
zk =
z 2N +1 − 1 1 + z + . . . + z 2N = zN (z − 1)z N
z N +1 − z −N z N +1/2 − z −(N +1/2) = z−1 z 1/2 − z −1/2 j(N +1/2)t −j(N +1/2)t sin N + 21 t e −e = . = ejt/2 − e−jt/2 sin 2t
=
Somit kann man die Funktion DN auch folgendermaßen beschreiben: für t = 2πn, n ∈ Z N 2N + 1 X jkt 1 e = sin (N + 2 )t DN (t) = für t 6= 2πn, n ∈ Z. k=−N sin( 2t )
12
2 Trigonometrische Polynome, Fourierkoeffizienten
Satz. Für die Dirichlet-Kerne DN (t) gilt lim
N →∞
N X
ejkt = lim
N →∞
k=−N
1+
N X
!
2 cos(kt)
k=1
=
(
+∞ für t = 2πn ,
n∈Z
unbestimmt divergent sonst.
An keiner einzigen Stelle t ∈ R existiert ein Grenzwert der trigonometrischen Reihe +∞ X
ejkt = 1 +
∞ X
2 cos(kt).
k=1
k=−∞
Wäre nämlich die Reihe etwa bei t0 konvergent, dann wäre lim cos(kt0 ) = 0. Dies k→∞ ergäbe für k → ∞ aber den Widerspruch sin2 (kt0 ) = 1 − cos2 (kt0 ) −→ 1
und
sin2 (kt0 ) =
1 1 (1 − cos(2kt0 )) −→ . 2 2
20 15 10 5 0 D3 (t) D9 (t)
−5 −2π
−π
0
π
2π
Interpretiert man DN (t) als ein Signal, zum Beispiel in Form von Spannungsänderungen am Ausgang eines elektrotechnischen Übertragungssystems, dann hat man den Eindruck, dass für wachsendes N eine Impulsfolge beschrieben wird, mit Impulsen zu den Zeiten 2πn, n ∈ Z, wobei das Signal zwischen den Impulsen zwar nie verschwindet, jedoch immer stärker oszilliert. Signalverarbeitung in kausalen linearen Systemen führt mathematisch auf Integraltransformationen des Signals (Faltungen mit der Impulsantwort; man vgl. später S. 52 und S. 183). Die zunehmenden Oszillationen zwischen den Stellen 2πn werden für wachsendes N bei Integralen in den Bereichen [2πn + ε,2π(n + 1) − ε], 0 < ε < π, zu Auslöschung führen, weil dann ein immer größerer Anteil der Gesamtfläche zwischen dem Graphen von DN und der t-Achse jeweils einmal oberhalb und einmal unterhalb der t-Achse liegt, sich also im Integral zu Null addiert. Dieser Eindruck wird später (in den Rechnungen und Beweisen auf S. 18, S. 39, S. 108 und in Abschnitt 8.1) noch genauer beschrieben und bestätigt.
2.4 Zusammenfassung über trigonometrische Polynome
13
2.4 Zusammenfassung über trigonometrische Polynome Für trigonometrische Polynome f vom Grad N > 0 mit kleinster Periode T gelten die folgenden Beziehungen: 2π Grundkreisfrequenz ω0 = T ˆT N X 1 f (s)DN (t − s) ds Komplexe Darstellung f (t) = ck ejkω0 t = T k=−N
0
mit DN (t − s) = Sinus-Cosinus-Form Umrechnungsformeln
Orthonormalitätsrelationen
1 ck = T
bk =
und die Polardarstellung
ˆT
f (t) e−jkω0 t dt
0
1 a0 = 2 T
Für reellwertige f gilt
k=−N
ejkω0 (t−s) , j 2 = −1
N a0 X f (t) = + (ak cos(kω0 t) + bk sin(kω0 t)) 2 k=1 ak − jbk ak + jbk ck = , c−k = 2 2 mit b0 = 0, k = 0, . . . ,N ; a0 = c0 , ak = ck + c−k , bk = j(ck − c−k ) 2 ˆT 1 0 für k 6= n ejnω0 t ejkω0 t dt = 1 für k = n T 0
Berechnung der Fourierkoeffizienten
N X
2 T
ˆT
0 ˆT
2 f (t) dt , ak = T
ˆT
f (t) cos(kω0 t) dt
0
f (t) sin(kω0 t) dt
0
ck = c−k , ak = 2ℜ(ck ), bk = −2ℑ(ck ) N X f (t) = c0 + 2 |ck | cos(kω0 t + arg(ck )) k=1
Anzahl der Nullstellen pro Periode Darstellung des trigonometrischen Polynoms P (t) = 0.3j sin(ω0 t) + j sin(2ω0 t) − cos(3ω0 t), ω0 = π/2, Periode T = 4 als zirkuläre Schwingung
maximal 2N Nullstellen in [0,T [
Sechs bedeutende Protagonisten in 250 Jahren Ideengeschichte zur Fourier-Analysis
Daniel Bernoulli, Jean Baptiste Fourier, Peter G. Lejeune Dirichlet (vgl. S. 1), Bernhard Riemann (vgl. S. 2), David Hilbert (vgl. S. 379), Laurent Schwartz (vgl. S. 129). Bildquellen: B. Riemann, TU Graz, D. Hilbert, Oberwolfach-Archiv, L. Schwartz, wwwhistory.mcs.st-andrews.ac.uk, alle anderen sind von Wikimedia Commons.
15
3
Fourierreihen
3.1 Die erste Fourierreihe Durch Grenzwertbildung N → ∞ entstehen aus T -periodischen trigonometrischen Polynomen trigonometrische Reihen. fN (t) =
N X
k=−N
ck ejkω0 t −→
N →∞
+∞ X
ck ejkω0 t
(ω0 = 2π/T )
k=−∞
Wie wir aber am Beispiel der Dirichlet-Kerne
N X
ejkt gesehen haben, kann es durchaus
k=−N
vorkommen, dass an keiner einzigen Stelle t ∈ R ein Grenzwert existiert. Existiert aber die Grenzfunktion f einer trigonometrischen Reihe mit T -periodischen Partialsummen, dann ist diese Funktion ebenfalls T -periodisch. Um zunächst etwas Gefühl für das Verhalten trigonometrischer Reihen zu vermitteln, soll „die erste Fourierreihe“ besprochen werden: Wir untersuchen die Konvergenz der Reihe ∞ X sin(kt)
k
k=1
=
+∞ X
k=−∞ k6=0
1 jkt e 2kj
und erarbeiten eine Darstellung ihrer Grenzfunktion durch ein genaueres Studium der Dirichlet-Kerne. Wir beginnen mit einigen Vorbemerkungen über Funktionen mit Werten in R oder in C. Näherungsfehler, punktweise und gleichmäßige Konvergenz Eine entscheidende Rolle bei der Approximation einer Funktion f durch eine Folge von Funktionen fN , N ∈ N, spielt die Güte der Näherung, mit anderen Worten, der Fehler fN − f für wachsendes N . Man kann zum Beispiel den Fehler fN (t) − f (t) an einzelnen Stellen t in einem Intervall I des Definitionsbereiches der Funktionen f und fN betrachten oder auch den Maximalfehler sup |fN (t) − f (t)| in I. Es kann vorkommen, dass zwar t∈I
lim (fN (t) − f (t)) = 0 für jedes einzelne t ∈ I gilt, dass aber trotzdem der Maximalfeh-
N →∞
ler auf I mit wachsendem N nicht kleiner wird. Ein Beispiel liefern die Funktionenfolge (fN )N ∈N und f , definiert durch n 0 für 0 ≤ t < 1 fN (t) = tN auf [0,1] und f (t) = 1 für t = 1. Für jedes t ∈ [0,1] ist lim fN (t) = f (t), der Maximalfehler auf dem Intervall [0,1] ist N →∞
jedoch sup |fN (t) − f (t)| = sup tN = 1 für alle N ∈ N. Betrachtet man andererseits 0≤t≤1
0≤t 0. Für das Konvergenzverhalten σN −→ σ gilt: N →∞
1. σN (t) → σ(t) punktweise überall für N → ∞, d.h. für jedes t ∈ R. 2. Überall gilt die Mittelwerteigenschaft 1 1 σ(t) = (σ(t+) + σ(t−)) = 2 2
3. σ(t) ist stückweise stetig differenzierbar.
lim σ(t + h) + lim σ(t − h) .
h→0+
h→0+
18
3 Fourierreihen 1 0.5 σ1 (t) σ6 (t) 0 −8
−2
0
2
8
Wir erwarten daher ein ähnliches Verhalten der Kerne DN (t) – nämlich die punktweise ∞ X sin(kt) Konvergenz ihrer Integrale. Diese Integrale sind mit der erwähnten Reihe k k=1 eng verwandt, weil deren Partialsummen, gliedweise differenziert, bis auf einen Faktor und eine additive Konstante ja gerade die Dirichlet-Kerne liefern.
Studium der Reihe
∞ X sin(kt)
k=1
k
Unerfahrene Leser stehen vielleicht auf den ersten Blick den folgenden Rechnungen zunächst etwas reserviert gegenüber. Deshalb sei vorweg gesagt, dass für die Überlegungen dieses Abschnitts lediglich Kenntnisse der Differential- und Integralrechnung des ersten Semesters benutzt werden. Die Rechnungen dienen auch dem Erlernen einer einfachen, grundlegenden Abschätzungstechnik, die im Folgenden immer wieder benutzt wird, und der Einübung eines unerschrockenen Umgangs mit den trigonometrischen Funktionen. Wir bilden Stammfunktionen der Dirichlet-Kerne zwischen zwei „Impuls-Spitzen“ von DN (vgl. das Bild auf S. 12), d.h. wir integrieren für t ∈ ]0,2π[ von π bis t . ˆt π
ˆt sin (N + 12 )τ dτ = (1 + 2 cos(τ ) + . . . + 2 cos(N τ )) dτ DN (τ ) dτ = sin( τ2 ) π π sin(N t) sin(2t) sin(3t) + + ...+ = (t − π) + 2 sin(t) + = IN (t). 2 3 N ˆt
Andererseits ergibt partielle Integration ˆt π
t ˆt u(τ )v (τ ) dτ = u(τ )v(τ ) − v(τ )u′ (τ ) dτ , π π cos (N + 21 )τ 1 1 ′ , v (τ ) = sin (N + )τ , v(τ ) = − mit u(τ ) = sin( τ2 ) 2 N + 12 ′
folgendes Resultat: cos (N + 12 )t 1 IN (t) = − 1 t + (N + 2 ) sin( 2 ) N +
1 2
ˆt π
′ 1 1 dτ , also cos (N + )τ 2 sin( τ2 )
3.1 Die erste Fourierreihe
19
cos (N + 21 )t 1 IN (t) = − 1 t + (N + 2 ) sin( 2 ) N +
1 2
′ 1 1 dτ . sgn(t − π) cos (N + )τ 2 sin( τ2 )
max(π,t) ˆ min(π,t)
sgn(t − π) bezeichnet dabei das Vorzeichen von (t − π). Nun ist 1/sin(τ /2) ≥ 1 für 0 < τ < 2π und sgn(t − π)(1/ sin(τ /2))′ ≥ 0 für τ ∈ [min(π,t), max(π,t)]. Man erkennt dies leicht an den Monotonieeigenschaften der Funktion 1/ sin(τ /2) im Intervall [min(π,t), max(π,t)]. Diese Funktion ist nämlich streng monoton fallend für t < π, streng monoton wachsend für t > π. Die cos-Funktionen auf der rechten Seite können durch die Konstante K = 1 majorisiert werden (| cos(x)| ≤ 1 überall). Als Standardtechnik liefern dann Anwendung der Dreiecksungleichung und Vergrößern der Terme auf der rechten Seite die folgende Abschätzung: 1 1 |IN (t)| ≤ + (N + 21 ) sin( 2t ) N +
1 2
max(π,t) ˆ
sgn(t − π)
min(π,t)
|
{z
1 sin( τ2 )
′
dτ ≤
2 . (N + 21 ) sin( 2t )
}
sin(t/2)−1 −1
Damit zeigt sich, dass IN (t) für wachsendes N → ∞ verschwindet. Für jedes feste t in ]0,2π[ erhält man also das Ergebnis (t − π) + 2
N X sin(kt)
k=1 ∞ X k=1
Satz. 1. Die Reihe
∞ X
−→ 0,
k
N →∞
sin(kt) k
=
d.h.
(π − t)/2 0
für 0 < t < 2π für t = 0.
sin(kt) stellt die 2π-periodische Sägezahnfunktion S(t) dar. k k=1 (π − t)/2 für 0 < t < 2π S(t) = 0 für t = 0 π/2
S(t) = S(t + 2πn), n ∈ Z
π
t 2π
−π/2 2. Die Mittelwerteigenschaft ist erfüllt für alle t ∈ R S(t) =
1 (S(t+) + S(t−)). 2
20
3 Fourierreihen
3. S(t) ist stückweise stetig differenzierbar. 4. Die trigonometrische Reihe zur Sägezahnfunktion konvergiert gleichmäßig auf jedem abgeschlossenen Intervall, welches keine Sprungstelle von S(t) enthält. Trotz dieses Sachverhaltes und obwohl alle Partialsummen beliebig oft differenzierbar sind, ist die Grenzfunktion nicht mehr stetig! Für h ≤ t ≤ 2π − h, h > 0, gilt nämlich sin(t/2) ≥ sin(h/2) > 0, also N X 1 1 sin(kt) 1 ≤ = |IN (t)| ≤ S(t) − 1 t 1 k 2 (N + 2 ) sin( 2 ) (N + 2 ) sin( h2 ) k=1
für alle t ∈ [h,2π − h]. Die Güte der Annäherung von IN (t) an Null hängt nur von N ab, nicht von t ∈ [h,2π − h], mit anderen Worten, lim IN (t) = 0 mit gleichmäßiger N →∞
Konvergenz in jedem abgeschlossenen Intervall [h,2π − h], h > 0. Andererseits zeigt sich trotz der gleichmäßigen Konvergenz der Partialsummen SN (t) von S(t) in jedem Intervall [h,2π − h], h > 0, dass die SN (t) in der unmittelbaren Umgebung der Sprungstellen wellenförmig über S(t) hinausschwingen. Die Wellenbuckel rücken für N → ∞ den Sprungstellen zwar immer näher und werden schmäler, jedoch konvergiert ihre Abweichung von der Funktion S(t) nicht gegen Null. Es stellt sich heraus, dass die Näherungskurven SN (t) immer um ca. 9% der Sprunghöhe S(0+) − S(0−) über S(t) hinausschlagen. Dieses Verhalten der Näherungen SN (t) wird nach J. W. Gibbs (1839-1903) das Gibbs-Phänomen genannt. In der folgenden Veranschaulichung bezeichnet Si(π) den Wert des Integralsinus Si(t) =
ˆt
sin(τ ) dτ τ
0
an der Stelle t = π.
S(t) S(t) + Si(π) − π/2 S3 (t) S7 (t)
Si(π) S(0+) = π/2
0
0
t7
π
3.1 Die erste Fourierreihe
21
Das Gibbs-Phänomen beim Sägezahn Zum Nachweis des Gibbs-Phänomens betrachten wir die erste positive Extremalstelle tN der Abweichungen SN (t) − S(t) zwischen der Sägezahnreihe S und ihren Partialsummen SN für 0 < t < π. Wegen 1 SN (t) − S(t) = IN (t) = 2
ˆt π
sin (N + 12 )τ dτ 2 sin τ2
folgt mit stückweiser Integration und Vergleich mit S. 18 SN (t) − S(t) =
ˆt 0
ˆπ sin (N + 12 )τ sin (N + 21 )τ dτ − dτ . 2 sin τ2 2 sin τ2 0 | {z } S(0+)=π/2
π 1 Das rechte Integral lässt sich nämlich schreiben als − lim IN (ε) = . Durch Diffe + ε→0 2 2 sin (N + 12 )t ′ rentiation SN (t) − S ′ (t) = und Aufsuchen der ersten Nullstelle dieser t 2 sin 2 π ist. Zur Abschätzung der Abweichung in tN Ableitung zeigt sich, dass tN = N + 12 ˆtN sin (N + 12 )τ π SN (tN ) − S(tN ) = dτ − 2 2 sin τ2 0
benutzt man die Umformung sin (N + 21 )τ τ − 2 sin τ2 sin (N + 12 )τ 1 sin (N + )τ . + = τ 2 2 sin τ2 2τ sin τ2 1 π Zusammen mit der Substitution t = (N + )τ und tN = folgt hieraus 2 N + 21
SN (tN ) − S(tN ) =
ˆtN 0
ˆπ
ˆtN τ − 2 sin τ2 sin (N + 12 )τ 1 π sin (N + )τ dτ dτ − + τ 2 2 2τ sin τ2 0 {z } | rN (tN )
π sin(t) dt − + rN (tN ). = t 2 0 τ 1 Weil 2 sin < τ und sin (N + )τ ≥ 0 für 0 < τ < tN sind, ist rN (tN ) ≥ 0 . 2 2 Verwendet man nun den bekannten Wert des Integralsinus (Übungsaufgabe) Si(π) =
ˆπ 0
sin(t) dt = 1.8519... , t
22
3 Fourierreihen
dann ergibt sich SN (tN ) − S(tN ) ≥ 0.28 + rN (tN ) ≥ 0, d.h. bei tN schwingt SN (t) über S(t) hinaus. Weil der Integrand von rN (tN ) für τ → 0+ den Grenzwert 0 hat und lim tN = 0 ist, N →∞
folgt lim rN (tN ) = 0. Der aktive Leser kann dies mit Bleistift und Papier zum Beispiel N →∞
durch Potenzreihenentwicklung des Integranden von rN (tN ) oder durch Anwendung der Regeln von L’Hospital schnell sehen (Übungsaufgabe). Ergebnis. Für wachsende N erhält man schließlich ein Überschwingen der Partialsummen SN (t) über die Funktion S(t) hinaus um ca. 9% der Sprunghöhe S(0+) − S(0−) = π, auch wenn die Stelle tN an die Sprungstelle t = 0 heranrückt: lim (SN (tN ) − S(tN )) ≈ 0.28 ≈ 0.09π.
N →∞
Dieses Resultat über die schlechte Konvergenz der Reihe in der Nähe der Sprungstellen geht zurück auf Arbeiten von H. Wilbraham (1848) und J. W. Gibbs (1898). Alle hier am speziellen Beispiel der Sägezahnreihe überlegten Eigenschaften sind charakteristisch für viele in der Praxis relevante trigonometrische Reihen. Fragen nach der Darstellbarkeit anderer T -periodischer Funktionen als Überlagerung harmonischer Schwingungen beantworten wir nun im nächsten Abschnitt.
3.2 Grundlegende Sätze über Fourierreihen +∞ X Die Fourierreihe einer Funktion f : [0,T ] → C ist die Reihe Sf (t) = ck ejkω0 t mit ˆT k=−∞ 1 2π −jkω0 t f (t) e dt. , deren Koeffizienten ck definiert sind durch ck = ω0 = T T 0
Als Partialsumme Sn von Sf bezeichnen wir die Summe Sn (t) =
+n X
ck ejkω0 t und
k=−n
sagen, dass die Reihe Sf für t ∈ R konvergiert, wenn lim Sn (t) existiert. n→∞ Wir beschränken uns in den folgenden Abschnitten meist auf Aussagen über stückweise stetige oder stückweise stetig differenzierbare T -periodische Funktionen f . Das heißt, dass Real- und Imaginärteil von f bis auf höchstens endliche viele Stellen in ]0,T [ stetig bzw. stetig differenzierbar sind, und dass alle in [0,T ] möglichen einseitigen Grenzwerte von f und gegebenenfalls f ′ in C existieren. Diese werden für ein t mit f (t+) resp. f (t−) notiert. Die Funktionen f und f ′ sind dann beschränkt und die Werte an den Unstetigkeitsstellen sind für bestimmte Integrale, also auch für die Fourierkoeffizienten belanglos. Wir setzen f (0) = f (T ) und denken uns f zu einer T -periodischen Funktion auf ganz R fortgesetzt, die wir ebenso mit f bezeichnen. Solche Funktionen bilden eine für viele Anwendungen hinreichend große Klasse, und die folgenden Sätze zur Darstellbarkeit durch Fourierreihen lassen sich mit den mathematischen Hilfsmitteln der üblichen Grundvorlesungen zeigen.
3.2 Grundlegende Sätze über Fourierreihen
23
Die Aussagen der Sätze gehen zurück auf die Arbeiten von P. L. Dirichlet (1829), L. Fejér (1904), H. Wilbraham (1848) und J. W. Gibbs (1898). Der erste Satz ist eine Variante der von Dirichlet bewiesenen allgemeineren Aussage, dass periodische Funktionen von beschränkter Variation durch ihre Fourierreihen dargestellt werden. Diese Variante wird im Folgenden als Satz von Dirichlet bezeichnet. Satz von Dirichlet. Ist f auf [0,T ] stückweise stetig differenzierbar, dann konvergiert die 1 Fourierreihe Sf an jeder Stelle t gegen [f (t+) + f (t−)], an Stetigkeitsstellen t also ge2 gen f (t). Die Fourierreihe Sf konvergiert gleichmäßig gegen f in jedem abgeschlossenen Intervall, das keine Sprungstellen von f enthält. Satz von Wilbraham-Gibbs. An Unstetigkeitsstellen stückweise stetig differenzierbarer periodischer Funktionen tritt das Gibbs-Phänomen auf; alle Partialsummen SN der Fourierreihen von Real- oder Imaginärteil von f überschwingen einen jeweiligen Sprung für große N ∈ N um rund 9%.
Satz von Fejér. 1. Ist f eine stetige periodische Funktion, dann konvergieren die arithmetischen Mittel 1 SN = (S0 + S1 + . . . + SN ) N +1 der Partialsummen Sn , n ∈ N0 , von Sf für N → ∞ gleichmäßig gegen f . 2. Wenn die Fourierreihe Sf einer stückweise stetigen periodischen Funktion f an einer 1 Stelle t0 überhaupt konvergiert, dann konvergiert sie dort gegen [f (t0 +) + f (t0 −)]. Ist 2 außerdem f stetig bei t0 , dann ist Sf (t0 ) = f (t0 ).
Verschwinden des Gibbs-Phänomens bei Fejérschen Mitteln. Benutzt man die Fejér1 Mittel (S0 + S1 + . . . + SN ) der Partialsummen von Sf zur Approximation einer N +1 stückweise stetig differenzierbaren periodischen Funktion, so tritt das Gibbs-Phänomen nicht auf. Erklärungen zu diesen Sätzen Zur punktweisen Konvergenz im Satz von Dirichlet: Eine Vorstellung über die Konvergenz von Fourierreihen an einer Stelle t gibt uns das bereits bemerkte Verhalten der Dirichlet-Kerne – hier mit Periode 2π/ω0 : ˆT ˆT N N X X 1 1 ejkω0 (t−s) ds = I(N,t). f (s) e−jkω0 s ds ejkω0 t = f (s) T T k=−N k=−N 0 0 {z } | DN (t−s)
Die Kerne DN (t − s) konzentrieren sich mit wachsendem N immer mehr um t (vgl. Bild unten), während sie außerhalb der Stelle t für N → ∞ immer stärker oszillieren. Für ˆT 1 DN (t − s) ds = 1. Die „Oszillationsteile“ von DN (t − s) alle N gilt andererseits T 0
24
3 Fourierreihen
liefern keinen nennenswerten Beitrag zu diesem Integral. Der Wert des Integrals I(N,t) entspricht daher ungefähr dem Mittelwert von f in einer kleinen Umgebung U (N,t) von t. Für N → ∞ zieht sich U (N,t) mit den Kernen DN (t − s) auf den Punkt t zusammen, der 1 Mittelwert von f auf U (N,t) konvergiert dabei gegen [f (t+) + f (t−)]. Die Umsetzung 2 dieser Anschauung in einen exakten, rechnerisch durchgeführten Beweis wird in Abschnitt 6.1 gezeigt.
D14 (s − t) f (s)
0
t 0
s
T
Zum Satz von Fejér: P. Du Bois-Reymond (1831-1889) wies nach, dass es periodische stetige Funktionen gibt, deren Fourierreihe auf einer im Definitionsbereich von f dichten Menge divergiert. Von ganz besonderer Bedeutung ist daher das Resultat von L. Fejér (1880-1959), dass die arithmetischen Mittel aus den Partialsummen der Fourierreihen von stetigen periodischen Funktionen sogar gleichmäßig gegen f konvergieren. n X Schreibt man die arithmetischen Mittel der Partialsummen Sn (t) = ck ejkω0 t in der Form k=−n N X 1 |k| ck ejkω0 t , 1− (S0 (t) + S1 (t) + . . . + SN (t)) = N +1 N +1 k=−N
so sieht man deutlich eine schwächere Gewichtung der höherfrequenten Anteile in der Näherungssumme. Dies führt zu einer Glättung der Näherungen. Zum genaueren Studium des Fejérschen Satzes sei vorerst auf Kapitel 6 verwiesen. Die Wirkung der Mittelbildung zeigt das folgende Bild der Partialsumme S4 (t) der Sägezahnreihe und des arithmetischen Mittels ihrer Partialsummen bis zur Ordnung N = 4.
S(t) S4 (t) (S1 (t) + . . . + S4 (t))/5
π/2
0 0
π
3.2 Grundlegende Sätze über Fourierreihen
25
Zum Gibbs-Phänomen: Die Aussage zum Gibbs-Phänomen an Unstetigkeitsstellen ergibt sich sofort. Es reicht aus, eine T -periodische, stückweise stetig differenzierbare reellwertige Funktion f mit einer einzigen Sprungstelle t0 in [0,T ] und der Mittelwerteigenschaft f (t0 ) = [f (t0 +) + f (t0 −)]/2 zu untersuchen. Mit Hilfe der Sägezahnfunktion S von S. 19 schreibt man f in der Form f (t) = g(t) + r(t) mit 2π 1 (t − t0 ) , g(t) = f (t) − [f (t0 +) − f (t0 −)] S π T 1 2π r(t) = [f (t0 +) − f (t0 −)] S (t − t0 ) . π T
Die Funktion g ist stetig bei t0 mit g(t0 ) = [f (t0 +)+f (t0 −)]/2. Die Funktion r zeigt wegen des Gibbs-Phänomens für die Sägezahnfunktion in der Nähe von t0 das Überschwingen der Partialsummen ihrer Fourierreihe um ca. 9% der Sprunghöhe f (t0 +) − f (t0 −). Die Aussage über das Verschwinden des Gibbs-Phänomens bei Verwendung der Fejérschen Mittel zur Approximation lässt sich dadurch erklären, dass das Überschwingen bei Sprungstellen, d.h. in der Nähe äußerst steiler Flanken, durch höherfrequente Anteile in der Näherungssumme bewirkt wird (vgl. später S. 41). Die Amplituden der harmonischen Anteile höherer Frequenzen werden aber durch die Verwendung der arithmetischen Mittel stark gedämpft. Damit wird die Näherung geglättet und ein Überschwingen verhindert, allerdings um den Preis weniger steiler Flanken. Man vergleiche hierzu die Bilder auf S. 28 und S. 29 und Abschnitt 6.2, S. 113. Die Fejérsche Mittelbildung zur Glättung und Konvergenzverbesserung entspricht der Verwendung der Gewichtsfunktion n g(x) = 1 − |x|/(N + 1) für |x| ≤ N + 1 0 sonst an den diskreten Stellen |k| = 0, . . . ,N . g(x) 1.0
0 −(N + 1)
0
(N + 1)
In den Ingenieur-Anwendungen der Fourier-Analyse spielt die Technik von Glättungen durch Gewichtsfunktionen als Fenstertechnik eine wichtige Rolle. Das Dreiecksfenster gewichtet die Amplituden der zur Näherung verwendeten harmonischen Schwingungen der Kreisfrequenzen kω0 , |k| ≤ N , mit den Gewichten 1−|k|/(N +1). Zum Beispiel will man in der Signalverarbeitung mit wesentlich besseren, kleineren Toleranzschranken als mit einem 9%-Fehler wie beim Gibbs-Phänomen an steilen Flanken arbeiten. Der Fejérsche Satz liefert hier eine erste mathematische Begründung für Verbesserungsmöglichkeiten durch Fenstertechniken ohne übermäßigen zusätzlichen Aufwand.
26
3 Fourierreihen
Wir halten fest, dass die Sätze zeigen, dass man sehr viele Funktionen durch ihre Fourierreihen darstellen kann. Im Gegensatz zu Taylorreihen, die in ihrem Konvergenzbereich immer unendlich oft differenzierbare, also besonders glatte Funktionen darstellen, gestatten es die Fourierreihen, auch sehr „irreguläre“ Funktionen durch Superposition immer höherfrequenter Schwingungen nachzubilden. Deshalb sind Fourierreihen von großem Nutzen in der Mathematik und ihren Anwendungsgebieten. Die gesamte Denkweise in Spektralund Frequenzbegriffen, die weite Anwendungsbereiche beherrscht, ist auf diese Sätze zurückzuführen. Zunächst wenden wir uns Anwendungsbeispielen zu. Dadurch sammeln wir ausreichend Motivation, in Kapitel 6 dann die Sätze von Dirichlet und Fejér sowie einige weitere grundlegende Aussagen über die Darstellung periodischer Funktionen durch ihre Fourierreihen genauer zu studieren.
3.3 Das Spektrum periodischer Funktionen Anschauliche Bedeutung des diskreten Spektrums Die Folge (ck )k∈Z der Fourierkoeffizienten einer periodischen Funktion f wird als das diskrete Spektrum von f bezeichnet. Für T -periodische reelle „Signale“ f : R → R ist dann wegen ck = c−k das Betragsspektrum (|ck |)k∈Z symmetrisch. |c0 | •
|c−2 | •
|c2 |
|c−1 |
|c1 |
•
•
• |c3 | •
−3ω0
−2ω0
−ω0
0
ω0
2ω0
3ω0
Wegen an = cn + c−n , ist An =
bn = j(cn − c−n )
p p a2n + b2n = 4cn c−n = 2|cn |
für n 6= 0 und ω0 = 2π/T die Amplitude der n-ten Oberschwingung von f (t) = c0 +
∞ X
k=1
2|ck | cos(kω0 t + arg(ck )).
Die Folge (2|ck |)k∈N heißt Amplitudenspektrum, die Folge (arg(ck ))k∈N nennt man das Phasenspektrum von f . c0 = a0 /2 ist der Gleichanteil in der Funktion f , zum Beispiel der Gleichspannungsanteil in einer Wechselspannung f . Das Spektrum zeigt, mit welchen Amplituden und Phasen die einzelnen harmonischen Schwingungen der Kreisfrequenzen kω0 , k ∈ N, als „Bausteine“ am Aufbau des Signals f beteiligt sind.
3.3 Das Spektrum periodischer Funktionen
27
v u∞ X ∞ uX 2 t Die Größe |ck | |ck |2 heißt Klirrfaktor. Der Klirrfaktor ist ein Maßstab für k=2
k=1
den Oberschwingungsanteil von f und damit ein Maß für die Verzerrung von f gegenüber der reinen Grundschwingung. Wir werden in Abschnitt 4.6 eine Methode lernen, den Klirrfaktor mit Hilfe der Leistung des Signals f zu berechnen. Weitere Beispiele für Fourierreihen 1. Explizites Ausrechnen einer Fourierreihendarstellung: T A t=− 2 2 T 2A f (t) = − t für − < t ≤ 0 T 2 T 0 0 0. Gesucht sind die Fourierkoeffizienten ck , ak , bk . f (t) A
−T
−T /2
T /2
0
T
t
a0 A An der Zeichnung ist zu sehen, dass c0 = = ist. 2 4 2π Für k ∈ Z \ {0} und ω0 = ist T ˆT ˆT 2A 1 1 −jkω0 t f (t) e − (t − T ) e−jkω0 t dt . dt = ck = T T T 0
T /2
T Mit der Substitution u = t − T und f (t) = 0 auf [0, [ also 2 #u=0 " ˆ0 2A −jkω0 u 2A e−jkω0 u 1 − ue (−jkω0 u − 1) du = − 2 ck = T T T (−jkω0 )2 | {z } u=−T /2 −T /2 g(u) e−jkω0 u e−jkω0 u ′ −jkω0 u . g (u) = (−jkω0 ) [−jkω0 u − 1] + (−jkω0 ) = u e (−jkω0 )2 (−jkω0 )2
28
3 Fourierreihen
Einsetzen der Integrationsgrenzen ergibt: T 1 2A T e0 (0 − 1) − ejkω0 2 jkω0 − 1 ck = − 2 · − 2 2 T k ω0 2 i h A jkπ e|{z} (jkπ − 1) · −1− = 2π 2 k 2 cos(kπ) + j sin(kπ) | {z } | {z } 0 (−1)k =−
A 1 + (−1)k (jkπ − 1) . 2π 2 k 2
Wegen ck = c−k erhalten wir für k ∈ N:
( 0 A k ak = ck + c−k = 2 ℜ(ck ) = − 2 2 1 − (−1) = 2A − 2 2 π k k π A bk = j(ck − c−k ) = −2 ℑ(ck ) = (−1)k . kπ
für gerade k für ungerade k
Mit den Spektralwerten ck bzw. ak und bk sind die harmonischen „Bauteile“ von f bekannt, und f lässt sich näherungsweise als trigonometrisches Polynom mit den Partialsummen seiner Fourierreihe rekonstruieren. Die Funktion f besitzt die Fourierreihenentwicklung ∞ A A A X k k (−1) − 1 cos(kω0 t) + + (−1) sin(kω0 t) f (t) = 4 k2 π2 kπ k=1
=
A 2A cos(ω0 t) − sin(ω0 t) 2 {z π } |π Grundschwingung Gleichanteil A 2A sin(3ω0 t) + . . . − 2 cos(3ω0 t) − |9π {z 3π } A 4 |{z}
−
+
A sin(2ω0 t) } |2π {z 1. Oberschwingung
2. Oberschwingung
Alle Partialsummen sind unendlich oft differenzierbar, die Grenzfunktion ist jedoch nicht mehr stetig! Die Veranschaulichung mit Verwendung von 7 Spektralwerten ck zeigt deutlich das Gibbs-Phänomen:
f (t) S7 (t)
A
−T /2
0
T /2
T
3.3 Das Spektrum periodischer Funktionen
29
Zum Vergleich betrachten wir eine geglättete Näherung mit dem zugehörigen Fejérschen Mittel S 7 aus den Partialsummen. Das Gibbs-Phänomen tritt nicht mehr auf. Der Preis für diese Verbesserung ist andererseits eine weniger steile Flanke in der Umgebung der Sprungstelle und damit ein größerer Fehler an den „Ecken“ des Graphen.
f (t) S 7 (t)
A
0
−T /2
T /2
T
2. Fourierreihendarstellung durch Verwendung einer schon bekannten Reihe: Die Reihe ∞ X cos(kt)
cos(2t) cos(3t) + + ... 4 9 k=1 N X 1 N ist gleichmäßig konvergent (vgl. S. 15), denn wegen = gilt die Abk(k + 1) N +1 k=1 schätzung f (t) =
∞ X | cos(kt)|
k=1
k2
k2
≤
= cos(t) +
∞ N X X 2N 1 2 < lim = lim = 2. k 2 N →∞ k(k + 1) N →∞ N + 1 k=1
k=1
Gliedweise Differentiation liefert die Sägezahnfunktion f ′ (t) = −
∞ X sin(kt) k=1
k
= −S(t).
Dabei konvergiert die Sägezahnfunktion S gleichmäßig in [h,2π − h], h > 0. Daher ist f (t) eine Stammfunktion von −S(t) in ]0,2π[: f (t) =
(t − π)2 +c 4
(t ∈ ]0,2π[) .
Zur Bestimmung der Konstante c bemerken wir, dass für f der Gleichanteil c0 = 0 ist, d.h. ˆ2π 0
f (t) dt =
ˆ2π 0
(t − π)2 π3 + c dt = + 2πc = 0, also 4 6
Als Anwendung erhält man etwa für t = 0 den Grenzwert der Reihe
c=−
π2 . 12
∞ X π2 1 = . 2 k 6
k=1
30
3 Fourierreihen
3.4 Übungsaufgaben
f (x)
A1)
A
−2π
−π
0
π
x 2π
3π
4π
(a) Berechnen Sie die Fourierkoeffizienten ak und bk der dargestellten periodischen Funktion. (b) Geben Sie die Fourierreihe in trigonometrischer Form und in Polarform bis zur 5. Oberschwingung an. (c) Gegen welchen Wert konvergiert die Fourierreihe an der Stelle x = 0 ? A2) Eine T -periodische Funktion u(t) sei gegeben durch uˆ sin(ω0 t) für 0 ≤ t < T 2 u(t) = T 0 ≤t 0 hat die Funktion F (t) = f (αt) die Periode . Sie besitzt α dieselben Fourierkoeffizienten wie f (t): +∞ X
F (t) = f (αt) =
ck ejkαω0 t .
k=−∞
Eine Frequenzänderung ändert nicht die Amplituden der Teilschwingungen, wohl aber die Zuordnung der Fourierkoeffizienten ck zu den Kreisfrequenzen kαω0 . Mit τ = αt, 0 ≤ τ ≤ α T
T ist nämlich α
T ˆ/α
f (αt) e−jkαω0 t dt =
1 T
0
ˆT
f (τ ) e−jkω0 τ dτ = ck .
0
Dieser Ähnlichkeitssatz bietet die Möglichkeit, bei bekannten Fourierreihen von Signalen f (t) die Fourierreihen ähnlicher Funktionen f (αt) ohne erneute Rechnungen sofort anzugeben. Beispiele 1. f (t) = | sin(t)|
(zweiweg-gleichgerichteter Sinus)
| sin(t)|
1.0
0 −2π
−π
0
π
2π
4.1 Symmetrie-Eigenschaften, Linearität, Ähnlichkeit Für T = 2π gilt:
1 a0 = 2 π
ˆπ
33
π 1 2 sin(t) dt = − cos(t) = . π π 0
Alle bk = 0, weil f gerade ist; ˆπ 0 2 sin(t) cos(kt) dt = 0, denn Substitution t = x + π/2 Für ungerade k ist ak = π 0
ergibt mit dem Additionstheorem cos(k(x+π/2)) = − sin(kx) sin(kπ/2) ein Integral einer ungeraden Funktion über das Intervall [−π/2,π/2], also ˆπ/2
2 ak = − π
cos(x) sin(kx) sin
−π/2
kπ 2
dx = 0.
Für gerade k = 2n, n ∈ N benutzen wir das Additionstheorem sin(α) + sin(β) α−β α+β cos = . sin 2 2 2 Mit t =
a2n
α−β α+β , 2nt = folgt α = (1 + 2n)t, β = (1 − 2n)t, und somit 2 2 π ˆπ ˆ 1 = sin((1 + 2n)t) dt + sin((1 − 2n)t) dt π 0 0 1 1 1 =− cos((1 + 2n)π) −1 + cos((1 − 2n)π) −1 {z } {z } π 1 + 2n | 1 − 2n | =
Damit ist
2 π
−1
1 1 + 1 + 2n 1 − 2n
4 2 f (t) = − π π
=−
4 . (2n + 1)(2n − 1)π
cos(2t) cos(4t) cos(6t) + + + ... 3 3·5 5·7
=−
−1
+∞ 2 X ej2kt . π 4k 2 − 1 k=−∞
2. Die Funktion f (t) = | sin(2t)| besitzt nach dem Ähnlichkeitssatz von S. 32 und dem vorangehenden Beispiel 1 die Fourierreihenentwicklung +∞ 2 X ej4kt 2 4 cos(4t) cos(8t) cos(12t) f (t) = − = − + + + . . . . π 4k 2 − 1 π π 3 3·5 5·7 k=−∞
T ist f (αt) eine 2π-periodische Bemerkung: Für ein T -periodisches f und α = 2π Funktion und es gilt f (αt) =
+∞ X
k=−∞
ck e
jkt
1 mit ck = 2π
ˆ2π
f (αt) e−jkt dt .
0
Daher werden in der Literatur oft nur 2π-periodische Funktionen behandelt.
34
4 Rechnen mit Fourierreihen
3. Ist f :]0,T [→ R gegeben, dann lässt sich f 2T -periodisch gerade oder auch ungerade fortsetzen.
f (t)
0
2T -periodische gerade Fortsetzung
T
−T
t
0
T
3T
t
2T -periodische ungerade Fortsetzung −T
T
t
3T
Eine 2T -periodische Fortsetzung besitzt dann – je nach gewählter Weise – eine reine Cosinus- oder eine reine Sinusreihendarstellung. Cosinusreihe für f
(2T -periodisch gerade fortgesetzt) ∞
a0 X + ak cos f (t) = 2 k=1
Sinusreihe für f f (t) =
kπ t T
2 , ak = T
ˆT
f (t) cos
0
kπ t dt . T
(2T -periodisch ungerade fortgesetzt) ∞ X
k=1
bk sin
kπ t T
2 , bk = T
ˆT 0
f (t) sin
kπ t dt . T
Beide Reihen stellen auf dem Intervall ]0,T [ dieselbe Funktion dar. Die Sinus-Form haben wir bei der Behandlung des Problems der schwingenden Saite bereits benutzt. Die Anfangsbedingungen f (x) und g(x) für die Saitenschwingung – auf ganz R 2lperiodisch fortgesetzt – waren dort ungerade Funktionen auf R.
4.2 Translationen im Zeit- und im Frequenzbereich
35
4.2 Translationen im Zeit- und im Frequenzbereich Translation im Zeitbereich. Durch Substitution τ = t+t0 in der Formel zur Berechnung von ck ergibt sich sofort +∞ X
f (t + t0 ) =
(ejkω0 t0 ck ) ejkω0 t .
k=−∞
Beispiel.
Die Funktion t für −π < t < π f (t) = 0 für t ∈ {−π,π}
ist (2π-periodisch fortgesetzt) ein Sägezahn, der mit 1 (π − t) für 0 < t < 2π S(t) = 2 0 für t ∈ {0,2π} dargestellt werden kann.
f (t) = −2S(t + π) π
t
π
−π −π
Die Amplituden in der Fourierentwicklung müssen doppelt so groß wie bei S(t) sein und mit ejkπ = (−1)k erhält man aus der Fourierreihe von S(t) mit obiger Regel (vgl. S. 15) f (t) = −2
+∞ ∞ X X ejk(t+π) sin(kt) = −2 (−1)k . 2kj k k=−∞ k=1
k6=0
Translation im Frequenzbereich, Amplitudenmodulation. Wegen 1 T
ˆT 0
ejnω0 t f (t) e−jkω0 t dt = ck−n
gilt
ejnω0 t f (t) =
+∞ X
ck−n ejkω0 t .
k=−∞
Die Multiplikation der 2π/ω0 -periodischen Funktion f (t) mit der Funktion ejnω0 t bewirkt eine Verschiebung des Spektrums von f (t) um nω0 .
36
4 Rechnen mit Fourierreihen ejnω0 t f (t) Spektrum von f (t)
ejnω0 t f (t)
⊗
Spektrum von ejnω0 t f (t)
−2ω0 0 2ω0
nω0
0
Zum besseren Verständnis der Anwendungsmöglichkeiten betrachten wir die Amplitudenmodulation cos(nω0 t)f (t) und beachten, dass cos(nω0 t) = (ejnω0 t + e−jnω0 t )/2 ist. Das Spektrum (dk )k∈Z von cos(nω0 t)f (t) ist dann gegeben durch 1 1 ck−n + ck+n , 2 2 d.h. das Spektrum von f wird nach links und rechts um die Frequenz nω0 verschoben, die Werte halbiert; es entstehen zwei sogenannte Seitenbänder mit halbierten Amplituden. Dieses Verhalten ermöglicht in der Nachrichtentechnik, ein Signalspektrum in einen gewünschten Frequenzbereich zu verschieben, etwa ein Sprachsignal in einem gewünschten Frequenzband außerhalb des Hörbereichs zu übertragen und beim Empfang durch erneute Amplitudenmodulation wieder im Frequenzband von Sprachsignalen hörbar zu machen. dk =
cos(nω0 t) f (t) Spektrum von f (t)
cos(nω0 t)f (t)
⊗
Spektrum von cos(nω0 t)f (t)
−nω0
−2ω0 0 2ω0 Beispiel.
Die 2π-periodische Funktion f (t) =
0
∞ X cos(kt) k=1
k2
nω0
(vgl. auch S. 29) besitzt die
Fourierkoeffizienten c0 = 0, ck = c−k = ak /2 = 1/(2k 2 ) für k ≥ 1. Damit folgt cos(2t)f (t) = f (t)
+∞ X ej2t + e−j2t ck+2 + ck−2 jkt e = 2 2 k=−∞
= =
a2 + 2
∞ X ak+2 + a|k−2| k=1
2
cos(kt)
1 13 5 1 5 + cos(t) + cos(2t) + cos(3t) + cos(4t) + . . . 8 9 32 25 36
4.3 Die Ableitung von Fourierreihen
37
4.3 Die Ableitung von Fourierreihen Satz. Ist f stetig auf R und stückweise stetig differenzierbar, dann sind die Fourierkoeffizienten c′k der Ableitung f ′ gegeben durch c′k = jkω0 ck . Die Fourierreihe von f ′ erhält man durch gliedweise Differentiation der Fourierreihe von f . Stückweise partielle Integration zwischen den Stellen 0 = t0 < t1 < . . . < tm = T , in denen f ′ eventuell nicht existiert, liefert nämlich für k 6= 0: tℓ ˆtℓ m 1 X −jkω0 t ′ −jkω0 t e e ck = − f (t) − f (t) dt . jkω0 T tℓ−1 ℓ=1
tℓ−1
Aufgrund der Stetigkeit und T -Periodizität von f folgt hieraus 1 T
ˆT
f ′ (t) e−jkω0 t dt = jkω0 ck .
0
1 Für k = 0 ist T
ˆT 0
Beispiel.
f ′ (t) dt =
m X ℓ=1
Die Funktion f (t) =
(f (tℓ ) − f (tℓ−1 )) = f (T ) − f (0) = 0.
∞ X cos(kt)
ist stetig und stückweise stetig differenzierk2 bar. Gliedweise Differentiation ergibt die Sägezahnreihe −S(t) (vgl. S. 29). k=1
Bemerkung. Wenn die Ableitung f ′ nicht wieder stückweise stetig differenzierbar ist, ist nicht gesichert, ob die Fourierreihe von f ′ überhaupt konvergiert. Wenn sie jedoch an einer Stelle t konvergiert, dann hat sie dort nach dem Satz von Fejér den Grenzwert (f ′ (t+) + f ′ (t−))/2. Gliedweise Differentiation von Fourierreihen unstetiger Funktionen führt im Allgemeinen auf divergente Reihen. Zum Beispiel ergibt sich durch gliedweise ∞ X sin(kt) eine Reihe, die an keiner Stelle mehr Ableitung der Sägezahnreihe f (t) = k k=1 konvergiert (vgl. S. 12). G. Cantor und H. Lebesgue haben gezeigt, dass die gliedweise Differentiation von Fourierreihen stückweise stetig differenzierbarer Funktionen mit Sprungstellen auf Reihen führt, die höchstens auf einer Nullmenge konvergieren (vgl. auch Übungsaufgabe A7). Daher bedarf gliedweise Differentiation von Fourierreihen, die man etwa in Differentialgleichungen einsetzt (vgl. Abschnitt 1.2), in der Regel genauer mathematischer Überlegungen. In welchem Sinn man dennoch mit solchen divergenten Reihen erfolgreich umgehen kann, werden wir in den späteren Kapiteln über Distributionen sehen.
38
4 Rechnen mit Fourierreihen
4.4 Integration von Fourierreihen Betrachtet man zu einer stückweise stetigen T -periodischen Funktion f (t) mit der Fourierˆt +∞ X jkω0 t reihe ck e die Integralfunktion F (t) = (f (x) − c0 ) dx, dann ist F (t) stetig k=−∞
0
und T -periodisch mit stückweise stetiger Ableitung f (t) − c0 . Die Integralfunktion F ist deshalb darstellbar durch ihre Fourierreihe F (t) =
+∞ X
Fk ejkω0 t .
k=−∞
Partielle Integration unter Beachtung von F (0) = F (T ) = 0 ergibt für k 6= 0 Fk =
1 T
ˆT
1 T
ˆTˆt
F (t)
0
F0 =
0 0
Somit ist
ˆt 0
ˆT 1 d e−jkω0 t ck dt = (f (t) − c0 ) e−jkω0 t dt = . dt −jkω0 jkω0 T jkω0 0
(f (x) − c0 ) dx dt ist der Mittelwert von F .
(f (x) − c0 ) dx = F0 + ˆt
+∞ X
k = −∞ k 6= 0
ck jkω0 t e , also jkω0
f (x) dx = c0 t + F0 +
+∞ X
k = −∞ k 6= 0
0
ck jkω0 t e . jkω0
Satz. Das Integral der T -periodischen Funktion f wird gebildet aus einer T -periodischen Funktion, die um die „Rampe“ c0 t + F0 schwingt. Bestimmte Integrale von f erhält man durch gliedweise Integration der Fourierreihe von f : ˆβ
f (t) dt =
α
c0 (β − α) +
+∞ X
k = −∞ k 6= 0
ˆβ 0
f (t) dt −
ˆα
f (t) dt =
0
+∞ ˆβ X ck jkω0 β jkω0 α e = ck ejkω0 t dt . −e jkω0 k=−∞ α
Anmerkung. Mit größerem Aufwand als oben kann man zeigen, dass die Integralfunktion F (t) auch dann durch ihre (gleichmäßig konvergente) Fourierreihe darstellbar ist, wenn man von f nur absolute Integrierbarkeit auf [0,T ] verlangt. F ist dann absolut-stetig. Man siehe hierzu etwa A. Kufner, J. Kadlec (1971) oder G. P. Tolstov (1976).
4.5 Asymptotisches Verhalten der Fourierkoeffizienten Beispiel. Die Sägezahnreihe f (t) =
39
∞ X sin(kt)
besitzt einen verschwindenden Gleichk anteil. Integration von 0 bis t ergibt die 2π-periodische Funktion (vgl. S. 29) k=1
F (t) =
ˆt
f (x) dx =
∞
π 2 X cos(kt) − 6 k2 k=1
0
π2 2πt − t2 . Für 0 ≤ t ≤ 2π ist F (t) = . 6 4
mit dem Gleichanteil F0 =
4.5 Asymptotisches Verhalten der Fourierkoeffizienten Ziele dieses Abschnitts sind Aussagen über den Zusammenhang zwischen Glattheitseigenschaften periodischer Funktionen und dem qualitativen Verhalten ihres Spektrums. Dabei wird sich insbesondere herausstellen, dass lokale Eigenschaften einer Funktion f sich auf ihr gesamtes Spektrum auswirken. Für eine auf [0,T ] Riemann-integrierbare T -periodische Funktion f mit den Fourierkoeffizienten ak , bk bzw. ck gilt folgende wichtige Ungleichung. Wie üblich ist wieder ω0 = 2π/T .
Die Bessel-Ungleichung (F.W. Bessel, 1784–1846) lautet ˆT ∞ +∞ X 1X |a0 |2 1 2 2 2 + (|ak | + |bk | ) = |ck | ≤ |f (t)|2 dt . 4 2 T k=1
k=−∞
0
Für die Partialsummen fN (t) der Fourierreihe von f gilt nämlich mit ω0 = 2π/T : 1 T
ˆT
f (t)fN (t) dt =
N X
k=−N
0
1 ck T
ˆT
f (t) e−jkω0 t dt =
N X
k=−N
0
ck ck =
N X
k=−N
Mit den Orthonormalitätsrelationen aus 2.1 erhält man für alle N ∈ N auch 1 T
ˆT
fN (t)fN (t) dt =
N X
k=−N
0
|ck |2 .
Damit ist 1 0≤ T
ˆT 0
1 |f (t) − fN (t)| dt = T 2
ˆT 0
(f (t) − fN (t))(f (t) − fN (t)) dt
|ck |2 .
40
4 Rechnen mit Fourierreihen T ˆT ˆ ˆT ˆT 1 |f (t)|2 dt − f (t)fN (t) dt − f (t)fN (t) dt + fN (t)fN (t) dt = T 0
0
=
1 T
ˆT 0
|f (t)|2 dt −
N X
k=−N
0
0
|ck |2 .
Hieraus folgt die rechte Hälfte der Bessel-Ungleichung durch Grenzübergang N → ∞. Die linke Hälfte ergibt sich aus den Umrechnungsformeln für die Fourierkoeffizienten (vgl. auch S. 13): |ak |2 + |bk |2 = (ck + c−k )(ck + c−k ) + j(ck − c−k )(−j)(ck − c−k ) = 2ck ck + 2c−k c−k , also |a0 |2 = 4|c0 |2 , |ak |2 + |bk |2 = 2(|ck |2 + |c−k |2 ) für k ≥ 1. Insbesondere gilt immer 1 T
ˆT 0
1 |f (t) − fN (t)| dt ≤ T 2
ˆT 0
|f (t)|2 dt .
Folgerung. Die Fourierkoeffizienten einer auf [0,T ] Riemann-integrierbaren T -periodischen Funktion f sind quadratisch summierbar: ∞ X
k=0
∞ X
2
|ak | < ∞ ,
k=1
2
|bk | < ∞ ,
+∞ X
k=−∞
|ck |2 < ∞ .
Asymptotisches Verschwinden der Fourierkoeffizienten Aus der quadratischen Summierbarkeit der |ck | erhält man sofort folgenden
Satz. Für die Fourierkoeffizienten ak , bk , ck einer auf [0,T ] Riemann-integrierbaren T periodischen Funktion f gilt lim ak = lim bk = lim ck = 0.
k→∞
k→∞
|k|→∞
Diese Aussage ist bekannt als Riemann-Lebesgue-Lemma. Sie bedeutet anschaulich, ˆT dass die Integrale, zum Beispiel f (t) cos(kω0 t) dt, mit wachsendem |k| → ∞ durch 0
die immer dichteren Oszillationen der harmonischen Schwingungen gelöscht werden. Es ˆb gilt dann auch lim f (t) e−jkω0 t dt = 0 für Teilintervalle [a,b] von [0,T ]. Man setze |k|→∞
a
hierzu nur g(t) = f (t) in [a,b], g(t) = 0 in [0,T ] \ [a,b], und wende die obigen Aussagen auf die T -periodische Fortsetzung von g an. Auch für absolut-integrierbare Funktionen f auf R gilt
4.5 Asymptotisches Verhalten der Fourierkoeffizienten
41
+∞ ˆ lim f (t) e−jωt dt = 0.
|ω|→∞ −∞
+∞ ˆ+a ˆ ˆ −jωt −jωt Dies folgt aus der Abschätzung f (t) e dt ≤ f (t) e dt + −∞
−a
|f (t)| dt ,
|t|≥a
da das zweite Integral der rechten Seite beliebig klein gemacht werden kann, wenn nur a > 0 groß genug gewählt wird, und das erste Integral mit wachsendem |ω| gegen Null konvergiert. Das folgende Bild veranschaulicht den Sachverhalt. cos(40πt/T ) f (t) 1 0 −1 0
T
Die Funktion f ändert sich im Vergleich zu einer schnell oszillierenden Schwingung nur langsam, im Integral des Produktes kompensieren sich positive und negative Anteile mit wachsender Frequenz der Schwingung immer mehr. Größenordnung der Fourierkoeffizienten und Glattheit von f Für eine T -periodische, auf [0,T ] integrierbare Funktion f mit Fourierkoeffizienten ck gelten mit ω0 = 2π/T die folgenden Beziehungen zwischen der Größenordnung der Fourierkoeffizienten ck und Differenzierbarkeitseigenschaften von f : Satz. Sind f,f ′ , . . . ,f (m−1) stetig auf R und ist f (m) stückweise stetig, dann gilt +∞ X
k=−∞
|k m ck |2 < ∞, speziell also |k m ck | −→ 0 für |k| → ∞.
Gilt andererseits für alle k ∈ Z \ A mit einer endlichen Menge A, einer geeigneten Konstante M > 0, m ∈ N und einem α > 1 die Abschätzung |ck | ≤ M |k|−(m+α) , dann ist f m-mal stetig differenzierbar. Es ist eine bemerkenswerte Tatsache, dass lokale Eigenschaften der Funktion f sich auf ihr gesamtes Spektrum auswirken, und umgekehrt globale Eigenschaften des Spektrums lokale Eigenschaften von f widerspiegeln. Der Satz zeigt, dass auch lokal eng begrenzte kleine Störungen von f , etwa aufgesetzte kleine Spitzen, bei Verlust von Differenzierbarkeitseigenschaften das gesamte Spektrum verändern. Beweis. Nach den Ergebnissen von Abschnitt 4.3, S. 37, folgt für die Fourierkoeffizienten (m) ck , c′k , . . ., ck von f , f ′ , . . ., f (m) nämlich (m)
ck
(m−1)
= (jkω0 )ck
= . . . = (jkω0 )m ck .
42
4 Rechnen mit Fourierreihen
Mit der Bessel-Ungleichung und dem Riemann-Lebesgue-Lemma für f (m) folgt daher der erste Teil des Satzes. Mit α > 1 ergibt sich aus der Voraussetzung der zweiten Aussage für n ≤ m und hinreichend großes k0 ∈ N X X X |k|−(m−n+α) ≤ 2M |k n ck | ≤ M k −α < ∞. |k|>k0
Die Reihen
+∞ X
k=−∞
k>k0
|k|>k0
(jkω0 )n ck ejkω0 t sind dann also für n ≤ m gleichmäßig konvergent und
stellen daher nach dem Satz von Fejér von S. 23 die stetigen Funktionen f (n) dar. Eine ausführliche Diskussion der Zusammenhänge zwischen den Glattheitseigenschaften periodischer Funktionen und der Größe ihrer Fourierkoeffizienten findet man bei G. P. Tolstov (1976), A. Kufner, J. Kadlec (1971), N. K. Bary (1964) oder A. Zygmund (2003). Beispiele 1. Der Sägezahn ist stückweise stetig, aber nicht stetig. Die Fourierkoeffizienten des Sägezahns fallen ab wie 1/|k| (Fall m = 0). Die aus Parabelbögen zusammengesetzte Funktion g(t), die durch g(t) = t2 für t in [−π,π], g(t) = g(t + 2πk), k ∈ Z, definiert wird, hat quadratisch abfallende Fourierkoeffizienten (Übung): cos(t) cos(2t) cos(3t) π2 − + ∓ . . . . −4 g(t) = 3 12 22 32 g(t) ist nicht stetig differenzierbar (Fall m = 1). Ist eine Funktion f (t) =
+∞ X
ck ejkω0 t stetig differenzierbar mit stückweise stetiger
k=−∞
zweiter Ableitung (Fall m = 2), so fallen die Amplituden der Oberschwingungen mit Kreisfrequenzen kω0 für wachsende |k| ∈ N schneller ab als 1/|k|2 . t(π + t) für −π ≤ t ≤ 0 Etwa besitzt f (t) = eine stückweise stetige zweite t(π − t) für 0≤t≤π Ableitung. Es gilt sin(3t) sin(5t) 8 sin(t) + + + ... . f (t) = π 33 53 4 f (t) 0
−4 −π
0
π
4.6 Spektrum und Leistung, Parseval-Gleichung
43
M für alle k ∈ Z \ {0} und eine geeignete Konstante M > 0 wie |k|3 im letzten Beispiel, so folgt
2. Gilt etwa |ck | ≤
+∞ X
k=−∞
dann ist f (t) =
|k| |ck | =
+∞ X
∞ X
k=1
k |ck | +
∞ X
k=1
k |c−k | ≤ 2M
∞ X 1 < ∞; k2 k=1
ck ejkω0 t stetig differenzierbar.
k=−∞
3. Gilt für die Fourierkoeffizienten ck von f , dass lim |k|m |ck | = 0 für alle m ∈ N, |k|→∞
dann ist f unendlich oft differenzierbar.
Für beliebige m ∈ N ist dann nämlich die Folge |k|m+2 |ck | k∈Z beschränkt, und mit +∞ +∞ +∞ X X X |k|m+2 1 geeignetem M ∈ R gilt |k|m |ck | = |c | ≤ M < ∞. k 2 2 |k| |k| k=−∞ k=−∞ k=−∞
k6=0
k6=0
Damit folgt, dass f für jedes m ∈ N m-mal differenzierbar ist.
Anschaulich gesprochen bedeuten die obigen asymptotischen Aussagen, dass zu einer guten Nachbildung von periodischen Funktionen mit „Knickstellen“ oder Sprungstellen die Amplituden der Oberschwingungen nicht zu schnell fallen dürfen.
4.6 Spektrum und Leistung, Parseval-Gleichung Eine T -periodische Wechselspannung U gibt, über die Periode T gemittelt, an einem WirkˆT |U (t)|2 1 dt ab. Als normalisierte Leistung P einer widerstand R die Leistung P = T R 0
T -periodischen stückweise stetigen Funktion f (t) = entsprechend mit der Normierung R = 1 Ω 1 P = T
ˆT 0
+∞ X
ck ejkω0 t definiert man daher
k=−∞
|f (t)|2 dt .
√ P heißt Effektivwert von f . Man√ bezeichnet den Effektivwert in der Mathematik auch als Norm von f und schreibt kf k2 = P . Das Skalarprodukt p von S. 9 ist auch für stückweise stetige Funktionen definiert und es gilt dann kf k2 = hf |f i für die Norm von f .
44
4 Rechnen mit Fourierreihen
Für je zwei stückweise stetige, T -periodische Funktionen f und g ist durch die Norm kf − gk2 = hf − g|f − gi1/2 der Differenzfunktion f − g ein Abstandsbegriff zwischen Funktionen definiert. Dabei werden zwei Funktionen identifiziert, wenn sie sich nur auf einer Nullmenge unterscheiden. Mit dieser Identifikation ist das eingeführte Skalarprodukt positiv definit. Die Funktionen f sind bei dieser Identifikation genau genommen durch die ihnen zugehörigen Äquivalenzklassen zu ersetzen. Es ist üblich, trotzdem weiter von Funktionen statt von Äquivalenzklassen zu sprechen. Die Norm kf k2 ist genau dann Null, wenn sich f höchstens auf einer Nullmenge von der Nullfunktion unterscheidet, und es gilt die Dreiecksungleichung kf ± gk2 ≤ kf k2 + kgk2 . Wir werden in Abschnitt 5.1 auf diesen Abstandsbegriff und auf den damit verbundenen Konvergenzbegriff zurückkommen. Satz. Die normalisierte Leistung von f kann durch das Spektrum (ck )k∈Z der Funktion f ausgedrückt werden: P =
kf k22
1 = T
ˆT 0
|f (t)|2 dt =
+∞ X
k=−∞
|ck |2 .
Diese Gleichung wird nach M. A. Parseval (1755-1836) als Parseval-Gleichung bezeichnet. Weil die Leistung von f (t) = ck ejkω0 t gerade |ck |2 ist, lässt sich auch formulieren: Die normalisierte Leistung von f ist gleich der Summe der Leistungen aller harmonischen Teilschwingungen von f . Diese wichtige Beziehung wird für stückweise stetige periodische Funktionen in Kapitel 6 gezeigt. Sie lässt sich mit Sätzen der Lebesgueschen Integrationstheorie auch für alle auf [0,T ] quadratisch Lebesgue-integrierbaren Funktionen beweisen.
4.7 Übungsaufgaben Die Aufgaben mit einem Stern ⋆ zu diesem und den Folgekapiteln sind mathematisch schwieriger als die anderen und vornehmlich für Mathematiker unter den Lesern gedacht. A1) Gegeben sei f (t) = cos(t) für 0 < t < π. Skizzieren Sie die ungerade, 2π-periodische Fortsetzung von f und geben Sie die Fourierreihe dieser ungeraden, 2π-periodischen Funktion an. A2) Gegeben sei die 2π-periodische Funktion 1 für 0 < t < π 0 für t = 0 h(t) = −1 für − π < t < 0 h(t + 2kπ) = h(t) für k ∈ Z.
1
π
−π -1
(a) Geben Sie die Fourierreihe an. (b) Wie lautet dann die Fourierreihe der im Folgenden skizzierten 4-periodischen Funktion g(t + 4k) = g(t) für k ∈ Z ?
4.7 Übungsaufgaben
45
g(t) =
−3
1 5 N ).
A6) Vergleichen Sie die Stetigkeits- und Differenzierbarkeitseigenschaften einiger Fourierreihen aus Beispielen der behandelten Kapitel und aus Ihrer Formelsammlung. Betrachten Sie Beispiele, deren Fourierkoeffizienten ein asymptotisches Verhalten 1 1 1 1 wie , 2 , 3 und 2 besitzen. k k k k −1 A7) Zeigen Sie, dass gliedweise Differentiation der Fourierreihe des Rechteckmäanders f (t) = sgn(t), −π ≤ t < π, auf eine Reihe führt, die nur an den Stellen t der Form t = (2k − 1)π/2, k ∈ Z, konvergiert.
46
4 Rechnen mit Fourierreihen
A8) Wie lauten die Grenzwerte der Reihen ∞ X
1 , 2−1 4n n=1
∞ X
(−1)n+1
n=1
1 , n2
∞ X
(−1)n+1
n=1
1 ? (2n − 1)3
Verwenden Sie Fourierreihen periodischer Funktionen aus Ihrer Formelsammlung. A9) Schreiben Sie jeweils eine Prozedur (z.B. für Maple oder Mathematica) zur exakten und zur numerischen Berechnung von Fourierentwicklungen T -periodischer, stückweise stetiger Funktionen. Analog zur Berechnung Fejérscher Mittel. n X sin(kt) A10)⋆ Grafische Darstellungen der Summen lassen für die Sägezahnfunktik k=1 on vermuten, dass alle Partialsummen in ]0,π[ strikt positiv, in ]−π,0[ strikt negativ sind, d.h. dass sie in ]0,π[ nicht „nach unten durchschwingen“, in ]−π,0[ nicht „nach oben“. Zeigen Sie diese Vermutung mit vollständiger Induktion. In welchen Toleranzbereichen kann der Sägezahn durch solche Partialsummen approximiert werden? A11)⋆ Diese Aufgabe soll zeigen, dass es konvergente trigonometrische Reihen gibt, die keine Fourierreihen im bisher behandelten klassischen Sinn sind. n X sin((n + 1)t/2) sin(nt/2) gilt (bei stesin(kt) = (a) Rechnen Sie nach, dass sin(t/2) k=1 tiger Ergänzung an den Nullstellen des Nenners). Hinweis: Verwenden Sie 1 − ejϕ = ejϕ/2 (−2j) sin(ϕ/2) und eine ähnliche Rechnung wie beim Dirichlet-Kern auf S. 11. (b) Zeigen Sie, dass für die Sinus-Koeffizienten bk der Fourierreihe einer auf [0,2π] ∞ X integrierbaren Funktion – welche f nicht darstellen muss – bk /k < ∞ gilt. k=1
Verwenden Sie dazu die Anmerkung auf S. 38 und entwickeln Sie die Integralfunktion von f in eine Fourierreihe. (c) (Abels Lemma) Zeigen Sie, dass für zwei Folgen (ak )k∈N , (bk )k∈N und n n n X X X sk (bk − bk+1 ). ak bk = sn bn+1 + ak gilt: sn = k=1
k=1
k=1
(d) (Abel-Dirichlet-Test) Zeigen Sie mit (c) folgende Verallgemeinerung des für alternierende Reihen bekannten Leibniz-Kriteriums: n X Für eine Folge (ak )k∈N gelte ak ≤ M für alle n ∈ N und ein M > 0. Für k=1
jede monoton fallende Nullfolge (bk )k∈N konvergiert dann die Reihe
∞ X
k=1 ∞ X
ak b k .
sin(kt) ln(k) k=2 überall konvergiert, für h > 0 in jedem Intervall [h, 2π − h] sogar gleichmäßig gegen eine stetige Funktion, dass die Reihe aber nicht die (klassische) Fourierreihe dieser Funktion sein kann.
(e) Zeigen Sie nun unter Verwendung der Anmerkung von S. 38, dass
47
5
Anwendungsbeispiele für Fourierreihen
In diesem Kapitel werden einige ausgewählte Beispiele vorgestellt, die einen ersten Eindruck über die weitreichenden technisch-wissenschaftlichen Anwendungsmöglichkeiten von Fourierreihen vermitteln sollen. Im letzten Abschnitt werden diese Beispiele durch eine Reihe von Übungsaufgaben ergänzt, deren Bearbeitung jedem Leser nahegelegt sei.
5.1 Beste Approximation im quadratischen Mittel Im Mittelpunkt der folgenden Überlegungen stehen nicht mehr wie bisher punktweise oder gleichmäßige Näherungen an periodische Funktionen f durch trigonometrische Polynome, sondern Näherungen, deren mittlere quadratische Abweichung von der Zielfunktion f klein sein soll. Eine T -periodische stückweise stetige Funktion f : R → C (oder ihre Restriktion N X auf [0,T ]) soll durch ein trigonometrisches Polynom P (t) = αk ejkω0 t , ω0 = 2π/T , k=−N
so approximiert werden, dass der mittlere quadratische Fehler minimal wird: 1 T
ˆT 0
|f (t) − P (t)|2 dt = min !
Besitzt f die Fourierkoeffizienten ck , so gilt für den mittleren quadratischen Fehler 1 T
ˆT 0
1 |f (t) − P (t)| dt = T
ˆT
1 T
ˆT
2
=
0
0
=
1 T |
ˆT 0
(f (t) −
N X
k=−N
|f (t)|2 dt − |f (t)|2 dt − {z
αk ejkω0 t )(f (t) − N X
k=−N N X
k=−N
unabhängig von den αk
αk ck − |ck |2 + }
N X
k=−N N X
k=−N
N X
αk e−jkω0 t ) dt
k=−N
αk ck +
N X
k=−N
|αk |2
|ck − αk |2 .
Das obige Leistungsintegral wird minimal genau dann, wenn αk = ck für |k| ≤ N . Wir erhalten damit folgenden Satz über die beste Approximation im quadratischen Mittel: Satz. Das beste trigonometrische Näherungspolynom vom Grad höchstens N zu diesem N X ck ejkω0 t der Fourierreihe von f . Zweck ist die N -te Partialsumme P (t) = k=−N
48
5 Anwendungsbeispiele für Fourierreihen
Geometrische Interpretation Sucht man für einen Vektor ~x = (x1 , . . . ,xn ) ∈ Rn einen Näherungsvektor ~y in einem Untervektorraum U des Rn mit n X (xi − yi )2 = min ! , |~x − ~ y |2 = i=1
so ist ~y bekanntlich die Orthogonalprojektion von ~x auf U . Für die Skalarprodukte von (~x − ~y ) mit Vektoren ~u ∈ U gilt dann die Orthogonalitätsrelation ~x − ~ y
~x
~y
U
(~x − ~ y ) · ~u = 0 für alle ~u ∈ U. Der gleiche Sachverhalt gilt auch in höherdimensionalen Vektorräumen mit einem innerem Produkt. Ganz in diesem Sinn ist die N -te Partialsumme fN der Fourierreihe von f die Orthogonalprojektion von f auf den Vektorraum TN der T -periodischen trigonometrischen Polynome bis zum Grad N : Die stückweise stetige T -periodische Funktion f besitzt eine ⊥ eindeutige Zerlegung f = fN + fN mit fN ∈ TN und ⊥ |hi = hf − fN |hi = 0 für alle h ∈ TN , hfN
mit dem inneren Produkt von S. 9. Denn für h(t) = 1 hf − fN |hi = T =
ˆT 0
( f (s) −
N X
k=−N
N X
αk ejkω0 t ist
k=−N
ck e
jkω0 s
k=−N
αk ck −
N X
N X
k=−N
ck αk
!
)
N X
αm e−jmω0 s ds
m=−N
= 0.
Die Funktion f ist ein Element des unendlich-dimensionalen Vektorraumes aller T -periodischen stückweise stetigen Funktionen. Die Orthogonalprojektion fN mit der Integraldarstellung ˆT 1 fN (t) = f (s)DN (t − s) ds T 0
ist Element des (2N +1)-dimensionalen Untervektorraumes TN (DN ist der Dirichlet-Kern vom Grad N ). Konvergenz im quadratischen Mittel Satz. Die Fourierreihe einer T -periodischen stückweise stetigen Funktion f konvergiert im quadratischen Mittel gegen f .
5.1 Beste Approximation im quadratischen Mittel
49
Dieser Satz ist gleichbedeutend mit der Gültigkeit der Parseval-Gleichung. Hat f die Fourierkoeffizienten ck , so gilt nämlich mit ω0 = 2π/T 1 T
ˆT 0
|f (t) −
N X
ck e
1 | dt = T
jkω0 t 2
k=−N
ˆT 0
|f (t)|2 dt −
N X
k=−N
|ck |2 −→ 0. N →∞
Der Begriff der Konvergenz im quadratischen Mittel ist für technische und theoretische Zwecke häufig wichtiger als punktweise Konvergenz. Durch den Satz von Dirichlet (S. 23) ist die punktweise Darstellung von periodischen Funktionen f durch ihre Fourierreihen im Wesentlichen nur für stückweise stetig differenzierbare Funktionen gesichert. In der Tat gibt es Beispiele von stetigen periodischen Funktionen, deren Fourierreihen an unendlich vielen Stellen divergieren. Andererseits weiß man seit einer Arbeit von L. Carleson (1966), dass Fourierreihen stetiger periodischer Funktionen f „fast überall“ (vgl. dazu Anhang B) konvergieren. Neben dem bemerkenswerten Satz von Fejér (S. 23) ist daher das für die Anwendungen wohl wichtigste Resultat die oben formulierte Konvergenz im quadratischen Mittel, die für die Fourierreihen sehr allgemeiner Funktionen gezeigt werden kann. Dieses Ergebnis wurde oben für stückweise stetige Funktionen genannt und wird für diese Funktionenklasse im nächsten Kapitel bewiesen. In der Integrationstheorie wird unter Verwendung des Lebesgueschen Integralbegriffs (vgl. Anhang B) für Elemente f aus dem Vektorraum L2 ([0,T ]) aller auf [0,T ] quadratisch integrierbaren komplexwertigen Funktionen der folgende allgemeinere Satz gezeigt. Jede auf [0,T ] definierte Funktion f ∈ L2 ([0,T ]) kann wie üblich zu einer T -periodischen Funktion auf R fortgesetzt werden. Satz. Die Fourierreihe einer Funktion f ∈ L2 ([0,T ]) konvergiert im quadratischen Mittel gegen f . Einen Beweis dieses Satzes findet man etwa bei W. Rudin (1990). Auch wenn Funktionen f ∈ L2 ([0,T ]) nicht notwendig punktweise durch ihre Fourierreihe dargestellt werden, so lassen sie sich doch im quadratischen Mittel beliebig gut durch Partialsummen fN ihrer Fourierreihen approximieren. Man benutzt in diesem Sinne ebenfalls die Schreibweise +∞ X f (t) = ck ejkω0 t . Sie bedeutet dann, dass die Partialsummen fN für N → ∞ bek=−∞
züglich der Norm von S. 43 gegen f konvergieren: lim kfN − f k2 = 0. Die Abstände N →∞
von fN und f , gemessen in dieser Norm, werden für wachsendes N beliebig klein, d.h. der mittlere quadratische Fehler kfn − f k22 konvergiert gegen Null.
Berechnung von Klirrfaktoren Mit der Parseval-Gleichung lassen sich Klirrfaktoren über die normalisierte Leistung P berechnen (vgl. S. 27). Für ein reellwertiges r Signal f mit den Fourierkoeffizienten ck und 1 Z , wobei N = (P −|c0 |2 ) und Z = N −|c1 |2 Leistung P beträgt der Klirrfaktor K = N 2 ist. So folgt etwa für das Beispiel auf S. 27 ein Klirrfaktor K von ungefähr K = 0.56.
50
5 Anwendungsbeispiele für Fourierreihen
5.2 Periodische Faltung, Anwendung auf lineare Systeme In diesem Abschnitt wenden wir Fourierreihen an, um lineare gewöhnliche Differentialgleichungen mit konstanten Koeffizienten und periodischen Störfunktionen zu lösen. Bekannte Beispiele sind etwa Bewegungsgleichungen in der Mechanik oder Differentialgleichungen zur Beschreibung von RCL-Netzwerken in der Elektrotechnik. Hierzu benötigt man den Begriff der periodischen Faltung. Definition. Die T -periodische Faltung für stückweise stetige T -periodische Funktionen f und h ist definiert durch 1 (f ∗ h)T (t) = T
ˆT 0
f (u)h(t − u) du .
Sind f und h wie vorausgesetzt stückweise stetig, dann ist (f ∗ h)T eine auf R stetige T periodische Funktion. Diese Eigenschaft wird im nächsten Kapitel gezeigt und dort auch zum Beweis der Parseval-Gleichung benutzt. Bemerkung. Mit der Lebesgueschen Integrationstheorie kann die periodische Faltung allgemeiner definiert werden. Für Funktionen f und h, die auf [0,T ] Lebesgue-integrierbar sind, existiert die Faltung dann fast-überall und die Stetigkeit von (f ∗ h)T lässt sich für T -periodische, auf dem Intervall [0,T ] quadratisch Lebesgue-integrierbare Funktionen f und h beweisen und ergibt dann die Parsevalgleichung auch für solche Funktionen.
Die Fourierreihe der periodischen Faltung Die Koeffizienten ck seien nun die Fourierkoeffizienten von f , die Koeffizienten hk diejenigen von h. Für den k-ten Fourierkoeffizienten von (f ∗ h)T ergibt sich mit Vertauschung der Integrationsreihenfolge: 1 T
ˆT 0
1 T
ˆT
f (u)h(t−u) du e−jkω0 t dt =
0
1 T
ˆT
f (u)
0
(f ∗ h)T (t) =
+∞ X
1 T |
ˆT
h(t−u) e−jkω0 t dt du = ck hk .
0
{z
}
hk ·e−jkω0 u nach 4.2
ck hk ejkω0 t .
k=−∞
Ergebnis. Die Fourierkoeffizienten der T -periodischen Faltung (f ∗ h)T sind das Produkt der entsprechenden Fourierkoeffizienten von f und h. Aus der Ungleichung (|ck | − |hk |)2 ≥ 0 erhält man durch Ausmultiplizieren sofort 2|ck hk | ≤ |ck |2 + |hk |2 . Hieraus folgt mit der Bessel-Ungleichung
5.2 Periodische Faltung, Anwendung auf lineare Systeme +∞ X
k=−∞
|ck hk | ≤
51
+∞ 1 X (|ck |2 + |hk |2 ) < ∞. 2 k=−∞
Deshalb ist die Fourierreihe von (f ∗h)T gleichmäßig konvergent. Nach dem Satz von Fejér wird die stetige Funktion (f ∗h)T daher durch ihre Fourierreihe punktweise dargestellt. Die Stetigkeit von (f ∗ h)T wird auf Seite 115 gezeigt. Anwendung auf asymptotisch stabile, zeitinvariante lineare Systeme Als Anwendung betrachten wir lineare Differentialgleichungen der Form n X
ak u(k) (t) = f (t).
k=0 (k)
Dabei sind u die k-ten Ableitungen von u und ak konstante reelle Koeffizienten. Wir setzen o.E.d.A. an = 1. Viele Gleichungen zur mathematischen Modellierung technischphysikalischer Systeme sind von diesem Typ. Man denke zum Beispiel an elektrische Netzwerke aus Widerständen, Kapazitäten und Induktivitäten oder an Schwingungsdifferentialgleichungen in der Mechanik. Wir setzen nun voraus, dass das System asymptotisch stabil ist, d.h. dass bei beliebigen Anfangswerten die Lösung der zugehörigen homogenen Differentialgleichung für t → ∞ verschwindet. Dies ist genau dann der Fall, wenn alle Nullstellen des charakteristischen Polynoms negative Realteile besitzen. Das charakteristische Polynom muss dann ein HurwitzPolynom sein und alle Koeffizienten ak müssen wegen an > 0 ebenfalls positiv sein (siehe etwa K. Meyberg, P. Vachenauer (2001), Bd. 2, Kap. 9). Bei rechten Seiten der Form f (t) = A sin(ωt + φ) ist unter diesen Voraussetzungen die periodische Lösung eindeutig bestimmt, besitzt jedoch bei gleicher Kreisfrequenz ω im Allgemeinen eine andere Amplitude und Phase als f (t) (man vgl. die bekannte Ansatzmethode zur Lösung solcher Differentialgleichungen). Die lineare Abbildung L, die unter den obigen Voraussetzungen einer rechten Seite U0 ejωt die eindeutig bestimmte periodische Lösung zuordnet, beschreibt ein sogenanntes zeitinvariantes lineares System. Wir werden solche Systeme nach weiteren mathematischen Vorbereitungen genauer und allgemeiner in Kapitel 10 studieren. Schematisch wird der hier zunächst vorgelegte Sachverhalt für harmonische Schwingungen durch das folgende Bild dargestellt: Eingang U0 ejωt
asymptotisch stabiles zeitinvariantes lineares Übertragungssystem L im eingeschwungenen Zustand
Ausgang h(ω) ejωt U0 b
Die Funktion b h(ω) drückt Verstärkung oder Dämpfung und Phasenverschiebung bei der Übertragung in Abhängigkeit von der Kreisfrequenz ω aus. Es gilt b h(ω) = 1/P (jω) mit dem charakteristischen Polynom P der gegebenen Differentialgleichung.
52
5 Anwendungsbeispiele für Fourierreihen
Es stellt sich die Frage, ob es ganz generell bei periodischen Anregungen genau eine periodische Lösung gibt. Diese Lösung würde das Langzeitverhalten nach Abklingen von Einschwingvorgängen beschreiben. Wir erhalten unter geeigneten Einschränkungen an die rechte Seite f folgenden Satz. Satz. Eine asymptotisch stabile lineare gewöhnliche Differentialgleichung mit konstanten Koeffizienten und einer stetigen, stückweise stetig differenzierbaren T -periodischen rechten Seite f besitzt die eindeutig bestimmte T -periodische Lösung u(t) =
+∞ X
ck hk ejkω0 t
k=−∞
2π ω0 = . T
Dabei sind die Koeffizienten ck die Fourierkoeffizienten von f und hk = 1/P (jkω0) mit dem charakteristischen Polynom P der Differentialgleichung. Beweis. Einsetzen der Reihe in die Differentialgleichung zeigt diese Aussage unmittelbar. Diese Reihe und alle ihre gliedweise gebildeten Ableitungen bis zur Ordnung n sind gleichmäßig konvergent, da die Fourierreihe von f gleichmäßig konvergiert. Insbesondere ist u eine n-mal stetig differenzierbare Funktion. Die Eindeutigkeit folgt sofort aus der Tatsache, dass die Differenz zweier T -periodischer Lösungen wieder T -periodisch ist und eine Lösung der homogenen Gleichung sein muss. Dies kann wegen der vorausgesetzten Stabilität nur die Nullfunktion sein. Man kann zeigen, dass für genügend große |k|, ein geeignetes M > 0 und Polynomgrad n ≥ 2 die Abschätzung |P (jω0 k)|−1 ≤ M |k|−3/2 gilt (Übungsaufgabe A4). Daher stellt dann die Reihe +∞ X h(t) = hk ejkω0 t k=−∞
eine stetige Funktion dar. Für Gleichungen erster Ordnung kann man mit etwas Rechen+∞ X 1 ejkt , arbeit durch einen Vergleich mit der Sägezahnreihe sehen, dass h(t) = jk + a0 k=−∞ a0 > 0, stetig ist bis auf die Stellen t = 2nπ, n ∈ Z. An diesen Stellen hat h rechtsund linksseitige Grenzwerte (π(coth(a0 π) ± 1) für T = 2π). Die Reihe stellt eine stückweise stetig differenzierbare Funktion dar (Übungsaufgabe A5). Dies gilt auch für andere Perioden als T = 2π. Mit der Faltungseigenschaft für Fourierreihen erhalten wir daher: Die Fourierkoeffizienten der Lösung u sind das Produkt der entsprechenden Fourierkoeffizienten von f und h, und u ist die T -periodische Faltung u = (f ∗ h)T . f (t) =
+∞ X
k=−∞
ck ejkω0 t
h(t) = +∞ X hk ejkω0 t
(f ∗ h)T (t) =
k=−∞
1 = T
+∞ X
k=−∞
ˆT 0
Die Funktion h heißt T -periodische Übertragungsfunktion.
ck hk ejkω0 t
f (s)h(t − s) ds
5.2 Periodische Faltung, Anwendung auf lineare Systeme
53
Bemerkung. Will man allgemeinere rechte Seiten wie eine Sägezahn-Funktion oder ein Rechteck-Mäander als Modell von Ein- und Ausschaltvorgängen behandeln, so ist eine Modifikation des klassischen Lösungsbegriffs bei Differentialgleichungen zwingend notwendig. Man kann dies für den Anwendungsfall mit stückweise stetigen rechten Seiten f durch eine Modifikation des Begriffs der Stammfunktion erreichen wie etwa K. Königsberger (2003), dort bei Variation der Konstanten. Mit den Ergebnissen der Lebesgueschen Integrationstheorie, der Funktionalanalysis und der Distributionentheorie ist es möglich, einen neuen Lösungsbegriff einzuführen und damit die Voraussetzungen an f und h sehr weitgehend abzuschwächen. Es genügt zum Beispiel, dass die Koeffizienten ck von f quadratisch summierbar sind. Alle oben auftretenden Fourierreihen konvergieren dann in L2 ([0,T ]) und die Funktion u ist die Faltung (f ∗ h)T zweier Funktionen in L2 ([0,T ]). Mit dem Begriff der verallgemeinerten Ableitung (Abschnitt 7.5) in der Distributionentheorie und verallgemeinerten Fourierreihen f und h (Abschnitt 8.1) kann schließlich (f ∗ h)T als Lösung der Differentialgleichung interpretiert werden, ohne dass zusätzliche Stetigkeits- oder Differenzierbarkeitseigenschaften für f erforderlich sind. Dies ist ein großer, auch rechentechnischer Gewinn bei der Behandlung vieler Anwendungsprobleme. Wir betrachten, wie schon erwähnt, zeitinvariante lineare Systeme genauer erst nach den erforderlichen mathematischen Vorbereitungen in Kapitel 10 und kommen dort in Abschnitt 10.5 auf die hier angemerkten Sachverhalte zurück. Der letzte Satz und seine angemerkten Verallgemeinerungen bilden das Fundament der als komplexe Wechselstromrechnung bekannten Methode in der Elektrotechnik. Beispiel. Das folgende RCL-Tiefpassfilter mit einem Ohmschen Widerstand R, mit der Induktivität L und der Kapazität C, in der Regelungstechnik als P T2 -Glied bezeichnet, R Ue (t)
L C
Ua (t)
wird nach den Kirchhoffschen Gesetzen beschrieben durch die Differentialgleichung LC
dU a d2 Ua (t) + RC (t) + Ua (t) = Ue (t). dt dt2
Die Nullstellen des charakteristischen Polynoms LCλ2 + RCλ + 1 sind s 1 1 R2 R2 R − ≥ ± für − 2 2 2L 4L LC 4L LC λ1,2 = r 2 2 R 1 R 1 − R ± j für < − . 2L LC 4L2 4L2 LC
Sie haben negative Realteile, das vorliegende lineare System ist asymptotisch stabil. Für Ue (t) = U0 ejkω0 t , ω0 = 2π/T, ergibt sich die T -periodische Lösung Ua (t) =
U0 ejkω0 t . 1 + jkω0 RC − k 2 ω02 LC
54
5 Anwendungsbeispiele für Fourierreihen
Die stetige T -periodische Übertragungsfunktion lautet +∞ X
hk ejkω0 t =
k=−∞
+∞ X
k=−∞
1 ejkω0 t . 1 + jkω0 RC − k 2 ω02 LC
Mit der Faltungsregel lassen sich also für asymptotisch stabile Systeme Fourierreihendarstellungen der periodischen Systemantworten angeben, wenn die Fourierentwicklungen von (bisher noch als stetig vorausgesetzten) periodischen Eingangssignalen und der zugehörigen periodischen Übertragungsfunktion bekannt sind. 1 entspricht Bemerkung. Die Spektralfolge (hk )k∈Z = 1 + jkω0 RC − k 2 ω02 LC k∈Z Abtastwerten der kontinuierlichen Funktion b h(ω) = 1/(1 + jωRC − ω 2 LC), die in der Elektrotechnik als Frequenzgang des Filters bezeichnet wird. Die Tiefpasswirkung obiger Schaltung, d.h. die starke Dämpfung höherfrequenter Anteile von Eingangssignalen, ist sowohl an der Folge (hk )k∈Z als auch am Frequenzgang b h(ω) des Beispiels sofort zu sehen. Mechanische Systeme zweiter Ordnung mit periodischer Störfunktion Analog zum obigen Beispiel aus der Elektrotechnik erhält man natürlich auch für asymptotisch stabile mechanische Systeme der Form m¨ x(t) + k x(t) ˙ + Dx(t) = K(t), mit dem für die Praxis wichtigen Fall periodischer Zwangskräfte K(t), eine Darstellung der jeweiligen periodischen Lösung durch Fourierreihenentwicklung von K(t) und periodische Faltung mit der periodischen Übertragungsfunktion des Systems (bisher wieder unter der Stetigkeitsbedingung an die Kraft K(t), später in den Abschnitten 8.1 und 10.5 ganz allgemein). Die Umsetzung dieser Analogie durch Ersetzen der Koeffizienten des vorherigen Beispiels durch die Konstanten m, k und D sei dem Leser überlassen.
5.3 Die Potentialgleichung auf einer Kreisscheibe ∂2u ∂2u ∂2u + 2 + 2 = 0 tritt in vielen Gebieten der mathe∂x2 ∂y ∂z matischen Physik auf. In der Theorie der Wärmeleitung ist u die stationäre Temperatur, d.h. die Temperatur, die sich nach einiger Zeit einstellt. Diese erhält man, wenn in der ∂u Wärmeleitungsgleichung = α2 ∆u die linke Seite Null gesetzt wird (α2 ist dabei die ∂t Temperaturleitfähigkeit in m2 /s). In der Theorie der Gravitation oder der Elektrizität stellt die Funktion u ein Gravitationspotential bzw. ein elektrisches Potential dar. Die Gleichung ∆u = 0 wird deshalb auch Potentialgleichung genannt.
Die Laplace-Gleichung ∆u =
5.3 Die Potentialgleichung auf einer Kreisscheibe
55
Die Aufgabe ∆u = 0 innerhalb eines Gebietes G zu lösen, wobei u auf dem Rand des Gebietes G vorgegeben ist, wird als Dirichletsches Randwertproblem bezeichnet. Es lässt sich für Funktionen von zwei Variablen auf einer Kreisscheibe durch Anwendung der Faltungsbeziehung für Fourierreihen leicht lösen. In einer Kreisscheibe um den Nullpunkt mit Radius R betrachten wir das Problem ∆u =
∂2u ∂2u + 2 = 0. ∂x2 ∂y
In Polarkoordinaten lautet diese Gleichung für 0 < r < R und 0 ≤ φ < 2π: ∆u =
∂ 2 u 1 ∂u 1 ∂2u + = 0. + 2 2 ∂r r ∂r r ∂φ2
Lösung durch Fourierreihenentwicklung bei gegebenen Randwerten Man rechnet durch Einsetzen nach, dass die Funktionen u k = ck
r k R
ejkφ
und u−k = c−k
r k R
e−jkφ
für jedes k ∈ N0 und beliebige Konstanten ck und c−k Lösungen der Potentialgleichung sind. Mit dem Superpositionsprinzip erhält man daraus eine Lösung der Form u(r,φ) =
+∞ X
ck
k=−∞
r |k| R
ejkφ ,
sofern die Reihe konvergiert und eine hinreichend glatte Funktion darstellt. Die Konstanten ck tragen die physikalische Einheit von u. Bei gegebenen Randwerten U (φ) auf der Kreislinie r = R sind die ck gerade die Fourierkoeffizienten von U (φ), 0 ≤ φ < 2π. u(R,φ) = U (φ) =
+∞ X
ck ejkφ .
k=−∞
Lösung des Randwertproblems durch die Poisson-Integralformel Für jedes r ∈ [0,R[ und φ ∈ [0,2π[ ist die folgende geometrische Reihe absolut konvergent mit der Darstellung ∞ X r
k=0
Damit folgt
R
ejφ
k
=
R R2 − Rr cos(φ) + jRr sin(φ) = . R − r ejφ R2 + r2 − 2Rr cos(φ)
56
5 Anwendungsbeispiele für Fourierreihen +∞ |k| ∞ k −1 −k X X X r r r ejkφ = ejkφ + ejkφ R R R
k=−∞
=
k=0 ∞ X k=0
k=−∞
r k
R
ejkφ +
∞ k X r k=0
R
ejk(−φ) −1.
Also können wir für diese Reihe auch schreiben +∞ |k| X R2 − Rr cos(φ) + jRr sin(φ) + R2 − Rr cos(φ) − jRr sin(φ) r ejkφ = R R2 + r2 − 2Rr cos(φ)
k=−∞
+
2Rr cos(φ) − R2 − r2 R2 − r 2 = . R2 + r2 − 2Rr cos(φ) R2 + r2 − 2Rr cos(φ)
Weil u(r,φ) durch die Fourierreihe der 2π-periodischen Faltung zwischen U (φ) und der R2 − r 2 zusätzlich von r abhängigen Funktion g(r,φ) = 2 dargestellt wird R + r2 − 2Rr cos(φ) (vgl. oben), ergibt sich aus der Faltungsbeziehung die folgende Integraldarstellung der Lösung u(r,φ) für 0 ≤ r < R und 0 ≤ φ < 2π: 1 u(r,φ) = 2π
ˆ2π 0
U (ψ)
R2
+
r2
R2 − r 2 dψ . − 2Rr cos(φ − ψ)
Diese Lösungsformel für die Potentialgleichung mit den Randwerten U (φ) auf der Kreislinie r = R ist bekannt als Poisson-Integralformel. Ist die Funktion u(r,φ) zum Beispiel eine stationäre Temperaturverteilung, so wird die Temperatur für jeden Punkt im Innern der Kreisscheibe damit ausgedrückt durch die (konstant gehaltenen) Temperaturwerte U (ψ), 0 ≤ ψ < 2π, auf dem Rand der Kreisscheibe. Zu Glattheit und Eindeutigkeit der Lösung, Maximumprinzip Um unsere Arbeit mit partiellen Differentialgleichungen noch einen Schritt zu vertiefen, untersuchen wir hier kurz die Frage nach der Differenzierbarkeit und der Eindeutigkeit der Lösung. Wir fordern etwa für die Randbedingung U (φ), dass sie eine stetige, stückweise stetig differenzierbare, 2π-periodische Funktion ist. Weil für jedes m ∈ N gilt, dass r |k| = lim |k|m |ck | e|k| ln(r/R) = 0, lim |k|m |ck | |k|→∞ R |k|→∞ zeigt sich aufgrund der Überlegungen in Abschnitt 4.5 an den Summierbarkeitseigenschaften der Reihendarstellung für die Lösung, dass u(r,φ) nach beiden Variablen beliebig oft differenzierbar ist, und dass für φ ∈ [0,2π[ gilt: lim u(r,φ) = U (φ). r→R
Der Nachweis der Eindeutigkeit gelingt mit Hilfe des sogenannten Maximumprinzips für die Potentialgleichung, das wir für allgemeinere Gebiete als Kreisscheiben in der Ebene formulieren.
5.3 Die Potentialgleichung auf einer Kreisscheibe
57
Satz. G sei ein offenes, beschränktes Gebiet in der Ebene. Eine nicht-konstante Funktion u erfülle in G die Potentialgleichung ∆u = 0 und sei stetig auf G ∪ ∂G. Dann nimmt u sein Maximum (Minimum) auf dem Rand des Gebietes an. Dies ist leicht zu sehen: Für ε > 0 setzt man v(x,y) = u(x,y) + ε(x2 + y 2 ). Dann ist ∂2v ∂2v + = 4ε > 0 in G. ∂x2 ∂y 2 Nimmt man (x0 ,y0 ) als inneren Punkt an mit v(x0 ,y0 ) = max{v(x,y) | (x,y) ∈ G ∪ ∂G}, so folgt aus den bekannten Kriterien für Extremstellen notwendigerweise ∂2v (x0 ,y0 ) ≤ 0 und ∂x2
∂2v (x0 ,y0 ) ≤ 0. ∂y 2
Das ist ein Widerspruch zu obiger Gleichung. Daher nimmt v(x,y) sein Maximum auf dem Rand ∂G an. Mit der Stetigkeit von u(x,y) folgt dann wegen u ≤ v sofort: max u(x,y) ≤ max v(x,y) = max v(x,y) ≤ max u(x,y) + ε max(x2 + y 2 ).
G∪∂G
G∪∂G
∂G
∂G
∂G
Weil ε > 0 beliebig klein sein kann, ergibt sich max u(x,y) = max u(x,y).
G∪∂G
∂G
Dieselbe Schlussweise, angewendet auf −u(x,y), zeigt, dass u auch sein Minimum auf dem Rand von G annimmt. Die auf G ∪ ∂G stetigen Funktionen u, die in G die Gleichung ∆u = 0 erfüllen, heißen die auf G harmonischen Funktionen. In einer anschaulich plausiblen, einfachen Bedeutung sagt das Maximumprinzip für harmonische Funktionen bei einem Wärmeleitungsproblem mit konstanter Temperatur T0 auf dem Rand eines beschränkten Gebietes, dass die stationäre Temperatur im Gebietsinneren weder niedriger noch höher als am Rand sein kann, d.h. dass sich nach einiger Zeit überall die Temperatur T0 einstellt. Eindeutigkeit der Lösung Angenommen u˜ ist eine zweite Lösung, so setzen wir v(x,y) = u(x,y) − u˜(x,y). Dann erfüllt v(x,y) die Potentialgleichung und hat auf dem Rand die Werte Null: v(x,y) = 0 für alle
(x,y) ∈ ∂G
Das Maximumprinzip sagt dann: v(x,y) = 0 überall in G ∪ ∂G, und dies bedeutet u(x,y) = u˜(x,y)
überall in G ∪ ∂G.
58
5 Anwendungsbeispiele für Fourierreihen
Veranschaulichung der Lösung eines Dirichletschen Randwertproblems Das folgende Bild zeigt die Lösung der Laplace-Gleichung auf der Einheitskreisscheibe zu vorgegebener Randfunktion U (φ) = cos(φ) + sin(2φ). Maxima und Minima der Lösung liegen auf dem Rand. Im Kreisinneren liegen keine lokalen Extrema, aber ein Sattelpunkt. Die Lösung stellt die stationäre Temperaturverteilung bzw. das elektrische Potential im Kreisinneren bei vorgegebener Randtemperatur bzw. gegebenem Randpotential U (φ) dar.
-1
0
1
5.4 Lösung für das Problem der schwingenden Saite Wir waren bei der Bearbeitung der Anfangsrandwertaufgabe für die homogene, kräftefrei schwingende Saite 2 ∂2u 2∂ u = c , ∂t2 ∂x2 u(0,t) = u(l,t) = 0,
u(x,0) = f (x), ∂u lim (x,t) = g(x), t→0+ ∂t
zu folgendem Lösungsansatz gelangt: u(x,t) =
∞ X
n=1
sin
cnπ cnπ nπ x an cos t + bn sin t . l l l
Bei gliedweiser Differentiation und Vertauschung von Grenzwertbildungen ist dann u(x,0) = ∂u (x,t) = t→0+ ∂t lim
∞ X
n=1 ∞ X
an sin
nπ x = f (x), l
nπ cnπ bn sin x = g(x). l l n=1
5.4 Lösung für das Problem der schwingenden Saite
59
Für hinreichend glatte Funktionen f und g ist daher die Lösung mit den Fourierkoeffizienten von f und g zu bestimmen. Die Funktionen f und g werden dabei als 2l-periodisch und ungerade fortgesetzt angenommen. Die Koeffizienten an , bn sind 2 an = l
ˆl 0
nπ f (x) sin x dx , l
2 bn = cnπ
ˆl
g(x) sin
0
nπ x dx . l
Damit hat sich eine Reihendarstellung für die Lösung ergeben. Zur Differenzierbarkeit der Lösung Zur Frage, welche Funktionen f und g „hinreichend glatt“ sind, gilt folgender Satz: Satz. Ist f zweimal stetig differenzierbar auf ganz R und f ′′′ stückweise stetig, g stetig differenzierbar auf R und g ′′ stückweise stetig, dann ist die Lösung u(x,t) zweimal stetig partiell differenzierbar; durch zweimalige gliedweise Differentiation nach x oder nach t entstehen gleichmäßig konvergente Reihen, die stetige Funktionen darstellen. Beweis. Nach Abschnitt 4.3 erhält man die Fourierkoeffizienten fn(3) von f ′′′ durch die ∞ nπ X dreimalige gliedweise Differentiation der Reihe f (x) = an sin x . Entsprechend l n=1 findet man die Fourierkoeffizienten gn(2) von g ′′ durch zweimalige gliedweise Ableitung der Reihe zu g. Mit den Koeffizienten an und bn besteht der Zusammenhang l3 (3) f , π 3 n3 n l3 bn = − 3 3 gn(2) . cπ n
an = −
Damit schreibt man u(x,t) in der Form u(x,t) = −
3 X ∞ cnπ 1 nπ cnπ 1 l (3) (2) f cos . sin x t + g sin t n π n3 l l c n l n=1
Mit der Bessel-Ungleichung zeigt sich dann aber, dass auch nach zweimaliger gliedweiser Differentiation nach x oder t gleichmäßig konvergente Reihen resultieren: ∞ ∞ (3) X |fn | 1X 1 (3) 2 < ∞, + |f | ≤ n n 2 n=1 n2 n=1 ∞ ∞ (2) X |gn | 1X 1 (2) 2 + |gn | < ∞. ≤ n 2 n=1 n2 n=1
60
5 Anwendungsbeispiele für Fourierreihen
Die D’Alembertsche Lösung für die schwingende Saite Man kann die Lösung auch noch etwas umformen. Setzt man nämlich an = An sin(φn ) und bn = An cos(φn ), so ergibt sich mit den Additionstheoremen – wieder für hinreichend glatte Funktionen f und g – die D’Alembertsche Darstellung der Lösung (Übungsaufgabe A7): ∞ nπ nπ X An cos (x − ct) − φn − cos (x + ct) + φn 2 l l n=1 x+ct ˆ 1 1 f (x − ct) + f (x + ct) + g(τ ) dτ = 2 c
u(x,t) =
x−ct
G. S. Ohm (1789-1854) folgerte als Anwendung der Reihendarstellungen für die Saitenschwingung erste Grundprinzipien der Akustik. Ohmsches Gesetz der Akustik. Im Klang der Saite sind der die Tonhöhe bestimmende Grundton (mit Frequenz c/(2l)) und die Obertöne je nach den Anfangsbedingungen mit p verschiedenen Amplituden An vertreten. Vom Verhältnis dieser Amplituden An= a2n + b2n hängt die Klangfarbe ab. Bemerkung. Einschwingvorgänge, die zum Erkennen eines Instrumentes nötig sind, und Phasen, die zur Lokalisierung der Klangquellen von akustischer Bedeutung sind, bleiben bei dieser Charakterisierung der Klangfarbe unberücksichtigt. Konkrete Beispiele zu Saitenschwingungen findet man in Lehrbüchern über Mechanik oder Akustik. Einige Anfangsrandwertaufgaben der besprochenen Art, und auch die Saitenschwingung unter dem Einfluss einer äußeren Kraft werden in den Übungsaufgaben behandelt. Eindeutigkeit der Lösung Eine Voraussetzung, die Musikern unter den Lesern erst gestattet, Fertigkeiten auf einem Saiteninstrument durch regelmäßige Übungen zu erlernen oder vielleicht sogar ein Vorspiel vor Zuhörern riskieren zu können, ist die Tatsache, dass eine Saite bei gleichen Randund Anfangsbedingungen auch immer wieder gleich klingt. Mathematisch bedeutet dies, dass die gefundene Lösung unserer Anfangsrandwertaufgabe eindeutig sein muss. Eine Standardmethode, mit der die Eindeutigkeit gezeigt wird, ist die Untersuchung des Energieintegrals. Die Energie einer zweimal stetig differenzierbaren Lösung u(x,t) ist zur Zeit t ≥ 0 mit der Spannung P , der Massendichte ̺ und Querschnittsfläche A der Saite für kleine Auslenkungen gegeben durch E(t) =
ˆl 0
2 2 1 ∂u ∂u 1 ̺A + PA dx . 2 ∂t 2 ∂x {z } | {z } | kinetische
potentielle Energiedichte
5.4 Lösung für das Problem der schwingenden Saite
61
Dann folgt durch Differentiation nach t unter dem Integral, bei Beachtung der Wellengleichung mit c2 = P/̺ und Anwendung von Ketten- und Produktregel beim Differenzieren 1 dE (t) = A dt
ˆl 0
=P
ˆl ∂u P ∂ 2 u ∂u ∂ 2 u ∂u ∂ 2 u ∂u ∂ 2 u ̺ ̺ dx = dx + P + P ∂t ∂t2 ∂x ∂x∂t ∂t ̺ ∂x2 ∂x ∂x∂t
ˆl 0
0
∂u ∂u ∂ ∂u ∂u dx = P ∂x ∂t ∂x ∂t ∂x | {z
x=l
= 0.
x=0
}
=0 wegen der Randbedingungen
Dies bedeutet, dass für die schwingende Saite der Energieerhaltungssatz gilt: E(t) ist konstant. Ist jetzt u ˜ eine zweite Lösung, so gelten für v = u − u ˜: 2 ∂2v 2∂ v = c , v(x,0) = 0, ∂t2 ∂x2
lim
t→0+
∂v (x,t) = 0, v(0,t) = v(l,t) = 0, ∂t
∂v (x,0) = 0; folglich ist E(0) = 0 und damit wegen der Energieerhaltung E(t) = 0 ∂x ∂v (x,t) = 0 für alle x und t, und schließlich für alle t; somit ist dann auch ∂x
also
v(x,t) = v(0,t) +
ˆx
∂v (τ,t) dτ = 0. ∂x
0
Das heißt aber gerade, dass die Lösung u eindeutig ist: u = u ˜. Das schöne Erlebnis, gut einstudierte Musik hören zu können, haben wir also dem Energieerhaltungssatz zu danken. Anschauliche Bedeutung der Lösung des Schwingungsproblems Für eine Anfangsgeschwindigkeit g ≡ 0 besteht die Lösung u(x,t) aus den beiden Wellen 1 1 f (x + ct) und f (x − ct), die sich ohne Änderung ihrer Form mit der Geschwindig2 2 keit c entgegengesetzt bewegen, überlagern, und an den Saitenenden mit entgegengesetzter Phase reflektiert werden. Der Einfluss einer Anfangsgeschwindigkeit g 6= 0 ist durch den x+ct ˆ 1 additiven Anteil g(τ ) dτ gegeben. 2c x−ct
Die Tonhöhe wird bestimmt durch die Grundfrequenz c/(2l) in der Fourierreihendarstellung der Lösung. Da c2 = P/̺ der Quotient aus Spannung P und Massendichte ̺ der Saite ist, erkennt man an der Reihenlösung sofort den Einfluss von Spannungs-, Massen- oder Längen- und Querschnittsänderungen auf die Frequenzen der schwingenden Saite. Jeder, der schon einmal ein Saiteninstrument manipuliert, vielleicht sogar gestimmt hat, kennt wohl diese Einflüsse aus seiner Erfahrung.
62
5 Anwendungsbeispiele für Fourierreihen
Wir veranschaulichen an zwei Beispielen die Lösungsfunktion u(x,t) für 0 ≤ x ≤ 1, 0 ≤ t ≤ 2, c = 1, mit konkreten Anfangsbedingungenf und g. −1/(1−x2 ) für −1 < x < 1, Im ersten Beispiel ist f (x) = h(4x − 2) mit h(x) = e 0 sonst. 2x für 0 ≤ x ≤ 1/4, Im zweiten Beispiel ist f (x) = 2(1 − x)/3 für 1/4 ≤ x ≤ 1.
In beiden Fällen wird g = 0 gesetzt. Im ersten Beispiel ist die Anfangsbedingung f beliebig oft differenzierbar, im zweiten Beispiel ist f und damit auch die Lösung u nicht differenzierbar (man vgl. hierzu Abschnitt 8.6).
2 0
2 0
t
t
x
x 1 0
1 0
5.5 Der Approximationssatz von Weierstraß In der Praxis mathematischer Modellbildungen für technische Probleme und auch in vielen mathematischen Beweisführungen benutzt man häufig das Verfahren, eine stetige Funktion f : [a,b] → C näherungsweise durch ein Polynom zu ersetzen. Eine Grundlage dafür ist der folgende Satz von K. Weierstraß (1815-1897). Satz von Weierstraß. Jede stetige Funktion f : [a,b] → C auf einem abgeschlossenen beschränkten Intervall [a,b] lässt sich gleichmäßig durch Polynome approximieren. Beweis. Die Funktion lässt sich zu einer stetigen 2(b − a)-periodischen Funktion f˜ fortsetzen, zu welcher es für jedes gegebene ε > 0 ein trigonometrisches Polynom Pn der Form 1 ε Pn = (S0 + S1 + . . . + Sn−1 ) gibt, so dass sup |f˜(t) − Pn (t)| ≤ ist (nach dem Satz n 2 t∈R von Fejér, S. 23). Dabei sind die Sk für k ∈ N0 die k-ten Partialsummen der Fourierreihenentwicklung von f˜. Zu jeder Partialsumme Sk gibt es ein Taylorpolynom Tk , so dass n−1 1X ε Tk , dass sup |Sk (t) − Tk (t)| ≤ gilt. Dann folgt sofort mit T = 2 n t∈[a,b] k=0
sup |f (t) − T (t)| ≤ sup |f (t) − Pn (t)| + sup |Pn (t) − T (t)| ≤ ε.
t∈[a,b]
t∈[a,b]
t∈[a,b]
5.6 Das 1/f -Theorem von Wiener
63
Bemerkung. Wir verzichten an dieser Stelle auf explizite Beispiele, weil die im Beweis angegebene Methode für die Suche nach Näherungspolynomen sehr aufwändig und umständlich ist. Häufig besitzen aber in der Praxis vorliegende Funktionen f außer der oben vorausgesetzten Stetigkeit zusätzliche Glattheitseigenschaften. Man kann dann mit weniger aufwendigen Methoden Polynome finden, welche die Funktion an bestimmten Stützstellen interpolieren und insgesamt auch gute Approximationseigenschaften zwischen den Stützstellen besitzen (vgl. S. 89). Der Satz von Weierstraß kann verschärft werden, wenn Glattheitseigenschaften der zu approximierenden Funktion f vorliegen (vgl. S. 118).
5.6 Das 1/f -Theorem von Wiener Thema dieses Abschnitts ist ein elementarer Beweis für das berühmte 1/f -Theorem von N. Wiener (1933). Dieses Theorem besagt, dass für eine Fourierreihe f , die keine Nullstelle hat und absolut-summierbare Koeffizienten besitzt, auch die reziproke Funktion 1/f absolut-summierbare Koeffizienten hat. Eine Anwendung bei der Rekonstruktion gefilterter diskreter Daten werden wir dann bei der Besprechung stabiler diskreter linearer Filter in Abschnitt 10.6 auf S. 315 kennenlernen. Der Beweis, dem wir folgen, stammt von D. J. Newman (1975). Andere Beweise mit Hilfe von Sätzen über maximale Ideale in normierten Algebren findet man in Lehrbüchern der Funktionalanalysis (vgl. etwa W. Rudin (1990)). +∞ X Für eine Fourierreihe f (t) = ck ejkt mit absolut-summierbaren Koeffizienten ist k=−∞
kf kA =
+∞ X
k=−∞
|ck |
eine Norm. Offensichtlich gilt kf k∞ = max |f (t)| ≤ kf kA . Für zwei solche Reihen f und g, die wir nun als stetige Funktionen auf [0,2π] betrachten, gelten die Ungleichungen kf + gkA ≤ kf kA + kgkA und kf · gkA ≤ kf kA · kgkA . Der Vektorraum A, den solche Fourierreihen bilden, ist mit dieser Norm eine normierte Algebra mit der Funktion f (t) = 1 auf [0,2π] als multiplikativ neutralem Element. Man kann zeigen, dass dieser Raum A vollständig ist, d.h. jede Cauchy-Folge in A konvergiert gegen eine Funktion aus A (siehe hierzu etwa W. Rudin (1990)). Die erste Ungleichung folgt sofort aus der entsprechenden Dreiecksungleichung für die Partialsummen, die zweite sieht man folgendermaßen: +N +N X X Sind fN (t) = ck ejkt und gN (t) = dk ejkt , dann folgt mit der Cauchyk=−N
k=−N
Schwarz-Ungleichung und der Parsevalgleichung von S. 48 die Konvergenz von fN gN gegen f g in der Norm k.k1 von L1 ([0,2π]) (wegen der Definition von k.k1 siehe S. 420):
64
5 Anwendungsbeispiele für Fourierreihen 1 2π
ˆ2π 0
|fN (t)gN (t) − f (t)g(t)| dt ≤ kfN − f k2 kgN k2 + kf k2 kgN − gk2 −→ 0. N →∞
+2N X
Die Fourierkoeffizienten hk (N ) von fN gN (t) =
hk (N ) ejkt sind (vgl. Übung A5,
k=−2N +N X
S. 45) hk (N ) =
n=−N
cn dk−n (mit dm = 0 für |m| > N ). Sie konvergieren für N → ∞
gegen die Fourierkoeffizienten hk von f g, denn aus der L1 -Konvergenz von fN gN folgt ˆ2π 1 −jkt (fN (t)gN (t) − f (t)g(t)) e dt ≤ kfN gN − f gk1 −→ 0. |hk (N ) − hk | = N →∞ 2π 0
Damit gilt hk =
+∞ X
cn dk−n , d.h. die Fourierkoeffizienten von f · g ergeben sich durch
+N X
|hk (N )| ≤
n=−∞
diskrete Faltung der Koeffizientenfolgen von f und g. Wir erhalten nun für jedes N ∈ N
k=−N
+N X
n=−N
|cn |
+N X
|dk | ≤ kf kA · kgkA
k=−N
und hieraus dann die Ungleichung kf · gkA ≤ kf kA · kgkA . Aufmerksame Leser seien hinsichtlich dieser letzten Abschätzung an die in der Analysis gezeigte absolute Konvergenz des Cauchy-Produkts von Potenzreihen erinnert, wo man ganz analog verfährt. Wir fahren mit einer weiteren nützlichen Ungleichung fort: Für 2π-periodische und 2-mal stetig differenzierbare Funktionen f und ihre Ableitungen f ′ gilt max |f (t)| ≤ kf kA ≤ max |f (t)| + 2 max |f ′ (t)|.
t∈[0,2π]
t∈[0,2π]
t∈[0,2π]
Die erste Ungleichung ist trivial. Für die zweite schätzen wir mit der Cauchy-SchwarzUngleichung ab (vgl. auch S. 29 und S. 41). Für f mit Fourierkoeffizienten ck ist
X
k∈Z,k6=0
2
|ck | ≤ ≤
X
k∈Z,k6=0 2
π 3
1 · k2
X
k∈Z,k6=0
π2 1 · k |ck | ≤ 3 2π 2
2
ˆ2π 0
|f ′ (t)|2 dt
max |f ′ (t)|2 ≤ 4 max |f ′ (t)|2 .
t∈[0,2π]
t∈[0,2π]
Mit c0 ≤ max |f (t)| folgt nun die zweite Ungleichung für kf kA . t∈[0,2π]
Das 1/f -Theorem von Wiener lautet nun: Für jede Fourierreihe f ∈ A , die keine Nullstelle besitzt, gehört auch 1/f zu A .
5.6 Das 1/f -Theorem von Wiener
65
Beweis. Gegeben sei ein f ∈ A ohne Nullstelle. Wir können annehmen, dass |f (t)| ≥ 1 für alle t ist. Dann gibt es eine Partialsumme P der Fourierreihe von f , die keine Nullstelle hat, so dass kP − f kA ≤ 1/3 ist. Wir bilden nun die geometrische Reihe S=
∞ X
n=1
sn =
∞ X (P − f )n−1 Pn n=1
und zeigen, dass S in A gegen 1/f konvergiert:
Es gilt |P (t) − f (t)| ≤ 1/3 für alle t, also nach der Dreiecksungleichung auch für alle t |P (t)| ≥ |f (t)| − |P (t) − f (t)| ≥
2 . 3
Daher haben wir für n ∈ N die Abschätzung n 1 ≤ 3 . max 2 t∈[0,2π] P n
Aus (1/P n )′ = −nP ′ /P n+1 folgt mit K = max |P ′ | n+1 1 ′ 3 max . ≤ nK t∈[0,2π] P n 2
Mit der vorbereitend gezeigten zweiten Ungleichung ergibt sich daraus
n
1
≤ (3nK + 1) 3
.
Pn 2 A
n−1 1 , Mit der Norm-Ungleichung gilt außerdem k(P − f ) kA ≤ kP − ≤ 3 so dass nun für die Summanden sn von S – wieder mit der Norm-Ungleichung in A – folgt
(P − f )n−1
≤ 9Kn + 3 . ksn kA =
n P 2n A n−1
Somit ist
∞ X
n=1
n−1 f kA
ksn kA < ∞, was man etwa mit dem Quotientenkriterium prüft. Also ist die
Reihe S in der Norm von A und wegen ksn k∞ ≤ ksn kA auch gleichmäßig konvergent (Majorantenkriterium, S. 16). Mit k(P − f )/P knA → 0 für n → ∞ folgt nun für die geometrische Reihe n−1 ∞ 1 1 X P −f = . S= P n=1 P f
Um abschließend die absolute Summierbarkeit der Fourierkoeffizienten von 1/f zu zeigen, notieren wir die k-ten solchen Koeffizienten von 1/f durch ck (1/f ) und diejenigen von sn = (P − f )n−1 /P n analog durch ck (sn ).
66
5 Anwendungsbeispiele für Fourierreihen
Die Fourierkoeffizienten von S können durch gliedweise Integration berechnet werden, weil die Reihe gleichmäßig konvergiert. Wir erhalten mit sn ∈ A und Vertauschung der Summationsreihenfolge in der folgenden absolut-konvergenten Doppelreihe:
+∞ +∞ X ∞ +∞ X ∞ X X X
1
= |c (1/f )| = c (s ) ≤ |ck (sn )| k k n
f A n=1 n=1 k=−∞
=
k=−∞
∞ X +∞ X
n=1 k=−∞
k=−∞
∞ X
∞ X 9Kn + 3 < ∞, |ck (sn )| = ksn kA ≤ 2n n=1 n=1
und damit ist die Aussage des 1/f -Theorems bewiesen. Bemerkung. Das 1/f -Theorem gilt auch für Fourierreihen mehrerer Variablen. Man siehe hierzu die oben schon zitierte Quelle W. Rudin (1990). Ein analoges Resultat des gezeigten Typs für sogenannte Dirichlet-Reihen findet man bei A. Goodman, D. J. Newman (1984).
5.7 Einführung in die diskrete Fouriertransformation Die Aufgabe der Approximation von Signalen f : [0,T ] → C endlicher Zeitdauer T durch Superposition harmonischer Schwingungen wird gelöst durch Fourierreihenentwicklung von f . In der Praxis der Signalverarbeitung oder auch der numerischen Integration liegt jedoch häufig nicht das kontinuierliche Signal f (t), t ∈ [0,T ] vor, sondern nur Werte f (tn ) zu gewissen äquidistanten Abtastzeiten tn = n∆t. Hieraus soll dann ein trigonometrisches Polynom bestimmt werden, mit dem sich Näherungswerte f (t) auch für Zeiten t 6= tn und Näherungen für die Spektralwerte ck des Signals berechnen lassen. Endliche diskrete Fouriertransformation (DFT) Wir nehmen an, dass f : [0,T [→ C stetig und stückweise stetig differenzierbar ist. f besitze für t → T den Grenzwert f (T −). Von der Funktion f sei auf [0,T [ ein Wertevektor ~y = (y0 ,y1 , . . . , yN −1 ), yn = f (n∆t) bekannt mit ∆t > 0, n = 0, 1, . . . , N − 1 und T = N ∆t. Das Signal f hat eine stückweise stetig differenzierbare T -periodische Fortsetzung fp , welcher dann die Wertefolge (yn )n∈Z = (. . . ,y−2 ,y−1 ,y0 ,y1 , . . . ,yN −1 ,yN , . . .) entspricht. Diese Folge ist N -periodisch, d.h. yn+mN = yn , m ∈ Z, n = 0, 1, . . . , N − 1. Als Näherung b ck für den k-ten Fourierkoeffizienten ck von fp 1 ck = T
ˆT 0
fp (t) e−jkω0 t dt
(k ∈ Z, ω0 = 2π/T )
wählt man mit den als Information verfügbaren Abtastwerten die Riemann-Summe
5.7 Einführung in die diskrete Fouriertransformation
ck = b
67
N −1 N −1 1 X 1 X f (n∆t) e−jknω0 ∆t ∆t = yn e−jkn2π/N . T n=0 N n=0
Bei der Verwendung dieser Näherungen b ck für die Spektralwerte ck sind folgende Gesichtspunkte zu beachten: 1. Aus der Periodizität der komplexen Exponentialfunktion folgt
da für m ∈ Z gilt: e
ck = b b cl
−jkn2π/N
für alle l = k + mN, m ∈ Z,
= e−j(k+mN )n2π/N .
Die entstehende Folge (b ck )k∈Z ist also N -periodisch. Andererseits gilt aber für die Fourierkoeffizienten ck von fp , dass lim ck = 0 ist (vgl. Abschnitt 4.5). Man kann |k|→∞
daher höchstens einen Abschnitt der Länge N dieser Folge für Näherungen von N Spektralwerten der Funktion fp verwenden. Für die DFT-Koeffizienten b ck reellwertiger Funktionen f gilt b ck = b cN −k , 1 ≤ k ≤ N/2, d.h. bei geradem N ist b cN/2 reell. +∞ X
+∞ X
fp (0) + fp (T −) 2 l=−∞ l=−∞ erhält man für k ∈ Z durch gliedweise Addition der konvergenten Reihen ! N −1 X +∞ X 1 jln2π/N −jkn2π/N e ck = b fp (0) + cl e N n=1
2. Mit fp (n∆t) = f (n∆t) =
cl ejln2π/N für n 6= 0 und
cl =
l=−∞
=
+∞ X
l=−∞
cl
1 N
N −1 X n=0
e−j(k−l)n2π/N −
Für die endliche geometrische Reihe
+∞ 1 X fp (0) . cl + N N l=−∞
N −1 1 X −j(k−l)n2π/N e gilt N n=0
N −1 1 X −j(k−l)n2π/N 1 e = 0 N n=0
für l = k + mN, m ∈ Z, für l 6= k + mN, m ∈ Z.
Das Ergebnis bezeichnen wir als Alias-Formel: b ck =
+∞ X
ck+mN +
m=−∞
Der Wert der Reihe ist dabei aufzufassen als
fp (0) − fp (T −) . 2N +∞ X
m=−∞
ck+mN = lim
M→∞
+M X
ck+mN .
m=−M
Der Koeffizient b ck enthält die Summe aller exakten Fourierkoeffizienten ck+mN von fp , m ∈ Z. Die zugehörigen harmonischen Schwingungen ej(k+mN )ω0 t mit Kreisfrequenzen (k + mN )ω0 können anhand der Abtastwerte f (nT /N ) nicht unterschieden werden, weil alle Funktionen ej(k+mN )ω0 t an allen Stellen nT /N übereinstimmen: ejkn2π/N = ej(k+mN )n2π/N
für alle m ∈ Z und alle n = 0,1, . . . ,N − 1.
68
5 Anwendungsbeispiele für Fourierreihen
Man nennt diese Tatsache den „Alias-Effekt“. Die komplexen Amplituden aller Schwingungen der Kreisfrequenzen (k + mN ) ω0 , m ∈ Z beliebig, sind in b ck in Summe vertreten. Hat fp bei t = T eine Sprungstelle, so kommt der Term (fp (0) − fp (T −))/(2N ) bei allen DFT-Koeffizienten additiv als ein „Lattenzaun-Effekt“ hinzu. Der „Lattenzaun-Term“ entfällt, wenn man den Wert f (0) auf den Mittelwert (fp (0+) + fp (T −))/2 abändert. Am folgenden Bild ist zu erkennen, dass etwa die Schwingungen f1 (t) = sin(8πt) und f2 (t) = sin(28πt) mit 4 Hz bzw. 14 Hz anhand von beispielsweise 10 Abtastwerten an den Stellen tk = k/10, k = 0, . . . ,9, nicht zu unterscheiden sind. f1 (t) f2 (t)
1 0 −1 0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
Alias-Effekt und Zuordnung der DFT-Koeffizienten zu Frequenzen Man erkennt, dass die Bandbreite eines Ausschnitts des Spektrums von fp , welcher durch die DFT-Koeffizienten ohne Alias-Verfälschungen repräsentiert werden kann, mit N und T festgelegt ist, nicht aber die Lage eines solchen spektralen Ausschnitts. Diese ist aus a-priori-Wissen oder willentlich zu bestimmen. Dies hat Nachteile bei der Beobachtung unbekannter Signale, aber auch enorme Vorteile für die Signalverarbeitung in technischen Systemen wie zum Beispiel in der Nachrichtentechnik. Denn dort können ja die Signale und die Lage von Signalfrequenzen im Spektrum selbst gewählt werden. Wir gehen nachfolgend davon aus, dass eine DFT mit N Werten und Abtastfrequenz N/T aus der Abtastung einer T -periodisch zu fp fortgesetzten Funktion f wie zu Beginn des Abschnitts vorliegt. Mit ω0 = 2π/T gilt dann folgender Satz für die DFT-Koeffienten b ck , dessen Aussagen unmittelbar aus der Alias-Beziehung folgen:
Satz. 1. Zu jedem m ∈ N0 und jedem k , 1 ≤ k < N/2 , gibt es genau eine Schwingung mN (m + 1)N cl ejlω0 t aus der zu fp gehörigen Fourierreihe mit 0 Translationen, Amplitudenmodulation f (t + t0 ) =
+∞ X
ck k=−∞ +∞ X
ejmω0 t f (t) =
ejkω0 (t+t0 ) ck−m ejkω0 t
(yn+m )n∈Z , (m ∈ Z)
(z km b ck )k∈Z , z = ej2π/N
(z nm yn )n∈Z
(b ck−m )k∈Z
N -periodische Faltung
mit Fourierkoeffizienten
k=−∞
T -periodische Faltung Für f (t) = g(t) =
+∞ X k=−∞ +∞ X
ck ejkω0 t
Für yn = f (nT /N )
dk ejkω0 t :
k=−∞ +∞ X
(f ∗ g)T (t) =
(b ck )k∈Z bzw. (dbk )k∈Z :
xn = g(nT /N ) :
ck dk ejkω0 t
(y ∗ x)n∈Z =
k=−∞
N−1 1 X xm yn−m N m=0
(b ck dbk )k∈Z
Parsevalgleichung ||f ||2 =
+∞ X
N−1 N−1 X 1 X |b ck |2 |yn |2 = N n=0 k=0
|ck |2
k=−∞
Trigonometrische Interpolation Gegeben sei ein Wertevektor (y0 ,y1 , . . . ,yN −1 ) einer stetigen Funktion f auf [0,T ], T > 0 yn = f (n∆t), N ∆t = T. Gesucht wird ein trigonometrisches Polynom P (t) =
m X
αk ejkω0 t , ω0 = 2π/T , mit
k=−m
einem Grad von höchstens m ≤ N/2, so dass P (n∆t) = f (n∆t) an den äquidistanten Abtaststellen n∆t für n = 0, . . . ,N − 1 gilt. Hierzu sind 2m + 1 Koeffizienten zu berechnen.
5.7 Einführung in die diskrete Fouriertransformation
77
Trigonometrische Interpolation mit einer ungeraden Anzahl von Stützstellen Ist die Anzahl N der Interpolationsstellen ungerade, N = 2m + 1, dann ist das gesuchte trigonometrische Interpolationspolynom eindeutig bestimmt. Weil nämlich ein trigonometrisches Polynom P (t) 6= 0 vom Grad m höchstens 2m Nullstellen pro Periode besitzt (vgl. S. 10), sind je zwei solche Polynome, die an 2m + 1 Stellen pro Periode übereinstimmen, schon identisch. N −1 X Nach Konstruktion der DFT und der IDFT ist Q(t) = b ck ejkω0 t mit den DFTk=0
Koeffizienten b ck von (y0 , . . . ,yN −1 ) ein trigonometrisches Interpolationspolynom. Da die Funktionen ejkω0 t und ej(k+N )ω0 t für k ∈ Z an allen Stützstellen n∆t übereinstimmen und die Folge (b ck )k∈Z N -periodisch ist, folgt sofort X m −1 m 2m X X X 2π 2π 2π 2π T b ck ejkn N + b ck+N ej(k+N )n N = cbk ejkn N . = ck ejkn N = b Q n N k=0
k=0
k=−m
k=−m
Satz. Das eindeutig bestimmte trigonometrische Interpolationspolynom P mit einem Grad von höchstens m = (N − 1)/2 ergibt sich durch die DFT der Wertefolge (y0 , . . . ,yN −1 ) mit ω0 = 2π/T m X P (t) = ck ejkω0 t b (N = 2m + 1). k=−m
Wie in Abschnitt 2.1 folgt die trigonometrische Form für P mit den Werten P (n∆t) = yn für n = 0, . . . ,N − 1: m
P (t) =
b a0 X + (b ak cos(kω0 t) + bbk sin(kω0 t)), 2 k=1
b ak = b ck + b c−k =
N −1 2 X 2π , yn cos nk N n=0 N
N −1 2 X 2π bbk = j(b ck −b c−k ) = . yn sin nk N n=1 N
Sind die Stützwerte reell, dann ist auch P (t) eine reellwertige Funktion. Insbesondere gilt P = f , wenn f ein T -periodisches trigonometrisches Polynom vom Grad höchstens m ist. Trigonometrische Interpolation mit einer geraden Anzahl von Stützstellen Ist N = 2m gerade, so ist das Interpolationsproblem nicht eindeutig lösbar, das trigom X nometrische Polynom P (t) = αk ejkω0 t hat N + 1 Koeffizienten. Die DFT von k=−m
(y0 ,y1 , . . . yN −1 ) liefert N Koeffizienten (b c0 , . . . ,b cm−1 ,b cm , . . . ,b cN −1 ). Ordnet man dem Koeffizienten b cm = b cN/2 die Schwingung e−jmω0 t zu und setzt αm = 0, insgesamt also
78
5 Anwendungsbeispiele für Fourierreihen (α−m , . . . ,α0 , . . . ,αm ) = (b cm , . . . ,b cN −1 ,b c0 , . . . ,b cm−1 ,0),
dann ergibt sich das trigonometrische Interpolationspolynom P1 (t) =
m−1 X
k=−m
ck ejkω0 t . b
P1 (t) ist aber im Allgemeinen nicht reellwertig. Man kann jedoch als „Alias“ auch die Zuordnung 1 1 cm , . . . ,b b cN −1 ,b c0 , . . . ,b cm−1 , b cm (α−m , . . . ,α0 , . . . ,αm ) = 2 2 wählen und erhält als trigonometrisches Interpolationspolynom mit b cm = P2 (t) =
m−1 X
k=−m+1
N −1 X
yn (−1)n /N
n=0
b ck ejkω0 t +b cm cos(mω0 t).
Bei reellen Abtastwerten yn ist dann P2 ebenfalls reellwertig. Wir bezeichnen nun mit Vm den Vektorraum, der von den Funktionen cos(kω0 t), sin(kω0 t) für k = 1, . . . ,m − 1, der konstanten Eins und der Funktion cos(mω0 t) erzeugt wird. Damit können wir folgenden Satz formulieren: Satz. Für eine gerade Anzahl N = 2m von Stützstellen tn = nT /N (n = 0, . . . ,N − 1) und Werte yn = f (tn ) einer reellwertigen Funktion f auf [0,T ] ist b cm reell, und mit b ak , bbk wie oben, ω0 = 2π/T ist P2 (t) =
m−1 X b a0 b am + (b ak cos(kω0 t) + bbk sin(kω0 t)) + cos(mω0 t) mit P2 (tn ) = f (tn ) 2 2 k=1
das eindeutig bestimmte reellwertige trigonometrische Interpolationspolynom im Vektorraum Vm . Lässt sich f zu einer T -periodischen geraden Funktion fortsetzen, dann sind alle Koeffizienten bbk = 0. Ist eine ungerade T-periodische Fortsetzung möglich, dann sind alle b ak = 0.
Beweis. Für die Fourierkoeffizienten pk einer Funktion P aus Vm mit den Abtastwerten y0 , . . . ,y2m−1 von P2 gilt mit den zugehörigen DFT-Koeffizienten b ck und P (0) = P (T −) (vgl. S. 67) ck = b
+∞ X
n=−∞
pk+2nm für k = −m + 1, . . . ,m.
5.7 Einführung in die diskrete Fouriertransformation
79
Da für P aus Vm aber pn = 0 für |n| > m und pm = p−m reell sind, folgt pk = b ck für |k| ≤ m − 1 und pm = b cm /2 = p−m . Mit den gleichen Fourierkoeffizienten stimmen daher P und P2 überein. Liegt eine gerade Symmetrie vor, dann gilt yn = y2m−n und damit b ck = b c2m−k = b c−k . Dann sind alle bbk = j(b ck − b c−k ) = 0 und P2 ist gerade. Bei ungerader Symmetrie gilt entsprechend yn = −y2m−n , b ck = −b c−k , alle b ak sind Null und P2 ist ungerade. Beispiel. Für N = 4, tn = nπ/2, T = 2π und die Abtastwerte y0 = 1, y1 = 2, y2 = 1 und y3 = 3 rechnet man P2 wie oben aus und erhält P2 (t) =
7 1 3 − sin(t) − cos(2t). 4 2 4
Auch P (t) = P2 (t) + α sin(2t) mit beliebigem reellen α ist ein trigonometrisches Interpolationspolynom vom Grad 2, da sin(2tn ) stets Null ergibt. Ein solche Funktion P gehört für α 6= 0 aber nicht zu V2 . Die angegebenen Interpolationen P1 und P2 sind trigonometrische Polynome im Basisband zu einer DFT. Für Bandpass-Signale f lassen sich – entsprechend den Ausführungen ab S. 68 – mit Hilfe einer DFT und Unterabtastung auch trigonometrische Interpolationspolynome im zugehörigen Passband angeben. Insbesondere sind trigonometrische Polynome in einem Passband mit einer DFT exakt rekonstruierbar. Die Formulierung dafür sei den Lesern überlassen. Die diskrete Cosinus-Transformation DCT I Die Interpolationsformel bietet Anlass, für reellwertige Funktionen auch eine reellwertige diskrete Fouriertransfomation einzuführen, die in der Literatur als diskrete CosinusTransformation vom Typ I oder kurz als DCT I bezeichnet wird. Dazu gehen wir von einer stetigen reellwertigen Funktion f auf [0,T ] aus, die wir zu einer geraden 2T -periodischen Funktion fortgesetzt denken, und betrachten Abtastwerte yn mit der Symmetrie yn = y−n . Mit N = 2m Abtastwerten yn = f (nT /m) für n = −m + 1, . . . ,m erhalten wir für die DFT-Koeffizienten b ck und 0 ≤ k ≤ 2m − 1 aufgrund der Symmetrie yn = yn−2m = f (nT /m − 2T ) und der Alias-Beziehung e−jπkn/m = e−jπk(n−2m)/m ! m−1 m X X ym 1 1 y0 πkn −jπkn/m + + yn cos cos(kπ) . ck = b yn e = 2m n=−m+1 m 2 m 2 n=1
Da außerdem wegen der Symmetrievoraussetzung auch b ck = b c−k = b c2m−k gilt, genügt es, die Koeffizienten für k = 0, . . . ,m aus den Abtastwerten y0 , . . . ,ym zu berechnen. Man definiert die DCT I der yk für k = 0, . . . ,m durch b ck wie oben. Diese Transformation ist wie die DFT aufgrund der Interpolationseigenschaft des trigonometrischen Polynoms P2 von oben umkehrbar und die Umkehrtransformation ist wegen yn = P2 (nT /m) mit ω0 = π/T daran unmittelbar ablesbar. Wir setzen b ak = b ck + b c−k = 2b ck und erhalten so die diskrete Cosinus-Transformation DCT I und ihre Umkehrung:
80 DCT I:
IDCT I:
5 Anwendungsbeispiele für Fourierreihen ! m−1 X ym y0 πkn + + yn cos cos(kπ) 2 m 2 n=1
2 b ak = m
m−1 X b am πkn b a0 + b ak cos + cos(nπ). yn = 2 m 2
(k = 0, . . . ,m)
(n = 0, . . . ,m)
k=1
Wir betrachten noch eine weitere Möglichkeit der Interpolation mit einem im Vergleich verschobenen Gitter von Stützstellen. Dieser Fall ergibt die als DCT II bezeichnete Variante, die in Anwendungen der DFT besonders weit verbreitet ist. Ein Grund dafür ist die Optimalitätsaussage Nr. 4 des später folgenden Satzes auf Seite 89. Verschobene Stützstellen, die diskrete Cosinus-Transformation DCT II Wir gehen wie zuletzt von einer stetigen reellwertigen geraden 2T -periodischen Funktion f aus. Für die Stützstellen wählen wir jetzt jedoch das verschobene Gitter 2n + 1 T für 0 ≤ n ≤ 2m − 1, m ∈ N. 2m Wir setzen yn = f (tn ) und erhalten aufgrund der Symmetrie von f für n = 0, . . . ,m − 1 tn =
yn = f (tn ) = f (2T − tn ) = f (t2m−1−n ) = y2m−1−n . Um das vorherige Ergebnis zu verwenden, definieren wir die Funktion g auf [0,2T ] durch g(t) = f (t + T /(2m)). Die Funktion g ist im Allgemeinen nicht mehr gerade, jedoch gilt gn = g(nT /m) = f (nT /m + T /(2m)) = yn . Nun interpolieren wir wie vorher diese Funktion g auf dem Intervall [0,2T ] mit P2 wie oben, wobei dort ω0 = π/T zu setzen ist. Die DFT-Koeffizienten b ck für k = −m + 1, . . . ,m zu den Stützstellen gn = yn sind b ck =
2m−1 2m−1 1 X 1 X gn e−jπkn/m = yn e−jπkn/m . 2m n=0 2m n=0
Mit e−jπkn/m = ejπk/(2m) e−jπk(2n+1)/(2m) und e−jπk(2M+1)/(2m) = e+jπk(2n+1)/(2m) für M = 2m − 1 − n folgt aus der Symmetrie yn = y2m−1−n m−1 X πk(2n + 1) jπk/(2m) 1 . yn cos b ck = e m n=0 2m
Dabei ist b cm = 0, da die cos-Terme in der Summe für k = m stets Null sind. Für die Funktion f (t) = g(t − T /(2m)) erhält man (vgl. S. 35) mit ω0 = π/T das entsprechende reellwertige trigonometrische Interpolationspolynom P3 aus der Formel von P2 auf S. 78: P3 (t ) =
m−1 X
k=−m+1
b ak =
2 m
m−1 X n=0
ck e−jπk/(2m) ejkω0 t = b
yn cos
πk(2n + 1) 2m
m−1 X b a0 b ak cos(kω0 t) + 2 k=1
für k = 0, . . . ,m − 1.
5.7 Einführung in die diskrete Fouriertransformation
81
Wie vorher ist die Abbildung (y0 ,y1 , . . . ,ym−1 ) −→ (b a0 ,b a1 , . . . ,b am−1 ) umkehrbar und die Umkehrabbildung ist direkt aus der Interpolationsformel ablesbar. Diese Abbildung wird als DCT II bezeichnet, ihre Inverse entsprechend als IDCT II. Wir notieren die DCT II und die IDCT II mit m Abtastwerten yn = f ((2n+1)T /(2m)), n = 0, . . . ,m − 1 durch m−1 2 X πk(2n + 1) DCT II: b ak = (k = 0, . . . ,m − 1) yn cos m n=0 2m IDCT II:
m−1 X b a0 πk(2n + 1) yn = + b ak cos 2 2m k=1
(n = 0, . . . ,m − 1)
Bei gleicher Anzahl von Abtastwerten y0 , . . . ,ym lassen sich also gerade 2T -periodische trigonometrische Polynome f bis zum Grad m mit der DCT I oder mit der DCT II und den zugehörigen trigonometrischen Interpolationspolynomen P2 und P3 mit ω0 = π/T exakt darstellen. Für P2 und die DCT I sind dabei die Werte yn = f (nT /m), für die DCT II entsprechend die Werte yn = f ((2n + 1)T /(2m + 2)) mit n = 0, . . . ,m zu verwenden. In den obigen Formeln der DCT II und P3 ist dann also m durch m + 1 zu ersetzen. Bemerkungen. a) Der Koeffizient b a0 /2 ist der Gleichanteil (dc-Wert bei einem Spannungsverlauf f ). In der Literatur und in Software-Implementierungen der DFT und der DCT-Varianten (wie zum Beispiel in Matlab, Mathematica oder Maple) sind unterschiedliche Normierungsfaktoren in Gebrauch. Auch beginnt dort die Indizierung oft mit Eins statt mit Null. Bei Anwendungen ist auf solche Unterschiede der Darstellung zu achten. b) Wie wir schon gesehen hatten, hängt das Abfallverhalten der Spektralwerte |ck | einer stetigen periodischen Funktion f für wachsende |k| von Glattheitseigenschaften von f ab. +∞ X Davon ausgehend ergeben sich mit der Beziehung b ck = ck+lN auch Abschätzungen l=−∞
für die Approximationsfehler der trigonometrischen Interpolationen und für das Abfallen der DFT-Koeffizienten in Abhängigkeit von der Anzahl N der Abtastwerte. Man findet solche Abschätzungen etwa in den empfehlenswerten Lehrbüchern von M. Hanke-Bourgeois (2008), W. L. Briggs, Van Emden Henson (1995) oder D. Kincaid, W. Cheney (2002).
Numerische Integration nach Clenshaw-Curtis Ein erste Anwendung der diskreten Cosinus-Transformation, die hier gezeigt werden soll, ist die numerische Integration einer Funktion auf einem beschränkten Intervall. Gegeben sei wie zuletzt eine stetige 2T -periodische reellwertige gerade Funktion f . Der k-te Koeffizient b ak der DCT I mit den Abtastwerten yn = f (nT /m), m ∈ N, n = 0, . . . ,m ist eine ˆT 2 f (t) cos(kπt/T ) dt mit der Trapezregel. Näherung für das Integral T 0
Falls f zu dem oben eingeführten Vektorraum Vm gehört, ergibt diese Quadratur mit der Trapezregel nach dem Interpolationssatz von S. 78 die exakten Fourierkoeffizienten von f .
82
5 Anwendungsbeispiele für Fourierreihen
Gesucht sei nun eine Näherung für das Integral I=
ˆb
g(t) dt
a
einer Funktion g, von der wir annehmen wollen, dass sie auf [a,b] stetig und stückweise a+b b−a x+ des Intervalls stetig differenzierbar ist. Mit der Transformation u(x) = 2 2 ′ [−1,1] auf das Integrationsintervall [a,b] und der Definition f (x) = g(u(x))u (x) gilt ˆ+1 I = f (x) dx . −1
Erneute Substitution durch x = cos(ϕ), ϕ ∈ [0,π] ergibt mit der Bezeichnung I = I(f ) I(f ) =
ˆπ
f (cos(ϕ)) sin(ϕ) dϕ .
0
Die Funktion f (cos(ϕ)) lässt sich zu einer stetigen geraden 2π-periodischen Funktion fortsetzen, die durch ihre Fourierreihe dargestellt wird. Wir erhalten aus der Fourierreihe f (cos(ϕ)) =
∞
a0 X + ak cos(kϕ) 2 k=1
daher durch gliedweise Integration (vgl. S. 38) eine Darstellung des Integrals als Reihe I(f ) = a0 +
∞ X
k=1
ak
ˆπ
cos(kϕ) sin(ϕ) dϕ = a0 +
∞ X
k=1
0
I(f ) = a0 +
∞ X
k=1
ak
(−1)k + 1 , 1 − k2
2a2k . 1 − (2k)2
Bei der Quadratur nach C.W. Clenshaw, A.R. Curtis (1960) approximiert man die Funktion f (cos(ϕ)) in [0,2π] durch das gerade trigonometrische Interpolationspolynom N −1 X b a0 b aN P (ϕ) = b ak cos(kϕ) + + cos(N ϕ) 2 2 k=1
mit den 2N Abtastwerten P (nπ/N ) = f (cos(nπ/N )) für n = 0, . . . ,2N − 1. Es ist nach dem Satz von S. 78 eindeutig bestimmt. Setzen wir außerdem voraus, dass N = 2m ˆπ gerade ist, dann ergibt sich als entsprechende Näherung SN (f ) = P (ϕ) sin(ϕ) dϕ für das gesuchte Integral I(f )
0
5.7 Einführung in die diskrete Fouriertransformation
SN (f ) = b a0 +
m−1 X k=1
83
2b a2k b a2m + . 2 1 − 4k 1 − 4m2
Die Näherungen b ak für die Fourierkoeffizienten nπ ak von f (cos(ϕ)) werden nun mit den N + 1 = 2m + 1 Abtastwerten f cos für 0 ≤ n, k ≤ N = 2m nach der TrapezN regel mit der DCT I berechnet, also ! N −1 f (−1) f (1) X nπ πkn 2 k cos + + f cos (−1) . b ak = 2m 2 N N 2 n=1
(N − n)π Die gesuchten Koeffizienten b a2k erhält man daraus mit cos N schon aus einer DCT I mit m + 1 Summanden. Für 0 ≤ n,k ≤ m und nπ nπ yn = f cos + f − cos N N ergibt sich
b a2k
1 = m
m−1 X ym y0 πkn + + yn cos (−1)k 2 m 2 n=1
!
= − cos
nπ N
.
Für Anwendungen schreibt man die erhaltene Quadraturregel mit xn = cos(nπ/N ) meist in der Form m X SN (f ) = wn (f (xn ) + f (−xn )) = w ~ T ~y. n=0
Mit vorab berechneten Gewichten wn lassen sich dann schnell verschiedene Funktionen f durch Einsetzen ihrer Abtastwerte an den Knoten ±xn numerisch integrieren. Um die Gewichte anzugeben, notieren wir die Quadraturformel in vektorieller Schreibweise mit der zur DCT I gehörigen Matrix D wie folgt: D = (dkn )0≤k,n≤m ist die DCT I-Matrix mit Zeilenindex k, Spaltenindex n 1 πnk für n = 0, n = m 2m cos m dkn = 1 πnk sonst. cos m m
Mit dem Spaltenvektor der benötigten Abtastwerte ~y = (y0 , . . . ,ym )T , w ~ = (w0 , . . . ,wm )T , T mit ~a = (b a0 ,b a2 ,b a4 , . . . ,b a2m ) – T steht wie üblich für die Transposition – und dem Spaltenvektor ~b = (βk /(1 − 4k 2 ))0≤k≤m , β0 = βm = 1, βk = 2 sonst, erhalten wir SN (f ) = ~b T ~a = ~b T (D~ y ) = (DT ~b)T ~y = w ~ T ~y, also w ~ = DT ~b.
84
5 Anwendungsbeispiele für Fourierreihen
Auch DT ~b kann man als DCT I mit nur leicht veränderten Normierungsfaktoren auffassen. Die Gewichte wn sind sämtlich positiv und ihre Summe ist Eins. Um dies zu sehen, betrachten wir für n = 0, . . . ,m mit α0 = 2m = αm , αn = m sonst ! m−1 X 1 πnk 2 + cos cos(πn) = 1 − s. αn wn = 1 − 4k 2 − 1 m 4m2 − 1 k=1
Man schätzt die Summe s in der Klammer ab |s| ≤
m−1 X k=1
2 1 2m + =1− < 1. 4k 2 − 1 4m2 − 1 4m2 − 1
1 1 2 = − (Übung). −1 2k − 1 2k + 1 Damit folgt die Positivität der Gewichte wn . Mit der konstanten Funktion f = 1 ergibt sich aus I(f ) = SN (f ), dass ihre Summe Eins ist. Als Alternative zur Näherung der Fourierkoeffizienten durch eine DCT I könnte man auch eine DCT II mit den weiter oben betrachteten verschobenen Abtaststellen verwenden. Eine solche Quadratur wurde bereits von L. Fejér (1933) angegeben. Aus dem Interpolationssatz von S. 78 geht hervor, dass die Clenshaw-Curtis-Quadratur mit den angegebenen N + 1 Stützstellen für trigonometrische Polynome f (cos(ϕ)) und damit nach bekannten Additionstheoremen für trigonometrische Funktionen auch für Polynome f bis zum Grad N exakt ist. Gleiches gilt bei Quadratur nach Fejér mit oben bei der DCT II angegebenen ebenfalls N + 1 Stützstellen. Fehlerabschätzungen kann man aus der bekannten Abschätzung für die Trapezregel gewinnen, nach der ja die DCT I integriert. Auf Literaturquellen mit solchen Abschätzungen war oben schon verwiesen. Konvergenz der Näherungen SN (f ) gegen I(f ) für N → ∞ folgt aus der Konvergenz der Fourierreihe von f (cos(ϕ)). An der Alias-Beziehung b ck = +∞ X ck+2N n zwischen den Fourierkoffizienten ck der periodischen Funktion f (cos(ϕ)) Die letzte Gleichung erhält man dabei schnell aus
4k 2
n=−∞
und ihren DFT-Koeffizienten b ck erkennen wir, dass das Verfahren umso besser konvergiert, je glatter der Integrand ist, je schneller also die Spektralwerte der Funktion für wachsende Frequenzen verschwinden.
Bemerkenswert ist, dass das Clenshaw-Curtis-Verfahren ein sogenanntes universelles Quadraturverfahren ist, d.h. die Maximalfehler von SN (f ) sind für beliebige k ∈ N und alle k-mal stetig differenzierbaren Funktionen f für N ≥ k − 1 von der Ordnung N −k . Um diese Aussage zu erläutern, bezeichnen wir im Folgenden mit F k die Menge F k = { f ∈ C k ([−1,1]) : ||f (k) ||∞ ≤ 1 }. Dabei bedeutet ||f (k) ||∞ die Supremumsnorm der k-ten Ableitung von f , C k ([−1,1]) den Vektorraum der k-mal stetig differenzierbaren reellwertigen Funktionen auf [−1,1]. Mit PN bezeichnen wir die Menge aller Polynome vom Grad ≤ N . Die obige Aussage über SN (f ) folgt dann mit einem Satz von D. Jackson (1912) aus der Approximationstheorie:
5.7 Einführung in die diskrete Fouriertransformation
85
Satz von Jackson. Für jedes k ∈ N existiert eine Konstante αk , so dass für alle N ∈ N mit N ≥ k − 1 und alle f ∈ C k ([−1,1]) gilt: EN (f ) = inf ||f − P ||∞ ≤ αk N −k ||f (k) ||∞ . P ∈PN
Einen Beweis mit einer schärferen Abschätzung findet man etwa bei T. J. Rivlin (2010). Satz. Für die Maximalfehler der Clenshaw-Curtis-Quadratur SN (f ) auf den Mengen F k gilt bei beliebigem k ∈ N mit einer Konstante γk , die nur von k abhängt, und für alle N = 2m ≥ k − 1 sup{ |I(f ) − SN (f )| : f ∈ F k } ≤ γk N −k .
Beweis. Wir betrachten wie zuletzt die Quadraturformel m X SN (f )= wn (f (xn ) + f (−xn )) n=0
mit den Knoten xn = cos(nπ/N ) für eine Funktion f auf [−1,1] mit N = 2m, m ∈ N. Da die Gewichte w0 , . . . ,wm positiv sind und ihre Summe Eins ergibt, erhält man für alle f ∈ F k und alle Polynome P aus PN wegen I(P ) = SN (P ) die Ungleichung |I(f ) − SN (f )| = |I(f − P ) − SN (f − P )| ≤ |I(f − P )| + |SN (f − P )| ≤ 4||f − P ||∞ . Für N ≥ k−1 folgt damit aus dem Satz von Jackson mit γk = 4αk die Behauptung.
Eine Analyse und einen Vergleich der Clenshaw-Curtis-Quadratur mit der Gauß-Quadratur findet man bei L. N. Trefethen (2008), einen schnellen Algorithmus zur Berechnung der Gewichte wn für das Verfahren bei J. Waldvogel (2003). Zur vertiefenden Lektüre über Quadraturverfahren sei etwa das Buch von H. Brass, K. Petras (2011) empfohlen. Das Clenshaw-Curtis-Verfahren findet auch Verwendung bei der Konstruktion von interpolatorischen Algorithmen zur numerischen Integration von Funktionen auf hochdimensionalen Quadern. Einen Einstieg in das Thema können interessierte Leser in der Arbeit von E. Novak, K. Ritter, R. Schmitt, A. Steinbauer (1999) und den dort genannten weiteren Quellen finden. Bei großen Dimensionen d ≫ 10 wird man jedoch eher zu Monte-CarloMethoden zur numerischen Integration greifen. Eine Referenz zu diesen Methoden ist etwa das Buch von T. Müller-Gronbach, E. Novak, K. Ritter (2012). Approximation und Interpolation mit Tschebyscheff-Polynomen Zum Abschluss unseres ersten Exkurses in die Numerische Mathematik sei noch auf die enge Beziehung der Clenshaw-Curtis-Quadratur zur Interpolation und Approximation der betrachteten Funktion f auf [−1,1] durch Tschebyscheff-Polynome 3 eingegangen. Damit erhalten wir Beispiele für Approximationen von Funktionen auf beschränkten Intervallen mit einem von den bisher betrachteten trigonometrischen Funktionen verschiedenen System orthogonaler Funktionen. 3
Für den Namen des russischen Mathematikers Pafnuti i Qebyx¨ ev (1821-1894) sind in der Literatur auch die Schreibweisen Chebyshev und andere ähnliche verbreitet.
86
5 Anwendungsbeispiele für Fourierreihen
Die Tschebyscheff-Polynome Tn sind zunächst auf [−1,1] für n ≥ 0 definiert durch Tn (x) = cos(n arccos x). Mit den Additionstheoremen für die Cosinusfunktion erhält man mit T0 (x) = 1, T1 (x) = x für n ∈ N die Rekursionsgleichung (Übung: man substituiere arccos(x) = ϕ ∈ [0,π]) Tn+1 (x) = 2xTn (x) − Tn−1 (x). Damit ist Tn ein Polynom vom Grad n, das als Polynom auch auf ganz R und C definiert ist. Tn ist für gerade n ein gerades Polynom von Grad n, für ungerade n ein ungerades Polynom vom Grad n und es gilt stets |Tn | ≤ 1 auf [−1,1]. Der Koeffizient an des Anteils an xn mit der größten Potenz von x in Tn ist an = 2n−1 . Die Tschebyscheff-Polynome bilden über dem Intervall [−1,1] ein p Orthogonalsystem bezüglich des inneren Produkts mit der Gewichtsfunktion w(x) = 1/ 1 − x2 ˆ+1 ¨r n 6= m 0 fu 1 π fu ¨r n = m = 0 dx = hTn ,Tm iw = Tn (x)Tm (x) √ 1 − x2 π/2 f u ¨ r n = m 6= 0. −1 Diese und einige weitere Eigenschaften der Tschebyscheff-Polynome, die im Zusammenhang mit der DCT interessant sind, können Leser in den Übungsaufgaben am Kapitelende selbständig erarbeiten. In unserem Zusammenhang sehen wir wegen Tn (cos(ϕ)) = cos(nϕ), dass die Fourierreihenentwicklung von f (cos(ϕ)) auf S. 82 mit der verwendeten Substitution x = cos(ϕ) einer Reihenentwicklung von f mit dem Orthogonalsystem der Tschebyscheff-Polynome entspricht. Diese Reihe konvergiert für stetige, stückweise stetig differenzierbare Funktionen f auf [−1,1] sogar gleichmäßig gegen f . Wir erhalten für x ∈ [−1,1] ∞
X a0 f (x) = T0 (x) + ak Tk (x). 2 k=1
Die Koeffizienten ak sind dabei ak = αk hf,Tek iw mit den bezüglich des obigen inneren p √ Produkts orthonormierten Tschebyscheff-Polynomen Tek und α0 = 2/ π, αk = p 2/π für k 6= 0. Die Koeffizienten sind wegen der Wahl der Gewichtsfunktion w = 1/ 1 − x2 beim inneren Produkt die Fourierkoeffizienten der cos-Reihendarstellung von f (cos(ϕ)). Identifiziert man wie in Abschnitt 4.6 Funktionen, die sich nur auf einer Nullmenge unterscheiden, dann ist das innere Produkt positiv definit. Man erhält Reihendarstellungen wie oben auch für alle Funktionen f : [−1,1] → R mit hf,f iw < ∞. Die Reihen konvergieren dann in der Regel nicht mehr punktweise, sondern in der vom inneren Produkt erzeugten Norm, die gegeben ist durch p kf kw = hf,f iw .
Den reellen Vektorraum dieser Funktionen bezeichnen wir als L2w ([−1,1]). Es gilt analog zum Satz auf S. 49 folgende Aussage über die Vollständigkeit des Orthogonalsystems der Tschebyscheff-Polynome in diesem Vektorraum:
5.7 Einführung in die diskrete Fouriertransformation
87
Satz. Jede Funktion f aus L2w ([−1,1]) besitzt die Reihendarstellung f=
∞
X a0 T0 + ak T k 2 k=1
mit den Koeffizienten ak = αk hf,Tek iw wie oben. Die Reihe konvergiert in der Norm von L2w ([−1,1]) gegen f . Die Koeffizienten ak sind auch die Fourierkoeffizienten ak = ck +c−k , k ∈ N0 , von f (cos(ϕ)).
Je glatter die Funktion f ist, desto schneller konvergiert die obige Reihe (vgl. S. 41). Ein wieder auf Clenshaw-Curtis (1960) zurückgehender Algorithmus erlaubt eine schnelle Berechnung von Partialsummen der obigen Reihendarstellung von f . Für Reihenentwicklungen von Funktionen f auf [−1,1] mit Tschebyscheff-Polynomen erhält man wegen ihrer Verwandtschaft zur entsprechenden Fourierreihen-Entwicklung von f (cos(ϕ)) analoge Aussagen bezüglich punktweiser Konvergenz, Konvergenz der arithmetischen Mittel wie im Satz von Fejér und Approximation durch Partialsummen wie in Kapitel 3, in Abschnitt 5.1 oder nachfolgend in Kapitel 6. In den folgenden Bildern sehen wir die Tschebyscheff-Polynome T1 bis T4 auf [−1,1] und drei Approximationen an die Signum-Funktion mit Partialsummen Sn der Reihenentwicklung wie im letzten Satz mit Polynomgraden n = 5, n = 9 und n = 19. Wie bei den Näherungen durch Fourierreihen-Entwicklung beobachten wir auch hier das GibbsPhänomen, d.h. ein Überschwingen in der Umgebung der Sprungstelle bei x = 0. 1.0 1.0 0.5
0.5
0.0
0.0 - 0.5
- 0.5 - 1.0 - 1.0
- 1.0 - 0.5
0.0
0.5
Die Tschebyscheff-Polynome T1 bis T4
1.0
- 1.0
- 0.5
0.0
0.5
1.0
Signum-Funktion, S5 , S9 , S19 , Gibbs-Phänomen
Bemerkung. Das Gibbs-Phänomen tritt auch bei Approximationen mit anderen Orthogonalsystemen auf. Als Beispiele seien etwa die Systeme der Legendre-, Hermite- oder Laguerre-Polynome und bei mehreren Variablen die Kugelflächenfunktionen genannt. Zur Verbesserung der Näherungen in der Umgebung von Sprungstellen einer Funktion f haben wir bei Fourierreihen-Entwicklungen die Bildung der arithmetischen Mittel von Partialsummen nach Fejér kennen gelernt. Allgemeiner ist die Faltung der Funktion f mit einem geeigneten Summationskern (vgl. Abschnitt 6.2), durch die das Spektrum der Funktion gewichtet wird, eine solche Methode. Analoge Vorgehensweisen werden auch bei anderen Orthogonalsystemen als dem trigonometrischen verwendet. Details und weitere Referenzen hierzu findet man etwa bei D. Gottlieb und C.-W. Shu (1997). G. Helmberg und P. Wagner (1997) zeigen eine Methode zur Minderung des Gibbs-Phänomens für trigonometrische Interpolationspolynome durch geeignete Abänderung des Funktionswerts an einer Sprungstelle, wenn diese ein Knoten dieses Interpolationspolynoms ist.
88
5 Anwendungsbeispiele für Fourierreihen
Interpolation mit Tschebyscheff-Polynomen Wir betrachten stetige, stückweise stetig differenzierbare Funktionen f : [−1,1] → R. Aus den trigonometrischen Interpolationspolynomen P2 und P3 von S. 78 und S. 80 für f (cos(ϕ)) ergeben sich unmittelbar entsprechende Formeln für die Interpolation von f mit Tschebyscheff-Polynomen. Mit den Abtastwerten yn = f (xn ), xn = cos(πn/m)) für die DCT I resp. xn = cos(π(2n + 1)/(2m + 2)) für die DCT II, jeweils mit n = 0, . . . ,m, erhält man für f die an den Stellen xn interpolierenden Polynome P2,T und P3,T : mit DCT I-Koeffizienten b ak :
P2,T (x) =
mit DCT II-Koeffizienten b ak :
P3,T (x) =
m−1 X b am b a0 b ak Tk (x) + + Tm (x), 2 2 k=1 m
b a0 X + b ak Tk (x). 2 k=1
Wie man den Approximationsfehler der trigonometrischen Interpolation einer periodischen Funktion f dadurch beschreiben kann, dass sich Amplituden von Schwingungsanteilen in f mit höheren Frequenzen als der Maximalfrequenz des Interpolationspolynoms durch „Aliasing“ additiv auf die Amplituden der Näherung auswirken, so kann man auch den Fehler bei der Interpolation mit Tschebyscheff-Polynomen auf diese Weise beschreiben. Betrachten wir etwa den Fall der Interpolation mit der DCT II und den m + 1 Knoten xn = cos(π(2n+1)/(2m+2)), welche die Nullstellen des Tschebyscheff-Polynoms Tm+1 sind (0 ≤ n ≤ m). Diese Knoten werden auch als Tschebyscheff-Abszissen bezeichnet. Dann folgt aus Tk (cos(xn )) = cos(kxn ) mit den Additionstheoremen, dass die Polynome Tk und (−1)l Tl(2m+2)±k an den Knoten xn nicht unterscheidbar sind. Für k = 0, . . . ,m und n = 0, . . . ,m sowie l ∈ N gilt also die Beziehung (als Übung nachzurechnen) Tk (xn ) = (−1)l Tl(2m+2)±k (xn ). Für die Koeffizienten b ak des Interpolationspolynoms P3,T bedeutet dies:
∞
X a0 ak Tk und den T0 + 2 k=1 DCT II-Koeffizienten b ak , k = 0, . . . ,m zu den Abtastwerten von f an den TschebyscheffAbszissen besteht folgende Alias-Beziehung: DCT II-Alias-Formel: Zwischen den Koeffizienten ak von f =
b ak = ak +
∞ X
(−1)l (al(2m+2)+k + al(2m+2)−k ).
l=1
Die Leser mögen selbst eine analoge Aliasbeziehung für den Fall der Interpolation mit der DCT I und den Knoten xn = cos(πn/m) bestimmen (0 ≤ n ≤ m). Auf solche Effekte ist insbesondere zu achten, wenn man in nicht-linearen Problemen etwa einen Term der Form f (x)3 durch Tschebyscheff-Interpolation von f annähern will. Zur Veranschaulichung interpolieren wir die Funktion f = 2T10 + T20 mit 5 Tschebyscheff-Abszissen als Knoten wie besprochen. Die Koeffizienten a10 = 2 und a20 = 1 ergeben wegen des Alias-Effekts mit m = 4 das Interpolationspolynom P3,T = −T0 = −1.
5.7 Einführung in die diskrete Fouriertransformation
89
3 2 1 0 -1 - 1.0
- 0.5
0.0
0.5
1.0
f und P3,T haben an den Tschebyscheff-Abszissen xn = cos(π(2n + 1))/10 für n = 0, . . . ,4 gleiche Werte. Die Tschebyscheff-Abszissen sind näherungsweise −0.951, −0.588, 0, 0.588 und 0.951.
Es gibt vielfältige Untersuchungen zur Konvergenz von Interpolationspolynomen bei wachsenden Knotenzahlen, abhängig davon, mit welcher Norm die Approximationsfehler gemessen werden. Nachfolgend einige Aussagen und Hinweise zu Details in der Literatur zur Approximationstheorie. Quellen sind etwa T. J. Rivlin (2010) oder A. Schönhage (1971). Im folgenden Satz sind C([−1,1]) bzw. C n ([−1,1]) die Räume der stetigen bzw. n-mal stetig differenzierbaren reellwertigen Funktionen auf [−1,1], versehen mit der Norm k.k∞ der gleichmäßigen Konvergenz. Mit Sn (f ) notieren wir das Interpolationspolynom vom Grad ≤ n − 1 mit den n Nullstellen des Tschebyscheff-Polynoms Tn als Knoten. Satz. 1. Für jede stetige Funktion f ∈ C([−1,1]) konvergieren die Polynome Sn (f ) für n → ∞ in der Norm von L2w ([−1,1]) gegen f . 2. Bei beliebiger Wahl von jeweils n Knoten in [−1,1] gibt es eine Funktion f ∈ C([−1,1]), so dass die Folge der zugehörigen Interpolationspolynome für n → ∞ nicht gleichmäßig gegen f konvergiert. 3. Für Lipschitz-stetige Funktionen f auf [−1,1], d.h. Funktionen f mit |f (x) − f (y)| ≤ L|x − y| für x, y in [−1,1] und eine geeignete Konstante L, insbesondere also für stetig differenzierbare Funktionen f konvergiert die Folge der Sn (f ) gleichmäßig gegen f . 4. Die Polynome Sn (f ) mit den Tschebyscheff-Abszissen als Knoten besitzen folgende Minimax-Eigenschaft: Für alle f ∈ C n ([−1,1]) gilt die Abschätzung kf − Sn (f )k∞ ≤
21−n (n) kf k∞ . n!
Bei jeder anderen Wahl von Knoten für Interpolationspolynome wird diese Schranke für den Maximalfehler der Interpolation auf C n ([−1,1] überschritten, d.h. die Wahl der Tschebyscheff-Abszissen als Knoten ist hinsichtlich dieses „Worst Case Fehlers“ auf C n ([−1,1] die optimale Knotenwahl. Die erste Aussage findet man bewiesen bei P. Erdös, P. Turán (1937), die zweite bei G. Faber (1912), die weiteren in der angegebenen Literatur zur Approximationstheorie. Bei einem Vergleich verschiedener Strategien zur Knotenwahl ist festzuhalten, dass die dritte Aussage des Satzes für äquidistante Knoten selbst bei analytischen Funktionen f nicht gilt. Ein bekanntes Beispiel hierzu von C. Runge (1901) ist die Funktion f (x) = 1/(1 + 25x2 ) auf [−1,1] (siehe Übungsaufgabe A23). Eine unterschiedliche Knotenwahl lässt sich auch vergleichen durch die Normen der Operatoren An auf C([−1,1]), die bei n Knoten eine Funktion f auf das Interpolationspolynom An (f ) vom Grad ≤ n − 1 abbilden. Man kann
90
5 Anwendungsbeispiele für Fourierreihen
zeigen, dass diese Normen kAn k = sup{kAn (f )k∞ : kf k∞ ≤ 1} bei der Wahl der Tschebyscheff-Abszissen als Knoten mit n wie log(n), bei äquidistanten Knoten hingegen exponentiell wachsen. Details darüber findet man bei T. J. Rivlin (2010). Insgesamt ergibt sich aus dem Satz, dass die Interpolation mit Polynomen hohen Grades im allgemeinen Fall ohne bekannte Glattheitseigenschaften der zu interpolierenden Funktionen nicht sinnvoll ist. Daher sei darauf hingewiesen, dass man mit sogenannten Splines durch stückweise polynomiale Interpolation unter relativ geringen Glattheitsforderungen an die zu interpolierende Funktion gleichmäßige Konvergenz erzielen kann. Interpolation mit Splines ist auch dann angezeigt, wenn die Knoten nicht frei gewählt werden können, sondern vorgegeben sind. Man lese hierzu Literatur über Approximationstheorie. Eine für Anwendungen interessante Extremaleigenschaft der Tschebyscheff-Polynome Wir prüfen abschließend noch eine Extremaleigenschaft der Tschebyscheff-Polynome, die erklärt, warum man diese Polynome in der Elektrotechnik vielfach beim Entwurf von Tiefpassfiltern verwendet. Solche Filter sollen in Übertragungssystemen Signalkomponenten bis zu einer Grenzfrequenz möglichst unverzerrt übertragen und Signalkomponenten mit Frequenzen, die höher als die Grenzfrequenz sind, möglichst gut dämpfen. Satz. 1. Für jedes x0 außerhalb von [−1,1] hat das Polynom Pn = Tn /Tn (x0 ) unter allen Polynomen P vom Grad n mit P (x0 ) = 1 minimale Supremumsnorm über [−1,1]. 2. Unter allen Polynomen P vom Grad n mit |P (x)| ≤ 1 auf [−1,1] wächst Tn außerhalb von [−1,1] am schnellsten, d.h. dort gilt |Tn | ≥ |P |. Beweis. Zu 1. Da alle Nullstellen von Tn in [−1,1] liegen, ist Tn (x0 ) 6= 0. Nach Definition nimmt Tn an den n + 1 Stellen tk = cos(kπ/n) für k = 0, . . . ,n nacheinander die Extremalwerte ±1 alternierend an. Nimmt man an, es gäbe ein Polynom P mit kleinerer Norm kP k∞ auf [−1,1] als Tn /Tn (x0 ), dann müsste an allen Stellen tk auch |P (tk )| < |Tn (tk )/Tn (x0 )| gelten. Daher hätte Tn /Tn (x0 ) − P mindestens n Vorzeichenwechsel und damit Nullstellen: Etwa würde für Tn (x0 ) > 0 folgen, dass P (t0 ) < Tn (t0 )/Tn (x0 ) = 1/Tn (x0 ), P (t1 ) > Tn (t1 )/Tn (x0 ) = −1/Tn(x0 ) usw. wären. Das Differenzpolynom hätte eine weitere Nullstelle in x0 . Im Widerspruch zur Annahme müssten dann P und Tn /Tn (x0 ) gleich sein. Zu 2. Für jedes beliebige x0 außerhalb von [−1,1] folgt für Polynome P wie vorausgesetzt aus der vorherigen Aussage, wieder mit der Supremumsnorm auf [−1,1]
P
1 1
≥ Tn = ≥ ,
|P (x0 )| P (x0 ) ∞ Tn (x0 ) ∞ |Tn (x0 )| falls P (x0 ) 6= 0 ist. Für den Fall P (x0 ) = 0 ist nichts zu zeigen.
b Tschebyscheff-Tiefpassfilter q in der Elektrotechnik besitzen Frequenzgänge h, welche die Beziehung |b h(ω)| = K/ 1 + ε2 T 2 (ω/ωg ) erfüllen. Solche Filter lassen Signalanteile mit n
tiefen Frequenzen bei der Signalübertragung weitgehend unverzerrt passieren und dämpfen
5.7 Einführung in die diskrete Fouriertransformation
91
Anteile mit Kreisfrequenzen ω > ωg stark ab. Die Grenzfrequenz ωg /(2π), die Ordnung n des Filters und die Konstanten ε und K werden dabei nach Vorgaben an den Dämpfungsverlauf gewählt (man vgl. noch einmal das Tiefpass-Beispiel auf S. 53, Übungsaufgabe A26 am Kapitelende und später Kapitel 10). Die Aussage des Satzes zeigt, dass solche Filter Vorteile beim Dämpfungsverhalten für ω > ωg im Vergleich zu anderen Tiefpassfiltern mit rationalen Frequenzgängen aufweisen. Der Preis dafür ist eine Verzerrung im Passband des Filters durch die Welligkeit der Tschebyscheff-Polynome Tn mit n Nullstellen in [−1,1]. Zur Vertiefung über die Anwendungen der Tschebyscheff-Polynome seien noch einmal das Buch über Numerische Mathematik von M. Hanke-Bourgeois (2008) und das ganz diesen Polynomen gewidmete Buch von J. C. Mason und D. Handscomb (2002) genannt. Mit den Tschebyscheff-Polynomen haben wir neben den trigonometrischen Funktionen ein zweites System orthogonaler Funktionen bezüglich eines inneres Produkts mit einer Gewichtsfunktion kennen gelernt und gesehen, wie Reihendarstellungen von Funktionen durch Orthogonalprojektionen auf die von diesen Polynomen erzeugten Teilräume von L2w ([−1,1]) möglich werden. Durch Umskalierung können leicht alle Ergebnisse auch auf Funktionen über anderen Intervallen als [−1,1] übertragen werden (vgl. Aufgabe A25 am Kapitelende). Das gleiche Konzept ermöglicht Darstellungen von Funktionen auch mit vielen anderen Funktionenfamilien, die in einem Raum mit innerem Produkt ein vollständiges Orthogonalsystem bilden. Wir gehen in Kapitel 12 auf diesen weiterführenden Aspekt ein. Lesern, die mehr darüber lernen wollen, sei das Buch von G. B. Folland (1992) und die reichhaltige Literatur zur Funktionalanalysis empfohlen. Weitere Anwendungsbeispiele für die diskrete Fouriertransformation Aus der Fülle technischer Anwendungen, die ohne DFT oder ihr eng verwandter Verfahren gar nicht denkbar sind, können hier nur einige Beispiele stichwortartig skizziert werden. Jeder angehende Ingenieur oder Naturwissenschaftler wird in seinen Fachdisziplinen bereits im Studium solche Anwendungen kennenlernen. Diskrete lineare Filter Ein diskretes, kausales lineares Filter mit rationaler Übertragungsfunktion ( man vgl. später Kap. 10) verarbeitet eine Folge von Eingabewerten xk , k ≥ 0, zu einer Folge von Ausgabewerten yn , n ≥ 0, nach der Formel yn =
N X
k=0
ak xn−k +
M X l=1
bl yn−l , (xk ,yk = 0 für k < 0,N ≥ 0,M ≥ 1).
Solche Filter treten bei linearen Übertragungssystemen der Elektrotechnik auf, ja generell bei der Diskretisierung linearer Systeme auch in jedem anderen wissenschaftlichen Gebiet. Die N + 1 Koeffizienten ak und die M Koeffizienten bl haben bei zeitinvarianten Systemen konstante Werte und legen die Filterantwort in Abhängigkeit von den Eingabewerten fest. Sind die Werte xk Abtastwerte einer zeitabhängigen Funktion f im zeitlichen Abstand T , xk = f (kT ), k = 0,1,2, . . ., dann wird der Ausgabewert yn zur Zeit nT berechnet aus
92
5 Anwendungsbeispiele für Fourierreihen
xn , den N vorherigen Werten xn−N , . . . ,xn−1 und aus den M vorherigen Ausgabewerten yn−M , . . . ,yn−1 . Man spricht man von einem kausalen Filter, weil die „Gegenwart“ yn nur durch xn und zurückliegende Werte x0 , . . . ,xn−1 bestimmt ist. Für M = 0 verschwindet in der Formel die zweite Summe; solche Filter heißen nichtrekursive Filter. Für M 6= 0 nennt man das Filter ein rekursives Filter. Der Frequenzgang des Filters (genaue Details dazu später in Kap. 10) ist definiert als die Funktion
b h(ω) =
N X
ak e−jkωT
k=0 M X
1−
. bl e
−jlωT
l=1
Der Frequenzgang zeigt Amplituden- und Phasenänderung der Abtastwerte einer zu den Zeiten kT , k ∈ N0 , abgetasteten Schwingung bei der Übertragung durch das Filter im stationären Zustand in Abhängigkeit von der Kreisfrequenz ω der Schwingung (|ω| < π/T ). Als Beispiel für ein nicht-rekursives Filter dient das nachfolgende Schema mit Haltegliedern, welche die Werteweitergabe um einen Zeitschritt T verzögern. N X Das Filter hat bei Haltezeit T den 2π/T -periodischen Frequenzgang b h(ω) = ak e−jkωT . k=0
Sind bei dem Filter die Eingabewerte zum Beispiel xk = cos(kωT ) für k ≥ 0, xk = 0 für k < 0, dann ist bei reellen Koeffizienten ak im stationären Zustand (n > N ) der Ausgabewert yn gegeben durch yn = |b h(ω)| cos(nωT + φ), φ = arg(b h(ω)) (Übung A12). xn = x(nT )
T
T
T
xn
xn−1
xn−2
xn−N
a0
a1
a2
aN
+
+
+ yn = y(nT )
Wir bemerken, dass die Filterantwort eine Faltung der Filterkoeffizienten mit den Eingabewerten und im rekursiven Fall auch mit zurückliegenden Ausgabewerten ist, die pro Zeitschritt N + 1 bzw. N + 1 + M Multiplikationen erfordert. Es lässt sich zeigen, dass der Faltungssatz für die DFT (vgl. Tabelle S. 75) in Verbindung mit schnellen Algorithmen zur Berechnung von DFT und IDFT – auf die wir im Anschluss noch kommen – eine erhebliche Reduzierung der Anzahl der nötigen Multiplikationen ermöglicht. Dies spielt in Realzeitanwendungen mit sehr hohen Abtastfrequenzen und hohen Filtergraden N eine wichtige Rolle. Als Beispiele für den Einsatz solcher diskreter Filter seien wieder DAB, DVB-T, DSL, WLAN, Mobilfunk usw. genannt.
5.7 Einführung in die diskrete Fouriertransformation
93
Auch beim Entwurf von Filtern zu vorgegebenen Wunsch-Frequenzgängen kommt die DFT zum Einsatz. Aus den Stützwerten des erwünschten Frequenzganges werden dann die Filterkoeffizienten so berechnet, dass der Filter-Frequenzgang eine je nach Zweck möglichst gute Näherung des Wunsch-Frequenzgangs ist. Solche DFT-Berechnungen sind bei den Entwurfsmethoden eingebettet in Iterationsverfahren zur schrittweisen Optimierung der Koeffizienten. Einzelheiten hierzu, den sogenannten Remez-Parks-McClellan-Exchange-Algorithmus, der häufig beim Entwurf von nicht-rekursiven Filtern eingesetzt wird, findet man im Lehrbuch über zeitdiskrete Signalverarbeitung von A.V. Oppenheim und R.W. Schafer (1999). Andere Filter-Entwurfsverfahren, sowohl für rekursive als auch für nicht-rekursive lineare Filter, besprechen wir in Abschnitt 10.6. Zeitreihenanalyse Die Abtastwerte f (nT /N ) einer Funktion f nennt man auch eine Zeitreihe. In der Nachrichtenübertragung, auch in der Medizin bei Elektroenzephalogrammen oder etwa auch in der Seismographie, hat man oft mit zufällig gestörten Signalen zu tun. Schätzung des Spektrums kann wesentliche Information über solche Signale liefern. Etwa sind mit einem Elektroenzephalogramm in der Medizin Hirnschädigungen feststellbar. So stellt man zum Beispiel bei Elektroenzephalogrammen von Patienten mit Epilepsie oder der AlzheimerKrankheit in gewissen Frequenzbereichen im Vergleich zu gesunden Patienten erniedrigte Frequenzen mit erhöhten Amplituden fest. In der Sicherheitstechnik von Kraftwerken verwendet man umfangreiche Systeme von Schwingungsdetektoren zur Überwachung. Anhand des Spektrums der mechanischen Schwingungen kann man beispielsweise periodische Anteile mit bestimmten Frequenzen finden. Durch Analyse von Amplituden- und Phasenspektren mit Hilfe der DFT lassen sich dann lose, schwingende Teile orten und Sicherheitsrisiken beseitigen. Ein weiteres Anwendungsgebiet der DFT ist etwa die Abstrahlungsmessung im Hochfrequenzbereich zur Überprüfung der elektro-magnetischen Verträglichkeit (EMV). Um bei einer Messung bis 1 GHz Abtastraten im Basisband mit mehr als 2 GS/s (GS=Gigasamples) und nicht zu bewältigende Datendurchsätze bei erforderlichen langen Messzeiten zu vermeiden, unterteilt man den beobachteten Frequenzbereich durch Bandpassfilter in Abschnitte und fügt die abschnittweise mit der DFT berechneten Spektren zum Gesamtbild zusammen. In den einzelnen Passbändern kann man durch Unterabtastung mit wenig Abtastpunkten und kurzen Beobachtungszeiten arbeiten (vgl. Beispiel 3 auf S. 73). Eine detaillierte Beschreibung des so in der Praxis von EMV-Messungen umgesetzten Verfahrens finden interessierte Leser bei G. Vogl, J.-C. Nickel (2003). Eine Schlüsseltechnologie in modernen Kommunikationssystemen wie WLAN-Netzen, beim digitalen Hörfunk und digitalen Fernsehen (DAB, DVB-T), aber auch bei drahtgebundenen Verfahren wie DSL ist die Mehrträger-Übertragung. Das zur Zeit am weitesten verbreitete solche Übertragungsverfahren basiert auf der diskreten Fouriertransformation (DFT) und wird im Zusammenhang mit Mobilfunk-Anwendungen als OFDM (Orthogonal Frequency Division Multiplexing, vgl. später Abschnitt 11.1) und bei kabelgebundenen Übertragungssystemen als DMT (Discrete Multitone) bezeichnet. Seinen Namen hat das
94
5 Anwendungsbeispiele für Fourierreihen
Übertragungsverfahren von der Grundidee, die Nutzinformationen als Amplituden eines trigonometrischen Polynoms mit orthogonalen Trägern zu senden. Dabei kommen neben der DFT auch lineare Filter im Zusammenwirken mit Abtastverfahren, Codierungs- und Schätzalgorithmen zum Einsatz. Alle Details dazu findet man in den Lehrbüchern von K.D. Kammeyer, A. Dekorsy (2018) oder H. Schulze, C. Lüders (2005). Diese und viele andere Beispiele wie CD-Player, MP3-Player etc. zeigen deutlich, dass vieles in heutigen Haushalten ohne die Methoden der Fourier-Analyse garnicht vorhanden wäre. Mehrdimensionale DFT-Varianten findet man bei bildgebenden medizinischen Verfahren oder etwa bei der Erzeugung von Satellitenbildern aus SAR-Daten (Synthetic Aperture Radar), vgl. etwa T. Salditt et al. (2017) und I.G. Cumming, F.H. Wong (2005). In der Messtechnik und bei der Filterung oder bei der Vorhersage von verrauschten, zufallsabhängigen Größen f spielt die sogenannte Autokorrelationsfunktion 1 r(t) = lim T →∞ 2T
ˆT
f (τ )f (t + τ ) dτ
−T
eine fundamentale Rolle. Mit Hilfe von DFT und IDFT ergeben sich aus der Faltungsregel durch Multiplikation der zu f gehörigen Fourierkoeffizienten schnelle Algorithmen zur numerischen Berechnung der Autokorrelation. Numerische Lösung von Integral- und Differentialgleichungen Die diskrete Fouriertransformation kann auch auf den Fall von Funktionen mit mehreren Variablen ausgedehnt werden. Sie eröffnet Möglichkeiten zur numerischen Differentiation analytischer Funktionen, zur numerischen Inversion von Laplacetransformationen wie auch zur Behandlung von Integral- und Differentialgleichungen. Als Beispiel sei etwa erwähnt, dass DFT-Verfahren für Potentialprobleme der Form ∆u = f in rechteckigen Gebieten mit zu den schnellsten verfügbaren Lösungsmethoden gehören. Dabei sind die durch die Diskretisierung entstehenden Differenzengleichungen als Faltungsgleichungen zu verstehen, die mit der DFT einfach und schnell gelöst werden können. Wir gehen auf keinen der genannten Anwendungsbereiche näher ein. Als Empfehlung sei aber interessierten Lesern die Arbeit „Fast Fourier Methods In Computational Complex Analysis“ von P. Henrici (1979) genannt, in der ein Teil der angesprochenen Themen behandelt wird, oder das Buch von W. Briggs und Van Emden Henson (1995). Für alle Anwendungen benötigt man einen Algorithmus zur Berechnung von DFT und IDFT. Die naive Berechnung der DFT eines Wertevektors (y0 ,y1 , . . . ,yN −1 ) erfordert N 2 Operationen (1 Operation = 1 komplexe Multiplikation + Addition). Es gibt aber schnelle Algorithmen zur Berechnung der DFT, mit denen unter Ausnutzung von Symmetrien der DFT die Anzahl der nötigen Operationen erheblich reduziert werden kann. Daher soll im Folgenden das Grundprinzip solcher Algorithmen kurz vorgestellt werden. Die Grundidee der Fast Fourier Transform (FFT) Die Geschichte schneller Algorithmen zur Berechnung trigonometrischer Reihen reicht bis Gauß zurück, der bereits 1805, noch vor Fouriers Arbeiten, den gleichen Ansatz benutzte
5.7 Einführung in die diskrete Fouriertransformation
95
wie J. W. Cooley und J. W. Tukey (1965) in ihrem berühmten Artikel „An Algorithm For The Machine Calculation Of Complex Fourier Series“, in dem die Anzahl der Operationen für eine DFT der Länge N = 2n von N 2 auf N log2 (N ) reduziert wird. Eine Übersicht bieten die Arbeit „Fast Fourier Transforms: A Tutorial Review And The State Of The Art“ von P. Duhamel und M. Vetterli (1990) oder das Buch von H. J. Nussbaumer (1982). Die grundlegende Idee aller FFT-Algorithmen besteht darin, eine DFT der Länge N für eine Faktorisierung N = n1 n2 · · · nk ,(n1 ,n2 , . . . ,nk ∈ N), rekursiv zu berechnen durch DFT’s der kleineren Längen n1 ,n2 , . . . ,nk , symbolisch „DFTN = DFTnk (DFTnk−1 (. . . (DFTn1 ) . . .))“. Für den Fall k = 2, N = r · s, r,s ∈ N, soll das Vorgehen exemplarisch gezeigt werden. Wir benutzen hier folgende Schreibweisen: Für einen gegebenen Wertevektor (y0 ,y1 , . . . ,yN −1 ), N = r · s ∈ N mit den Fourierkoeffizienten (b c0 ,b c1 , . . . ,b cN −1 ) bezeichnen im Folgenden: e(n) = e−j2πn u = p0 + p1 r, v = q1 + q0 s,
p0 = 0, . . . ,r − 1 p1 = 0, . . . ,s − 1 q0 = 0, . . . ,r − 1 q1 = 0, . . . ,s − 1.
Dann gelten 0 ≤ u ≤ rs − 1 = N − 1 und 0 ≤ v ≤ N − 1, sowie e(n + m) = e(n) e(m) e(n) = 1
für n,m ∈ Z.
1 yv . N Für die Fourierkoeffizienten C(u) gilt damit folgende Darstellung: rs−1 rs−1 uv X X (p0 + p1 r)(q1 + q0 s) C(u) = Y (v) e = Y (q1 + q0 s) e N N v=0 q +q s=0 Wir schreiben C(u) statt b cu und Y (v) statt 1
0
(p0 + p1 r)(q1 + q0 s) . N q1 =0 q0 =0 p rq s 1 0 Beachtet man N = r · s und e = e(p1 q0 ) = 1, so ist N s−1 X r−1 p q p q p q X 0 0 e 0 1 e 1 1 C(p0 + p1 r) = Y (q1 + q0 s) e r rs s q =0 q =0 =
r−1 s−1 X X
Y (q1 + q0 s) e
1
0
! r−1 p q p q X p q 1 1 0 1 0 0 e e Y (q1 + q0 s) e = s rs q =0 r q1 =0 0 | {z } „DFTr “ | {z } „DFTs “ s−1 X
Daher kann folgender Algorithmus angesetzt werden:
96
5 Anwendungsbeispiele für Fourierreihen
FFT-Algorithmus 1. Man berechne für p0 = 0, . . . ,r − 1 und q1 = 0, . . . ,s − 1 C(p0 ,q1 ) = e
r−1 p q X p q 0 1 0 0 . Y (q1 + q0 s) e rs q =0 r 0
2. Man berechne für p0 = 0, . . . ,r − 1 und p1 = 0, . . . ,s − 1, d.h. also für u = 0, . . . ,N − 1 C(u) = C(p0 + p1 r) =
s−1 X p q e 1 1 C(p0 ,q1 ). s q =0 1
Die vorkommenden Werte der Exponentialfunktion werden bei gegebenem N = r ·s vorab berechnet und gespeichert. Dann benötigt der Algorithmus für den ersten Schritt rs(r + 1) Operationen, für den zweiten Schritt rs2 Operationen. Beispiel. Für N = 103 = 10 · 100 mit r = 10, s = 100 ergäbe naive Berechnung der DFT N 2 = 1 000 000 Operationen, Berechnung mit obigem Algorithmus nur N (r + s + 1) = 111 000 Operationen, d.h. man ist damit ca. 9-mal schneller geworden. Wie erwähnt kann der Algorithmus auf den Fall von k Faktoren, N = n1 n2 · · · nk , ausgedehnt und dadurch der Rechenaufwand weiter reduziert werden. Als besonders günstig für die praktische Anwendung erweist sich die Wahl von N als Zweierpotenz. Wir begnügen uns mit der vorgestellten exemplarischen Einführung der Grundidee. Hinsichtlich Fragen nach optimaler Faktorisierung von N , Fragen nach einer Fehleranalysis (schnelle FFT-Algorithmen sind auch genauer als naive Verfahren) etc. sei auf die angegebene Literatur verwiesen. Zählt man eine komplexe Multiplikation und Addition gemeinsam als eine komplexe Operation, dann sind folgende Reduktionen des Rechenaufwands erreichbar: k X (ni − 1) komplexe Ist N = n1 n2 · · · nk , so benötigt eine FFT nicht mehr als 2N i=1
Operationen. Ist N eine Zweierpotenz, dann genügen N log2 (N ) Operationen.
Auch für Berechnungen diskreter Cosinus-Transformationen gibt es schnelle Algorithmen. Man siehe hierzu etwa K. R. Rao, J. J. Hwang (1996). In Numerik-Software wie Matlab und in Computeralgebra-Systemen wie Mathematica oder Maple stehen leistungsfähige schnelle Algorithmen für DFT- und DCT-Berechnungen bereits zur Verfügung. Zum Abschluss dieses kleinen Einblickes in die Numerische Mathematik seien noch einige Beispiele zur Veranschaulichung und als Anreiz zur Vertiefung gegeben: Beispiele. 1. Gegeben sei ein von zufälligen Störungen überlagertes Signal f , dessen Signalfrequenzen ν im Bereich 0 ≤ ν < 50 Hertz liegen. Bei Abtastung über einen Zeitraum [0,T [ mit einer Abtastfrequenz νa = N/T > 100 Hz, zum Beispiel mit T = 2 s und
5.7 Einführung in die diskrete Fouriertransformation
97
N = 256, ist mit bloßem Auge an der Darstellung des Signals durch einen Polygonzug, der die Abtastwerte interpoliert, nicht zu erkennen, aus welchen Schwingungen das Signal zusammengesetzt ist (nachfolgend linkes Bild ). Anwendung der FFT und Darstellung des Betragsspektrums |b ck |, 0 ≤ k ≤ N − 1 (nachfolgend rechtes Bild), zeigen „Peaks“ bei k = 60 und k = 90. Hieraus schließt man, dass das Signal im Wesentlichen eine Überlagerung zweier verrauschter, harmonischer Schwingungen der Frequenzen ν1 = 60/T = 30 Hz und ν2 = 45 Hz ist, die erste mit einer Amplitude von ca. Eins, die zweite mit ca. 0.7 als Amplitude. Die Symmetrie des dargestellten Betragsspektrums geht auf den Aliaseffekt zurück. Das Rauschen hat dem Signalverlauf nach kräftige Amplituden ebenfalls bis etwa Eins, die so von der DFT nicht detektiert wurden, sondern durch Superpositionseffekte vieler Signalanteile mit kleinen Amplituden zu erklären sind. Tatsächlich verwendet wurde f (t) = cos(60πt)+0.7 sin(90πt) und dazu Störungen mit Zufallswerten aus [−0.7,0.7]. Dass die gesuchten Frequenzen im Beispiel so überaus deutlich zu erkennen sind, ist darauf zurückzuführen, dass sie (zufällig) genau mit abgetasteten Frequenzen zusammenfallen. Solch ein „Glücksfall“ wird in Beispielen der realen Praxis selten sein. Wir gehen an dieser Stelle nicht auf mangelndes Glück und andere Praxisprobleme ein, sondern werden auf die diskrete Fouriertransformation noch einmal in einem späteren Kapitel zurückkommen (Abschnitt 11.5). Dort werden wir dann einige für die praktische Anwendung wichtige Aspekte erörtern.
0.5
2
0.4
1
0.3
0
0.2
-1 -2 0.0
0.1 0.0 0.5
1.0
1.5
Signalverlauf über 2 s
2.0
0
50
100
150
200
250
DFT-Betragsspektrum
2. Das nächste Beispiel zeigt uns die prinzipielle Möglichkeit einer Verwendung Fourierscher Methoden zur Bilddatenkompression. Das erste Bild links ist die Wiedergabe eines gescannten Bildes von G. S. Ohm (1789-1854). Jedem Pixel des Bildes wurde ein ganzzahliger Grauwert aus dem Intervall [0,255] zugeordnet. Diese Daten des Bildes wurden in der zugehörigen Grauwert-Matrix A gespeichert. Diese Matrix – aufgefasst als von den Ortskoordinaten abhängiges diskretes Signal aus Grauwerten – wurde einer DFT (in zwei Variablen) unterworfen. Anschließend wurden alle diejenigen DFT-Koeffizienten durch Null ersetzt, deren Betrag kleiner als 2M · 10−3 war, M der Maximalbetrag aller auftretenden DFT-Koeffizienten. Etwa 90% aller Koeffizienten des Beispiels wurden so durch Null ersetzt. Das zweite Bild rechts zeigt die Rekonstruktion mit einer inversen DFT, angewandt auf die derart modifizierten Koeffizienten.
98
5 Anwendungsbeispiele für Fourierreihen
Da die modifizierten DFT-Koeffizienten sehr viele Nullen aufweisen, benötigt man zu ihrer Speicherung mit einer Entropiecodierung (z.B. Huffman-Code) bedeutend weniger Speicherplatz als für die Speicherung der ursprünglichen Bilddaten-Matrix A. Da die zu höheren Frequenzen gehörenden DFT-Koeffizienten des Bildes schnell klein werden und bei dieser Art der Kompression zu Null gesetzt werden, hat man weniger steile Flanken in der Rekonstruktion und dadurch einen „Weichzeichnungseffekt“, den wir im rechten Bild erkennen können. Nach einem ähnlichen Prinzip arbeiten die bekannten JPEG-Algorithmen zur Bilddatenkompression (JPEG steht für Joint Photographic Experts Group). Dabei verwendet JPEG die DCT II in einer 2-dimensionalen Variante, die im folgenden Beispiel vorgestellt wird. Bei JPEG werden Pixelblöcke der Größe 8 × 8 oder 16 × 16 mit der DCT transformiert und die Werte pro Block nach einer Tabelle quantisiert. Für solche Blöcke einer Grauwert-Matrix geschieht dies so, dass die DCT-Koeffizienten je nach Position in der Koeffizienten-Matrix durch die Werte der sogenannten Luminanz-Tabelle dividiert und auf ganze Zahlen gerundet werden. Die Werte der Luminanz-Tabelle hängen von der gewünschten Kompressionsrate ab. Im nachfolgenden Beispiel ist eine solche Luminanz-Tabelle angegeben. Da die DCT-Koeffizienten für höhere Frequenzanteile meist schnell abfallen und die Divisoren der Tabelle für solche Koeffizienten anwachsen, erhält man in der Regel viele Nullen in den hohen Frequenzen als Ergebnis der Quantisierung und dadurch die Möglichkeit, die Spektraldaten komprimiert zu speichern oder zu übermitteln. Beim Betrachter wird der Datenstrom wieder in die DCT-Matrix decodiert, requantisiert und blockweise passend einer IDCT unterzogen. In der Regel sind die IDCT-Daten für das Bild auch neu zu rastern, wenn sie Werte enthalten, die nicht zu N0 ∩ [0,255] gehören. Bei Farbbildern werden die Farbinformationen in analoger Weise mit ChrominanzTabellen quantisiert. Die veränderte Quantisierung kann im Zusammenwirken mit dem Gibbs-Phänomen in der Umgebung von Kanten zu unerwünschten Artefakten führen, da die IDCT nach der Kompression in der Regel ein anderes trigonometrisches Polynom interpoliert als mit den ursprünglichen DCT-Daten. Man kann dies schnell
5.7 Einführung in die diskrete Fouriertransformation
99
verifizieren, wenn man einmal an die Kanten in einem JPEG-Bild heranzoomt. Gängige Standards in der Bilddaten-, Audio- und auch Video-Codierung findet man bei W. B. Pennebaker, J. L. Mitchell (1993) und K. R. Rao, J. J. Hwang (1996). Moderne und mitunter leistungsfähigere mathematische Verfahren zur Signalkompression werden wir im Schlussabschnitt 12.2 über Wavelets noch kennen lernen. Der neuere JPEG 2000-Standard benutzt solche Wavelet-Verfahren – nachzulesen etwa bei D. S. Taubman und M. Marcellin (2001) – oder auch das Datei-Format DjVu. 3. Die 2-dimensionale DCT II. Im letzten Beipiel sehen wir die Möglichkeit, Information im Spektrum eines Signals zu speichern, ohne dass diese Information im Signal direkt erkannt werden kann. Solche Techniken werden bei digitalen Wasserzeichen in Bildern oder Audio-Signalen zur Wahrung von Urheberrechten verwendet oder zu Zwecken der geheimen Nachrichtenübertragung. Wie schon im letzten Beispiel angekündigt, wird zunächst die 2-dimensionale Variante der DCT II angegeben, die wir im Folgenden verwenden. Für eine (M × N )-Matrix A mit Komponenten Amn ist die DCT-2D von A die wie folgt definierte (M ×N )-Matrix B mit Komponenten Bpq für 0 ≤ p ≤ M − 1, 0 ≤ q ≤ N − 1 DCT-2D :
Bpq = αp αq
−1 M−1 X NX
Amn cos
m=0 n=0
IDCT-2D:
Amn =
M−1 −1 X NX p=0 q=0
αp αq Bpq cos
π(2m + 1)p 2M
π(2m + 1)p 2M
cos
cos
π(2n + 1)q 2N
π(2n + 1)q 2N
Dabei sind die Normierungsfaktoren in der hier verwendeten Version der NumerikSoftware Matlab gegeben durch √ √ 1/ M falls p = 0, 1/ N falls q = 0, αp = p αq = p 2/M falls 1 ≤ p ≤ M − 1, 2/N falls 1 ≤ q ≤ N − 1.
Die DCT-2D ist also die Verkettung einer DCT über die Zeilen der Matrix A, gefolgt von einer DCT über die Spalten des vorangehenden Transformationsergebnisses. Je größer p + q wird, desto höheren Frequenzanteilen im Signal ist der Koeffizient Bpq zuzuordnen. Ausführliche Details über die geometrischen Aspekte der DCT-2D kann man zum Beispiel bei W. L. Briggs, Van Emden Henson (1995) finden.
Für unser Demonstrationsbeispiel eines digitalen Wasserzeichens wurde als Information das Wort „Geheimnis“ zunächst als geeignet skaliertes Schwarz-Weiß-Bild gespeichert. Die Werte 0 für schwarze, 1 für weiße Pixel wurden in die DCT-Matrix des nachfolgenden Bildes so kodiert, dass pro 8 × 8 Block der Reihe nach ein Pixelwert der Information gespeichert wurde. Zur Identifizierung der Pixel sind weiße so kodiert, dass die Relation B32 > B41 erfüllt ist. Gegebenenfalls wurden diese Werte vertauscht, um dieses Ergebnis zu erzielen. Entsprechend wurde ein Informationspixel durch B32 < B41 als schwarz kodiert und identifiziert. Bei Gleichheit beider Werte wurde der Block nicht berücksichtigt. Die Differenz der beiden Werte wurde um einen Schwellwert vergrößert, um eine bessere Stabilität gegen Angriffe durch Verrauschung
100
5 Anwendungsbeispiele für Fourierreihen und Datenkompression zu erreichen. Die Koeffizienten B32 und B41 wurden gewählt, weil sie zu mittleren Frequenzen im Block gehören und nach der folgenden LuminanzTabelle für JPEG gleich quantisiert werden. Dies lässt eine gewisse Robustheit gegen JPEG-Komprimierung erhoffen, wenn beide Werte gleich skaliert werden. Das Beispiel 4 zeigt keinen wirklich professionellen Algorithmus zur WasserzeichenGenerierung, demonstriert aber in einfacher Weise, wie man den Frequenzbereich zur Speicherung von Information nutzen kann. Da ein so konstruiertes Wasserzeichen gegen geometrische Angriffe wie Skalierung und Rotation des Bildes nicht stabil ist, werden im professionellen Bereich eine ganze Reihe unterschiedlicher Methoden für solche Zwecke verwendet. Zu erwähnen sind etwa die sogenannten Spread Spectrum Verfahren, bei denen die Information über das gesamte Spektrum verteilt wird. Diese Verfahren entstammen ursprünglich der Radio-Übertragungstechnik und wurden auch in der militärischen Nachrichtenübertragung schon seit etwa 1950 genutzt. In analoger Weise wie bei Bildern lassen sich auch digitale Wasserzeichen in Audio- und VideoDaten einbringen. Wir sehen die Luminanz-Tabelle und das Ergebnis des geschilderten Beispiels in den folgenden aus den modifizierten DCT-Spektren rekonstruierten Bildern: p\q 0 1 2 3 4 5 6 7 0 16 11 10 16 24 40 51 61 1 12 12 14 19 26 58 60 55 2 14 13 16 24 40 57 69 56 3 14 17 22 29 51 87 80 62 4 18 22 37 56 68 109 103 77 5 24 35 55 64 81 104 113 92 6 49 64 78 87 193 121 120 101 7 72 92 95 98 112 100 103 99 8 × 8 - Luminanztabelle
Bild mit Wasserzeichen (197 KB) 4
Das versteckte Wasserzeichen
Das identifizierte Wasserzeichen im verrauschten und komprimierten Bild mit Pixelfehlern, doch gut erkennbar.
JPEG-komprimiert und verrauscht (30 KB)
Das gerechnete Beispiel und einige weitere im Text und den Übungsaufgaben kann man beim Material zu Maple und Matlab auf der Website des Autors mit der URL www.stiftung-swk.de/mathematik finden.
5.8 Übungsaufgaben
101
Es gibt heute umfangreiche Literatur zum Thema Digitale Wasserzeichen und Steganographie im Zusammenhang mit dem Schutz von Rechten an digitalen Dokumenten (DRM, Digital Rights Mangement). Interessierte Leser seien auf die Spezialliteratur zu diesem Teilgebiet verwiesen. Eine Referenz ist etwa das Buch von I. Cox, M. Miller, J. Bloom, J. Fridrich, T. Kalker (2008). Auch durch einfache Internet-Recherche zu den genannten Stichwörtern findet man sehr schnell zahlreiche Quellen.
5.8 Übungsaufgaben A1) (a) Wie groß ist der Klirrfaktor bei der ungeraden 2π-periodischen Fortsetzung der Funktion f (t) = cos(t) für 0 < t < π ? (b) Welchen Klirrfaktor besitzt das Rechtecksignal r(t)? 1 π
2π
-1
A2) Gegeben seien a
g(t)
π/2 π
2π
f (t) 0
−a
π
2π
t
−π/2
Wie lautet die Fourierreihe zu (f ∗g)2π ? Ist (f ∗g)2π eine differenzierbare Funktion? A3) Wie lautet die T -periodische Übertragungsfunktion für das folgende Netzwerk mit der Induktivität L, der Kapazität C und dem Ohmschen Widerstand R? L Ue (t)
C
R
Ua (t)
Wie lautet für t → ∞ die Ausgangsspannung Ua (t) bei Ue (t) = U0 | sin(ω0 t)| ? A4) Für eine asymptotisch stabile Differentialgleichung
n X
k=0
ak u(k) = f mit dem cha-
rakteristischen Polynom P sei hk = 1/P (j2πk/T ), (k ∈ Z). Zeigen Sie, dass für n ≥ 2 die Koeffizienten hk der T -periodischen Übertragungsfunktion für genügend große |k| die Abschätzung |hk | ≤ M |k|−3/2 mit einer geeigneten Konstante M > 0 erfüllen (man vgl. S. 52).
102
5 Anwendungsbeispiele für Fourierreihen
A5) Zeigen Sie, dass die 2π-periodische Übertragungsfunktion h(t) =
+∞ X
k=−∞
ejkt jk + a0
der Gleichung u′ (t) + a0 u(t) = f (t), a0 > 0, eine 2π-periodische Fortsetzung der Funktion 2π e−a0 t (1 − e−2πa0 )−1 auf ]0,2π[ ist. (Da h die Gleichung für die +∞ X 2π-periodische Impulsfolge f (t) = 2π δ(t − 2kπ) löst, die zwischen zwei k=−∞
Impulsen verschwindet (vgl. dazu später Abschnitt 8.1), muss die Lösung in ]0,2π[ mit einer Lösung der homogenen Differentialgleichung übereinstimmen.) Die Reihe konvergiert auf jedem abgeschlossenen Teilintervall von ]0,2π[ gleichmäßig und die einseitigen Grenzwerte für t → 0, t > 0 bzw. t < 0 existieren. h ist stückweise stetig differenzierbar. Berechnen Sie die Sprunghöhe bei t = 0 (vgl. auch S. 52).
A6) Wie lautet die Fourierreihendarstellung für das Potential u(r,φ) in einer Kreisscheibe um Null mit dem Radius R, wenn das Potential auf dem Rand der Kreisscheibe durch U − 0 (φ − π) für 0 < φ ≤ π u(R,φ) = U π 0 (φ − π) für π < φ ≤ 2π π gegeben ist ?
A7) Rechnen Sie mit Hilfe der Additionstheoreme nach, dass sich die Fourierreihenlösung für das Problem der schwingenden Saite bei hinreichend glatten Funktionen f und g schreiben lässt in der D’Alembertschen Form 1 1 u(x,t) = (f (x + ct) + f (x − ct)) + 2 2c und als u(x,t) =
x+ct ˆ
g(τ ) dτ
x−ct
∞ nπ nπ X An (x − ct) − φn − cos (x + ct) + φn . cos 2 l l n=1
A8) Lösen Sie – wie Fourier 1807 – die 1-dimensionale Wärmeleitungsgleichung von Seite 1 durch einen Separationsansatz wie bei der schwingenden Saite. Setzen Sie dabei voraus, dass alle auftretenden Reihen gleichmäßig konvergieren. A9)⋆ Bei der inhomogenen Wellengleichung 2 ∂2u 2∂ u = c + F (x,t), u(x,0) = f (x), ∂t2 ∂x2 ∂u u(0,t) = u(l,t) = 0, lim (x,t) = g(x) t→0+ ∂t
sucht man eine Lösung der Form u = v + w, wobei w die Lösung der Anfangsrandwertaufgabe wie in Abschnitt 1.2 ist, und v eine Lösung der obigen inhomogenen Gleichung, so dass v die Randbedingungen v(0,t) = v(l,t) = 0 und die Anfangsbe∂v (x,t) = 0 erfüllt. dingungen v(x,0) = 0 und lim + t→0 ∂t
5.8 Übungsaufgaben
103
kπx Lösen Sie die Aufgabe mit dem Ansatz v(x,t) = vk (t) sin , gliedweisen l k=1 Ableitungen und Koeffizientenvergleich mit der Fourierreihenentwicklung der Inho ˆl ∞ X 2 kπx kπx , Fk (t) = dx . F (x,t) sin mogenität F (x,t) = Fk (t) sin l l l ∞ X
k=1
0
Setzen Sie voraus, dass alle auftretenden Reihen gleichmäßig konvergieren.
∂2u ∂u ∂2u mit 0 < κ < πc/l für A10) Lösen Sie die homogene Gleichung 2 = c2 2 − 2κ ∂t ∂x ∂t die gedämpfte Saitenschwingung mit den gleichen Anfangs– und Randbedingungen wie in der vorangehenden Aufgabe A9. A11) Die Kepler-Gleichung (J. Kepler 1571-1630) für die elliptische Bahn eines Planeten lautet ϕ(t) − ε sin(ϕ(t)) = ωt.
Dabei sind ω = 2π/T die Kreisfrequenz bei Umlaufzeit T , 0 ≤ ε < 1 die numerische Exzentrität der Ellipse und ϕ(t) die exzentrische Anomalie zur Zeit t. y b b
ϕ
P x
S
ω > 0 ist. Außerdem ist ϕ(0) = 0 1 − ε cos(ϕ(t)) und ϕ(T ) = 2π. Daher muss ϕ(t) monoton wachsend mit t und sin ϕ(t) aufgrund der Symmetrie der Bewegung eine ungerade Funktion von t sein.
Es gilt für alle t ∈ R, dass ϕ(t) ˙ =
Dies motiviert den Lösungsansatz ϕ(t) = ωt +
∞ X
bk sin(kωt).
k=1
Bestimmen Sie die auf J. L. Lagrange und F. W. Bessel zurückgehende Lösung durch Berechnung der Fourierkoeffizienten bk . A12) Für ein nicht-rekursives diskretes Filter mit Haltezeit T mit reellen Koeffizienten ak und 2π/T -periodischem Frequenzgang b h(ω) =
N X
ak e−jkωT
k=0
(vgl. S. 92) seien die Eingabewerte xk = cos(kωT ) für k ≥ 0, xk = 0 für k < 0. Berechnen Sie die Ausgabewerte yn für n > N .
104
5 Anwendungsbeispiele für Fourierreihen
A13) Prüfen Sie, dass man für N = 2m Knoten das T -periodische trigonometrische Interpolationspolynoms P2 im Satz auf S. 78 auch mit dem modifizierten Dirichlet-Kern m X 2π ejkω0 t − cos(mω0 t) für ω0 = darstellen kann durch Wm (t) = T k=−m
2m−1 kT 1 X (k = 0, . . . ,2m − 1). f (tk )Wm (t − tk ) = P2 (t) , tk = P (t) = 2m 2m k=0
A14) Führen Sie mit der Funktion f (t) = cos(t), 0 ≤ t < π eine DFT mit N = 15 Abtastwerten tn = nπ/N , n = 0, . . . ,N − 1, durch und verifizieren Sie an den 7 X DFT-Koeffizienten b c0 und b c1 die Alias-Formel von S. 67. Warum ist ck ej2kt b k=−7
– mit N -periodisch fortgesetzten b ck – nicht ungerade? Setzen Sie f (0) = 0, wiederholen Sie damit die DFT und bilden Sie wieder das zugehörige trigonometrische Interpolationspolynom. Was stellen Sie fest?
A15) (Approximationsgüte trigonometrischer Interpolationspolynome) Gegeben sei eine stetige 2π-periodische Funktion f : R → C mit absolut-summierbaren Fourierkoeffizienten ck , k ∈ Z. Für N = 2m sei P2 das Interpolationspolynom von XS. 78. ′′ |ck | Zeigen Sie, dass für alle t ∈ R die Fehlerabschätzung |P2 (t) − f (t)| ≤ 2 X
′′
|k|≥N/2
gilt. Das Symbol bedeutet dabei, dass die Summanden mit Indizes N/2 und −N/2 mit dem Faktor 1/2 zu multiplizieren sind.
A16) Gegeben sei ein Signal, dessen Signalfrequenzen ν im Bereich 0 ≤ ν < 80 Hz liegen. Das Signal werde mit der DFT analysiert. Die Beobachtungszeit T betrage T = 2 Sekunden. Wie groß muss die Anzahl N der Abtastwerte mindestens sein, um unerwünschte Alias-Effekte bei der Spektralanalyse zu vermeiden? A17) (a) Wo erscheinen für die Schwingung cos(2πνt), ν = 6 Hz, Werte ungleich Null im Amplitudenspektrum einer DFT mit 128 Punkten im Zeitraum 0 ≤ t ≤ 4 Sekunden? (b) Für die Schwingung cos(2πνt), ν = 100 Hz, sei eine DFT gegeben mit 128 Abtastwerten aus einem Zeitfenster von einer Sekunde. Welche Koeffizienten ck , 0 ≤ k ≤ 127, im DFT-Spektrum sind ungleich Null und warum? b A18) Für ein reelles periodisches Signal f im Frequenzband bis 600 Hz sei eine DFT gegeben mit 512 Abtastwerten aus einem Zeitfenster von 2 Sekunden. Es seien nur die DFT-Koeffizienten b c90 und b c422 von Null verschieden. Welche Frequenzen im Signal können dieses DFT-Spektrum erzeugen?
A19) Es sollen Schwingungsamplituden im Frequenzband F =]2GHz , 2GHz + 1MHz [ mit einer DFT detektiert werden. Die Frequenzauflösung sei 1/T = 5 kHz. Bestimmen Sie m und die Abtastfrequenz N/T , so dass F ⊂]mN/(2T ),(m + 1)N/(2T )[ gilt. Welche DFT-Koeffizienten einer mit diesen Größen durchgeführten DFT gehören zu f (t) = sin(2πνt) mit ν = 2000150 kHz? (Vgl. Beispiel 3, S. 73)
5.8 Übungsaufgaben
105
A20) Mit den Abtastwerten tn = n/8 + ∆t, n = 0, . . . ,7 und ∆t = 0.05 der Funktion f (t) = 6 cos(2πt) + 3 sin(4πt) − 4 sin(6πt) + 5 cos(8πt) werde eine DFT durchgeführt. Wie ist das DFT-Spektrum nur mit Kenntnis der Amplitude A = 6 des „Pilotträgers“ cos(2πt) so zu korrigieren, dass man das Spektrum der reellwertigen Funktion f erhält? (Vgl. Beispiel 4, S. 73) A21) Zeigen Sie, dass die DFT von 1/N · (xn yn )0≤n≤N −1 die N-periodische Faltung der DFT-Koeffizienten von (xn )0≤n≤N −1 und (yn )0≤n≤N −1 ist. A22) Programmieren Sie das Clenshaw-Curtis-Verfahren zur numerischen Integration und testen Sie Ihr Programm an Polynomen und in einem Vergleich mit der Trapezregel ˆ1 1 dx = ln(2). am Beispiel des Integrals 1+x 0
Vergleichen Sie dabei die relativen Fehler bei wachsender Anzahl von Stützstellen. A23) Schreiben Sie ein Programm zur Interpolation der Funktion f (x) = 1/(1 + 25x2 ) auf [−1,1] (Beispiel von C. Runge (1901)) mit n äquidistanten Knoten und mit den Tschebyscheff-Abszissen als Knoten für n = 8, n = 13 und n = 17. Stellen Sie die Ergebnisse grafisch dar und diskutieren Sie die Güte der erhaltenen Polynome als Approximationen an die Funktion f auf [−1,1]. A24) Zeigen Sie die Orthogonalität der Tschebyscheff-Polynome Tk auf [−1,1] bezüglich des inneren Produkts h.,.iw . Berechnen Sie die Alias-Beziehung für die Koeffizienten der Polynome Tk bei der Interpolation mit den Knoten xn = cos(nπ/m), n = 0, . . . ,m. Testen Sie Ihr Ergebnis, indem Sie die Funktion f = T11 + T13 − 2T23 mit 7 solcher Knoten mit einer DCT I wie auf S. 88 interpolieren. A25) Interpolation mit Tschebyscheff-Polynomen auf anderen Intervallen als [−1,1]. Gegeben sei f : [−3,7] → R, f (t) = 1/(1 + (t − 2)2 ). Bilden Sie das Intervall [−1,1] mit einer affinen Abbildung L auf [−3,7] ab, und berechnen Sie mit einer DCT II das Interpolationspolynom P vom Grad m = 12 für g(t) = f (L(t)) mit den Tschebyscheff-Abszissen xn (n = 0, . . . ,m) als Knoten. Plotten Sie die Funktion f , das Interpolationspolynom P ◦ L−1 mit den Knoten tn = L(xn ) und den Interpolationsfehler f − P ◦ L−1 . (Verwenden Sie Ihr Programm zu Aufgabe A23.) A26) Komplexe Tschebyscheff-Polynome, Entwurf analoger Tschebyscheff-Tiefpassfilter. (a)⋆ Wenn Sie Kenntnisse über komplexe Funktionen haben, dann überlegen Sie, dass für Variable z ∈ C das n-te Tschebyscheff-Polynom bestimmt ist durch Tn (cos(z)) = cos(nz).
106
5 Anwendungsbeispiele für Fourierreihen (b)⋆ Die Joukowsky-Abbildung z = z(w) = (w + w−1 )/2 bildet das Äußere des Einheitskreises umkehrbar auf das Komplement von [−1,1] in C ab. ∞ X p 1/2 (−1)n 2 Zeigen Sie, dass bei Wahl der Hauptwerte 1 − 1/z = z 2n n n=0 ∞ p X 1/2 und 1 − z 2 = (−1)n z 2n für die Wurzeln die Umkehrabbildung n n=0 p |z| > 1, z + zp 1 − 1/z 2 explizit gegeben ist durch w(z) = z + j 1 − z 2 für |z| ≤ 1,ℑ(z) > 0, p 2 |z| ≤ 1,ℑ(z) < 0. z−j 1−z wn + w−n Rechnen Sie nach, dass gilt: Tn (z) = . 2 ⋆ (c) Mit dem Ansatz Q(z) = H(z)H(−z) = 1/(1 + ε2 Tn2 (z/(jωg ))) sucht man die Pole von Q mit negativem Realteil. Setzen Sie z/(jωg ) = cos(x + jy) und zeigen Sie, dass für ε > 0 und ωg > 0 diese Pole gegeben sind durch zk = ωg sin(xk ) sinh(y) + jωg cos(xk ) cosh(y) (k = 0, . . . ,n − 1), 1 1 (2k + 1)π , y = − arsinh xk = . 2n n ε (d) Schreiben Sie ein Programm zur Lösung der folgenden Aufgabe. Mit den Polen zk , k = 0, . . . ,n − 1, aus (c) ist der Frequenzgang b h(ω) = H(jω) eines 1 2 b Tschebyscheff-Tiefpassfilters der Ordnung n mit |h(ω)| = 1 + ε2 Tn2 (ω/ωg ) n−1 Y −zk . Die Gleichspannungsverstärkung ist gegeben durch b h(ω) = b h(0) jω − zk k=0 p b h(0) = 1 für ungerade n und b h(0) = 1/ 1 + ε2 für gerade n. Mit ωg /(2π) als Grenzfrequenz ist die Dämpfung in dB (Dezibel) A(ω) = 10 log10 (1 + ε2 Tn2 (ω/ωg )).
Berechnen Sie aus folgenden Angaben ein Tschebyscheff-Tiefpassfilter mit möglichst niedriger Ordnung n: Die Grenzkreisfrequenz ωg sei gegeben durch ωg = 2π · 1000 Hz; die Stoppbandecke sei ωs = 2π · 2500 Hz. Die maximale Dämpfung an der PassbandEcke ωg sei Amax = 0.2 dB, die minimale Dämpfung an der Stoppband-Ecke Amin = 40 dB. Berechnen Sie aus den Angaben zunächst ε und die nötige Filterordnung n ∈ N, indem Sie die gegebenen Dämpfungswerte bei ωg und ωs einsetzen. Dann berechnen Sie die gesuchten Pole mit negativem Realteil wie in (c) und bilden damit den Frequenzgang des Filters. Stellen Sie den Amplitudengang |b h|, den Phasengang Φ(ω) = arg(b h(ω)), die Verzögerung −Φ(ω)/ω und die Gruppenlaufzeit D(ω) = − dΦ (ω)/ dω grafisch dar. (Man vgl. auch später in Abschnitt 10.3 den Entwurf anderer analoger Filtertypen mit rationalen Frequenzgängen – wie etwa Butterworth-Tiefpassfilter – und in Abschnitt 10.6 entsprechende diskrete Filter-Varianten.)
107
6
Zur Konvergenz von Fourierreihen
Nachdem wir in den letzten Kapiteln erste Beispiele und Anwendungen von Fourierreihen kennen gelernt haben, sollen in diesem Kapitel die zentralen Konvergenzaussagen in den Sätzen von P. L. Dirichlet und L. Fejér aus Abschnitt 3.2 und die Parseval-Gleichung genauer studiert werden. Die Beweise der Sätze werden so geführt, dass nicht so sehr ihr „juristischer Charakter“ im Vordergrund steht, sondern dass der Leser daran auch eine gute Portion Rechentechnik im Umgang mit trigonometrischen Funktionen, mit Summen und Integralen erlernen kann. Das gemeinsame Grundprinzip der Untersuchung von Näherungen fN für T -periodische Funktionen f in den folgenden Abschnitten ist die Darstellung der Näherungen in der Form 1 fN (t) = T
ˆT 0
f (s)KN (t − s) ds
mit geeigneten Integralkernen KN . Aus den Eigenschaften der untersuchten Funktion f und der Faltungskerne KN ergibt sich das Verhalten der Näherungsfunktionen fN . Beim Konvergenzverhalten der Näherungen fN wird dabei unterschieden zwischen punktweiser Konvergenz, gleichmäßiger Konvergenz und Konvergenz im quadratischen Mittel.
6.1 Der Satz von Dirichlet Gegenstand dieses Abschnitts ist der Beweis des Satzes von Dirichlet über die punktweise Darstellung stückweise stetig differenzierbarer periodischer Funktionen durch ihre Fourierreihen (vgl. S. 22). Eine detaillierte Diskussion der punktweisen Konvergenz von Fourierreihen allgemeinerer Funktionen, zum Beispiel monotoner Funktionen und Funktionen von beschränkter Variation, findet man etwa bei A. Zygmund (2003), N. K. Bary (1964) oder T. W. Körner (1989). Als typisches Beispiel einer solchen Funktion, die nicht stückweise stetig differenzierbar ist, sei hier nur auf die berühmte Cantorfunktion, auch Teufelstreppe genannt, hingewiesen. Weitere Beispiele für Fourierreihenentwicklungen von Funktionen, die nicht stückweise stetig differenzierbar sind, werden in der Aufgabe A6 behandelt. Satz. Die Fourierreihe einer stückweise stetig differenzierbaren periodischen Funktion f : R → C konvergiert an jeder Stelle t gegen (f (t+) + f (t−))/2. Beweis. Zum Beweis nehmen wir an, dass die Funktion f T -periodisch mit T = 1 ist und die Fourierkoeffizienten ck besitzt. Der Beweis der Konvergenzaussage vollzieht sich in vier Schritten.
108
6 Zur Konvergenz von Fourierreihen
1. Man benutzt entsprechend zu T = 1 die 1-periodischen Dirichlet-Kerne sin((2N + 1)πt) N für t 6∈ Z X j2πkt sin(πt) e = DN (t) = 2N + 1 k=−N für t ∈ Z und rechnet sofort nach: ˆ1
DN (t) dt =
0
ˆ1/2
ˆ1/2 DN (t) dt = 1. DN (t) dt = 2 0
−1/2
2. DN und f sind 1-periodisch. Wie schon in 3.2 gezeigt wurde, ist fN (t) =
ˆ1 N X
f (s) e−j2πks ds ej2πkt =
k=−N 0
=
ˆ1/2
ˆ1 0
DN (s)f (t − s) ds =
ˆ1/2
DN (t − s)f (s) ds
sin((2N + 1)πs) f (t − s) ds . sin(πs)
−1/2
−1/2
3. Man kann das letzte Integral in folgende Form bringen: fN (t) =
ˆ0
f (t − s) − f (t+) sin((2N + 1)πs) ds +f (t+) sin(πs)
−1/2
|
{z
}
I1 (N,t)
ˆ1/2
ˆ0
DN (s) ds
−1/2
f (t − s) − f (t−) ds +f (t−) + sin((2N + 1)πs) sin(πs) 0 {z } |
ˆ1/2 DN (s) ds 0
I2 (N,t)
1 = [f (t+) + f (t−)] + I1 (N,t) + I2 (N,t). 2
4. Da f stückweise stetig differenzierbar ist, existieren die beiden Grenzwerte (rechtsbzw. linksseitige Ableitungen bei t) lim
s→0−
f (t − s) − f (t+) sin(πs)
und
lim
s→0+
f (t − s) − f (t−) . sin(πs)
Damit sind die Integranden in den obigen Integralen I1 (N,t) und I2 (N,t) beschränkt und stückweise stetig. Nach dem Riemann-Lebesgue-Lemma in 4.5, S. 40, werden diese Integrale für N → ∞ durch die zunehmenden Oszillationen der Funktionen sin((2N + 1)πs) gelöscht:
6.2 Der Satz von Fejér, Konvergenz von Glättungen
109
lim I1 (N,t) = lim I2 (N,t) = 0 für jedes t.
N →∞
N →∞
1 Die Fourierreihe von f konvergiert überall gegen [f (t+) + f (t−)] . Besitzt f die 2 1 ˆ f (s)DN (t − s) ds für jedes t ∈ R. Mittelwerteigenschaft, so ist f (t) = lim N →∞
0
Elementare Alternativ-Beweise zur punktweisen Konvergenz von Fourierreihen findet man bei P. R. Chernoff (1980) und R. Redheffer (1984).
6.2 Der Satz von Fejér, Konvergenz von Glättungen Gleichmäßige Konvergenz der Fejér-Mittel bei stetigen Funktionen Nachdem P. Du Bois-Reymond (1831-1889) gezeigt hatte, dass es stetige, periodische Funktionen f gibt, deren Fourierreihe auf einer im Definitionsbereich von f dichten Menge divergiert, gelang es L. Fejér 1904 – immerhin erst 100 Jahre nach Fouriers Arbeiten – den folgenden, schon auf S. 23 angegebenen Satz zu beweisen: Satz. Die arithmetischen Mittel der Partialsummen Sk der Fourierreihe einer periodischen stetigen Funktion f : R → C konvergieren gleichmäßig gegen f . An Stelle der Dirichlet-Kerne Dn benutzt man zum Beweis dieses Resultats die Fejér1 Kerne Fn (t) = (D0 + . . . + Dn−1 ). Als Periode sei wieder T = 1 angenommen. n 5
12 F4 (t)
F10 (t)
4
10
3
8 6
2
4
1
2 0 0 −1
−1
0
1
−1
0
Mit der Periode T = 1 und t ∈ R \ Z gilt für n ∈ N Fn (t) =
n−1 1 X sin((2k + 1)πt) n sin(πt) k=0
für t 6∈ Z.
1
110
6 Zur Konvergenz von Fourierreihen
Die Fn sind gerade Funktionen und aus ˆ1/2
ˆ1/2
Dn (t) dt = 1 folgt
−1/2
ˆ1/2 Fn (t) dt = 1. Fn (t) dt = 2 0
−1/2
Mit sin(x) = ℑ(ejx ) und der Formel für die Summe einer endlichen geometrischen Reihe stellt man fest (Übungsaufgabe): 1 sin2 (nπt) Fn (t) = n sin2 (πt) für t ∈ R \ Z, n für t ∈ Z.
1 für t ∈ R \ Z konvergiert die n sin2 (πt) in jedem Intervall [δ,1/2], 0 < δ < 1/2, gleichmäßig gegen
Also sind alle Fn ≥ 0 und wegen Fn (t) ≤ Funktionenfolge (Fn )n∈N Null.
Beweis des Satzes von Fejér: Nach diesen Bemerkungen ergibt sich nun für periodische stetige Funktionen f mit der Periode T = 1 1/2 n−1 n−1 ˆ 1X 1X Dk (s)f (t − s) ds − f (t) Sk (t) − f (t) = n n k=0
k=0−1/2
=
ˆ1/2
Fn (s)(f (t − s) − f (t)) ds .
−1/2
Die Funktion g(s) = f (t − s) − f (t) ist stetig mit g(0) = 0. Dann gibt es zu jedem ε > 0 1 ein δ ∈ ]0, ], so dass |g(s)| ≤ ε ist für |s| < δ. 2 sin2 (nπs) 1 1 ≤ Aus der Ungleichung für alle s ∈ [δ, ] erhält man deshalb die 2 sin2 (πs) sin2 (πδ) Abschätzung ˆ ˆ X 1 n−1 Fn (s)|f (t − s) − f (t)| ds Fn (s)|g(s)| ds + Sk (t) − f (t) ≤ n k=0
|s| n + 1. Beweis. Es genügt, reellwertige Funktionen f zu betrachten. Wir bemerken, dass für beliebiges ε > 0, beliebiges 0 < δ < 1/2, für die 1-periodischen Fejér-Kerne Fn und 1-periodische, stückweise stetig differenzierbare reellwertige Funktionen f gilt
114
6 Zur Konvergenz von Fourierreihen
−ε
0 ein n0 ∈ N, so dass für n ≥ n0 und t ∈ [a + δ,b − δ] die Abschätzung n
1 X Sk (t) = n+1 k=0
ˆ1/2
Fn+1 (s)f (t − s) ds ≤
ˆδ
Fn+1 (s)f (t − s) ds + ε ≤ M + ε
−δ
−1/2
gilt, weil (t−s) ∈ [a,b] ist für |s| ≤ δ, also f (t−s) ≤ M und Fn+1 ≥ 0, Analog sieht man die Abschätzung m − ε ≤
1 n+1
n X
k=0
ˆδ
Fn+1 (s) ds ≤ 1.
−δ
Sk (t) für t ∈ [a + δ,b − δ].
Diese Ungleichungen zeigen, dass die Fejér-Mittel für genügend große n ∈ N auch in der Nähe von Sprungstellen in einem wählbaren Toleranzbereich B = B(a,b,ε,δ) mit beliebig kleinem ε gehalten werden können. Das Gibbs-Phänomen kann daher nicht auftreten. Man betrachte zur Veranschaulichung folgendes Bild und auch noch einmal die Grafik auf S. 29. M +ε M
f
ε B
m m−ε
ε a a+δ b−δ
b
Da für eine Approximation und Rekonstruktion von Funktionsverläufen T -periodischer Funktionen aus näherungsweise berechneten Spektralwerten ck in der Praxis immer nur Partialsummen von Fourierreihen verwendet werden können, spielt das Gibbs-Phänomen, allgemeiner gesprochen, das Oszillationsverhalten der Näherung eine wichtige Rolle. Die vorangehenden Überlegungen zeigen, dass die Näherungen geglättet und in vorgegebenen Toleranzbereichen gehalten werden können, wenn man zum Beispiel die Fejér-Mittel zur Approximation benutzt. Die Beweise zeigen außerdem, dass man an Stelle des DreieckFensters auch andere Gewichtsfunktionen benutzen kann. Ein Dreieck-Fenster entspricht im „Zeitbereich“ der Faltung mit einem Fejér-Kern Fn . In allen Sätzen können die Fejér-Kerne Fn durch beliebige Kerne Kn ersetzt werden, wenn diese Faltungskerne Kn , hier bezogen auf 1-periodische Funktionen, nicht-negative, ˆ1 stetige gerade Funktionen mit Kn (t) dt = 1 sind, und wenn lim Kn (t) = 0 gleichn→∞
0
mäßig in jedem Intervall [δ,1/2], 0 < δ < 1/2. Solche Kerne heißen Summationskerne.
6.3 Die Parseval-Gleichung
115
Diese Erkenntnis ist Ausgangspunkt für die Konstruktion anderer Fensterfunktionen bzw. zugehöriger Kerne, die – je nach Anwendungszweck – vorteilhaftere Näherungen als die Fejér-Mittel erzeugen. Solche Vorteile können im Vergleich zum Beispiel steilere Flanken an Sprungstellen sein, damit auch eine höhere Leistung der Näherung, eine nicht so starke Glättung – technisch gesprochen eine höhere Auflösung – und vieles mehr. Man vgl. hierzu auch die späteren Abschnitte 11.4 und 11.5 über gefensterte Fouriertransformationen. Die genannten Bedingungen an die Folge Kn der Faltungskerne können noch abgeschwächt werden, so dass nicht notwendig Kn ≥ 0 verlangt werden muss. Ein Beispiel dazu ist der de la Vallée Poussin Kern V2n = 2F2n+1 − Fn mit dem Fejér Kern Fn . Hierzu und zu anderen Faltungskernen sei auf J. S. Walker (1988) oder L. Grafakos (2008 und 2010) und dort genannte weitere Referenzen verwiesen.
6.3 Die Parseval-Gleichung Wir überlegen zuerst, dass periodische Faltungen stückweise stetiger T -periodischer Funktionen f : R → C stetig sind, und folgern daraus die Parseval-Gleichung für solche Funktionen. Sie lautet: Hat f die Fourierkoeffizienten ck , dann gilt
1 T
ˆT 0
|f (t)|2 dt =
+∞ X
k=−∞
|ck |2 .
Stetigkeit der periodischen Faltung stückweise stetiger Funktionen Es genügt, 2π-periodische Funktionen f und h mit jeweils nur einer Sprungstelle t0 bzw. t1 in [0,2π] zu betrachten. Sie haben dann die Form f = g1 + r1 und h = g2 + r2 , 1 (f (t0 +) − f (t0 −))S(t − t0 ) , π 1 h(t) = g2 (t) + (h(t1 +) − h(t1 −))S(t − t1 ) , π wobei g1 und g2 stetig auf R sind und S die 2π-periodische Sägezahnfunktion ist. Aus der gleichmäßigen Stetigkeit von g1 und g2 auf [0,2π] folgt dann sofort die Stetigkeit der Faltungen (g1 ∗ g2 )2π , (g1 ∗ r2 )2π und (g2 ∗ r1 )2π durch Abschätzungen wie zum Beispiel f (t) = g1 (t) +
ˆ2π ˆ2π r1 (s)(g2 (t + δ − s) − g2 (t − s)) ds ≤ |r1 (s)||g2 (t + δ − s) − g2 (t − s)| ds 0
0
< 2πε sup |r1 (s)| , 0≤s≤2π
da der Integrand im zweiten Integral für jedes s in [0,2π] kleiner als ein beliebiges ε > 0 wird, wenn nur δ > 0 klein genug gewählt wird. Es verbleibt also noch, die Stetigkeit der 2π-periodischen Faltung zweier Sägezahnfunktionen St0 (t) = S(t − t0 ) und St1 (t) = S(t − t1 ), t0 ,t1 ∈ [0,2π], zu prüfen. An der Gleichung
116
6 Zur Konvergenz von Fourierreihen ˆ2π 0
S(x − t0 )S(t − t1 − x) dx =
ˆ2π 0
S(u)S(t − t0 − t1 − u) du
sieht man (St0 ∗ St1 )2π (t) = (S ∗ S)2π (t − t0 − t1 ),so dass alles gezeigt ist, wenn man (π − t)/2 für 0 < t < 2π, die Stetigkeit von (S ∗ S)2π nachweist. Mit S(t) = (−t − π)/2 für −2π < t < 0, rechnet aber jeder Leser für t ∈ ]0,2π[ ganz einfach aus: t ˆ2π ˆ 1 (π − s)(π − t + s) ds + (π − s)(−t − π + s) ds (S ∗ S)2π (t) = 8π t
0
1 π π2 = − t2 + t − . 8 4 12 Mit (S ∗ S)2π (0+) = (S ∗ S)2π (2π −) ergibt sich dann die Stetigkeit der 2π-periodischen Fortsetzung auf ganz R. Die Parseval-Gleichung für stückweise stetige periodische Funktionen Ist f auf [0,T ] stückweise stetig mit den Fourierkoeffizienten ck , k ∈ Z, dann besitzt die Funktion f (−t) nach Abschnitt 4.1 die Fourierkoeffizienten ck , k ∈ Z. Damit gilt ˆT +∞ X 1 |ck |2 ejkω0 t mit f (u)f (u − t) du = für die T -periodische Faltung g(t) = T k=−∞
0
ω0 = 2π/T . Nun ist die Funktion g stetig und ihre Fourierreihe konvergiert gleichmäßig gegen g. Insbesondere gilt also die Parseval-Gleichung 1 g(0) = T
ˆT 0
2
|f (u)| du =
+∞ X
k=−∞
|ck |2 .
Damit ist auch gezeigt, dass die Fourierreihe von f im quadratischen Mittel gegen f konvergiert (vgl. S. 48). Bemerkung. Wie schon auf S. 50 bemerkt, kann man die Stetigkeit der Faltung (f ∗ h)T auch für T -periodische, auf [0,T ] quadratisch Lebesgue-integrierbare Funktionen f und h beweisen. Wie oben folgt dann die Parsevalgleichung und die Konvergenz der Fourierreihen im quadratischen Mittel auch für solche Funktionen f oder h (vgl. etwa W. Rudin (1990)).
6.4 Fourierreihen für Funktionen mehrerer Variablen Mit Hilfe der trigonometrischen Funktionen kann man auch viele Funktionen mit mehreren Variablen, die auf würfelförmigen Gebieten Q im Rn definiert sind, durch Reihenentwicklungen darstellen. Man erhält ganz analoge Ergebnisse wie im eindimensionalen Fall. Wir beschränken uns auf die exemplarische Angabe einiger Sätze für den Fall zweier Variablen.
6.4 Fourierreihen für Funktionen mehrerer Variablen
117
Satz. Ist f : Q → C auf Q = ]−π,π[ × ]−π,π[ stückweise stetig oder allgemeiner quadratisch integrierbar auf Q, so gilt die Parseval-Gleichung 1 4π 2
ˆπ ˆπ −π −π
mit den Fourierkoeffizienten clm
|f (x,y)|2 dx dy = ˆπ ˆπ
1 = 4π 2
−π −π
Es gilt das Riemann-Lebesgue-Lemma, d.h.
+∞ X
l,m=−∞
|clm |2
f (x,y) e−j(lx+my) dx dy . lim
l2 +m2 →∞
clm = 0. Das bedeutet, dass für ein
gegebenes ε > 0 höchstens endlich viele |clm | > ε sind. +∞ X Die Fourierreihe clm ej(lx+my) konvergiert im quadratischen Mittel gegen die l,m=−∞
Funktion f , d.h. für N → ∞ wird der Fehler 1 4π 2
ˆπ ˆπ f (x,y) −
−π −π
X
l2 +m2 0 ein Polynom P (x,y), so dass für alle (x,y) ∈ Q und alle (p,q) in N0 × N0 mit p + q ≤ k die folgende Ungleichung gilt: p+q ∂ ∂ p+q < ε. f (x,y) − P (x,y) ∂xp ∂y q p q ∂x ∂y
Die Funktion f lässt sich also mit allen ihren Ableitungen bis zur Ordnung k gleichmäßig durch Polynome approximieren. Diese Variante folgt aus der Beobachtung, dass die gliedweise partiell differenzierten Fejér-Mittel gleichmäßig gegen die entsprechend differenzierten, stetigen partiellen Ableitungen von f konvergieren, und dass die verwendeten trigonometrischen Funktionen bzw. ihre Ableitungen durch ihre Taylorpolynome bzw. durch deren Ableitungen gleichmäßig approximierbar sind. Alle Sätze lassen sich entsprechend auch auf andere Rechtecke als das hier benutzte Rechteck Q übertragen und gelten auch für mehr als zwei Variablen. Wir betrachten als Beispiel eine stückweise stetig differenzierbare oder allgemeiner eine quadratisch integrierbare Funktion f auf dem Rechteck Q = ]0,L1 [ × ]0,L2 [. Die Funktion f kann in eine „doppelte Sinusreihe“ entwickelt werden: Satz. Ist f auf Q = ]0,L1 [ × ]0,L2 [ stückweise stetig differenzierbar oder allgemeiner quadratisch integrierbar, dann konvergiert die Reihe ∞ X
bn,m sin
n,m=1
bn,m
nπx L1
4 = L1 L2
sin
ˆL2ˆL1 0 0
mπy L2
f (x,y) sin
,
nπx L1
sin
mπy L2
dx dy ,
im quadratischen Mittel gegen f . Um – ohne exakten Beweis – eine Idee zu diesem Satz zu geben, entwickeln wir f (x,y) für festes y in eine Sinusreihe (vgl. S. 34) f (x,y) =
∞ X
n=1
bn sin
nπx L1
2 mit bn = L1
ˆL1 0
f (x,y) sin
nπx L1
dx .
Betrachtet man bn als Funktion von y, die wiederum in eine Sinusreihe entwickelt werden kann, dann ist
6.4 Fourierreihen für Funktionen mehrerer Variablen
bn =
∞ X
bn,m sin
m=1
mπy L2
mit bn,m
119
2 = L2
ˆL2
bn sin
0
nπy L2
dy
und damit f (x,y) =
∞ X ∞ X
bn,m sin
n=1 m=1
bn,m
4 = L1 L2
ˆL2ˆL1
nπx L1
f (x,y) sin
0 0
mπy L2
sin
nπx L1
sin
,
mπy L2
dx dy .
Anwendungen von Fourierreihen mehrerer Variablen ergeben sich bei linearen partiellen Differentialgleichungen mit konstanten Koeffizienten auf würfelförmigen Gebieten. Man kann dann versuchen, solche Differentialgleichungen mit Separationsansätzen zu lösen, analog dem Vorgehen bei der Saitenschwingung. Für solche Probleme waren die Reihenentwicklungen von Bernoulli und Fourier ja gerade eingeführt worden. Erste Anwendungen waren die Lösung von Wärmeleitungsproblemen und auch die Behandlung schwingender Membranen. Hierbei führen die Eigenlösungen (man vgl. S. 4) auf das trigonometrische Funktionensystem. Wir betrachten ein Beispiel, auf das wir später in Abschnitt 8.5 noch genauer zurückkommen. Beispiel.
Auslenkung einer belasteten quadratischen Membran
Im Quadrat Q = [0,L]×[0,L] der Ebene sei eine elastische Membran am Rand fixiert. Unter dem Einfluss einer äußeren Kraft, die senkrecht zur Ebene wirkt, biegt sich die Membran durch. Die Spannung, die von der Befestigung herrührt, sei isotrop, so dass sie durch eine skalare Größe k (der Dimension N/m) beschrieben wird. Ist f die Flächendichte der Kraft, dann gilt für kleine Auslenkungen u im Gleichgewichtszustand näherungsweise (man vgl. etwa W. Greiner (2008) oder W. Strauss (1995)) 2 ∂ u ∂ 2u −k∆u = −k + 2 = f in Q, u = 0 auf dem Rand ∂Q von Q. ∂x2 ∂y mπy nπx sin sind Eigenfunktionen von −∆ zu den Die Funktionen un,m = sin L nπ 2 Lmπ 2 Eigenwerten λn,m = + , d.h. für alle n,m ∈ N gilt L L −∆un,m = λn,m un,m .
Ist die Kraftdichte f eine Linearkombination dieser Eigenfunktionen un,m , f (x,y) =
N X M X
n=1 m=1
bn,m sin
nπx L
sin
mπy L
,
dann ist die Auslenkung u mit u(x,y) = 0 auf dem Rand ∂Q gegeben durch
120
6 Zur Konvergenz von Fourierreihen
u(x,y) =
N M mπy nπx 1 X X bn,m sin , sin k n=1 m=1 λn,m L L
wie man durch Einsetzen in die Differentialgleichung leicht nachprüft. Rechte Seiten f in der Differentialgleichung, die von der Gestalt eines trigonometrischen Polynoms wie oben sind, sind meist als Näherungen für die exakte physikalische Krafteinwirkung zu verstehen. Die Lösung u ist dann ebenfalls eine Näherung der echten Membranauslenkung. Man vergleiche hierzu Übungsaufgabe A7 am Ende des Abschnitts und später Abschnitt 8.5, S. 213. Um gute Näherungen für verschiedene physikalische Situationen zu erhalten, möchte man eine Lösungstheorie für möglichst allgemeine rechte Seiten f . Dies ist möglich mit Fourierreihenentwicklungen für f und u. Je höher die Ordnung der Partialsummen dieser Reihenentwicklungen wird, desto bessere Näherungen kann man erwarten. Für quadratisch integrierbares f auf Q mit der Fourierreihendarstellung f (x,y) =
∞ X
n,m=1
bn,m sin
nπx L
sin
mπy L
ergibt sich mit dem Ansatz u(x,y) =
∞ mπy nπx 1 X bn,m sin sin k n,m=1 λn,m L L
bei gliedweiser Differentiation der Fourierreihe von u: −k∆u = −
∞ mπy X bn,m nπx sin = f (x,y). ∆ sin λ L L n,m=1 n,m
Somit ist u die gewünschte Lösung. Das Verfahren ist elegant, es erfordert jedoch eine mathematisch exakte Begründung: Die Fourierreihe von f konvergiert im Allgemeinen nicht punktweise, sondern im quadratischen Mittel gegen f , die gliedweise Differentiation der Fourierreihe von u ist ein fragwürdiges Vorgehen (vgl. Abschnitt 4.3), und es stellt sich die Frage, in welchem Sinn diese Reihe konvergiert und die Randwerte Null annimmt. Befriedigende Erklärungen liefert die Distributionentheorie. Wir greifen daher in Kapitel 8 bei den Anwendungen von Distributionen noch einmal das Beispiel der belasteten Membran auf, und erarbeiten im nächsten Kapitel einige Grundlagen der Distributionentheorie. Eine genaue Diskussion der zitierten Sätze über Fourierreihen mehrerer Variablen und Anwendungen bei der Lösung partieller Differentialgleichungen findet man etwa bei H. Triebel (1980). Analog zum Beispiel der belasteten Membran ergeben sich bei vielen anderen Fragen der mathematischen Physik Funktionensysteme als Eigenlösungen, die ähnliche Eigenschaften wie das trigonometrische System besitzen. Man kann dann oft Lösungen solcher Probleme finden, indem man an Stelle des trigonometrischen Systems Reihenentwicklungen mit dem Eigenfunktionensystem verwendet. Dieses allgemeinere Konzept, das in der klassischen Fourier-Analysis seine Wurzeln hat, wird in Kapitel 12 skizziert.
6.5 Gründe für den Übergang zu Distributionen
121
6.5 Gründe für den Übergang zu Distributionen Rückblick und Zusammenfassung Wir haben gesehen, dass Fourierreihen geeignet sind, Lösungen von Wellengleichungen, Wärmeleitungs- und Potentialproblemen zu erarbeiten und lineare zeitinvariante Systeme der Elektrotechnik oder Mechanik zu beschreiben. Am Studium solcher Beispiele haben wir einen Zugang zu Frequenz- und Spektralbegriffen gefunden, die für viele technischphysikalische Gebiete eine fundamentale Bedeutung besitzen. Wir haben die wichtigsten Rechenregeln im Umgang mit trigonometrischen Summen und Reihen gelernt (man vgl. die Tabellen auf S. 13 und S. 76), haben mit der diskreten Fouriertransformation auch einen ersten Blick auf die numerische Anwendung geworfen, und haben einige wesentliche Konvergenzeigenschaften von Fourierreihen studiert. Die meisten dieser Ergebnisse lassen sich für allgemeinere Funktionenklassen als für stückweise stetige oder stückweise stetig differenzierbare Funktionen zeigen. So lassen sich zum Beispiel die Parseval-Gleichung oder die Stetigkeit von periodischen Faltungen ˆT noch beweisen für alle T -periodischen Funktionen f mit |f (t)|2 dt < ∞. Der Übergang 0
zu solchen allgemeineren Funktionen, verbunden mit dem Übergang vom traditionellen Riemann-Integral zum modernen, in entscheidenden Punkten flexibleren Lebesgue-Integral und schließlich zur Distributionentheorie ist dabei nicht nur ein mathematischer Zeitvertreib, sondern geht zurück bis auf die Vorbehalte und Bedenken gegen Fouriers Ansätze 1807 und auf Erfordernisse, die aus der Praxis und ihren Anwendungsproblemen heraus eine solche Weiterentwicklung der mathematischen Werkzeuge erzwingen. Dies lässt sich schon an Beispielen mit unseren bis jetzt erworbenen Kenntnissen leicht erläutern. Übergang zu Distributionen und Lebesgue-Integral Will man etwa bei der Behandlung der schwingenden Saite Anfangsbedingungen f (x) mit folgenden Formen wählen, f (x)
0
f (x)
oder
l
x
0
l
x
um ein rechentechnisch überschaubares mathematisches Modell für eine gezupfte Saite zu studieren, so sieht man an der D’Alembertschen Form der Lösung (vgl. S. 60) sofort, dass die formal errechnete Lösung u(x,t) keinesfalls eine zweimal differenzierbare Funktion
122
6 Zur Konvergenz von Fourierreihen
ist. Was soll sie dann aber bedeuten, da man sie doch in eine Differentialgleichung zweiter Ordnung einsetzen will? Wir haben auch gesehen, dass gliedweise Ableitungen der Fourierreihen periodischer Funktionen mit Sprungstellen in der Regel nicht mehr konvergieren. Dennoch sind etwa die Partialsummen der Dirichlet-Kerne gut als Näherung einer periodischen Impulsfolge zu verstehen (vgl. S. 12). Könnte man dann nicht die zugehörige Fourierreihe, trotzdem sie überall divergiert, als eine ideale Impulsfolge auffassen und auch mathematisch solide damit rechnen? Antworten auf solche Fragen und auch sichere Rechenmethoden, die überdies im Vergleich zur klassischen Differentialrechnung vieles erleichtern, ergeben sich aus der Theorie der Distributionen. Bei der Behandlung stabiler zeitinvarianter linearer Systeme, die durch gewöhnliche Differentialgleichungen gegeben waren, wurde in Abschnitt 5.2 bei periodischen rechten Seiten f solcher Gleichungen vorausgesetzt, dass f stetig und stückweise stetig differenzierbar sein sollte. Für viele Anwendungsfälle ist dies eine sehr einschränkende Voraussetzung. Ein Beispiel wären etwa periodische Ein- und Ausschaltvorgänge, beschrieben durch eine unstetige Rechteckmäander-Funktion f . Der Grund für diese Einschränkung war der mit dem Riemann-Integral verwendete herkömmliche Stammfunktionen-Begriff. Die Bessel-Ungleichung und die Parseval-Gleichung wurden „ohne Theorieaufwand“ nur für stückweise stetige periodische Funktionen gezeigt. Die Parseval-Gleichung für Funktionen f aus L2 ([0,T ]) (vgl. S. 49) beseitigt diese Einschränkung und ergibt dann praktikable Anwendungsmöglichkeiten von Fourierreihen beim Studium linearer Systeme (man vgl. auch noch einmal die Bemerkung auf S. 53). Der Riemannsche Integralbegriff wird dabei ersetzt durch das Lebesgue-Integral. Das Lebesgue-Integral schließt den Bereich der integrierbaren Funktionen so ab, wie die reellen Zahlen den Bereich der rationalen Zahlen. Etwa gibt es Beispiele, bei denen eine Folge (fn )n∈N Riemann-integrierbarer Funktionen auf [a,b] ⊂ R für n → ∞ gegen eine Funktion f konvergiert, die nicht mehr Riemann-integrierbar ist. Insbesondere gilt dann nicht lim
n→∞
ˆb a
fn (t) dt =
ˆb
lim fn (t) dt .
n→∞
a
Von V. Volterra (1860-1940) stammt ein Beispiel einer differenzierbaren Funktion f auf [0,1], deren Ableitung f ′ beschränkt, aber nicht Riemann-integrierbar ist (man vgl. etwa I. Natanson (1981)). Insbesondere gilt dann nicht ˆ1 0
f ′ (t) dt = f (1) − f (0) .
Bei Funktionen mehrerer Variablen ist beim Riemann-Integral die Vertauschbarkeit der Integrationsreihenfolge und die Gleichheit ˆd ˆb ˆb ˆd f (x,y) dx dy = f (x,y) dy dx c
a
a
c
6.6 Übungsaufgaben
123
im Allgemeinen nur richtig, wenn neben der Existenz der Integrale ˆb
f (x,y) dx
und
a
ˆd
f (x,y) dy
c
auch die Beschränktheit von f vorausgesetzt wird. Die Vertauschbarkeit der Integrationsreihenfolge ist daher bei uneigentlichen Riemann-Integralen ohne Zusatzvoraussetzungen nicht gesichert. Auch die Existenz des uneigentlichen Riemann-Integrals einer Funktion f ist nicht gleichbedeutend mit der Existenz des entsprechenden uneigentlichen Integrals der Betragsfunktion |f |. Nun möchte der Praktiker gerne an seinem eigentlichen Problem arbeiten, ohne ständig Rücksicht auf Konvergenzprobleme nehmen zu müssen, er möchte eigentlich am liebsten immer differenzieren, integrieren, falten, Grenzwertbildungen mit Integralen und Reihen vertauschen dürfen – und tut dies gewöhnlich ohne allzu große Sorge auch. Dass bei solch fragwürdigen Vorgehensweisen häufig trotzdem, ja oft gerade erst dadurch vernünftige Ergebnisse erarbeitet werden, und wie sie zu interpretieren sind, das wollen wir im nächsten Kapitel über Distributionentheorie verstehen lernen. Dabei benützen wir ab jetzt den 1902 von H. Lebesgue (1875-1941) gefundenen Integralbegriff, der heute vielfach schon in Anfängervorlesungen gelehrt wird und der hinsichtlich Vertauschbarkeit von Integralen mit Grenzwertbildungen leistungsfähiger und damit auch rechentechnisch einfacher als das Riemann-Integral zu handhaben ist. Für anwendungsorientierte Leser ergeben sich bei der Lektüre der folgenden Kapitel daraus keine zusätzlichen Schwierigkeiten im Vergleich zur eingeübten Integralrechnung. Mathematisch interessierte Leser finden die im Folgenden benutzten Hilfsmittel aus der Integrationstheorie mit entsprechenden Literaturangaben in Anhang B zusammengestellt. Eine lesenswerte Darstellung der historischen Entwicklung der Distributionentheorie im Kontext zwischen Mathematik und theoretischer Physik findet man bei K. H. Peters (2004).
6.6 Übungsaufgaben A1) Rechnen Sie nach, dass
n−1 X
sin((2k + 1)πt) =
k=0
sin2 (nπt) ist. sin(πt)
A2) Berechnen Sie durch Taylorreihenentwicklung des Integranden näherungsweise Si(π) =
ˆπ
sin(t) dt . t
0
A3) Berechnen Sie die Steigung der Fejér-Mittel im Nullpunkt für die Sägezahnfunktion S(t) = (π − t)/2 in ]0,2π[, S(t + 2kπ) = S(t), k ∈ Z. Vergleichen Sie die entsprechenden Steigungen der Partialsummen der Fourierreihe von S.
124
6 Zur Konvergenz von Fourierreihen
A4) Zeigen Sie, dass für stetige T -periodische Funktionen f und T -periodische SummaT /2 ˆ 1 f (t − s)Kn (s) ds gleichmäßig tionskerne Kn (vgl. S. 114) die Näherungen T gegen f konvergieren.
−T /2
A5) Rechnen Sie nach, dass die Fourierreihe der 2π-periodischen Funktion −1 für t ∈ ]−π , 0], f (t) = +1 für t ∈ ]0 , π] in ]0,π[ strikt positive, in ]−π,0[ strikt negative Partialsummen besitzt. Überlegen Sie, in welchem Toleranzgebiet um den Graphen von f die Fejér-Mittel für genügend große n ∈ N gehalten werden können. A6)⋆ Beispiel einer Fourierreihe einer unbeschränkten periodischen Funktion. (a) Zeigen Sie, dass die Fourierreihe einer auf [0,2π] absolut integrierbaren 2πperiodischen Funktion f an einer Stelle t0 , an der f differenzierbar ist, gegen f (t0 ) konvergiert. t (b) Zeigen Sie, dass f (t) = ln 2 sin , t 6= 2kπ, k ∈ Z, auf [0,2π] absolut 2 integrierbar ist. ∞ X cos(nt) (c) Zeigen Sie, dass für t 6= 2kπ, k ∈ Z, und f aus (b) gilt: f (t) = − . n n=1 X ∞ cos(nt) t = (−1)n+1 für t 6= (2k + 1)π, k ∈ Z. (d) Zeigen Sie: ln 2 cos 2 n n=1
Hinweis: Inspizieren Sie den Beweis des Satzes von Dirichlet auf S. 108 und verwenden Sie S(0+) = π/2 beim Sägezahn S (siehe S. 21). A7)⋆ Gegeben sei ein Quadrat Q = [0,L]2 , an dessen Rand eine belastete elastische Membran fixiert sei. Die Seitenlänge betrage L = 1 m, die Spannung k = 2 N/m. Die Flächendichte der äußeren Kraft betrage konstant f (x,y) = 1 N/m2 .
Berechnen Sie eine Näherung der Auslenkung u(x,y) der Membran im Gleichgewichtszustand, d.h. lösen Sie −k∆u = f in Q, u = 0 auf dem Rand von Q, indem 3 nπx mπy X Sie die Funktion f durch die Partialsumme bn,m sin sin ihL L n,m=1 rer Fourierreihenentwicklung ersetzen. Wie groß ist die errechnete Auslenkung im Punkt mit den Koordinaten x = y = L/2 ? Erzeugen Sie eine grafische Darstellung dieser Näherungslösung und vergleichen Sie mit dem Bild auf S. 218.
125
7
Grundzüge der Distributionentheorie
7.1 Beschreibung von Funktionen durch Mittelwerte In den Grundvorlesungen des Studiums erlernt man, zum Beispiel Schwingungen oder Spannungen, Stromstärken etc. durch Funktionen f (t), t ∈ R, zu beschreiben und damit zu rechnen. Die Vorstellung, die mit einem solchen mathematischen Modell verbunden ist, beinhaltet, dass man, wenn t ein Zeitparameter ist, die interessierenden physikalischen Größen zu jeder Zeit, von Zeitpunkt zu Zeitpunkt ihrem Wert nach genau kennt. Dies ist aber eine Idealvorstellung. Realistischerweise kennt man physikalische Größen in der Praxis hauptsächlich durch Mittelwerte aus Messungen. Ist zum Beispiel f (t) = v(t) = x(t) ˙ die Geschwindigkeit bei einer Zugfahrt, so schätzt man üblicherweise die Momentangeschwindigkeit v(t0 ) zu einer Zeit t0 durch die mittlere Geschwindigkeit in einem gewissen Zeitintervall [t0 − ε,t0 + ε]: +∞ ˆ 1 v(t0 ) ≈ v(t)ϕε (t) dt = (x(t0 + ε) − x(t0 − ε)) , 2ε −∞
mit ϕε (t) =
1 für |t − t0 | ≤ ε, ϕε (t) = 0 für |t − t0 | > ε. Mit ε = 1/n folgt 2ε +∞ ˆ v(t0 ) = lim v(t)ϕ1/n (t) dt . n→∞ −∞
Die Momentangeschwindigkeit ist ein (idealer) Grenzwert von Mittelwerten und auch in der Praxis punktweise selbst gar nicht zugänglich. Allgemeiner wäre eine ideale Messung des Wertes f (t0 ) einer stetigen Messgröße f zu einem Zeitpunkt t0 schematisch zu beschreiben durch Messwert f (t0 )
f Abtastsystem
Ein realistisches Messgerät wird aber bei dieser Abtastung ein An- und Abschwingverhalten zeigen. Die reale Messung wird also nicht genau den Abtastwert f (t0 ) liefern, sondern +∞ ˆ einen gewichteten Mittelwert f (t)ϕ(t) dt der Funktion f mit einer für das Messgerät −∞
charakteristischen Gewichtsfunktion ϕ.
126
7 Grundzüge der Distributionentheorie
Schematisch: +∞ ˆ f (t0 ) ≈ f (t)ϕ(t) dt
f Messgerät mit Gewichtsfunktion ϕ
−∞
Mathematisch lässt sich nun zeigen, dass man jede stetige Funktion f durch Kenntnis +∞ ˆ der gewichteten Mittel f (t)ϕ(t) dt von f mit hinreichend vielen Gewichtsfunktionen −∞
ϕ auch punktweise rekonstruieren kann. Punktweise Rekonstruktion stetiger Funktionen aus Mittelwerten Wir betrachten folgende glatte Gewichtsfunktion: 2 c · e−1/(1−t ) für |t| < 1 ϕ(t) = 0 +∞ für |t| ≥ 1 , ˆ wobei die Konstante c so gewählt wird, dass ϕ(t) dt = 1. −∞
0.5
ϕ(t)/c
0 −1
0
1
Mit dieser unendlich oft differenzierbaren Funktion ϕ definiert man für t0 ∈ R und n ∈ N ϕt0 ,n (t) = nϕ(n(t − t0 )) . 1 Es gilt ϕt0 ,n (t) = 0 für |t − t0 | ≥ und n
+∞ ˆ ϕt0 ,n (t) dt = 1 für alle n ∈ N.
−∞
(ϕt0 ,n „konzentriert sich“ für wachsendes n immer mehr um t0 .) ϕt0 , n=10 (t)/c
3
0 0
1 t0 − 10
t0
1 t0 + 10
7.1 Beschreibung von Funktionen durch Mittelwerte
127
Für eine stetige Funktion f ergibt sich dann +∞ ˆ t0ˆ+1/n (f (t) − f (t0 ))ϕt0 ,n (t) dt f (t)ϕt0 ,n (t) dt − f (t0 ) = −∞
t0 −1/n
≤
sup |t−t0 |≤1/n
|f (t) − f (t0 )|
t0ˆ +1/n
ϕt0 ,n dt −→ 0 .
t0 −1/n
|
n→∞
{z
}
=1
Somit lässt sich der Funktionswert von f an einer beliebigen Stelle t0 aus den gewichteten +∞ ˆ Mitteln f (t)ϕt0 ,n (t) dt zurückgewinnen: −∞
+∞ ˆ f (t0 ) = lim f (t)ϕt0 ,n (t) dt . n→∞ −∞
Der Begriff „Mittelwert“ ist angebracht, da nach dem Mittelwertsatz der Integralrechnung +∞ ˆ f (t)ϕt0 ,n (t) dt = f (tn ) ergibt mit einer Stelle tn , so dass |t0 − tn | ≤ 1/n.
−∞
Der aufmerksame Leser bemerkt das mathematisch vollkommen gleiche Vorgehen wie bei der Darstellung stetiger, periodischer Funktionen durch Grenzwerte ihrer Fejér-Mittel. Die Rolle der Fejér-Kerne als Gewichtsfunktionen wurde hier nur übernommen von den Glättungskernen ϕt0 ,n (vgl. Kapitel 6). Zusammenfassung. Für eine physikalische Größe f erhält man durch Messungen in der Regel Informationen über gewisse gewichtete Mittelwerte von f , „die Größe f wird durch Messungen ermittelt“. Anstatt physikalische Größen durch Funktionen f (t), t ∈ R, zu beschreiben, kann man sie beschreiben durch ihre Mittelwerte: Jeder Gewichtsfunktion ϕ +∞ ˆ aus einem geeigneten Vektorraum D wird der Mittelwert f (t)ϕ(t) dt zugeordnet. Ist −∞
die Menge D der Gewichtsfunktionen reichhaltig genug, so kennt man durch die lineare Abbildung Tf : D → R, +∞ ˆ Tf (ϕ) = f (t)ϕ(t) dt −∞
auch f selbst. Dies ist einer der Grundgedanken der Distributionentheorie. Im folgenden Abschnitt führen wir eine geeignete, d.h. eine hinreichend große Menge von unendlich oft differenzierbaren Gewichtsfunktionen ein. Statt von Gewichtsfunktionen spricht man auch von Testfunktionen. Alle Funktionen werden bis auf Weiteres als reellwertig vorausgesetzt.
128
7 Grundzüge der Distributionentheorie
7.2 Testfunktionen Wir betrachten Funktionen ϕ : R → R, die beliebig oft differenzierbar sind und außerhalb eines (von ϕ abhängigen) beschränkten Intervalls [a,b] identisch verschwinden. Man sagt, der Träger von ϕ liegt in [a,b]. Der Träger Tr(ϕ) von ϕ ist die abgeschlossene Hülle der Menge { t ∈ R | ϕ(t) 6= 0 }. Der Träger von ϕ ist eine kompakte, d.h. eine abgeschlossene und beschränkte Menge in R. Definition. Die Menge D aller solchen Funktionen ϕ wird als Raum der Testfunktionen bezeichnet. Man kann sich sofort klarmachen, dass D ein Vektorraum über R ist, d.h. mit ϕ1 ,ϕ2 ∈ D, λ ∈ R sind auch λϕ1 ∈ D und ϕ1 + ϕ2 ∈ D. Der Raum der Testfunktionen enthält sehr viele Funktionen: Beispiele sind etwa die im letzten Abschnitt benutzten Funktionen ϕ(t) und ϕt0 ,n (t) = nϕ(n(t − t0 )); der Träger Tr(ϕt0 ,n ) von ϕt0 ,n ist das abgeschlossene Intervall [t0 − 1/n,t0 + 1/n]. Auch Produkte dieser Funktionen mit beliebigen, unendlich oft differenzierbaren Funktionen ergeben wieder Testfunktionen in D. Konvergenz von Testfunktionen Zwei Gewichtsfunktionen ϕ1 und ϕ2 aus D sind „sehr wenig unterschiedlich“, wenn sich (k) (k) neben ϕ1 und ϕ2 auch alle ihre Ableitungen ϕ1 und ϕ2 , k ∈ N, nur wenig unterscheiden. Die Erfahrung zeigt, dass näherungsweise gleiche Messapparate, d.h. solche mit wenig unterschiedlichen Gewichtsfunktionen ϕ1 und ϕ2 bei Messung von f auch wenig unter+∞ +∞ ˆ ˆ schiedliche Messwerte f (t)ϕ1 (t) dt und f (t)ϕ2 (t) dt liefern. Diese Beobachtung −∞
−∞
findet ihre mathematische Entsprechung in einer Stetigkeitsforderung an die Abbildung +∞ ˆ Tf (ϕ) = f (t)ϕ(t) dt . Hierzu benötigt man einen Konvergenzbegriff in D, der aus−∞
drückt, was „sehr wenig unterschiedliche“ Testfunktionen sind. Definition. Eine Folge (ϕn )n∈N von Testfunktionen konvergiert gegen ϕ in D, wenn alle ϕn und ϕ gemeinsam außerhalb eines geeigneten Intervalles verschwinden, und wenn außerdem die ϕn gleichmäßig gegen ϕ und alle Ableitungen ϕ(k) n gleichmäßig gegen die Ableitung ϕ(k) , k ∈ N, konvergieren, mit anderen Worten also genau dann, wenn für alle n ∈ N und ein geeignetes r > 0 gilt ϕn (t) = 0
und ϕ(t) = 0
für |t| ≥ r ,
und wenn für alle k ∈ N0 gilt
(k) sup ϕ(k) (t) − ϕ (t) −→ 0 . n t∈R
n→∞
Wir schreiben dann ϕ = D-lim ϕn , um diesen Konvergenzbegriff deutlich von anderen n→∞ Konvergenzarten zu unterscheiden.
7.3 Der δ-Impuls
129
2
c · e−1/(1−t ) für |t| < 1 ist beliebig oft differenzier0 für |t| ≥ 1 bar und verschwindet für |t| ≥ 1. Der Träger von ϕ ist das Intervall [−1,1]. Dies gilt auch für alle Ableitungen ϕ(k) . Beispiel. Die Funktion ϕ(t) =
1 ϕ konvergiert in D gegen die Nullfunktion: D-lim ϕn = 0 . n→∞ n (k) Denn alle Ableitungen ϕ sind beschränkt, und daher folgt Die Folge ϕn =
ϕ(k) n (t) =
1 (k) ϕ (t) −→ 0 gleichmäßig. n→∞ n
Dagegen konvergieren die Folge ψn c e−n2 /(n2 −t2 ) 1 t ψn (t) = ϕ = n n n 0
für |t| < n für |t| ≥ n
und alle ihre Ableitungen ψn(k) zwar ebenfalls gleichmäßig gegen die Nullfunktion, aber diese Folge konvergiert nicht im Sinne der D-Konvergenz, weil es kein beschränktes Intervall gibt, welches die Träger aller ψn zugleich enthält. Die Distributionentheorie beinhaltet das Studium linearer, stetiger Abbildungen auf dem Vektorraum D der Testfunktionen, mithin das Studium physikalischer Größen anhand von gewichteten Mitteln. Diese Theorie geht auf P. Dirac (1902-1984) zurück, wurde entwickelt etwa ab 1935 von S. L. Sobolev (1908-1989), in den Jahren 1945-1950 von L. Schwartz (1915-2002) u.a. Sie ermöglicht zum Beispiel ein mathematisches Modell für Impulse und einen Differenzierbarkeitsbegriff auch für Funktionen mit Sprungstellen.
7.3 Der δ-Impuls Impulse in der Elektrotechnik In der Elektrotechnik gibt es Schaltungen, die näherungsweise differenzierende Wirkung besitzen: R K1 K2
Un
In Ip
− +
C Ue
R
C Up
Ua
130
7 Grundzüge der Distributionentheorie
Bei einem idealen Operationsverstärker mit obiger Beschaltung gilt für die Ströme In = Ip = 0 und für die Spannungen Un = Up . Aus den Kirchhoffschen Regeln für die Ströme und Spannungen ergeben sich folgende Knotengleichungen: dU n Ua − Un −C = 0, R dt d( Ue − Up ) Up C − = 0. dt R
K1 : K2 :
Mit Un = Up erhält man durch Gleichsetzen der linken Seiten Ua = RC
dU e . dt
Die Schaltung realisiert ein (näherungsweise ideales) Differenzierglied. Als Eingangsgröße Ue (t) wählen wir nun eine Gleichspannung U0 ab t = 0: n 0 für t ≤ 0 Ue (t) = U0 s(t) , s(t) = 1 für t > 0.
Ue (t) ist für t = 0 nicht differenzierbar. Dieser Spannungsverlauf ist wieder eine vereinfachte Vorstellung mit einem idealen Schalter, welche die Problematik aufwirft, wie dann dU e (t) Ua (t) = RC zu verstehen ist. Wir nähern uns der Antwort, indem wir die Sprungdt funktion Ue (t) als Grenzfunktion einer Folge glatter Spannungsverläufe Un (t) mit immer steileren Flanken auffassen: Ue (t) = lim Un (t) n→∞
für t ∈ R .
Man könnte etwa ausgehen von der glatten Funktion −1/(1−t2 ) e für |t| < 1 ψ(t) = 0 für |t| ≥ 1 und glatte Spannungsverläufe Un (t) darstellen durch für kt ≤ 0 0 Un (t) = U0 · e ·ψ(n(kt − 1/n)) für 0 < kt < 1/n U0 für kt ≥ 1/n
(e = e1 die Eulerzahl, kt physikalisch dimensionslos mit numerischem Wert von t). U1 (t) U3 (t)
U0 0 0
0.3
0.5
1
7.3 Der δ-Impuls
131
Man erwartet, dass die zu Un (t) gehörigen Ausgangsgrößen RCU0 fn (t) = RCUn′ (t) sich mit wachsendem n ∈ N der Antwort Ua (t) des Differenziergliedes auf die Sprungfunktion Ue (t) annähern. Wir veranschaulichen die Funktionen RCUn′ (t) für R = 1 Ω, C = 1 F: RCU1′ (t) RCU3′ (t) U0 0 0
0.3
0.5
1
Für festes n ∈ N stellt man also bei Erregung Un (t) am Ausgang des Differenziergliedes den „Spannungsstoß“ RCU0 fn (t) = RCUn′ (t) fest. Stets gilt +∞ ˆ RCU0 fn (t) dt = RC(Un (1/n) − Un (0)) = RCU0 .
−∞
Da andererseits fn (t) = Un′ (t)/U0 = 0 ist für kt ≤ 0 und kt ≥ 1/n, gilt im Sinn der punktweisen Konvergenz: lim fn (t) = 0
n→∞
für alle t ∈ R.
Würde man im idealisierten Grenzfall Ua (t) = lim RCU0 fn (t) einsetzen, dann wäre n→∞
Ua (t) = 0 für jedes t, während bei Vertauschung der Grenzwertbildung mit der Integration folgen würde: +∞ +∞ +∞ ˆ ˆ ˆ Ua (t) dt = RCU0 fn (t) dt = RCU0 . lim RCU0 fn (t) dt = lim n→∞
−∞
−∞
n→∞ −∞
Eine solche Funktion Ua (t) im herkömmlichen Sinn kann es nicht geben. Mathematisch liegt folgende Situation vor: Gegeben ist eine Funktionenfolge unendlich oft differenzier+∞ ˆ barer Funktionen fn (t), so dass lim fn (t) = 0 für alle t ∈ R ist und fn (t) dt = 1 für n→∞ alle n ∈ N. −∞ Definition des δ-Impulses Es gibt keine klassische Funktion δ(t), so dass punktweise δ(t) = lim fn (t), fn (t) wie n→∞ +∞ +∞ ˆ ˆ oben, und δ(t) dt = lim fn (t) dt = 1 ist. Obwohl δ(t) als Funktion von t ∈ R −∞
n→∞ −∞
nicht definiert werden kann, ist es aber durchaus sinnvoll, den Grenzwert für n → ∞ aus
132
7 Grundzüge der Distributionentheorie
+∞ ˆ den Mitteln fn (t)ϕ(t) dt für jede Testfunktion ϕ zu bilden. Man definiert daher den δ−∞
Impuls nicht punktweise für t ∈ R, sondern durch Integralwerte mit Testfunktionen ϕ ∈ D. Die Funktionen fn sind gegeben durch fn (t) = Un′ (t)/U0 . Definition. Der δ-Impuls ist definiert durch die Zuordnung +∞ ˆ ϕ ∈ D → δ(ϕ) = lim fn (t)ϕ(t) dt . n→∞ −∞
Vielfach wird in der Literatur auch die Schreibweise δ(t) = lim fn (t) verwendet und n→∞
δ(ϕ) durch ein Integralsymbol notiert:
+∞ +∞ ˆ ˆ δ(ϕ) = δ(t)ϕ(t) dt = lim fn (t)ϕ(t) dt . n→∞ −∞
−∞
Das mitgeschriebene Argument t in der Schreibweise δ(t) für den δ-Impuls dient dabei dem Hinweis auf den Integrationsparameter der rechten Seite und meint nicht, dass einzelnen Stellen t ein Funktionswert zugeordnet werden kann. Das Integral auf der linken Seite ist kein Integral im herkömmlichen Sinn, sondern ein Symbol, dessen Bedeutung erst durch die rechte Seite festgelegt wird. Schreibt man formal δ(t) = lim fn (t), dann entspricht n→∞ die obige „Integralbeziehung“ formal einer Vertauschung der Grenzwertbildung mit der Integration. Diese Vertauschung führt im Sinn klassischer Funktionen auf Widersprüche. δ(t) ist keine Funktion von t im herkömmlichen Sinn, sondern wird eine verallgemeinerte Funktion oder Distribution genannt. Diese Distribution wird nach P. Dirac auch als DiracDistribution, als Dirac-Impuls oder kurz als δ-Impuls bezeichnet. Wir verwenden ebenfalls die genannten Schreibweisen und lernen, wie man korrekt mit verallgemeinerten Funktionen arbeitet. Auswertung des δ-Impulses, Ausblendeigenschaft Trotz der noch üblichen Schreibweise δ(t) hat also diese verallgemeinerte Funktion für sich allein genommen an keiner einzigen Stelle t einen Wert. Die Benutzung von δ(t) wird +∞ ˆ immer verstanden in dem Sinn, dass erst die Mittelbildung δ(ϕ) = δ(t)ϕ(t) dt mit −∞
einer Testfunktion ϕ einen Zahlenwert liefert. Wir wollen diesen Zahlenwert berechnen und zeigen, dass sich ergibt: +∞ ˆ δ(ϕ) = δ(t)ϕ(t) dt = ϕ(0) . −∞
7.3 Der δ-Impuls
133
Es waren fn (t) = Un′ (t)/U0 mit für kt ≤ 0 0 Un (t) = U0 · e ·ψ(n(kt − 1/n)) für 0 < kt < 1/n U0 für kt ≥ 1/n
und
ψ(t) =
−1/(1−t2 ) e 0
für |t| < 1 für |t| ≥ 1 .
Für jedes n ∈ N ist fn ≥ 0, fn unendlich oft differenzierbar mit Träger Tr(f ) = [0,1/n], +∞ ˆ ˆ1/n fn (t) dt = 1 . und fn (t) dt = −∞
0
Für ϕ ∈ D gilt daher +∞ ˆ fn (t)ϕ(t) dt − ϕ(0) ≤ −∞
sup 0≤t≤1/n
ˆ1/n fn (t) dt −→ 0 . |ϕ(t) − ϕ(0)| n→∞
0
Damit ist die behauptete Beziehung schon nachgewiesen: +∞ +∞ ˆ ˆ δ(t)ϕ(t) dt − ϕ(0) = lim fn (t)ϕ(t) dt − ϕ(0) = 0 . n→∞ −∞
−∞
Bezeichnet nun δ(t − t0 ) den um t0 verschobenen δ-Impuls, definiert für ϕ ∈ D durch +∞ +∞ ˆ ˆ δ(t − t0 )ϕ(t) dt = lim fn (t − t0 )ϕ(t) dt , n→∞ −∞
−∞
dann gilt entsprechend +∞ +∞ ˆ ˆ δ(t − t0 )ϕ(t) dt = δ(t)ϕ(t + t0 ) dt = ϕ(t0 ) .
−∞
−∞
Ein solcher zeitlich um t0 verschobener Impuls tritt an unserem Differenzierglied auf, wenn die Eingangsspannung U0 s(t) zeitlich zu U0 s(t − t0 ) verschoben wird. Die Einführung von δ mit der oben gewählten Folge fn zeigt, dass nicht nur für Testfunktionen, sondern für beliebige stetige Funktionen f : R → R und jedes t0 ∈ R folgt: +∞ ˆ δ(t − t0 )f (t) dt = f (t0 ) .
−∞
Ergebnis. Anwendung von δ-Impulsen ist daher ein geeignetes mathematisches Modell, um Punktauswertungen und Abtastvorgänge bei stetigen Funktionen zu beschreiben. Man sagt auch, δ(t) besitzt die Ausblendeigenschaft.
134
7 Grundzüge der Distributionentheorie
δ-Funktionen als verallgemeinerte Dichtefunktionen In der Physik werden (verallgemeinerte) „δ-Funktionen“ häufig verwendet, um diskrete Verteilungen anzugeben, zum Beispiel von Massen oder Ladungen. Man benutzt dabei n X mi δ(x−xi ) als verallgemeinerte Massendichte, um n Punktmassen mi an etwa ̺(x) = i=1
den Stellen xi (auf der Zahlengeraden) zu beschreiben. Dann kann man für Berechnungen mit kontinuierlichen und diskreten Verteilungen einheitlich dieselben Formeln verwenden. Etwa gilt für den Schwerpunkt S der Punktmassen
S=
+∞ ´
x̺(x) dx
−∞ +∞ ´
= ̺(x) dx
−∞
=
n P
mi
i=1 n P
+∞ ´
x
n P
−∞ i=1 +∞ n ´ P −∞ i=1
−∞ +∞ ´ −∞
mi δ(x − xi ) dx
mi δ(x − xi ) dx
xδ(x − xi ) dx
mi
i=1
+∞ ´
n P
mi xi = i=1 . n P m i δ(x − xi ) dx i=1
Bemerkung. Ein Vergleich mit Anhang B zeigt, dass durch Integrale der Form +∞ ˆ n X mi f (xi ) f (x)̺(x) dx = i=1
−∞
Integrale bezüglich des diskreten Maßes m, welches jedem Intervall I in R die Masse X m(I) = mi zuordnet, beschrieben werden. Das Maß m(I) misst die in I verteilte n xi ∈I X mi δ(x − xi ) dx zur Bezeichnung des Maßes Masse. Oft wird auch dm = ̺(x) dx = i=1
m geschrieben. Von diesem Aspekt ist auch die Bezeichnung für Distributionen abgeleitet: Das englische Wort „distribution“ heißt Verteilung.
Der δ-Impuls als Ableitung der Einheitssprungfunktion Für unser Beispiel mit der vereinfachten Eingangsspannung Ue (t) = U0 s(t) bedeutet RCU0 δ(t) den (idealen) Impuls, der zur Zeit t = 0 mit der Impulsstärke RCU0 am Ausgang des behandelten Differenziergliedes erscheint: U0 s(t) RC
d dt
RCU0 δ(t)
7.4 Distributionen
135
Man fasst daher δ(t) als verallgemeinerte Ableitung der Einheitssprungfunktion auf. Man kann δ(t) durch einen Pfeil veranschaulichen, dessen Höhe der Impulsstärke entspricht. U0 s(t) RC U0
d dt
RCU0 δ(t)
t 0
t 0
Bemerkung. Ist U0 eine Spannung in V und s(t) eine physikalisch dimensionslose Funktion der Zeit t in s, so kann man δ(t) die physikalische Einheit 1/s geben. Die Impulsstärke hat dann die Einheit Vs, der Impuls RCU0 δ(t) wieder die Spannungseinheit V. Zusammenfassung.
Wir bemerken, dass durch die Zuordnung +∞ ˆ ϕ ∈ D → δ(ϕ) = δ(t)ϕ(t) dt = ϕ(0) −∞
eine lineare stetige Abbildung vom Raum D der Testfunktionen in die reellen Zahlen definiert wird. Somit ist unsere erste Distribution δ(t) ein Beispiel für das in Abschnitt 7.1 skizzierte Konzept der Beschreibung physikalischer Größen – hier eines Impulses – anhand von Mittelwerten. Der Impuls δ(t) kann zu keinem Zeitpunkt wertemäßig erfasst werden, aber Mittelbildungen mit Gewichtsfunktionen ϕ ∈ D liefern Zahlenwerte. Wie manche Leser wohl schon aus Grundvorlesungen wissen, gelingt es durch Einführung dieser ersten Distribution δ(t), etwa lineare zeitinvariante Systeme auf einfache Art zu beschreiben mittels Begriffen wie der Impulsantwort, der Übertragungsfunktion, usw. Wir werden darauf später noch genau zu sprechen kommen. Dabei lässt man diese Distribution zu als rechte Seite und möglicherweise als Lösungsanteil bei linearen, gewöhnlichen Differentialgleichungen mit konstanten Koeffizienten. Schon diese wenigen Bemerkungen weisen auf eine Vielfalt von Anwendungsmöglichkeiten hin. In den folgenden Abschnitten soll das Konzept der Distributionen und ihrer Verwendung bei der Behandlung von linearen Differentialgleichungen mit konstanten Koeffizienten allgemeiner erläutert werden.
7.4 Distributionen Definition von Distributionen Ganz analog zur Sichtweise, den δ-Impuls als eine lineare stetige Abbildung vom Vektorraum D der Testfunktionen in die reellen Zahlen aufzufassen, definiert man Distributionen allgemein. Distributionen nennt man synonym auch verallgemeinerte Funktionen.
136
7 Grundzüge der Distributionentheorie
Definition. Eine Distribution oder verallgemeinerte Funktion T ist eine lineare stetige Abbildung T : D → R, d.h. für a,b ∈ R, ϕ1 ,ϕ2 ∈ D und ϕ = D-lim ϕn in D gelten n→∞
T (aϕ1 + bϕ2 ) = aT (ϕ1 ) + bT (ϕ2 ) und T (ϕ) = lim T (ϕn ). Die Menge aller Distribun→∞ tionen wird mit D′ bezeichnet. Bemerkungen
1. Für den Wert T (ϕ) einer Distribution T bei gegebener Testfunktion ϕ sind in der Literatur auch folgende Schreibweisen üblich +∞ ˆ T (ϕ) = hT,ϕi = hT (t),ϕ(t)i = T (t)ϕ(t) dt . −∞
Wir werden sie ebenfalls benutzen. Die Motivation für diese Schreibweisen ergibt sich aus dem folgenden Satz und den anschließenden Beispielen für Distributionen. Man schreibt T (t) statt T , wenn man die Variable des zugrunde liegenden Parameterraumes noch mit anzeigen will, auch wenn T (t) nicht im Sinn eines Funktionswertes an einer Stelle t aufzufassen ist. 2. Bei konkret gegebenen linearen Abbildungen T : D → R ist es meist sehr leicht, die geforderte Stetigkeit zu zeigen. Es sind auch keine „physikalischen“ linearen Abbildungen T : D → R bekannt, die nicht auf D stetig sind. Leser, die an der topologischen Struktur von D und D′ interessiert sind, seien auf die Bücher von L. Schwartz (1957) oder W. Rudin (1990) hingewiesen. Wie sich die δ-Distribution anschaulich als „Limes“ einer Folge unendlich oft differenzierbarer Funktionen fn darstellen lässt, so gilt auch allgemein folgender Satz. Zu jeder Distribution T gibt es eine Folge (fn )n∈N unendlich oft differenzierbarer Funktionen, so dass für jede Testfunktion ϕ ∈ D gilt +∞ ˆ T (ϕ) = lim fn (t)ϕ(t) dt . n→∞ −∞
Die Funktionen fn können dabei sogar so gewählt werden, dass sie beschränkte Träger besitzen, also Testfunktionen sind. Man schreibt dann kurz T = D′ -lim fn und nennt T den n→∞ distributionellen Limes der fn . Eine Distribution T ist also Limes einer Funktionenfolge (fn )n∈N , zwar im Allgemeinen nicht im Sinn von punktweiser Konvergenz der Funktionenfolge, wie wir schon beim δ-Impuls gesehen haben, jedoch gilt nach obigem Satz: Die mit einer Testfunktion ϕ gewichteten Mittel der fn konvergieren gegen eine ˆ reelle Zahl. Diese Zahl T (ϕ) erhält man
in beliebig guter Näherung durch ein Integral
fn (t)ϕ(t) dt mit einer Näherungsfunktion
fn für die Distribution T , wenn nur n gehörig groß wird. Wir erhalten diese Tatsache später (S. 167) aus Sätzen über Faltungen und wenden uns zunächst Beispielen zu.
7.4 Distributionen
137
Grundlegende Beispiele von Distributionen Alle Funktionen in diesem und dem nächsten Abschnitt werden als reellwertig vorausgesetzt. Die Erweiterung der Begriffe und Beispiele auf den Fall komplexwertiger Funktionen und Distributionen erfolgt in Abschnitt 7.6. 1. Der Impuls δ : D → R ist eine Distribution im oben definierten Sinn. Mit c1 ,c2 ∈ R, ϕ,ϕn ∈ D für n ∈ N, ϕ = D-lim ϕn gilt: n→∞
hδ,c1 ϕ1 + c2 ϕ2 i = c1 ϕ1 (0) + c2 ϕ2 (0) = c1 hδ,ϕ1 i + c2 hδ,ϕ2 i , lim hδ,ϕn i = lim ϕn (0) = ϕ(0) = hδ, D-lim ϕn i . n→∞
n→∞
n→∞
Somit ist δ auf D linear und stetig. Gleiches gilt für einen um t0 verschobenen Impuls δ(t − t0 ). 2. Jede lokal-integrierbare Funktion f (d.h. f und |f | sind integrierbar über jedes beschränkte Intervall) kann als Distribution Tf aufgefasst werden, nämlich durch +∞ ˆ Tf (ϕ) = hf,ϕi = f (t)ϕ(t) dt
(ϕ ∈ D) .
−∞
Dies motiviert auch die in der vorangehenden Bemerkung erwähnte Schreibweise für Distributionen allgemein. Die Definition zeigt sofort, dass Tf linear auf D ist.
Ist ϕ = D-lim ϕn und [a,b] ein Intervall, welches die Träger aller ϕn enthält, so ergibt n→∞ sich ˆ |f (t)| dt −→ 0 . |Tf (ϕn ) − Tf (ϕ)| ≤ sup |ϕn (t) − ϕ(t)| n→∞
t∈[a,b]
[a,b]
Aus der gleichmäßigen Konvergenz der ϕn gegen ϕ auf [a,b] folgt also die Stetig+∞ ˆ keit von Tf auf D. Daher ist mit f durch Tf (ϕ) = f (t)ϕ(t) dt eine Distribution gegeben. −∞
Beispielsweise kann so die Funktion ln(|t|) als Distribution betrachtet werden. Die Sichtweise, lokal-integrierbare Funktionen jetzt auch als Distributionen zu verstehen, entspricht genau dem in Abschnitt 7.1 dargelegten Konzept, eine Funktion durch ihre Mittelwerte mit Gewichtsfunktionen ϕ aus D zu beschreiben. Damit kennt man bereits eine große Menge von Distributionen. Distributionen, die solche klassischen, lokal-integrierbaren Funktionen sind, nennt man regulär. Distributionen, die keine lokal-integrierbaren Funktionen sind, wie zum Beispiel die δ-Distribution, nennt man singulär. Für reguläre Distributionen Tf ist es üblich, statt Tf auch wieder nur f zu schreiben und ihre Werte für ϕ ∈ D anzugeben durch +∞ ˆ Tf (ϕ) = hTf ,ϕi = hf,ϕi = f (t)ϕ(t) dt . −∞
138
7 Grundzüge der Distributionentheorie Zwei Funktionen f und g auf R sind genau dann gleich, wenn f (t) = g(t) für alle t in R gilt. Ganz entsprechend sind zwei Distributionen T und G genau dann gleich, wenn T (ϕ) = G(ϕ) ist für jede Testfunktion ϕ aus D. Bei zwei regulären Distributionen Tf und Tg sind für beliebige Testfunktionen ϕ alle Integralwerte Tf (ϕ) und Tg (ϕ) gleich, wenn sich f und g zum Beispiel nur an endlich vielen Stellen, allgemein höchstens auf einer Nullmenge (vgl. Anhang B) unterscheiden. In einem solchen Fall gilt also Tf = Tg .
3. Pseudofunktionen, Regularisierung divergenter Integrale. Neben den regulären Distributionen und der δ-Distribution gibt es auch viele singuläre Distributionen. Typische Beispiele ergeben sich bei divergenten Integralen von Funktionen mit Singularitäten wie etwa rationalen Funktionen. Rationale Funktionen und ihre Fouriertransformierten spielen eine große Rolle in der linearen Systemtheorie und Schaltungsentwicklung (zu Anwendungen vgl. Kap. 10). a) Der Cauchy-Hauptwert. Ausgangspunkt ist die Funktion f (t) = 1/t, t = 6 0, die ˆε auf R nicht lokal-integrierbar ist. Das uneigentliche Integral f (t) dt, ε > 0, ist divergent. Andererseits existiert für a > 0 der Grenzwert −ε ˆ−ε ˆ+a lim f (t) dt + f (t) dt = 0 .
ε→0+
−a
ε
Deshalb wird durch vp(f )(ϕ) = lim
ε→0+
ˆ−ε −∞
+∞ ˆ f (t)ϕ(t) dt + f (t)ϕ(t) dt eine Disε
tribution vp(f ) definiert. Für ϕ ∈ D mit Tr(ϕ) ⊂ [−a,a], a > 0, gilt nämlich ˆ−ε ˆ−ε ˆa ˆa ϕ(t) − ϕ(0) ϕ(0) ϕ(0) ϕ(t) − ϕ(0) vp(f )(ϕ) = lim dt + dt + dt + dt . ε→0+ t t t t −a
−a
ε
ε
Da nach dem Mittelwertsatz |ϕ(t) − ϕ(0)| ≤ |t| max |ϕ′ (t)| ist, existieren die −a≤t≤a
Grenzwerte der beiden äußeren Integrale für ε → 0, ε > 0. Die beiden mittleren Integrale addieren sich zu Null. Hieraus folgt, dass vp(f )(ϕ) für alle ϕ ∈ D definiert ist. Linearität und Stetigkeit von vp(f ) auf D ergeben sich dann unmittelbar. Die singuläre Distribution vp(f ) heißt Cauchy-Hauptwert von f („valeur principale“; in englischsprachiger Literatur meist durch pv(f ) als „ principle value“ notiert). Man nennt den Cauchy-Hauptwert auch eine Regularisierung des divergenten Integrals von 1/t. Für ϕ ∈ D mit 0 ∈ / Tr(ϕ) ist nämlich vp(f )(ϕ) einfach das (konvergente) Integral von f (t)ϕ(t) über R: vp(f )(ϕ) =
ˆ∞ −∞
ϕ(t) dt = t
ˆ∞ 0
ϕ(t) − ϕ(−t) dt . t
7.4 Distributionen
139
b) Die Pseudofunktionen pf(t−m ), m ∈ N. Für negative Potenzen t−m mit m ≥ 2 ˆ∞ m −m ϕ(t) + (−1) ϕ(−t) dt für ε → 0 im Allgemeinen diversind die Integrale t ε
gent, der Cauchy-Hauptwert wie in a) existiert daher nicht. Um nun die Singularität bei t = 0 zu kompensieren, subtrahiert man bei der auf M. Hadamard zurückgehenden Regularisierung von jeder Testfunktion ϕ ihr Taylorpolynom Tm−1 ϕ vom Grad m − 1 mit Entwicklungspunkt an der Singularität t = 0 und integriert an Stelle von ϕ den Taylorschen Rest Rm ϕ = ϕ − Tm−1 ϕ. Die entstehende Distribution nennt man eine Pseudofunktion und notiert sie durch pf(t−m ). Nach M. Hadamard ist dies der endliche Anteil („ partie finie“) des divergenten Integrals. m−1 X ϕ(k) (0) Für ϕ ∈ D, m ≥ 1 definiert man also mit Rm ϕ(t) = ϕ(t) − tk die k! k=0
Pseudofunktion pf(t−m ) durch pf(t
−m
)(ϕ) =
ˆ∞
t
−m
0
m Rm ϕ(t) + (−1) Rm ϕ(−t) dt .
|t|m max{|ϕ(m) (t)| : t ∈ Tr(ϕ)}. m! Das uneigentliche Integral pf(t−m )(ϕ) ist daher konvergent für alle ϕ ∈ D.
Nach der Taylorformel gilt |Rm ϕ(t)| ≤
Auch Linearität und Stetigkeit von pf(t−m ) auf D folgen sofort. Für m = 1 gilt pf(t−1 ) = vp(t−1 ). Ein Vorteil dieser Regularisierung nach Hadamard ist, dass für ϕ ∈ D mit 0 ∈ / Tr(ϕ) das Taylorpolynom mit dem Entwicklungspunkt t = 0 verschwindet und dann pf(t−m )(ϕ) mit dem konvergenten Integral von t−m ϕ(t) übereinstimmt: pf(t
−m
+∞ ˆ
)(ϕ) =
−∞
ϕ(t) dt = tm
ˆ∞
ϕ(t) + (−1)m ϕ(−t) dt tm
0
(0 ∈ / Tr(ϕ)).
−m −m c) Die Pseudofunktionen pf(t−m ) für m ∈ N. + ), pf(t− ) und pf(|t|
−m Für t+ = s(t)t−m , s(t) die Einheitssprungfunktion, betrachten wir zunächst
ˆ∞ ε
t
−m
Rm ϕ(t) dt =
ˆ1
t
−m
Rm ϕ(t) dt +
ε
ˆ∞
t
−m
Rm−1 ϕ(t) dt +
ˆ∞ 1
1
ϕ(m−1) (0) dt . (m − 1)t
Dabei sei R0 ϕ(t) = ϕ(t). Die beiden ersten Integrale der rechten Seite sind für alle ϕ ∈ D konvergent für ε → 0. Das dritte Integral der rechten Seite ist für t → ∞ divergent. Eine Möglichkeit der Regularisierung von t−m + ist daher, diesen divergenten Anteil durch Null zu ersetzen und die Pseudofunktion pf(t−m + ) zu definieren durch: −m pf(t+ )(ϕ)
=
ˆ1 0
t
−m
Rm ϕ(t) dt +
ˆ∞ 1
t−m Rm−1 ϕ(t) dt
140
7 Grundzüge der Distributionentheorie pf(t−m + )(ϕ) =
ˆ∞ 0
ϕ(m−1) (0) m−1 t s(1 − t) dt . t−m Rm−1 ϕ(t) − (m − 1)!
Linearität und Stetigkeit auf D sind leicht zu sehen. Ganz analog kann man auch mit −m −m t− = s(−t)t−m die Pseudofunktionen pf(t−m ) definieren durch: − ) und pf(|t| −m pf(t− )(ϕ)
=
ˆ∞
t
−m
0
ϕ(m−1) (0) m−1 m (−1) Rm−1 ϕ(−t) + t s(1 − t) dt (m − 1)!
−m m pf(|t|−m ) = pf(t−m + ) + (−1) pf(t− ) . −m Damit folgen sofort pf(t−m ) = pf(t−m + ) + pf(t− ) und für gerade m ∈ N auch −m −m pf(|t| ) = pf(t ).
4. Für Maße m auf R mit einer Dichtefunktion ̺, notiert oft durch dm = ̺(x) dx, wird durch +∞ ˆ ˆ T (ϕ) = ϕ dm = ϕ(x)̺(x) dx (ϕ ∈ D) −∞
eine Distribution definiert. Generell definiert jedes Maß m (vgl. Anhang B) durch ˆ T (ϕ) = ϕ dm (ϕ ∈ D) auch eine Distribution. Distributionen sind also Verall-
gemeinerungen sowohl von Funktionen als auch von Maßen.
Das obige Maß m mit einer integrierbaren Dichtefunktion ̺ entspricht der regulären n X mi δ(x − xi ) (vgl. S. 134) ist zu identifiDistribution T̺ , das diskrete Maß m e = zieren mit der singulären Distribution S
i=1
ˆ n n X X mi ϕ(xi ) . mi δ(x − xi ),ϕ(x)i = ϕ dm e = S(ϕ) = h i=1
i=1
Bemerkung. In technisch-physikalischen Problemstellungen sind oft auch Ausdrücke der Form T (ϕ) auszuwerten, bei denen ϕ nicht notwendigerweise eine Testfunktion aus D ist. Häufig lassen sich aber gegebene Distributionen T als stetige lineare Funktionale auf einer größeren Klasse von Funktionen als auf D definieren. D ist eine Menge von Funktionen, auf der alle solchen linearen Funktionale T gemeinsam operieren. Zum Beispiel lässt sich die Dirac-Distribution δ(ϕ) für alle ϕ definieren, die um den Nullpunkt stetig sind, reguläre Distributionen Tf lassen sich fortsetzen auf alle ϕ, für welche das Produkt f ϕ integrierbar ist. Die Pseudofunktionen pf(t−m ± ) lassen sich anwenden auf alle hinreichend schnell abfallenden, beliebig oft differenzierbaren Funktionen ϕ, usw. Durch Einschränkung auf den gemeinsamen Definitionsbereich D stellt die Distributionentheorie einen Kalkül zur Verfügung, der für alle solchen Funktionale T gleichermaßen gilt. In späteren Kapiteln über die Fouriertransformation werden wir diese Bemerkung aufgreifen und auch mit einem weiteren bewährten Testfunktionenraum, der größer als D ist, als Definitionsbereich von Distributionen arbeiten (vgl. Kap. 9, S. 243).
7.5 Rechnen mit Distributionen
141
Zusammenfassung. Neben dem klassischen Funktionsbegriff erscheint für den Ingenieur und Naturwissenschaftler der mit Messvorgängen anschaulich verbundene Begriff von gewichteten Mittelwerten einer als Distribution verstandenen Messgröße T sehr natürlich. Das interessierende Objekt ist die Distribution T mit ihren Eigenschaften. Ihre Werte T (ϕ) auf Testfunktionen sind Zahlenwerte, welche einzelnen, gewichteten Mittelwerten, anschaulich gesprochen einzelnen Messwerten von T entsprechen. Der Ingenieur kann wie im vorangehenden Beispiel 2 lokal-integrierbare Funktionen f ganz selbstverständlich mit den zugehörigen Distributionen Tf identifizieren. Er weiß zum Beispiel erfahrungsgemäß, dass man eine periodische Rechtecksfunktion in der Praxis näherungsweise gut durch eine Überlagerung harmonischer Schwingungen realisieren kann. Dabei ist dann die „ideale“ Rechtecksfunktion r(t) als Distribution aufzufassen, nämlich als distributioneller Limes der unendlich oft differenzierbaren Partialsummen der zu r(t) gehörigen Fourierreihe. Die Näherung kann so gut erfolgen, dass zum Beispiel Leistungsunterschiede im Vergleich zur „Idealfunktion“ r(t) (das sind auch Integralmittel) beliebig klein werden. Ganz analog stelle man sich daher jede Distribution als einen solchen Limes klassischer Funktionen vor, Limes im Sinne der Existenz von Grenzwerten für gewichtete Mittel und nicht unbedingt punktweise. Häufig genug interessieren in der Praxis ja auch nur solche Mittelwerte physikalischer Größen. Genaue Lektüre technischer Literatur zeigt, dass in vielen Fällen „distributionell“ gerechnet wird, ohne dass dies explizit angemerkt ist. Die Vorteile dieses Konzeptes bezüglich Differentiation und anderer mathematischer Grenzwertbildungen werden sich in den folgenden Abschnitten herausstellen, in denen das Rechnen mit Distributionen erläutert wird.
7.5 Rechnen mit Distributionen Distributionen zeichnen sich dadurch aus, dass man in vielen Fällen mit ihnen wesentlich leichter rechnen kann als mit herkömmlichen Funktionen. Hierzu ist es notwendig, einige Operationen in D′ einzuführen. Für die Ableitung einer differenzierbaren Funktion f verwenden wir die Notation f ′ , für die im Folgenden eingeführte verallgemeinerte Ableitung einer Distribution T (t) zunächst die Notation T˙ (t), später auch wieder T ′ (t). Differentiation von Distributionen Distributionen dürfen beliebig oft ohne jede Einschränkung differenziert werden. Sind nämlich T = D′ -lim fn , alle fn beliebig oft differenzierbar, und ϕ ∈ D mit Träger n→∞
Tr(ϕ) ⊂ [a,b], so folgt durch partielle Integration, dass folgender Grenzwert existiert: +∞ ˆb ˆ b ′ lim fn (t)ϕ(t) dt = lim fn (t)ϕ(t) a − fn (t)ϕ′ (t) dt . n→∞ n→∞ | {z } −∞
=0
a
142
7 Grundzüge der Distributionentheorie
Also ist lim
+∞ +∞ ˆ ˆ fn′ (t)ϕ(t) dt = − lim fn (t)ϕ′ (t) dt = −T (ϕ′ ) .
n→∞ −∞
n→∞ −∞
Man kann daher die Ableitung T˙ einer Distribution T auf folgende Weise einführen. Definition. Die Ableitung T˙ einer Distribution T = D′ -lim fn ist definiert durch n→∞
T˙ = D′ -lim fn′ . n→∞
Für ϕ ∈ D ist
T˙ (ϕ) = −T (ϕ′ ).
Bei regulären Distributionen Tf schreibt man auch wieder f˙ statt T˙f . Linearität und Stetigkeit von T˙ auf D sind leicht nachzuprüfen: Für ϕ = D-lim ϕm und a,b ∈ R gelten: m→∞
lim T˙ (ϕm ) = − lim T (ϕ′m ) = −T (ϕ′ ) = T˙ (ϕ)
m→∞
m→∞
T˙ (aϕ1 + bϕ2 ) = −T (aϕ′1 + bϕ′2 ) = aT˙ (ϕ1 ) + bT˙ (ϕ2 ) . Höhere Ableitungen der Ordnung k definiert man analog durch T (k) = D′ -lim fn(k) . n→∞
Dies bedeutet bei Anwendung auf ϕ ∈ D für die k-te Ableitung von T T (k) (ϕ) = (−1)k T (ϕ(k) ) . Beispiel. Für die Sprungfunktion 0 für t < 0 1 σ(t) = für t = 0 , 2 1 für t > 0
(aufgefasst als reguläre Distribution) und beliebige ϕ ∈ D gilt mit den Schreibweisen Tσ = σ und T˙σ = σ˙ hT˙σ ,ϕi = hσ,ϕi ˙ = −hσ,ϕ′ i = −
+∞ ˆ ϕ′ (t) dt = ϕ(0) = hδ,ϕi . 0
σ(ϕ) ˙ und δ(ϕ) ergeben also für jedes ϕ ∈ D den gleichen Wert, d.h. es gilt die Gleichung σ˙ = δ in D′ , auch notiert als σ(t) ˙ = δ(t), wenn man die ursprüngliche Funktionsvariable t noch anzeigen will. Man kann somit eine Sprungfunktion differenzieren. Dies ist im Rahmen der klassischen Analysis nicht möglich gewesen. Entsprechend ist σ(t ˙ − t0 ) = δ(t − t0 ).
7.5 Rechnen mit Distributionen
143
0 für t ≤ 0 , so hat dies keinen Ein1 für t > 0 fluss auf Integrale von σ(t) oder s(t). Also stellen σ(t) und s(t) dieselbe Distribution dar: Tσ = Ts . Ebenso gilt dann die Gleichung s˙ = δ in D′ . Diese Beziehung findet man auch ˆt häufig notiert in der Form δ(τ ) dτ = s(t). Ändert man σ(t) im Nullpunkt ab zu s(t) =
−∞
d dt
s(t) 1
1
t
0
δ(t) t
0
Der Leser verifiziert leicht folgende Tatsachen: 1. D′ ist ein Vektorraum. 2. Für T ∈ D′ und beliebig oft differenzierbare Funktionen f ist auch das Produkt f · T , für ϕ ∈ D definiert durch hf · T,ϕi = hT,f · ϕi, eine Distribution. Weitere Ableitungsregeln. Die Ableitung ist linear und es gilt die Produktregel: (cT )(k) = cT (k) , (S + T )(k) = S (k) + T (k) , (f T )(k) =
k X k
n=0
n
f (n) T (k−n)
für k ∈ N0 , c ∈ R, S,T ∈ D′ und unendlich oft differenzierbare Funktionen f . Denn für jedes ϕ ∈ D und k = 1 gilt: h(cT )(1) ,ϕi = −chT,ϕ′ i = hcT˙ ,ϕi , ˙ h(S + T )(1) ,ϕi = −hS,ϕ′ i − hT,ϕ′ i = hS,ϕi + hT˙ ,ϕi ,
h(f T )(1) ,ϕi = −hf T,ϕ′ i = −hT,f ϕ′ i = −hT,f ϕ′ + f ′ ϕi + hT,f ′ ϕi = hT˙ ,f ϕi + hT,f ′ ϕi = hf T˙ + f ′ T,ϕi .
Entsprechend ergeben sich diese Regeln bei höheren Ableitungen mit k > 1 durch vollständige Induktion. Fasst man jetzt lokal-integrierbare Funktionen als Distributionen auf, so kann man sie ohne jede Einschränkung differenzieren, auch wenn sie Sprungstellen besitzen. Man spricht von verallgemeinerter Ableitung. Für eine reguläre Distribution Tf zu einer differenzierbaren Funktion f ist hT˙f ,ϕi = hf˙,ϕi = −
+∞ +∞ ˆ ˆ f (t)ϕ′ (t) dt = f ′ (t)ϕ(t) dt = hf ′ ,ϕi = hTf ′ ,ϕi .
−∞
−∞
144
7 Grundzüge der Distributionentheorie
Das bedeutet, dass für differenzierbare f der klassische Ableitungsbegriff und der Begriff der verallgemeinerten Ableitung äquivalent sind bezüglich Integration von Ableitungen gegen Testfunktionen. Bemerkung. Man beachte, dass eine Multiplikation T · G in D′ zwischen Distributionen T und G allgemein p nicht definiert ist. Zum Beispiel ist durch die lokal-integrierbare Funktion f (t) = 1/ |t| eine reguläre Distribution gegeben; dagegen ist f 2 (t) = 1/|t| nicht lokal-integrierbar, das Produkt f 2 kann erst durch die Regularisierung pf(|t|−1 ) als Distri˙ bution interpretiert werden. Ebenfalls in D′ nicht definiert sind Ausdrücke wie δ(t) · δ(t), δ 2 (t) oder f (t)δ(t) für Funktionen f , die nicht unendlich oft differenzierbar sind. Es sei aber bemerkt, dass auf einer D′ umfassenden erweiterten Klasse verallgemeinerter Funktionen Multiplikationen wie s(t)δ(t) oder δ 2 (t) zwischen Distributionen durchaus erklärt werden können. Eine solche Erweiterung der Theorie verallgemeinerter Funktionen hat fundamentale Bedeutung, wenn man nicht-lineare Gleichungen zwischen verallgemeinerten Funktionen studieren will. Hierzu sei verwiesen auf die Arbeiten von J. C. Colombeau (1992) und M. Oberguggenberger (1992) und auf die dort genannten Referenzen.
Weitere Beispiele 1. Für beliebig oft differenzierbares f ergibt sich folgende wichtige Regel: f (t)δ(t − t0 ) = f (t0 )δ(t − t0 ) . Wieder ist zu zeigen, dass die behauptete Beziehung richtig ist bei Anwendung auf eine beliebige Testfunktion ϕ ∈ D: hf (t)δ(t − t0 ),ϕ(t)i = hδ(t − t0 ),f (t)ϕ(t)i
= f (t0 )ϕ(t0 ) = hf (t0 )δ(t − t0 ),ϕ(t)i .
Eine bemerkenswerte Konsequenz dieser Beziehung ist zum Beispiel, dass die Gleichung tT (t) = 1 in D′ wegen ktδ(t) = 0 die Lösungen T (t) = vp(1/t) + kδ(t) mit beliebigen Konstanten k besitzt. Im nachfolgenden Beispiel 8 zeigen wir, dass es keine weiteren Lösungen mehr gibt. 2. Für f (t) = |t| ist
−1 für t < 0 f˙(t) = sgn(t) = 0 für t = 0 . 1 für t > 0
Denn für ϕ ∈ D ergibt sich mit partieller Integration hf˙,ϕi = −hf,ϕ′ i = − =−
ˆ0
−∞
+∞ +∞ ˆ ˆ0 ˆ ′ ′ tϕ′ (t) dt |t|ϕ (t) dt = tϕ (t) dt −
−∞
ϕ(t) dt +
+∞ ˆ
ϕ(t) dt =
0
−∞
0
+∞ ˆ
−∞
sgn(t)ϕ(t) dt = hsgn ,ϕi .
7.5 Rechnen mit Distributionen
145
Anschaulich f˙(t)
f (t) 1
1
−1
t
1
t
0 −1
Man kann also auch Funktionen mit „Knickstellen“ differenzieren, wenn man sie als Distributionen auffasst. Die bisherigen Beispiele demonstrieren folgende Merkregel für verallgemeinerte Ableitungen. Hat eine Funktion f (t) etwa bei t0 einen „Knick“, einen Sprung bei t1 , und ist ansonsten differenzierbar, so entsteht bei der verallgemeinerten Ableitung f˙(t) bei t0 ein Sprung von f ′ (t0 −) auf f ′ (t0 +) und bei t1 ein δ-Impuls der Stärke f (t1 +) − f (t1 −). 3. Gegeben sei die Funktion 0 at f (t) = at0 2 0
für t t0
f (t) = at[σ(t) − σ(t − t0 )], aufgefasst als Distribution, liefert f˙(t) = a[σ(t) − σ(t − t0 )] + at[σ(t) ˙ − σ(t ˙ − t0 )] = a[σ(t) − σ(t − t0 )] + a · 0 · δ(t) − at0 δ(t − t0 ). Daher ist f˙(t) = a[σ(t) − σ(t − t0 )] − at0 δ(t − t0 ). f˙(t)
f (t) a
at0
t0
t
t
−at0 4. Mit f (t) = t folgt für m ∈ N und ϕ ∈ D hf δ (m) ,ϕi = (−1)m hδ,(f ϕ)(m) i = (−1)m mϕ(m−1) (0), also f δ (m) = −mδ (m−1) .
146
7 Grundzüge der Distributionentheorie
5. Die Ableitung von ln(|t|). Wir zeigen, dass die Ableitung von T (t) = ln(|t|) durch den Cauchy-Hauptwert vp(1/t) gegeben ist (vgl. S. 138): Für ϕ ∈ D mit Träger Tr(ϕ) ⊂ [−a,a], a > 0, folgt mit partieller Integration ˆ−ε ˆa ϕ(t) ϕ(t) 1 ,ϕi = lim dt + dt hvp ε→0+ t t t −a ε = lim (ϕ(−ε) − ϕ(ε)) ln(ε) + (ϕ(a) − ϕ(−a)) ln(a) ε→0+ {z } | =0
−
ˆ−ε
−a
′
ln(|t|)ϕ (t) dt −
ˆa
′
ln(|t|)ϕ (t) dt .
ε
′
Nach dem Mittelwertsatz ist ϕ(−ε) − ϕ(ε) = 2εϕ (u), u ∈ [−ε,ε] geeignet; also ist lim (ϕ(−ε) − ϕ(ε)) ln(ε) = 0. Weil ln(|t|) lokal-integrierbar ist, folgt das Ergebnis
ε→0+
ˆa 1 hvp ,ϕi = − ln(|t|)ϕ′ (t) dt = hT˙ ,ϕi . t −a
Die Distribution T (t) = ln(|t|) ist regulär, ihre Ableitung T˙ (t) = vp(1/t) dagegen eine singuläre Distribution. −m 6. Die Ableitungen der Pseudofunktionen pf(t−m + ) und pf(t− ), m ∈ N.
−m ′ Wir berechnen die verallgemeinerte Ableitung von pf(t−m + ), die wir durch pf(t+ ) notieren, mit Hilfe von partieller Integration. Dazu halten wir zunächst fest, dass für m−1 X ϕ(k) (0) tk gilt: Rm ϕ(t) = ϕ(t) − k! k=0
′
(Rm ϕ(t)) = Rm ϕ′ (t) +
ϕ(m) (0) m−1 t (m − 1)!
(ϕ ∈ D).
ϕ(m) (0) m t = Rm+1 ϕ(t) ist daher eine Stammfunktion für Rm ϕ′ (t). Diese m! speziell gewählte Stammfunktion mit der Konstante K = −ϕ(0) erlaubt die partielle Integration der im Folgenden auftretenden uneigentlichen Integrale, ohne dass deren Konvergenz verloren geht. Wir berechnen damit für ϕ ∈ D (vgl. S. 139) Rm ϕ(t)−
pf
′ t−m +
Mit lim
ε→0+
ergibt sich:
(ϕ) =
ε
−m
′ −pf(t−m + )(ϕ )
=−
Rm+1 ϕ(ε) = 0 und
ˆ1 0
ˆ1 0
t
−m
′
Rm ϕ (t) dt −
ˆ∞
t−m Rm−1 ϕ′ (t) dt .
1
′ ϕ(m) (0) t−m Rm+1 ϕ(t) dt = Rm ϕ(1) − m!
7.5 Rechnen mit Distributionen
′ −pf(t−m + )(ϕ )
147
1 ˆ1 −m = − t Rm+1 ϕ(t) − −mt−(m+1) Rm+1 ϕ(t) dt 0
0
∞ ˆ∞ −(m+1) −m Rm ϕ(t) dt + t Rm ϕ(t) − −mt 1
1
ˆ1 ˆ∞ ϕ(m) (0) −(m+1) = + −mt Rm+1 ϕ(t) dt + −mt−(m+1) Rm ϕ(t) dt . m! 0
Daher haben wir mit
1
ϕ(m) (0) (−1)m (m) = hδ (t),ϕ(t)i das Ergebnis m! m!
pf t−m +
′
(−1)m (m) −m−1 = pf −mt+ + δ (t). m!
Vollkommen analog erhält man auch die folgenden verallgemeinerten Ableitungen: (−1)m (m) −m−1 δ (t), − = pf −mt− m! ′ −m−1 −m−1 = pf −mt−m−1 , + pf −mt− pf t−m = pf −mt+ ((−1)m − 1) (m) ′ −m−1 −m−1 δ (t). + + (−1)m pf −mt− pf |t|−m = pf −mt+ m! −m pf t−
′
7. Die Gleichung tn T (t) = 0 in D′
In späteren Kapiteln (Kap. 9 und 10) treten bei der Berechnung von Fouriertransformationen insbesondere Gleichungen der Form tn T (t) = u(t) mit u(t) = 1, u(t) = s(t) oder u(t) = sgn(t) auf. Um ihre allgemeinen Lösungen in D′ zu finden, bestimmen wir zunächst die allgemeine Lösung der homogenen Gleichung: Die allgemeine Lösung der Gleichung tn T (t) = 0 in D′ ist für n ∈ N gegeben durch T =
n−1 X
ck δ (k)
k=0
mit beliebigen Konstanten ck , k = 0, . . . n − 1.
Beweis. Aus Beispiel 1 auf S. 144 folgt tn δ (k) (t) = 0 für 0 ≤ k < n, also ist n−1 X T = ck δ (k) für beliebige Konstanten ck eine Lösung von tn T (t) = 0. Wir zeik=0
gen nun, dass umgekehrt jede Lösung dieser Gleichung in D′ als Linearkombination der Distributionen δ (k) , k = 0 . . . n − 1, dargestellt werden kann: Sei also tn T (t) = 0 für n ∈ N. Nach der Taylorformel gilt für ϕ ∈ D : ϕ(t) =
n−1 X k=0
ϕ(k) (0) k t + tn ̺(t) k!
148
7 Grundzüge der Distributionentheorie 1 mit ̺(t) = (n − 1)!
ˆ1 0
(1 − s)n−1 ϕ(n) (st)ds . Die Funktion ̺(t) ist unendlich oft dif-
ferenzierbar (Differentiation unter dem Integral ist möglich). Nun sei α eine Funktion in D mit α(t) = 1 in einer Nullumgebung U. Mit dem Taylorpolynom Tn−1 ϕ von ϕ vom Grad bis n − 1 definieren wir ψ(t) =
1 (ϕ(t) − α(t)Tn−1 ϕ(t)) . tn
Dann sind sowohl ψ(t) als auch tn ψ(t) wieder Testfunktionen aus D, da ψ in der Nullumgebung U mit ̺ übereinstimmt, insbesondere also an der Stelle t = 0 unendlich oft differenzierbar ist. Damit ergibt sich für beliebiges ϕ ∈ D hT,ϕi = hT,αTn−1 ϕi + hT,tn ψi . Der letzte Summand ist Null wegen tn T = 0. Mit hδ (k) ,ϕi = (−1)k ϕ(k) (0) und hT,tk αi folgt daher die behauptete Darstellung für T : ck = (−1)k k! hT,ϕi =
n−1 X k=0
n−1 X ϕ(k) (0) hT,tk αi = ck hδ (k) ,ϕi . k! k=0
8. Die Gleichung tn T (t) = 1 in D′
Aus den vorangehenden Ergebnissen folgt jetzt für n ∈ N sofort: Die Gleichung tn T (t) = 1 hat in D′ die allgemeine Lösung T (t) = pf(t
−n
)+
n−1 X
ck δ (k) (t)
k=0
mit beliebigen Konstanten ck . Entsprechend erhält man die Aussagen: Die Gleichung tn T (t) = s(t) hat in D′ die allgemeine Lösung T (t) = pf(t−n + )+
n−1 X
ck δ (k) (t).
k=0
Die Gleichung tn T (t) = s(−t) hat in D′ die allgemeine Lösung T (t) = pf(t−n − )+
n−1 X
ck δ (k) (t).
k=0
Die Gleichung tn T (t) = sgn(t) hat in D′ die allgemeine Lösung
7.5 Rechnen mit Distributionen
149
−n T (t) = pf(t−n + ) − pf(t− ) +
n−1 X
ck δ (k) (t).
k=0
Mit den Pseudofunktionen pf(t−n ± ) haben wir erste Beispiele für Regularisierungen von Funktionen mit Singularitäten kennen gelernt. Historisch gesehen haben die Arbeiten von M. Hadamard (1932) über Regularisierungen divergenter Integrale, die in Fundamentallösungen von Wellengleichungen auftreten, maßgeblich zur Entwicklung der Distributionentheorie beigetragen. Leser, die noch mehr über dieses Thema lernen wollen, seien hierzu etwa auf die Referenz I. M. Gel’fand, G. E. Shilov, N. Ya. Vilenkin (1964), Vol. 1, oder auf N. Ortner, P. Wagner (2013) hingewiesen. Unbestimmte Integrale von Distributionen Ziel dieses Abschnitts ist zu zeigen, dass die Differentialgleichung T˙ = G für alle G ∈ D′ eine Lösung T ∈ D′ besitzt, und dass sich zwei Lösungen höchstens um eine Konstante c unterscheiden. Jede solche Lösung nennen wir ein unbestimmtes Integral von G. +∞ ˆ Vorab bemerken wir, dass für alle Testfunktionen ϕ ∈ D das Integral ϕ′ (t) dt = 0 ist. −∞
+∞ ˆ ˆt Umgekehrt folgt für jedes ψ ∈ D mit ψ(t) dt = 0, dass ϕ(t) = ψ(x) dx zu D −∞
−∞
gehört und eine Stammfunktion von ψ ist. Daher gilt +∞ ˆ D0 = {ϕ : ϕ ∈ D} = {ψ ∈ D : ψ(t) dt = 0}. ′
−∞
+∞ ˆ Für die folgenden zwei Beweise sei α ∈ D eine Testfunktion mit α(t) dt = 1 und für −∞
+∞ ˆ ϕ ∈ D sei P ϕ = ϕ − αI(ϕ) mit I(ϕ) = ϕ(t) dt . Dann ist P ϕ ∈ D0 und P ϕ′ = ϕ′ . −∞
Satz. Für T ∈ D gilt genau dann T˙ = 0, wenn T = c mit einer Konstante c ist. ′
Beweis. Offensichtlich ist T˙ = 0 für T = c, c konstant. Umgekehrt sei T˙ = 0. Dann ist hT,ψi = 0 für alle ψ ∈ D0 . Da ϕ(t) = P ϕ(t) + α(t)I(ϕ) ist, folgt mit c = hT,αi und +∞ ˆ hT,P ϕi = 0, dass hT,ϕi = c ϕ(t) dt , also T = c gilt. −∞
Satz. Jede Distribution G besitzt ein unbestimmtes Integral T ∈ D′ , und für jede Distribution S mit S˙ = G gilt S = T + c mit einer Konstante c.
150
7 Grundzüge der Distributionentheorie
Beweis. Für zwei unbestimmte Integrale T und S von G gilt T˙ − S˙ = 0, also T − S = c mit einer Konstante c nach dem vorangehenden Satz. Um eine Distribution T mit T˙ = G zu ˆt bestimmen, definieren wir F ϕ(t) = P ϕ(x) dx für ϕ ∈ D. F ϕ ist eine Stammfunktion −∞
von P ϕ, und man bemerkt, dass (F ϕ)′ in D0 und F ϕ in D liegen. Wir definieren hT,ϕi = −hG,F ϕi. T ist linear und auch stetig auf D : Für eine Folge ϕn in D mit D-lim ϕn = 0 gilt wegen n→∞
P ϕ′ = ϕ′ und lim I(ϕn ) = 0 auch D-lim P ϕn = 0. Nun sei [a,b] ein Intervall, das die n→∞
n→∞
Träger von α und aller P ϕn enthält. Dann enthält [a,b] auch alle Tr(F ϕn ), n ∈ N, und sup |F ϕn (t)| ≤ t∈R
+∞ ˆ |P ϕn (t)| dt ≤ (b − a) sup |P ϕn (t)|. t∈R
−∞
Hieraus folgt F ϕn → 0 gleichmäßig. Außerdem gilt für k ≥ 1 : (F ϕn )(k) = (P ϕn )(k−1) und (P ϕn )(k−1) → 0 gleichmäßig für n → ∞. Damit erhält man D-lim F ϕn = 0 und n→∞
schließlich lim hT,ϕn i = 0. Also ist T stetig auf D, d.h. eine Distribution. T ist ein n→∞
unbestimmtes Integral von G : Mit F ϕ′ = ϕ folgt nämlich
hT˙ ,ϕi = −hT,ϕ′ i = hG,F ϕ′ i = hG,ϕi .
Eine wichtige Konsequenz der beiden Sätze ist die Folgerung, dass eine homogene lineare Differentialgleichung, deren Koeffizienten Konstanten oder unendlich oft differenzierbare Funktionen sind, auch als Gleichung in D′ außer den bekannten klassischen Lösungen keine weiteren Lösungen in D′ besitzt (Übungsaufgabe). Konvergenz von Distributionenfolgen Wenn zwei näherungsweise gleiche physikalische Messgrößen durch Distributionen T1 , T2 dargestellt werden, so zeigt die Erfahrung, dass dann bei Messung mit derselben Gewichtsfunktion ϕ ∈ D auch die Werte hT1 ,ϕi und hT2 ,ϕi näherungsweise gleich sind. Dieser Erfahrung entspricht der Konvergenzbegriff für Distributionen. Definition. Eine Folge (Tn )n∈N von Distributionen in D′ konvergiert gegen eine Distribution T ∈ D′ , wenn für alle ϕ ∈ D gilt, dass lim hTn ,ϕi = hT,ϕi ist. Man schreibt dann T = D′ -lim Tn .
n→∞
n→∞
Bemerkung. Man kann zeigen, dass zu jeder Folge von Distributionen Tn , zu der die Grenzwerte lim hTn ,ϕi für jedes ϕ ∈ D existieren, durch hT,ϕi = lim hTn ,ϕi tatsächn→∞ n→∞ lich ein stetiges lineares Funktional T auf D definiert wird. Einen Beweis für diese Vollständigkeitseigenschaft von D′ findet man bei W. Walter (1994) oder L. Schwartz (1957).
7.5 Rechnen mit Distributionen
151
Beispiele. 1. Mit einer beliebigen integrierbaren Funktion f definiere man fn (t) = nf (nt), n ∈ N. Für ϕ ∈ D gilt dann mit der Substitution x = nt +∞ +∞ +∞ ˆ ˆ ˆ fn (t)ϕ(t) dt = nf (nt)ϕ(t) dt = f (x)ϕ(x/n) dx . −∞
Gilt
−∞
−∞
+∞ ˆ −∞
f (t) dt = 1, so folgt wegen |f (x)ϕ(x/n)| ≤ |f (x)| max |ϕ(x)| mit Verx∈R
tauschung von Limesbildung und Integration (möglich nach dem Satz von Lebesgue über majorisierte Konvergenz, vgl. S. 416 in Anhang B) +∞ +∞ ˆ ˆ lim fn (t)ϕ(t) dt = f (x) lim ϕ(x/n) dx = ϕ(0) = hδ,ϕi .
n→∞ −∞
n→∞
−∞
Somit ist D′ -lim fn = δ. Eine derartige Folge von Funktionen fn nennt man eine n→∞ δ-Folge. Die vorher schon benutzte Notation ist also mit dem definierten Konvergenzbegriff verträglich. Speziell können alle approximierenden Funktionen fn selbst schon als Distributionen aufgefasst werden. Als konkrete Beispiele betrachte man etwa die 1 1 , s(t) die EinFunktionen f (t) = (s(t + ε/2) − s(t − ε/2)) oder f (t) = ε π(1 + t2 ) heitssprungfunktion. Diese Funktionen werden oft zur Einführung der δ-Distribution als Limes von Funktionenfolgen – im Sinn der oben definierten Konvergenz in D′ – herangezogen (vgl. S. 17 und S. 125). 2. Wir betrachten die Funktionen fn (t) = n sin(nt)s(t), s(t) die Einheitssprungfunktion, n ∈ N. Anschaulich ist nicht offensichtlich, ob die Folge (fn )n∈N in irgendeinem Sinn konvergiert. Für ϕ ∈ D sieht man jedoch mit partieller Integration: +∞ +∞ +∞ +∞ ˆ ˆ ˆ fn (t)ϕ(t) dt = n sin(nt)ϕ(t) dt = − cos(nt)ϕ(t) + cos(nt)ϕ′ (t) dt
−∞
0
0
0
+∞ ∞ ˆ 1 1 ′ sin(nt)ϕ′′ (t) dt . sin(nt)ϕ (t) − = ϕ(0) + n n 0 {z } | 0
=0
+∞ +∞ ˆ ˆ ′′ |ϕ′′ (t)| dt < ∞ folgt sin(nt)ϕ (t) dt ≤ Wegen 0
0
+∞ ˆ lim fn (t)ϕ(t) dt = ϕ(0) ,
n→∞ −∞
152
7 Grundzüge der Distributionentheorie d.h. man erhält das Ergebnis: D′ -lim fn = δ. Dagegen ergibt sich für die Folge n→∞
gn (t) = n cos(nt)s(t), dass D′ -lim gn = 0, also die Nulldistribution ist. n→∞
sin(nt) , n ∈ N, und ϕ ∈ D gilt πt +∞ +∞ +∞ ˆ ˆ ˆ sin(nt) sin(nt) ϕ(t) − ϕ(0) ϕ(t) dt = dt + ϕ(0) dt . sin(nt) πt πt πt
3. Für die Funktionen
−∞
−∞
−∞
Das letzte Integral der rechten Seite ergibt Eins (vgl. Übungsaufgabe A9). Da ϕ steϕ(t) − ϕ(0) stetig, beschränkt und hat einen beschränkten tig differenzierbar ist, ist πt Träger. Deshalb verschwindet nach dem Riemann-Lebesgue-Lemma das erste Integral der rechten Seite für n → ∞, d.h. sin(nt) = δ(t) . πt ˆn ˆn sin(nt) 1 1 ′ jωt e ejωt dω = δ(t) . folgt D -lim dω = Aus n→∞ 2π 2π πt D′ -lim n→∞
−n
−n
In Kapitel 9 werden wir sehen, dass diese Beziehung bedeutet, dass der Dirac-Impuls die konstante Eins-Funktion als Fouriertransformierte besitzt. Wir bemerken, dass etwa die Näherung f1 (t) = 100/(π(1 + 10000t2)) aus dem vorherigen Beispiel 1 am ehesten der landläufigen Idee einer „Impulsfunktion“ entspricht, während Funktionenfolgen wie in den Beispielen 2 und 3 wenig mit der Vorstellung gemein haben, dass eine δ-Folge bei t = 0 gegen Unendlich und sonst gegen Null konvergiere. Man vergleiche hierzu die nachfolgenden Grafiken mit Darstellungen von f1 (t) = 100/(π(1 + 10000t2)), f2 (t) = 100 sin(100t)s(t) und f3 (t) = sin(100t)/(πt). 35 30 25 20 15 10 5 0 -1.0
100
30
50
20
0
-0.5
0.0
0.5
f1 als Impulsnäherung
1.0
10
-50
0
-100
-10 -1.0
-0.4 -0.2
0.0
0.2
f2 als Impulsnäherung
0.4
-0.5
0.0
0.5
1.0
f3 als Impulsnäherung
Ein Vergleichstest der Abtasteigenschaften von f1 , f2 und f3 , zum Beispiel mit der 2 Funktion ϕ(t) = e−1/(1−t ) für |t| ≤ 1, Null sonst, zeigt, dass die Funktionen f2 und f3 bei weitem bessere Näherungen für den Abtastwert hδ,ϕi liefern als die am ehesten „impulsartig anmutende“ Funktion f1 : Bei ϕ(0) = 1/ e ≈ 0.36788 ergibt numerische Berechnung der Integrale hfk ,ϕi (k = 1,2,3) mit einem Computeralgebra-System hf1 ,ϕi ≈ 0.36293, hf2 ,ϕi ≈ 0.36807, hf3 ,ϕi ≈ 0.36788.
7.5 Rechnen mit Distributionen
153
4. Wir untersuchen die Distributionen Tn =
k=−n
Für jedes ϕ ∈ D existiert n X
lim hTn ,ϕi = lim
n→∞
n X
n→∞
δ(t − k), (n ∈ N).
hδ(t − k),ϕi = lim
n→∞
k=−n
n X
k=−n
denn wegen des beschränkten Trägers von ϕ ist die Reihe eine endliche Summe. Daher wird durch +∞ X
T =
k=−∞
δ(t − k) = D′ -lim n→∞
ϕ(k) =
n X
k=−n
+∞ X
ϕ(k) ,
k=−∞ +∞ X
ϕ(k) eigentlich nur
k=−∞
δ(t − k)
eine Distribution definiert. Die Linearität und Stetigkeit auf D sind leicht nachzuprü+∞ X fen. Die Reihe T = δ(t − k) ist konvergent in D′ mit T = D′ -lim Tn . n→∞
k=−∞
5. Für Tn , T ∈ D′ mit T = D′ -lim Tn gilt T˙ = D′ -lim T˙n , denn für jedes ϕ ∈ D gilt n→∞
n→∞
hT˙n ,ϕi = hTn , − ϕ′ i −→ hT, − ϕ′ i = hT˙ ,ϕi . n→∞
Ebenso gilt für Distributionenreihen: Wenn
+∞ X
Tn = T ist, dann gilt
n=−∞
+∞ X
T˙n = T˙ .
n=−∞
Ergebnis. Jede Distributionenreihe darf ohne Einschränkung gliedweise differenziert werden. Die Ableitung ist vertauschbar mit der Limesbildung. Ein solches Resultat ist überaus praktisch und in der klassischen Analysis nicht erreichbar. Es bedeutet, dass die Differentiation auf dem Vektorraum der Distributionen mit dem eingeführten Konvergenzbegriff eine stetige Operation ist.
Affine Koordinatentransformationen bei Distributionen Für lokal-integrierbare Funktionen f und Testfunktionen ϕ ergibt sich bei einem Integral +∞ ˆ der Form f (ax + b)ϕ(x) dx, a 6= 0, mit der Substitution t = ax + b : −∞
+∞ +∞ ˆ ˆ t−b 1 dt . f (ax + b)ϕ(x) dx = f (t) ϕ |a| a
−∞
−∞
154
7 Grundzüge der Distributionentheorie
Um auch mit nicht-regulären Distributionen T in der gewohnten Weise rechnen zu können, definiert man entsprechend der Substitutionsregel die transformierte Distribution TA einer Distribution T für eine Transformation A(t) = at + b, a 6= 0, und ϕ ∈ D durch hTA ,ϕi = hT,|(A−1 )′ | ϕ ◦ A−1 i
1 D T (t),ϕ |a| die Verknüpfung der beiden Abbildungen A−1 und ϕ.
und verwendet dafür auch die Schreibweise hT (at + b),ϕ(t)i = Dabei ist ϕ ◦ A−1
Beispiel. Für a 6= 0 gilt:
denn für ϕ ∈ D ist
t−b a
E
.
b 1 , δ t+ δ(at + b) = |a| a
hδ(at + b),ϕ(t)i =
1 D δ(t),ϕ |a|
t−b a
E
=
1 ϕ |a|
−b a
.
Mit obiger Definition kann man einige Symmetrieeigenschaften für Distributionen in derselben Weise wie für Funktionen beschreiben: T ist gerade, wenn T (t) = T (−t), d.h. wenn T = TA mit A(t) = −t ist.
T ist ungerade, wenn T (t) = −T (−t), d.h. wenn T = −TA mit A(t) = −t ist.
T ist periodisch mit Periode p > 0, wenn T (t + p) = T (t), d.h. wenn T = TA mit A(t) = t + p ist. Zum Beispiel ist δ(t) eine gerade Distribution. Klassische Fourierreihen lassen sich als periodische Distributionen auffassen. Eine Konsequenz der eingeführten Transformationen ist zum Beispiel, dass bei Symmetrien, Translationen oder Frequenzänderungen von Fourierreihen in der bisher gewohnten Weise gerechnet werden kann, auch wenn diese nicht-reguläre Distributionen darstellen. Solche Beispiele werden wir im nächsten Kapitel besprechen (vgl. Abschnitt 8.1). Man kann zeigen, dass im Sinn der eingeführten Regeln für die Ableitung T˙ einer Distribution T gilt T (t + h) − T (t) (Übungsaufgabe). T˙ = lim h→0 h Für die Ableitung einer Distribution S(t) = T (at + b), a 6= 0, gilt dann auch wieder die t−b ˙ Kettenregel: S(t) = aT˙ (at + b) , denn mit der Kettenregel für ϕ( ) ∈ D gilt a t−b E 1 D ˙ T (t),ϕ′ hS(t),ϕ(t)i = −hT (at + b),ϕ′ (t)i = − |a| a E D t−b a ˙ = haT˙ (at + b),ϕ(t)i . T (t),ϕ = |a| a Im folgenden Abschnitt werden auch nichtlineare Koordinatentransformationen allgemeiner für Distributionen auf mehrdimensionalen Parametermengen eingeführt.
7.6 Testfunktionen und Distributionen mit mehreren Variablen
155
7.6 Testfunktionen und Distributionen mit mehreren Variablen Alle besprochenen Begriffe können auch auf Funktionen mit mehr als einer Variablen übertragen werden. Leser, die über Erfahrung mit Funktionen von mehreren Variablen verfügen, werden die Analogien schnell erkennen. Wir skizzieren hier nur ein paar entsprechende, grundlegende Begriffsbildungen und erarbeiten einen vertrauteren Umgang damit im folgenden Abschnitt über Faltungen und danach bei den Anwendungen von Distributionen im nächsten Kapitel. Bevor wir Testfunktionen und Distributionen für mehrdimensionale Parametermengen definieren, ist es zweckmäßig, eine kompakte Schreibweise für partielle Differentialoperatoren einzuführen. Für Multi-Indizes k = (k1 , . . . ,kn ) ∈ Nn0 und ~x ∈ Rn definiert man |k| = k1 + k2 + . . . kn und ~x k = xk11 xk22 · · · xknn . Die partiellen Differentialoperatoren ∂i für 1 ≤ i ≤ n, ∂iki für ki ∈ N und ∂ k für einen Multi-Index k werden dann definiert durch ∂i =
∂ ki ∂ k1 +k2 +...+kn ∂ k , ∂iki = = ∂1k1 ∂2k2 · · · ∂nkn . und ∂ = ∂xi ∂xki i ∂xk11 . . . ∂xknn
Wir werden diese Notationen insbesondere im späteren Abschnitt 11.8 verwenden, wo sie sehr zur Übersichtlichkeit der Darstellung beitragen. Für ein Gebiet Ω ⊂ Rn ist der Testfunktionenraum D(Ω) die Menge aller Funktionen ϕ : Ω → R, die beliebig oft differenzierbar sind und einen beschränkten Träger Tr(ϕ) in Ω besitzen. Der Träger von ϕ ist die im Rn abgeschlossene Hülle der Menge aller ~x ∈ Rn mit ϕ(~x) 6= 0. Eine Folge (ϕm )m∈N konvergiert in D(Ω) gegen die Nullfunktion genau dann, wenn es eine kompakte, d.h. eine abgeschlossene, beschränkte Teilmenge von Ω gibt, welche sämtliche Träger der ϕm enthält, und wenn sämtliche Ableitungen der ϕm gleichmäßig gegen die Nullfunktion konvergieren, d.h. wenn für beliebige k = (k1 , . . . ,kn ) ∈ Nn0 gilt: sup ∂ k ϕm (~x) −→ 0 . ~ x∈Ω
m→∞
Man definiert dann den Vektorraum D′ (Ω) der Distributionen auf Ω durch D′ (Ω) = {T : D(Ω) → R | T linear und stetig} .
Eine Charakterisierung der Stetigkeit linearer Funktionale auf D durch Abschätzungen von |hT,ϕi| für ϕ ∈ D wird am Ende des Abschnitts gezeigt. Partielle Ableitungen ∂ k T für Distributionen T ∈ D′ (Ω) definiert man analog zum Fall einer Variablen für Multi-Indizes k durch h∂ k T,ϕi = (−1)|k| hT,∂ k ϕi . Die Reihenfolge der Differentiationen kann bei Distributionen immer beliebig gewählt werden. Dies ist nach dem bekannten Satz von Schwarz bei herkömmlichen Funktionen im Allgemeinen nicht so.
156
7 Grundzüge der Distributionentheorie
Konvergenz in D′ (Ω) definiert man wie vorher: Für T,Tm ∈ D′ (Ω) ist T = D′ -lim Tm , m→∞ wenn lim hTm ,ϕi = hT,ϕi für alle ϕ ∈ D(Ω) gilt. m→∞ Alle Begriffe lassen sich auch auf komplexwertige Testfunktionen und Distributionen übertragen. Eine Distribution T hat dann die Gestalt T = T1 + jT2 mit T1 ,T2 ∈ D′ (Ω). Ihre Wirkung auf eine komplexwertige Testfunktion ϕ = ϕ1 + jϕ2 , ϕ1 ,ϕ2 ∈ D(Ω), wird definiert durch hT,ϕi = (hT1 ,ϕ1 i − hT2 ,ϕ2 i) + j (hT1 ,ϕ2 i + hT2 ,ϕ1 i) . Wir können daher ab jetzt ohne Einschränkung komplexwertige Testfunktionen und Distributionen über dem Skalarenkörper C betrachten. Für Variablentransformationen A und Distributionen T auf Rn definiert man die Distribution TA durch Verallgemeinerung der Substitutionsregel für Integrale (vgl. S. 417). Die Transformation A : Ω1 → Ω2 sei dabei eine beliebig oft differenzierbare, bijektive Abbildung, deren Funktionaldeterminante det ∂A nirgendwo in Ω1 verschwindet (vgl. S. 417). Die Umkehrabbildung A−1 und | det ∂A−1 | sind dann ebenfalls beliebig oft differenzierbar. Man definiert damit für T ∈ D′ (Ω2 ) und ϕ ∈ D(Ω1 ) die Distribution TA ∈ D′ (Ω1 ) durch hTA ,ϕi = hT,| det ∂A−1 | ϕ ◦ A−1 i ,
Mit dieser Definition können Symmetrieeigenschaften, zum Beispiel Rotationsinvarianz, für Distributionen formuliert und Koordinatentransformationen durchgeführt werden. Zum Beispiel ist eine Distribution T auf Rn rotationsinvariant, wenn für alle orthogonalen (n × n)-Matrizen A gilt, dass TA = T ist. Für solche Matrizen A gelten A−1 = A∗ , A∗ die transponierte Matrix, und | det A| = | det ∂A−1 | = 1. Für beliebige Testfunktionen ϕ und rotationsinvariante T folgt dann hTA ,ϕi = hT (~x),ϕ(A−1 ~x)i. Beispiele für Variablentransformationen findet man in den folgenden Abschnitten. Beispiele. 1 = (x2 + y 2 + z 2 )−1/2 für ~x = (x,y,z) ist in R3 lokal inte|~x| grierbar, denn die Integrale
1. Die Funktion h(~x) =
ˆ 0 0 an den Raumstellen
7.6 Testfunktionen und Distributionen mit mehreren Variablen
157
~xi ∈ R3 sein. Die Distribution ̺ lässt sich entsprechend der Bemerkung auf S. 134 zu einem diskreten Maß im R3 fortsetzen. Wie im Fall einer ˆ Variablen ist umgekehrt mit jedem Maß m im R3 (vgl. Anhang B) durch hT,ϕi = Distribution T gegeben.
ϕ dm (ϕ ∈ D(R3 )) eine
3. Mit ϕ ∈ D(R3 ), R > 0 und dem üblichen Oberflächenelement do auf der Kugeloberfläche um Null zum Radius R (vgl. Anhang B) wird ˆ für eine dort gegebene Dichte̺ϕ do eine Distribution T im
funktion ̺ durch das Oberflächenintegral hT,ϕi =
|~ x|=R
R3 definiert. T entspricht einer Verteilung mit der Flächendichte ̺ auf der Oberfläche der Kugel. Man nennt T eine einfache Belegung der Kugeloberfläche und notiert auch T (~x) = ̺(~x)δ(|~x| − R). ˆ ˆ 3 ̺(~x)ϕ(~x) do(~x) . hT,ϕi = ̺(~x)δ(|~x| − R)ϕ(~x) dλ (~x) = R3
|~ x|=R
Charakterisierung der Stetigkeit von Distributionen Der folgende Satz beschreibt die Stetigkeit linearer Funktionale T auf D(Ω) durch Abschätzungen von |hT,ϕi| für ϕ ∈ D(Ω). Der Satz ist daher ein nützliches Kriterium zur Prüfung der Stetigkeit spezieller linearer Funktionale, auf das wir in späteren Abschnitten zurückgreifen können. Dabei ist ||ϕ||p für eine ganze Zahl p ≥ 0 die Maximumnorm ||ϕ||p = max{|∂ k ϕ(~x)| : ~x ∈ Ω,|k| ≤ p} von ϕ im Raum der p-mal stetig differenzierbaren Funktionen mit kompaktem Träger in Ω. Satz. Ein lineares Funktional T auf D(Ω) ist genau dann stetig, wenn es zu jeder kompakten Menge K ⊂ Ω eine Konstante C > 0 und eine ganze Zahl p ≥ 0 gibt, so dass für jede Testfunktion ϕ mit Träger in K die folgende Abschätzung gilt: |hT,ϕi| ≤ C||ϕ||p . Beweis. a) Seien T ∈ D′ (Ω) und eine kompakte Menge K ⊂ Ω gegeben. Zum Beweis der Notwendigkeit der angegebenen Bedingung nehmen wir an, dass sie falsch ist. Dann gibt es zu jeder natürlichen Zahl p eine Testfunktion ϕp mit Träger in K, so dass |hT,ϕp i| > p||ϕp ||p . Die Funktionen ψp = ϕp /(p||ϕp ||p ) haben ihre Träger in K und konvergieren in D(Ω) für p → ∞ gegen Null, da für jedes fest gewählte k ∈ Nn0 und alle p ≥ |k| und ~x ∈ Ω die Abschätzung 1 |∂ k ψp (~x)| ≤ ||ψp ||p = p
158
7 Grundzüge der Distributionentheorie
erfüllt ist. Aus der Stetigkeit von T folgt dann, dass für p → ∞ auch die Zahlen |hT,ψp i| gegen Null konvergieren. Das steht im Widerspruch zur Folgerung |hT,ψp i| > 1 für alle p nach der oben vorausgesetzten Annahme. b) Für jede Nullfolge ϕm in D(Ω) gibt es eine kompakte Menge K ⊂ Ω, die alle Träger der ϕm enthält, und es gilt lim ||ϕm ||p = 0 sogar für alle p ∈ N0 . Aus der angegebenen m→∞
Bedingung für ein lineares Funktional T auf D(Ω) folgt daher lim hT,ϕm i = 0, also die m→∞ Stetigkeit von T .
7.7 Tensorprodukt und Faltung Ziel dieses Abschnitts ist die Einführung von Faltungen für Distributionen. Damit ergibt sich im nächsten Kapitel das Grundlösungsverfahren für inhomogene lineare Differentialgleichungen mit konstanten Koeffizienten. Dieses zentrale Ergebnis, das die Berechnung partikulärer Lösungen solcher Gleichungen erlaubt, erfordert einige Vorbereitungen. Faltungen sind auch ein grundlegendes theoretisches Werkzeug für die lineare Systemtheorie und ihre Anwendungsbereiche. Wir gehen darauf in Kapitel 10 näher ein. Das Tensorprodukt von Distributionen Für lokal-integrierbare Funktionen f und g auf R ist f ⊗ g(x,y) = f (x)g(y) eine lokal-integrierbare Funktion auf R2 . Durch f ⊗ g ist dann auf den Testfunktionen ϕ aus D(R × R) eine Distribution definiert durch ˆˆ hf ⊗ g,ϕi = f (x)g(y)ϕ(x,y) dy dx . R R
Mit Blick auf Anwendungen von Distributionen übertragen wir alle folgenden Überlegungen sofort auf Funktionen mit mehreren Variablen. Wir bezeichnen im Folgenden mit X = Rn , Y = Rm , Z = Rp und mit dλp (~z) das differentielle Volumenelement im Rp . Für lokal-integrierbare Funktionen f auf X, g auf Y und eine Testfunktion ϕ aus D(X × Y ) wird durch ˆˆ hf ⊗ g,ϕi = f (~x)g(~y )ϕ(~x,~y ) dλm (~y ) dλn (~x) = hf (~x),hg(~y ),ϕ(~x,~y )ii XY
eine reguläre Distribution f ⊗g ∈ D′ (X ×Y ) definiert. Man nennt f ⊗g das Tensorprodukt von f und g. Der Faktor f wirkt nur auf die Parameter aus X, der Faktor g auf die Parameter aus Y . Statt f ⊗ g notieren wir auch f (~x) ⊗ g(~y ), wenn wir die Integrationsvariablen zur Orientierung mit angeben wollen. Vertauschung der Integrationsreihenfolge entspricht der Vertauschung des Tensorprodukts, d.h. es gilt: f (~x) ⊗ g(~y ) = g(~y) ⊗ f (~x).
7.7 Tensorprodukt und Faltung
159
Definition. Für zwei beliebige Distributionen T ∈ D′ (X) und G ∈ D′ (Y ) definiert man das Tensorprodukt T ⊗ G analog mit ϕ ∈ D(X × Y ) durch hT (~x) ⊗ G(~y ),ϕ(~x,~y )i = hT (~x),hG(~y ),ϕ(~x,~y )ii . Die Definition ist sinnvoll, weil für jedes feste ~x ∈ X die Funktion ϕ~x (~y) = ϕ(~x,~y ) zu D(Y ) und die Funktion ψ(~x) = hG,ϕ~x i zu D(X) gehören. Das Tensorprodukt ist linear und stetig auf D(X × Y ), d.h. T ⊗ G ist eine Distribution aus D′ (X × Y ). Wir verzichten an dieser Stelle und auch bei den nachfolgenden Aussagen über Faltungen auf sehr technische, detaillierte Beweise und konzentrieren uns auf die für die Anwendungen wesentlichen Aspekte. Mathematisch interessierte Leser finden eine ausführliche Darstellung der Inhalte dieses Abschnitts mit kompletten Beweisen etwa bei W. Walter (1994). Für Testfunktionen ϕ ∈ D(X × Y ) der speziellen Gestalt ϕ(~x,~y ) = ϕ1 (~x)ϕ2 (~y ) mit ϕ1 ∈ D(X) und ϕ2 ∈ D(Y ) folgt aus der Definition des Tensorprodukts hT (~x) ⊗ G(~y ),ϕ(~x,~y )i = hT (~x),ϕ1 (~x)ihG(~y ),ϕ2 (~y )i = hG(~y ) ⊗ T (~x),ϕ(~x,~y )i. Mit dem Satz von Weierstraß (vgl. S. 118) lässt sich zeigen, dass jede Testfunktion ϕ durch Linearkombinationen der speziellen Gestalt n X
ϕ1,k (~x)ϕ2,k (~y )
k=1
in D(X × Y ) approximiert werden kann. Aus der Linearität und der Stetigkeit von T ⊗ G folgt dann die Kommutativität des Tensorprodukts auf ganz D(X × Y ): T (~x) ⊗ G(~y ) = G(~y ) ⊗ T (~x). Auf analoge Weise erhält man auch die Assoziativität des Tensorprodukts von Distributionen T ,G und H auf X, Y bzw. Z: T (~x) ⊗ G(~y ) ⊗ H(~z) = (T (~x) ⊗ G(~y )) ⊗ H(~z) = T (~x) ⊗ (G(~y ) ⊗ H(~z)). Beispiele. 1. Die δ-Distribution δ(~x) = δ(x,y,z) im R3 ist für ~x = (x,y,z) gerade das Tensorprodukt δ(x) ⊗ δ(y) ⊗ δ(z). Denn für ϕ ∈ D(R3 ) ist hδ(x,y,z),ϕ(x,y,z)i = hδ(x),hδ(y),hδ(z),ϕ(x,y,z)iii = hδ(x),hδ(y),ϕ(x,y,0)ii = hδ(x),ϕ(x,0,0)i = ϕ(0,0,0) .
2. Ist g lokal-integrierbar auf Y , so ist für ϕ ∈ D(X × Y ) hδ(~x) ⊗ g(~y ),ϕ(~x,~y )i = hg(~y ) ⊗ δ(~x),ϕ(~x,~y )i ˆ = g(~y)ϕ(~0,~y) dλm (~y ) . Y
160
7 Grundzüge der Distributionentheorie
3. Eine Massen- oder Ladungsdichte ̺(z) auf einem dünnen Stab der Länge 2l, der idealisiert gegeben sei durch das (ausgeartete) Intervall {0} × {0} × [−l,l] im R3 , wird mit der Einheitssprungfunktion s(z) beschrieben durch das Tensorprodukt δ(x) ⊗ δ(y) ⊗ ̺(z)[s(z + l) − s(z − l)] .
Der Träger einer Distribution Im Folgenden benötigen wir noch, was man unter dem Träger einer Distribution versteht. Zum Träger einer stetigen Funktion f gehören alle Punkte, in denen f nicht verschwindet. Da bei Distributionen T von Werten an einzelnen Stellen nicht gesprochen werden kann, sagt man, T verschwindet in einer offenen Menge A, T = 0 in A, wenn hT,ϕi = 0 ist für alle Testfunktionen ϕ mit Tr(ϕ) ⊂ A. Zum Beispiel ist δ(~x) = 0 in jeder offenen Menge A, die den Nullpunkt nicht enthält. Umgekehrt heißt ein Punkt ~x ein wesentlicher Punkt für T , wenn es zu jeder offenen Umgebung U von ~x eine Testfunktion ϕ mit Tr(ϕ) ⊂ U und hT,ϕi 6= 0 gibt. Zum Beispiel ist der Nullpunkt der einzige wesentliche Punkt für δ(~x). Definition. Der Träger Tr(T ) einer Distribution T ist die abgeschlossene Menge aller für T wesentlichen Punkte. Der Träger Tr(T ) einer Distribution T ist also die kleinste abgeschlossene Menge, in deren Komplement T = 0 ist. Beispiele. 1. Für reguläre Distributionen Tf mit stetigen f gilt Tr(Tf ) = Tr(f ). Der Träger lokalintegrierbarer Funktionen f ist definiert als der Träger der Distribution Tf . Der Träger von δ(~x − ~x0 ) ist die Menge {~x0 }, der Träger von δ(|~x| − R) ist die Kugelfläche |~x| = R, der Träger von δ(x)⊗δ(y)⊗[s(z+l)−s(z−l)] ist die Menge {0}×{0}×[−l,l] im R3 . 2. Für eine Distribution T und eine Testfunktion ϕ ist hT,ϕi nur abhängig von den Werten von ϕ auf dem Träger von T . Verändert man nämlich ϕ außerhalb einer Umgebung U von Tr(T ) so, dass wieder eine Testfunktion ψ entsteht, so ist ψ = ϕ + h mit einer Testfunktion h, die auf U verschwindet. Hieraus folgt wegen hT,hi = 0, dass hT,ψi = hT,ϕ + hi = hT,ϕi ist.
Die Faltung von Distributionen Die Faltung f ∗ g zweier integrierbarer Funktionen f und g auf Rn ist definiert durch ˆ (f ∗ g)(~x) = f (~x − ~y)g(~y ) dλn (~y ) .
7.7 Tensorprodukt und Faltung
161
Die Faltung f ∗ g ist wieder eine integrierbare Funktion. Betrachtet man sie als reguläre Distribution, dann folgt für jede Testfunktion ϕ mit der Substitutionsregel für Integrale (vgl. Anhang B) ˆˆ ˆˆ n n hf ∗g,ϕi = f (~x −~y)g(~y )ϕ(~x) dλ (~y ) dλ (~x) = f (~x)g(~y )ϕ(~x +~y) dλn (~y ) dλn (~x) . Mit Hilfe des Tensorproduktes f (~x) ⊗ g(~y ) kann die Faltung von f und g dann beschrieben werden durch die Formel hf ∗ g,ϕi = hf (~x) ⊗ g(~y ),ϕ(~x + ~y)i = hf (~x),hg(~y ),ϕ(~x + ~y )ii . Mit der Reflexion ϕ(~ ˇ x) = ϕ(−~x) von ϕ erhält man äquivalent hf ∗ g,ϕi = hf,ˇ g ∗ ϕi. Wie üblich wird die reguläre Distribution Tf ∗g mit der Funktion f ∗ g identifiziert: Tf ∗g = f ∗ g . Definition. Für zwei beliebige, nicht notwendig reguläre Distributionen T und G definiert man die Faltung T ∗ G durch das gleiche Rezept: hT ∗ G,ϕi = hT (~x) ⊗ G(~y ),ϕ(~x + ~y )i = hT (~x),hG(~y ),ϕ(~x + ~y )ii . Mit der Reflexion Tˇ(ϕ) = hT,ϕi ˇ = hT (~x),ϕ(−~x)i von T kann man die Faltung wie oben auch notieren durch ˇ ∗ ϕi. hT ∗ G,ϕi = hT,G Bei der Definition ist jedoch zu beachten, dass ϕ(~x + ~y ) im Allgemeinen keinen beschränkten Träger besitzt. Die definierende Formel ist daher in der Regel nur mit Zusatzbedingungen sinnvoll. Wenn die Faltung T ∗ G zweier Distributionen existiert, dann ist T ∗ G wieder eine Distribution, und aus der Kommutativität des Tensorprodukts folgt die Kommutativität der Faltung: T ∗ G = G ∗ T . Der folgende Satz gibt Bedingungen an, unter denen die Faltung von Distributionen existiert. Danach sind die wichtigsten Eigenschaften für das Rechnen mit Faltungen zusammengefasst. Einige in späteren Kapiteln verwendete Fakten über Faltungen klassischer Funktionen sind im Anhang B zusammengestellt. Weitere Aussagen über Faltungen, die in Verbindung mit der Fouriertransformation benötigt werden, behandeln wir in Kapitel 9. Hinreichende Bedingungen für die Existenz von Faltungen Die Faltung T ∗ G zweier Distributionen T und G auf Rn ist für alle ϕ ∈ D(Rn ) durch hT ∗ G,ϕi = hT (~x) ⊗ G(~y ),ϕ(~x + ~y )i unter jeder der folgenden Bedingungen sinnvoll definiert:
162
7 Grundzüge der Distributionentheorie
1. T oder G hat einen beschränkten Träger. 2. Die Träger von T und G sind beide in einem „Quadranten“ Qc+ = {~x = (x1 , . . . ,xn )|xi ≥ c,i = 1, . . . ,n} oder beide in einem „Quadranten“ Qc− = {~x = (x1 , . . . ,xn )|xi ≤ c,i = 1, . . . ,n}, c in R geeignet, enthalten. Im eindimensionalen Fall n = 1 existiert also T ∗ G, wenn die Träger von T und G auf derselben Seite halbbeschränkt sind. Das ist zum Beispiel der Fall, wenn Tr(T ) ⊂ [0,∞[ und Tr(G) ⊂ [0,∞[. Im ersten Fall habe etwa G einen beschränkten Träger. Dann verschwindet die unendlich oft differenzierbare Funktion ψ(~x) = hG(~y ),ϕ(~x + ~y)i, wenn |~x| so groß wird, dass sich die Träger Tr (G) und Tr (ϕ~x ), ϕ~x (~y ) = ϕ(~x + ~y), nicht mehr schneiden. Also ist ψ eine Testfunktion, und T lässt sich auf ψ anwenden, d.h. die Faltung T ∗ G ist möglich. Zur zweiten Bedingung betrachten wir den anschaulichen Fall n = 1 und Distributionen T und G mit Trägern in [0,∞[. Für wachsende x verschiebt sich der Träger von ϕ(x + y) nach links, so dass irgendwann Tr (ϕ(x + y)) ∩Tr (G) = ∅ ist, d.h. der Träger von ψ(x) = hG(y),ϕ(x + y)i ist nach rechts beschränkt. Folglich ist der Durchschnitt Tr (T ) ∩ Tr (ψ) beschränkt. Wählt man eine Testfunktion α konstant α = 1 auf diesem Durchschnitt, dann stimmt die Testfunktion αψ auf dem Träger von T mit ψ überein. Die Faltung T ∗G existiert und es gilt: hT ∗ G,ϕi = hT,αψi.
Diese Argumente lassen sich unter den „Quadrantenbedingungen“ aus Punkt 2 auch auf den mehrdimensionalen Fall übertragen. Bevor wir zu Beispielen für Faltungen kommen, sind nachfolgend einige grundlegende Eigenschaften von Faltungen aufgelistet. Beweisdetails zu diesen Aussagen findet man bei W. Walter (1994) oder A. H. Zemanian (2010). Eigenschaften von Faltungen 1. Distributivität von Faltungen. Kann man eine Distribution T mit zwei Distributionen G und S falten, dann ist Faltung ist distributiv, d.h. es gilt für beliebige Konstanten α und β T ∗ (αG + βS) = α(T ∗ G) + β(T ∗ S). Es gilt Tr(αG + βS) ⊂ Tr(G) ∪ Tr(S).
2. Kommutativität, Assoziativität von Faltungen. Da Tensorprodukte kommutativ sind, gilt dies auch für Faltungen. Erfüllen drei Distributionen T , G und S die Quadrantenbedingung mit einem gemeinsamen Quadranten Qc+ oder Qc− oder haben mindestens zwei von ihnen einen beschränkten Träger, dann ist die Faltung assoziativ, d.h. es gilt T ∗ (G ∗ S) = (T ∗ G) ∗ S.
7.7 Tensorprodukt und Faltung
163
3. Faltung mit der Dirac-Distribution. Für alle Distributionen T existiert T ∗ δ und für jede Testfunktion ϕ gilt hT ∗ δ,ϕi = hT (~x),hδ(~y ),ϕ(~x + ~y )ii = hT (~x),ϕ(~x)i. Aus der Definition der Faltung und der Kommutativität folgt also, dass δ bei der Faltung wie die Eins bei der Multiplikation wirkt: T ∗ δ = δ ∗ T = T. 4. Differentiation und Translation von Faltungen. Existiert die Faltung T ∗ G, so gilt für ∂ und die Ableitung ∂i (T ∗ G) der Faltung einen Differentialoperator ∂i = ∂xi ∂i (T ∗ G) = T ∗ ∂i G = ∂i T ∗ G. Wir zeigen exemplarisch die erste Gleichung: Für jede Testfunktion ϕ gilt h∂i (T ∗ G),ϕi = hT ∗ G, − ∂i ϕi = hT (~x),h∂i G(~y ),ϕ(~x + ~y)ii = hT ∗ ∂i G,ϕi. Speziell gilt für alle Distributionen T , dass ∂i (δ ∗ T ) = ∂i (T ∗ δ) = ∂i T ist.
Auf analoge Weise sieht man für eine Translation A(~x) = ~x + ~a und die Verschiebung (T ∗ G)A der Faltung (vgl. S. 154) (T ∗ G)A = TA ∗ G = T ∗ GA . Dies folgt mit (T ∗ G)A = (T ∗ G) ∗ δA aus der Kommutativität und Assoziativität von Faltungen. Man kann also bei Differentiation und Translation eines Faltungsproduktes beliebig unter den Faktoren auswählen. 5. Faltung mit unendlich oft differenzierbaren Funktionen. Für jede Distribution T und jede Testfunktion g ist die Faltung T ∗ g eine unendlich oft differenzierbare Funktion. Es gilt (T ∗ g)(~x) = hT (~y),g(~x − ~y )i. Das Gleiche gilt, wenn g unendlich oft differenzierbar ist und keinen beschränkten Träger hat, dafür aber T einen beschränkten Träger besitzt. Als Ableitung ∂i (T ∗ g) der Faltung T ∗ g für ∂i = ∂/∂xi erhält man T ∗ ∂i g (vgl. Punkt 4). 6. Der Träger von Faltungen. Für den Träger einer Faltung T ∗ G gilt die Beziehung Tr(T ∗ G) ⊂ Tr(T ) + Tr(G) = {~x + ~y | ~x ∈ Tr(T ),~y ∈ Tr(G)}. 7. Konvergenz von Faltungen. Für Distributionen G und T = D′ -lim Tk gilt k→∞
′
T ∗ G = D -lim(Tk ∗ G) , k→∞
falls eine der folgenden Bedingungen erfüllt ist: (a) Es gibt eine beschränkte Menge, die alle Träger der Tk enthält. (b) Der Träger von G ist beschränkt. (c) Die Träger aller Tk und der Träger von G liegen gemeinsam in einem „Quadranten“ Qc+ oder Qc− , c ∈ R geeignet (vgl. S. 162).
164
7 Grundzüge der Distributionentheorie
Beispiele zu Faltungen 1. Nach Eigenschaft 4 gilt für beliebige Distributionen T und G, deren Faltung existiert, T (t − a) ∗ G(t − b) = T (t) ∗ G(t − (a + b)). Zum Beispiel gelten also für die DiracDistribution δ(t) und die Einheitssprungfunktion s(t) die Gleichungen δ(t − a) ∗ δ(t − b) = δ(t − (a + b)), δ(t − a) ∗ s(t − b) = δ(t) ∗ s(t − (a + b)) = s(t − (a + b)). 2. Für integrierbare Funktionen f (t) und die Einheitssprungfunktion s(t) sind nützlich zu merken +∞ ˆ ˆt (f ∗ s)(t) = f (u)s(t − u) du = f (u) du , −∞
((f s) ∗ s)(t) =
ˆt
−∞
f (u)s(u) du = s(t)
−∞
ˆt
f (u) du .
0
Die Faltung s ∗ rn der Einheitssprungfunktion mit der Rechteckfunktion rn , definiert durch rn (t) = s(t) − s(t − n) ergibt (s ∗ rn )(t) = min(t,n)s(t). Mit D′ -lim rn = s n→∞ folgt (s ∗ s)(t) = ts(t) . 3. Die Faltung als kontinuierliche Superposition. Das im Unendlichen verschwindende Potential U einer räumlich begrenzten Ladungsverteilung mit der Dichtefunktion ̺ ist durch die Poisson-Formel (vgl. später Abschnitt 8.4) gegeben (Tr (̺) ⊂ B, B beschränkt im R3 ): ˆ ̺(~y ) 1 dλ3 (~y ) . U (~x) = 4πε0 |~x − ~y | B
1 . Es ent4πε0 |~x| steht also durch kontinuierliche Superposition der Einflüsse aller räumlich verteilten Ladungen.
Das Potential U ist die Faltung von ̺ mit der regulären Distribution
4. Existiert die Faltung T ∗ G zweier Distributionen T und G auf R, dann gilt für einen m X dk beliebigen linearen Differentialoperator L = ck k , mit konstanten Koeffizienten dt k=0 ck die Gleichung L(T ∗ G) = LT ∗ G = T ∗ LG. Dasselbe gilt bei mehreren Variablen und entsprechenden partiellen Differentialoperatoren. Diese Gleichungen folgen sofort aus der Eigenschaft 4 aufgrund der Linearität von Faltungen. Sie stellen ein distributionelles Analogon der Vertauschung von Differentiation und Integration dar, die bei klassischen Funktionen nicht ohne weiteres möglich ist.
7.7 Tensorprodukt und Faltung
165
5. Der Träger einer Faltung T ∗ G ist oft gegenüber den Trägern von T und G vergrößert. Wir betrachten als einfaches Beispiel die Indikatorfunktion f = 1[−1,1] des Intervalls [−1,1]. Sie hat den Wert Eins in [−1,1] und sonst den Wert Null. Sie ist eine reguläre Distribution mit Tr(f ) = [−1,1] und +∞ ˆ ˆ1 (f ∗ f )(t) = 1[−1,1] (x)1[−1,1] (t − x) dx = 1[−1,1] (t − x) dx . −∞
−1
Mit 1[−1,1] (t − x) = 1[−1,∞[ (t − x) − 1]1,∞[ (t − x) = 1]−∞,t+1] (x) − 1]−∞,t−1[ (x) rechnet man sofort aus 0 für t ≤ −2 ˆ+1 ˆ1 t + 2 für −2 < t ≤ 0 (f ∗ f )(t) = 1]−∞,t+1] (x) dx − 1]−∞,t−1[ (x) dx = 2 − t für 0 < t ≤ 2 −1 −1 0 für t > 2. Also gilt Tr(f ∗ f ) = Tr(f ) + Tr(f ) = [−2,2].
Aus der Eigenschaft 6 ergibt sich, dass bei beschränkten Trägern von T und G auch Tr(T ∗ G) beschränkt ist. Für Distributionen T und G auf R, deren Träger in [0,∞[ liegen, ist auch der Träger von T ∗ G in [0,∞[ enthalten. 6. Faltungen von Impulsfolgen. Eine zentrale Rolle in der diskreten Signalverarbeitung, deren Grundlagen wir in Kapitel 10 erläutern, spielt die diskrete Faltung. Dort werden +∞ X zeitdiskrete Signale durch eine Impulsfolge der Form x = xk δk modelliert. k=−∞
Dabei notieren wir mit xk δk jeweils Impulse δk = δ(t − ka) der Stärke xk zur Zeit ka und 1/a > 0 ist die Abtastfrequenz, mit der das diskrete System arbeitet. Für diskrete +∞ X lineare Filter mit der Impulsantwort h = hk δk und diskrete Eingangssignale x k=−∞
gilt dann für die Ausgangssignale y die Faltungsrelation y = x∗h (vgl. später Kap. 10). Die Faltung der Impulsantwort h des Filters mit den zugelassenen Eingangssignalen x muss möglich sein, damit diese Beziehung einen Sinn ergibt. Wir berechnen die diskrete Faltung für zwei Spezialfälle, auf die wir in Kapitel 10 zurückgreifen werden. Im ersten Fall setzen wir voraus, dass h einen beschränkten Träger hat, im zweiten Fall, dass die Träger von h und x nach unten beschränkt sind. Dann existiert jeweils +∞ X ym δm ist, die Faltung y = h ∗ x und wir zeigen, dass y von der Form y = m=−∞
wobei
ym =
+∞ X
k=−∞
hk xm−k =
+∞ X
hm−k xk .
k=−∞
a) Im Fall hk = 0 für |k| > M und geeignetes M ∈ N folgt aus der Distributivität der Faltung mit der Indextransformation k + n = m
166
7 Grundzüge der Distributionentheorie
X
h∗x =
k∈Tr(h)
=
+∞ X
h k δk ∗
X
+∞ X
xn δn
n=−∞
!
+∞ X
xn hk δk+n =
X
xm−k hk δm
m=−∞ k∈Tr(h)
n=−∞ k∈Tr(h)
und damit die oben behauptete Darstellung von ym . Veranschaulichung. Gegeben seien x = {−2, − 1,0,1}. Um etwa y−2 in x ∗ h =
+∞ X
xn δn und h =
n=−∞ +∞ X
1 X
hk δk mit Träger
k=−2
ym δm zu erhalten, schreibt man die
m=−∞
gespiegelte Folge der hk so über die Folge der Koeffizienten xn , dass h0 über dem zu δ−2 gehörenden x−2 steht. Dann multipliziert man alle übereinander stehenden Koeffizienten und addiert. Man berechnet also y−2 im Beispiel wie folgt: . . . 0 h1 h0 h−1 h−2 0 0 0 . . . . . . x−4 x−3 x−2 x−1 x0 x1 x2 x3 . . . ↑ y−2 = x−3 h1 + x−2 h0 + x−1 h−1 + x0 h−2
Man beachte, dass die Faltung y = h ∗ x in der Regel einen größeren Träger als die beteiligten Faltungsfaktoren besitzt, auch wenn h und x endliche Träger haben, b) Im zweiten Beispiel setzen wir voraus, dass h =
+∞ X
hk δk und x =
+∞ X
xn δn
n=n0
k=k0
nach unten beschränkte Träger haben. Dann gilt für beliebige Testfunktionen ϕ hh,ϕi =
+∞ X
k=k0
hk ϕ(ka) und hx,ϕi =
+∞ X
xn ϕ(na)
n=n0
und beide Summen haben wegen des beschränkten Trägers von ϕ nur endlich viele Summanden ungleich Null. Daher folgt aus ! +∞ +∞ X X xn ϕ((n + k)a) hk hh ∗ x,ϕi = k=k0
n=n0
durch Vertauschung der Summationsreihenfolge und Indextransformation m = n + k hh ∗ x,ϕi = =
+∞ +∞ X X
hk xn ϕ((n + k)a)
n=n0 k=k0 +∞ X
m=k0 +n0
+∞ X
k=k0
hk xm−k
!
ϕ(ma).
7.7 Tensorprodukt und Faltung
167
Auch in diesem Fall ist also der Koeffizient ym von y = h∗ x =
+∞ X
ym δm gegeben
m=−∞
durch die folgende Faltungsformel (mit hk = 0 für k < k0 , xn = 0 für n < n0 ) ym =
+∞ X
k=−∞
hk xm−k =
+∞ X
hm−k xk
k=−∞
Der Koeffizient ym ist Null, wenn m < k0 + n0 ist, und die Reihe für ym ist de facto eine endliche Summe. Weitere Beispiele und konkrete Anwendungungen diskreter Faltungen erarbeiten wir in Abschnitt 9.5 und im schon genannten Kapitel 10 über lineare Filter. Glättungsfolgen, Näherungen von Distributionen durch glatte Funktionen Die oben genannten Eigenschaften von Faltungen beinhalten den Satz, dass jede Distribution T aus D′ (Rn ) der D′ -Limes einer Folge von glatten Funktionen fk ist, die sogar als Testfunktionen gewählt werden können. Man sagt auch, D liegt dicht in D′ . Um dies einzusehen, wähle man eine Folge von Testfunktionen ϕk mit D′ -lim ϕk = δ, wie wir k→∞
dies bei der Einführung der δ-Distribution getan hatten. Eine solche Folge nennt man eine ˆ Glättungsfolge. Man kann dabei von irgendeiner Testfunktion ϕ mit
ϕ(~x) dλn (~x) = 1
ausgehen, und definiert
ϕk (~x) = k n ϕ(k~x) (vgl. Bsp. 1, S. 151). Dann gilt nach den vorher genannten Eigenschaften 3 und 7 (S. 163) D′ -lim(T ∗ ϕk ) = T ∗ δ = T . k→∞
Die Folge der ϕk heißt Glättungsfolge, weil die Faltungen T ∗ ϕk nach Eigenschaft 5 von S. 163 unendlich oft differenzierbare Funktionen sind. Man wähle jetzt noch eine beliebige Testfunktion g mit g(~x) = 1 in einer Umgebung des Nullpunktes, und definiere für k ∈ N die Funktion gk (~x) = g(~x/k). Für eine beliebige Testfunktion ψ und gehörig große k ist dann gk (~x) = 1 für alle ~x ∈ Tr(ψ), und somit lim hgk (T ∗ ϕk ),ψi = hT,ψi .
k→∞
Die Funktionen fk = gk (T ∗ ϕk ) sind die gesuchten Testfunktionen zur Approximation von T : D′ -lim fk = T . Daher gilt: k→∞
Satz. Jede Distribution T ist der D′ -Limes einer Folge von Testfunktionen.
Bemerkung. Für konkret gegebene Funktionen oder Distributionen kann es ausgesprochen schwierig sein, Faltungen „auszurechnen“. Als wichtiges Hilfsmittel werden wir in Kapitel 9 die Fouriertransformation kennenlernen. In praktischen, numerischen Anwendungen werden Faltungen von Funktionen vielfach näherungsweise mit Hilfe der diskreten Fouriertransformation berechnet.
168
7 Grundzüge der Distributionentheorie
′ Die Räume E ′ und DR , Stetigkeit von Faltungsoperatoren
Zum Abschluss dieses Abschnitts soll noch ein Aspekt der Eigenschaft 7 von S. 163 zur Konvergenz von Faltungen hervorgehoben werden. Dazu führen wir zwei neue Vektorräume von Distributionen ein und definieren Konvergenzbegriffe für Folgen in diesen Räumen, auf die wir später bei den Anwendungsbeispielen in Kapitel 10 zurückkommen werden. Definition. 1. E ′ bezeichnet den Raum der Distributionen T ∈ D′ (R) mit kompaktem Träger. Eine Folge Tn konvergiert in E ′ gegen eine Distribution T , wenn T = D′ -lim Tn gilt und n→∞ alle Tn und T gemeinsam ihre Träger in einer kompakten Menge K haben. 2. Mit Dr′ bezeichnen wir den Raum aller Distributionen T ∈ D′ (R), deren Träger im Intervall [r,∞[ für r ∈ R liegen. Eine Folge von Distributionen Tn konvergiert in Dr′ gegen eine Distribution T , wenn T = D′ -lim Tn gilt und alle Tn und T ihre Träger in [r,∞[ haben.
′ Den Raum DR =
n→∞
[
r∈R
Dr′ bezeichnen wir als Raum der kausalen Distributionen.
6
′ Eine Folge von Distributionen Tn konvergiert in DR gegen eine Distribution T , wenn ′ T = D -lim Tn gilt und zusätzlich alle Träger der Tn und T für ein geeignetes r ∈ R n→∞
im Intervall [r,∞[ liegen.
Diese Definitionen lassen sich in naheliegender Weise auch auf den Fall mehrdimensionaler Parametermengen übertragen. Wir beschränken uns auf den eindimensionalen Fall und notieren nachfolgend wieder kurz nur D′ für D′ (R). Betrachtet man nun für eine Distribution G den Faltungsoperator LG (T ) = G ∗ T für Distributionen T in Räumen, welche die Faltungen G ∗ T stets gestatten, dann sind die Eigenschaften von Faltungen aus Nr. 7 von S. 163 Stetigkeitsaussagen für solche Faltungsoperatoren. Wir werden in Kapitel 10 auf folgende Aussagen zurückgreifen: Satz. Für eine Distribution G ist der Faltungsoperator LG : Z → A, definiert durch LG (T ) = G∗T , ein linearer translationsinvarianter stetiger Operator in folgenden Fällen: 1. Z = E ′ , A = D′ und G ∈ D′ . 2. Z = D′ = A und G ∈ E ′ . ′ ′ 3. Z = DR = A und G ∈ DR .
Die Translationsinvarianz bedeutet, dass die Faltungsoperatoren LG für Translationen A der Parametermenge mit dem Translationsoperator, den wir hier ebenfalls mit A bezeichnen – auf D′ definiert durch AT = TA – vertauscht werden können, d.h., wenn für alle T ∈ Z und LG (T ) = G ∗ T gilt: 6
Oft auch als rechtsseitige Distributionen bezeichnet (engl. right-sided) wie bei A. H. Zemanian (2010). Wir verwenden wie C. Gasquet, P. Witomski (1998) die Bezeichnung „kausale“ Distributionen.
7.8 Übungsaufgaben
169 LG (AT ) = A(LG (T )) = (G ∗ T )A .
Der Satz ist nur eine Umformulierung von Nr. 4 und Nr. 7 auf von S. 163, wenn man die ′ oben eingeführten Konvergenzbegriffe in E ′ und DR beachtet. In Kapitel 10 gehen wir auf die Frage ein, welche translationsinvarianten linearen Operatoren L : Z → A sich für gewisse vorgegebene Distributionenräume Z und A als Faltungsoperatoren darstellen lassen. Dort werden auch Beispiele von Faltungsoperatoren angegeben, die nicht stetig sind, und Beispiele stetiger translationsinvarianter Operatoren, die keine Faltungsoperatoren sind (S. 278 und S. 302). Vorläufig formulieren wir schon hier ein grundlegendes Ergebnis, das auf L. Schwartz (1957) zurückgeht. Dort kann man auch den Beweis nachlesen. Satz von L. Schwartz. Jeder stetige translationsinvariante lineare Operator L : E ′ → D′ ist mit Faltungen von Elementen aus E ′ vertauschbar und lässt sich darstellen als Faltung mit h = Lδ, d.h. L(T ) = L(δ ∗ T ) = L(δ) ∗ T = h ∗ T für alle T ∈ E ′ .
Eine ausführliche Diskussion von Varianten dieses Satzes für Operatoren auch auf anderen Distributionenräumen als E ′ findet man bei A. H. Zemanian (2010) und E. Albrecht, M. Neumann (1979).
7.8 Übungsaufgaben A1) Welche der folgenden Funktionale auf D sind Distributionen? +∞ ˆ ϕ′ (t) dt , T (ϕ) = − 0
G(ϕ) = max ϕ(t) , t∈R
+∞ ˆ H(ϕ) = |ϕ(t)| dt , −∞
R(ϕ) = |ϕ(0)| , ∞ X S(ϕ) = ϕ(k) (0) , k=0
U (ϕ) =
X
|k|≤p
∂ k ϕ(0) für ϕ ∈ D(Rn ), p ∈ N .
˙ ˙ und tδ(t), ¨ ¨ A2) Berechnen Sie tδ(t), t2 δ(t) t2 δ(t). A3) Prüfen Sie: t pf(t−2 ) = pf(t−1 ), −1 t pf(t−2 + ) = pf(t+ ),
tδ (m) (t) = −mδ (m−1) (t) für m ∈ N.
170
7 Grundzüge der Distributionentheorie
A4) Zeigen Sie, dass der Cauchy-Hauptwert vp(t−1 ) dargestellt werden kann in der Form vp(t−1 ) = T (t) + f (t), wobei T eine Distribution mit beschränktem Träger ist und f (t) eine quadratisch integrierbare Funktion ist. A5)⋆ Zeigen Sie: Für jedes ϕ ∈ D gilt
+∞ ˆ lim ϕ(t)
ε→0 −∞
t2
t dt = vp(t−1 )(ϕ), + ε2
d.h. die regulären Distributionen Tε (t) = den Cauchy-Hauptwert vp(t−1 ). A6)⋆ Zeigen Sie, dass für −1 < λ < 0 durch T (ϕ) =
pf(λtλ−1 + )(ϕ)
=
t2
ˆ∞ 0
t , konvergieren für ε → 0 gegen + ε2
λtλ−1 (ϕ(t) − ϕ(0)) dt
eine singuläre Distribution definiert wird, welche die Ableitung von tλ+ = tλ s(t) regularisiert, d.h. die verallgemeinerte Ableitung der regulären Distribution tλ+ ist T (vgl. S. 139). Dabei ist s(t) wie bisher üblich die Einheitssprungfunktion. ′ 1 −3/2 −1/2 . = − pf t+ Beispiel: t+ 2 A7) Wie lautet die verallgemeinerte zweite Ableitung f¨ von π π π f (t) = (sin(t) + α)[s(t) − s(t − )] + ((t − )2 + α + 1)s(t − ) , 2 2 2 s(t) die Einheitssprungfunktion, α > 0 ? A8)⋆ Zeigen Sie, dass mit Benutzung der Transformationsregeln und des Konvergenzbegriffes für Distributionen sich für die verallgemeinerte Ableitung T˙ (t) einer Distribution T (t) ergibt: T (t + ∆t) − T (t) T˙ (t) = lim . ∆t→0 ∆t ˆ∞ sin(t) π A9) Rechnen Sie nach, dass dt = ist. Gehen Sie folgendermaßen vor: t 2 0
sin(t) − t für t = 0 stetig ergänzt werden kann. Folt sin(t) gern Sie hieraus mit Hilfe des Riemann-Lebesgue-Lemmas, dass gilt:
(a) Zeigen Sie, dass f (t) =
lim
n→∞
(2n+1)π/2 ˆ 0
sin(t) dt = lim n→∞ t
ˆπ/2 0
sin((2n + 1)t) dt . sin(t)
7.8 Übungsaufgaben
171
(b) Berechnen Sie dann den Grenzwert lim
n→∞
ˆπ/2
sin((2n + 1)t) dt . sin(t)
0
A10) Prüfen Sie, dass
∞ X
k=1 ∞ DX k=1
k sin(kt) in D′ konvergiert, und berechnen Sie
1 E k sin(kt),ϕ(t − ) 2
für ϕ(t) =
2
e−1/(1−t 0
)
für |t| < 1 sonst .
A11) Berechnen Sie für die Dirac-Distribution δ(t), die Einheitssprungfunktion s(t) und eine integrierbare Funktion f (t) und reelle Zahlen a und b die Faltungen ˙ − a) ∗ s(t − b), δ(t ˙ − a) ∗ δ(t ˙ − b), δ(t s(t − a) ∗ f (t),
s(t − a) ∗ s(t − b), sowie die Faltung s(t) ∗ [ln(t + 1)s(t + 1)]. A12) Für Gaußsche Glockenfunktionen der Form 2 2 1 e−(x−m) /(2σ ) Gm σ (x) = √ σ 2π
mit m ∈ R und σ > 0, rechne man nach, dass die Faltung wieder eine Gaußsche Glockenfunktion ergibt: m2 1 √ 1 +m2 . = Gm Gm σ ∗ Gτ σ2 +τ 2
Hinweis: Schreiben Sie dazu den Exponenten des Integranden im Faltungsintegral p 2 2 m2 1 2 2 Gm σ ∗ Gτ (x) in der Form u + v mit v = (x − (m1 + m2 ))/ σ + τ und substituieren Sie die Integrationsvariable durch u. m2 1 √ 1 +m2 spielt eine wichtige Rol= Gm Bemerkung. Der Zusammenhang Gm σ ∗Gτ σ2 +τ 2 le in der Wahrscheinlichkeitstheorie. Gm σ ist die Wahrscheinlichkeitsdichte der sog. (m,σ)-Normalverteilung mit Erwartungswert m und Standardabweichung σ. Die Summe zweier unabhängiger, (m,σ)-normalverteilter Zufallsgrößen besitzt dann die √ m Wahrscheinlichkeitsdichte Gm ∗ G , d.h. die Standardabweichung σ 2. σ σ Die Standardabweichung der Summe von √ n unabhängig genommenen Messwerten n, die des arithmetischen Mittels aus den derart verteilter Zufallsgrößen ist dann σ √ Messwerten also σ/ n. Mittelbildung aus mehreren Messwerten verringert somit die Varianz, das arithmetische Mittel der Messwerte liefert für große n eine brauchbare Schätzung des Erwartungswertes m.
172
7 Grundzüge der Distributionentheorie
A13) Beweisen Sie für integrierbare Funktionen f und g die Relation Tr (f ∗ g) ⊂ Tr (f ) + Tr (g). A14) Zeigen Sie, dass der Träger der Ableitung T˙ einer Distribution T ∈ D′ (R) im Träger von T enthalten ist. A15) Geben Sie ein Beispiel mit drei Distributionen, deren Faltung nicht assoziativ ist. A16) Wie lautet die allgemeine Lösung der Gleichung tT (t) = G(t) für G ∈ D′ mit 0 ∈ / Tr(G) ? A17) Geben Sie für n ∈ N eine Distribution T an mit Tr(T ) = {0} und tn T (t) 6= 0. ′ A18) Der Raum D+ aller Distributionen mit Träger in R+ 0 ist eine Faltungsalgebra. ˙ Bestimmen Sie die Faltungsinversen T mit T ∗ G = δ für die Distributionen G = δ, ′ G = δ˙ − αδ und den Einheitssprung G(t) = s(t) in D+ (R). ′ ′ A19) Zeigen Sie, dass jede Distribution T ∈ D+ genau ein unbestimmtes Integral S ∈ D+ besitzt und dass S = s ∗ T gilt (s die Einheitssprungfunktion).
A20)⋆ Zeigen Sie, dass eine homogene lineare Differentialgleichung n-ter Ordnung n X
ak (t)x(k) (t) = 0
k=0
mit unendlich oft differenzierbaren Koeffizienten ak (t), aufgefasst als Gleichung in D′ , außer den regulären klassischen Lösungen keine weiteren Lösungen in D′ besitzt. Zeigen Sie, dass dies gleichfalls für ein homogenes System erster Ordnung ~x ′ (t) = A(t)~x(t) mit einer komponentenweise unendlich oft differenzierbaren Matrix A gilt.
173
8
Anwendungsbeispiele für Distributionen
8.1 Periodische Distributionen sind verallgemeinerte Fourierreihen Für p > 0 bezeichnet man eine Distribution T aus D′ als p-periodisch, wenn im Sinn von Translationen für Distributionen gilt: T (t + p) = T (t) . Für ϕ ∈ D und k ∈ Z folgt dann hT (t + kp),ϕ(t)i = hT (t),ϕ(t − kp)i = hT,ϕi . Fourierreihen als Distributionen Satz. Jede trigonometrische Reihe
+∞ X
ck ejkt , deren Koeffizienten ck polynomial be-
k=−∞
schränkt sind, d.h. |k|−n |ck | −→ 0 für geeignetes n ∈ N, konvergiert distributionell |k|→∞
gegen eine 2π-periodische Distribution T .
Beweis. Bei polynomial beschränkten Koeffizienten ist für genügend großes n ∈ N die +∞ X ck ejkt gleichmäßig konvergent, stellt also eine stetige, 2π-periodische Reihe n (jk) k=−∞ k6=0
Funktion f dar. Mit der n-ten verallgemeinerten Ableitung f (n) von f folgt dann T (t) =
+∞ X
ck ejkt = c0 + f (n) (t).
k=−∞
Da für ϕ ∈ D und k ∈ Z stets +∞ +∞ ˆ ˆ jkt e ϕ(t) dt = ejkt ϕ(t − 2π) dt
−∞
−∞
gilt, ist T eine 2π-periodische Distribution. Eine ganz entsprechende Aussage gilt auch für andere Perioden p 6= 2π. Wenn eine klassische Fourierreihe punktweise fast überall oder im quadratischen Mittel konvergieren soll, müssen die Fourierkoeffizienten ck notwendigerweise eine Nullfolge bilden. Im distributionellen Sinn wird dagegen Konvergenz sogar noch erreicht, wenn die ck nur nicht allzu schnell wachsen. Alle diese nun als Distributionen betrachteten Reihen, die wir ab jetzt als verallgemeinerte Fourierreihen bezeichnen, dürfen außerdem gliedweise differenziert werden, was im Rahmen der klassischen Analysis gerade nicht der Fall ist (vgl. Abschnitt 4.3).
174
8 Anwendungsbeispiele für Distributionen
Beispiel: Periodische Impulsfolgen. Die 2π-periodischen Dirichlet-Kerne n X
Dn (t) =
ejkt
k=−n
konvergieren für kein t ∈ R punktweise. Für wachsende n oszillieren diese Funktionen auf R immer mehr (vgl. S. 11). Wir erhalten nun jedoch für n → ∞ sehr wohl Konvergenz im Distributionssinn: Satz. Die Dirichlet-Kerne konvergieren distributionell gegen die periodische Distribution T (t) =
+∞ X
ejkt = 2π
+∞ X
k=−∞
k=−∞
δ(t − 2πk).
Beweis. Es gilt D′ -lim Dn (t) = n→∞
und
+∞ X
ejkt = 1 + 2
cos(kt) = 1 + 2
∞ X sin(kt)
k
=
∞
d X sin(kt) , dt k k=1
k=1
k=−∞
k=1
∞ X
(π − t)/2 für 0 < t < 2π 0 für t=0
stellt die Sägezahnkurve S(t), S(t + 2kπ) = S(t) dar. S(t) π/2
t π
2π
−π/2
Distributionelle (gliedweise) Ableitung liefert ∞ X
k=1
+∞ X 1 cos(kt) = − + π δ(t − 2πk) . 2 k=−∞
˙ S(t) π −2π
0 −1/2
2π
4π
t
8.1 Periodische Distributionen sind verallgemeinerte Fourierreihen
175
Also erhält man für die Dirichlet-Kerne Dn (t): Dn (t) =
n X
ejkt = 1 + 2
k=−n
n X
k=1
D′
cos(kt) −→ 2π n→∞
+∞ X
k=−∞
δ(t − 2πk) .
Dies belegt den heuristischen Eindruck, den wir bereits vorher von den Dirichlet-Kernen gewonnen hatten (vgl. S. 11 und S. 40): Die Dirichlet-Kerne konvergieren gegen eine periodische Impulsfolge. Diese Impulsfolge ist eine singuläre Distribution. Satz. Für p-periodische Impulsfolgen ( p > 0, ω0 = 2π/p ) gelten entsprechend +∞ X
k=−∞
δ(t − kp) =
+∞ 1 X jkω0 t e p k=−∞
und
+∞ X
k=−∞
+∞ X ˙ − kp) = 1 jkω0 ejkω0 t . δ(t p k=−∞
Periodische Distributionen sind verallgemeinerte Fourierreihen Wir zeigen nun, dass periodische Distributionen stets durch verallgemeinerte Fourierreihen darstellbar sind und dass ihre Fourierkoeffizienten ck für |k| → ∞ nicht schneller wachsen als eine Potenz von |k|. Wir betrachten nur 2π-periodische Distributionen. Die Umformulierung für andere Periodenlängen mag dem Leser als Übung dienen. Ein Standard-Beweis dieses Resultats verwendet eine sogenannte Zerlegung der Eins. Wir konstruieren eine solche Zerlegung wie folgt: Wir wählen irgendeine gerade Testfunktion ϕ ≥ 0 mit ϕ(t) ≥ 1/2 in [−π,π] und Träger Tr(ϕ) ⊂]−2π,2π[. Damit definieren wir die 2π-periodische, unendlich oft differenzierbare +∞ X ϕ(t + 2kπ). Die Periodizität ist offensichtlich, die Glattheit folgt Funktion Φ(t) = k=−∞
aus der Tatsache, dass die obige Reihe in jedem beschränkten Intervall nur endlich viele Summanden ungleich Null hat, die alle unendlich oft differenzierbar sind. Es gilt stets Φ(t) ≥ 1/2. Damit nun führen wir die folgenden Funktionen ein: h(t) = ϕ(t)/Φ(t) ∈ D und H(t) =
+∞ X
h(t + 2kπ).
k=−∞
Es sind dann H(t) = 1 für alle t ∈ R und h(0) = 1. Man nennt die Darstellung von H eine Zerlegung der Eins mittels einer Testfunktion h. Zur Veranschaulichung dieser Funktionen und zum Verständnis der Rechnung im Anschluss betrachte man die folgenden Graphiken, für die wir als ganz konkretes Beispiel ϕ wie folgt wählen: 2 2 Mit ψ(t) = e−t /(1−t ) für |t| ≤ 1, ψ(t) = 0 sonst (vgl. S. 130), definieren wir ϕ durch 4t + 1 für −∞ < t < −1/4 ψ 19 ϕ(t) = 1 für −1/4 ≤ t ≤ 1/4 4t − 1 für 1/4 < t < +∞. ψ 19
176
8 Anwendungsbeispiele für Distributionen 1.2 1.0 0.8 0.6 0.4 0.2 0.0
1.2 1.0 0.8 0.6 0.4 0.2 0.0 -6
-4
-2
0
2
4
6
-6
-4
0
-2
2
4
6
Das linke Bild zeigt ϕ(t + 2π), ϕ(t), ϕ(t − 2π) und die Summenfunktion Φ. Das rechte Bild zeigt h(t + 2π), h(t), h(t − 2π) und die Summenfunktion H = 1 im Intervall [−2π,2π]. Der Träger von ϕ und h ist [−5,5].
Man rechnet nach, dass die Fourierkoeffizienten fk einer 2π-periodischen, auf [0,2π] integrierbaren Funktion f durch Anwendung von f auf die Testfunktion h(t) e−jkt gegeben sind: hf (t) , h(t) e
=
−jkt
+∞ ˆ2π X
+∞ ˆ +∞ X i= f (t)h(t) e−jkt dt =
k=−∞
−∞
−jkx
f (x)h(x + 2kπ) e
dx =
k=−∞ 0
ˆ2π
2(k+1)π ˆ
f (t)h(t) e−jkt dt
2kπ
f (x)H(x) e−jkx dx = 2πfk .
0
Weil h einen beschränkten Träger hat, sind die dabei auftretenden Reihen de facto endliche Summen und dürfen mit dem Integral vertauscht werden. Dieser Zusammenhang ist unabhängig von der speziellen Wahl, die wir für h und damit H getroffen haben, und gilt für jede analoge Zerlegung der Eins. Ersetzt man f durch eine 2π-periodische Distribution T , so ist auch hier die Größe hT (t) , h(t) e−jkt i unabhängig von der Wahl von h, da jedes solche T mit Hilfe einer Glättungsfolge (fn )n∈N wie auf S. 167 als distributioneller Limes von regulären und ebenfalls wieder 2π-periodischen Distributionen wie f dargestellt werden kann. Hieraus folgt, dass die mit irgendeinem h wie oben definierten Fourierkoeffizienten fkn von fn für n → ∞ stets den gleichen Grenzwert hT (t) , h(t) e−jkt i/(2π) haben. Dieser Ausdruck kann daher zur Definition der Fourierkoeffizienten von periodischen Distributionen ganz allgemein verwendet werden. Damit erhalten wir dann den angestrebten Satz über die Darstellung periodischer Distributionen als verallgemeinerte Fourierreihen. Definition. Die Fourierkoeffizienten ck einer 2π-periodischen Distribution T sind – mit h 1 hT (t) , h(t) e−jkt i. wie oben konstruiert – für k ∈ Z die komplexen Zahlen ck = 2π Satz. Jede 2π-periodische Distribution T hat die Darstellung T (t) =
+∞ X
ck ejkt
k=−∞
mit den in der Definition angegebenen Fourierkoeffizienten ck . Die Fourierkoeffizienten ck sind polynomial beschränkt, d.h. es gibt eine Konstante C und eine natürliche Zahl n, so dass für alle k ∈ Z \ {0} die Ungleichung |ck | ≤ C|k|n gilt.
8.1 Periodische Distributionen sind verallgemeinerte Fourierreihen
177
Beweis. a) Nach dem vorangehenden Beispiel gilt +∞ +∞ X X 1 jkt e ∗T (t) = h(t) δ(t − 2kπ) ∗ T (t). h(t) 2π k=−∞
k=−∞
Wegen Tr(h) ⊂] − 2π,2π[ und h(0) = 1 erhält man damit für T die Darstellung T (t) = T (t) ∗ h(t)δ(t) = h(t)
+∞ X
k=−∞
δ(t − 2kπ) ∗ T (t).
e der Eins wie oben ist, lässt sich b) Weil für jedes t auch e h(s) = h(t − s) eine Zerlegung H e ck auch mit h statt mit h berechnen. Also gilt T (t) ∗ h(t) ejkt = hT (s) , e h(s) ejk(t−s) i = 2πck ejkt .
c) Aus a) und b) folgt nun die gewünschte Darstellung von T als verallgemeinerte Fourierreihe: T (t) = T (t) ∗
+∞ +∞ X 1 1 X ejkt = h(t) 2π 2π k=−∞
k=−∞
+∞ X h(t) ejkt ∗T (t) = ck ejkt . k=−∞
Die zweite Gleichung verwendet die Konvergenz der Faltungen (vgl. S. 163), da h ∈ D ist. d) Ist I ein offenes Intervall, welches den Träger von h enthält, dann gibt es nach der Charakterisierung der Stetigkeit von T auf S. 157 ein K > 0 und n ∈ N0 , so dass für alle ϕ ∈ D mit Träger in I die Ungleichung |hT , ϕi| ≤ Kkϕkn gilt. Speziell folgt für k 6= 0 mit der Leibnizregel für die Ableitungen von h(t) e−jkt bis zur Ordnung n 2π|ck | = |hT (t) , h(t) e−jkt i| ≤ Kkh(t) e−jkt kn ≤ 2n Kkhkn |k|n . Die Fourierkoeffizienten ck sind also polynomial beschränkt.
Aus dem Satz folgt insbesondere, dass zwei verallgemeinerte Fourierreihen T (t) = +∞ +∞ X X ck ejkt und S(t) = dk ejkt genau dann gleich sind, wenn ck = dk für alle
k=−∞
k=−∞
k ∈ Z gilt, d.h. Koeffizientenvergleich ist möglich.
Bemerkung. Auch für Distributionen über einem mehrdimensionalen Parameterbereich, die in jeder Variablen 2π-periodisch sind, kann man analoge Darstellungen als verallgemeinerte Fourierreihen zeigen. Den Beweis findet man bei W. Walter (1994), V. S. Vladimirov (2002) oder L. Schwartz (1957). ∞ X
cos(2kt) für k k=1 t 6= (2k + 1)π/2, k ∈ Z (Aufgabe 6 zu Kapitel 6) folgt durch Differentiation die verallgemeinerte Fourierreihe für die als periodische Distribution T˙ aufzufassende regularisierte Tangens-Funktion: Beispiel. (Fourierreihe des Tangens) Mit T (t) = − ln |2 cos(t)| =
(−1)k
178
8 Anwendungsbeispiele für Distributionen tan(t) = 2
∞ X
(−1)k+1 sin(2kt) mit htan , ϕi = −hT , ϕ′ i für ϕ ∈ D.
k=1
Bemerkung. Regularisierungen von Funktionen mit Singularitäten wie hier beim Tangens sind im Allgemeinen nicht nur auf eine Weise möglich. Daher sei bemerkt, dass die oben angegebene Distribution T˙ als Regularisierung des Tangens die eindeutig bestimmte sogenannte kanonische Regularisierung im Sinn von I. M. Gel’fand, G. E. Shilov, N. Ya. Vilenkin (1964), Vol. I, ist. Die in den Abschnitten 4.1 – 4.3 behandelten Rechenregeln für Fourierreihen gelten aufgrund der Transformationsregeln für Distributionen auch für verallgemeinerte Fourierreihen. Zum Beispiel ergibt sich bei einer Translation der p-periodischen Impulsfolge +∞ X δ(t − kp) um t0 > 0 nach rechts k=−∞
+∞ X
k=−∞
δ((t − t0 ) − kp) =
+∞ 1 X jkω0 (t−t0 ) e p
(ω0 = 2π/p).
k=−∞
Zwei p-periodische Distributionen kann man im Allgemeinen nicht auf die in Abschnitt 7.7 definierte Weise falten. Keine der dort angegebenen Bedingungen für die Träger ist erfüllt. Man kann aber die p-periodische Faltung (T ∗ S)p von T (t) =
+∞ X
k=−∞
ck ejkω0 t
und S(t) =
+∞ X
dk ejkω0 t
(ω0 = 2π/p),
k=−∞
analog zu Abschnitt 5.2, S. 50 einführen durch (T ∗ S)p (t) =
+∞ X
ck dk ejkω0 t .
k=−∞
Sind etwa T = f (n) und S = g (m) verallgemeinerte Ableitungen n-ter bzw. m-ter Ordnung zweier stetiger p-periodischer Funktionen f und g (vgl. S. 173), dann ist (T ∗ S)p = (f ∗g)(n+m) , d.h. die p-periodische Faltung von T und S ist die verallgemeinerte Ableitung p der Ordnung n + m von (f ∗ g)p .
Anwendung bei asymptotisch stabilen Differentialgleichungen wie in Abschnitt 5.2 Das Langzeitverhalten der Lösungen asymptotisch stabiler gewöhnlicher linearer Differentialgleichungen mit konstanten Koeffizienten bei periodischen Anregungen lässt sich damit wie auf S. 52 durch die periodische Übertragungsfunktion beschreiben. Dabei kann auf Stetigkeitsvoraussetzungen, wie sie dort verlangt wurden, verzichtet werden, wenn periodische Eingangssignale, Übertragungsfunktionen und Ausgangssignale als periodische Distributionen mit verallgemeinerten Fourierreihendarstellungen gelesen werden. Alle Fourierreihen, aufgefasst als Distributionen T , dürfen insbesondere immer auch gliedweise differenziert werden und das Ergebnis stellt dann die verallgemeinerte Ableitung T˙ dar.
8.1 Periodische Distributionen sind verallgemeinerte Fourierreihen
179
Die Impulsmethode zur Berechnung von Fourierkoeffizienten Das Verständnis von Fourierreihen als Distributionen kann man zum Beispiel nutzen, um für „einfache“ stückweise stetig differenzierbare Funktionen die Fourierkoeffizienten nicht durch Integrationen zu berechnen, sondern durch Differentiation und durch Koeffizientenvergleich mit Reihen, welche Impulsfolgen mit bekannten Koeffizienten darstellen. Wir zeigen dies exemplarisch an folgendem Beispiel: 2π p p = f (t), k ∈ Z. ,f t+k Wir wählen etwa f (t) = cos(ω0 t) für 0 ≤ t < , ω0 = 2 p 2 1
f (t)
0 −1 0
p
p/2
3p/2
t-Achse
Für 0 ≤ t
0, an 6= 0).
Ein bekanntes Beispiel ist die Gleichung für die Auslenkung u eines Federpendels m
d2 u du (t) + k (t) + Du(t) = K(t). dt2 dt
Die Koeffizienten bezeichnen dabei die Masse m des Pendels, den Dämpfungskoeffizienten k und die Federkonstante D. Die auf das Pendel wirkende äußere Kraft ist K(t). Der Differentialoperator A in diesem Beispiel lautet A=m
d d2 + k + D. dt2 dt
Jeder Studierende kennt weitere Gleichungen dieses Typs, sei es aus der Mechanik, der Elektrizitätslehre oder anderen Anwendungsgebieten. In Anlehnung an typische Beispiele bezeichnen wir die Variable t als Zeitparameter. Für eine stetige Störung f (t) und verschwindende Anfangswerte ist die Lösung regulär und eindeutig bestimmt, und bei zeitlicher Verschiebung der rechten Seite zu f (t + t0 ) ergibt die entsprechend verschobene Lösung u von Au = f die Lösung v(t) = u(t + t0 ) von Av(t) = f (t + t0 ). Die Gleichung beschreibt dann ein sogenanntes zeitinvariantes lineares System.
8.2 Lineare Differentialgleichungen mit konstanten Koeffizienten
181
Die zentrale Bedeutung von Faltungen liegt in folgender Methode zum Auffinden partikulärer Lösungen solcher Differentialgleichungen, die wir jetzt als Gleichungen zwischen Distributionen auffassen. Grundlösungsverfahren. Man sucht zuerst eine Grundlösung g, d.h. eine Distribution g ∈ D′ , so dass gilt Ag = δ. Ist f eine Distribution, für welche die Faltung g ∗ f existiert, dann erhält man eine distributionelle partikuläre Lösung u der Gleichung Au = f durch u = g ∗ f. Denn dann ist A(g ∗ f ) = Ag ∗ f = δ ∗ f = f. Die Faltung g ∗ f existiert sicher, wenn f einen beschränkten Träger besitzt („zeitbegrenzt“ ist), oder wenn die Träger von g und f beide nach derselben Seite halbbeschränkt sind, zum Beispiel, wenn sie in [0,∞[ liegen. Bemerkungen 1. Aus dem Satz über unbestimmte Integrale von Distributionen (siehe S. 150) folgt, dass die homogene Differentialgleichung Au = 0 außer den klassischen, unendlich oft differenzierbaren Lösungen keine weiteren Distributionslösungen hat (man vgl. die Übungsaufgabe A20 am Ende des vorherigen Kapitels). Dies ist sofort plausibel, da jede Lösung u auf der linken Seite der Gleichung Au = 0 ja mit A differenziert wird, also wie die rechte Seite eine unendlich oft differenzierbare Funktion sein muss. 2. Bei Anfangswertproblemen benötigt man in der Regel Zusatzbedingungen, die sicherstellen, dass bei der Lösung von Au = f von Anfangswerten gesprochen werden kann. Wir gehen darauf später ein (S. 184). 3. Die oben eingeführte Grundlösung g ist für technisch-physikalische Gleichungen im Allgemeinen keine Lösung im physikalischen Sinn, weil die physikalische Einheit von g in der Regel nicht die Dimension einer solchen Lösung hat. Die Distribution g ist als Funktional zu verstehen, dessen Faltung u = g ∗ f mit einer rechten Seite f erst eine Lösung der Gleichung Au = f ergibt. Die Lösung u = g ∗ f besitzt dann mit f und den Koeffizienten der Gleichung auch die korrekte physikalische Dimension. Gleiches gilt für die im Folgenden eingeführte Impulsantwort. Man beachte hierzu auch die anschließenden Beispiele im nächsten Abschnitt. Die kausale Grundlösung Beschreibt die Differentialgleichung Au = f ein physikalisches System, dann sind die Lösungen u mögliche Systemantworten auf die durch f mathematisch modellierte Anregung des Systems. Jede spezielle Lösung u hängt außer von f noch von den Anfangsbedingungen des Systems ab. Wir setzen nun voraus, dass sich das System bis zu einem Anfangszeitpunkt t0 im energielosen Ruhezustand befindet, d.h. alle Anfangswerte sind Null, und betrachten eine Anregung f ab diesem Zeitpunkt t0 , d.h. Tr (f ) ⊂ [t0 ,∞[. Unter der Voraussetzung der Kausalität des Systems kann die Systemantwort nicht schon zeitlich vor der Anregung vorhanden sein. Wir suchen daher eine Lösung u von Au = f , deren Träger
182
8 Anwendungsbeispiele für Distributionen
ebenfalls in [t0 ,∞[ enthalten ist. Wenn eine solche kausale Lösung existiert, dann ist sie eindeutig bestimmt; denn für jede weitere kausale Lösung u˜ gilt A(u − u ˜) = 0, und u − u ˜ verschwindet für t < t0 . Wegen der Eindeutigkeit dieser Lösung der homogenen Gleichung muss dann u − u ˜ die Nullfunktion sein. Wenn das Kausalitätsprinzip nicht verletzt werden soll, dürfen keine nichttrivialen Lösungen der homogenen Gleichung zu u addiert werden. Wir nennen im Folgenden eine Distribution kausal, wenn ihr Träger in einer Halbachse [t0 ,∞[ enthalten ist. Wir zeigen nun, dass es genau eine kausale Grundlösung g ∈ D′ gibt. Ihr Träger liegt in [0,∞[ und sie ist die Antwort des durch Au = f beschriebenen Systems auf einen Eingangsimpuls zur Zeit t = 0. Die Faltung g ∗ f mit der kausalen Grundlösung existiert dann für jede rechte Seite f ∈ D′ , deren Träger nach links beschränkt ist, und ergibt wegen Tr (g ∗ f ) ⊂ Tr (g) + Tr (f ) die gesuchte kausale Lösung von Au = f . Satz. Die kausale Grundlösung g ist gegeben durch g(t) = v(t)s(t) . Der Träger von g ist enthalten in [0,∞[. Dabei ist s(t) die Einheitssprungfunktion und v(t) diejenige Lösung der homogenen Gleichung Au = 0 n-ter Ordnung, die folgenden Anfangsbedingungen genügt: Für n = 1 : v(0) =
1 1 ; für n ≥ 2 : v (k) (0) = 0 für k = 0, . . . ,n−2, v (n−1) (0) = . a1 an
Man kann g daher mit Hilfe der Nullstellen des charakteristischen Polynoms bestimmen. Beweis. Für n = 1 ist e−a0 t/a1 s(t)/a1 die gesuchte Grundlösung. Für n ≥ 2 und für k = 1, . . . ,n gilt aufgrund der Anfangsbedingung mit einer beliebigen Testfunktion ϕ h(vs)(k) ,ϕi = hv (k) s + v (k−1) δ,ϕi . Für k = 1 ist dies sofort zu sehen, für 1 ≤ k ≤ n−1 ergibt sich mit vollständiger Induktion und der Anfangsbedingung h(vs)(k+1) ,ϕi = −h(vs)(k) ,ϕ′ i = −hv (k) s + v (k−1) δ,ϕ′ i = −hv (k) s,ϕ′ i = hv (k+1) s + v (k) δ,ϕi .
Daraus folgt dann bei erneuter Anwendung der Anfangsbedingung mit Av = 0 * n ! + + * n X X (k) (k) hAg,ϕi = s + δ,ϕ = hδ,ϕi . ak (vs) ,ϕ = ak v k=0
k=0
Die Eindeutigkeit der kausalen Grundlösung hatten wir schon oben festgestellt. Beispiel. Die Differentialgleichung u(3) +u˙ = 0 hat das charakteristische Polynom P (λ) = λ3 + λ mit den Nullstellen λ1 = 0, λ2 = j und λ3 = −j. Damit ist die allgemeine Lösung u(t) = c1 + c2 sin(t) + c3 cos(t) mit Parametern c1 , c2 , c3 aus R. Aus der Anfangsbedingung folgt die spezielle Lösung v(t) = 1 − cos(t) und die kausale Grundlösung g(t) = s(t) − cos(t)s(t). Bemerkung. Ist v(t)s(t) die kausale Grundlösung von Au = f , dann ist −v(t)s(−t) ebenfalls eine Grundlösung. Durch Konvexkombinationen von v(t)s(t) und −v(t)s(−t) erhält man daher unendlich viele nicht-kausale Grundlösungen. Die kausale Grundlösung g heißt auch Green-Funktion nach G. Green (1793-1841).
8.2 Lineare Differentialgleichungen mit konstanten Koeffizienten
183
Impulsantwort und Sprungantwort zeitinvarianter linearer Systeme Viele kausale, zeitinvariante lineare Systeme in technischen Anwendungsbereichen werden beschrieben durch Differentialgleichungen der Form A1 u = A2 f, wobei A1 und A2 zwei lineare Differentialoperatoren mit konstanten Koeffizienten sind. Es treten also auch Ableitungen auf der rechten Seite auf. Wir verwenden weiterhin t0 = 0 als Anfangszeitpunkt für Störungen f und verstehen eine Distribution f mit Tr(f ) ⊂ [0,∞[ als Eingangsgröße, die eindeutig bestimmte distributionelle Lösung u mit Tr(u) ⊂ [0,∞[ als gesuchte Ausgangsgröße des linearen Systems. Das zweite Beispiel im nächsten Abschnitt ist von diesem Typ. Ist nun g die kausale Grundlösung von A1 g = δ, so erhält man die kausale Impulsantwort h des Systems A1 u = A2 f durch h = g ∗ A2 δ = A2 g. Denn dann ist A1 h = A1 (g ∗ A2 δ) = A1 g ∗ A2 δ = δ ∗ A2 δ = A2 δ. Der Träger von h ist enthalten in [0,∞[. Da man die Impulsantwort h mit jeder Distribution f falten kann, deren Träger nach unten beschränkt ist, besteht folgender Zusammenhang zwischen solchen Eingangsgrößen f , der Impulsantwort h und der Systemantwort u: A1 (h ∗ f ) = A1 h ∗ f = A2 δ ∗ f = δ ∗ A2 f = A2 f. Satz. Die kausale Lösung u für eine Anregung f mit Tr (f ) ⊂ [0,∞[ ergibt sich durch die Faltung h ∗ f von f mit der kausalen Impulsantwort h: u = h ∗ f. Der Träger von u ist enthalten in [0,∞[. Wegen dieses Zusammenhangs benutzt man in der Systemtheorie die Impulsantwort h zur Kennzeichnung des Übertragungsverhaltens kausaler, zeitinvarianter linearer Systeme der Form A1 u = A2 f . Diese Charakterisierung des Übertragungsverhaltens gilt allgemeiner auch für kausale zeitinvariante lineare Systeme, die nicht durch Differentialgleichungen beschrieben werden können (zum Beispiel Verzögerungsleitungen oder Integrierglieder in der Elektrotechnik). Wir kommen auf Grundlagen der linearen Systemtheorie in Kapitel 10 noch detaillierter zurück. Messtechnisch leichter erfassbar als die Impulsantwort h ist meist die kausale Sprungantwort a, d.h. die Reaktion auf die Einheitssprungfunktion s. Aus A1 a = A2 s folgt jedoch sofort A1 a˙ = A2 s˙ = A2 δ. Man erhält die Impulsantwort h durch Differentiation der Sprungantwort a, kann also kausale, zeitinvariante lineare Systeme A1 u = A2 f statt durch ihre Impulsantwort h gleichermaßen durch ihre Sprungantwort a charakterisieren. Erläuterung. Physikalisch realisierbare, zeitinvariante lineare Systeme der Form Au = x sind kausal (Schaltungen, Regler etc.). Die Systemantwort auf eine reguläre Anregung x(τ ) mit x(τ ) = 0 für τ < 0 ist zur Zeit t ≥ 0 gegeben durch das Faltungsintegral
184
8 Anwendungsbeispiele für Distributionen
u(t) =
ˆt 0
x(τ )h(t − τ )dτ.
Die Faltung u(t) ist also eine kontinuierliche Superposition von Werten der Anregung x, und zwar von Werten, mit denen die Anregung überhaupt begonnen hat (x(τ ) für τ = 0) über den gesamten Zeitverlauf des „Signals“ x hinweg bis zur „Gegenwart“ t. Die Stärke, mit der die Werte x(τ ) in diese Superposition eingehen, wird dabei gesteuert durch die Faktoren h(t − τ ). Dabei wird der Gegenwartswert x(t) mit dem Faktor h(0) gewichtet, der am weitesten zurückliegende Wert x(0) mit dem Faktor h(t). Man könnte daher sagen, dass die Impulsantwort h das „ physikalische Gedächtnis“ des Systems (einer elektrotechnischen Schaltung, eines Reglers etc.) beinhaltet: Der gesamte Zeitablauf von 0 bis t geht durch die Superposition von Signalwerten x(τ ), 0 ≤ τ ≤ t, mit den Gewichten h(t − τ ) in die Systemantwort h ∗ x zur Zeit t ein. In den Gewichten h(t − τ ) steckt die Information über die Stärke, mit der vergangene Ereignisse im System aufgrund seiner Bauart noch in die Gegenwart hineinwirken. Man vergleiche hierzu insbesondere die Berechnung der Impulsantwort h(t) aus der allgemeinen Lösung des homogenen Systems (siehe S. 182). Daran sieht man deutlich, wie die Eigenlösungen und das Abklingverhalten bei Einschwingvorgängen, mithin wie die Wurzeln des charakteristischen Polynoms die Impulsantwort h(t) bis auf einen Faktor eindeutig festlegen. Wenn wir außerdem noch beachten, dass typische Impulsantworten von asymptotisch stabilen, kausalen zeitinvarianten Systemen, die durch lineare Differentialgleichungen beschrieben sind, für t → ∞ sehr schnell gegen Null gehen, dann erkennen wir, dass in der Superposition h∗x Werte von x(τ ) in der Regel ein umso stärkeres Gewicht besitzen, je näher τ der „Gegenwart“ t ist, und dass die Gewichte h(t − τ ) umso schneller abnehmen, je weiter man mit τ → 0 in die „Vergangenheit“ geht. Lineare Anfangswertprobleme n-ter Ordnung mit konstanten Koeffizienten Wir betrachten weiterhin Gleichungen mit konstanten Koeffizienten der Form P (D)u = Q(D)f für D = d/ dt, Polynome P (λ) =
n X
k=0
ak λk (n > 0, an 6= 0) und Q(λ) =
Die Notation P (D) des Differentialoperators bedeutet P (D) =
n X
k=0
ak
m X
bk λk .
k=0
dk . dtk
Für die Gleichungen P (D)u = Q(D)f in D′ ist bei distributionellen rechten Seiten ohne Zusatzbedingungen nicht klar, was Anfangswerte bedeuten sollen. Etwa besitzt die Gleichung u˙ = δ˙ die allgemeine Lösung u = δ + c mit beliebigen Konstanten c, ein Anfangswert u(0) = a macht aber keinen Sinn.
8.2 Lineare Differentialgleichungen mit konstanten Koeffizienten
185
Wir wollen erklären, wie im Folgenden ein Anfangswertproblem verstanden werden soll. Dazu nehmen wir an, dass die Differentialgleichung ein Übertragungssystem beschreibt, welches ein gegebenes zeitabhängiges Eingangssignal f in ein zugehöriges Ausgangssignal u transformiert. Damit die Differentialgleichung dieses Ausgangssignal u als eindeutige Lösung besitzt, sind weitere Bedingungen über die Natur des Systems und den Typ des Eingangssignals f zu formulieren. Hierzu nehmen wir an, dass unser System kausal ist, d.h. eine Störung des in Ruhe befindlichen Systems durch eine Anregung mit Träger in [t0 ,∞[ erzeugt eine Systemantwort mit Träger in [t0 ,∞[. Über die rechte Seite f setzen wir voraus, dass f von der Form ′ f = fr + fg mit fr ∈ C m (R) und fg ∈ D+ ist. Dabei bedeuten C m (R) den Raum der ′ den Raum der Distributionen m-mal stetig differenzierbaren Funktionen auf R und D+ mit Träger in [0,∞[. Als Anfangszeitpunkt wählen wir dabei t0 = 0 und schreiben Anfangsbedingungen der Form u(k) (0−) = lim u(k) (t) = ck für k = 0, . . . ,n − 1 vor. t→0,t 0 und hinreichend glattes f mit der klassischen Lösung des Anfangswertproblems übereinstimmt. Es gilt folgende Aussage: ′ Satz. 1. Für f ∈ D+ ist die Distribution T = g ∗ Q(D)f + zs die eindeutige kausale Lösung der distributionellen Gleichung ! n k−1 X X ak cp δ (k−1−p) . P (D)u = Q(D)f + k=1
Dabei sind P (λ) =
n X
k=0
p=0
ak λk , g die kausale Grundlösung von P (D)u = δ, s die Ein-
heitssprungfunktion und z die klassische Lösung der homogenen Gleichung P (D)u = 0, welche den Anfangsbedingungen z (k) (0) = ck , k = 0, . . . ,n − 1, genügt. Die Lösung ist die Faltung von g mit der rechten Seite der obigen Differentialgleichung. 2. Für f ∈ C m (R) mit Träger in [0,∞[ ist T = g ∗ Q(D)f + zs regulär und stimmt für t > 0 mit der klassischen Lösung u des Anfangswertproblems zu den Anfangswerten u(k) (0−) = ck , k = 0, . . . ,n − 1 überein.
188
8 Anwendungsbeispiele für Distributionen
′ Beweis. Die Differentialgleichung besitzt eine eindeutige Lösung in D+ . Einsetzen von T in die Gleichung zeigt die Behauptung, da für k = 1, . . . ,n − 1
(zs)(k) = z (k) s +
k−1 X
cp δ (k−1−p) .
p=0
Für f ∈ C m (R) mit Träger in [0,∞[ ist die klassische Lösung des Anfangswertproblems u = g ∗ Q(D)f + z. Sie stimmt für t > 0 mit der in diesem Fall regulären Distribution T überein. Beispiel. Die Lösung des Anfangswertproblems aus dem vorangehenden Beispiel 2 auf Z Seite 186 ist x(t) = ts(t) + v0 t + x0 . Sie ist stetig, zeigt aber als Folge der Stoßkraft m bei t = 0 eine abrupte Geschwindigkeitsänderung. Die Lösung des Anfangswertproblems ′ in D+ , d.h. der modifizierten Differentialgleichung m¨ u = Zδ + m(x0 δ˙ + v0 δ) „bei ausgeZ blendeter Vergangenheit“ ab t = 0 ist T (t) = ts(t) + v0 ts(t) + x0 s(t), also T = xs. m 8
8
6
6
4
4
2
2
0
0
-1.0
-0.5
0.0
0.5
1.0
-1.0
-0.5
0.0
0.5
1.0
Die Bilder zeigen links x(t) und rechts T (t) für m = 1 kg, x0 = 2 m, v0 = 0.4 m/s, Z = 5 Ns. Das dritte Beispiel von Seite 186 behandeln wir im nächsten Abschnitt. Bemerkungen. 1. Die im Vergleich zu P (D)u = Q(D)f modifizierte Differentialglei′ chung im ersten Teil des letzten Satzes für Anfangswertprobleme in D+ geht zurück auf A. H. Zemanian (2010), L. Schwartz (1957) und G. E. Shilov (1968). Diese Gleichung enthält die Anfangswerte direkt, und deren Einfluss ergibt gerade die Wirkung des Anfangszustandes auf die Lösung für t > 0. Es spielt dabei keine Rolle, wie der Anfangszustand „wirklich“ erreicht worden ist (vgl. auch Beispiel 2 im folgenden Abschnitt). Ein Vorteil dieser Formulierung für Probleme, bei denen nur die Lösung ab t0 = 0 interessiert, ′ ist folgender: Das Anfangswertproblem ist dadurch in der Faltungsalgebra D+ formuliert, und man kann mit der modifizierten Gleichung dann solche Probleme mit distributionellen rechten Seiten auch mit der bei Ingenieuren viel gebrauchten Laplace-Transformation, die ′ ja gerade in D+ operiert, lösen. Man vergleiche hierzu etwa L. Schwartz (1966), A. H. Zemanian (2010) oder R. Brigola, P. Singer (2009). Unter geeigneten Zusatzbedingungen, die in praktischen Anwendungen oft erfüllt sind, kann man auch die Fouriertransformation zur Lösung heranziehen. Wir gehen in Abschnitt 11.6 darauf ein. 2. In analoger Weise lassen sich auch Anfangswertprobleme in Halbräumen für partielle Differentialgleichungen mit distributionellen rechten Seiten behandeln. Interessierte Leser seien dazu auf L. Schwartz (1957), G. E. Shilov (1968) oder H. Triebel (1980) verwiesen.
8.2 Lineare Differentialgleichungen mit konstanten Koeffizienten
189
3. Die Beweise der beiden letzten Sätze zeigen, dass nur hinreichende Glattheit der rechten Seite in einer linksseitigen Umgebung von t0 = 0 notwendig ist, um die Ergebnisse zu erhalten. Man kann dann auch für die Halbgerade t < 0 die Lösung des Anfangswertproblems mit Hilfe der Parametertransformation t → −t ähnlich wie im letzten Satz berechnen, und auch dafür die rechtsseitige Laplace-Transformation verwenden. Hierzu sei wieder auf die oben schon zitierte Literatur verwiesen. Satz. Für t < 0 ist die Lösung des Anfangswertproblems zu gegebenen Anfangswerten ′ u(k) (0−) = ck (k = 0, . . . ,n − 1) die Reflexion u(t) = y(−t) der Lösung y ∈ D+ von ! n k−1 X X (−1)k ak P (−D)y = (Q(−D)fˇr )s + (−1)p cp δ (k−1−p) . k=1
p=0
Dabei ist fˇr (t) = fr (−t), f = fr + fg wie im Satz auf S. 186. Beweis. Man betrachte die kausale Grundlösung g = vs wie auf S. 182, vˇ(t) = v(−t) und die Lösung z von P (D)u = 0 zu Anfangswerten z (k) (0) = ck . Dann ist −ˇ vs die kausale ′ . Die Faltung von −ˇ v s mit Grundlösung der reflektierten Gleichung P (−D)y = δ in D+ der rechten Seite der reflektierten Gleichung ! n k−1 X X k p (k−1−p) (−1) ak (−1) cp δ P (−D)y = (Q(−D)fˇr )s + k=1
p=0
′ ergibt die Reflexion y ∈ D+ der Lösung u unseres Anfangswertproblems für t < 0. Aufgrund der Regularitätseigenschaften von v und fr verschwinden nämlich die stetigen Fal(k) tungen −ˇ v s ∗ (Q(−D)fˇr )s für k = 0, . . . ,n − 1 und t → 0+, während die Faltung von (−ˇ v s)(k) mit dem singulären Term der rechten Seite mit (ˇ z s)(k) übereinstimmt, d.h. (k) k für t → 0+ gegen zˇ (0) = (−1) ck konvergiert. Die Reflexion u von y ergibt dann die verlangten Anfangswerte ck = u(k) (0−), k = 0, . . . ,n − 1.
Beispiel. Zur Demonstration betrachten wir die Gleichung u ¨ + u = f˙ mit Anfangsbedingungen u(0−) = 0, u(0−) ˙ = 1 und f (t) = s(t + 1) − s(t) + δ(t). Die kausale Grundlösung lautet g(t) = v(t)s(t) = sin(t)s(t). Das Anfangswertproblem ′ ˙ Es hat die eindeutige für t ≥ 0 in D+ lautet mit fg (t) = −s(t) + δ(t) dann x¨ + x = δ. kausale Lösung x(t) = cos(t)s(t). Für t < 0 gehen wir wie im gerade gezeigten Satz vor: Mit fˇr (t) = s(−t + 1), P (λ) = λ2 + 1, Q(λ) = λ, und −ˇ v s = g löst man die Gleichung ′ P (−D)y(t) = δ(t − 1) − δ(t) wie in der vorangehenden Bemerkung in D+ und erhält y(t) = − sin(t)s(t) + sin(t − 1)s(t − 1). Damit haben wir dann u(t) = x(t) + yˇ(t) als Gesamtlösung, welche die Anfangsbedingungen u(0−) = 0 und u(0−) ˙ = 1 erfüllt: u(t) = cos(t)s(t) + sin(t)s(−t) − sin(t + 1)s(−t − 1) für t ∈ R.
190
8 Anwendungsbeispiele für Distributionen
Kausale lineare Systeme erster Ordnung mit konstanten Koeffizienten Wir betrachten noch Anfangswertprobleme auf der Halbgerade t ≥ 0 für lineare Systeme erster Ordnung der Form X˙ = AX + F mit einer konstanten (n × n)-Matrix A und Vektor-Distributionen X und F . Die Komponenten von F sollen Träger in [0,∞[ haben. Wir verwenden im Weiteren folgende Notation: ′ Definition. Für (n×n)-Matrizen G mit Komponenten gkm∈D+ und Vektor-Distributionen ′ ′n F mit n Komponenten fm ∈ D+ , d.h. F ∈ D+ , ist die Faltung G ∗ F = (ck )1≤k≤n definiert durch n X ck = gkm ∗ fm . m=1
Man rechnet leicht nach, dass für die komponentenweise verallgemeinerte Ableitung (G∗F )′ wie im eindimensionalen Fall (G∗F )′ = G′ ∗F = G∗F ′ gilt, und prüft mit etwas Geduld, dass für eine konstante Matrix A, G und B wie oben und eine Vektor-Distribution F gilt: (AG + B) ∗ F = A(G ∗ F ) + B ∗ F. Mit der bekannten Fundamentalmatrix eAt des Systems können wir nun folgenden Satz formulieren, in dem s wieder die Einheitssprungfunktion ist: ′n Satz. 1. Das System X˙ = AX + F besitzt für F ∈ D+ mit G(t) = eAt s(t) die eindeutig bestimmte kausale Lösung U =G∗F . n
′ 2. Die Vektor-Distribution T = G ∗ (F + ~x0 δ) = G ∗ F + G~x0 ist für F ∈ D+ und einen n gegebenen Vektor ~x0 ∈ R die eindeutig bestimmte kausale Lösung von
X˙ = AX + F + ~x0 δ. Für stetige Störungen F ist T regulär und stimmt für t > 0 mit der klassischen Lösung X des Anfangswertproblems X˙ = AX + F zu den Anfangswerten X(0) = ~x0 überein: X(t) = e
At
~x0 +
ˆt
eA(t−τ ) F (τ ) dτ .
0
Beweis. 1. Mit der Einheitsmatrix E folgt aus U˙ = G˙ ∗ F = (AG + Eδ) ∗ F = AU + F , dass U = G ∗ F eine Lösung ist. U ist kausal und damit eindeutig bestimmt. 2. Für die Distribution T = G ∗ F + G~x0 ist T˙ = G˙ ∗ F + G˙ x~0
= (AG + Eδ) ∗ F + (AG + Eδ)~x0 = AT + F + ~x0 δ.
8.3 Anwendung auf lineare elektrische Netzwerke
191
Damit ist T die eindeutig bestimmte kausale Lösung des gestellten Problems. Mit stetigem F ist auch T regulär, stetig und stimmt offensichtlich für t > 0 mit der bekannten klassischen Lösung X des Anfangswertproblems mit X(0) = ~x0 überein. Bemerkungen. 1. Welche Einträge stehen in der Matrix eAt ? Die Matrix eAt s(t) hat hier die Rolle, welche die kausale Grundlösung im eindimensionalen Fall hatte. Die k-te Spalte von eAt s(t) zeigt die Reaktion aller Zustandsvariablen auf eine δ-Störung der Zustandsvariablen xk . Die Antwort des Systems auf die Störung F = 1n δ ist eAt 1n s(t) mit dem Vektor 1n , dessen sämtliche Komponenten gleich Eins sind. Sie beschreibt die Reaktion jeder Komponente des Zustandsvektors X bei simultanen δ-Störungen dieser Komponenten. Die Elemente der Matrix eAt sind daher Linearkombinationen von Funktionen der Form m t sin(αt) eβt und tn cos(γt) eλt mit m,n ∈ N0 und α,β,γ,λ ∈ R, abhängig von den Nullstellen des charakteristischen Polynoms der Matrix A. 2. Die Gleichung X˙ = AX + F + ~x0 δ ist die adäquate mathematische Formulierung ′ ′ lösen will. Für die explizite × . . . × D+ für ein Anfangswertproblem, das man in D+ At Bestimmung der Fundamentalmatrix e kann man für kleine Matrizen bei einfachen Anwendungsbeispielen gut mit einem Computeralgebrasystem oder mit der schon erwähnten Laplace-Transformation arbeiten. Eine Analyse numerischer Algorithmen zur Berechnung von eAt bei größeren Matrizen A findet man in der empfehlenswerten Arbeit von C. Moler, C. Van Loan (2003).
Der Satz von Malgrange-Ehrenpreis Das Grundlösungsverfahren behält seine Gültigkeit auch für lineare partielle Differentialgleichungen mit konstanten Koeffizienten (vgl. S. 163). Die Existenz von Grundlösungen wird durch den Satz von B. Malgrange (1953) und L. Ehrenpreis (1954) sichergestellt. Beweise für dieses bedeutende Ergebnis über die Lösbarkeit linearer Differentialgleichungen können interessierte Leser zum Beispiel bei L. Hörmander (2003), W. Rudin (1990) oder bei W. Walter (1994) finden. Wir folgen in Kapitel 11 als Anwendung der Fouriertransformation einem Beweis, der auf Arbeiten von N. Ortner, P. Wagner (1994) und P. Wagner (2009) zurückgeht, mit einer expliziten Formel zur Darstellung von Grundlösungen.
8.3 Anwendung auf lineare elektrische Netzwerke Wir testen das Grundlösungsverfahren an vier einfachen Anwendungsbeispielen für elektrische Netzwerke. Die Analyse des Verhaltens solcher Schwingkreise bei unterschiedlichen Anregungen gehört zur Grundlagenausbildung in einem Studium der Physik und selbstverständlich in der Elektrotechnik.
192
8 Anwendungsbeispiele für Distributionen
Beispiel 1. Gegeben sei das folgende „RL-Netzwerk“ mit elektrischem Widerstand R und Induktivität L L
I(t)
U (t)
R
0 für t < 0 werde I(t) mit I(t) = 0 für t < 0 gesucht aus der U0 sin(ωt) für t ≥ 0 zugehörigen Differentialgleichung Für U (t) =
L
dI (t) + RI(t) = U (t). dt
Die kausale Impulsantwort ist gegeben durch h(t) =
1 −(R/L)t e s(t) , s(t) die Einheitssprungfunktion , L
denn ˙ Lh(t) + Rh(t) = −
R R −(R/L)t e s(t) + e−(R/L)t δ(t) + e−(R/L)t s(t) = δ(t). L L
Hieraus folgt dann sofort die Lösung I(t) durch Faltung der regulären Distributionen h(t) und U (t). Beide Distributionen haben ihre Träger in [0,∞ [. Für t ≥ 0 ist ˆt I(t) = (h ∗ U )(t) = h(t − τ )U (τ ) dτ . 0
Durchführung der Integration liefert I(t) =
U0 U0 ωL e−(R/L)t (R sin(ωt) − ωL cos(ωt)) + 2 R2 + (ωL)2 R + (ωL)2 {z } | {z } | stationärer abklingender Anteil Einschwingvorgang
für t ≥ 0; I(t) = 0 für t < 0.
Beispiel 2. (Schematisches Hochpass-Filter) Beim Hochpass-Filter von Beispiel 3 auf S. 186 sei die Eingangsspannung Ue (t) = U0 −U0 s(t). Die Schaltung wird bei geladenem Kondensator beschrieben durch das Anfangswertproblem 1 U˙ a + Ua = −U0 δ und Ua (0−) = 0. RC
8.3 Anwendung auf lineare elektrische Netzwerke
193
Die allgemeine Lösung UH (t) der zugehörigen homogenen Differentialgleichung ist UH (t) = K e−t/(RC) ,
(K ∈ R beliebig).
Als kausale Grundlösung ergibt sich g(t) = e−t/(RC) s(t). d auf der Die zugehörige Impulsantwort h bestimmt man mit dem Differentialoperator dt rechten Seite der Ausgangsgleichung durch Differentiation der Grundlösung g: h(t) = g(t) ˙ = δ(t) −
1 −t/(RC) e s(t) . RC
Für die Eingangsspannung Ue (t) = U0 s(−t) ist die Lösung Ua (t) = −U0 (g ∗ δ)(t) = −U0 e−t/(RC) s(t). Ist die Anregung ein (idealer) Spannungsstoß Ue (t) = U0 R1 C1 δ(t) mit der Impulsstärke U0 R1 C1 in der physikalischen Einheit Vs (vgl. S. 135), erzeugt etwa mit einem (idealen) vorgeschalteten Differenzierglied, und Ua (0−) = 0, so ergibt sich die Ausgangsspannung Ua auf diesen Eingangsimpuls durch Faltung mit der kausalen Impulsantwort h: Ua (t) = h(t) ∗ U0 R1 C1 δ(t) = U0 R1 C1 δ(t) −
U0 R1 C1 −t/(RC) e s(t). RC
Beispiel 3. Gegeben sei der dargestellte RCL-Schwingkreis mit Widerstand R, Kapazität C und Induktivität L.
R
C
Ue (t)
Ua (t) L
Die Differentialgleichung 1 2 ˙ Ua = U1 δ˙ und Ua (0−) = U0 , U˙a (0−) = 0 Ua + U¨a + √ LC LC beschreibt den Schwingkreis bei kritischer Dämpfung (R2=4L/C) mit Eingangsspannung Ue (t) = U1 s(t) und gegebenen Anfangswerten. Die Lösung ist der Spannungsverlauf an der Induktivität. Die kausale Grundlösung ist √ g(t) = t e−t/ LC s(t).
194
8 Anwendungsbeispiele für Distributionen
Die Lösung nach unserem Satz von S. 186 ist ˙ + z, Ua (t) = g ∗ (U1 δ) √ √ U1 t U t e−t/ LC s(t) + U0 + √ 0 e−t/ LC . Ua (t) = U1 − √ LC LC
Sie erfüllt Ua (0−) = U0 und Ua (0+) = U0 + U1 . Für große negative Werte t stellt Ua (t) sicher keine realistische Spannung dar und im Allgemeinen bleibt der „wirkliche“ Spannungsverlauf über die gesamte Vergangenheit t < 0 wohl unbekannt. Betrachten wir daher unter Ausblendung der Vergangenheit das Anfangswertproblem nur auf der Halbgerade ′ t ≥ 0, dann erhalten wir die Lösung T ∈ D+ mit der distributionellen Gleichung 2 ˙ 2U0 1 T¨ + √ T = U1 δ˙ + √ T+ δ + U0 δ˙ LC LC LC aus dem Satz von S. 187, nämlich T = Ua s (U0 − U1 )t −t/√LC e s(t). T (t) = U0 + U1 + √ LC Beispiel 4. Wir betrachten das skizzierte Blockschaltbild aus Addierern, Integratoren und Proportionalgliedern. Seine Komponenten können durch elektrotechnische Bauelemente (Operationsverstärker, Widerstände, Kapazitäten) so nachgebildet werden, dass für Spannungsverläufe f auch alle auftretenden Zustandsgrößen x0 , . . . xm−1 und x˙ 0 , . . . x˙ m−1 wieder Spannungen in Volt sind. Wir werden später sehen, dass eine große Klasse linearer Übertragungssysteme, die einen spezifizierten Frequenzgang besitzen, auf diese Weise konstruiert werden kann (Abschnitt 10.2).
Die Zustandsbeschreibung dieses Netzwerks durch ein System erster Ordnung mit verschwindenden Anfangswerten lautet: ~x˙ (t) = A~x(t) + ~cf (t) mit ~x(t) = (x0 (t),x1 (t), . . . ,xm−1 (t))T , ~c = (c0 ,c1 , . . . ,cm−1 )T und der Matrix
8.4 Räumliche Potentialprobleme
195
0 · · · · · · · · · · · · · · · −α0 1 0 · · · · · · −α1 .. 1 ... ... .. .. .. .. A= ... .. .. . 0 1 0 −αm−2 1 −αm−1
Um konkret zu rechnen, wählen wir
m = 3, c0 = Ω3 , c1 = c2 = 0, a0 = Ω3 , a1 = 2Ω2 , a2 = 2Ω. Später in Abschnitt 10.2 kann man erkennen, dass damit ein Butterworth-Tiefpass-Filter der Ordnung 3 mit Grenzfrequenz Ω/(2π) beschrieben wird. Eine Darstellung des zugehörigen Frequenzgangs findet man auf S. 286. Wir wählen als Eingangssignal einen Spannungsstoß f = kδ (k in der Einheit Vs) und ′ fragen zum Beispiel nach der Ausgangsspannung x2 (t) = v(t) ∈ D+ als zugehörige Impulsantwort. Die Zustandsbeschreibung lautet dann: 3 x˙ 0 0 0 − Ω3 x0 kΩ δ x˙ 1 = 1 0 −2Ω2 x1 + 0 . x˙ 2 0 1 −2Ω x2 0
In der Regel ist es nun mit einigem Aufwand verbunden, die Fundamentalmatrix eAt zu berechnen. Wie schon erwähnt bieten die Laplace-Transformation oder ComputeralgebraSysteme wie Mathematica, Maple oder Matlab dabei gute Unterstützung. Im Übrigen sei dazu auf die Literatur zur Linearen Algebra, etwa auf das empfehlenswerte Buch von H. Niemeyer, E. Wermuth (1987) verwiesen. Im vorliegenden Fall ergibt sich für die benötigte Komponente g31 von G(t) = eAt s(t): ! !! √ √ √ −Ωt/2 1 3Ωt 3Ωt −Ωt −Ωt/2 g31 (t) = sin + 3e s(t). 3e −3 e cos 3Ω2 2 2
Die gesuchte Ausgangsspannung für das Einganssignal kδ mit k = 1 Vs, d.h. die kausale Impulsantwort des gegebenen Butterworth-Filters, ist dann x2 (t) = k Ω3 g31 (t). Die Leser mögen als Übung mit den Mitteln der Linearen Algebra (etwa mit Unterstützung durch ein geeignetes Computeralgebra-System) die komplette Matrix eAt bestimmen.
8.4 Räumliche Potentialprobleme Wir beginnen nun mit Anwendungen von Distributionsmethoden auf räumliche Probleme. Dabei wird vorausgesetzt, dass Leser in ihren mathematischen Grundvorlesungen schon Funktionen mit mehreren Variablen studiert haben und die wichtigsten Sätze der Vektoranalysis, insbesondere den Divergenzsatz von Gauß und die Greenschen Formeln, benutzen können. Man findet diese Sätze auch in Anhang B zusammengestellt.
196
8 Anwendungsbeispiele für Distributionen
Bei vielen physikalischen Fragestellungen hat man die Aufgabe, ein Kraftfeld aus seinen Quellen und Wirbeln zu berechnen. Solche Aufgaben lassen sich häufig als Potentialprobleme formulieren. Ist etwa eine räumlich beschränkte Ladungsverteilung im Vakuum durch die Ladungsdichte ̺ gegeben, so wird der Sachverhalt, dass die Ladungen die Quellen bzw. Senken des erzeugten elektrischen Feldes sind, seit J. C. Maxwell (1831-1879) beschrie~ = ̺/ε0 , in der ε0 die elektrische Feldkonstante bezeichnet. ben durch die Gleichung div E ~ = − grad u lässt sich das elektrostatische Feld E ~ im Raum aus einer Lösung u der Mit E Potentialgleichung berechnen: div grad u = ∆u = −
̺ . ε0
∂2 ∂2 ∂2 + + . Eine ∂x2 ∂y 2 ∂z 2 ~ = (E1 ,E2 ,E3 ) Lösung u ist ein zu ̺ gehöriges Coulomb-Potential. Für u : R3 → R und E mit den skalaren Komponenten E1 ,E2 und E3 sind ∂u ∂u ∂u ~ = ∂E1 + ∂E2 + ∂E3 . und div E , , grad u = ∂x ∂y ∂z ∂x ∂y ∂z In kartesischen Koordinaten lautet der Laplace-Operator ∆ =
~ Analog kann man bei stationärem E-Feld und gegebener Stromdichte ~j die Maxwell~ ~ ~ Gleichungen rot B = µ0 j und div B = 0 für das erzeugte magnetische Wirbelfeld im ~ = rot A ~ in eine Gleichung für das Vektorpotential A ~ überführen: Vakuum mit B ~ = ∆A ~ = −µ0~j . − rot rot A ~ = (A1 ,A2 ,A3 ) ist dabei ∆A ~ = (∆A1 ,∆A2 ,∆A3 ), µ0 ist die magnetische FeldkonFür A stante und ∂A2 ∂A1 ∂A3 ∂A2 ∂A1 ∂A3 ~ . − , − , − rot A = ∂y ∂z ∂z ∂x ∂x ∂y
Entsprechende Potentialprobleme ergeben sich bei der Berechnung von Gravitationsfeldern aus gegebenen Massenverteilungen oder in der Mechanik von Flüssigkeiten und Gasen. Weil alle behandelten Begriffe und Ergebnisse der letzten Abschnitte auf Funktionen mit mehr als einer Variablen übertragen werden können (vgl. Abschnitt 7.7), kann man mit dem Grundlösungsverfahren auch partielle lineare Differentialgleichungen mit konstanten Koeffizienten lösen. Wir berechnen als Beispiel ein Potential u, das durch eine elektrische Ladungsverteilung in einem beschränkten räumlichen Gebiet erzeugt wird. Dabei fassen wir die Ladungsdichte ̺ als eine Distribution mit beschränktem Träger auf. Die zugehörige partielle Differentialgleichung lautet: ∆u = −
̺ . ε0
1 1 Zuerst rechnet man nach, dass die Funktion g(x,y,z) = p = eine Grund2 2 2 r x +y +z lösung liefert. Dabei ist r2 = |~r|2 = x2 + y 2 + z 2 für ~r = (x,y,z), und die Funktion g wird als reguläre Distribution aufgefasst (vgl. S. 156).
8.4 Räumliche Potentialprobleme
197
1. ∆g(x,y,z) = 0 in jedem Gebiet, welches den Ursprung nicht enthält. Der Leser möge dies durch entsprechende Differentiation nachprüfen. 2. Für Testfunktionen ϕ = ϕ(x,y,z) = ϕ(~r) gilt: h∆g,ϕi = hg,∆ϕi ˆˆˆ g(x,y,z)∆ϕ(x,y,z) dx dy dz = R3
= lim
ε→0
ˆˆˆ
g(x,y,z)∆ϕ(x,y,z) dx dy dz .
r≥ε>0
Man benutzt die zweite Greensche Formel aus der Vektoranalysis (vgl. Anhang B auf S. 419): ˆ ˆ (g∆ϕ − ϕ∆g) dλ3 =
G
(ggradϕ − ϕgradg) · ~n do ,
∂G
wobei ~n die Einheits-Außennormale, dλ3 das Volumenelement, do das Oberflächenelement auf dem Rand ∂G von G bezeichnen, und G die sphärische Schale G = {~r ∈ R3 | 0 < ε ≤ |~r| ≤ a} ist. Der Außenradius a sei dabei so groß, dass für r = |~r| ≥ a die Testfunktion ϕ(~r) verschwindet: p ϕ(x,y,z) = 0 für x2 + y 2 + z 2 ≥ a . Dann ist mit ∆g = 0 für r ≥ ε und der Richtungsableitung ˆ
g∆ϕ dλ3 =
ˆ r=ε
r≥ε
g
dϕ do − d~n
ˆ
ϕ
dϕ = gradϕ · ~n : d~n
dg do . d~n
r=ε
1 dϕ für alle ~r mit |~r| = ε. Aus der Beschränktheit von folgt: ε d~n ˆ ˆ 1 1 dϕ dϕ = ≤ · 4πε2 · K für geeignetes K ∈ R. do do g ε d~n ε d~n
Nun ist g(~r) =
r=ε
r=ε
Also verschwindet für ε → 0 das erste Oberflächenintegral der rechten Seite: ˆ dϕ lim g do = 0. ε→0 d~n r=ε
Weil auf der Innensphäre r = ε die Normale ~n zum Ursprung weist, ist dort 1 dg (~r) = 2 . d~n ε
198
8 Anwendungsbeispiele für Distributionen Damit ergibt sich für das zweite Oberflächenintegral ˆ ˆ 1 dg do = − 2 − ϕ ϕ do = −4πMε (ϕ). d~n ε r=ε
r=ε
Dabei bezeichnet Mε (ϕ) den Mittelwert von ϕ auf der Sphäre mit Radius ε : ˆ 1 ϕ do . Mε (ϕ) = 4πε2 r=ε
Für ε → 0 gilt nun Mε (ϕ) −→ ϕ(0), und daher erhält man ε→0
h∆g,ϕi = lim
ε→0
ˆ
∆ϕ 3 dλ = −4πϕ(0) = −4πhδ,ϕi. r
r≥ε
1 1 g(~r) = − ist eine Grundlösung der Potentialgleichung 4π 4πr ̺ im R3 . Durch Faltung erhält man eine partikuläre Lösung für die Gleichung ∆u = − : ε0 1 ̺ ∗ . u= ε0 4πr Ergebnis. Die Funktion −
̺ kann hierbei eine beliebige Distribution mit beschränktem Träger sein. Für reguläre Ladungsdichten ̺ ist dies die Poisson-Integralformel im R3 : ˆˆˆ 1 ̺(u,v,w) p u(x,y,z) = du dv dw . 4πε0 (x − u)2 + (y − v)2 + (z − w)2 R3
Zwei Coulomb-Potentiale derselben Ladungsverteilung ̺ unterscheiden sich wegen der ~ = ̺/ε0 für die elektrische Feldstärke höchstens um eine Konstante. Die Beziehung div E reguläre Distribution q/(4πε0 r) ist das im Unendlichen verschwindende Potential einer Ladung q im Nullpunkt. Entsprechend ist q/(4πε0 (r − r0 )) der Beitrag zum Potential an der Stelle ~r, der von einer solchen Ladung im Punkt ~r0 beigesteuert wird. Durch das obige Faltungsintegral mit der Ladungsdichte ̺(~r) werden dann die Beiträge aller Raumpunkte zum Gesamtpotential aufsummiert. Für „einfache“ Ladungsdichten ̺ lässt sich das Potential u aus dem Poissonschen Faltungsintegral direkt berechnen7. Beispiele 1. Im Raum sei ein dünner Stab S = { (x,y,z) ∈ R3 : x = y = 0,|z| ≤ l} der Länge 2l mit homogener Massendichte ̺0 (mit der Einheit kg/m) gegeben. Wir beschreiben diese räumliche Massenverteilung mit der Indikatorfunktion 1[−l,l] (z) durch das distributionelle Tensorprodukt (vgl. S. 159) 7
Abbildungen von Äquipotentialflächen zu einigen einfachen Ladungsdichten finden Sie bei Interesse unter den Notebooks des Autors mit der URL www.stiftung-swk.de/mathematica.
8.4 Räumliche Potentialprobleme
199
̺(x,y,z) = δ(x) ⊗ δ(y) ⊗ ̺0 1[−l,l] (z) . Aus der Potentialgleichung ∆u = 4πγ̺ mit der Gravitationskonstante γ folgt das im Unendlichen verschwindende Gravitationspotential u = −γ̺ ∗
1 . r
Für (x,y,z) 6∈ S ergibt sich durch Integration das Potential u: u(x,y,z) = −γ̺0
ˆl −l
1 p dw x2 + y 2 + (z − w)2
p w=+l 2 2 2 = −γ̺0 ln 2 x + y + (z − w) + 2w − 2z
= −γ̺0 ln
! p x2 + y 2 + (z − l)2 + l − z p . x2 + y 2 + (z + l)2 − l − z
w=−l
Mit F~ = − grad u findet man dann das zugehörige Gravitationsfeld F~ . 2. Ist σ eine reguläre Flächenladungsdichte auf der Oberfläche der Kugel mit Radius R um den Nullpunkt, notiert durch die singuläre Distribution ̺(~x) = σ(~x)δ(|~x| − R) (man vgl. S. 157), dann erhält man aus u = ̺ ∗ 1/(4πε0 r) die Coulomb-Formel für das im Unendlichen verschwindende Potential ˆ σ(~x) 1 do(~x) . u(~x0 ) = 4πε0 |~x − ~x0 | |~ x|=R
Ansätze zur Lösung von Randwertaufgaben Die Poisson-Formel kann zur Potentialberechnung benutzt werden, wenn eine bekannte Ladungsverteilung vorliegt. Viele Problemstellungen in der Elektrostatik sind aber von der Form, dass das Potential u auf bestimmten Flächen vorgegeben ist, ohne dass man die erzeugende Ladungsverteilung kennt, oder dass bei gegebener Ladungsverteilung in einem Gebiet zusätzlich die Werte des Potentials auf dem Gebietsrand vorgeschrieben sind. Zwei typische, zugehörige Randwertaufgaben sind: 1. Das innere Dirichlet-Problem: Für ein beschränktes Gebiet B mit Rand ∂B sind eine Distribution v mit Tr (v) ⊂ B und eine Funktion f auf ∂B gegeben. Man bestimme u so, dass ∆u = v in B und u = f auf ∂B. 2. Das äußere Dirichlet-Problem: Für ein beschränktes Gebiet K mit Rand ∂K sind eine Distribution v mit Tr (v) ⊂ R3 \ (K ∪ ∂K) und eine Funktion f auf ∂K gegeben. Man bestimme u so, dass ∆u = v in R3 \ (K ∪ ∂K) und u = f auf ∂K.
200
8 Anwendungsbeispiele für Distributionen
äußeres Problem
inneres Problem
B K
u gesucht in B
u gesucht im Komplement von K ∪ ∂K
Beispiele des ersten Typs sind die Frage nach dem Potential einer elektrischen Ladungsverteilung ̺ = −vε0 innerhalb eines nach außen elektrisch abgeschirmten Raumbereiches (d.h. f = 0) oder auch die Frage nach der stationären Temperaturverteilung (v = 0) in einem Körper B mit zeitlich konstant gehaltener Randtemperaturverteilung f . Ein Beispiel für ein äußeres Dirichlet-Problem ist etwa die Frage nach dem Potential u, das sich ergibt, wenn sich ein geerdeter, elektrischer Leiter (d.h. f = 0) im elektrischen Feld einer Ladung ̺ befindet. Die analytische Lösung solcher Randwertaufgaben erfordert im Allgemeinen ein gutes Maß an mathematischem Aufwand und zusätzliche Glattheitseigenschaften der Daten ∂B, ∂K, v und f . Um einen prinzipiellen Eindruck eines klassischen Lösungsweges zu erhalten, betrachten wir die Randwertaufgaben unter vereinfachenden Annahmen: Für ~x0 ∈ R3 setzen wir g(~x,~x0 ) = 1/(4π|~x − ~x0 |). Dann gilt ∆~x g = 0 in R3 \ {~x0 }. ∆~x bedeutet, dass der Laplace-Operator auf die Variable ~x anzuwenden ist. Als Gebiet B betrachten wir B = {~x ∈ R3 | 0 ≤ r < |~x| < R}, d.h. eine Kugel oder eine sphärische Kugelschale. K sei die Kugel um Null mit Radius r. Ist ~x0 ∈ B, dann bezeichne die Menge Bε (~x0 ) ⊂ B eine kleine abgeschlossene Kugel vom Radius ε um diese Singularität ~x0 von g.
B K
~x0 ε
Für eine ausreichend glatte Funktion u auf B gilt dann die zweite Greensche Formel und wegen ∆~x g = 0 in B \ {~x0 } folgt mit den Außennormalen ~n von ∂B resp. ∂Bε (~x0 )
8.4 Räumliche Potentialprobleme ˆ
201
g(~x,~x0 )∆u(~x) dλ3 (~x) =
ˆ du dg g(~x,~x0 ) (~x) − u(~x) (~x,~x0 ) do(~x) d~n d~n
∂B
B\Bε (~ x0 )
−
ˆ ∂Bε (~ x0 )
du dg g(~x,~x0 ) (~x) − u(~x) (~x,~x0 ) do(~x) . d~n d~n
Auf S. 197 haben wir gezeigt, dass das zweite Oberflächenintegral für ε → 0 gegen u(~x0 ) konvergiert. Damit ergibt sich ˆ ˆ du dg u(~x0 ) = g(~x,~x0 ) (~x) − u(~x) (~x,~x0 ) do(~x) − g(~x,~x0 )∆u(~x) dλ3 (~x) . d~n d~n ∂B
B
(8.4) Der Wert einer hinreichend glatten Lösung u des inneren Dirichlet-Problems an einem „Aufpunkt“ ~x0 ∈ B ist damit bestimmt durch die Werte der Inhomogenität ∆u in B und durch die Werte des Potentials u und seiner Normalableitung (von innen) auf dem Rand ∂B. Das Potential u und damit auch seine Normalableitung ist durch Vorgabe von ∆u in B und von u auf dem Rand ∂B schon eindeutig bestimmt: Sind nämlich u1 und u2 zwei (entsprechend glatte) Lösungen, dann erfüllt ϕ = u1 − u2 die Gleichungen ∆ϕ = 0 in B und ϕ = 0 auf ∂B. Einsetzen in die erste Greensche Formel (S. 419) zeigt ˆ ˆ dϕ do , (ϕ∆ϕ + grad ϕ · grad ϕ) dλ3 = ϕ d~n B
∂B
wegen ∆ϕ = 0 also ˆ
grad ϕ · grad ϕ dλ3 = 0,
B
d.h. grad ϕ = ~0. Dann ist ϕ konstant und aus den Randwerten folgt ϕ = 0, u1 = u2 überall. Wenn es gelingt, in der obigen Darstellungsformel (8.4) für alle ~x0 ∈ B die Funktion g(~x,~x0 ) zu ersetzen durch eine Funktion G(~x,~x0 ), welche weiterhin ∆~x G(~x,~x0 ) = 0 für alle ~x in B \ {~x0 } erfüllt und außerdem auf dem Rand von B verschwindet und auch das Volumenintegral unverändert lässt, dann ergibt sich aus (8.4) der folgende Ansatz zur Lösung u des inneren Dirichlet-Problems an einer Stelle ~x0 ∈ B: ˆ ˆ dG u(~x0 ) = − f (~x) (~x,~x0 ) do(~x) − v(~x)G(~x,~x0 ) dλ3 (~x) . d~n ∂B
B
Die gesuchte Funktion G wird Green-Funktion genannt. Man definiert sie durch G(~x,~x0 ) =
1 + F (~x,~x0 ) 4π|~x − ~x0 |
(~x 6= ~x0 , ~x0 ∈ B, ~x ∈ B ∪ ∂B),
und fordert von F gemäß der Vorüberlegung folgende Eigenschaften:
(8.5)
202
8 Anwendungsbeispiele für Distributionen
1. Für jedes ~x0 ∈ B ist F (~x,~x0 ) als Funktion von ~x zweimal stetig differenzierbar in B mit ersten partiellen Ableitungen, die stetig auf den Rand ∂B hin fortsetzbar sind. Für jedes ~x0 ∈ B ist F harmonisch in B, d.h. für alle ~x,~x0 aus B gilt ∆~x F (~x,~x0 ) = 0. 2. Für jedes ~x0 ∈ B und jedes ~x ∈ ∂B gilt F (~x,~x0 ) = −
1 . 4π|~x − ~x0 |
Analog zum Eindeutigkeitsnachweis für die Lösung u sieht man, dass es höchstens eine Funktion F mit den verlangten Eigenschaften gibt, d.h. wenn es eine Green-Funktion G überhaupt gibt, dann ist sie eindeutig bestimmt. Der Anteil g(~x,~x0 ) = 1/(4π|~x − ~x0 |) der Green-Funktion G ist bis auf einen Faktor ein Potential einer Punktladung am Ort ~x0 aus B. Die physikalische Bedeutung von F (~x,~x0 ) ist daher wegen ∆~x F (~x,~x0 ) = 0 für ~x ∈ B die eines Potentials einer Ladungsverteilung außerhalb des Gebietes B. Größe und Lage dieser externen Ladungsverteilung müssen gerade so sein, dass die Überlagerung ihres Potentials mit dem der Punktladung in ~x0 auf dem Gebietsrand ∂B Null ergibt. Auf dieser Überlegung gründet die Methode der Bildladung, mit der für so einfache Gebiete wie Kugeln die Green-Funktion G gefunden werden kann. Bevor wir ein Beispiel rechnen, wenden wir uns noch dem äußeren Dirichlet-Problem für die Kugel K zu (vgl. Bild auf S. 200): Coulomb-Potentiale u, die von räumlich begrenzten, stetigen Ladungsverteilungen ̺ erzeugt werden und im Unendlichen verschwinden, fallen nach der Poisson-Formel für |~x| → ∞ ab wie 1/|~x|, ihre Normalableitungen auf Kugelsphären |~x| = R für R → ∞ wie 1/R2 : Ist nämlich α > 0 so groß, dass die vorhandene Gesamtladung in der Kugel um den Nullpunkt mit Radius α liegt, dann gilt für alle β mit 0 < β < 1 und ~x mit |~x| ≥ α/β die Ungleichung 1 − α/|~x| ≥ 1 − β und damit (man vgl. das Bild zur Veranschaulichung) ˆ ˆ 1 ̺(~y ) |̺(~y )| 1 dλ3 (~y ) ≤ |u(~x)| = dλ3 (~y ) 4πε0 |~x − ~y | 4πε0 |~x − |~αx| ~x| |~ y|≤α
1 = 4πε0 (1 −
α x| |~ x| )|~
ˆ
|~ y|≤α
|̺(~y)| dλ3 (~y ) ≤
|~ y|≤α
1 4πε0 (1 − β)|~x|
ˆ
|̺(~y )| dλ3 (~y ) .
|~ y|≤α
̺ z
α
}|
{ z
|~ x−α~ x/|~ x||
}|
{
~x
Entsprechend zeigt man, dass für u die Normalableitung auf Kugelsphären |~x| = R für R → ∞ gleichmäßig in alle Richtungen abfällt wie 1/R2 (Übung). Wir bemerken nun in der Greenschen Formel (8.4) auf S. 201, dass unter den obigen Voraussetzungen an u bei einer Kugelschale B = {~x ∈ R3 | r < |~x| < R} das Oberflächenintegral über die Außenfläche |~x| = R für R → ∞ verschwindet: Der Integrand fällt
8.4 Räumliche Potentialprobleme
203
für R → ∞ ab wie 1/R3 , während die Kugeloberfläche wächst wie R2 . Auch das Volumenintegral in (8.4) bleibt beschränkt, wenn räumlich begrenzte, stetige Ladungsdichten ̺ vorliegen. Folgt man den gleichen Überlegungen wie beim inneren Dirichlet-Problem, dann ergibt Formel (8.5) unter den obigen, physikalisch motivierten Annahmen über die Lösung u auch einen Ansatz für das äußere Dirichlet-Problem an einer Stelle x0 6∈ K ∪ ∂K. Ansatz für das äußere Dirichlet-Problem an einer Stelle x0 6∈ K ∪ ∂K: ˆ ˆ dG v(~x)G(~x,~x0 ) dλ3 (~x) (~x,~x0 ) do(~x) − f (~x) u(~x0 ) = − d~n
(8.6)
|~ x|>r
|~ x|=r
für |~x0 | > r mit der Innennormale ~n zur Kugeloberfläche |~x| = r und der Green-Funktion G zur Kugel K um den Nullpunkt mit Radius r. Da man δ-Distributionen durch glatte Funktionen approximieren kann (vgl. S. 167), kann man Formel (8.5) auch noch verwenden, wenn die Ladungsdichte ̺ eine Punktladung qδ(~x − ~x1 ) repräsentiert. Mit Randwerten f auf der Kugelfläche |~x| = r, |~x1 | > r und v(~x) = −qδ(~x − ~x1 )/ε0 lautet dann der Ansatz für das Potential an einer Stelle ~x0 6= ~x1 , |~x0 | > r bei Verwendung der Innennormale ~n zur Kugeloberfläche ˆ dG q f (~x) (~x,~x0 ) do(~x) . (8.7) u(~x0 ) = G(~x1 ,~x0 ) − ε0 d~n |~ x|=r
Beispiel. Die geerdete, leitende Kugel im Feld einer Punktladung. Gegeben ist eine elektrisch leitende Kugel K um den Nullpunkt mit Radius r. Sie liege auf Erdpotential u = 0. Außerhalb dieser Kugel befinde sich eine Punktladung q an der Stelle ~x1 , |~x1 | > r. Das zugehörige äußere Dirichlet-Problem lautet: Gesucht wird das im Unendlichen verschwindende Potential u, so dass gilt ∆u(~x) = − u(~x) = 0
q δ(~x − ~x1 ) ε0
für |~x| > r,~x 6= ~x1 ,
für |~x| = r.
Nach der Methode der elektrischen Bildladung macht man für die Green-Funktion G den Ansatz mit einer zweiten Ladung q ′ im Inneren der Kugel K. Ort ~x2 und Größe von q ′ sind so zu bestimmen, dass G(~x,~x0 ) = 0 ist für alle ~x und ~x0 mit |~x0 | > r und |~x| = r. Mit (8.7) setzt man für das im Unendlichen verschwindende Coulomb-Potential der beiden Punktladungen q und q ′ an einer Stelle ~x0 6= ~x1 an: u(~x0 ) =
q q q′ G(~x1 ,~x0 ) = + . ε0 4πε0 |~x0 − ~x1 | 4πε0 |~x0 − ~x2 |
Die Randbedingung wird erfüllt, wenn ~x2 der Spiegelpunkt von ~x1 an ∂K ist, d.h. wenn gilt ~x2 = r2 ~x1 /|~x1 |2 , und wenn q ′ = −rq/|~x1 | ist (vgl. linkes Bild).
204
8 Anwendungsbeispiele für Distributionen |~x1 |~n0 ~x
K ~0
~x2
|r~n0 − ~x1 | ~0
~x1
~x1
Für beliebige Randpunkte ~x = r~n0 , |~n0 | = 1, gilt dann nämlich (vgl. rechtes Bild) q′ q =− |r~n0 − ~x2 | | |~x1 |~n0 −
r x1 |~ x1 | ~
|
=−
q |r~n0 − ~x1 |
und damit u(~x) = 0 .
Man prüft durch Einsetzen in die Aufgabenstellung nach, dass das Potential ! q 1 r u(~x) = − 4πε0 |~x − ~x1 | |~x1 | |~x − |~xr2|2 ~x1 | 1 die eindeutige Lösung der gestellten Randwertaufgabe ist. Die Green-Funktion G(~x,~y ) ist symmetrisch in ~x und ~y (Rechenübung mit dem Cosinussatz für Dreiecke) und lautet für dieses Beispiel im Komplement der Kugel ! 1 r 1 . − G(~x,~y ) = 4π |~x − ~ y | |~y| |~x − |~yr2|2 ~y | Die vorgestellte Methode lässt sich auf alle Gebiete übertragen, für die der Divergenzsatz von Gauß gilt (S. 419). In der mathematischen Potentialtheorie wird gezeigt, unter welchen – möglichst geringen – Bedingungen an die Daten ∂B, v und f die Ansätze mit den Formeln (8.5) und (8.6) tatsächlich Lösungen der gestellten Randwertaufgaben ergeben. Für kompliziertere Gebiete als Kugeln ist es jedoch im Allgemeinen schwierig, die Green-Funktionen zu bestimmen oder die auftretenden Faltungsintegrale zu berechnen. Daher sind auch andere Lösungsverfahren von großer Bedeutung. Zu nennen sind hier Methoden aus der Variationsrechnung und der Funktionalanalysis oder für Probleme in der Ebene die Methoden der Funktionentheorie. In der angegebenen Literatur – man studiere etwa die Lehrbücher von R. Courant und D. Hilbert (1993), von W. Hackbusch (1996) oder W. Greiner (2008) – findet man neben der weiterführenden theoretischen Behandlung von Randwertproblemen auch konkrete Anwendungen der hier behandelten Ansätze auf Fragestellungen der mathematischen Physik und Elektrotechnik. Für praktische Probleme sind numerische Verfahren zur näherungsweisen Lösung sehr wichtig. Besondere Bedeutung hat die Methode der Finiten Elemente erlangt, deren Grundidee vor dem Hintergrund distributioneller Sichtweisen im nächsten Abschnitt erläutert werden soll. Die folgenden Seiten mögen daher als Einladung verstanden werden, diese in der Ingenieurmathematik heute unverzichtbaren Verfahren anhand vertiefender Literatur zu erlernen.
8.5 Die Grundidee der Finiten Elemente
205
8.5 Die Grundidee der Finiten Elemente Die Methode der Finiten Elemente geht zurück auf Verfahren, die 1908 von W. Ritz, 1915 von B. Galerkin und 1943 von R. Courant zur Lösung von Variationsproblemen benutzt wurden. Sie entwickelte sich in den Ingenieurdisziplinen seit den 50er Jahren mit dem Einsatz elektronischer Rechenanlagen zu einem Standardwerkzeug beispielsweise zur Lösung von Elastizitätsproblemen deformierbarer Körper mit komplizierter Geometrie oder von Problemen der Strömungsmechanik. Systematische Darstellungen dieser Methode findet man zum Beispiel bei D. Braess (1999), W. Hackbusch (1996) oder K. Atkinson und W. Han (2005). Ein erster Einblick soll im Folgenden exemplarisch an einem Randwertproblem für die Potentialgleichung erarbeitet werden. Beispiel. Gleichgewichtszustand einer belasteten Membran. Man denke an ein beschränktes Gebiet Ω in der Ebene mit einem stückweise linearen Rand ∂Ω, an dem eine elastische Membran fixiert ist. Unter dem Einfluss einer äußeren Kraft, die senkrecht zur Ebene wirkt, biegt sich die Membran durch. Die Spannung, die von der Befestigung herrührt, sei isotrop, so dass sie durch eine skalare Größe k (der Dimension N/m) beschrieben wird. Bezeichnet f die Flächendichte der Kraft, so gilt für kleine Auslenkungen u im Gleichgewichtszustand −k∆u = f in Ω, u = 0 auf ∂Ω .
(8.8)
Dabei bezeichnet ∆ den Laplace-Operator. Die Gleichgewichtslage ist also Lösung eines Dirichletschen Randwertproblems (man vgl. auch den vorherigen Abschnitt). Die folgenden Überlegungen lassen sich daher auch auf elektrische Potentialprobleme oder stationäre Wärmeleitungsprobleme übertragen. Eine Herleitung des obigen Sachverhaltes aus dem Hookeschen Gesetz geben etwa R. Courant, D. Hilbert (1993) oder W. Greiner (2008).
Hat der Rand ∂Ω eine komplizierte Gestalt, so wird es nicht möglich sein, eine Lösung mit den bisher besprochenen, klassischen analytischen Methoden zu berechnen. Einen Zugang zur praktischen Lösung eröffnen aber distributionelle Betrachtungsweisen. Man fasst die Gleichung −k∆u = f als Gleichung zwischen Distributionen auf, d.h. man sucht eine Distribution u, so dass bei Verwendung kartesischer Koordinaten für alle Testfunktionen ϕ ∈ D(Ω) gilt ˆ −kh∆u,ϕi = k grad u(x,y) · grad ϕ(x,y) dx dy = hf,ϕi. (8.9) Ω
206
8 Anwendungsbeispiele für Distributionen
Die Gleichheit mit dem mittleren Ausdruck in (8.9) ergibt sich aus der Definition der verallgemeinerten Ableitungen von u (vgl. S. 155). Da man nun ein Randwertproblem zu lösen hat, sucht man eine Distributionslösung u, die regulär ist und es außerdem erlaubt, von Randwerten u = 0 dieser Distribution u auf ∂Ω überhaupt zu sprechen. Nach S. L. Sobolev (1908-1989) sucht man die Lösung u unter denjenigen Funktionen v, die zusammen mit ihren partiellen verallgemeinerten Ableitungen auf Ω quadratisch integrierbar sind und am Rand ∂Ω verschwinden. Die Menge aller solchen Funktionen v bildet einen Funktionenvektorraum V über R. Auch für komplizierte Gebiete, deren Rand nur geringe Regularitätseigenschaften besitzt, lässt sich dieser Vektorraum so einführen, dass man sinnvoll von Randwerten seiner Elemente sprechen kann. Dies sei im Folgenden für Ω und V vorausgesetzt. 8 Es gilt D(Ω) ⊂ V ⊂ D′ (Ω), und man identifiziert zwei Funktionen in V , wenn sie sich nur auf einer Nullmenge unterscheiden. Der Raum V ist ein Beispiel eines als Sobolevraum bezeichneten Funktionenvektorraumes. Allgemeiner sind Sobolevräume Vektorräume regulärer Distributionen aus D′ (Ω), deren partielle Ableitungen bis zu einer gewissen Ordnung ebenfalls wieder regulär sind. Details über Sobolevräume und ihre Anwendungen bei partiellen Differentialgleichungen kann man zum Beispiel bei R. Dautray, J. L. Lions (1992), D. Braess (1999), W. Hackbusch (1996), H. Triebel (1980), W. Walter (1994), K. Atkinson, W. Han (2005) oder H.W. Alt (2006) finden. Ein Blick auf die zweite Gleichung in (8.9) zeigt, dass man die Testfunktionen ϕ aus D(Ω) in (8.9) durch Funktionen aus V ersetzen kann, weil das Produkt zweier quadratisch integrierbarer Funktionen wieder integrierbar ist. Die Grundlage für Lösbarkeitsaussagen zu Problem (8.9) und auch für die Konstruktion numerischer Näherungslösungen in V mit der Methode der Finiten Elemente bildet dann folgende Neuformulierung der Aufgabe: Die Kraftdichte f sei auf Ω quadratisch integrierbar und V sei der oben beschriebene Sobolevraum. Gesucht wird eine Funktion u ∈ V , so dass für alle v ∈ V gilt: mit
a(u,v) = l(v) (8.10) ˆ ˆ ∂u ∂v ∂u ∂v dx dy + a(u,v) = k grad u · grad v dx dy = k ∂x ∂x ∂y ∂y Ω Ω ˆ l(v) = hf,vi = f (x,y)v(x,y) dx dy . Ω
Aufgrund der Voraussetzungen sind a(u,v) und l(v) für alle u,v ∈ V wohldefiniert. Die vorkommenden Ableitungen sind als verallgemeinerte Ableitungen aufzufassen. Die Randbedingung ist in der Aufgabenstellung dadurch enthalten, dass die Lösung u im Vektorraum V gesucht wird, dessen Elemente Funktionen sind, die am Rand ∂Ω verschwinden. Die Lösung u ist – falls es sie gibt – als distributionelle Lösung von (8.8) zu verstehen. Potentielle Energie und Energiefunktional der Membran Die jetzt gestellte Aufgabe (8.10) ist eng verbunden mit der physikalischen Überlegung, dass sich der Gleichgewichtszustand der Membran so einstellt, dass die potentielle Gesamtenergie minimal wird. 8
Mathematisch präzisiert: Ω sei ein beschränktes Lipschitz-Gebiet. Dann ist V der Sobolevraum H01 (Ω) (siehe Anhang B, S. 421). Vereinfacht: Man stelle sich als Beispiel das Gebiet wie im Bild auf S. 205 vor.
8.5 Die Grundidee der Finiten Elemente
207
Unter der Annahme eines linearen elastischen Materialverhaltens nach dem Hookeschen Gesetz ist die Deformationsenergie proportional zur Flächenänderung. Die potentielle Gesamtenergie E(v) der Membran ist dann für eine Auslenkung v gegeben durch ˆ ˆ ˆ 2 1/2 E(v) = k (1 + | grad v(x,y)| ) dx dy − dx dy − f (x,y)v(x,y) dx dy . Ω
Ω
Ω
Bei kleinen Auslenkungen erhält man mit (1 + | grad v(x,y)|2 )1/2 − 1 ≈
1 | grad v(x,y)|2 2
die Näherung E(v) ≈ J(v) =
k 2
ˆ
| grad v(x,y)|2 dx dy −
Ω
ˆ
f (x,y)v(x,y) dx dy .
Ω
Man nennt J das Energiefunktional der Membran. Gibt es eine Funktion u, für die J(u) minimal ist, so wird durch u näherungsweise die Gleichgewichtslage der Membran beschrieben. Wir bemerken, dass sich J(v) schreiben lässt in der Form J(v) =
1 a(v,v) − l(v) 2
mit a und l wie oben in (8.10). Der Zusammenhang der gestellten Randwertaufgabe mit dem Variationsproblem, das Funktional J zu minimieren, wird durch folgende Variante eines Satzes von P. Lax und A. Milgram (vgl. etwa D. Braess (1999)) hergestellt. Der Satz zeigt, dass beide Probleme im Sobolevraum V eine gemeinsame Lösung besitzen. Lösbarkeit der Randwertaufgabe und des Variationsproblems 1. Für eine Funktion u ∈ V gilt a(u,v) = l(v) für alle v ∈ V genau dann, wenn J(u) = inf{J(v) | v ∈ V } ist, d.h. wenn u das Energiefunktional J minimiert. 2. Unter den gegebenen Voraussetzungen in (8.10) ist das Energiefunktional J auf V nach unten beschränkt, und es gibt eine eindeutig bestimmte Funktion u ∈ V , die J minimiert. Diese Funktion u ist damit auch die gesuchte Distributionslösung des Randwertproblems (8.10). Es lohnt sich, die Begründungen dieser fundamentalen Lösbarkeitsaussage genauer zu studieren, weil man daran lernt, dass nicht nur unser exemplarisches Problem (8.10), sondern auch andere Probleme gleichen Typs auf dieselbe Weise gelöst werden können. Viele Randwertaufgaben lassen sich nämlich so formulieren, dass man eine Funktion u in einem der jeweiligen Aufgabe angepassten Funktionenraum V sucht, so dass eine Gleichung der Form a(u,v) = l(v) für alle v ∈ V gilt. Die Aussagen des Satzes gelten dann auch für alle solchen Probleme, für welche die wesentlichen benutzten Eigenschaften des Vektorraumes
208
8 Anwendungsbeispiele für Distributionen
V und der (vom Problem abhängigen) Funktionale a und l erfüllt sind. Beim Beweis benötigt man einige mathematische Argumente, die außerhalb des Rahmens dieses Buches liegen. Wir beschränken uns darauf, die zum Verständnis nötigen Schritte durchzuführen. Interessierte Leser mögen die offengelassenen Punkte (im Beweis durch Kursivschrift angezeigt) als Anreiz zu genauerem Studium in der bereits zitierten Literatur zu Sobolevräumen und Variationsproblemen verstehen. Beweis zu 1. Die Abbildung a : V × V → R definiert eine symmetrische Bilinearform (a(u,v) = a(v,u) für u,v ∈ V ). Das Funktional l ist linear auf V . Für u,v ∈ V und t ∈ R folgt dann 1 a(u + tv,u + tv) − l(u + tv) 2 1 = J(u) + t(a(u,v) − l(v)) + t2 a(v,v). 2
J(u + tv) =
Erfüllt u die Gleichung a(u,v) = l(v) für alle v ∈ V , so ergibt sich mit t = 1 1 J(u + v) = J(u) + a(v,v) ≥ J(u) 2 und Gleichheit gilt nur für v = 0. Dann ist also u die eindeutig bestimmte Minimalstelle von J. Der Term a(v,v)/2 beschreibt das Anwachsen der potentiellen Energie, wenn man die Auslenkung u durch u + v ersetzt. Wenn umgekehrt J bei u ein Minimum hat, so muss für jedes v die Ableitung der differenzierbaren Funktion t 7→ J(u + tv) bei t = 0 verschwinden. Diese Ableitung ist gerade a(u,v) − l(v). Dann gilt also a(u,v) = l(v) für jedes v ∈ V . Beweis zu 2. Die Bilinearform a ist auf V positiv definit (a(v,v) > 0 für v 6= 0). Dies folgt aus der Poincaré-Friedrichs-Ungleichung (siehe Anhang B): Es gibt ein c > 0, so dass für alle v 6= 0 aus V gilt ˆ ˆ 0 < hv,vi = v 2 dx dy ≤ c a(v,v) = c k | grad v|2 dx dy . Ω
Ω
Durch a wird daher ein p Skalarprodukt auf dem Vektorraum V definiert. Für jedes v ∈ V bezeichnet man ||v||a = a(v,v) gemäß seiner physikalischen Bedeutung als die Energienorm von v (man vgl. auch S. 43 und S. 49). Der Abstand zweier Funktionen v,w ∈ V ist in dieser Norm durch ||v − w||a gegeben. Nach Sobolev ist V die Vervollständigung von D(Ω) in der Energienorm, d.h. zu jedem v ∈ V gibt es eine Folge (ϕn )n∈N in D(Ω), so dass lim ||v − ϕn ||a = 0 ist, und in V konvergiert jede Cauchy-Folge (vn )n∈N bzgl. dieser n→∞
Norm (||vn − vm ||a → 0 für n,m → ∞) gegen eine Funktion v ∈ V . Ist u eine Minimalstelle von J, so gilt l(v) = a(u,v) für alle v ∈ V . Nach der Cauchy-Schwarz-Ungleichung für Skalarprodukte muss dann das lineare Funktional l auf V notwendigerweise stetig bzgl. der Energienorm sein: Für jedes v ∈ V gilt nämlich |l(v)|2 = |a(u,v)|2 ≤ a(u,u)a(v,v) = ||u||2a ||v||2a ,
8.5 Die Grundidee der Finiten Elemente
209
insbesondere also lim l(vn ) = l(v), falls lim ||vn − v||a = 0 für vn ,v ∈ V . Bei einer n→∞ n→∞ quadratisch integrierbaren Kraftdichte f in unserem Beispiel (8.10) erfüllt das Funktional l(v) = hf,vi diese notwendige Bedingung. Dies folgt wieder aus der Poincaré-FriedrichsUngleichung hv,vi ≤ c||v||2a durch die Abschätzung |l(v)|2 ≤ hf,f ihv,vi ≤ c hf,f i||v||2a . p Es gilt also |l(v)| ≤ C||v||a mit C = c hf,f i. Daraus ergibt sich dann
1 1 1 1 2 ||v|| − l(v) ≥ (||v||a − C)2 − C 2 ≥ − C 2 2 a 2 2 2 für alle v ∈ V , d.h. das Energiefunktional J ist auf V nach unten beschränkt. Deshalb gibt es nun in V eine Minimalfolge (un )n∈N für J, J(v) =
lim J(un ) = inf{J(v) | v ∈ V } .
n→∞
Da in allen Vektorräumen, in denen die Norm der Vektoren durch ein Skalarprodukt gegeben ist, die aus der Elementargeometrie bekannte Parallelogrammgleichung gilt, folgt auch für Elemente un und um dieser Minimalfolge in V 2||un ||2a + 2||um ||2a = ||un − um ||2a + ||un + um ||2a . Subtrahiert man auf beiden Seiten 4l(un + um ), so ergibt sich die Ungleichung un + um + ||un − um ||2a ≥ 8 inf J(v) + ||un − um ||2a . 4J(un ) + 4J(um ) = 8J v∈V 2 Da J(un ) → inf J(v) und J(um ) → inf J(v) für n,m → ∞, erhält man damit v∈V
v∈V
||un − um ||2a → 0 für n,m → ∞ . Die Minimalfolge ist also eine Cauchy-Folge bzgl. der Energienorm. Deshalb folgt aus der Vollständigkeit von V und der Stetigkeit von J, wieder bzgl. der Energienorm, dass es eine Funktion u = lim un in V gibt, für die J(u) = inf{J(v) | v ∈ V } ist. Die Eindeutigkeit n→∞ der Minimalstelle von J wurde schon im ersten Teil des Beweises gezeigt. Zusammenfassung. Wir lernen an der Beweisführung, dass jedes Problem der Gestalt a(u,v) = l(v) in einem Funktionenraum V eine Lösung hat, wenn a ein Skalarprodukt auf V definiert, so dass erstens V mit der zu a gehörigen Energienorm vollständig ist und zweitens das Funktional l stetig in dieser Norm ist. Für viele Randwertprobleme der Praxis ist daher das Sobolevsche Konzept der Konstruktion eines geeigneten Vektorraumes V der Ausgangspunkt zuerst für eine theoretische Lösbarkeitsaussage und danach für die Entwicklung von Verfahren zur Bestimmung von Näherungslösungen. Beispiel. Stationäre Temperaturverteilung in einem Stab. Wir formulieren als weiteres Beispiel, für das die Leser später eine Näherungslösung mit Finiten Elementen selbst berechnen können, das folgende eindimensionale Randwertproblem, welches die stationäre Temperaturverteilung T in einem Stab der Länge L mit stückweise konstanter Temperaturleitfähigkeit k und vorgeschriebenen Temperaturwerten an den Stabenden beschreibt:
210
8 Anwendungsbeispiele für Distributionen ′
(k(x)T ′ (x)) = 0, L k(x) = k1 > 0 für 0 ≤ x ≤ , 3
T (0) = T0 , T (L) = T1 (8.11) L k(x) = k2 > 0 für < x ≤ L . 3 x Man formt zunächst mit der Substitution u(x) = T (x) − T0 + (T0 − T1 ) das Problem in L eine Differentialgleichung für u mit homogenen Randwerten um: ′ 1 ′ k(x) (u (x) − (T0 − T1 )) = 0, u(0) = u(L) = 0, k(x) wie oben. (8.12) L Für diese Aufgabe wählt man V als Vektorraum aller absolutstetigen Funktionen v auf [0,L], die eine quadratisch integrierbare Ableitung v ′ besitzen und v(0) = v(L) = 0 erfüllen. Aus der Absolutstetigkeit ergibt sich, dass alle v stetig und außerhalb einer Nullmenge N ⊂ [0,L] differenzierbar sind, und dass für sie der Hauptsatz der Integralrechnung ˆx v ′ (x) dx = v(x) gilt. Aus der Aufgabenstellung 0
ˆL 0
k(x)(u′ (x) −
1 (T0 − T1 ))v ′ (x) dx = 0 für alle v ∈ V L
erhält man nach kurzer Rechnung folgende zu (8.10) völlig analoge Formulierung des Problems (8.12): Gesucht wird eine Funktion u ∈ V , so dass für alle v ∈ V gilt a(u,v) = l(v) ˆL mit a(u,v) = k(x)u′ (x)v ′ (x) dx
(8.13)
0
T0 − T1 l(v) = L
ˆL 0
T0 − T1 L . k(x)v (x) dx = (k1 − k2 ) v L 3 ′
Die Poincaré-Friedrichs-Ungleichung hv,vi ≤ ca(v,v) mit c > 0 gilt analog für dieses eindimensionale Problem. Wie im vorherigen Beispiel definiert daher a ein Skalarprodukt p auf V . Es lässt sich zeigen, dass V vollständig bzgl. der Energienorm kvka = a(v,v) ist. Mit der Cauchy-Schwarz-Ungleichung sieht man, dass l auf V stetig bzgl. dieser Norm ist: Schreibt man |l(v)| für v ∈ V in der Form T − T ˆL p p 0 1 |l(v)| = k(x) k(x)v ′ (x) dx , L 0
dann ist
1/2 L 1/2 ˆ T − T ˆL 0 1 k(x) dx k(x)v ′ (x)2 dx , |l(v)| ≤ L 0
0
8.5 Die Grundidee der Finiten Elemente also
211
1/2 T − T ˆL p 0 1 k(x) dx . |l(v)| ≤ C a(v,v) = Ckvka mit C = L 0
Damit lässt sich der Beweis des Lösbarkeitssatzes wörtlich übernehmen, und es folgt, dass das Problem (8.13) genau eine Lösung u in V hat. Aus u ergibt sich dann sofort x T (x) = u(x) + T0 − (T0 − T1 ) L als Lösung des vorgelegten Wärmeleitungsproblems (8.11). Aufgrund dieser gesicherten Lösbarkeitsaussage macht es nun Sinn, Algorithmen zur Konstruktion von Näherungen für u bzw. T zu überlegen.
Die Ritz-Galerkin-Methode Mit der bisherigen Arbeit in diesem Abschnitt haben wir gelernt, wie Randwertprobleme nach (8.10) zu formulieren sind, und dass ihre (distributionelle) Lösung in einem Vektorraum V zu suchen ist, der das Skalarprodukt a(u,v) für u,v ∈ V und die Energienorm kuka besitzt. Damit sind nun die Grundlagen der Näherungsverfahren nach Ritz und Galerkin und später als Spezialfall das Prinzip der Finiten Elemente leicht zu schildern. In allen Vektorräumen V, in denen eine Norm kf k von Elementen f ∈ V durch ein Skalarprodukt gegeben ist, erhält man eine Näherung in einem Untervektorraum U von V durch Orthogonalprojektion von f auf U (man vgl. auch S. 9, Abschnitt 5.1 und 12.1, S. 382). Der Orthogonalitätsbegriff ist unmittelbar mit dem Skalarprodukt verbunden: f,g aus V sind genau dann orthogonal, wenn ihr Skalarprodukt Null ist. Die Orthogonalprojektion fU von f auf U ist eine optimale Näherung für f ∈ V durch ein Element g ∈ U in folgendem Sinn: kf − fU k = hf − fU ,f − fU i1/2 = inf kf − gk , g∈U
d.h. die Norm des Fehlers f − g ist unter allen g ∈ U für g = fU minimal. Das auf S. 206 diskutierte exemplarische Problem (8.10) besitzt nun eine (unbekannte) Lösung u in dem dort beschriebenen unendlich-dimensionalen Funktionenvektorraum V . Auf diesem Vektorraum V sind durch die zum Problem gehörige Bilinearform a(u,v) ein Skalarprodukt und die Norm kuka für alle u,v ∈ V definiert. Nach Ritz-Galerkin konstruiert man einen endlich-dimensionalen Teilvektorraum VN von V und berechnet als Näherung für die gesuchte Lösung der gestellten Randwertaufgabe die Orthogonalprojektion uN von u auf VN mit dem durch a gegebenen Skalarprodukt. Selbst wenn die Funktion u unbekannt bleibt, kann man ihre Orthogonalprojektion uN aus der Angabe von VN und aus der für jedes v ∈ V gültigen Gleichung a(u,v) = l(v) ermitteln. Man nennt uN die zu VN gehörige Ritz-Galerkin-Lösung. Entscheidend für den Fehler ku − uN ka der Näherung ist natürlich die Wahl von VN und damit die Frage, wie gut sich eine Funktion u ∈ V durch Funktionen aus VN überhaupt approximieren lässt. Um zufriedenstellende numerische Ergebnisse zu erhalten, ist daher die Angabe des Teilraumes VN und seiner Approximationseigenschaften der Schlüssel für die Konstruktion von Näherungslösungen.
212
8 Anwendungsbeispiele für Distributionen
Das lineare Gleichungssystem zur Bestimmung einer Ritz-Galerkin-Lösung Durch Angabe von N linear unabhängigen Funktionen v1 ,v2 , . . . ,vN aus V wird eine Basis eines N -dimensionalen Teilraumes VN von V festgelegt. Der Vektorraum VN ist die Menge aller Linearkombinationen der vk , 1 ≤ k ≤ N ; also hat die Ritz-Galerkin-Lösung uN in N X VN eine Darstellung der Form uN = uN,k vk mit eindeutig bestimmten Koeffizienten k=1
uN,k ∈ R. Die Orthogonalitätsrelationen a(u−uN ,vi ) = 0 und die Gleichungen a(u,vi ) = l(vi ) ergeben a(uN ,vi ) = l(vi ) für 1 ≤ i ≤ N.
Mit der Linearität von a und der obigen Darstellung von uN erhält man daraus das lineare Gleichungssystem N X uN,k a(vk ,vi ) = l(vi ) k=1
für die gesuchten Koeffizienten uN,1, . . . ,uN,N . In Matrizenform mit Spaltenvektoren ~u und ~l geschrieben lautet also die Aufgabenstellung: Aufgabe. Man bestimme ~u ∈ RN , so dass A~u = ~l erfüllt ist für A = (αi,k ) 1≤i≤N , 1≤k≤N ~l = (li )1≤i≤N ,
αi,k = a(vk ,vi ), li = l(vi ).
Die Größen αi,k und li lassen sich aus den gegebenen Funktionalen a und l und den gewählten Basisfunktionen vi berechnen. Die Matrix A ist symmetrisch und positiv definit, insbesondere regulär. Denn für ~x = (x1 , . . . ,xN ) 6= ~0 aus RN gilt aufgrund der PoincaréFriedrichs-Ungleichung für unser Beispiel (8.10), d.h. weil a positiv definit ist: A~x · ~x =
N X
i,k=1
xi αi,k xk = a
X N
k=1
xk vk ,
N X i=1
xi vi
> 0.
Bei Elastizitätsproblemen nennt man A die Steifigkeitsmatrix. Die eindeutig bestimmte Lösung ~u = (uN,1 , . . . ,uN,N ) des Gleichungssystems ergibt die gesuchte Näherungslösung N X uN = uN,k vk des ursprünglichen Problems a(u,v) = l(v) für v ∈ V . k=1
Beispiel. Eine Ritz-Galerkin-Lösung für eine belastete Membran. Als Anwendung berechnen wir eine Ritz-Galerkin-Lösung für das Randwertproblem (8.10). Dabei sei das Gebiet Ω = ]0,L[×]0,L[ das Quadrat mit der Seitenlänge L, und f (x,y) = F sei eine auf Ω konstante Kraftdichte. Zur Berechnung einer Näherungslösung wählen wir die folgenden vier linear unabhängigen Funktionen v1 , . . . ,v4 : π π π 3π v2 (x,y) = L sin x sin y , x sin y , v1 (x,y) = L sin L L L L π 3π 3π 3π v3 (x,y) = L sin x sin y , v4 (x,y) = L sin x sin y . L L L L
8.5 Die Grundidee der Finiten Elemente
213
Sie verschwinden auf dem Rand ∂Ω von Ω, liegen im Sobolevraum V des Problems (8.10) und sind eine Basis des von ihnen erzeugten Teilraumes V4 ⊂ V (N = 4). Für die Elemente αi,k der Steifigkeitsmatrix A gilt (Übung) α1,1 = a(v1 ,v1 ) = k
ˆL ˆL 0
0
| grad v1 (x,y)|2 dx dy
ˆL ˆL π π π π kL2 π 2 x sin2 y + sin2 x cos2 y dx dy = , cos2 = kπ 2 L L L L 2 0
α2,2 = α3,3 =
0
5kL2 π 2 9kL2 π 2 , α4,4 = . 2 2
Alle Nicht-Diagonalelemente αi,k , i 6= k, von A sind Null wegen der Orthogonalitätsrelationen für die trigonometrischen Funktionen (vgl. S. 9). Die Koeffizienten li der rechten Seite ~l berechnet man zu l1 = F
ˆL ˆL 0
v1 (x,y) dx dy =
4F L3 4F L3 4F L3 , l2 = l3 = , l4 = . 2 2 π 3π 9π 2
0
Als Lösung ~u = (u4,1 ,u4,2 ,u4,3 ,u4,4 ) von A~u = ~l ergibt sich u4,1 =
8F L 8F L 8F L , u4,2 = u4,3 = , u4,4 = . 4 4 kπ 15kπ 81kπ 4
Die Ritz-Galerkin-Lösung in V4 für die Auslenkung der Membran lautet unter den gegebenen Voraussetzungen also π π 8F L2 π 1 3π u4 (x,y) = sin x sin y + sin x sin y kπ 4 L L 15 L L π 1 3π 3π 3π 1 x sin y + sin x sin y . + sin 15 L L 81 L L
Für L = 1 m, F = 1 N/m2 , k = 2 N/m beträgt die Auslenkung an der Stelle x = y = L/2 damit ungefähr u4 (L/2,L/2) = 2848F L2/(405kπ 4 ) ≈ 0.0361 m.
Bemerkung. Weil das Gebiet Ω im Beispiel ein Rechteck ist, kann man für die Lösung u eine Fourierreihendarstellung durch einen Separationsansatz gewinnen. Unsere Näherungslösung ist wegen der Wahl der Basisfunktionen v1 , . . . ,v4 gerade die Fourierentwicklung der Lösung von Übungsaufgabe A7 zu Kapitel 6 (vgl. auch Abschnitt 6.4, S. 119). Das Beispiel macht daher deutlich, dass Ritz-Galerkin-Lösungen und in der Folge auch die Näherungslösungen mit Finiten Elementen Verallgemeinerungen von Fourierreihenentwicklungen sind. Orthogonalprojektion der Lösung auf einen Teilraum VN , der von trigonometrischen Funktionen erzeugt ist, erlaubt eine Darstellung der Näherungslösung als trigonometrisches Polynom, andere Basisfunktionen von VN ergeben entsprechend andere Entwicklungskoeffizienten uN,1 , . . . ,uN,N der Näherung uN .
214
8 Anwendungsbeispiele für Distributionen
Finite Elemente Wir studieren zur Erklärung weiterhin unser Membranproblem (8.10). Bei beliebiger Wahl einer Basis für einen N -dimensionalen Teilraum VN von V ist die Steifigkeitsmatrix A im Allgemeinen voll besetzt, und man benötigt N 2 Integrationen, um ihre Elemente exakt oder näherungsweise zu bestimmen. Die abschließende Auflösung des Gleichungssystems A~u = ~l würde eine Anzahl von Rechenoperationen erfordern, die mit N wie N 3 wächst. Will man gute Näherungen uN für die Lösung u des jeweils vorgelegten Problems in einem Teilraum VN hoher Dimension N , so erweist sich damit das allgemeine Ritz-GalerkinVerfahren für die Praxis als wenig brauchbar. Die prinzipielle Idee der Methode der Finiten Elemente ist nun, die Basisfunktionen v1 , . . . ,vN so zu wählen, dass möglichst viele der vk voneinander getrennte Träger besitzen. Ist nämlich Tr(vi ) ∩ Tr(vk ) leer für i 6= k oder berühren sich die Träger nur an Teilen ihres Randes, dann ist bei Problemen wie in unseren Beispielen a(vi ,vk ) = 0. Gilt dies für viele i und k, dann ist die Steifigkeitsmatrix dünn besetzt, d.h. sie hat Nullen an vielen Stellen. Sind die vk alle vom selben Typ, dann kann man außerdem vorhandene Symmetrieeigenschaften nutzen und dadurch ebenfalls erheblichen Rechenaufwand sparen. Triangulation des Gebietes, Wahl der Basisfunktionen, lineare Elemente Zur Umsetzung der geschilderten Idee zerlegt man das Gebiet Ω in kleine Teilstücke. Wir betrachten zur Veranschaulichung ein Gebiet Ω in der Ebene, das durch achsenparallele Strecken (bzgl. eines kartesischen Koordinatensystems) berandet ist. Durch Unterteilung mit einem Rechteckgitter und anschließende Unterteilung jedes Rechteckes in zwei Dreiecke entsteht eine Triangulation T von Ω wie im folgenden Bild.
T ~xk
~xi
~xk ~xj
Die Eckpunkte eines Dreiecks, die im Inneren von Ω liegen, heißen die inneren Knoten der Triangulation T . Mit N bezeichnen wir die Anzahl der inneren Knoten. Man denke sie durchnumeriert in einer Reihenfolge ~x1 , . . . ,~xN . Durch die Dreiecke, die einen inneren Knoten ~xk als gemeinsame Ecke besitzen, wird ein Vieleck Pk gebildet (z.B. das dick umrandete Sechseck im Bild oben links). Zu jedem inneren Knoten ~xk , 1 ≤ k ≤ N , definiert man jetzt eine stetige Funktion vk ∈ V mit vk (~xk ) 6= 0, die gerade das abgeschlossene Vieleck Pk als Träger hat. Ein besonders einfaches Beispiel ist die Wahl stetiger Funktionen vk derart, dass alle vk auf jedem Dreieck T der Triangulation affin-linear, d.h. von der Form vk (x,y) = a + bx + cy sind, mit
8.5 Die Grundidee der Finiten Elemente
215
vk (~xk ) = H > 0 und vi (~xk ) = 0 für alle i 6= k
(1 ≤ i,k ≤ N ) .
Der Graph jeder Funktion vk , 1 ≤ k ≤ N , sieht dann über dem zugehörigen Vieleck Pk aus wie ein Zeltdach, das von einem Pfahl der Höhe H an der Stelle ~xk getragen wird und an den benachbarten Knotenpunkten am Boden befestigt ist (Bild oben rechts). Ist T ein Dreieck der Triangulation mit den Ecken ~xk = (xk ,yk ), ~xi = (xi ,yi ) und ~xj = (xj ,yj ), so rechnet man schnell nach, dass vk auf T durch folgende Formel gegeben ist (man vgl. die dick umrandete „Zeltbahn“ im Bild oben rechts): vk (x,y) = H
(x − xi )(yj − yi ) − (y − yi )(xj − xi ) (xk − xi )(yj − yi ) − (yk − yi )(xj − xi )
für (x,y) ∈ T.
(8.14)
Die Funktionen v1 , . . . ,vN sind linear unabhängig: Setzt man nacheinander ~x = ~x1 , . . . ,~xN N X in die Gleichung αk vk (~x) = 0 ein, dann folgt Hα1 = 0, . . . ,HαN = 0. Die Funktiok=1
nen v1 , . . . ,vN erzeugen daher einen N -dimensionalen Teilraum VN von V . Ist die Wahl der Basisfunktionen getroffen und ihre Gestalt über einem Dreieck T der Triangulation festgelegt, dann bezeichnet man T als ein Finites Element. In unserem Beispiel spricht man wegen der Linearität der Basisfunktionen vk auf jedem Dreieck T von linearen Dreieckselementen. Mit der Angabe der Funktionen v1 , . . . ,vN sind die Steifigkeitsmatrix A und die rechte Seite ~l des Gleichungssystems A~u = ~l festgelegt. N X Die Näherungslösung uN = uN,k vk ist eindeutig bestimmt durch die Komponenten k=1
uN,k von ~u = A−1~l. Das beschriebene Verfahren einer Triangulation von Ω lässt sich für alle Gebiete Ω in der Ebene verwenden, die durch einen Polygonzug berandet sind. Eine (nicht notwendig regelmäßige) Zerlegung von Ω durch Dreiecke ist dabei eine zulässige Triangulation, wenn je zwei verschiedene Dreiecke Ti und Tk , deren Ränder sich berühren, entweder nur eine gemeinsame Ecke und sonst keine Randpunkte gemeinsam haben oder aber eine gemeinsame Seite mit zwei gemeinsamen Ecken besitzen.
Etwa ist
zulässig,
nicht zulässig.
Stückweise lineare Basisfunktionen vk können dann genau wie oben definiert werden, und jede Funktion u aus dem erzeugten Vektorraum VN ist durch ihre Werte auf den inneren Knoten eindeutig bestimmt. Auch für räumliche Probleme mit polyederförmigen Gebieten Ω im R3 kann man bei entsprechenden Zulässigkeitsbedingungen an die Zerlegung das hier beschriebene Prinzip benutzen. Man verwendet dann zum Beispiel Tetraeder, Platten oder Prismen als Finite Elemente und geeignete Polynome oder Wavelets (vgl. Abschnitt 12.2) als Basisfunktionen. Wir berechnen als konkretes, einfaches Beispiel mit Finiten Elementen eine Näherung für die Auslenkung unserer belasteten quadratischen Membran.
216
8 Anwendungsbeispiele für Distributionen
Beispiel. Näherungslösung mit Finiten Elementen für eine belastete Membran. Wie schon auf S. 212 seien Ω das Quadrat mit der Seitenlänge L und f (x,y) = F eine auf Ω konstante Kraftdichte. Zur näherungsweisen Lösung des Problems (8.10) mit Finiten Elementen unterteilen wir Ω zunächst in (p + 1)2 , p ∈ N, Quadrate und anschließend jedes so entstehende Quadrat in zwei Dreiecke wie im Bild. Mit p = 3 hat diese Zerlegung N = p2 = 9 innere Knoten. Jedes Dreieck hat den Flächeninhalt h2 /2 mit h = L/(p + 1). Als Basisfunktionen benutzen wir die in (8.14) beschriebenen stückweise linearen Funktionen vk , 1 ≤ k ≤ N . N
NW V W
VI
Z
III
I 0
| {z }
O
II S
L
h
IV
SO
Aufstellen des linearen Gleichungssystems Wir bezeichnen nun einen herausgegriffenen inneren Knoten mit Z, seine Nachbarknoten entsprechend den Himmelsrichtungen mit S, SO, . . . ,W und die Dreiecksgebiete zwischen diesen Knoten mit römischen Ziffern I, . . . ,VI wie im Bild oben. Sind alle Knoten S,SO, . . . ,W innere Knoten, so sind für die zugehörigen Basisfunktionen vZ ,vS , . . . ,vW die Größen a(vZ ,vZ ),a(vZ ,vS ), . . . ,a(vZ ,vW ) zu berechnen. Liegen einige der Knoten S, SO . . . W auf dem Rand ∂Ω, dann entfallen die jeweiligen Basisfunktionen vS ,vSO . . . vW und entsprechend die jeweiligen Größen a(vZ ,vS ),a(vZ ,vSO ) oder a(vZ ,vW ). Am Graph von vZ oder mit Formel (8.14) sieht man sofort die partiellen Ableitungen von vZ auf den Dreiecken I, . . . ,VI. Da alle Basisfunktionen gleiche Gestalt haben, folgen daraus auch die Ableitungen von vS , . . . ,vW auf diesen Dreiecken. In einer Tabelle zusammengefasst ergeben sich I
II
∂vZ ∂x
H h
0
∂vZ ∂y
H h
H h
III
IV
V
VI
0
H h
H h
0
H h
−
H h
0
−
H h
−
−
Mit der Schreibweise I . . . VI für die Vereinigung der Gebiete I bis VI erhält man
8.5 Die Grundidee der Finiten Elemente a(vZ ,vZ ) = k
ˆ
217
2
| grad vZ | dx dy = k
I...VI 2
ˆ
I...VI 2
∂vZ ∂x
2
+
∂vZ ∂y
2
dx dy
h2 H h2 h2 h h2 h2 = 4kH 2 , 2 + + + 2 + + h2 2 2 2 2 2 2 2 ˆ ∂vZ ∂vS H2 h ∂vZ ∂vS h2 a(vS ,vZ ) = k dx dy = k 2 − − = −kH 2 . + ∂x ∂x ∂y ∂y h 2 2 =k
I∪II
Ganz entsprechend findet man a(vN ,vZ ) = a(vW ,vZ ) = a(vO ,vZ ) = −kH 2 , a(vSO ,vZ ) = a(vN W ,vZ ) = 0 . Bei Ausnutzung der vorhandenen Symmetrien genügen die sechs berechneten Integrale bereits zum Aufstellen der Steifigkeitsmatrix A. Dazu numerieren wir die inneren Knoten wie im folgenden Bild zu unserem Beispiel mit p = 3: L
0
7
8
9
4
5
6
1
2
3
L
Nacheinander übernehmen jetzt alle inneren Knoten die Rolle von Z und ihre inneren Nachbarknoten gemäß der Himmelsrichtung ihrer Lage bzgl. Z die Rollen der Knoten S, SO usw. Man beginnt mit dem ersten Knoten. Er hat die inneren Nachbarknoten der Nummern 2 und 4. Die erste Zeile von A ist dann an den Positionen α1,1 ,α1,2 und α1,4 besetzt. Alle anderen Elemente der ersten Zeile sind Null. Entsprechend fährt man fort. Die Matrix A lautet also: −1 4 −1 −1 4 −1 −1 −1 4 −1 −1 4 −1 −1 2 . −1 4 −1 −1 −1 A = kH −1 −1 4 −1 −1 4 −1 −1 −1 4 −1 −1 −1 4
√ Die leeren Plätze sind mit Nullen besetzt. Die Matrix ist mit 5N − 4 N (hier mit 33) nichtverschwindenden Koeffizienten nur dünn besetzt. Für eine Quadratgitterzerlegung mit einer großen Zahl N = p2 innerer Knoten erhält man bei entsprechender Nummerierung analog die Koeffizienten αi,k von A durch
218
8 Anwendungsbeispiele für Distributionen αi,i = 4kH 2 (1 ≤ i ≤ N ) αi,i+1 = −kH 2 (1 ≤ i ≤ N − 1, i mod p 6= 0, d.h. wenn i nicht durch p teilbar ist) αi,i−1 = −kH 2 (2 ≤ i ≤ N, (i − 1) mod p 6= 0) αi,i+p = −kH 2 (1 ≤ i ≤ N − p) αi,i−p = −kH 2 (p + 1 ≤ i ≤ N ) αi,k = 0 sonst
Bei konstanter Kraftdichte f (x,y) = F auf Ω sind aus Symmetriegründen alle Komponenten li der rechten Seite von A~u = ~l gegeben durch ˆ li = F vZ (x,y) dx dy = F Hh2 für 1 ≤ i ≤ N, I−VI
wenn Z wieder ein innerer Knoten wie im Bild auf S. 216 ist, denn über dem Sechseck um Z bildet der Graph von vZ eine Pyramide vom Volumen Hh2 . Grafische Darstellung einer Näherungslösung Die mit den besprochenen Finiten Elementen errechnete Näherungslösung uN für die Auslenkung der Membran ist für p = 7, N = 49, L = 1 m, k = 2 N/m, F = 5 N/m2 im folgenden Bild dargestellt. Man sieht deutlich, dass die Näherung an den Kanten der Triangulation nicht differenzierbar ist, mithin nur als eine distributionelle Näherungslösung für das ursprüngliche Randwertproblem (8.8) sinnvoll interpretiert werden kann. Aktive Leser gönnen sich an einem verregneten Wochenende das Vergnügen, Rechnung und Grafik einmal selbst auszuführen und als Übung auf analoge Weise auch eine L-förmige Membran wie auf S. 205 und das Wärmeleitungsproblem von S. 209 mit Finiten Elementen zu behandeln. Die hier errechnete Maximalauslenkung der quadratischen Membran beträgt ca. 0.182 m.
Ähnliche Vorgehensweisen wie in den behandelten Beispielen können auch für andere Differentialgleichungen mit anderen Arten von Randbedingungen entwickelt werden. Zum Schluss dieses Abschnitts, der einen Einblick in die Bedeutung von Distributionsmethoden für die theoretische und auch praktische Lösung von Randwertaufgaben vermitteln soll, sei stichwortartig auf wichtige Aufgabenstellungen der numerischen Mathematik bei der
8.6 Distributionelle Lösung der Schwingungsgleichung
219
Verwendung der geschilderten Verfahren hingewiesen: Aufgaben in der Praxis sind neben der mathematischen Modellierung gegebener Probleme zum Beispiel die Entwicklung von Triangulationsroutinen auch für kompliziert berandete Gebiete, die Auswahl geeigneter numerischer Integrationsmethoden für die Berechnung der Steifigkeitsmatrix, die Wahl geeigneter Gleichungslöser für die entstehenden großen linearen Gleichungssysteme, ein brauchbares mit Grafik verbundenes „post processing“, um aus „Zahlenfriedhöfen“ aussagefähige Ergebnisse zu erhalten u.v.m. Allgemein erwartet man, dass bei Verfeinerungen der Triangulation die Näherungslösungen uN mit wachsendem N in V gegen die Lösung u konvergieren. Erst mit Konvergenzuntersuchungen und Fehlerabschätzungen für die Näherungen erhält man effiziente und brauchbare numerische Resultate, Abbruchkriterien für Rechenprogramme, die iterativ Näherungen durch Verfeinerungen der Triangulationen berechnen, verlässliche Kriterien für die Güte der berechneten Näherungslösungen. Den Rahmen dafür bilden Approximationsund Distributionentheorie. Bedenkt man, dass etwa die Sicherheit von Kernkraftwerken, Chemieanlagen, elektronischen Systemen in Flugzeugen usw. von der Güte numerisch berechneter Näherungslösungen – z.B. für Verformungen und Belastungen von Bauteilen bei mechanischen und thermischen Einwirkungen – abhängen, so wird deutlich, dass selbst bei exakt gelösten Gleichungssystemen erst zuverlässige Abschätzungen für den Fehler uN −u vor hohen Risiken schützen. Zeitgemäße Technik erfordert ein hohes Maß an ebenso zeitgemäßer Mathematik. Ingenieure und Naturwissenschaftler sollten dabei nicht zögern, die Zusammenarbeit mit kompetenten Mathematikern zu suchen. Bei Interesse an Vertiefung und an Fehlerabschätzungen zu den hier skizzierten numerischen Methoden sei nochmals auf die zu Beginn des Abschnitts auf S. 206 angegebene Literatur hingewiesen. Als neuere Quelle für Fehlerabschätzungen sei insbesondere die Arbeit von S. Dahlke, E. Novak, W. Sickel (2010) mit den dort genannten weiteren Referenzen empfohlen.
8.6 Distributionelle Lösung der Schwingungsgleichung Wir betrachten exemplarisch noch einmal kurz das Anfangsrandwertproblem für die kräftefrei schwingende Saite. Gesucht war eine zweimal stetig differenzierbare Funktion u(x,t), so dass 2 ∂2u 2∂ u − c =0 für 0 < x < l , t > 0 , ∂t2 ∂x2 u(0,t) = u(l,t) = 0 u(x,0) = f (x)
für t ≥ 0 , für 0 ≤ x ≤ l , f (0) = f (l) = 0 ,
∂u (x,t) = g(x) für 0 ≤ x ≤ l , g(0) = g(l) = 0 . ∂t Für die Lösbarkeit waren im Rahmen der klassischen Theorie Glattheitsbedingungen an f und g nötig. Will man jetzt für eine Gitarrensaite Anfangsbedingungen f der folgenden Formen behandeln, lim
t→0+
220
8 Anwendungsbeispiele für Distributionen
f (x)
0
f (x)
oder
l
x
0
l
x
so sieht man das Problem als eine Differentialgleichung für Distributionen unter folgenden zusätzlichen Voraussetzungen an die Anfangsbedingungen f und g an: f : [0,l] → R sei stetig und stückweise stetig differenzierbar mit f (0) = f (l) = 0, g : [0,l] → R sei stückweise stetig differenzierbar, g(0) = g(l) = 0 . Die ungeraden, 2lperiodischen Fortsetzungen von f und g werden ebenfalls f bzw. g genannt. Die Fourierreihe von f konvergiert gleichmäßig und im quadratischen Mittel gegen f , die Fourierreihe von g konvergiert im quadratischen Mittel gegen g und punktweise bis auf eventuelle Unstetigkeitsstellen von g. Die errechnete Reihenlösung u(x,t) aus Abschnitt 5.4, S. 58, fasst man auf als eine Distributionslösung mit folgenden Eigenschaften: 1. Die Fourierreihe stellt für 0 < x < l, t > 0 folgende Distribution dar: 1 1 u(x,t) = [f (x + ct) + f (x − ct)] + 2 2c
x+ct ˆ
g(τ ) dτ
x−ct
Diese Distribution ist regulär, u(x,t) ist stetig fortsetzbar auf [0,l] × R+ 0 , aber nicht notwendig differenzierbar in ]0,l[×R+. Ihre stetige Fortsetzung auf [0,l] × R+ 0 wird ebenfalls mit u(x,t) bezeichnet. 2. u(x,t) löst für 0 < x < l, t > 0 die Schwingungsgleichung im distributionellen Sinn, d.h. für jede Testfunktion ϕ(x,t) mit Träger in ]0,l[×R+ und für die verallgemeinerten D ∂2u E 2 2∂ u Ableitungen von u(x,t) gilt − c ,ϕ = 0. ∂t2 ∂x2 3. Für die Randwerte gilt u(0,t) = u(l,t) = 0
(t ≥ 0).
4. Durch Grenzwertbetrachtung t → 0+ und (verallgemeinertes) gliedweises Differenzieren der Fourierreihe von u(x,t) erhält man für die Anfangswerte (a) (b)
lim u(x,t) = f (x) für 0 ≤ x ≤ l punktweise,
t→0+
lim
t→0+
∂u (x,t) = g(x) für 0 ≤ x ≤ l punktweise bis auf Unstetigkeitsstellen. ∂t
5. Die Lösung u(x,t) ist durch die Vorgabe der Anfangsbedingungen f und g eindeutig bestimmt.
8.7 Zusammenfassung
221
Man darf distributionell mit dem Reihenansatz so rechnen, wie wir dies getan hatten, und erhält eine Distributionslösung in ]0,l[×R+ . Alle Partialsummen der Reihe zu u erfüllen die Schwingungsgleichung im klassischen und damit auch im distributionellen Sinn. Für ihren distributionellen Limes u folgt aus der Stetigkeit von Ableitungen auf D′ (]0,l[×R+ ) sofort die obige Aussage 2 (vgl. S. 153). Da Distributionen im Allgemeinen punktweise keine Werte besitzen, stellt sich jedoch die Frage nach der Bedeutung von Anfangs- und Randwerten. Im vorliegenden Fall ist aber die Lösung regulär, eine herkömmliche Funktion. Die Annahme der Anfangs- und Randwerte ergibt sich hier aus der Stetigkeit von u(x,t) auf [0,l] × R+ 0 , aus den Voraussetzungen über f und g und aus den Konvergenzeigenschaften der Fourierreihen, welche f und g darstellen. Bei hinreichender Glattheit der Anfangsbedingungen ist die Distributionslösung – zu sehen an der D’Alembertschen Form der Lösung und am asymptotischen Verhalten der Fourierkoeffizienten – eine entsprechend glatte, wieder klassische Lösung. Somit bildet das Konzept der Distributionen ein solides Fundament für die alten Vorgehensweisen von Bernoulli und Fourier, und befreit weitgehend von den Bedenken und Einschränkungen, die man im klassischen Rahmen hinsichtlich Konvergenz, gliedweiser Differenzierbarkeit von Reihen etc. haben musste. In ähnlicher Weise wie bei der Lösung des Saitenproblems lassen sich durch Separationsansätze, die auf Reihendarstellungen für Distributionslösungen führen, auch inhomogene Wellen-, Wärmeleitungs- und Potentialprobleme behandeln. Grundfragen, die es dabei immer zu lösen gilt, sind Fragen nach der Regularität solcher Lösungen und, in welchem Sinn von Anfangs- und Randwerten der Distributionslösungen gesprochen werden kann. Hierfür benutzt man Methoden, die auf die Arbeiten von S. L. Sobolev zurückgehen (vgl. auch Abschnitt 8.5). Diese Methoden können bei einem vertieften Studium partieller Differentialgleichungen und ihrer Anwendungen mit den angegebenen weiterführenden Lehrbüchern erarbeitet werden.
8.7 Zusammenfassung Zum Abschluss dieses Kapitels stellen wir noch einmal einige wichtige Begriffe und Tatsachen aus der klassischen Differentialrechnung den entsprechenden Begriffen und Aussagen der Distributionentheorie gegenüber. Ein Vergleich zeigt, warum Distributionsmethoden gerade auch in den Ingenieurdisziplinen zu einem ständig benutzten mathematischen Werkzeug geworden sind. Diese Methoden stellen einen Kalkül zur Verfügung, mit dem korrekt und leicht gerechnet werden kann auf eine Weise, die aus der Sicht der klassischen Analysis oft nur heuristisch oder sogar falsch war. Man vergleiche anhand der nachfolgenden Tabelle noch einmal die Aussagen in Abschnitt 6.5 und die aus der Analysis bekannten Sätze mit den Eigenschaften des Distributionenkalküls, die wir in Kapitel 7 erarbeitet haben.
222
8 Anwendungsbeispiele für Distributionen
Klassische Analysis
Distributionentheorie
• Man studiert punktweise definierte Funktionen f : R → R.
• Man studiert lineare Abbildungen T : D → R, D der Raum der Testfunktionen
• Werte: Jedem t ∈ R ist der Funktionswert f (t) zugeordnet.
• Werte: Jeder Testfunktion ϕ ∈ D ist der Wert T (ϕ) zugeordnet. Trotz der oft üblichen Schreibweise T = T (t) haben Distributionen i.a. für einzelne t ∈ R keine Werte, sondern es sind nur „Mittelwerte“ T (ϕ) definiert. • Zu jeder Distribution T gibt es eine Folge unendlich oft differenzierbarer Funktionen fn , so dass gilt T = D ′ -lim fn , d.h. für jedes n→∞
ϕ ∈ D ist T (ϕ) = lim
+∞ ˆ
n→∞ −∞
fn (t)ϕ(t) dt.
• Jede herkömmliche, lokal-integrierbare Funktion f : R → R ist auch eine Distribution durch +∞ ˆ f (ϕ) = hf,ϕi = f (t)ϕ(t) dt (ϕ ∈ D). −∞
• Viele Funktionen f sind nicht stetig oder nicht differenzierbar.
• Alle Distributionen sind stetig auf D. Durch einen allgemeineren Ableitungsbegriff sind alle Distributionen auch beliebig oft differenzierbar. Linearität, Kettenregel und Produktregel gelten im Distributionssinn.
• Es gibt keine ideale Impulsfunktion d s(t), s(t) die Einheitssprungfunktion δ(t) = dt
• Der δ-Impuls δ(ϕ) = ϕ(0), ϕ ∈ D, ist die verallgemeinerte Ableitung von s(t): s˙ = δ, +∞ ˆ s(t)ϕ′ (t) dt. δ(ϕ) = − −∞
• Eine Funktionenfolge fn : R → R konvergiert punktweise gegen f : R → R, wenn für jedes t ∈ R gilt: lim fn (t) = f (t).
• Eine Distributionenfolge Tn : D → R konvergiert gegen T : D → R, wenn für jedes ϕ ∈ D gilt: lim Tn (ϕ) = T (ϕ).
• Für eine punktweise konvergente Funktionenfolge fn mit lim fn (t) = f (t) gilt i.a. nicht
• Für eine konvergente Distributionenfolge Tn mit lim Tn = T gilt immer lim T˙n = T˙ .
n→∞
n→∞ lim f ′ (t) = n→∞ n
f ′ (t).
n→∞
n→∞
n→∞
8.8 Übungsaufgaben
223
Klassische Analysis
Distributionentheorie
• Für punktweise konvergente Funktionen∞ X reihen fn (t) = f (t) gilt i.a. nicht ∞ X
• Für konvergente Distributionenreihen ∞ X immer T˙n = T˙ .
n=0
fn′ (t) n=0
∞ X
Tn = T gilt
n=0
n=0 ′
= f (t).
• Klassische Fourierreihen
+∞ X
ck ejkt sind
• Verallgemeinerte Fourierreihen
k=−∞
+∞ X
ck ejkt
k=−∞
konvergieren distributionell selbst dann noch, wenn die |ck | polynomial wachsen, d.h. wenn mit geeignetem n ∈ N gilt: |k|−n |ck | → 0 für |k| → ∞.
höchstens dann gegen eine auf [0,2π] integrierbare Funktion konvergent, wenn ck → 0 für |k| → ∞ gilt. • Die Faltung f ∗ g existiert i.a. nur unter geeigneten Integrierbarkeitsvoraussetzungen an f und g. Die Reihenfolge von Differentiation und Faltung kann nur bei Differenzierbarkeitseigenschaften von f oder g vertauscht werden.
• Die Faltung T ∗ G zweier Distributionen T und G auf R existiert, wenn eine der Distributionen einen beschränkten Träger hat, oder wenn beide Träger auf derselben Seite halbbeschränkt sind, z.B. wenn Tr(T ) ⊂ [0,∞[ und Tr(G) ⊂ [0,∞[. Für Distributionen im Rn existiert die Faltung unter den auf S. 161 angegebenen Bedingungen. Differentiation und Faltung sind vertauschbar. Dies ermöglicht, zusammen mit der Existenz der δ-Distribution, die einfache Beschreibung vieler zeitinvarianter, linearer Systeme durch ihre Impulsantwort (vgl. später Kap. 10).
• Klassische Lösungen für viele Anfangsrandwertprobleme existieren häufig nur unter starken Glattheitsvoraussetzungen an die Anfangs- und die Randbedingungen.
• Distributionen ermöglichen einen Lösungsbegriff, der oft einfache, nicht notwendig glatte Anfangs- und Randbedingungen zulässt. Dadurch kann mit einfachen mathematischen Modellen für praktische Probleme eine Lösung oft sehr erleichtert werden.
8.8 Übungsaufgaben A1)
Berechnen Sie mit der Impulsmethode von S. 179 die Fourierreihe folgender Funktion f (t) = f (t + 2kT ), k ∈ Z: f (t)
A
−T
−T /2
0
t T /2
T
224
8 Anwendungsbeispiele für Distributionen
A2)
Berechnen Sie die Sprungantwort und die Impulsantwort für die RCL-Schaltung P T2 -Glied von S. 53. Bestimmen Sie die Systemantwort Ua (t) im eingeschwungenen Zustand (t → ∞), wenn (a) die Erregung Ue (t) = U0 1[0,T ] (t) ein Rechtecksignal der Zeitdauer T ist. (b) die Erregung Ue (t) = U0 sin(ωt) ist. (c) Transformieren Sie die Differentialgleichung aus (a) in ein System erster Ordnung mit Systemmatrix A, berechnen Sie mit einem ComputeralgebraSystem Ihrer Wahl die Matrix eAt für verschiedene Werte von R, C und L und identifizieren Sie jeweils die Impulsantwort als Element in eAt s(t).
A3)
Ein zeitinvariantes lineares Übertragungssystem sei durch eine Differentialgleichung beschrieben. Die Nullstellen des charakteristischen Polynoms P der Differentialgleichung seien z1 = −1 + j, z2 = −1 − j, z3 = −2. Es gelte P (0) = 4. (a) Geben Sie die Differentialgleichung dritter Ordnung an, die das System beschreibt. (b) Wie lauten die Eigenfunktionen des Systems, wie die allgemeine Lösung der homogenen Gleichung? (c) Bestimmen Sie die kausale Impulsantwort und bemerken Sie ihre Determinierung durch die Eigenfunktionen. (d) Beschreiben Sie das gleiche Problem durch ein System erster Ordnung. Geben Sie eine Fundamentalmatrix dazu an. Wie lautet die Lösung des inhomogenen Systems, wenn alle Anfangswerte Null gesetzt werden?
A4)
Berechnen Sie das Potential u des Stabes aus dem Beispiel von S. 198 an den Stellen (0,0,z) und (0,0, − z) für z > l und bestimmen Sie die Gestalt der Äquipotentialflächen von u.
A5)
Eine Halbhohlkugel H im Vakuum mit Radius R sei in Kugelkoordinaten beschrieben durch H = {(R,θ,φ) : 0 ≤ θ ≤ π/2,0 ≤ φ < 2π}. Sie trage eine Flächenladungsdichte σ(θ,φ) = σ0 cos(θ). Berechnen Sie für den Hohlkugelmittelpunkt den Wert des im Unendlichen verschwindenden Potentials mit folgenden Größen: R = 2 m, σ0 = 3 µC/m2 , ε0 = 8.85 · 10−12 As/Vm.
A6)⋆
Bilden Sie die Normalableitung der Greenfunktion für eine Kugeloberfläche um den Nullpunkt mit Radius R. Stellen Sie damit die Werte einer im Inneren der Kugel harmonischen Funktion anhand ihrer Randwerte auf der Kugeloberfläche dar und vergleichen Sie mit der Poisson-Formel auf S. 56.
A7)⋆
(a) Unter Verwendung von Polarkoordinaten rechne man nach, dass g(r,φ) =
1 ln(r) 2π
eine Grundlösung der Potentialgleichung in der Ebene ist (vgl. S. 55). (b) Suchen Sie die Greenfunktion für den Kreis K um Null mit Radius R.
8.8 Übungsaufgaben
225
(c) Bilden Sie die Normalableitung der Greenfunktion auf diesem Kreis. Benutzen Sie Formel (8.5) auf S. 201 zur Lösung des Dirichlet-Problems ∆u = 0 in K, u = f auf ∂K, und vergleichen Sie Ihr Ergebnis mit der PoissonFormel auf S. 56. A8)
Man löse unter Verwendung einer Bildladung das Randwertproblem q δ(~x − ~x0 ) für ~x0 = (2,0,0), ~x = (x,y,z) mit x > 0 ε0 u(~x) = 0 für ~x = (x,y,z) mit x = 0
∆u(~x) = − A9)
Berechnen Sie mit den Größen des Beispiels von S. 218 und den dort verwendeten linearen Finiten Dreieckselementen die Näherungslösung uN , N = p2 = 81, für die Auslenkung der Membran und ihren Wert an der Stelle x = y = L/2.
A10)
Berechnen Sie mit analogen Finiten Elementen die stationäre Temperaturverteilung für den Stab auf S. 209 mit den Größen L = 1 m, k1 = 2 m2 /s, k2 = 3 m2 /s, T0 = 273.2 ◦ K, T1 = 283.2 ◦ K bei einer Unterteilung des Intervalles [0,L] in N + 1 = 12 gleich große Teilintervalle, also mit N = 11 inneren Knoten. Wie lauten die Näherungswerte für die stationäre Temperatur an den Stellen x1 = L/6, x2 = L/3, x3 = 2L/3 ?
A11)
Berechnen Sie die Amplituden Ak bis zur 5. Oberschwingung bei der kräftefrei schwingenden Saite mit Anfangsauslenkungen f1 und f2 und Anfangsgeschwindigkeiten Null für x ∈ [0,l], l = 200h = 1m, n ∈ N, a > 0, h > 0 mit l ax für 0 ≤ x ≤ 2 f1 (x) = l a(l − x) für ≤ x ≤ l 2 und
l h x für 0 ≤ x ≤ l − l n l − n f2 (x) = nh (l − x) für l − l ≤ x ≤ l. l n Vergleichen Sie die Amplitudenverhältnisse mit Ihren Erfahrungen über die Klangfarbenunterschiede der beiden Modelle. Die erste Aufgabe modelliert eine Auslenkung in der Mitte der Saite, die zweite bei großem n eine Auslenkung in der Nähe des Saitenendes. Sind die Lösungen der Wellengleichung zu obigen Anfangsbedingungen f1 und f2 klassische Lösungen, oder können sie nur als Distributionen verstanden werden?
226 A12)
8 Anwendungsbeispiele für Distributionen Zu Faltungsgleichungen, numerischen Lösungen und Tichonov-Regularisierung. In Anwendungen treten vielfach Faltungsgleichungen h ∗ f = x auf, in denen etwa x und h bekannt sind und f gesucht wird. Die folgenden Beispiele sollen verdeutlichen, dass solche Gleichungen sogenannte schlecht-gestellte Probleme sind, d.h. wenn die rechte Seite x (die Daten) auch nur kleine Datenfehler besitzt, kann eine naiv berechnete numerische Lösung von der eigentlichen Lösung des Problems weit entfernt sein. Um Näherungslösungen unempfindlicher gegen Datenfehler zu machen, sind Regularisierungsverfahren üblich. Geeignete Literatur dazu ist etwa die Referenz H. Engl, C. W. Groetsch (1987). In der Aufgabe soll die sogenannte Tichonov-Regularisierung in zwei Beispielen getestet werden. (a) Berechnen Sie die Impulsantwort der Gleichung f (t) = x′′ (t). Beim zugehörige Inversenproblem sei nun x(t) = (sin(t) − t)s(t) (s die Einheitssprungfunktion) gegeben. Mit der Impulsantwort h gilt h ∗ f = x. Berechnen Sie f . Nun seien von x nur äquidistant genommene Abtastwerte bekannt, die willkürlich mit kleinen Fehlern behaftet werden, etwa xi = x(ti )(1 + (−1)i 10−3 ). Diskretisieren Sie die Faltungsgleichung zu einem Gleichungssystem der Form Af~ = ~x mit 100 Datenwerten über 0 ≤ t ≤ 10 und lösen Sie es „naiv“ mit Hilfe eines Computeralgebra-Systems. Vergleichen Sie durch eine Grafik die numerische Lösung mit der analytischen Lösung f . Überzeugen Sie sich durch Vergleich von Af~ mit ~x, dass Ihr Gleichungslöser sehr gut ist und dass die großen Abweichungen dieser numerischen Lösung in der Natur des Problems liegen. Beachten Sie det(A) und überlegen Sie Datenfehler-Auswirkungen. wenn Sie etwa die Cramersche Regel zur Gleichungslösung betrachten. Das Problem entspricht der Berechnung einer Beschleunigung aufgrund einer beobachteten Bewegung. (b) Suchen Sie nun eine Näherungslösung mit den fehlerbehafteten Daten durch Tichonov-Regularisierung, d.h. lösen Sie (AT A+αE)f~ = AT ~x anstelle von Af~ = ~x mit einem Regularisierungsparameter α ≪ 1, etwa α = 10−3 (E die Einheitsmatrix). Vergleichen Sie wieder Ihr Ergebnis mit der analytischen Lösung ohne Datenfehler. Testen Sie mit unterschiedlichen Parametern α. (c) Zum Empfangsproblem bei einer Übertragung. Bearbeiten Sie in analoger Weise das Problem h ∗ f = x mit f (t) = U0 sin(ω0 t)s(t) und der Impulsantwort h des folgenden Übertragungssystems (RC-Tiefpassfilters 2-ter Ordnung). Vernachlässigen Sie die Kopplungsimpedanz, setzen Sie zum Test etwa ω0 = 2 rad/s, R = 1 Ω, C = 1 F, U0 = 1 V. Die fehlerbehafteten Werte von ~x entsprechen dabei leicht gestörten Empfangsdaten bei der Übertragung, aus denen f zurück berechnet werden soll (vgl. auch später S. 342): R f (t)
R C
x(t)
227
9
Die Fouriertransformation
9.1 Darstellung von Funktionen durch harmonische Schwingungen In den zurückliegenden Kapiteln hatte sich gezeigt, dass man viele periodische Funktionen und periodische Distributionen durch ihre Fourierreihen als Überlagerungen harmonischer Schwingungen darstellen kann. Diese Darstellungen waren der Schlüssel zur Lösung von Anfangsrandwertaufgaben wie bei der schwingenden Saite und von einigen Randwertproblemen für die Potentialgleichung. Sie waren auch geeignet zur Beschreibung von zeitinvarianten linearen Systemen bei periodischen Anregungen. Gelingt für nicht-periodische Funktionen und Distributionen eine analoge harmonische Analyse, d.h. eine Darstellung als Superposition harmonischer Schwingungen, dann lassen sich nützliche Anwendungen auch bei Problemstellungen erwarten, in denen periodische Phänomene keine dominante Rolle spielen. Um einen Zugang zu finden, betrachten wir eine auf der reellen Achse integrierbare Funktion f , die auf jedem beschränkten Intervall stückweise stetig differenzierbar ist. Auf jedem Intervall ]−T /2,T /2 [, T > 0, besitzt f eine Fourierreihendarstellung mit der Mittelwerteigenschaft (vgl. S. 19): +∞ X f (t+) + f (t−) = ck e2πjkt/T 2 k=−∞
1 mit ck = T
+T ˆ /2
f (s) e−2πjks/T ds.
(9.1)
−T /2
Folgt man der Idee, den betrachteten Definitionsbereich zu vergrößern und schließlich zum Limes für T → ∞ überzugehen, dann sieht man, dass alle ck dabei verschwinden würden. Um diese Schwierigkeit zu umgehen, verwenden wir die Produkte ck T , setzen ∆ω = 2π/T und definieren eine Funktion fb an allen Stellen k∆ω, k ∈ Z, durch fb(k∆ω) = ck T =
+T ˆ /2
f (s) e−js(k∆ω) ds.
(9.2)
−T /2
Dann gilt für t ∈ ]−T /2,T /2 [ N 1 X b f (t+) + f (t−) = lim f (k∆ω) ejt(k∆ω) ∆ω. N →∞ 2π 2
(9.3)
k=−N
Fassen wir nun die Zahlen fb(k∆ω) als Abtastwerte einer Funktion fb(ω) auf und gehen wir zum Limes T → ∞ über, dann ergibt sich aus (9.2)
228
9 Die Fouriertransformation
fb(ω) =
+∞ ˆ f (s) e−jωs ds . −∞
Die rechte Seite von (9.3) könnte man dann verstehen als diskrete Approximation für 1 f (t+) + f (t−) = 2 2π
An allen Stetigkeitsstellen wäre f (t) =
1 2π
+∞ ˆ fb(ω) ejωt dω.
(9.4)
−∞
+∞ ˆ fb(ω) ejωt dω auf diese Weise dargestellt
−∞
durch eine kontinuierliche Superposition aller Schwingungen der Form ejωt mit jeweiliger 1 b |f (ω)| und Phase arg(fb(ω)) mit ω ∈ R. Amplitude 2π Definition. Die Abbildung F : f → fb heißt Fouriertransformation. Die Fouriertransformierte F (f ) = fb von f ist die Funktion fb(ω) =
+∞ ˆ f (t) e−jωt dt.
−∞
Die vorangehende Überlegung zur Darstellung von f durch (9.4) ist zwar mathematisch wegen der fragwürdigen Vertauschung der Grenzübergänge T → ∞ und N → ∞ nicht ganz exakt, doch zeigt sie zumindest, welche Formel zu erwarten ist. Im Folgenden betrachten wir integrierbare Funktionen f auf R. Integrierbarkeit bedeutet, dass mit f auch |f | über R integrabel ist. Eine Funktion f ist stückweise stetig bzw. stückweise stetig differenzierbar, wenn f auf jedem beschränkten Intervall stückweise stetig bzw. stückweise stetig differenzierbar ist und alle einseitigen Grenzwerte von f und f ′ existieren. Die Fouriersche Umkehrformel für stückweise stetig differenzierbare Funktionen Satz. Für eine integrierbare, stückweise stetig differenzierbare Funktion f auf R und ihre Fouriertransformierte fb gilt an jeder Stelle t ∈ R die folgende Fouriersche Umkehrformel f (t+) + f (t−) 1 = lim Ω→∞ 2π 2
ˆ+Ω fb(ω) ejωt dω.
−Ω
Zum genaueren Verständnis bezeichnen wir mit fΩ die Funktion 1 fΩ (t) = 2π
+∞ ˆ+Ω ˆ+Ω ˆ 1 jωt b f (s) ejω(t−s) ds dω. f (ω) e dω = 2π
−Ω
−Ω −∞
9.1 Darstellung von Funktionen durch harmonische Schwingungen
229
f (t+) + f (t−) . Für fest gewähltes Ω > 0 folgt zunächst Ω→∞ 2 mit Vertauschung der Integrationsreihenfolge Zu zeigen ist dann lim fΩ (t) =
+∞ +∞ ˆ ˆ+Ω ˆ 1 jω(t−s) sin(Ω(t − s)) e fΩ (t) = f (s) dω ds = ds. f (s) 2π π(t − s) −∞
(9.5)
−∞
−Ω
Wie wir schon früher (vgl. S. 152) gesehen hatten, konvergiert die Funktionenschar sin(Ω(t − s)) für Ω → ∞ distributionell gegen den δ-Impuls δ(t − s), so dass der Beweis π(t − s) der Umkehrformel auch anschaulich klar wird. Der Faltungskern sin(Ω(t − s))/(π(t − s)) spielt hier die Rolle, die bei der Fourierreihenentwicklung periodischer Funktionen der periodische Dirichlet-Kern gespielt hat. Man bezeichnet die Funktion sin(Ωt)/(πt) als Fourier-Kern oder auch wieder als Dirichlet-Kern. Beweis. Um den Beweis durchzuführen, wählt man eine beliebige Zahl ε > 0 und unterteilt den Integrationsbereich des Integrals auf der rechten Seite von (9.5). ˆ
fΩ (t) =
|s−t|>ε
+
ˆt
t−ε
sin(Ω(t − s)) ds + f (s) π(t − s)
f (s)
ˆt+ε sin(Ω(t − s)) ds f (s) π(t − s) t
sin(Ω(t − s)) ds. π(t − s)
f (s) für |s − t| > ε nach s integrierbar ist, folgt mit dem Riemann-LebesgueDa π(t − s) Lemma von S. 40, dass für wachsendes Ω → ∞ das erste Integral durch den Löschungseffekt der zunehmenden Oszillationen von sin(Ω(t − s)) verschwindet. Das zweite Integral schreiben wir genau wie beim Vorgehen auf S. 108 um: ˆt+ε ˆ0 ˆ0 sin(Ω(t − s)) sin(Ωu) sin(Ωu) ds = (f (t − u) − f (t+)) du + f (t+) du. f (s) π(t − s) πu πu t
−ε
−ε
(9.6) Da (f (t − u) − f (t+))/(πu) für −ε < u < 0 beschränkt bleibt, verschwindet wieder das erste Integral der rechten Seite für wachsendes Ω. Das zweite Integral konvergiert für Ω → ∞ gegen f (t+)/2 (man substituiere Ωu = x und verwende Aufgabe 9 zu Kap. 7). Analog sieht man, dass das dritte Integral in (9.6) gegen f (t−)/2 konvergiert, wenn Ω wächst. Damit ist die angegebene Fouriersche Umkehrformel gezeigt. Bemerkung. Nach eventueller Abänderung von f an Unstetigkeitsstellen derart, dass überf (t+) + f (t−) all die Mittelwerteigenschaft f (t) = erfüllt ist, notiert man die Umkehrfor2 mel oft kurz in der Form +∞ ˆ 1 fb(ω) ejωt dω. f (t) = 2π −∞
230
9 Die Fouriertransformation
Das Integral ist dabei im Sinne des gezeigten Satzes als Cauchy-Hauptwert-Integral zu verstehen, d.h. als Limes der Integrale über [−Ω,Ω] für Ω → ∞. Dies ist zu bemerken, weil aus der Integrierbarkeit von f nicht auf die Integrierbarkeit von fb geschlossen werden kann (vgl. Bsp. 1 und 3 im nächsten Abschnitt). Die im Satz vorausgesetzten Bedingungen über f sind hinreichend, aber nicht notwendig für die Gültigkeit der Fourierschen Umkehrformel. Wir werden später sehen, dass sich die Fouriertransformation und die Umkehrformel in einem für die Anwendungen geeigneten Sinn auch für eine große Klasse von Distributionen einführen lassen.
9.2 Fouriertransformation reellwertiger Funktionen Die Fouriertransformierte fb einer Funktion f heißt auch Spektralfunktion von f . Sie hat die gleiche Bedeutung wie die diskreten Spektralwerte für periodische Funktionen (vgl. S. 26), d.h. sie gibt für jede Kreisfrequenz ω an, mit welcher Amplitude und Phase die zugehörige Schwingung am Aufbau des „Signals“ f beteiligt ist. Wir betrachten reellwertige Funktionen f , für welche die Fouriersche Umkehrformel gilt. Dann sind wegen e−jωt = cos(ωt) − j sin(ωt) der Realteil R(ω) und der Imaginärteil X(ω) der Spektralfunktion fb(ω) gegeben durch +∞ +∞ ˆ ˆ R(ω) = f (t) cos(ωt) dt , X(ω) = − f (t) sin(ωt) dt. −∞
−∞
Daraus folgt, dass R eine gerade, X eine ungerade Funktion ist: R(ω) = R(−ω) , X(ω) = −X(−ω). Für die Spektralfunktion einer reellwertigen Funktion f und jedes ω ∈ R gilt dann fb(−ω) = fb(ω)
und |fb(−ω)| = |fb(ω)|.
Umgekehrt sind diese Symmetrieeigenschaften der Spektralfunktion hinreichend dafür, dass f reellwertig ist: 1 ℑf (t) = 2π
+∞ ˆ (R(ω) sin(ωt) + X(ω) cos(ωt)) dω = 0. −∞
Für reellwertiges f erhält man damit die Darstellung (man vgl. auch S. 10) +∞ +∞ ˆ 1 ˆ 1 jωt b f (ω) e dω = f (t) = ℜf (t) = ℜ ℜ(fb(ω) ejωt ) dω 2π 2π
=
1 π
ˆ∞ 0
−∞
−∞
|fb(ω)| cos(ωt + arg(fb(ω))) dω.
9.2 Fouriertransformation reellwertiger Funktionen
231
Anschaulich ist f zusammengesetzt aus Cosinusschwingungen sämtlicher Kreisfrequenzen 1 ω ≥ 0 mit jeweiliger Amplitude |fb(ω)| und Phase Φ(ω) = arg(fb(ω)). π Symmetrieeigenschaften. Für reelle gerade Funktionen f ist X = 0, fb also reellwertig und es gilt ˆ∞ 1 R(ω) cos(ωt) dω . f (t) = π 0
Für reelle ungerade Funktionen f ist R = 0, fb also rein imaginär und es gilt 1 f (t) = − π
ˆ∞
X(ω) sin(ωt) dω .
0
Für den geraden Anteil fg (t) = (f (t) + f (−t))/2 einer reellen Funktion f gilt fbg (ω) = R(ω) = 2
ˆ∞
fg (t) cos(ωt) dt .
0
Für den ungeraden Anteil fu (t) = (f (t) − f (−t))/2 gilt entsprechend fbu (ω) = jX(ω) = −2j
ˆ∞
fu (t) sin(ωt) dt .
0
Kausale Funktionen. Für reelle kausale Funktionen f , d.h. f (t) = 0 für t < 0, gelten f (−t) = 0 für t > 0, also f (t) = 2fg (t) = 2fu (t) für t > 0. Damit ergibt sich für t > 0 2 f (t) = π
ˆ∞ 0
2 R(ω) cos(ωt) dω = − π
ˆ∞
X(ω) sin(ωt) dω .
0
Diese Beziehungen bedeuten insbesondere, dass der Realteil R und der Imaginärteil X der Spektralfunktion fb einer kausalen Funktion f nicht unabhängig voneinander sind. Durch Einsetzen dieser Darstellungen von f in die ersten beiden Gleichungen des Abschnitts erkennt man 2 R(ω) = − π X(ω) = −
2 π
ˆ∞ ˆ∞ 0 0 ˆ∞ ˆ∞ 0
X(z) sin(zt) cos(ωt) dz dt ,
R(z) cos(zt) sin(ωt) dz dt .
0
Diese Tatsache spielt eine wichtige Rolle beim Entwurf kausaler Filter in der Systemtheorie (vgl. Abschnitt 10.3).
232
9 Die Fouriertransformation
Beispiele für Spektralfunktionen
1 für −T ≤ t ≤ T 1. Für die Rechteckfunktion rT (t) = 1[−T,T ] (t) = ist 0 für |t| > T ˆ+T 1 −jωT sin(ωT ) e−jωs ds = − e rbT (ω) = − ejωT = 2T jω ωT −T
1
2T
rT (t)
−T
T
t
− Tπ
rbT (ω) π T
ω
2π T
rT ist integrierbar, die Spektralfunktion rbT ist jedoch nicht absolut-integrierbar, obwohl ihr uneigentliches Riemann-Integral existiert. Vernachlässigt man die Frequenzanteile für Kreisfrequenzen oberhalb von π/T und bezeichnet π/T als Bandbreite des Rechtecksignals, so stellt man fest: Je kürzer die Dauer des Rechtecksignals ist, desto größer ist seine Bandbreite. Einen entsprechenden Zusammenhang zwischen Zeitdauer und Bandbreite werden wir später auch für andere Signale feststellen (Abschnitt 11.3). ( 1 − |t|/T für |t| ≤ T 2. Für die Dreieckfunktion f (t) = erhält man mit partieller 0 für |t| > T Integration die Fouriertransformierte fb(ω) = =
ˆT 0
2 T
s −jωs e + ejωs ds = 2 1− T
ˆT 0
ˆT 0
1−
s cos(ωs) ds T
4 sin(ωs) 2 2 Tω . (− cos(ωT ) + 1) = sin ds = ω T ω2 T ω2 2 T
1 −T
fb(ω)
f (t) T
t
2π T
4π T
ω
3. Die Spektralfunktion von f (t) = e−at s(t), s(t) die Einheitssprungfunktion und a > 0, ist −(a+jω)t t=R ˆ∞ e 1 −at −jωt b e = . dt = lim f (ω) = e R→∞ −(a + jω) t=0 a + jω 0
Auch in diesem Beispiel ist zwar f , nicht jedoch fb absolut-integrierbar.
9.2 Fouriertransformation reellwertiger Funktionen
233
1/a 1
|fˆ(ω)| = √
π/2
f (t)
1 a2 + ω 2
φ(ω) = arg(fˆ(ω))
−π/2
4. Die Gaußsche Glockenkurve. Zur Berechung der Fouriertransformierten +∞ ˆ 2 e−t /2 e−jωt dt fb(ω) = −∞
2 für die Gaußsche Glockenkurve f (t) = e−t /2 differenzieren wir fb. Vertauschung von Differentiation und Integration ist erlaubt, denn für die Funktion ∂g 2 2 g(t,ω) = e−t /2 e−jωt gilt (t,ω) ≤ |t| e−t /2 und die rechte Seite dieser Unglei∂ω chung ist nach t integrierbar. Also ist
d b f (ω) = −j dω
+∞ ˆ 2 t e−t /2 e−jωt dt.
−∞
Partielle Integration ergibt für R > 0
ˆ+R ˆ+R t=+R 2 −t2 /2 −jωt −t2 /2 −jωt e e e−t /2 e−jωt dt, te dt = − e −jω t=−R
−R
und damit
−R
dfb (ω) = − lim ω R→∞ dω
ˆ+R 2 e−t /2 e−jωt dt = −ω fb(ω).
−R
Die Fouriertransformierte fb erfüllt also das Anfangswertproblem y(ω) ˙ = −ωy(ω) mit y(0) = fb(0).
2 Die eindeutige Lösung dieses Problems ist y(ω) = fb(ω) = fb(0) e−ω /2 . Mit dem +∞ ˆ √ 2 b e−t /2 dt = 2π (vgl. auch Beispiel 2 auf bekannten Wert des Integrals f (0) = S. 241) folgt daher −∞√ 2 fb(ω) = 2π e−ω /2 . 2
−t /2 Wir stellen fest, bis √ dass die Fouriertransformation die Gaußfunktion f (t) = e ist die Gaußfunktion auf den Faktor 2π wieder in sich selbst überführt. Anders gesagt √ eine Eigenfunktion der Fouriertransformation zum Eigenwert 2π.
234
9 Die Fouriertransformation
9.3 Gibbs-Phänomen und Glättung Bei der Fourierschen Umkehrformel auf S. 228 hatten wir f als punktweisen Limes der Funktionen fΩ für Ω → ∞ erhalten:
f (t+) + f (t−) , 2 +∞ ˆ+Ω ˆ 1 1 jωt b e durch fΩ (t) = fb(ω)rΩ (ω) ejωt dω definiert f (ω) dω = 2π 2π lim fΩ (t) =
Ω→∞
wobei fΩ
−∞
−Ω
ist. Dabei werden wie bei ( Partialsummen von Fourierreihen die Spektralwerte mit dem 1 für |ω| ≤ Ω Rechteckfenster rΩ (ω) = gewichtet. Wie bei Fourierreihen ist an Sprung0 für |ω| > Ω stellen von f bei der Näherung durch fΩ wieder das Gibbs-Phänomen zu beobachten (vgl. S. 20). Es reicht aus, für diesen Abschnitt nur reellwertige Funktionen f zu betrachten. Das Gibbs-Phänomen bei der Fouriertransformation. Ist f stetig in [a,t0 [ und ]t0 ,b], f (t0 +) − f (t0 −) > 0 und erfüllt f ansonsten die Voraussetzungen der Umkehrformel, dann ist lim max (f (t) − fΩ (t)) = lim max (fΩ (t) − f (t)) ≈ 0.09 · (f (t+) − f (t−)).
Ω→∞ a 0, berechnet man σ 2π die Fouriertransformierte nach Beispiel 4 von S. 233 unter Verwendung von Ähnlichkeits- und Verschiebungsregel:
3. Für die Gaußglocke Gm σ (t) =
b m (ω) = e−jωm−σ2 ω2 /2 . G σ
238
9 Die Fouriertransformation m2 1 Die Faltung Gm σ ∗ Gτ zweier Gaußfunktionen hat dann die Spektralfunktion −jω(m1 +m2 )−(σ2 +τ 2 )ω 2 /2 1 b m2 bm bm √ 1 +m2 (ω). =G G σ (ω)Gτ (ω) = e σ2 +τ 2
Die nach der Fourierschen Umkehrformel durch die Spektralfunktion eindeutig bem2 1 stimmte Faltung Gm σ ∗ Gτ ist daher wieder eine Gaußglocke: m2 1 √ 1 +m2 . = Gm Gm σ ∗ Gτ σ2 +τ 2
Fouriertransformationen von Gaußfunktionen spielen eine große Rolle in der Wahrscheinlichkeitstheorie. Wir gehen jedoch auf die weitreichenden Anwendungen der Fouriertransformation in diesem Gebiet nicht ein. Interessierte Leser seien hierzu auf die Referenzen T. Kawata (1972) oder H. Schlitt (1994) und die dort genannte weitere Literatur verwiesen. Stetigkeit, Differenzierbarkeit und asymptotisches Verhalten 1. Aus der Definition der Spektralfunktion fb von f ergibt sich |fb(ω)| ≤
+∞ ˆ |f (t)| dt < ∞
(ω ∈ R)
−∞
und mit Vertauschung von Grenzwertbildung und Integration lim fb(ω) = lim
ω→ω0
+∞ +∞ ˆ ˆ f (t) e−jωt dt = f (t) e−jω0 t dt = fb(ω0 ).
ω→ω0 −∞
−∞
Riemann-Lebesgue-Lemma. Aus dem Riemann-Lebesgue-Lemma von S. 40 folgt lim |fb(ω)| = 0.
|ω|→∞
Die Fouriertransformierte fb ist also eine stetige und beschränkte Funktion und sie verschwindet für |ω| → ∞.
2. Wie bei Fourierreihen gibt es eine Wechselbeziehung zwischen den Differenzierbarkeitseigenschaften einer Funktion f und dem asymptotischen Verhalten ihrer Spektralfunktion fb einerseits, zwischen asymptotischem Verhalten von f und Differenzierbarkeitseigenschaften von fb andererseits: (a) Ist f zusätzlich zur generellen Voraussetzung des Abschnitts k-mal stetig differenzierbar und sind f,f ′ , . . . ,f (k) integrierbar, dann gilt für ω ∈ R |ω| |fb(ω)| ≤ k
+∞ ˆ |f (k) (t)| dt.
−∞
9.4 Rechnen mit Fouriertransformationen
239
(b) Ist g(t) = tk f (t) integrierbar, dann ist fb k-mal stetig differenzierbar und es gilt für ω ∈ R gb(ω) = j k fb(k) (ω).
Grob gesagt: Je glatter f ist, desto schneller fällt fb ab; je schneller f abfällt, desto glatter ist fb.
2.(a) ergibt sich aus der Differentiationsregel, 2.(b) folgt durch die Vertauschung von Differentiation und Integration mit vollständiger Induktion aus dem Nachweis der Behauptung für den Fall k = 1: +∞ +∞ ˆ ˆ d −jωt e dt = f (t) tf (t) e−jωt dt = b g(ω). dω
dfb (ω) = j j dω
−∞
−∞
Parsevalgleichung und Multiplikationssatz. Sind f und g quadratisch integrierbar, dann gelten: 1. Die Parsevalgleichung in den beiden Varianten +∞ +∞ ˆ ˆ 1 2 |fb(ω)|2 dω |f (t)| dt = 2π
(9.7)
−∞
−∞
+∞ +∞ ˆ ˆ 1 fb(ω)b f (t)g(t)dt = g (ω) dω. 2π
(9.8)
−∞
−∞
2. Der Multiplikationssatz
1 b f ∗ gb . fd ·g = 2π
(9.9)
Die linke Seite der Parsevalgleichung (9.7) wird als normierte Signalenergie bezeichnet +∞ ˆ (vgl. S. 43). Die Funktionen f mit |f (t)|2 dt < ∞ nennt man auch Energiesignale. Die −∞
Signalenergie kann nach (9.7) auch aus der Spektralfunktion fb berechnet werden. Insbesondere ist die Spektralfunktion von Energiesignalen wieder eine quadratisch integrierbare Funktion. Der Multiplikationssatz spielt eine wichtige Rolle bei der Amplitudenmodulation in der Nachrichtenübertragung und wird daher oft als Modulationstheorem bezeichnet. Beweis zu 1:
+∞ ˆ Man definiert h(s) = f (t)f (t − s) dt. Die Faltung h ist unter unse−∞
ren Voraussetzungen eine integrierbare, beschränkte und stetige Funktion (vgl. S. 235 und Anhang B). Nach dem Faltungssatz und der Symmetriebeziehung von S. 236 besitzt h die Fouriertransformierte b h(ω) = fb(ω)fb(ω) = |fb(ω)|2 .
240
9 Die Fouriertransformation
Es gilt h(0) =
+∞ ˆ −∞
|f (t)|2 dt und mit δn (t) = h(0) = lim
n folgt (vgl. S. 151) π(1 + n2 t2 )
+∞ ˆ h(t)δn (t) dt.
n→∞ −∞
1 −|ω|/n e ist (vgl. S. 237), ergibt sich 2π +∞ +∞ ˆ ˆ 1 e−|ω|/n e−jωt dω dt h(0) = lim h(t) 2π n→∞
Weil δn (t) die Fouriertransformierte von
−∞
−∞
+∞ +∞ ˆ ˆ 1 −|ω|/n e lim h(t) e−jωt dt dω = 2π n→∞ −∞
−∞
+∞ +∞ ˆ ˆ 1 1 −|ω|/n b e h(ω) dω = lim |fb(ω)|2 dω, = 2π n→∞ 2π −∞
−∞
also (9.7). Die Vertauschung der Grenzwertbildung mit dem Integral im letzten Schritt ist h(ω) ≥ 0 sind und eine aufsteigende Funktionenfolmöglich, weil die Funktionen e−|ω|/n b ge bilden (Satz von der monotonen Konvergenz, Anhang B, S. 413). +∞ ˆ Um Gleichung (9.8) zu zeigen, setzen wir zur Abkürzung a(f,g) = f (t)g(t) dt. Es gilt die Polarisationsgleichung (als Übung vom Leser nachzuprüfen) −∞
j 1 (a(f +g,f +g) − a(f −g,f −g)) + (a(f +jg,f +jg) − a(f −jg,f −jg)) . 4 4 Nach (9.7) kann man sämtliche Argumente f + g,f − g,f + jg,f − jg durch ihre mit dem 1 multiplizierten Fouriertransformierten ersetzen. Aufgrund der Linearität der Faktor √ 2π 1 Fouriertransformation folgt dann (9.8): a(f,g) = a(fb,b g ), d.h. 2π +∞ +∞ ˆ ˆ 1 g (ω) dω. f (t)g(t) dt = fb(ω)b 2π a(f,g) =
−∞
−∞
Beweis zu 2: Für h(t) = g(t) e ist b g(s − ω) = gb(ω − s) nach den Symmetrieh(s) = b und Frequenzverschiebungseigenschaften von S. 236. Aus der Parsevalgleichung (9.8) ergibt sich nun der Multiplikationssatz: jωt
+∞ +∞ +∞ ˆ ˆ ˆ 1 fb(s)b h(s) ds f (t)g(t) e−jωt dt = f (t)h(t) dt = 2π
−∞
−∞
−∞
+∞ ˆ 1 b 1 f ∗ gb(ω). fb(s)b g (ω − s) ds = = 2π 2π −∞
9.4 Rechnen mit Fouriertransformationen
241
Bemerkung. Das Riemann-Lebesgue-Lemma von S. 238 gilt auch für beliebige Lebesgueintegrierbare Funktionen f (vgl. Anhang B). Denn f kann durch eine Folge von Treppenfunktionen fn approximiert werden, so dass sup |fb(ω) − fc n (ω)| ≤
ω∈C
+∞ ˆ |f (t) − fn (t)| dt → 0 f u ¨r n → ∞,
−∞
b c b d.h. fc n → f gleichmäßig für n → ∞. Alle fn verschwinden für |ω| → ∞, also auch f . Parsevalgleichung, Multiplikations- und Faltungssatz sind auch für beliebige quadratisch Lebesgue-integrierbare Funktionen gültig und spielen eine zentrale Rolle für viele Anwendungen der Fourier-Analysis. Man vergleiche hierzu auch den noch folgenden Abschnitt 9.7 und die Anwendungsbeispiele in den Kapiteln 10 bis 12. Beispiele. 1. Wendet man die Parsevalgleichung (9.7) auf die Rechteckfunktion ( 1 für |t| ≤ 1 f (t) = 0 für |t| > 1 an, dann berechnet man daraus sofort das Integral +∞ ˆ −∞
π sin2 (ω) dω = ω2 2
+∞ ˆ |f (t)|2 dt = π.
−∞
2 2. Für die Gaußfunktion f (t) = e−t /2 gilt nach S. 233 fb(ω) = fb(0)f (ω). Den Wert von fb(0) zeigt auch die Parsevalgleichung:
+∞ +∞ +∞ ˆ ˆ ˆ √ 2 fb(0)2 e−t /2 dt = 2π. |f (ω)|2 dω , also fb(0) = |f (t)|2 dt = 2π
−∞
−∞
−∞
Zusammenfassung. Wir haben nun mit der Fourierschen Umkehrformel für integrierbare, stückweise stetig differenzierbare Funktionen eine Darstellung als Superposition harmonischer Schwingungen erhalten und wichtige Eigenschaften ihrer Fouriertransformierten, zum Beispiel Ähnlichkeits-, Translations-, Glattheits- und Abklingeigenschaften, Parsevalgleichung, Faltungs- und Multiplikationssatz erkannt. Es sind jedoch auch Nachteile der Fouriertransformation auf der bisher betrachteten Funktionenklasse festzustellen. Viele für die Anwendungen wichtige Funktionen, etwa die Einheitssprungfunktion, Polynome und periodische Funktionen wie sin(t) sind nicht über R integrierbar und haben daher im bisherigen Sinn keine Fouriertransformierten. Diese bis jetzt noch vorhandenen Beschränkungen werden im nächsten Abschnitt überwunden, in dem wir die Fouriertransformation auf einer für viele praktische Fragestellungen hinreichend großen Klasse von Distributionen einführen. In dieser Klasse werden alle oben genannten Funktionen als reguläre Distributionen enthalten sein und die Fouriertransformation bijektiv und damit umkehrbar sein. Die erhaltenen Transformationsregeln behalten im distributionellen Sinn ihre Gültigkeit.
242
9 Die Fouriertransformation
9.5 Die Fouriertransformation für temperierte Distributionen Den Ansatz, eine Funktionenklasse S zu finden, auf der die Fouriertransformation eine umkehrbare Abbildung ist, liefern die Aussagen über Differenzierbarkeits- und AbklingEigenschaften: Für jene unendlich oft differenzierbaren Funktionen, die zusammen mit allen ihren Ableitungen für |t| → ∞ schneller abfallen als jede Potenz von 1/|t|, haben die Fouriertransformierten wieder diese Eigenschaften und die Fouriersche Umkehrformel zeigt, dass die Fouriertransformation auf dieser Funktionenklasse bijektiv ist. Die Fouriertransformation für schnell fallende Funktionen Definition. Eine Funktion ϕ: R → C heißt eine schnell fallende Funktion, wenn ϕ unendlich oft differenzierbar ist und lim tm ϕ(k) (t) = 0
|t|→∞
für beliebige natürliche Zahlen k,m ≥ 0 gilt. Die Menge aller schnell fallenden Funktionen wird mit S bezeichnet und L. Schwartz zu Ehren Schwartzscher Raum genannt. Jede Testfunktion ϕ ∈ D (vgl. Kap. 7) gehört zu S, es gilt also D ⊂ S. Andere typische 2 Beispiele sind Funktionen der Form P (t) e−t mit einem Polynom P . Nicht zu S gehören 2 −|t| etwa 1/(1 + |t| ) oder e , weil die erste Funktion zu langsam abfällt und die zweite nicht differenzierbar ist. Man stellt folgende Eigenschaften von S fest: 1. S ist ein Funktionenvektorraum, d.h. Linearkombinationen von Funktionen aus S liegen wieder in S. 2. Produkte von Funktionen aus S liegen wieder in S und Produkte P ϕ zwischen Funktionen ϕ ∈ S und Polynomen P liegen in S. 3. Beliebige Ableitungen von Funktionen aus S liegen wieder in S. Jedes ϕ ∈ S ist integrierbar, weil mit einer (von ϕ abhängigen) geeigneten Konstante M wegen des schnellen Abfallens von ϕ gilt +∞ +∞ ˆ ˆ |ϕ(t)| dt ≤ M (1 + |t|)−2 dt < ∞ .
−∞
−∞
4. Für alle ϕ ∈ S gehören die Translationen ϕ(t − t0 ), t0 ∈ R, und die Produkte ϕ(t) e±jωt , ω ∈ R, wieder zu S. 5. Für jedes ϕ ∈ S liegt die Fouriertransformierte ϕ b ebenfalls in S.
Alle in 9.1 und 9.4 gezeigten Formeln für die Fouriertransformation gelten natürlich auch für Funktionen aus S. Die Tatsache, dass mit ϕ ∈ S auch ϕ b zu S gehört, die Symmetrieeigenschaft von S. 236 und die Fouriersche Umkehrformel ergeben zusammen den
9.5 Die Fouriertransformation für temperierte Distributionen
243
Hauptsatz über die Fouriertransformation auf S. Die Fouriertransformation ist eine lineare, bijektive Abbildung F : S → S mit der Umkehrabbildung F −1 , die für F ϕ = ϕ b gegeben ist durch F
−1
1 (F ϕ)(t) = ϕ(t) = 2π
+∞ ˆ ejωt dω. ϕ(ω) b
−∞
Bemerkung. In der Umkehrformel für Funktionen aus S kann man das vorher benutzte
Cauchy-Hauptwert-Integral auch als uneigentliches Riemann-Integral oder als LebesgueIntegral über R auffassen, da auf S alle drei Integralbegriffe zum gleichen Ergebnis führen (vgl. Anhang B, S. 416, Satz von der majorisierten Konvergenz für Ω → ∞ angewendet auf 1[−Ω,Ω] ϕ). b
Folgerungen
b 1. Die Symmetrieeigenschaft zeigt ϕ b (t) = F (F ϕ)(t) = 2πϕ(−t).
2. Da mit f und g aus S auch fb· b g in S liegt, zeigt die Bijektivität der Fouriertransformation auf S, dass mit je zwei Funktionen f und g aus S auch ihre Faltung f ∗ g wieder eine schnell fallende Funktion aus S ist: f ∗ g = F −1 F (f ∗ g) = F −1 (F f · F g) ∈ S.
3. Für eine integrierbare Funktion f und ϕ aus S, allgemeiner auch für integrierbare ϕ, erhält man mit Vertauschung der Integrationsreihenfolge +∞ +∞ +∞ ˆ ˆ ˆ fb(s)ϕ(s) ds = ϕ(s) f (t) e−jst dt ds −∞
−∞
−∞
−∞
−∞
+∞ +∞ +∞ ˆ ˆ ˆ −jst = f (t) ϕ(s) e ds dt = f (t)ϕ(t) b dt . −∞
Der Integrand fbϕ liefert also dasselbe Integral wie der Integrand f ϕ. b Dies erinnert sofort an die Definition der verallgemeinerten Ableitung f˙ für Distributionen f (vgl. S. 142). Dort hatten wir für eine Distribution f und eine Testfunktion ϕ definiert hf˙,ϕi =
+∞ +∞ ˆ ˆ ˙ f (t)ϕ(t) dt = − f (t)ϕ′ (t) dt = −hf,ϕ′ i,
−∞
−∞
hatten also analog den „Integranden“ f˙ϕ bis auf den Faktor −1 ersetzt durch f ϕ′ . Diese Beobachtung vermittelt die Idee, die Fouriertransformation für Distributionen nach dem gleichen Rezept einzuführen. An Stelle der Testfunktionenmenge D und der Distributionen aus D′ verwendet man als neuen, größeren Testfunktionenraum nun S, definiert Distributionen auf S als lineare stetige Funktionale und führt ihre Fouriertransformation ein. Hinsichtlich der Stetigkeit auf S benutzt man nach L. Schwartz die folgende Konvergenzdefinition:
244
9 Die Fouriertransformation
Definition. Eine Folge von Funktionen ϕn aus S konvergiert in S gegen ϕ ∈ S, wenn für beliebige natürliche Zahlen m,k ≥ 0 alle Funktionen tm ϕ(k) n (t) gleichmäßig gegen tm ϕ(k) (t) konvergieren, d.h. sup |tm ϕn(k) (t) − tm ϕ(k) (t)| → 0
für n → ∞.
t∈R
Wir schreiben dann ϕ = S-lim ϕn . n→∞
Eine Folge von Funktionen ϕn konvergiert damit in S gegen die Nullfunktion, wenn die ϕn und alle ihre Ableitungen gleichmäßig gegen Null konvergieren und für |t| → ∞ schneller als jede Potenz von 1/|t| abfallen. Mit ϕn konvergieren dann auch Produkte P ϕn mit Polynomen P in S gegen Null. Mit diesem Konvergenzbegriff für Funktionenfolgen in S zeigt sich die Stetigkeit der Fouriertransformation auf S. Konvergiert in S eine Folge von Funktionen ϕn gegen ϕ, dann gilt für die Fouriertransformierten S-lim ϕ bn = ϕ. b n→∞
Beweis. Zum Beweis genügt es, den Fall S-lim ϕn = 0 zu überlegen. Zunächst bemerken n→∞ wir, dass für beliebige ψ ∈ S folgende Abschätzung gilt: b sup |ψ(ω)| ≤ sup |π(1 + t2 )ψ(t)| .
ω∈R
t∈R
b Diese Abschätzung ergibt sich aus |ψ(ω)| ≤
+∞ ˆ |ψ(t)| dt durch Integration der Unglei-
−∞
chung |ψ(t)| ≤ (π(1 + t2 ))−1 sup |π(1 + t2 )ψ(t)|, wenn man beachtet, dass t∈R
+∞ ˆ −∞
1 dt = 1 π(1 + t2 )
ist. Außerdem macht man sich klar (vgl. S. 236), dass für m,k ∈ N0 |ω
m
ϕ b(k) n (ω)|
+∞ ˆ =| (tk ϕn (t))(m) e−jωt dt| = |ψbn (ω)| −∞
mit ψn (t) = (tk ϕn (t))(m) ∈ S gilt. Weil mit S-lim ϕn = 0 auch S-lim ψn = 0 gilt, folgt n→∞
n→∞
aus der gezeigten Abschätzung sup |ψbn (ω)| → 0 und sup |ω m ϕ b(k) n (ω)| → 0 für n → ∞. ω∈R
ω∈R
Dies bedeutet gerade S-lim ϕ bn = 0 und zeigt die Stetigkeit der Fouriertransformation n→∞ auf S.
9.5 Die Fouriertransformation für temperierte Distributionen
245
Temperierte Distributionen Definition. Jede stetige lineare Abbildung T : S → C nennt man eine temperierte Distribution. Die Menge aller temperierten Distributionen wird mit S ′ bezeichnet.
Statt T (ϕ) verwenden wir wie in Kapitel 7 auch wieder die Schreibweise hT,ϕi für den Wert einer Distribution T ∈ S ′ auf einer Testfunktion ϕ ∈ S. Die Stetigkeit eines linearen Funktionals T ∈ S ′ auf S bedeutet, dass lim hT,ϕn i = hT,ϕi ist, falls ϕ = S-lim ϕn gilt. n→∞ n→∞ Aufgrund der Definition stellt man fest: 1. S ′ ist ein Vektorraum.
2. Die Einschränkungen von Distributionen aus S ′ auf D ⊂ S ergeben Distributionen aus D′ . In diesem Sinn gilt S ′ ⊂ D′ . Für T ∈ D′ mit beschränktem Träger ist T (ϕ), ϕ ∈ S, definiert und stetig auf S. Distributionen mit beschränktem Träger sind so als Elemente von S ′ zu verstehen. Viele Beispiele von Distributionen aus Kapitel 7 sind damit auch Beispiele von Distributionen aus S ′ . Ableitungen T˙ und Produkte f T mit unendlich oft differenzierbaren Funktionen f sind für T ∈ S ′ definiert wie früher (vgl. S. 143). Für Distributionen T ∈ S ′ gehören auch die verallgemeinerten Ableitungen T (k) , k ∈ N, wieder zu S ′ .
Man kann zeigen, dass für T ∈ S ′ das Produkt mit einer unendlich oft differenzierbaren Funktion f genau dann temperiert ist, wenn f und alle Ableitungen f (k) , k ∈ N, höchstens polynomiales Wachstum besitzen, d.h. wenn es zu jedem k ∈ N0 eine natürliche Zahl N gibt, so dass lim |t|−N |f (k) (t)| = 0 gilt (L. Schwartz (1957)). |t|→∞
Den Vektorraum aller unendlich oft differenzierbaren Funktionen f mit f T ∈ S ′ für T ∈ S ′ nennt man den Raum OM der Multiplikatoren in S ′ . Seine Elemente nennt man langsam wachsend oder auch polynomial beschränkt. Bevor wir Beispiele für temperierte Distributionen angeben, führen wir die Fouriertransformation auf S ′ nach dem schon angekündigten Rezept ein. Die Fouriertransformation auf S ′
Definition. Die Fouriertransformierte Tb einer Distribution T ∈ S ′ ist für ϕ ∈ S definiert durch hTb,ϕi = hT,ϕi. b
Die Definition ist konsistent mit der Definition der Fouriertransformation für integrierbare Funktionen f . Fassen wir f als reguläre Distribution Tf auf, dann gilt Tbf = Tfb : Denn für ϕ ∈ S folgt mit Vertauschung der Integrationsreihenfolge hTbf ,ϕi = hf,ϕi b =
+∞ˆ +∞ ˆ f (ω)ϕ(t) e−jωt dt dω = hfb,ϕi = hTfb ,ϕi.
−∞−∞
Die Fouriertransformation von Distributionen, die nicht zu S ′ gehören, ist hier nicht definiert. Dazu sei verwiesen zum Beispiel auf W. Walter (1994) oder I. Gel’fand, G. Shilov, N. Vilenkin (1964).
246
9 Die Fouriertransformation
Umkehrung der Fouriertransformation auf S ′ . Mit demselben Konvergenzbegriff für Distributionen wie auf S. 150 schreiben wir T = S ′ -lim Tn , wenn lim hTn ,ϕi = hT,ϕi n→∞
n→∞
für alle ϕ ∈ S gilt. Damit erhält man, dass die Fouriertransformation F auf S ′ linear und umkehrbar ist, und dass S ′ -lim F (Tn ) = F (T ) für T = S ′ -lim Tn gilt. Die Umkehrtransn→∞
formation F −1 ist für T ∈ S ′ und ϕ ∈ S gegeben durch
n→∞
hF −1 T,ϕi = hT,F −1 ϕi . Diese Aussagen ergeben sich für T ∈ S ′ , T = S ′ -lim Tn , ϕ ∈ S durch n→∞
hF F −1 T,ϕi = hT,F −1 F ϕi = hT,ϕi, hF −1 F T,ϕi = hT,F F −1 ϕi = hT,ϕi, hTbn ,ϕi = hTn ,ϕi b −→ hT,ϕi b = hTb,ϕi. n→∞
Die letzte Eigenschaft ist eine Stetigkeitseigenschaft der Fouriertransformation auf S ′ . Für Mathematiker mit Kenntnissen in Funktionalanalysis sei erwähnt, dass dies die Stetigkeit von F ist, wenn man S ′ mit der sogenannten schwachen Topologie, notiert als σ(S ′ ,S)Topologie, versieht. Für mehr Details sei verwiesen etwa auf W. Rudin (1990). Die Umkehrformeln F −1 (F T ) = T und F (F −1 T ) = T sind Gleichungen in S ′ und in der Regel nicht punktweise Beziehungen wie die Umkehrformeln für Funktionen, weil Distributionen T im Allgemeinen an einzelnen Stellen keine Werte besitzen. Rechnen mit Fouriertransformationen in S ′ Die Transformationsregeln von S. 236 gelten im Sinn von Koordinatentransformationen für Distributionen auch in S ′ . Wir zeigen diese Aussage exemplarisch für Translationen und Ableitungen:
1. Man erhält die Korrespondenz T (t − t0 )
e−jωt0 Tb(ω)
mit A(t) = t − t0 und der Notation TA für die Translation von T , mit ϕ ∈ S und et0 (x) = e−jxt0 aus der Korrespondenz für eine Translation von ϕ b (siehe S. 236): et0 ϕi = het0 Tb,ϕi. hTc b ◦ A−1 i = hT,[ A ,ϕi = hT,ϕ
2. Für verallgemeinerte Ableitungen rechnet man nach T (k) (t) (−jt)k T (t)
(jω)k Tb(ω) Tb(k) (ω).
Denn für ϕ ∈ S und das Polynom P (x) = (jx)k gelten
(k) ,ϕi = hT,(−1)k ϕ hTd b(k) i = hT,Pcϕi = hP Tb,ϕi , (k) i = hT d b(k) ,ϕi. h(−1)k P T ,ϕi = h(−1)k P T,ϕi b = (−1)k hT,ϕd
9.5 Die Fouriertransformation für temperierte Distributionen
247
Man erkennt an der Symmetrieeigenschaft F 2 T (ω) = 2πT (−ω) (vgl. S. 236), dass die Fouriertransformation F die Beziehung F 4 (T ) = 4π 2 T erfüllt. Daher ist die√Umkehrtrans√ formation F −1 = (4π 2 )−1 F 3 und F hat nur die 4 möglichen Eigenwerte ± 2π, ± j 2π. Beispiele von Eigenfunktionen der Fouriertransformation sind auf S. 251 zu finden. Wir geben nun einige typische Beispiele von Distributionen aus S ′ und ihren Fouriertransformierten. Beispiele für temperierte Distributionen und ihre Fouriertransformierten 1. Der δ-Impuls. Der δ-Impuls hat den Nullpunkt als Träger und gehört zu S ′ . Aus der Gleichung +∞ ˆ hδ,ϕi b = ϕ(0) b = ϕ(t) dt = h1,ϕi −∞
ergibt sich als seine Fouriertransformierte δb = 1, also δ(t)
b δ(ω) = 1.
Insbesondere ist die konstante Funktion f = 1 aus S ′ . Umgekehrt gilt für die Fouriertransformierte von f = 1 und ϕ ∈ S bb i = 2π hfb,ϕi b = hf, ϕ
+∞ +∞ ˆ ˆ ϕ(−t) dt = 2π ϕ(t) dt = 2π ϕ(0) b = h2πδ,ϕi. b
−∞
−∞
Die resultierende Fouriertransformierte (vgl. auch S. 152) fb = b 1 = 2πδ
+∞ ˆ e−jωt dt = 2πδ(ω). Man beachte dabei, dass wird häufig notiert in der Form −∞
e−jωt nicht integrierbar ist, die linke Seite im herkömmlichen Sinn nicht definiert ist und nur als Symbol für die Distribution 2πδ(ω) verstanden werden kann. Die Fouriertransformierte des Impulses δ(t − t0 ) ist nach der Verschiebungsregel gegeben durch e−jωt0 . n 1 für t ≥ 0 2. Die Einheitssprungfunktion. Die Funktion s(t) = ist eine reguläre 0 für t < 0 ′ Distribution aus S und besitzt die verallgemeinerte Ableitung s˙ = δ. Aus der Differentiationsregel für Fouriertransformationen folgt b b s(ω) ˙ = jωb s(ω) = δ(ω) = 1.
Unter Beachtung von jωkδ(ω) = 0 erhält man (vgl. S. 144) sb(ω) =
1 + kδ(ω). jω
248
9 Die Fouriertransformation 1/ω bezeichnet dabei die singuläre Distribution vp(1/ω), die durch den Cauchy-Hauptwert definiert wird (S. 138), k ∈ C eine Konstante. Zur Bestimmung dieser Konstante 2 k wenden wir sb auf die Testfunktion ϕ(ω) = e−ω /2 aus S an. Dann ist einerseits √
hb s,ϕi = hs,ϕi b = hs(t), 2π e
−t2 /2
i=
√
2π
ˆ∞
2
e−t
/2
dt = π,
0
andererseits gilt
2 2 1 hb s,ϕi = −jh , e−ω /2 i + khδ(ω), e−ω /2 i = k, ω
denn der erste Summand der rechten Seite ist Null, weil 1/ω eine ungerade Funktion 2 und e−ω /2 eine gerade Funktion ist. Damit ergibt sich k = π, also s(t)
sb(ω) =
1 + πδ(ω). jω
Für die Signumfunktion sgn(t) = s(t) − s(−t) erhalten wir damit sgn(t)
sd gn(ω) =
2 . jω
3. Langsam wachsende Funktionen. Jede lokal-integrierbare Funktion f , die langsam wächst, d.h. |t|−N |f (t)| → 0 für |t| → ∞ bei geeigneter Wahl von N ∈ N, gehört zu S ′ . Wählt man nämlich C > 0 und N so, dass für t außerhalb einer geeigneten beschränkten Nullumgebung U die Abschätzung |f (t)| ≤ C(1 + |t|2 )N gilt, und betrachtet eine Folge von Funktionen ϕn in S mit S-lim ϕn = 0, dann folgt n→∞
εn = sup(1 + |t|2 )N +1 |ϕn (t)| → 0 t∈R
für n → ∞
und damit |hf,ϕn i| ≤ sup |ϕn (t)| t∈U
≤ sup |ϕn (t)| t∈U
ˆ U
ˆ
|f (t)| dt +
ˆ
C(1 + |t|2 )N +1 (1 + |t|2 )−1 |ϕn (t)| dt
R\U
|f (t)| dt + Cπεn → 0.
U
Dies zeigt die Stetigkeit der zu f gehörigen regulären Distribution auf S.
9.5 Die Fouriertransformation für temperierte Distributionen
249
Insbesondere gehören damit alle Polynome und auch die Funktionen ejω0 t , sin(ω0 t) und cos(ω0 t) zum Raum S ′ .
Periodische Distributionen T sind nach dem Satz von S. 176 stets als verallgemeinerte Fourierreihen der Form +∞ X T (t) = ck ejkω0 t k=−∞
mit polynomial beschränkten Koeffizienten ck darstellbar. Sie sind daher als Summe einer Konstante und der verallgemeinerten Ableitung f (n) einer stetigen periodischen Funktion f temperiert (n geeignet, vgl. Abschnitt 8.1). Ebenso gehören die langsam wachsende reguläre Distribution f (t) = ln(|t|) und ihre verallgemeinerten Ableitungen, damit also auch die Pseudofunktionen pf(t−m ) für m ∈ N zu S ′ und alle als Pseudofunktionen zu verstehenden rationalen Funktionen.
Auf ganz ähnliche Weise erkennt man, dass auch alle integrierbaren und alle messbaren beschränkten Funktionen zu S ′ gehören. Auch alle p-fach integrierbaren Funktionen f (d.h. |f |p ist integrierbar) sind für p > 1 temperierte Distributionen. Dies folgt mit 1/p + 1/q = 1 aus der Hölder-Ungleichung
1/p +∞ 1/q +∞ ˆ ˆ |hf,ϕn i| ≤ |f (t)|p dt |ϕn (t)|q dt , −∞
−∞
da die rechte Seite mit ϕn → 0 in S ebenfalls gegen Null konvergiert. Beispiele von Distributionen, die nicht temperiert sind. 2
Die Funktionen et , e−t , et sind Beispiele von Distributionen, die zwar zu D′ , aber wegen ihres großen Wachstums für |t| → ∞ nicht zu S ′ gehören. Sie besitzen keine Fouriertransformierten in S ′ . Anmerkung. Man kann zeigen, dass Distributionen T ∈ D′ lokal, d.h. auf offenen beschränkten Mengen mit verallgemeinerten Ableitungen geeignet hoher Ordnung von stetigen Funktionen übereinstimmen. Distributionen mit Träger im Inneren einer kompakten Menge K können als verallgemeinerte Ableitungen geeignet hoher Ordnung von stetigen Funktionen dargestellt werden, die ihre Träger in K haben. Temperierte Distributionen sind verallgemeinerte Ableitungen einer gewissen Ordnung von langsam wachsenden stetigen Funktionen. Die Beweise dieser bemerkenswerten Sätze über die Struktur von Distributionen führen über den Rahmen unserer Einführung hinaus. Man findet sie in der fundamentalen Monographie „Théorie Des Distributions“ von Laurent Schwartz (1957) oder bei V. S. Vladimirov (2002). Wir berechnen als weitere Beispiele nun die Fouriertransformierten für f (t) = ln(|t|), g(t) = |t|−1/2 , die Fouriertransformierten der Hermite-Funktionen, von Polynomen, verallgemeinerten Fourierreihen und rationalen Funktionen.
250
9 Die Fouriertransformation
b 4. Die Fouriertransformierte von f (t) = ln(|t|). Aus f˙(t) = vp(1/t), f˙(ω) = jω fb und der Fouriertransformierten von f˙(t) = vp(1/t) 1 −jπsgn(ω) vp t folgt fb(ω) = −πvp(|ω|−1 ) + kδ(ω).
2 Zur Bestimmung der Konstante k berechnen wir die Integrale I1 = hfb(ω), e−ω /2 i 2 und I2 = hvp(|ω|−1 ), e−ω /2 i . Dabei verwenden wir Eigenschaften der Eulerschen Gammafunktion Γ(x) (vgl. hierzu etwa H. Heuser (2009)). ˆ∞ e−u ux−1 du erhält man mit der Substitution u = t2 /2 und DifferenAus Γ(x) =
0
tiation unter dem Integral für x = 1/2 den Wert von Γ′ (1/2): ∞ √ ˆ −t2 /2 √ 1 Γ ln(t) dt − π ln(2). =2 2 e 2 ′
0
√ Mit der Euler-Konstante γ ≈ 0.5772 und Γ′ (1/2) = (−γ − 2 ln(2)) π folgt ∞
√ √ ˆ −t2 /2 −t2 /2 I1 = hln(|t|), 2π e ln(t) dt i = 2 2π e 0
√ = πΓ′
1 + π ln(2) = −π(γ + ln(2)). 2
Für I2 erhält man mit der Substitution ω = t1/2 und partieller Integration I2 = 2
=
1 2
ˆ1
dω + 2
ˆ∞
0
1
ˆ∞
1 2
ˆ∞
0
e−ω
2
/2
ω
−1
ln(t) e−t/2 dt −
1
2
e−ω /2 dω ω ln(t) e−t/2 dt +
ˆ∞
e−t/2 dt . t
1
Da die beiden letzten Summanden sich zu Null addieren, folgt mit t = 2u I2 =
ˆ∞ 0
ln(2u) e−u du = ln(2) + Γ′ (1) = ln(2) − γ.
Damit ergibt sich die Konstante k = −2πγ und wir haben das Ergebnis: ln(|t|)
−π vp(|ω|−1 ) − 2πγδ(ω).
9.5 Die Fouriertransformation für temperierte Distributionen
251
5. Die Fouriertransformierte von f (t) = |t|−1/2 . Die gerade Funktion f (t) = |t|−1/2 ist regulär und gehört zu S ′ . Es gilt fb(ω) = 2
ˆ∞
t
−1/2
cos(|ω|t) dt = 2|ω|
−1/2
ˆ∞
u−1/2 cos(u) du .
0
0
∞
ˆ p Mit dem bekannten Wert π/2 des Fresnel-Integrals u−1/2 cos(u) du (vgl. etwa Heuser (2009)) erhalten wir die Korrespondenz √ 2π|ω|−1/2 . |t|−1/2
0
|t|−1/2 ist √ also eine verallgemeinerte Eigenfunktion der Fouriertransformation zum Eigenwert 2π. 6. Die Fouriertransformierten der Hermite-Funktionen. Die Hermite-Polynome Hn sind für n ≥ 0 definiert durch 2
Hn (t) = (−1)n et
dn −t2 e . dtn
Man erhält aus 2
d −t2 dn −t2 e e = − H (t) n−1 dtn dt ′ 2tHn−1 (t) − Hn−1 (t)
e−t Hn (t) = (−1)n 2
= e−t die Beziehung
′ Hn (t) = 2t Hn−1 (t) − Hn−1 (t). 2
Die Hermite-Funktionen hn (t) = e−t
2
h′n (t) = −t e−t
/2
Hn (t) erfüllen dann die Beziehung
/2
Hn (t) + e−t
2
/2
Hn′ (t).
Hieraus folgt mit der obigen die Gleichung für Hn und Hn′ hn+1 (t) = t hn (t) − h′n (t). Wir zeigen, dass die√Funktionen hn Eigenfunktionen der Fouriertransformation zu den 2 Eigenwerten (−j)n 2π sind. Für n = 0, d.h. für h0 (t) = e−t /2 ist diese Behauptung schon gezeigt. Es gilt die Symmetrieeigenschaft hn (t) = (−1)n hn (−t). Mit vollständiger Induktion und der Notation fn (t) = jthn (t) erhält man nun durch Fouriertransformation der letzten Gleichung für hn+1 b b hn+1 (ω) = −j fc n (ω) − jω hn (ω) √ √ = −j j n 2π(−1)n+1 h′n (ω) + (−j)n 2πωhn (ω) √ √ = (−j)n+1 2π (−h′n (ω) + ωhn (ω)) = (−j)n+1 2πhn+1 (ω).
252
9 Die Fouriertransformation √ cn = (−j)n 2πhn für alle n ∈ N ∪ {0}. Damit ist die Behauptung gezeigt: h √ Es sei angemerkt, dass die normierten Hermite-Funktionen (2n n! π)−1/2 hn ein vollständiges Orthonormalsystem von Eigenfunktionen der Fouriertransformation in L2 (R) bilden. Geeignet skaliert sind sie auch Eigenfunktionen des harmonischen Oszillators. Hierzu und für Details über spezielle Funktionen sei etwa auf G. Folland (1992) oder H. Triebel (1980) verwiesen. Bei Interesse an weiteren Eigenfunktionen der Fouriertransformation sei das Buch von E. Titchmarsh (1948) empfohlen.
7. Polynome. Für jedes Monom P (t) = tm und ϕ ∈ S gilt [ (m) (ω)i = hj m b hPb ,ϕi = h1,ω m ϕ(ω)i b = h1,(−j)m ϕ 1(m) ,ϕi = h2πj m δ (m) ,ϕi.
Wir erhalten damit
Q(t) =
N X
a k tk
k=0
b Q(ω) = 2π
N X
j k ak δ (k) (ω).
k=0
8. Trigonometrische Funktionen, verallgemeinerte Fourierreihen. Aus Beispiel 1 und aus cos(ω0 t) = (ejω0 t + e−jω0 t )/2 sowie sin(ω0 t) = (ejω0 t − e−jω0 t )/(2j) erhält man die Korrespondenzen ejω0 t
2πδ(ω − ω0 )
π[δ(ω + ω0 ) + δ(ω − ω0 )] jπ[δ(ω + ω0 ) − δ(ω − ω0 )] +∞ X 2π ck δ(ω − kω0 ).
cos(ω0 t) sin(ω0 t) +∞ X
ck ejkω0 t
k=−∞
k=−∞
Die letzte Korrespondenz und auch die unten nachfolgende gelten für polynomial beschränkte Koeffizienten ck . Sie zeigt, dass periodische Funktionen und Distributionen ein diskretes Spektrum besitzen (vgl. S. 26). Die Fouriertransformierte ist eine Folge äquidistanter Impulse, deren Impulsstärken bis auf den Faktor 2π gerade die Fourierkoeffizienten ck sind. Unter Beachtung der Resultate von Abschnitt 8.1 bemerken wir, dass periodische Impulsfolgen – häufig Impulskämme genannt – wieder Impulskämme als Fouriertransformierte besitzen: +∞ X
k=−∞
δ(t − kp) =
+∞ 1 X j2kπt/p e p k=−∞
+∞ X
k=−∞
ck δ(t − kp)
+∞ 2π X δ(ω − 2kπ/p) p k=−∞
+∞ X
ck e−jkp ω .
k=−∞
Aus Beispiel 2 und der Regel für Frequenzverschiebungen folgen mit der Einheitssprungfunktion s(t)
9.5 Die Fouriertransformation für temperierte Distributionen ejω0 t s(t) cos(ω0 t)s(t) sin(ω0 t)s(t)
πδ(ω − ω0 ) +
253
1 j(ω − ω0 )
π jω [δ(ω − ω0 ) + δ(ω + ω0 )] + 2 2 ω0 − ω 2 π ω0 . [δ(ω − ω0 ) − δ(ω + ω0 )] + 2 2j ω0 − ω 2
Die auftretenden rationalen Funktionen sind hier und auch im folgenden Beispiel, falls sie für reelle ω Polstellen besitzen, als Pseudofunktionen (vgl. S. 139) zu verstehen. 9. Rationale Funktionen. Eine besondere Rolle in der linearen Systemtheorie spielen die Funktionen, deren Fouriertransformierte die Form Q(jω)/P (jω) mit Polynomen P und Q besitzen (vgl. Abschnitt 10.2). Um sie zu bestimmen, benätigt man die Rücktransformation der typischen Partialbrüche von Q(jω)/P (jω) (vgl. Anhang A, S. 409 zur Partialbruchzerlegung rationaler Funktionen). Für b ∈ R, r ∈ R\{0} und k ∈ N gelten folgende Korrespondenzen (sgn(t) bezeichnet dabei die Vorzeichenfunktion, s(t) die Einheitssprungfunktion): 1 jbt tk−1 e sgn(t) 2 (k − 1)!
− sgn(r)
1 (jω − jb)k 1 . (jω − (r + jb))k
tk−1 e(r+jb)t s(− sgn(r)t) (k − 1)!
Beweis. Mit sd gn(ω) =
2 folgt aus der Gleichung jω j k−1 dk−1 1 = k (jω) (k − 1)! dω k−1
1 jω
und den Regeln für Frequenzverschiebungen und Ableitungen (vgl. S. 246) sofort die 1 erste Korrespondenz. Mit F e−|a|t s(t) = für a ∈ R \ {0} (vgl. S. 232) jω + |a| und der Differentiationsregel erhält man
g(t) =
tk−1 e−|a|t s(t) (k − 1)! g(sgn(a)t)
sgn(a)k 1 = , (jω + |a|)k (j sgn(a)ω + a)k sgn(a)k ω . = gb (jω + a)k sgn(a)
Mit r = −a 6= 0 und wieder der Regel für Frequenzverschiebungen ergibt sich die zweite, oben behauptete Korrespondenz. Wir bemerken, dass die inverse Fouriertransformierte einer rationalen Funktion der Form Q(jω)/P (jω) genau dann eine kausale Distribution ist, d.h. ihren Träger in der Halbachse [0,∞[ hat, wenn alle Polstellen von Q/P Realteile r < 0 besitzen. Q(jω)/P (jω) gehört genau dann zum Raum OM der Multiplikatoren in S ′ , wenn keine Nullstelle von P auf der imaginaren Achse liegt (vgl. S. 245).
254
9 Die Fouriertransformation
9.6 Fouriertransformation von Faltungen Unter geeigneten Voraussetzungen an die Distributionen T und G aus S ′ ist die Faltung T ∗ G wieder eine temperierte Distribution und für ihre Fouriertransformierte gilt b. \ T ∗ G = Tb · G
Diese Gleichung bildet eine wichtige Grundlage zur Berechnung von Faltungen und für viele Anwendungen der Fouriertransformation. Weil jedoch Faltungen und Produkte für zwei beliebige Distributionen T und G nicht allgemein definiert werden können und auch die Fouriertransformation nur auf S ′ eingeführt ist, benötigt man zusätzliche Bedingungen für die Gültigkeit der Faltungsgleichung. Im folgenden Satz werden solche Bedingungen, die für unsere späteren Anwendungsbeispiele notwendig und ausreichend sind, ohne Beweise angegeben. b mit Distributionen T \ Satz. Hinreichend für die Gültigkeit der Gleichung T ∗ G = Tb · G und G aus S ′ ist jede der folgenden Bedingungen: 1. T und G sind integrierbare Funktionen.
2. T und G sind quadratisch integrierbare Funktionen. 3. Eine der beiden Distributionen T oder G ist regulär und gehört zu S. 4. Eine der beiden Distributionen T oder G besitzt einen beschränkten Träger. 5. Eine der beiden Distributionen T oder G besitzt eine Fouriertransformierte, die zum Raum OM der Multiplikatoren in S ′ gehört. b an Stelle von T und G sind hinreichend für die Die gleichen Voraussetzungen an Tb und G Gültigkeit des Multiplikationssatzes 1 b b T ∗ G. T[ ·G = 2π
Erläuterung. Generell muss für die Gültigkeit des Faltungssatzes erstens die Faltung T ∗G b definiert sein und möglich sein und zu S ′ gehören, und zweitens muss das Produkt TbG ebenfalls wieder zu S ′ gehören. Gilt etwa die erste Bedingung, dann folgt aus dem Satz von Fubini (Anhang B), dass die Faltung T ∗ G ebenfalls eine integrierbare Funktion ist. Der Faltungssatz ergibt sich dann direkt durch Vertauschung der Integrationsreihenfolge wie auf S. 50. Gilt die zweite Bedingung, dann ist T ∗ G eine stetige beschränkte Funkb eine integrierbare Funktion. Zur Fouriertransformation quadratisch\ tion und T ∗ G = TbG integrierbarer Funktionen sei hier auf den folgenden Abschnitt verwiesen. Gilt die dritte Bedingung, dann ist T ∗ G eine unendlich oft differenzierbare Funktion (vgl. auch S. 163). Man kann zeigen, dass diese Funktion mit allen ihren Ableitungen höchstens polynomial wächst, also zu S ′ gehört. Gilt die vierte Bedingung, etwa mit Tr (T ) beschränkt, dann ist Tb ein Multiplikator in S ′ . Dies folgt zum Beispiel aus einem Satz über die Glattheit und
9.6 Fouriertransformation von Faltungen
255
Wachstumseigenschaften von Tb von R. Paley, N. Wiener (1934). Man findet ihn bewiesen bei W. Walter (1994). Gilt allgemeiner noch die fünfte Bedingung mit Tb ∈ OM , dann ist T eine sogenannte „schnell fallende Distribution“. Typische Fälle für solche Distributionen T , die in unseren Anwendungsbeispielen auftreten, sind kausale Grundlösungen asymptotisch stabiler linearer Differentialgleichungen mit konstanten Koeffizienten (vgl. Abschnitt 8.2 und das nachfolgende Kapitel 10). Die Faltung T ∗ G existiert dann für alle Distributionen G ∈ S ′ und gehört ebenfalls zu S ′ .
Unter den genannten Bedingungen kann die Faltung T ∗ G, wie in Abschnitt 7.7, S. 161 mit ˇ ∗ ϕ) definiert werden. Diese Gleichung Testfunktionen ϕ ∈ D durch (T ∗ G)(ϕ) = T (G kann dann zu einer Definition der Faltung von Distributionen aus S ′ fortgesetzt werden. Alle Aussagen 1-5 gelten auch für Translationen und verallgemeinerte Ableitungen der beteiligten Distributionen T und G, wenn T und G eine der dort angegebenen Bedingungen erfüllen . Die Beweise der Aussagen des Satzes erfordern vertiefte Kenntnisse über die Struktur von Distributionen, die über den gesteckten Rahmen dieses Buches hinausgehen (siehe auch Anmerkung zu Beispiel 3 auf S. 249). Interessierte Leser seien hierzu auf L. Schwartz (1957) oder V. S. Vladimirov (2002) verwiesen. Dort findet man den Faltungssatz auch für weitere Distributionenklassen bewiesen, auf die wir hier nicht eingehen. Weitere Details über die Fouriertransformation von Faltungen und zu Produkten von Distributionen findet man bei D. Champeney (1989), J. Colombeau (1992), M. Oberguggenberger (1992) und N. Ortner, P. Wagner (2013), einige Ergebnisse der Integrationstheorie zur Faltung von Funktionen in Anhang B.
Beispiele 1. Die Einheitssprungfunktion. Für die Einheitssprungfunktion s(t) existiert zwar die Faltung s ∗ s(t) = ts(t) in S ′ und hat die Fouriertransformierte j sb˙ , d.h. 1 ˙ + jπ δ(ω). ω2 Es kann jedoch mit dem entwickelten Kalkül nicht das Quadrat der Distribution sb, 1 + πδ(ω) gebildet werden. sb(ω) = jω Der Anteil −1/ω 2 von sd ∗ s ist zu verstehen als zweite verallgemeinerte Ableitung von ln(|ω|) und bezeichnet die singuläre Distribution pf(−1/ω 2 ) (vgl. S. 139). sd ∗ s(ω) = −
2. Integralfunktionen, Glättungen. Für Funktionen f aus S gehört die Integralfunktion ˆt F (t) = f (s) ds zu S ′ . Sie lässt sich als Faltung mit der Einheitssprungfunktion −∞
s(t) schreiben: +∞ ˆ F (t) = f (u)s(t − u) du = (f ∗ s) (t). −∞
256
9 Die Fouriertransformation Sowohl f[ ∗ s als auch fb · sb gehören zu S ′ , der Faltungssatz gilt und ergibt fb(ω) Fb (ω) = + π fb(0)δ(ω). jω
Analog sieht man mit der Fouriertransformierten rbT (ω) = 2T funktion rT (t) (vgl. S. 232), dass die Glättung 1 G(t) = 2T
t+T ˆ
f (u) du =
sin(ωT ) der RechteckωT
1 f ∗ rT (t) 2T
t−T
einer integrierbaren Funktion f folgende Fouriertransformierte besitzt: sin(ωT ) b . G(ω) = fb(ω) ωT Der Faltungssatz ist anwendbar, weil rT einen beschränkten Träger hat. 3. Faltung des Cauchy-Hauptwertes. Ein interessantes Beispiel ist die Faltung f ∗ f für den Cauchy-Hauptwert f (t) = vp(1/t). Die Faltung existiert, da man f als Summe einer Distribution mit beschränktem Träger und einer quadratisch integrierbaren Funktion darstellen kann: Man wähle dazu eine Testfunktion aus ϕ ∈ D, die auf einer Nullumgebung konstant Eins ist; dann ist f ϕ + f (1 − ϕ) eine solche Darstellung von f . Mit dem Faltungssatz der Fouriertransformation folgt dann: f[ ∗ f (ω) = (−jπsgn(ω))2 = −π 2 , also (f ∗ f )(t) = −π 2 δ(t).
Beachten Sie, dass Tr(f ) = R ist, aber Tr(f ∗ f ) = {0} gilt. 4. Fouriertransformation zeitbegrenzter und bandbegrenzter Signale. Ist T ein zeitbegrenztes Signal, d.h. eine Distribution aus S ′ mit beschränktem Träger, dann ist die Fouriertransformierte Tb eine unendlich oft differenzierbare Funktion. Wählt man nämlich eine Testfunktion ϕ, so dass ϕ = 1 auf Tr (T ) ist, dann gilt T = ϕT und damit
1 b Tb = T ∗ ϕ. b 2π Nach der Bemerkung auf S. 254 ist die rechte Seite eine unendlich oft differenzierbare Funktion. Mit Mitteln der Funktionentheorie kann man zeigen, dass Tb überall durch seine Taylorreihe dargestellt wird (vgl. etwa W. Rudin (1990) oder W. Walter (1994)). Aus dem Identitätssatz für Potenzreihen ergibt sich dann, dass die Fouriertransformierte Tb eines zeitbegrenzten Signals T 6= 0 auf keinem Intervall vollständig verschwinden kann. Analog sieht man, dass ein bandbegrenztes Signal T , d.h. ein Signal, dessen verallgemeinerte Spektralfunktion Tb einen beschränkten Träger besitzt, immer eine unendlich oft differenzierbare Funktion ist, die für T 6= 0 auf keinem Intervall verschwindet.
5. Faltungen von Impulsfolgen, Produkte von Fourierreihen. Grundlegende Bedeutung bei diskreten linearen Filtern haben Impulsfolgen und ihre Faltungen. Wir betrachten vier Varianten, die für die Anwendungen relevant sind (vgl. später Abschnitt 10.6).
9.6 Fouriertransformation von Faltungen
257
(a) Faltung einer schnell fallenden Impulsfolge mit einer temperierten Impulsfolge. +∞ +∞ X X Gegeben seien T (t) = ck δk und G(t) = dk δk . Dabei bezeichne k=−∞
k=−∞
δk (t) = δ(t − ka) einen Impuls bei ka mit fest gewähltem a > 0. Wir setzen voraus, dass die Koeffizienten ck schnell fallend sind, d.h. |k|m ck → 0 für jedes m ∈ N und |k| → ∞. Dann hat T als Fouriertransformierte die Fourierreihe Tb(ω) =
+∞ X
ck e−jkωa .
k=−∞
Tb ist eine unendlich oft differenzierbare 2π/a-periodische Funktion (vgl. S. 42 und S. 252) und damit ein Multiplikator in S ′ . Die Distribution T ist ein Beispiel einer sogenannten schnell fallenden Distribution. Wir setzen nun weiterhin voraus, dass die Folge der Koeffizienten dk für |k| → ∞ polynomial beschränkt ist. Dann ist G ∈ S ′ und +∞ X b G(ω) = dk e−jkωa . k=−∞
b \ Nach Bedingung Nr. 5 von S. 254 gilt der Faltungssatz T ∗ G(ω) = Tb(ω) · G(ω). Dabei sind die Koeffizienten hk der durch die Faltung entstehenden Impulsfolge T ∗ G(t) =
+∞ X
h k δk
k=−∞
b und der verallgemeinerten Fourierreihe Tb(ω) · G(ω) =
+∞ X
hk e−jkωa gegeben
k=−∞
durch die diskrete Faltung der Koeffizienten ck und dk (vgl. auch S. 166): hk =
+∞ X
cn dk−n .
n=−∞
b Zum Beweis haben wir zu zeigen, dass die verallgemeinerte Fourierreihe Tb · G die angegebenen Koeffizienten hk hat. +N X Dazu betrachten wir die Partialsummen TN (t) = cn δn und die Faltungen n=−N
TN ∗ G. Für ϕ ∈ S ist hTN ∗ G,ϕi = mit hm (N ) =
N X
+N X
+∞ X
n=−N k=−∞
n=−N
cn dk ϕ((n + k)a) =
+∞ X
hm (N )ϕ(ma)
m=−∞
cn dm−n , da die obige Reihe absolut konvergiert und mit der
Indextransformation n + k = m umgeordnet werden kann. Also sind
258
9 Die Fouriertransformation TbN (ω) =
N X
n=−N
b cn e−jnωa und TbN · G(ω) =
+∞ X
hk (N ) e−jkωa .
k=−∞
b → TbG b in S ′ und hk (N ) → hk für N → ∞: Erstens konvergiert die Es gilt TbN G +∞ X Reihe cn dk−n aufgrund der Wachstumsbedingungen der Koeffizienten cn n=−∞
und dn für alle k absolut, d.h. alle hk sind sinnvoll definiert. Für jedes ϕ ∈ S ist b,ϕi = hG b , (Tb − TbN )ϕ i. Es gilt, dass (Tb − TbN )ϕ in S zweitens h (Tb − TbN )G für N → ∞ gegen Null konvergiert. Dies ergibt sich aus der Beschränktheit der Funktionen ω p ϕ(q) (ω) (p,q ∈ N) und der Tatsache, dass beliebige Ableitungen von Tb − TbN gleichmäßig gegen Null konvergieren (vgl. S. 112). Für N → ∞ b → TbG b in S ′ . Bezeichnen nun h−k die Fourierkoeffizienten von folgt daher TbN G b b T G, dann gilt für N → ∞ b (Tb − TbN )G(ω) =
+∞ X
k=−∞
(hk − hk (N )) e−jkωa → 0 in S ′ .
Dann konvergieren auch die inversen Fouriertransformierten +∞ X
k=−∞
(hk − hk (N ))δk → 0 in S ′ f u ¨r N → ∞.
Für k ∈ Z sei nun ϕk eine Testfunktion mit Träger in [(k − 1/2)a,(k + 1/2)a], die in einer Umgebung von ka Eins ist. Dann folgt (hk − hk (N ))ϕk (ka) → 0 für +∞ X N → ∞, schließlich für jedes k ∈ Z also hk = lim hk (N ) = cn dk−n . N →∞
n=−∞
(b) Faltung einer Impulsfolge, die summierbare Koeffizienten hat, mit einer Impulsfolge, die beschränkte Koeffizienten besitzt. Ein weitere Variante, die für diskrete Filter in den Anwendungsbeispielen von Abschnitt 10.6 im nächsten Kapitel interessant wird, ist die Faltung von zwei Impulsfolgen T (t) =
+∞ X
k=−∞
ck δk
und G(t) =
+∞ X
dk δk ,
k=−∞
von denen wir voraussetzen, dass etwa T absolut summierbare Koeffizienten und G beschränkte Koeffizienten besitzt, d.h. +∞ X
k=−∞
|ck | = C < ∞ und |dn | < M
für geeignete Konstanten C und M und alle n ∈ Z. Dieses Beispiel zeigt, dass b dazu ver\ man unter geeigneten Bedingungen den Faltungssatz T ∗ G = Tb · G wenden kann, das Produkt auf der rechten Seite zu definieren, auch wenn keiner b ein Multiplikator in S ′ ist. der Faktoren Tb oder G
9.6 Fouriertransformation von Faltungen
259
Unter den genannten Voraussetzungen gilt für hk =
+∞ X
n=−∞
wegen
+∞ X
k=−∞ +∞ X
k=−∞
Die Reihe
cn dk−n und ϕ ∈ S
|ϕ(ka)| ≤ A < ∞ mit einer geeigneten Konstante A > 0
|hk ||ϕ(ka)| ≤
+∞ X
+∞ X
n=−∞
k=−∞
+∞ X
+∞ X
!
|cn ||dk−n | |ϕ(ka)| ≤ ACM < ∞.
cn dk−n ϕ(ka) ist daher absolut konvergent und jede Um-
k=−∞ n=−∞
ordnung konvergiert zum gleichen Grenzwert. Da die Koeffizienten hk beschränkt sind, |hk | ≤ M C, ist die durch ! +∞ +∞ X X −1 −jkωa T ∗ G(t) = hk δk = F hk e k=−∞
k=−∞
definierte Faltung eine temperierte Distribution. Man kann nun wie im Beispiel +∞ X b b b b vorher das Produkt der Reihen T und G durch T (ω) · G(ω)= hk e−jkωa k=−∞
definieren und erhält so auch in diesem Fall die Faltungsbeziehung \ T ∗ G(ω) =
+∞ X
k=−∞
b hk e−jkωa = Tb(ω) · G(ω).
Zu dem auf diese Weise definierten Produkt sei jedoch Folgendes angemerkt: Es lässt sich zeigen, dass der Vektorraum der stetigen Funktionen f auf [0, 2π/a] mit absolut summierbaren Fourierkoeffizienten Xck ein vollständiger normierter Raum A ist, wenn man die Norm kf kA = |ck | einführt. Die Fourierreihe k∈Z
Tb gehört zu A. Dieser Raum ist eine Algebra, d.h. mit f und g gehört auch f · g b mit den Fourierzu A (vgl. S. 63), und es gilt kf gkA ≤ kfX kA kgkA . Man kann G b koeffizienten dk dann vermöge G(f ) = dk c−k als stetiges lineares Funktiok∈Z
b in der Literatur als ein Pseudomaß (vgl. nal auf A auffassen. Man bezeichnet G R. E. Edwards (1982) und die Referenzen dort). Weil A eine Algebra ist, kann b definieren durch f G(h) b b h). Es ist wegen man für f ∈ A das Produkt f G = G(f der Norm-Ungleichung oben ebenfalls ein stetiges lineares Funktional auf A. Für b mit dem oben eingeführten Produkt von Tb und G b überein. Das f = Tb stimmt f G b b Produkt T · G ist temperiert und hat die verallgemeinerte Ableitung b ′ = −jF (t(T ∗ G)). (Tb · G)
260
9 Die Fouriertransformation b ′ = Tb′ · G b + Tb · G b′ , weil die Produkte Es gilt jedoch nicht die Produktregel (Tb · G) der rechten Seite im Allgemeinen nicht mehr wie oben definiert werden können. Ebenso gelten im Allgemeinen auch nicht mehr die Gleichungen (T ∗ G)′ = T ′ ∗ G = T ∗ G′ .
(c) Faltung von Impulsfolgen mit absolut summierbaren Koeffizienten Für T und G wie im vorangehenden Beispiel gelte nun, dass beide Distributionen absolut summierbare Koeffizienten besitzen. Da die Koeffizienten dann beschränkt sind, folgt mit den gleichen Bezeichnungen wie vorher die Gültigkeit von +∞ X b \ T ∗ G(ω) = hk e−jkωa = Tb(ω) · G(ω). k=−∞
Ergänzend zeigt der Beweis des 1/f -Theorems von Wiener (vgl. S. 63), dass auch b zur dort eindie Koeffizienten hk absolut summierbar sind und das Produkt TbG b geführten normierten Algebra A gehört. Wenn etwa G keine Nullstelle hat, dann b ebenso in A und ist die Fouriertransformierte einer Falliegt der Quotient Tb/G tung zweier Impulsfolgen mit absolut summierbaren Koeffizienten.
(d) Faltung von Impulsfolgen mit quadratisch summierbaren Koeffizienten und die Multiplikation von Fourierreihen in L2 ([0,2π/ω0 ]) +∞ X ck ejkω0 t i) Wir untersuchen zunächst das Produkt von Fourierreihen f (t) = k=−∞
und g(t) =
+∞ X
dk ejkω0 t mit quadratisch summierbaren Koeffizienten. Das Pro-
k=−∞
dukt f g ist über [0,2π/ω0 ] integrierbar, da |f g| ≤ |f |2 + |g|2 ist und f und +N X g quadratisch integrierbar auf [0,2π/ω0 ] sind. Sind fN (t)= ck ejkω0 t und k=−N
gN (t) =
+N X
dk ejkω0 t , dann folgt wie auf S. 63 die Konvergenz von fN gN ge-
k=−N
gen f g in der Norm von L1 ([0,2π/ω0 ]) und die Fourierkoeffizienten von f g sind +∞ X hk = cn dk−n . Diese Reihe ist absolut konvergent. Da f g über [0,2π/ω0 ] n=−∞
integrierbar ist, gilt lim hk = 0 (Riemann-Lebesgue-Lemma, S. 241). Mit f |k|→∞
und g ist auch das Produkt f g eine 2π/ω0 -periodische Distribution in S ′ . +∞ +∞ X X ii) Für zwei Impulsfolgen T (t) = ck δk und G(t) = dk δk mit quak=−∞
k=−∞
dratisch summierbaren Koeffizienten ck und dk definiert man die Faltung wie in +∞ X den Beispielen vorher durch T ∗ G(t) = hk δk mit hk wie oben und erhält k=−∞
b \ nun aus i) die Gültigkeit des Faltungssatz T ∗ G = Tb · G.
9.7 Fouriertransformation quadratisch integrierbarer Funktionen
261
9.7 Fouriertransformation quadratisch integrierbarer Funktionen Eine wichtige Rolle in vielen Anwendungsbereichen spielen Signale endlicher Energie, mathematisch gesprochen quadratisch integrierbare Funktionen. Jede solche Funktion lässt sich auch als reguläre Distribution aus S ′ auffassen. Der Vektorraum L2 (R) aller quadratisch integrierbaren Funktionen ist enthalten in S ′ . Die Fouriertransformation temperierter Distributionen ergibt damit auch die Fouriertransformation quadratisch integrierbarer Funktionen und viele ihrer Eigenschaften. Zwei quadratisch integrierbare Funktionen f und g werden als gleich betrachtet, wenn sie in S ′ dieselbe Distribution darstellen, d.h. wenn für alle ϕ ∈ S gilt +∞ +∞ ˆ ˆ hf,ϕi = f (t)ϕ(t) dt = g(t)ϕ(t) dt = hg,ϕi. −∞
−∞
Die gleiche Aussage gilt mit D′ an Stelle von S ′ , d.h. wenn die letzte Gleichung für alle ϕ ∈ D gilt. Man kann beweisen, dass dies genau dann der Fall ist, wenn f (t) = g(t) für fast alle t ∈ R gilt, d.h. wenn f (t) 6= g(t) höchstens auf einer Lebesgueschen Nullmenge gilt (vgl. Anhang B). Auf L2 (R) sind durch +∞ ˆ hf |gi = f (t)g(t) dt −∞
und kf k2 = hf |f i1/2
ein inneres Produkt und eine Norm definiert (vgl. auch S. 49 und später 12.1). Zwei quadratisch integrierbare Funktionen f und g stellen genau dann dasselbe Element in L2 (R) dar, wenn die Norm kf − gk2 = 0 ist. Ohne Beweise halten wir folgende wichtigen Aussagen fest, für deren Überprüfung man im Wesentlichen Sätze der Integrationstheorie verwendet (siehe etwa H. Triebel (1980) oder J. Weidmann (1980)): 1. Der Vektorraum L2 (R) ist vollständig bezüglich der oben definierten Norm, d.h. jede Folge von Funktionen fn in L2 (R), n ∈ N, mit kfn − fm k2 → 0 für n,m → ∞ konvergiert gegen ein Element f ∈ L2 (R). 2. Es gilt die Cauchy-Schwarz-Ungleichung: Für f,g ∈ L2 (R) ist |hf |gi| ≤ kf k2 kgk2 . Das innere Produkt ist stetig in beiden Variablen. In der Cauchy-Schwarz-Ungleichung gilt genau dann das Gleichheitszeichen, wenn f und g linear abhängig sind, d.h. wenn f = αg für ein α ∈ C ist. 3. Zu jedem f ∈ L2 (R) gibt es eine Folge schnell fallender Funktionen fn ∈ S, die in L2 (R) gegen f konvergiert, d.h. lim kfn − f k2 = 0. n→∞
Mit diesen Eigenschaften zeigt sich, dass die Fouriertransformation den Vektorraum L2 (R) auf sich abbildet, und dass die Parsevalgleichung (S. 239) auf ganz L2 (R) fortgesetzt werden kann.
262
9 Die Fouriertransformation
Satz über die Fouriertransformation auf L2 (R). 1. Ist f ∈ L2 (R) und f = lim fn in L2 (R), fn ∈ S für n ∈ N, dann konvergieren die n→∞
Fouriertransformierten fbn in L2 (R) gegen fb. Insbesondere ist fb ∈ L2 (R).
2. Für je zwei Funktionen f und g aus L2 (R) gilt die Parsevalgleichung hf |gi =
1 b h f | gb i. 2π
Sie ist eine Orthogonalitätsrelation: Die Funktionen f und g sind genau dann orthogonal, wenn ihre Fouriertransformierten orthogonal sind. 3. Die Fouriertransformation ist auf L2 (R) stetig, bijektiv und stetig umkehrbar. Beweis. 1) Wegen der Parsevalgleichung in S (S. 239) gilt für fn ,fm aus S kfbn − fbm k22 = 2πkfn − fm k22 .
Für fn ∈ S mit lim fn = f in L2 (R) bilden die Funktionen fbn eine Cauchy-Folge in n→∞
L2 (R), die aufgrund der Vollständigkeit von L2 (R) gegen eine quadratisch integrierbare Funktion g konvergiert. Andererseits konvergiert diese Folge in S ′ gegen fb. Da sowohl die Konvergenz in L2 (R) als auch die Konvergenz in S ′ die Konvergenz in D′ nach sich ziehen, stimmen g und die Fouriertransformierte fb überein. 2. Für f und g aus L2 (R) gelte f = lim fn und g = lim gm in L2 (R) mit geeigneten n→∞
m→∞
Folgen schnell fallender Funktionen fn und gm . Die Parsevalgleichung auf L2 (R) folgt mit 1) aus der Stetigkeit des inneren Produkts: 2πhf | gi = 2π
lim hfn |gm i=
n,m→∞
lim hfbn | gbm i = hfb| b gi.
n,m→∞
Insbesondere ist die Fouriertransformation F auf L2 (R) injektiv und stetig. 3. Gilt f = lim fn , fn ∈ S, dann ist f = F ( lim F −1 (fn )). Mithin ist die Fouriern→∞
transformation auch surjektiv auf L2 (R).
n→∞
Die Faltungsformel und der Multiplikationssatz gelten im Sinn von Distributionen (vgl. S. 254 und Anhang B, S. 420). Für f und g aus L2 (R) sind f ∗ g und fb ∗ gb beschränkte stetige Funktionen, die jedoch nicht notwendig integrierbar oder quadratisch integrierbar sein müssen. Ihre Fouriertransformationen sind aber definiert, wenn man f ∗ g oder fb ∗ gb als Distributionen in S ′ auffasst. Die Produkte f g und fbgb sind integrierbare Funktionen. Satz. Für alle Funktionen f und g aus L2 (R) gelten die folgenden Faltungsbeziehungen f[ ∗ g = fb · gb 1 b f ∗ gb . fd ·g = 2π
9.7 Fouriertransformation quadratisch integrierbarer Funktionen
263
Beweis. Für fn und gn aus S mit lim fn = f und lim gn = g in L2 (R) gilt jedenfalls n→∞
n→∞
b bn . Mit der Cauchy-Schwarz-Ungleichung und der Parseval-Gleichung folgt f\ n ∗ gn = fn g 1 für die L -Norm (vgl. S. 420) von fbb g − fbn b gn kfbb g − fbn b gn k1 ≤ kfb − fbn k2 kb gk2 + kb g − gbn k2 kfbn k2
= 2π(kf − fn k2 kgk2 + kg − gn k2 kfn k2 ).
Somit konvergiert kfbgb − fbn gbn k1 gegen Null für n → ∞. Da nun für integrierbare Funktionen h stets kb hk∞ ≤ khk1 ist, folgt F −1 (fbn gbn ) −→ F −1 (fbb g) gleichmäßig für n → ∞.
Andererseits folgt aus der Youngschen Ungleichung (vgl. S. 420)
kf ∗ g − fn ∗ gn k∞ ≤ kf − fn k2 kgk2 + kg − gn k2 kfn k2 , also
F −1 (fbn b gn ) = fn ∗ gn → f ∗ g gleichmäßig für n → ∞.
Damit ergibt sich die erste Faltungsbeziehung f[ ∗ g = fb · gb. Den Multiplikationssatz beweist man analog. Bemerkung. Man kann zeigen, dass für f ∈ L2 (R) die Funktionen fbN (ω) =
ˆ+N
f (t) e−jωt dt
−N
in L2 (R) gegen fb konvergieren, also lim kfbN − fbk2 = 0. Analog konvergieren die FunkN →∞ ˆ+N 1 tionen fN (t) = fb(ω) ejωt dω in L2 (R) gegen f . 2π −N
Beispiele.
2 1. Für fb(ω) = ω −1/4 1]0,1] (ω) ist das Produkt fb integrierbar, gehört aber nicht zu 2 L2 (R). Die Faltung f ∗ f = F −1 (fb ) kann daher nicht zu L2 (R) gehören (1]0,1] ist die Indikatorfunktion von ]0,1]).
2. Die Funktion f (t) = sin(at)/t, a > 0, ist nicht absolut integrierbar, wohl aber quadratisch integrierbar. Sie besitzt die Fouriertransformierte n fb(ω) = π für |ω| ≤ a 0 sonst. Die Aussage folgt aus Beispiel 1 von S. 232 mit der Symmetrieregel von S. 236. Bevor wir im nächsten Kapitel Anwendungsbeispiele studieren, erörtern wir kurz, wie sich die Fouriertransformation auch bei Funktionen mehrerer Variablen einführen lässt und wie sich die wesentlichen Transformationsregeln auf diesen Fall übertragen.
264
9 Die Fouriertransformation
9.8 Die Fouriertransformation für Funktionen mehrerer Variablen Definition. Für integrierbare, komplexwertige Funktionen in p Variablen ist die Fouriertransformierte fb definiert durch ˆ b b f (~ ω ) = f (ω1 , . . . ,ωp ) = f (~x) e−j~ω ·~x dλp (~x). Rp
Dabei bezeichnen ω ~ · ~x das übliche Skalarprodukt der Vektoren ω ~ = (ω1 , . . . ,ωp ) und ~x = (x1 , . . . ,xp ) im Rp , dλp (~x ) = dx1 dx2 . . . dxp das p-dimensionale Volumenelement in kartesischen Koordinaten, und nachfolgend |~x| die euklidische Norm eines Vektors ~x. 2 2 Beispiel. Die Funktion f (x ,x ) = e−(x1 +x2 )/2 der beiden Variablen x und x besitzt 1
1
2
2
die Fouriertransformierte fb(ω1 ,ω2 ) =
+∞ ˆ +∞ ˆ 2 2 e−(x1 +x2 )/2 e−j(ω1 x1 +ω2 x2 ) dx1 dx2 −∞ −∞
+∞ +∞ ˆ ˆ 2 −jω1 x1 −x21 /2 e e−jω2 x2 −x2 /2 dx2 dx1 = −∞
= 2π e
−ω12 /2 −ω22 /2
e
−∞
= 2π e−(ω1 +ω2 )/2 . 2
2
Mit den auf S. 155 eingeführten Schreibweisen mit Hilfe von Multi-Indizes definiert man analog zu Abschnitt 9.5 den Schwartzschen Raum S (Rp ) der schnell fallenden Funktionen: Definition. ϕ: Rp → C gehört zu S (Rp ) , wenn ϕ unendlich oft differenzierbar ist und wenn für beliebige Multi-Indizes m = (m1 , . . . ,mp ) und k = (k1 , . . . ,kp ) aus Np0 gilt kϕkm,k = sup ~x m ∂ k ϕ(~x) < ∞ . ~ x∈Rp
Mit anderen Worten: Das Produkt zwischen einem beliebigen Polynom in p Variablen und einer beliebigen Ableitung von ϕ bleibt eine beschränkte Funktion, jede Ableitung von ϕ fällt für |~x| → ∞ schneller als 1/|~x|N für beliebige N ∈ N. Eine Folge von Funktionen ϕn ∈ S (Rp ) konvergiert gegen die Nullfunktion, notiert durch S-lim ϕn = 0 , wenn für beliebige m und k ∈ Np0 gilt lim kϕn km,k = 0 . Mit n→∞
n→∞
diesem Konvergenzbegriff auf S (Rp ) definiert man die Menge S ′ (Rp ) der temperierten Distributionen.
Definition. Eine temperierte Distribution T ∈ S ′ (Rp ) ist eine stetige, lineare Abbildung T : S (Rp ) → C.
9.8 Die Fouriertransformation für Funktionen mehrerer Variablen
265
Die Aussagen des Abschnitts 9.5 über S = S (R) und S ′ = S ′ (R) gelten sinngemäß ebenso für S (Rp ) und S ′ (Rp ). Insbesondere lassen sich die behandelten Eigenschaften der Fouriertransformation auf den Fall mehrerer Variablen übertragen. Wir fassen sie in der nachfolgenden Tabelle (S. 269) zusammen. Die Beweise dieser Eigenschaften erhält man auf analoge Weise wie im Fall einer Variablen. Die Fouriertransformation ist wie im Fall p = 1 stetig und bijektiv auf S (Rp ). Wie in Abschnitt 9.7 führt man die Fouriertransformation auf dem Vektorraum L2 (Rp ) der quadratisch integrierbaren Funktionen ein. Die dort formulierten Aussagen gelten auch in L2 (Rp ). Insbesondere gilt wieder die Parsevalgleichung 1/2 ˆ 2 kf k = |f (~x)| dλp (~x) Rp
1/2 ˆ 2 = (2π)−p/2 fb(~x) dλp (~x) = (2π)−p/2 kfbk. Rp
Satz. Die Abbildung (2π)−p/2 F mit der F Fouriertransformation, ist normerhaltend und bijektiv auf dem Vektorraum L2 (Rp ). Die Fouriersche Umkehrformel auf S (Rp ). Für jedes ϕ ∈ S (Rp ) und ~x ∈ Rp gilt ˆ 1 ϕ(~ b ω ) ej~ω·~x dλp (~ω ). ϕ(~x ) = (2π)p Rp
Beweis. Zum Beweis der Umkehrformel setzt man h(~s ) = e−|~s|
2
/2
. Mit der Substitutions-
regel für Integrale und der Ähnlichkeitsbeziehung der Fouriertransformation folgt daraus ˆ ˆ ˆ ~s b ~s pb p p dλ (~s ) = ϕ(~s )n h(n~s ) dλ (~s ) = ϕ h(~s ) dλp (~s ), ϕ(~ b s )h n n Rp
Rp
Rp
also für n → ∞ mit Grenzwertbildung ˆ unter dem Integral (nach dem Satz von der majorisierten Konvergenz, S. 416) und mit b h(~x ) dλp (~x ) = (2π)p Rp
h(~0 )
ˆ
Rp
p
ϕ(~ b s ) dλ (~s ) =
ˆ
Rp
ϕ(~ b s ) dλ (~s ) = ϕ(~0 ) p
ˆ
Rp
b h(~s ) dλp (~s ) = (2π)p ϕ(~0 ).
Dies ist die Umkehrformel an der Stelle ~x = 0 . Der allgemeine Fall ergibt sich aus der Translationsregel mit ψ(~ ω ) = ϕ(~ ω + ~x) ˆ ˆ 1 1 b ω ) dλp (~ ϕ(~ b ω ) ej~ω·~x dλp (~ω ). ψ(~ ω ) = ϕ(~x ) = ψ(~0 ) = (2π)p (2π)p Rp Rp
266
9 Die Fouriertransformation
Die Jordansche Umkehrformel. Der Beweis zeigt, dass die Umkehrformel statt für schnell fallende Funktionen auch für stetige integrierbare Funktionen ϕ mit einer integrierbaren Fouriertransformierten ϕ b gilt. Diese Variante der Umkehrformel geht auf C. Jordan (1838-1922) zurück und verzichtet im Vergleich zum Umkehrsatz auf S. 228 auf Differenzierbarkeitsvoraussetzungen. Satz von Jordan. Für jede integrierbare stetige Funktion f auf Rp mit einer integrierbaren Fouriertransformierten fb und alle ~x ∈ Rp gilt ˆ 1 f (~x ) = fb(~ ω ) ej~ω·~x dλp (~ω ). (2π)p Rp
Die Fouriertransformation für temperierte Distributionen auf Rp Definition. Nach dem gleichen Rezept wie in Abschnitt 9.5 definiert man für eine Distribution T ∈ S ′ (Rp ) die Fouriertransformierte Tb von T durch hTb , ϕi = hT , ϕi. b
Wie in Abschnitt 9.5 gelten die Eigenschaften 1-6 der folgenden Tabelle auf S. 269 auch für temperierte Distributionen T an Stelle von ϕ . Die Faltungsbeziehungen aus Punkt 7 der Tabelle gelten unter analogen Bedingungen wie sie im Fall einer Variablen auf S. 254 genannt waren. Punkt 8 der Tabelle wird für Distributionen hinfällig. Der Parsevalgleichung aus Punkt 9 b) entspricht für T ∈ S ′ (Rp ) und ϕ ∈ S (Rp ) die distributionelle Form hT , ϕi = Beispiele
1 b i. hTb , ϕ (2π)p
1. Die Rechteck-Blende. Für a > 0 , b > 0 besitzt die Funktion n f (~x ) = 1 für ~x ∈ [−a,a] × [−b,b] 0 sonst die Fouriertransformierte fb(~ω ) =
ˆa −a
e
−jω1 x1
dx1
ˆb −b
e−jω2 x2 dx2 = 4ab
sin(aω1 ) sin(bω2 ) · . aω1 bω2
Fouriertransformationen von Funktionen zweier Variablen spielen eine wichtige Rolle in der optischen Beugungstheorie. Wird zum Beispiel kohärentes Licht mit der Amplitudenverteilung f an einer Blende in der (x1 ,x2 )-Ebene gebeugt, dann ist im Fall der Fraunhoferschen Beugung die Intensitätsverteilung des gebeugten Lichts auf einem Schirm proportional zu |fb|2 . Für die obige Amplitudenverteilung f an der RechteckBlende [−1,1] × [−2,2] erhält man |fb| wie im folgenden Bild links dargestellt und näherungsweise ein Beugungsmuster wie im folgenden Bild rechts:
9.8 Die Fouriertransformation für Funktionen mehrerer Variablen
267
5 -10
0 0 -5
10
In diesem Sinn kann man hier „die Fouriertransformation sehen“. Wir gehen auf die weitreichenden Anwendungen in der kohärenten Optik nicht ein, sondern verweisen interessierte Leser auf die Lehrbücher von W. Lauterborn, T. Kurz, M. Wiesenfeldt (1993), A. Papoulis (1968) oder J. Walker (1988). Eng verwandte Anwendungen in der Theorie von Antennen findet man bei R. Bracewell (1999). 2. Die kreisförmige Blende. Die Funktion f (x,y) = 1 für x2 + y 2 ≤ R, f (~x) = 0 sonst, ist ein Beispiel einer radialen Funktion f (~x) = f (|~x|) ( ~x = (x,y) ). Mit Polarkoordinaten x = r cos(φ), y = r sin(φ), ω1 = ̺ cos(ψ), ω2 = ̺ sin(ψ) und f0 (r) = f (r cos φ, r sin φ) gilt für radiale Funktionen f zweier Variablen allgemein fb(~ω ) =
+∞ ˆ +∞ ˆ ˆ2πˆ∞ −j~ x·~ ω e f (x,y) dx dy = f0 (r) e−jr̺ cos(φ−ψ) r dr dφ . −∞ −∞
0
0
Substitution θ = φ − ψ − π/2 zeigt, dass das Integral unabhängig von ψ ist, d.h., fb ist ebenfalls radial. fb(~ω ) =
ˆ∞ ˆ2π 0
f0 (r) e
jr̺ sin(θ)
r dθ dr = 2π
ˆ∞ 0
0
1 Dabei ist J0 (r̺) = 2π
ˆ2π
f0 (r)J0 (r̺)r dr = fe0 (̺).
ejr̺ sin(θ) dθ die Besselfunktion der Ordnung Null. Die
0
Funktion fe0 (̺) ist die Hankel-Transformierte von f0 (r) der Ordnung Null. n 1 für 0 ≤ r ≤ R Im gegebenen Beispiel mit f0 (r) = ist 0 sonst fb(|~ ω |) = fe0 (̺) = 2π
ˆR
J0 (r̺)r dr .
0
Speziell ist fb(~0) = πR2 der Flächeninhalt der Kreisscheibe vom Radius R.
Man sieht leicht, dass rotationsinvariante Funktionen f auf Rp , d.h. f (A~x) = f (~x) für Matrizen A = (A∗ )−1 mit det A = 1 (A∗ die transponierte Matrix), auch eine rotationsinvariante Fouriertransformierte besitzen: f[ ◦ A(~ω ) = fb(A~ ω ).
268
9 Die Fouriertransformation Interessierte Leser mögen selbst eine Darstellung der Amplitudenverteilung und eines Beugungsmusters analog zum vorherigen Beispiel erstellen. Für ausführliche Behandlungen der Besselfunktionen und weiterer spezieller Funktionen sowie für Transformationen, die der Fouriertransformation verwandt sind, wie etwa die Hankel- oder die Mellin-Transformation, sei verwiesen auf E. Titchmarsh (1948), R. Bracewell (1999), G. Folland (1992) oder V. S. Vladimirov (2002).
3 3. Das Oberflächenmaß. Die Distribution T (~x ) = δ (|~x| − R) , ~x = (x1 ,x2 ,x3 ) ∈ R , 3 R > 0 , ist für ϕ ∈ S R definiert durch ˆ ϕ(~x ) do(~x ) hδ (|~x| − R) , ϕ(~x )i = |~ x|=R
mit dem Oberflächenintegral über die Kugelfläche |~x| = R. T gehört zu S ′ R3 und hat als Träger diese Kugelfläche. Wir berechnen die Fouriertransformierte von T . Für ϕ ∈ S R3 gilt mit dem Volumenelement dλ3 (~ω) = dω1 dω2 dω3 ˆ ˆ ϕ(~ω ) e−j~ω·~x dλ3 (~ω )do(~x ) hTb , ϕi = hT , ϕi b = =
|~ x|=R R3
ˆ
ϕ(~ ω)
R3
ˆ
e−j~ω ·~x do(~x) dλ3 (~ω ).
|~ x|=R
Für jedes feste ~ ω ∈ R3 wählen wir jetzt ω ~ /|~ ω| als „Nordpol“ des Kugelkoordinatensystems (r,θ,φ) für die Berechnung des Oberflächenintegrals. Mit ~ω · ~x = |~ω ||~x| cos(θ) , dem Winkel θ zwischen ~x und ~ ω und |~x| = R folgt dann hTb , ϕi = R2
ˆ
ϕ(~ ω)
R3
ˆπ ˆ2π 0
e−jR|~ω| cos(θ) sin(θ) dφdθdλ3 (~ω )
0
ˆπ ϕ(~ ω) ∂ −jR|~ω | cos(θ) 1 e dθdλ3 (~ω ) = 2πR · jR |~ ω| ∂θ 0 R3 ˆ ϕ(~ ω ) jR|~ω | 4πR e − e−jR|~ω| dλ3 (~ω ) = 2j |~ ω| R3 ˆ sin (R|~ ω|) 3 ω) = 4πR ϕ(~ dλ (~ω ). |~ ω| 2
ˆ
R3
Damit ist die Fouriertransformierte von δ (|~x| − R) berechnet und wir erhalten die Korrespondenz sin (R|~ω |) 4πR δ (|~x| − R) . |~ω | Dieses Beispiel wird der Schlüssel zur Lösung von Anfangswertproblemen der dreidimensionalen Wellengleichung in Abschnitt 11.7 sein.
9.8 Die Fouriertransformation für Funktionen mehrerer Variablen
269
Eigenschaften der Fouriertransformation auf S (Rp ) ϕ(~x ) = ϕ(x1 , . . . ,xp ) ∈ S (Rp )
ϕ(~ b ω ) = ϕ(ω b 1 , . . . ,ωp )
1. Linearität
αϕ b1 (ω~1 ) + β ϕ b2 (ω~2 )
αϕ1 (x~1 ) + βϕ2 (x~2 ) 2. Symmetrie
(2π)p ϕ(−~ω )
ϕ(~ b x)
ϕ(−~ b ω)
ϕ(~x )
3. Ähnlichkeit, Skalierung ϕ(α~x)
~ ω 1 ϕ b | α |p α
(α 6= 0)
4. Translationen
e−j~ω ·~x0 ϕ(~ b ω)
ϕ(~x − ~x0 )
ej~ω0 ·~x ϕ(~x ) 5. Ableitung (k Multi-Index, vgl. S. 155) ∂ k ϕ(~x), k ∈ Np0
ϕ(~ b ω − ~ω0 )
(j~ω )k ϕ(~ b ω)
6. Multiplikation mit einem Polynom ~xk ϕ(~x ) , k ∈ Np0
j |k| ∂ k ϕ(~ b ω)
7. Faltung und Modulation (ϕ1 ∗ ϕ2 )(~x ) ϕ1 (~x )ϕ2 (~x ) 8. Stetigkeit, Rieman-Lebesgue-Lemma Für ϕ(~x ) ∈ S (Rp ) ist
ϕ b1 (~ω )ϕ b2 (~ω ) 1 (ϕ b1 ∗ ϕ b2 )(~ω ) (2π)p ϕ(~ b ω ) stetig, beschränkt und es gilt lim ϕ(~ b ω) = 0 |~ ω |→∞
9. Parseval-Gleichung ˆ | ϕ(~x ) |2 dλp (~x ) a)
=
1 (2π)p
Rp
b)
ˆ Rp
p
ϕ1 (~x )ϕ2 (~x ) dλ (~x )
ˆ Rp
=
1 (2π)p
ˆ Rp
2
|ϕ(~ b ω )| dλp (~ω )
ϕ b1 (~ω )ϕ b2 (~ω ) dλp (~ω )
270
9 Die Fouriertransformation
Zusammenfassung. Die Fouriertransformation lässt sich von der in den ersten Abschnitten dieses Kapitels studierten Funktionenklasse fortsetzen auf temperierte Distributionen. Dies gilt für den Fall eines eindimensionalen oder p-dimensionalen zugrunde liegenden Parameterraumes. In den Beispielen haben wir erkannt, dass eine große Klasse verallgemeinerter Funktionen, die in Anwendungen vorkommen, temperierte Fouriertransformierte besitzt und dass sich auch die vom klassischen Fall gewohnten Rechenregeln in geeigneter Weise übertragen lassen (vgl. die Tabelle auf S. 269 und die Aussagen auf S. 266). Die zur Verfügung gestellten Spektralbegriffe und Transformationseigenschaften bieten ein mächtiges Instrument zur Lösung vieler praktischer Aufgabenstellungen. Einen Einblick in die Reichweite der mit der Distributionentheorie verbundenen Fourierschen Methoden erarbeiten wir an einer Auswahl typischer Anwendungen in den nächsten Kapiteln. Zur Fouriertransformation beliebiger Distributionen aus D′ sei auf die Lehrbücher von I. M Gel’fand, G. E. Shilov, N. Ya. Vilenkin (1964), auf A. H. Zemanian (2010) und W. Walter (1994) verwiesen.
9.9 Übungsaufgaben A1) Berechnen Sie die Fouriertransformierten von f1 (t) = sgn(t), f2 (t) = t2 sgn(t) 2 −t2
f3 (t) = t e
(sgn(t) die Vorzeichenfunktion),
,
2
f4 (t) = e−at +bt+c t . f5 (t) = 1 − jt
(a > 0),
A2) Zu welcher Funktion f gehört folgende Spektralfunktion? fb(ω)
U0 T
−3ω0
−ω0
ω0
3ω0
ω
Hinweis: fb ist Summe zweier Dreieck – Frequenzfenster.
A3) Für a > 0 sei
Fa (x) =
a 1 x 1 . = F1 π a2 + x2 a a
b Berechnen Sie für a > 0 , b > 0 die Fouriertransformationen F\ a ∗ Fb und Fa+b . (In der Wahrscheinlichkeitstheorie ist Fa die Dichte der Cauchy-Verteilung zum Parameter a.)
9.9 Übungsaufgaben
271
A4) Berechnen Sie mit Hilfe der Parsevalgleichung das Integral ˆ∞
sin(ax) sin(bx) dx. x2
0
A5) Die Parsevalgleichung gilt für alle quadratisch integrierbaren Funktionen f . Für welche durch Ω > 0 bandbegrenzte Funktion g , d.h. b g(ω) = 0 für |ω| > Ω , wird der mittlere quadratische Fehler +∞ ˆ 2 ε= |f (t) − g(t)| dt −∞
minimal, wenn man f durch g approximiert? (Man vgl. Abschnitt 5.1). A6) Berechnen Sie die Fouriertransformation der Distribution S(t) =
1 ∗ rT (t) t
(rT die Rechteckfunktion rT (t) = 1 für |t| < T , rT (t) = 0 für |t| ≥ T ). A7) (a) Finden Sie Beispiele von Funktionen und Distributionen f und g, so dass zwar deren Faltung existiert, für die aber nicht der Faltungssatz für die Fouriertransformation gilt. (b) Suchen Sie Beispiele für Funktionen f , so dass für die Integralfunktion f ∗ s nicht die Formel fb(ω) + π fb(0)δ(ω) f[ ∗ s(ω) = jω gilt (s(t) die Einheitssprungfunktion). A8) Berechnen Sie die Fouriertransformierte von f (t) = cos(t) (s(t + 1) − s(t − 1)) und rechtfertigen Sie, dass der Multiplikationssatz von S. 254 gilt. A9) (a) Berechnen Sie die kausale Lösung h von au(3) + bu˙ = δ für a,b > 0. (b) Berechnen Sie F −1 (fb) für fb(ω) =
(c) Berechnen Sie F −1 (fb) für fb(ω) =
1
(jω)3 a
+
+ jωb p mit ω0 = b/a für positive a, b.
1 . (jω)3 a + jωb
π π δ(ω) − (δ(ω − ω0 ) + δ(ω + ω0 )) b 2b
272
9 Die Fouriertransformation
5ω + 9 − 10j A10) a) Berechnen Sie F −1 (fb) für fb(ω) = 2 und b) F −1 (b hRC,α ) für ω − 4jω − 13 für |ω| ≤ b − a (0 < a < b, α = a/b) 1 0 für b + a ≤ |ω| b hRC,α (ω) = |ω| − (b − a) 2 cos π für b − a ≤ |ω| ≤ b + a 4a
Skizzieren Sie b hRC,α und hRC,α und überlegen Sie die Bedeutungen der Parameter a, b und α (vgl. auch „Raised Cosine Puls“, S. 333 und S. 339). Hinweis: b hRC,α ist reell, gerade (vgl. S. 231). Verwenden Sie Additionstheoreme für die cos2 -Funktion.
A11) Berechnen Sie die Fouriertransformierten von 2 2 f1 (x,y) = xy e−(x +y ) und f2 (x,y) = 1 0
für (x − 1)2 + (y − 1)2 ≤ 1 sonst. 2 A12) Überlegen Sie, dass die verallgemeinerte Ableitung f˙ von f (t) = sin et zwar eine temperierte Distribution ist, dass jedoch für ϕ ∈ S im Allgemeinen nicht +∞ ˆ 2 2 ˙ hf ,ϕi = 2t et cos et ϕ(t) dt gelten kann. −∞
⋆
A13) Berechnen Sie die Fouriertransformierten der folgenden Distributionen f (t) = |t|, g(t) = tn sgn(t), h(t) = ts(t),
p(t) = pf(t−n ) für n ∈ N, q(t) = pf(|t|λ−1 ) (0 < λ < 1).
Hinweis: Verwenden Sie beim letzten Beispiel e−rt tλ−1 s(t) −→ tλ−1 s(t) in S ′ für ˆ∞ r → 0+ und tλ−1 e−(r+jω)t dt = (r + jω)−λ Γ(λ) für r > 0 mit der bekannten 0
Gamma-Funktion. 1 für a > 0. cosh(ax) Für welches a ist f eine Eigenfunktion der Fouriertransformation und zu welchem Eigenwert? (Hinweis: Verwenden Sie den Residuensatz und Integrale über Rechteckwege mit Basis [−R,R] und Oberkante [−R + jπ/a,R + jπ/a] mit R → ∞.)
A14)⋆ Berechnen Sie die Fouriertransformierte von f (x) =
A15)⋆ (a) Fouriertransformation bei linearer Koordinatentransformation. Sei A eine reelle reguläre (p × p)-Matrix und B die transponierte Matrix von A−1 . Zeigen Sie, dass für T ∈ S ′ (Rp ) gilt (zur Notation vgl. S. 156): b Tc A = | det(B)| (T )B .
(b) P sei das Parallelogramm, das in der Ebene durch die Geraden y = ±1 und y = x ± 1 begrenzt wird. Berechnen Sie die Fouriertransformierte der Funktion fp , die auf P den Wert Eins hat und sonst Null ist.
273
10
Grundlagen über Lineare Filter
Ziel dieses Kapitels ist eine Einführung in erste grundlegende Begriffsbildungen und Ergebnisse der linearen Systemtheorie. Wichtige mathematische Hilfsmittel sind dabei der Kalkül der Distributionen und die Fourier-Analyse, deren Bedeutung für dieses Gebiet im Folgenden dargestellt wird. Gegenstand der Systemtheorie ist das Studium von Signalen und von Systemen, die Signale übertragen. Übertragungssysteme spielen in der Physik oder in der Nachrichten- und Regelungstechnik eine wichtige Rolle. Es handelt sich dabei um physikalische Systeme, die zeit- oder ortsabhängige Eingangssignale verarbeiten und sie verändert als Ausgangssignale wieder abgeben. Dabei wird unterschieden zwischen analoger, d.h. kontinuierlicher und diskreter Signalverarbeitung. Beispiele für Übertragungssysteme sind etwa elektrische Schaltungen, Telefonsysteme, die Gespräche übermitteln, eine Gitarrensaite, die zu Schwingungen angeregt wird, ein Gegenstand, der mit Licht bestrahlt wird und dieses teils absorbiert, teils reflektiert, Audio- und Video-übertragungssysteme und vieles andere mehr. Die für ein gegebenes System zulässigen und möglichen Eingangs- und Ausgangssignale sind im Allgemeinen auf gewisse Klassen beschränkt. Wir führen daher im ersten Abschnitt geeignete Signalräume ein, die es gestatten, sowohl analoge als auch diskrete lineare Systeme mathematisch einheitlich zu behandeln, und beschreiben im zweiten Abschnitt die linearen Systeme, die nachfolgend studiert werden sollen.
10.1 Signale Das mathematische Modell für ein Übertragungssystem ist eine Transformation L zwischen einer Menge Z zulässiger Eingangssignale und einer Menge A möglicher Ausgangssignale. Bei deterministischen Modellen – auf die wir uns im Folgenden beschränken – sind die Mengen Z und A Vektorräume von Funktionen oder Distributionen f. Die Variable eines Signals ist häufig die Zeit. Betrachtet man kontinuierliche Parameter, so spricht man auch von analogen Signalen f . Ist der Parameter diskret, so nennt man f ein diskretes Signal. Die Werte der Signale, im diskreten mathematischen Modell nachfolgend die Koeffizienten einer Impulsfolge, werden als reelle oder komplexe Zahlen vorausgesetzt. Wird auch der Koeffizientenbereich diskreter Signale diskretisiert – wie etwa in technischen Abtastsystemen der digitalen Nachrichtenübertragung – so spricht man von digitalen Signalen. Wir gehen auf Auswirkungen der Quantisierung, d.h. der Näherung reeller oder komplexer Werte durch diskrete Werte nicht ein, sondern verweisen hierzu auf die umfangreiche Literatur zur digitalen Signalverarbeitung. Außerdem beschränken wir uns im Folgenden auf den Fall eindimensionaler Parametermengen aus R oder aus der Menge aZ mit einem fest gewählten a > 0. Die Zahl 1/a steht dann für die Abtastfrequenz eines diskreten Systems.
274
10 Grundlagen über Lineare Filter
Bei kontinuierlichen Parametern verwenden wir folgende Signalräume für Z oder A: 1. D und D′ , die Räume der Testfunktionen und der Distributionen (vgl. Kapitel 7). 2. Dr′ , der Untervektorraum der Distributionen in D′ mit Träger in [r,∞[ und ′ DR der Raum der kausalen Distributionen: [ ′ = DR Dr′ . r∈R
3. Dp′ , der Raum der p-periodischen Distributionen. 4. S und S ′ , die Räume der schnell fallenden Testfunktionen und der temperierten Distributionen, die wir mit der Fouriertransformation in Kapitel 9 eingeführt haben. 5. Sr′ , der Raum der temperierten Distributionen in S ′ mit Träger in [r,∞[, r ∈ R, und ′ SR der Raum der kausalen temperierten Distributionen: [ ′ SR = Sr′ . r∈R
6. E ′ , der Raum der Distributionen mit beschränktem Träger. ′ 7. OC , der Raum der schnell fallenden Distributionen. Eine Distribution T gehört genau ′ dann zu OC , wenn ihre Fouriertransformierte Tb ein Multiplikator in S ′ ist. (Man vgl. hierzu S. 245, S. 253, S. 255 und das Beispiel auf S. 257.)
8. Lp (R) (1 ≤ p < ∞) und L∞ (R), die Räume der p-fach integrierbaren und der messbaren, wesentlich beschränkten Funktionen auf R (vgl. Anhang B, S. 411). Sie können als Teilräume von S ′ aufgefasst werden. Bis auf Dr′ und Sr′ besitzen alle diese Räume die Eigenschaft, dass zu jedem Element f auch jedes zeitlich verschobene Element fτ (vgl. S. 154) mit einer Translation τ (t) = t+t0 (t,t0 ∈ R) wieder im jeweils selben Signalraum enthalten ist. Für Dr′ und Sr′ gilt dies nur für Translationen nach rechts. Für Aussagen über die Stetigkeit von Operatoren auf diesen Signalräumen benötigt man Voraussetzungen über die Konvergenz, mathematisch gesprochen über die Topologie in diesen Räumen. Wir verwenden für die Räume D′ , E ′ und S ′ und ihre Unterräume die bereits eingeführten Konvergenzbegriffe von S. 150, S. 168 und S. 246. Für die Konvergenz ′ ′ einer Folge Tn → T für n → ∞ in DR resp. SR verlangen wir zusätzlich zur Bedingung hTn ,ϕi → hT,ϕi für alle ϕ in D resp. S, dass alle Tn und T für geeignetes r ∈ R zu Dr′ ′ ′ resp. Sr′ gehören. Genauer gesagt, DR und SR sollen die sogenannte Topologie des induk′ ′ tiven Limes der Räume Dr resp. Sr haben. Die Bedeutung dieser Topologie tritt später in einem Beispiel auf S. 278 deutlich hervor. Die Konvergenz in den Räumen Lp und L∞ ist die übliche Normkonvergenz in diesen Räumen mit den in Anhang B, S. 420 angegebenen Normen, die wir mit k.kp und k.k∞ bezeichnen.
10.1 Signale
275
Bei diskreten Parametern verwenden wir folgende Signalräume für Z oder A: 1. X = {x =
+∞ X
n=−∞
xn δn | xn ∈ C }, der Raum der diskreten Signale.
Dabei bezeichnet δn das Dirac-Funktional δ(t − na). Die Schrittweite a > 0 ist dabei beliebig und ab jetzt fest gewählt. Alle im Folgenden angegebenen Signalräume sind als Unterräume von X mit derselben Schrittweite a aufzufassen. Der Raum X sei mit der von D′ induzierten Topologie versehen. Eine Folge (xN )N ∈N diskreter Signale +∞ +∞ X X xN = xN,n δn konvergiert in X genau dann gegen x = xn δn , wenn n=−∞
n=−∞
lim xN,n = xn für alle n ∈ Z gilt, d.h. wenn sie punktweise gegen x konvergiert.
N →∞
2. X ∩ Dk′ , der Raum der diskreten Signale in D′ mit Träger in [ka,∞[ für k ∈ Z, a ′ ′ wie oben, und X ∩ DR , der Raum der kausalen diskreten Signale mit der von DR induzierten Topologie. ′ 3. X ∩ S ′ , X ∩ Sk′ und X ∩ SR , die entsprechenden Räume der temperierten diskreten ′ Signale in S mit den entsprechend induzierten Konvergenzbegriffen.
4. X ∩ E ′ , der Raum der diskreten Signale mit endlichem Träger mit der E ′ -Konvergenz. ′ , der Raum der diskreten Signale mit schnell fallenden Koeffizienten. 5. X ∩ OC
6. ldp = {x ∈ X |
+∞ X
n=−∞
|xn |p < ∞ }, für 1 ≤ p < ∞ der Raum der diskreten Signale x
mit p-fach summierbaren Koeffizienten. Die Norm von x ist kxkp = (
+∞ X
n=−∞
7.
ld∞
|xn |p )1/p .
= {x ∈ X | sup |xn | < ∞ }, der Raum der diskreten Signale x mit beschränkten n∈Z
Koeffizienten. Die Norm von x mit Koeffizienten xn ist kxk∞ = sup{|xn | : n ∈ Z}. Bis auf X ∩ Dk′ und X ∩ Sk′ gehört auch bei diesen Signalräumen mit jedem Element x auch jede Translation xτ zum jeweils selben Raum. Die Translationen τ sind hier Abbildungen auf aZ der Gestalt τ (na) = (n − m)a, m ∈ Z. Eine Translation xτ von x ∈ X um ma nach rechts mit m ∈ N ist einfach die Faltung xτ = x ∗ δm von x mit δm . X ∩ Dk′ und X ∩ Sk′ enthalten mit jedem Element auch alle dessen Translationen nach ′ ′ rechts. Konvergenz einer Folge (xN ) gegen x in X ∩ DR resp. X ∩ SR bedeute neben der punktweisen Konvergenz wieder, dass alle xN und x für geeignetes k ∈ Z in einem Raum X ∩ Dk′ resp. X ∩ Sk′ liegen. Die Räume ldp (1 ≤ p ≤ ∞) lassen sich mit den jeweiligen Normen der Räume lp (Z) versehen (vgl. Anhang B, S. 421). Die Abbil+∞ X dung x = xk δk → (xk )k∈Z ist dann eine Isometrie zwischen ldp und lp (Z) und die k=−∞
Einbettungen der ldp -Räume in X sind stetig. Beispiele für Signale aus unterschiedlichen Signalräumen sehen wir in den nächsten Abschnitten.
276
10 Grundlagen über Lineare Filter
10.2 Translationsinvariante lineare Systeme Bei der folgenden Definition setzen wir über die Parametermenge I voraus, dass I = R oder I = aZ gilt. Die Definition bezieht sich dann gleichermaßen auf kontinuierliche und diskrete lineare Systeme. Die Signalräume Z und A seien Räume aus den Listen des vorangehenden Abschnitts gemäß dieser Unterscheidung der Parametermenge. Definition. 1. Ein System L: Z → A heißt linear, wenn L ein linearer Operator ist, d.h. wenn für f1 ,f2 ∈ Z und beliebige Konstanten c1 und c2 gilt L(c1 f1 + c2 f2 ) = c1 Lf1 + c2 Lf2 . 2. Es heißt translationsinvariant, wenn L für Translationen τ der Parametermenge I mit dem Translationsoperator Tτ auf D′ , definiert durch Tτ f = fτ , vertauscht werden kann, d.h., wenn für alle f ∈ Z und Lf = g gilt: L(Tτ f ) = Tτ (Lf ) = gτ . Ein verschobenes Eingangssignal hat dann ein entsprechend verschobenes Ausgangssignal zur Folge. 3. Das System heißt kausal oder realisierbar, wenn ein Ausgangssignal erst dann festzustellen ist, wenn ein Eingangssignal vorhanden ist, d.h. wenn für alle t0 ∈ I und alle f ∈ Z mit Träger in [t0 ,∞[ gilt, dass auch der Träger von Lf in [t0 ,∞[ liegt. Bemerkung. Stellt der (kontinuierliche oder diskrete) Parameter der Signale die Zeit dar, so spricht man auch von zeitinvarianten statt von translationsinvarianten linearen Systemen. Beispiele. 1. Beispiele für analoge zeitinvariante lineare Systeme sind etwa eine Verzögerungsleitung, beschrieben durch Lf (t) = f (t − t0 ), t0 > 0 , oder ein Differenzierglied, beschrieben durch Lf (t) = cf˙(t), c ∈ R. Beide Systeme sind kausal und man kann als Signalklassen Z und A die Distributionenräume D′ oder S ′ wählen. Andere Beispiele finden wir in Abschnitt 8.3, wo kausale zeitinvariante lineare Systeme durch lineare Differentialgleichungen mit konstanten Koeffizienten gegeben sind. Die zugehörigen Operatoren L sind in allen diesen Beispielen durch die Faltung mit der kausalen Impulsantwort gegeben. Jeweils zulässige Eingangssignale sind dabei alle Distributionen, die sich mit der Impulsantwort falten lassen, zum Beispiel alle kausalen Eingangssi′ ′ gnale f ∈ DR . Für A kann man dann A = DR , im Fall stabiler Systeme (vgl. später ′ S. 285) auch Z = A = SR wählen. 2. Gegeben sei eine asymptotisch stabile, lineare Differentialgleichung P (D)u = f . Dabei sei also P ein Polynom mit reellen konstanten Koeffizienten, dessen Nullstellen negative Realteile besitzen und D = d/ dt. Dp′ bezeichne den Raum der p-periodischen verallgemeinerten Fourierreihen.
10.3 Analoge lineare Filter, Stetigkeit und Kausalität
277
Das System L : Dp′ → Dp′ , bei dem jeder p-periodischen verallgemeinerten Fourier∞ ∞ X X reihe f (t) = ck ej2πkt/p die periodische Lösung L(f )(t) = hk ck ej2πkt/p k=−∞
k=−∞
mit hk = 1/P (2πkj/p) zugeordnet wird, ist ein analoges zeitinvariantes lineares System (vgl. S. 52 und S. 178).
3. (a) Der Operator L : X → X auf dem Raum X der diskreten Signale, Lx = y mit yn = xn−k (k ∈ Z) beschreibt ein diskretes translationsinvariantes lineares System. Ebenso eine Mittelbildung L: X → X auf dem Raum X der diskreten 1 1 1 1 δ0 + δ1 mit yn = xn + xn−1 . Signale, zum Beispiel Lx = y = x ∗ 2 2 2 2 (b) Ebenso sind alle diskreten rekursiven Systeme L : X → X , Lx = y mit yn =
N X
k=0
ak xn−k +
M X l=1
bl yn−l , (N ≥ 0, M ≥ 1, ak , bl ∈ R)
linear, translationsinvariant und kausal (vgl. auch S. 91), wenn dabei der Anfangsruhezustand vorausgesetzt wird, d.h. y = 0 für x = 0.
10.3 Analoge lineare Filter, Stetigkeit und Kausalität Allen im ersten Beispiel oben genannten analogen Systemen ist gemeinsam, dass sich der Operator L als Faltung mit der Impulsantwort h = Lδ darstellen lässt. Für f ∈ Z gilt Lf = L (f ∗ δ) = f ∗ Lδ = f ∗ h .
(10.1)
′ DR
′ SR
Die Operatoren L in diesen Beispielen mit den Signalräumen oder für Z und A sind mit der Faltung vertauschbar (vgl. S. 163) und jeweils auch stetig: Für n → ∞ gilt fn → f in Z =⇒ Lfn = fn ∗ h → f ∗ h = Lf in A
(10.2)
Zeitinvariante lineare Systeme mit diesen beiden Eigenschaften heißen lineare Filter. Damit ein lineares System L : Z → A ein lineares Filter ist, bedarf es also erstens der Faltungsdarstellung (10.1) und zweitens der Stetigkeitseigenschaft (10.2) bei geeignet gegebenen Signalräumen Z und A. Wenn man davon ausgeht, dass für die Praxis vielfach kausale Systeme und Signale mit „endlicher Vergangenheit“ eine Rolle spielen, d.h. Signale, deren Träger nach unten beschränkt sind, dann zeigt sich die globale Bedeutung linearer Filter an folgendem Satz, in dem wir Ergebnisse von L. Schwartz (1957), E. Albrecht und M. Neumann (1979) und M. Neumann (1980) zusammenfassen. In diesem Satz wird die obige mathematische Stetigkeitsforderung an L durch die in zahlreichen Anwendungen physikalisch begründete Kausalitätsbedingung für ein lineares System ersetzt. Der Raum Z der Eingangssignale ist ′ dabei der Vektorraum DR aller Distributionen auf R, deren Träger nach unten beschränkt ′ sind, oder der Raum E der Distributionen mit beschränktem Träger. Der Bildbereich von L ist der Vektorraum D′ aller Distributionen. Ein lineares System der Form Lf = f ∗ h ist genau dann kausal, wenn der Träger von h im Intervall [0,∞[ liegt.
278
10 Grundlagen über Lineare Filter
Satz über die automatische Stetigkeit kausaler zeitinvarianter linearer Systeme ′ Auf den Räumen Z = E ′ oder Z = DR ist jedes kausale zeitinvariante lineare System ′ L: Z → D automatisch stetig und wird dargestellt durch die Faltung mit der Impulsantwort h = Lδ, d.h. für jedes f ∈ Z ist Lf = f ∗ h.
Der Beweis dieses grundlegenden Resultats erfordert funktionalanalytische Methoden und kann hier nicht geführt werden. In den genannten Arbeiten von E. Albrecht und M. Neumann findet man weitere Varianten dieses Satzes auch für andere Signalräume. Der Satz zeigt, dass viele physikalisch relevante, realisierbare zeitinvariante lineare Systeme lineare Filter sind und die oben geforderte Stetigkeitseigenschaft (10.2) immer besitzen. Ihr Übertragungsverhalten kann damit näherungsweise durch messtechnische Erfassung der Impulsantwort empirisch bestimmt werden. Faltungsdarstellungen erhält man auch für lineare dissipative Mehrparameter-Systeme. An der Fragestellung interessierten Lesern seien etwa die Arbeiten von Y. Fourès, I. E. Segal (1955), H. König (1959), L. Hörmander (1960), M. M. Day (1961), G. Weiss (1991), die Lehrbücher von A. H. Zemanian (1995), V. S. Vladimirov (2002), J. R. Partington (2004) und V. Pohl, H. Boche (2010), sowie die dort zu findenden Quellen zum weiteren Studium genannt. Für die Stetigkeit sind dabei die schon auf S. 168 eingeführten Konvergenzbegriffe in E ′ ′ und DR entscheidend, anders gesagt die Topologie dieser Räume. Im folgenden Beispiel ′ geben wir ein kausales System wahlweise auf Z = DR oder Z = E ′ an, das durch einen Faltungsoperator definiert wird, jedoch nicht stetig ist, wenn man den gewählten Raum Z mit der D′ -Konvergenz, d.h. mit der von D′ induzierten gröberen Topologie versieht. Beispiel. Man betrachte L : Z → D′ , definiert durch Lf = f ∗ h mit h = ′ Z = DR oder Z = E ′ . Der Akkumulator L ist ein kausaler Faltungsoperator.
Für n ∈ N sei
∞ X
δn mit
n=0
fn = −δ−n + δ0 .
Dann gilt
D′ -lim fn = δ0 , n→∞
aber (man vergleiche auch nochmals das Beispiel auf S. 166) Lfn = −
−1 X
k=−n
δk und damit
D′ -lim Lfn n→∞
=−
−1 X
k=−∞
δk 6= Lδ0 = h.
′ Andererseits ist die Folge fn in den auf S. 168 definierten Topologien weder in DR noch in ′ E konvergent und L ist auf diesen Räumen mit diesen Topologien stetig nach dem vorangehenden Satz.
Bei konkret vorgegebenen Operatoren L, die in Anwendungen der Systemtheorie meist direkt als Faltungsoperatoren wie im letzten Beispiel definiert werden, lässt sich oft auch direkt zeigen, dass die nötige Stetigkeitseigenschaft vorliegt, auch wenn die zulässige Si′ gnalklasse Z nicht mit DR oder E ′ übereinstimmt. Diese Systeme sind dann ebenfalls lineare Filter, selbst wenn sie nicht der Kausalitätsbedingung genügen. Lineare Filter, d.h. stetige Faltungssysteme auf geeigneten Signalräumen studieren wir im Folgenden.
10.3 Analoge lineare Filter, Stetigkeit und Kausalität
279
Der Frequenzgang analoger linearer Filter Wir betrachten nun Faltungssysteme Lf = f ∗ h, für die h eine temperierte Distribution ist (vgl. S. 245). Ist zum Beispiel das System durch eine gewöhnliche Differentialgleichung wie in Abschnitt 8.2 beschrieben, dann ist seine kausale Grundlösung genau dann temperiert, wenn sie keine exponentiell wachsenden Anteile enthält (vgl. S. 51 und S. 181), wenn also keine Nullstelle des charakteristischen Polynoms einen positiven Realteil hat. Über die Eingangssignale f setzen wir voraus, dass die Faltungen f ∗ h existieren und dass der Faltungssatz f[ ∗ h = fb b h für die Fouriertransformierten gilt. Dies ist etwa der Fall, wenn die Signale f „zeitbegrenzte“ Distributionen sind, d.h. wenn sie beschränkte Träger besitzen, wenn f und h quadratisch integrierbare Funktionen sind (vgl. S. 254) oder wenn f zu S ′ gehört und b h ein Multiplikator in S ′ ist (vgl. S. 245). Aus der Stetigkeit der Fouriertransformation auf den zugehörigen Signalräumen und dem Faltungssatz folgt dann unmittelbar die Stetigkeit der betrachteten Faltungsoperatoren Lf = f ∗ h. Definition. Bei einem linearen Filter Lf = f ∗ h, das die obigen Voraussetzungen erfüllt, bezeichnet man die Fouriertransformierte b h als den Frequenzgang des Filters.
Gehört der δ-Impuls zum Raum Z der Eingangssignale, dann ist der Frequenzgang die Fouriertransformierte der Impulsantwort Lδ = h. Das Übertragungsverhalten des Systems lässt sich nun schematisch folgendermaßen beschreiben: Zeitbereich
f ∗ h(t)
f (t) h(t)
Frequenzbereich
fb(ω)
f[ ∗ h(ω) = fb(ω)b h(ω)
b h(ω)
Mit der Fourierschen Umkehrtransformation F −1 fb b h von f[ ∗ h ergibt sich die Systemantwort im Zeitbereich durch die Gleichung h . (10.3) f ∗ h = F −1 fb b
Eine anschauliche Interpretation dieser Formel, die als Gleichung zwischen temperierten Distributionen zu lesen ist, erhält man, wenn man speziellere Bedingungen an h und f voraussetzt. Ist etwa f ein stückweise stetig differenzierbares, zeitbegrenztes Signal und ist mit h auch |h|2 eine integrierbare Funktion, dann ist das Ausgangssignal f ∗ h stetig, integrierbar und besitzt eine integrierbare Fouriertransformierte (vgl. S. 254). Der Jordansche Umkehrsatz von S. 266 und der Faltungssatz ergeben dann die punktweise Darstellung der Systemantwort f ∗ h auf die Eingangsgröße f : 1 f ∗ h(t) = 2π
+∞ +∞ ˆ ˆ 1 jωt [ fb(ω)b h(ω) e jωt dω. f ∗ h(ω) e dω = 2π
−∞
−∞
(10.4)
280 1 Das Eingangssignal f (t) = 2π
10 Grundlagen über Lineare Filter +∞ ˆ fb(ω) e jωt dω ist eine Superposition harmonischer
−∞
Schwingungen, deren Amplituden und Phasen in Abhängigkeit von der Frequenz durch die Spektralfunktion fb(ω) ausgedrückt werden. Die Amplituden |fb(ω)| der beteiligten Schwinb gungen werden bei der Übertragung mit dem Faktor |h(ω)| verstärkt oder abgeschwächt, b b die Phasen arg f (ω) additiv um die Phasen arg h(ω) verändert. Der Frequenzgang
b h enthält die Information über Amplituden- und Phasenänderungen bei der Übertragung von f . Er gibt daher entscheidende Informationen für die Analyse und den Entwurf linearer Übertragungssysteme, deren Eigenschaften damit spezifiert werden können. Man erkennt wegen δb = 1 und f ∗ δ = f , dass die Darstellung (10.4) auch noch gilt, wenn h zusätzliche δ-Anteile enthält. Beispiele, die den oben gestellten speziellen Voraussetzungen genügen, findet man in den Abschnitten 5.2 und 8.3. Für allgemeinere Situationen, etwa wenn h auch Ableitungen δ˙ von δ enthält, erfordert die punktweise Darstellung (10.4) zusätzliche Differenzierbarkeitseigenschaften von f . Das Wachstum von b h(ω) kann dann bei entsprechend glatten Eingangssignalen f durch hinreichend schnelles Abfallen von |fb(ω)| für |ω| → ∞ kompensiert werden, so dass das Produkt fb b h eine integrierbare Funktion ergibt und die Darstellung (10.4) gültig bleibt. Immer gültig ist für zeitbegrenzte Distributionen f und temperierte Distributionen h ohne weitere Voraussetzungen – und das ist der Vorteil der distributionellen Methode – die etwas abstraktere Distributionengleichung (10.3). Insbesondere erkennen wir, dass bei der Filterung eines Signals f keine neuen Frequenzen erzeugt werden: Wenn fb(ω) = 0 ist, dann ist auch fbb h(ω) = 0. Definition. Bei einem Filter mit einem stückweise differenzierbaren Frequenzgang b h(ω) = b |b h(ω)| ej arg(h(ω)) bezeichnen wir die Funktion A(ω) = |b h(ω)| als Amplitudengang. Die Funktion Φ(ω) = arg(b h(ω)) wird als Phasengang bezeichnet. Die fast überall definierte Funktion D(ω) = − dΦ(ω) / dω wird Phasenverzögerung oder Gruppenlaufzeit genannt. Bei einer frequenzabhängigen Gruppenlaufzeit werden Signale großer Bandbreite durch das Filter mit entsprechend starken Phasenänderungen übertragen. Beispielsweise liegen Gruppenlaufzeitänderungen von etwa 1 - 3 ms bei Signalen in Audiosystemen bereits wahrnehmbar über der Hörbarkeitsschwelle und erfordern in High-Fidelity-Komponenten eine Phasenentzerrung. Zur Veranschaulichung von regulären Frequenzgängen kann man den Amplitudengang, den Phasengang oder die Phasenverzögerung getrennt graphisch darstellen. Aus Symmetriegründen genügt dabei die Darstellung über der Halbachse ω ≥ 0 (man vgl. nochmals S. 230). In der Elektrotechnik wird vielfach auch die Darstellung des Frequenzgangs als vom Parameter ω abhängige Ortskurve in der komplexen Ebene verwendet. Signale f in diesem Anwendungsgebiet sind häufig zeitabhängige Spannungsverläufe. Beispiele. 1. Differenzierglied. Der Frequenzgang b h des idealen Differenziergliedes, betrachtet als ˙ Filter auf S ′ mit der kausalen Impulsantwort aδ(t), ist nach der Differentiationsregel b der Fouriertransformation gegeben durch h(ω) = jωa. Dies zeigt, dass der Differentiator sehr empfindlich gegen hochfrequente Störungen im Eingangssignal ist. Sie
10.3 Analoge lineare Filter, Stetigkeit und Kausalität
281
werden mit dem Faktor ωa verstärkt. Für ein zeitbegrenztes, zweimal stetig differenzierbares Eingangssignal f folgt mit der Jordanschen Umkehrformel von S. 266 f ∗ h(t) = af˙(t) =
1 2π
+∞ +∞ ˆ ˆ a jωafb(ω) e jωt dω = fb˙(ω) e jωt dω. 2π
−∞
−∞
Eine näherungsweise Realisierung als elektrotechnische Schaltung haben wir bereits auf S. 129 kennen gelernt. Will man ein System, das als Differenzierglied für Signalanteile mit niedrigen Frequenzen wirkt und hochfrequente Signalanteile stark dämpft, dann kann man als Frequenzgang etwa b hb (ω) =
jωa (1 + jbω)2
mit b > 0 wählen. Amplituden- und Phasenänderungen bei der Übertragung entsprechen bis zur Kreisfrequenz ω = 1/b etwa denjenigen des idealen Differenziergliedes. Oberhalb dieser Kreisfrequenz fällt die Amplitude auf Null ab, die Phase wechselt von π/2 zu −π/2 . Die Impulsantwort dieses näherungsweisen Differenziergliedes ist (Übung) a(1 − t/b) −t/b e hb (t) = s(t) b2 mit der Einheitssprungfunktion s(t). Das System ist kausal. 2. Integrator.
Ein idealer Integrator ist ein lineares System L, das mit einer reellen ˆt Konstante K definiert ist durch Lf (t) = K f (x) dx . −∞
f (t)
K
ˆ
Lf (t)
Seine Sprungantwort auf die Einheitssprungfunktion s(t) ist a(t) = Kts(t), seine ImK pulsantwort a(t) ˙ = Ks(t). Sein Frequenzgang lautet b h(ω) = + Kπδ(ω). jω Dabei bezeichnet 1/ω kurz den Cauchy-Hauptwert vp(ω −1 ) (vgl S. 138). Wählt man den Raum S oder die Menge der integrierbaren Funktionen mit beschränktem Träger als Eingangssignalklasse Z, dann gilt der Faltungssatz für die Fouriertransformation. Integrierglieder sind kausale lineare Systeme. Sie können ähnlich wie Differenzierglieder (vgl. S. 129) zum Beispiel durch geeignet beschaltete Operationsverstärker in elektrischen Schaltungen näherungsweise realisiert werden. 3. Ideales Tiefpassfilter. Wird der Amplitudengang |b h(ω)| eines Filters klein, sobald |ω| eine Kreisfrequenz ωg > 0 übersteigt, dann spricht man von einem Tiefpassfilter. Die Kreisfrequenz ωg wird als Grenzkreisfrequenz bezeichnet, das Intervall ]−ωg ,ωg [ als
282
10 Grundlagen über Lineare Filter Durchlassbereich, sein Komplement als Sperrbereich. Tiefpassfilter spielen eine bedeutende Rolle in der Nachrichtentechnik. Wir werden in Abschnitt 11.1 sehen, dass man sie etwa zur Rekonstruktion eines kontinuierlichen Signals aus geeigneten Abtastwerten verwenden kann. Das ideale Tiefpassfilter, auch Küpfmüller-Tiefpass genannt, wirkt im Durchlassbereich verzerrungsfrei, d.h. seine Antwort Lf auf ein Eingangssignal f ist von derselben Form wie f , eventuell jedoch zeitverzögert. Es ist definiert durch Lf (t) = A0 f (t − t0 ) (A0 > 0 , t0 > 0)
für alle f mit Tr(fb) ⊂ ]−ωg ,ωg [ . Anteile eines Signals f mit Kreisfrequenzen ω, |ω| ≥ ωg , werden abgeschnitten. Der Frequenzgang ist daher b h(ω) = A0 e−jωt0 rωg (ω),
wobei rωg (ω) = 1 für |ω| < ωg , rωg (ω) = 0 für ω ≥ ωg .
Wählt man als Eingangssignalraum Z den Raum der quadratisch integrierbaren Funktionen L2 (R) oder den Raum E ′ der zeitbegrenzten Distributionen, dann gilt der Faltungssatz für die Fouriertransformation. Für ein zeitbegrenztes Eingangssignal f ist fb eine unendlich oft differenzierbare Funktion (vgl. S. 256), und Anwendung von f ∗ h auf eine Testfunktion ϕ ∈ S zeigt hf ∗ h,ϕi = hfb b h,F
−1
A0 ϕi = 2π
+∞ +ω ˆ ˆ g −∞ −ωg
Also ist A0 f ∗ h(t + t0 ) = 2π
+ω ˆ g −ωg
fb(ω) e jω(t−t0 ) dω ϕ(t) dt.
fb(ω) e jωt dω.
Man erkennt an dieser Darstellung der Systemantwort im Zeitbereich neben der Zeitverzögerung um t0 und der Bandbegrenzung im Frequenzbereich auch, dass das Ausgangssignal f ∗ h eine unendlich oft differenzierbare Funktion ist. Wie irregulär f auch immer ist, durch Bandbegrenzung entsteht ein geglättetes Signal, welches allerdings nicht mehr zeitbegrenzt ist. A0 −ωg
|b h(ω)| ωg
A0 ωg /π ω
t0 t0 + π ωg
h(t) t
Das ideale Tiefpassfilter ist nicht kausal und mithin durch keine elektrotechnische Schaltung als Übertragungssystem realisierbar. Das Filter, auf E ′ betrachtet, hat die Impulsantwort A0 sin ωg (t − t0 ) . h(t) = π(t − t0 )
10.3 Analoge lineare Filter, Stetigkeit und Kausalität
283
Sie wäre auf einen anregenden Impuls zur Zeit t = 0 schon in jedem davor liegenden Zeitabschnitt vorhanden. Trotz der Nichtkausalität ist der Küpfmüller-Tiefpass wegen seiner einfachen Gestalt in vielen theoretischen Untersuchungen und auch beim Entwurf praktischer Übertragungssysteme von großem Nutzen. In der Praxis sucht man dann Filter, die realisierbar und stabil sind und näherungsweise gleichen Frequenzgang besitzen. Stabilität bedeutet dabei, dass ein amplitudenbeschränktes Eingangssignal auch ein amplitudenbeschränktes Ausgangssignal zur Folge hat. Will man lineare Filter mit kausaler Impulsantwort durch Vorgabe ihres Frequenzgangs konstruieren, so ist zu beachten, dass dessen Real- und Imaginärteil, anders gesagt Amplitudenverzerrung und Phasenverzerrung nicht unabhängig voneinander gewählt werden können (vgl. S. 231). Es gibt Kriterien, die angeben, zu welchen Frequenzgängen es realisierbare, d.h. kausale Filter gibt. Zu nennen sind hier die Sätze von R. Paley und N. Wiener und die Hilberttransformation. Referenzen zu diesem Themenbereich sind R. Paley, N. Wiener (1934), H. Dym, H. P. McKean (1985), A. Papoulis (1987), E. M. Stein, G. Weiss (1971), J. N. Pandey (1995), R. S. Pathak (1997) oder V. Pohl, H. Boche (2010). Wir gehen auf diesen Problemkreis mathematisch nicht weiter ein, sondern zeigen stattdessen im nachfolgenden Beispiel, wie man realisierbare, stabile Näherungsfilter mit einem rationalen Frequenzgang konstruieren kann. 4. Butterworth-Tiefpassfilter. Realisierbare, stabile Tiefpassfilter für Signale aus L∞ (R) oder allgemeiner aus S ′ ergeben sich mit der prinzipiellen Entwurfsmethode als Frequenzgang b h eine rationale Funktion b h(ω) =
K P (jω)
anzusetzen, wobei K eine reelle Konstante und P ein Polynom vom Grad n mit reellen positiven Koeffizienten ist, dessen Nullstellen negative Realteile besitzen: P (jω) = (jω)n + an−1 (jω)n−1 + . . . + a1 (jω) + a0 . Die Konstante K, die Ordnung n des Filters und die Koeffizienten a0 , . . . ,an−1 sind so zu bestimmen, dass das Filter den im Einzelfall gewünschten Anforderungen an Verstärkung, Durchlass– und Stoppbereich entspricht. Beispielsweise soll |b h(ω)| im schraffierten Bereich verlaufen, d.h. dem folgendem Toleranzschema genügen. Da |b h| gerade ist, genügt es, die Halbachse ω ≥ 0 zu betrachten. |b h(ω)|
|K| c1 h c2 h
Passband Übergangsbereich Stoppband 0
ω1
ω2
ω
284
10 Grundlagen über Lineare Filter Die Realisierbarkeit ergibt sich aus der Tatsache, dass ein Filter mit einem rationalen Frequenzgang b h(ω) = K/P (jω) durch eine Differentialgleichung der Form u(n) + an−1 u(n−1) + . . . + a1 u˙ + a0 u = Kf
beschrieben werden kann. Diese Gleichung hat eine eindeutige kausale Grundlösung und eindeutige kausale Lösungen u für rechte Seiten f mit Tr (f ) ⊂ [0,∞[ (man vgl. Abschnitt 8.2). Das zugehörige kausale System ist durch Lf = f ∗ h = u gegeben. Einsetzen der kausalen Grundlösung h und Fouriertransformation der Differentialgleichung ergibt: n n−1 \ (n) + a (n−1) + . . . + a b + . . . + a0 )b h = K δb = K. hd n−1 h 0 h = ((jω) + an−1 (jω)
Die kausale Grundlösung h der Differentialgleichung hat genau dann die Fouriertransformierte b h(ω) = K/P (jω), wenn alle Nullstellen von P negative Realteile besitzen (vgl. auch S. 253). Da dann die reguläre Distribution b h zum Raum OM der Multiplikatoren in S ′ gehört, gilt der Faltungssatz für die Fouriertransformation (vgl. S. 245 und S. 254). Für eine rechte Seite Kf mit Tr (f ) ⊂ [0,∞[ substituieren wir nun v˙ 0 = u(n) + an−1 u(n−1) + . . . + a1 u˙ = Kf − a0 u und betrachten v0 als kausale Antwort des Systems v˙ 0 = g auf die Eingangsgröße g = Kf − a0 u. Durch Integration folgt v0 = u(n−1) + an−1 u(n−2) + . . . + a2 u˙ + a1 u. Wegen Tr (v0 ) ⊂ [0,∞[ tritt keine Integrationskonstante auf. Mit weiteren Substitutionen erhält man folgendes Differentialgleichungssystem erster Ordnung: v˙ 0 = Kf − a0 u , v˙ k = vk−1 − ak u für 1 ≤ k ≤ n − 1, u = vn−1 . Dieses System mit den „Zustandsgrößen“ v0 , . . . ,vn−1 lässt sich als elektrotechnische Schaltung mit Proportionalgliedern, Addierern und Integratoren nachbilden (man vgl. auch S. 194). Referenzen zu Realisierungen in der Schaltungstechnik findet man am Ende des Abschnitts. Die Schaltung wird beschrieben durch das folgende Signalflussdiagramm: f
❩ K❩ ✚ ✚
+
v˙ 0
✡❏ ✡−a0❏
ˆ
v0
+
v˙ 1
✡❏ ✡−a1❏
ˆ
v1
+
···
✡❏ ✡−a2❏
+
v˙ n−1
✡❏ 1 ✡−an−❏ ···
ˆ
vn−1 = u
u
10.3 Analoge lineare Filter, Stetigkeit und Kausalität
285
Die Stabilität des Systems kann man dadurch charakterisieren, dass seine Impulsantwort h eine integrierbare Funktion ist. Für ein Signal f , dessen Amplituden beschränkt sind mit |f (t)| ≤ M (t ∈ R), ist dann auch die Filterantwort f ∗ h beschränkt mit +∞ ˆ |f ∗ h(t)| ≤ M |h(t)| dt, d.h. das Filter ist stabil. Integrierbarkeit von h bedeu−∞
tet, dass die Nullstellen des charakteristischen Polynoms P der Differentialgleichung negative Realteile haben müssen, da andernfalls Anteile der Form αtm eβt s(t) mit ℜ(β) ≥ 0, m ∈ N0 , α ∈ R in der Impulsantwort vorhanden wären. Diese Anteile wären nicht integrierbar. Diese im Ansatz bereits vorausgesetzte Eigenschaft der Nullstellen von P sichert also die gewünschte Stabilität. Weil das Polynom P laut Ansatz reelle Koeffizienten hat, ist |b h(ω)|2 =
K2 P (jω)P (−jω)
und die Lage der Nullstellen des Polynoms Q(z) = P (z)P (−z) zeigt in der komplexen Ebene eine Symmetrie zur reellen und auch zur imaginären Achse. Umgekehrt ergeben vorgegebene Nullstellen z1 , . . . ,z2n (alle zk 6= 0), die diese doppelte Symmetrie aufweisen, ein Polynom Q, das sich in der Form Q(z) = P (z)P (−z) faktorisieren lässt, wobei P positive reelle Koeffizienten hat und alle Nullstellen von P negative Realteile besitzen. Entsprechend ist dann b h(ω) = K/P (jω) der Frequenzgang eines realisierbaren stabilen Filters. Beim Butterworth-Tiefpass soll die Funktion |b h|2 für ω ≥ 0 unterhalb der Grenzkreisfrequenz ωg > 0 möglichst lange horizontal verlaufen. Da dort ω/ωg < 1 ist, wird diese Forderung am besten erfüllt, wenn |b h|2 nur von der höchsten Potenz von ω/ωg abhängt. Für ω/ωg < 1 liefern nämlich die niedrigen Potenzen von ω/ωg große Beiträge zum Nenner von |b h|2 , bewirken also einen Abfall der Verstärkung. Mit Substitution des Parameters jω durch die komplexe Variable z setzt man daher für das ButterworthTiefpassfilter, benannt nach S. Butterworth (1930), an z 2n . Q(z) = P (z)P (−z) = 1 + jωg Die Ordnung n und ωg müssen aus den Anforderungen an das Filter bestimmt werden. Zur Bestimmung der Koeffizienten von P betrachten wir die Nullstellen von Q. Sie lauten bei gegebener Ordnung n des Filters und gegebener Grenzfrequenz ωg zk = jωg ej(2k+1)π/(2n)
(k = 0, . . . ,2n − 1).
Die Nullstellen mit negativem Realteil sind die zk mit k = 0, . . . ,n − 1. Da P nach Voraussetzung positive Koeffizienten haben soll (gleiche Vorzeichen sind notwendig für Stabilität), folgt aus dem Ansatz P (0) = Q(0) = 1. Mit (−z0 )(−z1 ) · · · (−zn−1 ) = ωgn und Q(jω) = 1 + (ω/ωg )2n ergibt sich b h(ω) =
Kωgn (jω − z0 )(jω − z1 ) · · · (jω − zn−1 )
|K| . und |b h(ω)| = p 1 + (ω/ωg )2n
286
10 Grundlagen über Lineare Filter Um ein Beispiel mit konkreten Anforderungen an das Filter zu geben, verlangen wir etwa folgende Werte: Gleichspannungsverstärkung K = 1, Passband-Ecke ω1 /(2π) = 3 kHz, minimale Passband-Verstärkung b h1 = 0.9, Stoppband-Ecke ω2 /(2π) = 10 kHz, b maximale Stoppbandverstärkung h2 = 0.1. Die benötigte Ordnung n des Filters resultiert mit |b h(ω)|2 = K 2 /(1 + (ω/ωg )2n ) 2n 2 b2 2n aus (ω1 /ωg ) ≤ K /h1 − 1 = α1 und (ω2 /ωg ) ≥ K 2 /b h22 − 1 = α2 : Für n 2n muss gelten n ≥ ln(α1 /α2 )/(2 ln(ω1 /ω2 )). Aus (ω1 /ωg ) ≤ α1 , (ω2 /ωg )2n ≥ α2 ergibt sich, dass ωg im Intervall [ω1 e− ln(a1 )/(2n) , ω2 e− ln(a2 )/(2n) ] liegen muss. Es ist üblich, für ωg das geometrische Mittel der Intervallgrenzen zu wählen, um auch bei leichten Schwankungen von Filterparametern, z.B. von Kapazitäten der realisierenden Schaltung, die Filteranforderungen einzuhalten. Mit den vorliegenden Daten des Beispiels genügen n = 3, ωg /(2π) = 4.2 kHz, z0 ,z1 ,z2 die Nullstellen von Q mit negativen Realteilen wie auf S. 285 angegeben, und damit b h(ω) =
1 (1 + jω/ωg )(1 + jω/ωg − (ω/ωg )2 )
den Anforderungen an das Filter. Die zugehörige Impulsantwort findet man auf S. 195. d arg(b h(ω)) = Eine grafische Darstellung von |b h| und der Gruppenlaufzeit D(ω) = − dω n−1 X − ℜ(zk )/(ℜ(zk )2 +(ω−ℑ(zk ))2 ) zeigt, dass das Filter für annähernd verzerrungsk=0
freie Übertragung im Bereich bis etwa ωg /2, d.h. bis zu einer Frequenz von ca. 2.1 kHz geeignet ist. In diesem Bereich stimmt das Filter sehr gut mit einem idealen Tiefpass überein. Verzögerung (engl. delay) − arg(b h(ω))/ω und Gruppenlaufzeit (engl. group delay) des Filters sind stets kleiner als 0.11 ms, die Dämpfung bei ωg beträgt gemäß Entwurf mit K = 1 ca. 3 dB (−20 log10 (|b h(ωg )|) = 10 log10 (2), bei Volt-Input mit Referenzamplitude 1 V). Butterworth-Filter (als Analog-Filter oder in diskreter Variante, vgl. S. 321) finden vielfach Verwendung in Audio-High-Fidelity-Systemen oder in der Kommunikationstechnik in WLAN-Empfängern u.v.a.m. 3 1 2 0.5
1
0
0 0
1 2 |b h(λωg )|, λ ∈ [0,2]
0
1 2 ωg D(λωg ), λ ∈ [0,2]
Auf analoge Weise werden zum Beispiel auch Tschebyscheff-Tiefpässe konstruiert. Für deren Frequenzgang fordert man K . |b h(ω)| = p 2 1 + ε Tn2 (ω/ωg )
10.4 Analoge Filter mit rationalen Frequenzgängen
287
Dabei sind Tn , n ∈ N, die Tschebyscheff-Polynome von S. 86. Die Konstanten K, ε und die Filterordnung n sind nach Dämpfungsvorgaben für das Filter zu bestimmen. Tschebyscheff-Tiefpässe sind wegen der Nullstellen der Tschebyscheff-Polynome im Passband welliger als Butterworth-Filter, dämpfen dafür im Komplement bei gleicher Ordnung stärker ab (vgl. S. 90 - 91), haben allerdings größere und stärker frequenzabhängige Verzögerungen. Alle Details zum Entwurf solcher Filter für einen vorgegebenen Dämpfungsplan findet man in der Aufgabe A26 von Kapitel 5 auf S. 105.
10.4 Analoge Filter mit rationalen Frequenzgängen Eine große Klasse typischer linearer Übertragungsglieder lässt sich analog zum ButterworthFilter beschreiben durch Differentialgleichungen der Form u(m) + αm−1 u(m−1) + . . . + α0 u = βn f (n) + βn−1 f (n−1) + . . . β0 f mit reellen Koeffizienten α0 ,α1 , . . . ,αm−1 , αm = 1 und β0 , . . . ,βn−1 , βn 6= 0 (siehe etwa n m X X βk z k und dem αk z k , Q(z) = O. Föllinger (2008)). Mit den Polynomen P (z) = k=0
k=0
d notiert man die Differentialgleichung kurz durch Differentialoperator D = dt P (D)u = Q(D)f.
Wählt man eine Signalklasse Z mit Eingangssignalen f , die sich mit der kausalen Lösung ′ h von P (D)h = Q(D)δ falten lassen, etwa Z = SR , dann ist durch Lf = f ∗ h ein kausales zeitinvariantes System gegeben, das als analoges Filter bezeichnet wird. Dabei fassen wir Q(jω)/P (jω) als Pseudofunktion in S ′ auf (vgl. S. 253). Solche Filter sind in der Elektrotechnik in zahllosen Anwendungen realisiert und heute in Massenprodukten als billige Bauteile weit verbreitet. In der Folge werden Frequenzgang, Stabilität und Realisierbarkeit diskutiert und einige Standard-Beispiele vorgestellt. Gemeinsame Linearfaktoren der Polynome P und Q Es gelte P (z) =
m Y
k=1
(z − zk ) und Q(z) = βn
n Y
(z − bk ). Besitzen P und Q einen
k=1
e gegeben durch gemeinsamen Linearfaktor (z − z1 ) = (z − b1 ), dann seien Pe und Q m n Y Y e Pe (z) = (z −zk ) und Q(z) = βn (z −bk ). Man erkennt, dass die kausalen Lösungen k=2
k=2
e von P (D)u = Q(D)f und Pe(D)u = Q(D)f übereinstimmen. Gemeinsame Linearfaktoren von P und Q haben bei verschwindenden Anfangswerten also keinen Einfluss auf die Lösung des beschriebenen Systems, mithin auch nicht auf die im Anschluss diskutierten Frequenzgang- und Stabilitätseigenschaften des Systems. Wir setzen daher im Folgenden voraus, dass P und Q keine gemeinsamen Linearfaktoren besitzen.
288
10 Grundlagen über Lineare Filter
Frequenzgang und Übertragungsfunktion des kausalen Systems Das beschriebene kausale System hat genau dann einen Frequenzgang b h(ω), wenn seine Impulsantwort h(t) eine temperierte Distribution ist, d.h. wenn alle Nullstellen des charakteristischen Polynoms P Realteile r ≤ 0 besitzen. Für h ∈ S ′ ist b h(ω) = F (Q(D)g)(ω) =
n X
k=0
βk (jω)k gb(ω)
mit der kausalen Grundlösung g der Differentialgleichung P (D)g = δ. Für b h ∈ S ′ zeigt die Fouriertransformation der Differentialgleichung P (D)h = Q(D)δ, dass P (jω)b h(ω) = Q(jω).
Besitzt P Nullstellen mit Realteilen r = 0, dann ist 1/P (jω) kein Multiplikator in S ′ , der Faltungssatz für die Fouriertransformation gilt dann im Allgemeinen nicht mehr und Q(jω)/P (jω) ist dann nicht der Frequenzgang des beschriebenen kausalen Systems. Zwar ist F −1 (1/P (jω)) durchaus eine Grundlösung von P (D)g = δ, jedoch ist diese dann nicht kausal (vgl. S. 253) und man kann diese Grundlösung nicht mehr mit beliebigen kausalen rechten Seiten der Differentialgleichung falten. Anders gesagt, man kann dann die Glei′ ) nach b h(ω) chung P (jω)b h(ω) = Q(jω) nicht durch Multiplikation mit 1/P (jω) in F (SR auflösen. Haben die Nullstellen von P Realteile r < 0, dann ist 1/P (jω) ein Multiplikator in S ′ , die Impulsantwort F −1 (Q(jω)/P (jω)) ist eine schnell fallende kausale Distribution (vgl. S. 253), der Faltungssatz gilt für beliebige temperierte Störungen f und der Frequenzgang des Systems ist Q(jω) b . h(ω) = P (jω)
Die Funktion H(z) = Q(z)/P (z) nennt man die Übertragungsfunktion des Systems. Beispiele.
1. Die Differentialgleichung u˙ = Kf beschreibt einen Integrator (vgl. S. 281) mit Übertragungsfunktion H(z) = K/z. Sein Frequenzgang ist aber nicht K/(jω), sondern b h(ω) = au(3) + bu˙ = f beschreibt mit a, b > 0, pK/(jω) + Kπδ(ω). Die Gleichung ′ ω0 = b/a ein kausales Filter auf SR mit Impulsantwort h(t) = s(t)(1−cos(ω0 t))/b. Das charakteristische Polynom hat die Nullstellen λ1 = 0, λ2,3 = ±jω0 . Die Übertragungsfunktion lautet H(z) = 1/P (z) = 1/(az 3 + bz), der Frequenzgang aber ist (dies nachzurechnen sei hier Lesern als gute Übung aufgegeben; vgl. S. 247 und 253): b h(ω) =
π π 1 1 + δ(ω) − [δ(ω − ω0 ) + δ(ω + ω0 )] 6= . (jω)3 a + jωb b 2b P (jω)
Der Faltungssatz gilt nicht, wenn f zum Beispiel die Funktion f (t) = U0 s(t) ist. 2. Das kausale Filter zur Differentialgleichung u˙ − au = af kann durch einen Addierer, einen Integrator und ein Proportionalglied realisiert werden (vgl. S. 284). Es hat die Übertragungsfunktion H(z) = a/(z − a) und für positive a ∈ R die Impulsantwort
10.4 Analoge Filter mit rationalen Frequenzgängen
289
h(t) = a eat s(t). Sie ist nicht temperiert, das System ist instabil (siehe unten) und es besitzt keinen Frequenzgang, der nach Definition zu S ′ gehören sollte. a hat für a > 0 die Impulsantwort Das Filter mit dem Frequenzgang jω − a und ist nicht kausal.
e h(t) = −a eat s(−t)
Diese Beispiele zeigen, dass die Gleichung b h(ω) = H(jω) für den Frequenzgang eines Systems der Form P (D)u = Q(D)f nur dann richtig ist, wenn alle Pole von H negative Realteile besitzen.
Stabilität des kausalen Systems Ein kausales zeitinvariantes lineares System der Form P (D)u = Q(D)f wird als stabil bezeichnet, wenn ein beschränktes Eingangssignal ein beschränktes Ausgangssignal zur Folge hat (BIBO-stabil, „bounded input bounded output“). Für Polynome P und Q ohne gemeinsame Linearfaktoren ist das System sicher instabil, wenn P Nullstellen mit positiven Realteilen hat. Es ist auch instabil, wenn P Nullstellen auf der imaginären Achse besitzt. Für eine Nullstelle im Nullpunkt betrachte man zum Beispiel f (t) = s(t) als Eingangssignal. Für Nullstellen der Form ±jb, b > 0, betrachte man etwa f (t) = cos(bt)s(t) als Eingangssignal: Die Faltung mit dem zum Nullstellenpaar ±jb gehörigen Anteil (c1 cos(bt) + c2 sin(bt))s(t) der Impulsantwort ist für t → ∞ unbeschränkt (c1 , c2 geeignet). Wir setzen nun voraus, dass alle Nullstellen von P negative Realteile haben. Dann zeigen die vorangehenden Überlegungen, dass der Frequenzgang durch Q(jω) b h(ω) = P (jω)
gegeben ist. Gilt Grad Q = n > m = Grad P , dann enthält die Impulsantwort h additive Anteile der Form ck δ (k) (t) mit k ≥ 1 und gewissen Konstanten ck 6= 0 (vgl. Partialbruchzerlegung und Fouriertransformationen von Ableitungen auf S. 246). Das System ist in diesem Fall instabil, da dann zum Beispiel die Anregung f (t) = sin((ω0 t)2 )s(t) eine unbeschränkte Systemantwort zur Folge hat. Zusammenfassung. Für Polynome P und Q ohne gemeinsame Nullstellen ist das durch P (D)u = Q(D)f beschriebene kausale zeitinvariante lineare System genau dann stabil, wenn Grad Q ≤ Grad P gilt und alle Polstellen von Q/P negative Realteile besitzen. Dies ist genau dann der Fall, wenn die Impulsantwort h die Form h(t) = p(t) + cδ(t) mit einer geeigneten Konstante c und einer integrierbaren Funktion p(t) hat. Der Frequenzgang eines stabilen Systems dieser Form ist Q(jω)/P (jω). Der Anteil cδ(t) in der Impulsantwort tritt auf, wenn Grad Q = Grad P ist. Die integrierbare Funktion p(t) ist unter diesen Bedingungen sogar eine schnell fallende Distribution und der Faltungssatz der Fouriertransformation gilt für alle temperierten Eingangssignale f .
290
10 Grundlagen über Lineare Filter
Realisierung des kausalen Systems Wir betrachten weiterhin die Differentialgleichung von S. 287 mit den dort gegebenen Pon Y lynomen P und Q. Sei wieder Q(z) = βn (z − bk ) die Linearfaktorzerlegung von k=1
Q(z) =
n X
k=0
βk z k . Für n ≥ Grad P = m sei Q1 (z) = βn
m−1 Y k=1
(z − bk ) =
m−1 X
ck z k und
k=0
Q . Für n < m seien Q1 (z) = Q(z), ck = βk für 0 ≤ k ≤ n, ck = 0 für k > n Q2 = Q1 und Q2 (z) = 1. Die rechte Seite von P (D)u = Q(D)f lässt sich damit darstellen durch Q(D)f = Q2 (D)[Q1 (D)f ]. Mit der kausalen Grundlösung g des Systems erhält man für ein Eingangssignal f mit Tr (f ) ⊂ [0,∞[ das Ausgangssignal u = g ∗ Q(D)f = g ∗ [Q2 (D)Q1 (D)f ] = Q2 (D)[g ∗ Q1 (D)f ]. Diese Input-Output-Relation kann schematisch durch eine serielle Verknüpfung von zwei Systemen dargestellt werden: f
System 1
Q1 (D)g ∗ f = v
System 2
Q2 (D)v = u
Das System 2 kann elektrotechnisch durch Proportionalglieder, Addierer und Differenzierglieder nachgebildet werden. Wir betrachten das System 1 und setzen o.E.d.A. n = m − 1. Mit den Koeffizienten ck von Q1 ist es gegeben durch v (m) + αm−1 v (m−1) + . . . + α0 v = cm−1 f (m−1) + cm−2 f (m−2) + . . . + c0 f. Wie auf S. 284 wandelt man um in ein Differentialgleichungssystem erster Ordnung: Man setze x˙ 0 = c0 f − α0 v. Dann ist v (m) + αm−1 v (m−1) + . . . + α1 v˙ − cm−1 f (m−1) − . . . − c1 f˙ = x˙ 0 . Mit der Kausalität des Systems folgt durch Integration v (m−1) + αm−1 v (m−2) + . . . + α1 v − cm−1 f (m−2) − . . . − c2 f˙ − c1 f = x0 . Mit x˙ 1 = x0 + c1 f − α1 v und xm−1 = v ergibt erneute Integration und Fortführung des Verfahrens die folgende Zustandsbeschreibung durch ein System erster Ordnung: ~x˙ (t) = A~x(t) + Cf (t)
10.4 Analoge Filter mit rationalen Frequenzgängen
291
mit ~x(t) = (x0 (t),x1 (t), . . . ,xm−1 (t))T , C = (c0 ,c1 , . . . ,cm−1 )T und 0 · · · · · · · · · · · · · · · −α0 1 0 · · · · · · −α1 .. 1 ... ... .. .. A= . . ... .. .. . . . 0 1 0 −αm−2 1 −αm−1
In der Regelungstechnik nennt man diese Zustandsbeschreibung die Beobachtungsnormalform des Systems (vgl. O. Föllinger (2008)). Das zugehörige Blockschaltbild haben wir in Abschnitt 8.3 auf S. 194 bereits kennen gelernt. Beispiele. 1. Allpass-Filter. Ein Allpass-Filter L ist ein Filter mit konstantem Amplitudengang. Betrachtet man das Filter auf dem Signalraum L2 (R), dann folgt aus der Parsevalˆ∞ Gleichung, dass die Energie |Lf (t)|2 dt eines Ausgangssignals Lf proportional −∞
zur Energie eines Eingangssignals f des Filters ist. Allpässe kann man zur Signalverzögerung und zur Phasenentzerrung transformierter Signale verwenden. Man gelangt zum Beispiel vom Frequenzgang eines Tiefpasses der Form K K b hTP (ω) = = P (jω) |P (jω)| e−jΦ(ω)
zum Frequenzgang b hAP eines Allpasses, indem man den Zähler K durch den komplex konjugierten Nenner ersetzt. Dann ergibt sich b hAP (ω) = e2jΦ(ω) .
Der Amplitudengang ist dann konstant Eins, die Phasenverzögerung wird im Vergleich zum Tiefpass verdoppelt (All-Pass Delay Equalizer). 2. Hochpass-Filter. Hochpass-Filter besitzen ihr Stoppband 0 ≤ ω < ωg unterhalb einer Grenzkreisfrequenz ωg , oberhalb ihr Passband. Eine Möglichkeit, einen HochpassFrequenzgang zu erhalten, ist die Tiefpass-Hochpass-Transformation, d.h. Ersetzung des normierten Parameters s = jω/ωg im Frequenzgang eines Tiefpasses mit der Grenzfrequenz ωg /(2π) durch den Parameter 1/s. So ergibt sich zum Beispiel aus dem Frequenzgang b hTP des Butterworth-Tiefpasses von S. 286 der rationale Frequenzgang b hHP eines Hochpass-Filters gleicher Ordnung mit der gleichen Grenzfrequenz: b hHP (ω) =
(jω)3 b 1 hTP (ω). = 2 (1 − jωg /ω)(1 − jωg /ω − (ωg /ω) ) ωg3
292
10 Grundlagen über Lineare Filter
Amplitudengänge |hTP | und |hHP |
Generell gilt: Hat die Übertragungsfunktion eines stabilen Tiefpass-Filters die Pole zk , dann sind ωg2 /zk die entsprechenden Pole der Übertragungsfunktion des HochpassFilters (vgl. Bild unten rechts). Das Hochpass-Filter ist daher ebenfalls stabil und sein Frequenzgang hat bei ωg den gleichen Betrag wie das Tiefpass-Filter, im Bei√ hHP (α ωg )| = spiel 1/ 2, d.h. ca. 3 dB Dämpfung. Für die Amplitudengänge gilt |b b b |hTP (−ωg /α)| = |hTP (ωg /α)| für α > 0. Tiefpass- und Hochpass-Filter haben die gleiche Ordnung. Im Fall von Butterworth-Filtern besitzen Tiefpass- und abgeleitete Hochpass-Filter die gleichen Gruppenlaufzeiten, weil bei Butterworth-Filtern die Pole zk der Tiefpass-Übertragungsfunktion den Betrag ωg haben. Diese Aussagen nachzuprüfen sei Lesern hier als kleine Rechenübung aufgegeben. An log(α ωg ) = log(ωg ) + log(α), log(ωg /α) = log(ωg ) − log(α) erkennt man, dass die Transformation bei logarithmischer Frequenzachse den Amplitudengang des Tiefpass-Filters für ω > 0 an der Grenzfrequenz spiegelt (siehe folgende Grafik9 links mit logarithmischer Abszisse, beschriftet mit den Werten von ω/ωg , für das vorangestellte Butterworth-Beispiel). 1.0
Tiefpass
1.0
0.8
0.5
0.6
0.0 0.4
Bandpass-Pol
■
▲ ◆
Pol der Bandsperre
Dies ist im Allgemeinen nicht der Fall.
-0.5
0.2 0.0
Im Beispiel hat der Tiefpass-Pol den Betrag ωg . Daher sind die Paare der Bandpass und Bandsperren Pole zueinander konjugiert komplex.
0.01
▲ ◆
▼
-1.0 Hochpass
Hochpass-Pol
0.10
1
-1.0
10
ω/ωg mit logarithmischer Skala
-0.8
-0.6
-0.4
-0.2
0.0
Pole/ωg Tiefpass, Hochpass, Bandpass, Bandsperre
3. Bandpass-Filter. Bandpass-Filter kann man durch serielle Verknüpfung von Hochpässen und Tiefpässen erhalten oder auch durch die Tiefpass-Bandpass-Transformation. Bei dieser Transformation ersetzt man mit der Joukowsky-Abbildung (vgl. S. 106) den normierten Parameter jωn = jω/ωg im Frequenzgang eines Tiefpasses durch 1 1 jωn + . B jωn Beim Filterentwurf ist neben der Grenzkreisfrequenz ωg auch die normierte Bandbreite 0 < B < 1 frei wählbar. Die Größe Q = 1/B wird als Qualitätsfaktor des BandpassFilters bezeichnet. Einem Tiefpass 1. Ordnung mit dem Frequenzgang b hTP (ω) =
K (1 + jωn )
entspricht dann zum Beispiel ein Bandpass 2. Ordnung mit dem Frequenzgang
9
b hBP (ω) =
jωn BK . 1 + jωn B − ωn2
hier erstellt mit Mathematica mit dem Befehl LogLinearPlot für |b hHP (αωg )| und |b hTP (αωg )|, α ∈ [0.01,20]
10.4 Analoge Filter mit rationalen Frequenzgängen
293
Bei dieser Transformation gilt generell: Die Ordnung des Tiefpass-Filters wird verdoppelt und es gilt b hBP (ωg ) = b hTP (0). Mit dem Tiefpass- ist auch das Bandpass-Filter wieder stabil. Dies folgt aus den Abbildungseigenschaften der Joukowsky-Abbildung (vgl. S. 106 und Aufgabe A5 am Kapitelende). Das rechte Bild auf der vorherigen Seite zeigt als typisches Beispiel die Transformation des Pols z0 = jωg ejπ/6 der Übertragungsfunktion des Butterworth-Tiefpassfilters von S. 286 in ein Paar (im Allgemeinen nicht zueinander konjugiert) komplexer Pole der Übertragungsfunktion des erzeugten Bandpass-Filters mit B = 1/3. Der weitere Tiefpass-Pol z2 = z 0 führt dann beim Bandpass-Filter auf die zu diesem Paar konjugiert komplexen Pole. b (ω1 )| = |b Die Passbandgrenzen ω1 und ωp hBP (ω2 )| = 2 , ω2 > ω1 > 0, mit |hBPp 2 2 b |hTP (ωg )| sind ω1 = ωg (−B + 4 + B )/2, ω2 = ωg (B + 4 + B )/2. Daher ist (ω2 − ω1 )/ωg = B die normierte Bandbreite und es gilt ω1 · ω2 = ωg2 . Für α > 0 ist |b hBP (α ωg )| = |b hBP (ωg /α)|, d.h. bei logarithmischer Frequenzachse und normierter Frequenz ωn = ω/ωg wird der Amplitudengang für 0 < ωn < 1 zur Seite ωn > 1 gespiegelt und ω1,n , ω2,n liegen symmetrisch zur Mittenfrequenz ωn = 1 (siehe folgende Grafik links, ausgehend vom Butterworth-Tiefpass auf S. 286 und B = 1/3). Alle Aussagen mögen Leser bitte in Übungsaufgabe A5 am Kapitelende verifizieren.
1.0
Amplitudengänge |hTP | und |hBSP |
Amplitudengänge |hTP | und |hBP |
4. Bandsperren-Filter. Bei der Tiefpass-Bandsperren-Transformation ersetzt man den Parameter jωn = jω/ωg in einem Tiefpass-Frequenzgang durch B/(jωn + 1/jωn ). Die Ordnung n des Tiefpass-Filters wird dabei verdoppelt. Die Größe B∈ ]0,1[ ist die normierte Bandbreite des Sperrbereichs. Das Bandsperren-Filter ist dann mit dem Tiefpass ebenfalls wieder stabil und hat im Amplitudengang bei ωg eine n-fache Nullstelle. Die zum Tiefpass-Pol z0 = jωg ejπ/6 wie im vorherigen Beispiel korrespondierenden Pole mit B = 1/3 zeigt ebenfalls die rechte Grafik auf der vorangehenden Seite. Die Verifikation der Aussagen zu dieser Transformation sei Lesern in Übungsaufgabe A5 aufgetragen. Im Bild unten rechts wird – mit analogen Daten wie im Beispiel vorher – der Amplitudengang |b hBSP | des erzeugten Bandsperren-Filters der Ordnung 6 dargestellt. Die Bandgrenzen ω1,n , ω2,n sind die gleichen wie im Bandpass-Beispiel vorher. Bandpass
Tiefpass
0.8 0.6 0.4 0.2 ω1,n
ω2,n
0.0 0.5
1.0
1.5
ω/ωg mit logarithmischer Skala
2.0
2.5
B
1.0 0
0.6 0.4
T
0.2 ω1,n
ω2,n
0.0 0.5
1.0
1.5
2.0
2.5 3.0
ω/ωg mit l S l
Zu Realisierungsmöglichkeiten verschiedener Filtertypen mittels Operationsverstärkern, Widerständen und Kondensatoren – insbesondere zu je nach Zweck als Tiefpass, Hochpass-, Bandpass- oder Bandsperren-Filter einstellbaren Universalfiltern – sei auf die lehrreichen Quellen U. Tietze und Ch. Schenk (2002), R. Unbehauen (1984), R. Unbehauen (2002) oder H. Wupper, U. Niemeyer (1996) hingewiesen.
294
10 Grundlagen über Lineare Filter
10.5 Periodische Signale, stationäre Filterantwort Wir betrachten nun ein stabiles, kausales zeitinvariantes lineares System Lf = h ∗ f auf S ′ , das durch eine Differentialgleichung der Form P (D)u = f mit einem Polynom P und durch die kausale Grundlösung h der Gleichung gegeben ist. Einschwingvorgänge klingen dann mit wachsender Zeit ab. Wir berechnen die Filterantwort auf ein zur Zeit t = 0 eingeschaltetes Signal f (t)s(t) mit f (t) = U0 ejω0 t und der Einheitssprungfunktion s(t): ˆt
(f s ∗ h)(t) = s(t)
U0 e jω0 (t−x) h(x)dx
−∞ jω0 t
= U0 e
+∞ +∞ ˆ ˆ −jω0 x −jω0 x s(t) h(x) e dx − h(x) e dx −∞
Die Funktion
t
h(ω0 ) e jω0 t s(t) + r(t). = U0 b r(t) = −U0 e
jω0 t
+∞ ˆ s(t) h(x) e−jω0 x dx t
verschwindet wegen der Integrierbarkeit von h für t → ∞ . Sie ist die transiente Filterantwort, d.h. sie stellt den abklingenden Einschwingvorgang dar. h(ω0 ) ejω0 t . Sie Ergebnis. Für t > 0, t → ∞ ergibt sich die stationäre Filterantwort U0b jω0 t ist die eindeutig bestimmte periodische Lösung von P (D)u = U0 e .
In vielen Anwendungen ist es üblich, die Filterantwort auf periodische Eingangssignale zu studieren. Wählt man eine periodische Funktion f (t) = U0 ejω0 t als mathematisches Modell einer Anregung, dann setzt man implizit voraus, dass das Signal f zu jeder Zeit schon unendlich lange anliegt, dass sich also das System stets im eingeschwungenen Zustand befindet. Es gilt dann h(ω0 ) ejω0 t . (f ∗ h)(t) = U0b Unter unserer Stabilitätsvoraussetzung ist b h(ω) = 1/P (jω) ein Multiplikator in S ′ (man vgl. S. 245 und S. 254), und es folgt allgemeiner für eine T -periodische Distribution f (t) =
+∞ X
ck ej2πkt/T
k=−∞
mit dem Faltungssatz der Fouriertransformation hk = b h(2πk/T ) und fbb h(ω) = 2π
die periodische Filterantwort (vgl S. 249-252)
+∞ X
k=−∞
ck hk δ(ω − 2πk/T )
10.5 Periodische Signale, stationäre Filterantwort (f ∗ h)(t) = F −1 (fbb h)(t) =
295 +∞ X
ck hk ej2πkt/T .
k=−∞
Mit der Impulsantwort h eines stabilen kausalen Systems der Form P (D)u = f erhalten wir daher die periodische Lösung für periodische f auch durch periodische Faltung: Ergebnis. Für eine T -periodische Distribution f ist die Faltung f ∗h gerade die Filterantwort, die sich auch aus der T -periodischen Faltung der Anregung f mit der T -periodischen Übertragungsfunktion hT ergibt, hT (t) =
+∞ X
hk ej2πkt/T .
k=−∞
Die Koeffizienten hk sind die Abtastwerte b h(2πk/T ) des Frequenzgangs b h und f ∗ h ist wieder eine T -periodische Distribution. Man vergleiche hierzu auch noch einmal die Abschnitte 5.2 und 8.1.
Bemerkung. Wir stellen fest, dass die Funktionen ejωt Eigenfunktionen des Faltungsoperators L, der das Filter mathematisch beschreibt, sind. Die zugehörigen Eigenwerte sind jeweils die Faktoren b h(ω): L ejω0 t = ejω0 t ∗h(t) = F −1 (2πb h(ω)δ(ω − ω0 )) = b h(ω0 ) ejω0 t .
Die in Anwendungen gewöhnlich komplizierte Wirkung von L – man denke etwa an große lineare elektrische Netzwerke – wird durch die Fouriertransformation auf die einfache alc =b gebraische Multiplikationsoperation reduziert: Lf hfb. Die Analyse von L wird dadurch erheblich erleichtert. Auch für lineare Differentialoperatoren auf S ′ der Form L=
n X
k=0
gilt analog L ejωt =
n X
ck
dk
dtk
ck (jω)k ejωt und allgemein
k=0
c (ω) = Lf
n X
k=0
ck (jω)k fb(ω).
Dieser Sachverhalt ist der Grund für den Nutzen der Fouriertransformation bei der Lösung von Differentialgleichungen. Wir kommen in den Abschnitten 11.7 und 12.1 auf diesen Gesichtspunkt noch einmal zurück. Die vorangehenden Überlegungen zeigen, wie man den Frequenzgang b h stabiler zeitinvarianter linearer Systeme mit messtechnischen Mitteln näherungsweise bestimmen kann: Man schaltet Sinusschwingungen verschiedener Frequenzen als Testsignale auf das Übertragungssystem, wartet jeweils den eingeschwungenen Zustand ab und erhält schließlich aus gemessenen Betrags- und Phasenänderungen bei der Übertragung die Werte des Frequenzgangs b h für die Testfrequenzen. Aus diesen diskreten Werten konstruiert man durch Interpolation eine Näherung für b h.
296
10 Grundlagen über Lineare Filter
Periodisierung im Zeitbereich, Abtastung im Frequenzbereich Schneidet man aus einer lokal-integrierbaren Funktion f (t) durch ein Zeitfenster einen f (t) für − T /2 ≤ t < T /2 zeitbegrenzten Verlauf f0 (t) = heraus und setzt man f0 zur 0 sonst T -periodischen Funktion fT fort, dann lässt sich fT als Faltung mit einer Impulsfolge +∞ X δ(t − kT ) darstellen: δT (t) = k=−∞
fT (t) =
+∞ X
k=−∞
f0 (t + kT ) = (f0 ∗ δT )(t).
Man kann den Faltungssatz anwenden und erhält die verallgemeinerte Spektralfunktion fbT von fT durch fbT (ω) = fb0 (ω) · δc T (ω) = 2π
+∞ X 2πk 1 b 2πk δ ω− . f0 T T T
k=−∞
+T ˆ /2 1 b 2πk 1 f0 (t) e−j2πkt/T dt sind gerade die FourierkoDie Koeffizienten f0 = T T T −T /2
effizienten der Fourierreihe von fT . Sie ergeben sich aus den Abtastwerten der kontinuierlichen Spektralfunktion fb0 des zeitbegrenzten Ausschnitts f0 . Man sagt: Periodisierung im Zeitbereich entspricht einer Abtastung im Frequenzbereich. Analog entspricht einer Abtastung im Zeitbereich eine Periodisierung im Frequenzbereich. Man vergleiche zur Veranschaulichung die nachfolgende Grafik und später Abschnitt 11.2.
Numerische Näherungen für Fouriertransformationen. Der Zusammenhang zwischen den Fourierkoeffizienten des zeitbegrenzten Signalausschnitts f0 von f und Abtastwerten der Fouriertransformierten von f0 gestattet es, Näherungen für fb mit Hilfe der diskreten Fouriertransformation zu berechnen. Die aus Abtastwerten von f0 berechneten Koeffizienten b ck der diskreten Fouriertransformation (vgl. Abschnitt 5.7) dienen zur Näherung von Abtastwerten von fb0 . Interpolation der Punkte (2πk/T, b ck T ) ergibt eine Näherung für fb0 und damit für fb (man vgl. die Bemerkung auf S. 263 und (9.2) auf S. 227). Die Güte dieser Näherung hängt von der Anzahl der Abtastwerte ab und davon, wie gut f durch f0 approximiert wird (siehe Übungsaufgabe A6 auf S. 324, in der eine erste Näherung durch sogenanntes „zero padding“ bei der diskreten Fouriertransformation verbessert wird). Die Poissonsche Summenformel Mit den zuletzt verwendeten Bezeichnungen ergibt die Anwendung der Fourierschen Umkehrtransformation auf fbT (ω) die Fourierreihendarstellung der periodischen Funktion fT und man erhält die folgende Poissonsche Summenformel:
10.5 Periodische Signale, stationäre Filterantwort
297 +∞ P
δT (t) =
f0 (t)
k=−∞
1
1
∗
−T 2
Faltung ergibt fT
T 2
Fouriertransformation
−T 0
fT (t)
1 −T 2
δ(t − kT )
T 2T 3T
T 2
π fbT (ω) = fb0 · δbT (ω)
6π −4π −2π T T T
T 2
2π T
4π T
6π T
fb0 (ω)
δbT (ω) =
2π T
+∞ P
k=−∞
δ(ω −
2πk ) T
2π T
Multiplikation ergibt fb0 · δbT , d.h. das diskrete Spektrum von fT
−4π T
4π T
8π T
×
0
2π T
4π T
Die Fourierkoeffizienten ck der Fourierreihe fT 2πk 1 , k ∈ Z. sind ck = fb0 T T
Satz.
Es gilt fT (t) =
+∞ X
k=−∞
+∞ 1 X b 2πk ej2πkt/T . f0 (t + kT ) = f0 T T k=−∞
Die Poissonsche Summenformel gilt auch für viele Funktionen f0 , die keinen beschränkten Träger besitzen. Zum Beispiel erkennt man schnell, dass sie ebenfalls gilt, wenn man f0 durch eine schnell fallende Funktion ϕ ∈ S ersetzt. Wegen des schnellen Abfallens von +∞ X ϕ für t → ∞ ist die Reihe ϕ(t + kT ) absolut und gleichmäßig konvergent und stellt k=−∞
die zugehörige periodische Funktion auch punktweise dar. Eine der bekanntesten Anwen-
298
10 Grundlagen über Lineare Filter 2
dungen erhält man mit ϕ(t) = e−αt , α > 0 und T = 1 . Die Poissonsche Summenformel ergibt dann folgende Funktionalgleichung für die Theta-Funktion: r r +∞ +∞ +∞ X X π X j2πkt −π2 k2 /α π −π 2 k2 /α −α(t+k)2 e e e e cos(2πkt) . 1+2 = = α α k=1
k=−∞
k=−∞
Die Poissonsche Summenformel, die sich in entsprechender Form auch für Funktionen mit mehreren Variablen zeigen lässt, besitzt eine Fülle verschiedener Anwendungen, zum Beispiel bei der Lösung von Wärmeleitungsproblemen, bei der Entwicklung von Abtast- und Quadratur-Formeln oder bei der Beschreibung von Kristallstrukturen. Interessierte Leser seien etwa verwiesen auf P. Butzer, R. Stens und W. Splettstösser (1988) oder auf R. Strichartz (1994).
10.6 Diskrete lineare Filter, z-Transformation Analog zu Abschnitt 10.3 sollen im Folgenden für diskrete lineare Systeme grundlegende Fragen zur Darstellbarkeit durch Faltungen, zu Stabilität und Realisierungsmöglichkeiten untersucht werden. Ich hoffe, damit Leser anzuregen sich mit den Ideen und Methoden dieses Teilgebiets der diskreten Mathematik durch Studium weiterführender Literatur zu befassen. Dieses Teilgebiet beeinflusst weite Bereiche unserer technischen und anwendungsorientierten Umgebung stark. Realisierungen diskreter Filter gibt es in Prozessoren und vielen Programmen zur diskreten Datenverarbeitung in Technik und Wirtschaft. Wir betrachten translationsinvariante lineare Systeme L : Z → A, wobei die Signalräume Z und A im Einzelfall zu konkretisierende Unterräume des auf S. 275 eingeführten Raumes X der diskreten Signale sind. Wie bei analogen Filtern stellt sich die Frage nach der Darstellbarkeit durch die Faltung mit der Impulsantwort Lx = L(x ∗ δ) = x ∗ Lδ
und die Frage nach der Stetigkeit von L bezüglich geeigneter Topologien auf Z und A. Ein stetiges System, das durch einen Faltungsoperator L beschrieben werden kann, wird wie bisher als lineares Filter bezeichnet. Ein erster Darstellungssatz folgt schnell aus den schon in Abschnitt 7.7 behandelten Eigenschaften von Faltungen. Satz. Sei Z der Raum X aller diskreten Signale oder einer der Räume aus der Liste 1. - 6. von Seite 275. Dann ist jeder stetige lineare translationsinvariante Operator L : Z → X , der eine endliche Impulsantwort h = Lδ ∈ X ∩ E ′ besitzt, ein lineares Filter Lx = x ∗ h. Beweis. Sei h =
+M X
hn δn die Impulsantwort Lδ. Für ein Signal x =
n=−M
xN die Partialsumme xN = Operators L folgt
+∞ X
xk δk sei
k=−∞ +N X
k=−N
xk δk . Aus der Linearität und Translationsinvarianz des
10.6 Diskrete lineare Filter, z-Transformation
LxN =
+N X
k=−N
xk
+M X
hn δn+k
n=−M
!
299
=
NX +M
m=−(N +M)
+N X
xk hm−k
k=−N
!
δm .
Bei der letzten Gleichung haben wir die Summe mit der Indextransformation n + k = m umgruppiert. Dabei wird hn = 0 für |n| > M gesetzt. LxN ist also die Faltung xN ∗ h (man vgl. hierzu noch einmal das Beispiel von Nr. 6 auf S. 165). Für N → ∞ folgt aus der Stetigkeit von L mit xN → x in Z nun Lx = D′ -lim(xN ∗ h) = x∗ h. Die letzte Gleichung N →∞
ergibt sich dabei aus der Konvergenz der Faltungen xN ∗ h → x ∗ h für h ∈ X ∩ E ′ (vgl. Nr. 7(b) auf S. 163 und die Youngsche Ungleichung für die lp -Räume in Anhang B). Bemerkung. Im Fall Z = ld∞ (Nr. 7 der Liste auf S. 275) versagt der obige Beweis, weil +N X die Partialsummen xN = xk δk von x ∈ ld∞ in der Regel nicht in der Norm von ld∞ k=−N
gegen x konvergieren, wie man etwa am Beispiel x =
+∞ X
δk erkennt. Für diesen Raum
k=−∞
steht auf S. 302 auch ein Gegenbeispiel zur Aussage des obigen Satzes. Wie bei analogen Filtern sind auch diskrete kausale translationsinvariante lineare Syste′ me auf dem Raum X ∩ DR automatisch stetig und immer lineare Filter. Für Anwendungen in der Praxis der Signalverarbeitung mit kausalen translationsinvarianten linearen Operatoren und kausalen Signalen ergibt sich daher immer die gewünschte Faltungsdarstellung. Alle nachfolgenden Aussagen dazu und ihre Beweise stammen von E. Albrecht (2011). Da die Beweise im diskreten Fall wesentlich einfacher als bei analogen Systemen sind, können wir sie auch im Rahmen unseres Einstiegs in das Gebiet ausführen. Satz über die automatische Stetigkeit kausaler linearer diskreter Systeme ′ Jeder kausale lineare Operator L : X ∩ DR → X ist automatisch stetig und es gibt zu L eine eindeutig bestimmte unendliche linke untere Dreiecksmatrix AL = (am,n )m,n∈Z +∞ X ′ (d.h. am,n = 0 für m < n), so dass für alle x = xn δn aus X ∩ DR und y = Lx, n=−∞
y=
+∞ X
m=−∞
ym δm die Beziehung ym =
diese Reihe eine endliche Summe.
+∞ X
am,n xn gilt. Wegen der Kausalität von L ist
n=−∞
′ Beweis. Eine lineare Abbildung L : X ∩ DR → X ist nach Definition der Konvergenz in ′ X ∩ DR genau dann stetig, wenn ihre Einschränkungen L|Zk auf alle Räume Zk = X ∩ Dk′ stetig sind. Die Elemente von Zk haben ihre Träger in [ka,∞[, a > 0 wie auf S. 275 fest +∞ X gewählt. Wir betrachten nun für m ∈ Z und x = xn δn mit Pm : X → C die n=−∞
Projektion Pm x = xm auf die Komponente mit Index m. Nach Definition der Konvergenz in X folgt dann, dass L genau dann stetig ist, wenn die Kompositionen Pm ◦L|Zk : Zk → C für alle k und m aus Z stetig sind.
300
10 Grundlagen über Lineare Filter
′ Zum Nachweis dieser Eigenschaft für einen kausalen linearen Operator L : X ∩ DR →X führen wir für m, k ∈ Z mit m ≥ k noch die Bezeichnung
Qk,m : Zk → {x ∈ Zk : xn = 0 für alle n > m}
für die kanonische Projektion ein. Für x ∈ Zk und m ≥ k ist also Qk,m (x) =
m X
xn δn .
n=k
Diese Projektion ist stetig auf Zk und hat einen endlich-dimensionalen Bildraum.
′ Sei nun L : X ∩ DR → X ein linearer kausaler Operator. Für m < k sind die Abbildungen Pm ◦ L|Zk wegen der Kausalität von L Null und daher stetig. Für m ≥ k gilt wegen der Kausalität von L für x ∈ Zk , dass Pm (L(Ek − Qk,m )x)) = 0 ist. Dabei bezeichnet Ek die Identität auf Zk . Daher ist Pm ◦ L|Zk = Pm ◦ L ◦ Qk,m auf Zk . Da der Bildraum von Qk,m endlich-dimensional ist, folgt die Stetigkeit von Pm ◦ L|Zk auch in diesem Fall. Anders gesagt, L ist stetig, weil jeder Ausgangswert ym = Pm (Lx) für x ∈ Zk nur durch Werte xn bis zum „Zeitpunkt“ ma, d.h. durch den Signalausschnitt Qk,m x bestimmt ist. Man definiere nun am,n = Pm (Lδn ) für m,n ∈ Z. Dann folgt mit der Stetigkeit von L +∞ X ′ und y = Lx xn δn in X ∩ DR für alle x = n=−∞
ym = Pm (Lx) =
+∞ X
xn Pm (Lδn ) =
n=−∞
+∞ X
am,n xn ,
n=−∞
und wegen der Kausalität von L sind alle am,n = 0 für n > m. Da außerdem jedes x aus ′ X ∩ DR einen nach unten beschränkten Träger hat, ist die Reihe endlich.
Damit ergibt sich für translationsinvariante Systeme sofort folgender Satz:
′ Satz. Jeder translationsinvariante kausale lineare Operator L : X ∩ DR → X ist stetig +∞ X und es gilt mit h = Lδ0 = hn δn die Faltungsdarstellung n=0
Lx = h ∗ x =
+∞ X
n=−∞
+∞ X
k=−∞
xk hn−k
!
δn .
Beweis. Die Translationsinvarianz ergibt für die im vorangehenden Satz gezeigte Matrixdarstellung von L eine Matrix AL = (am,n )m,n∈Z , so dass am+1,n+1 = Pm+1 (Lδn+1 ) = Pm (Lδn ) = am,n für alle m, n ∈ Z gilt. Für h = Lδ0 = hm−n = am−n,0 = am,n
+∞ X
hn δn folgt aus hm = Pm (Lδ0 ) = am,0 also ! +∞ X und damit die Faltungsdarstellung für y = L xn δn = n=0
n=−∞
+∞ X
m=−∞
ym δm mit der endlichen Summe ym =
+∞ X
n=−∞
am,n xn =
+∞ X
n=−∞
hm−n xn .
10.6 Diskrete lineare Filter, z-Transformation
301
Bemerkung. Man kann zeigen, dass Operatoren L wie in den beiden letzten Sätzen auch ′ noch stetig sind, wenn man den Bildraum durch X ∩ DR mit seiner feineren Topologie ersetzt. Man vgl. hierzu E. Albrecht, M. Neumann (1979), dort Bemerkung 1.5. ′ Wieder ist für die Stetigkeit der auf X ∩DR eingeführte Konvergenzbegriff entscheidend (vgl. S. 274). Wir betrachten noch einmal das Beispiel von S. 278.
Beispiel. Das kausale diskrete lineare System Lx = x ∗ h mit h = wird als Akkumulator bezeichnet. Für x =
+∞ X
xn δn und y =
n=−N
∞ X
n=0
∞ X
′ δn auf X ∩ DR
yk δk mit y = Lx
k=−N
ist yk = xk + yk−1 . Wie schon auf S. 278 gezeigt, gilt für fn = −δ−n + δ0 , dass ′ D′ -lim fn = δ0 ist, aber D′ -lim Lfn 6= Lδ0 . In X ∩ DR ist aber die Folge der fn in der n→∞
n→∞
′ dort eingeführten Topologie nicht konvergent und L ist bezüglich der X ∩ DR -Topologie nach dem letzten Satz durchaus stetig. Wir erkennen, dass es auch in typischen Beispielen aus Ingenieurdisziplinen durchaus darauf ankommt, neben der bloßen Operatorenvorschrift auch die Signalräume und ihre Topologie in die Betrachtung einzubeziehen.
Wie wir schon bei analogen Filtern gesehen hatten, werden translationsinvariante lineare Systeme L : Z → A für die Anwendungen häufig mit einer erwünschten Impulsantwort h oder einem erwünschten Frequenzgang b h direkt als Faltungsoperatoren Lx = x ∗ h definiert oder so entworfen. Gleiches gilt für die Anwendungen diskreter Systeme. In dieser Situation zeigt der folgende Satz die Stetigkeit einer großen Klasse solcher Systeme. Wir fassen einige für die Anwendungen relevanten Fälle zusammen. Zusammenfassung. Ein linearer Faltungsoperator L : Z → A, Lx = x ∗ h ist stetig, d.h. ein lineares Filter in folgenden Fällen: 1. Z = X , h ∈ X ∩ E ′ , A = X 2. Z = X ∩ E ′ , h ∈ X , A = X ′ ′ ′ 3. Z = X ∩ DR , h ∈ X ∩ DR , A = X ∩ DR ′ 4. Z = X ∩ S ′ , h ∈ X ∩ OC , A = X ∩ S′
5. Z = ld∞ , h ∈ ld1 , A = ld∞ 6. Z = ld1 , h ∈ ld∞ , A = ld∞ 7. Z = ld2 , h ∈ ld2 , A = ld∞ In allen Fällen gilt für die Koeffizienten ym der Faltung y = x ∗ h = x=
+∞ X
n=−∞
xn δn und h =
+∞ X
k=−∞
hk δk die Darstellung ym =
+∞ X
k=−∞
+∞ X
m=−∞
hm−k xk .
ym δm mit
302
10 Grundlagen über Lineare Filter
Beweis. Die Fälle 1 und 2 folgen aus Nr. 7 auf S. 163. Fall 3 war oben gezeigt. In den Fällen 4 bis 7 gilt nach unseren Beispielen unter Nr. 5, S. 256 die Faltungsgleichung x[ ∗h = x bb h der Fouriertransformation und die Stetigkeit von L ergibt sich aus der Stetigkeit der Fouriertransformation auf S ′ resp. aus der Ungleichung von Young für die lp -Räume (Anhang B, S. 421). Aus dieser Ungleichung ergeben sich mit l1 (Z) ⊂ l2 (Z) ⊂ . . . ⊂ l∞ (Z) weitere Kombinationsmöglichkeiten, auf die wir nicht weiter eingehen. In allen Fällen hat y = Lx die genannte Form, wie ebenfalls in den Beispielen auf S. 165, S. 256 und S. 421 dargelegt. Man vergleiche dazu auch noch einmal die Veranschaulichung auf S. 166.
Translationsinvariante lineare Systeme, die nicht als Faltungen darstellbar sind Alle zuletzt betrachteten Systeme haben wir als Faltungsoperatoren vorausgesetzt. Es sei daher angemerkt, dass es – entgegen zahlreichen Darstellungen in der Ingenieurliteratur – durchaus stetige translationsinvariante lineare Systeme gibt, die nicht als Faltungssysteme dargestellt werden können und folglich auch nicht durch ihre Impulsantwort charakterisiert sind. Wir betrachten ein Beispiel eines solchen Systems auf ld∞ , das stetig, kausal und stabil im Sinn des nachfolgenden Abschnitts ist. Es geht bis auf Stefan Banach (1932) und seine Konstruktion von Banachlimiten zurück und wurde von I. W. Sandberg (2001) angegeben. Wir folgen einem Beweis von E. Albrecht (2011). Dabei verwenden wir einige Argumente aus der Funktionalanalysis, insbesondere den Fortsetzungssatz von Hahn-Banach und einen Fixpunktsatz von A. Markov, S. Kakutani (vgl. W. Rudin (1990), Theoreme 3.5 und 5.23). Beispiel. Man betrachte den abgeschlossenen Unterraum M ⊂ ld∞ aller x =
+∞ X
xn δn ,
n=−∞
so dass lim xn = 0 gilt. M ist invariant unter Translationen Tm . Für m ∈ Z sei dabei n→−∞
Tm die Translation um ma, also x =
∞ X
k=−∞
xk δk → Tm x =
∞ X
xm+k δk . Nach dem
k=−∞
Fortsetzungssatz von Hahn-Banach gibt es dann ein stetiges lineares Funktional P 6= 0 auf ld∞ , so dass gilt P (M ) = {0} und kP k = 1 = P (1). Mit 1 wird hier die Impulsfolge bezeichnet, deren sämtliche Koeffizienten Eins sind. Jedes solche Funktional P ist eine Fortsetzung des Limesfunktionals p(x) = lim xn , definiert für solche x ∈ ld∞ , deren n→−∞
Koeffizienten für n → −∞ einen Grenzwert haben. Unter allen diesen gibt es ein translationsinvariantes Funktional P0 , d.h. P0 (Tm x) = P0 (x) für m ∈ Z, x ∈ ld∞ . Um dies einzusehen, benötigt man ein Zusatzargument, das im Anschluss noch angegeben wird. +∞ X Der dann durch L(x) = P0 (x)δk definierte Operator ist linear, translationsinvariant, k=−∞
trivialerweise kausal und stetig als Abbildung L : ld∞ → ld∞ und damit auch stabil im Sinn des nachfolgenden Absatzes. Insbesondere ist Lδ0 = 0. Der Operator L kann daher nicht als Faltung dargestellt werden. Leser mit Kenntnissen der Funktionalanalysis können das benötigte Zusatzargument wie folgt nachvollziehen: Man betrachtet dazu die konvexe beschränkte Menge K := {P ∈ ld∞ ′ : P (M ) = {0}, kP k = 1 = P (1)} 6= ∅.
10.6 Diskrete lineare Filter, z-Transformation
303
Dabei ist ld∞ ′ der Dualraum von ld∞ , d.h. der Banachraum aller stetigen linearen Funktionale auf ld∞ . Die schwach-*-Topologie auf ld∞ ′ ist die gröbste Topologie, so dass alle x ∈ ld∞ als Funktionale auf ld∞ ′ stetig sind. Die Einheitskugel b′1 von ld∞ ′ ist schwach-*-kompakt, die Norm ist schwach-*-unterhalbstetig. Ein schwach-*-konvergentes Netz (Pλ )λ∈Λ in K konvergiert daher gegen ein Funktional aus K. Also ist K ⊂ b′1 schwach-*-abgeschlossen und daher ebenfalls schwach-*-kompakt. ′ Die zu den Translationen Tm adjungierten Abbildungen Tm : ld∞ ′ → ld∞ ′ , definiert durch ′ Tm P (x) = P (Tm x), sind schwach-*-stetig, bilden K affin-linear in sich ab und bilden eine kommutierende Familie. Nach dem oben schon genannten Fixpunktsatz von A. Markov, ′ S. Kakutani gibt es dann zu der Familie aller Tm , m ∈ Z, einen gemeinsamen Fixpunkt P0 6= 0 in K. Dieses Funktional P0 ist dann translationsinvariant. Für jeden stetigen kausalen Faltungsoperator A : ld∞ → ld∞ ist dann A + L stetig, kausal und translationsinvariant, aber nicht als Faltung darstellbar. Ein ganz analoges Beispiel zeigt auch im kontinuierlichen Fall, dass es stetige lineare kausale translationsinvariante Operatoren auf L∞ (R) gibt, die keine Faltungsoperatoren sind. Gleiches gilt auch im Fall mehrerer Variablen auf L∞ (Rn ) mit einer entsprechend angepassten Definition der Kausalitätsbedingung. Interessierte Leser seien dazu auf die Arbeiten von W. Rudin (1972), E. Albrecht, M. Neumann (1979) und die dort genannten Referenzen verwiesen. Ein weiteres Beispiel, das ebenfalls bei I. W. Sandberg (2001) genannt ist und mit den gleichen Argumenten wie oben verstanden werden kann, ist in der Übungsaufgabe A14 am Ende des Kapitels zu finden. Im Folgenden betrachten wir lineare Operatoren L : Z → A zwischen Teilräumen Z und A von X , die als Faltungsoperatoren, d.h. als diskrete lineare Filter vorausgesetzt seien. Stabilität und Realisierbarkeit diskreter linearer Filter Definition. Ein diskretes lineares Filter L : Z → A heißt stabil, wenn es eine Konstante C > 0 gibt, so dass für jedes Eingangssignal x ∈ Z ∩ ld∞ gilt: kLxk∞ ≤ Ckxk∞ .
Bei stabilen Filtern haben beschränkte Eingangssignale x ∈ ld∞ , d.h. solche mit beschränkten Koeffizienten xn , auch beschränkte Ausgangssignale Lx zur Folge und darüber hinaus sind die Maximalwerte der Koeffizienten von Lx dem Betrage nach nie größer als der mit C multiplizierte absolute Maximalwert der xn (n ∈ Z). Im folgenden Satz werden stabile und realisierbare diskrete Filter durch Eigenschaften ihrer Impulsantwort charakterisiert. Stabilität bedeutet, dass kleine Störungen von x auch nur kleine Auswirkungen auf die Filterantwort Lx haben. Satz. Sei L : Z → A ein diskretes lineares Filter, das zu einem der Fälle 1 - 7 der vorangehenden Zusammenfassung gehört. Seine Impulsantwort h besitze die Koeffizienten hk , k ∈ Z. Dann gelten folgende Aussagen: 1. L ist genau dann stabil, wenn
+∞ X
k=−∞
|hk | < ∞ ist.
2. L ist genau dann kausal, wenn hk = 0 für alle k < 0 gilt.
304
10 Grundlagen über Lineare Filter
Beweis. Zu 1. Wenn h ∈ ld1 ist, dann gilt für x ∈ ld∞ und y = Lx mit Koeffizienten yk , +∞ +∞ X X dass |yk | ≤ |hn ||xk−n | ≤ sup |xn | |hn | ist, also ist kyk∞ ≤ khk1 kxk∞ , d.h. L ist stabil.
n∈Z
n=−∞
n=−∞
Sei nun umgekehrt L stabil. Für die Fälle 1, 4 und 5 ist h ∈ ld1 und nichts zu zeigen. Für die anderen Fälle definieren wir nun eine Folge von Signalen xN , N ∈ N, deren k-te Koeffizienten xN,k mit Hilfe der konjugiert komplexen Filterkoeffizienten gegeben seien: xN,k = hN −k /|hN −k | für 0 ≤ k ≤ 2N und hN −k 6= 0 0 sonst.
Da für alle N die Signale xN endlich sind und immer kxN k∞ ≤ 1 ist, gehören sie zu Z∩ld∞ für die betrachteten Räume Z und es gilt kLxN k∞ ≤ C mit einer positiven Konstante C. Für jedes N ∈ N und yN = LxN folgt nun yN,N =
+∞ X
k=−∞
hk xN,N −k =
+N X
k=−N
|hk | ≤ C,
und damit die absolute Summierbarkeit der Filterkoeffizienten hk . Zu 2. Ist das Filter realisierbar, dann ist wegen h = Lδ nach Definition hk = 0 für k < 0. Umgekehrt folgt aus Tr(h) ⊂ aN ∪ {0} und Tr(x ∗ h) ⊂ Tr(x) + Tr(h) die Kausalität eines Filters mit einer solchen Impulsantwort h. Anmerkung. In vielen Lehrbüchern der linearen Systemtheorie wird Stabilität schwächer als oben definiert. Oft wird nur verlangt, ein beschränktes Eingangssignal solle ein beschränktes Ausgangssignal zur Folge haben. Es sei daher angemerkt, dass ein Filter, das nur diese schwächere Bedingung erfüllt, im Allgemeinen keine Impulsantwort mit absolut summierbaren Koeffizienten haben muss. Man betrachte etwa den Akkumulator mit Im+∞ X pulsantwort h = δk auf X ∩ E ′ oder bemerke, dass die Faltungen x ∗ h in den Fällen 6 k=0
und 7 stets in ld∞ liegen und es Elemente h in ld2 ⊂ ld∞ gibt, die nicht zu ld1 gehören. Nach unserer Definition ist Stabilität gleichbedeutend mit der Stetigkeit von L, wenn man sowohl den Teilraum Z ∩ld∞ der Eingangssignale als auch den Raum A∩ld∞ von Ausgangssignalen mit der ld∞ -Norm versieht. Frequenzgang und Übertragungsfunktion diskreter linearer Filter, z-Transformation
Bevor wir konkrete Beispiele von Filtern ansehen, behandeln wir die z-Transformation, die ein gebräuchliches mathematisches Werkzeug bei der Arbeit mit diskreten Filtern ist. Definition. 1. Gehört die Impulsantwort h =
+∞ X
k=−∞
hk δk eines linearen Filters L : Z → A zu
X ∩ S ′ , dann heißt die Fouriertransformierte b h von h der Frequenzgang des Filters.
10.6 Diskrete lineare Filter, z-Transformation
305
2. Für ein diskretes Signal x ∈ X ∩ S ′ mit Koeffizienten xk heißt x b das Spektrum von x +∞ X und X(z) = xk z −k seine z-Transformierte. k=−∞
3. Wenn die z-Transformierte H(z) eines diskreten linearen Filters mit Impulsantwort h für gewisse z ∈ C konvergiert, dann heißt H die Übertragungsfunktion des Filters. Gilt für ein diskretes Filter die Faltungsbeziehung x[ ∗h=x bb h, dann kann man das Filter wie im analogen Fall durch Eigenschaften des Frequenzgangs beschreiben oder nach vorgegebenen Anforderungen an den Frequenzgang entwerfen. Wir kommen darauf später in Beispielen zurück. Der Frequenzgang b h und Spektren x b sind im diskreten Fall periodische Distributionen. In vielen Anwendungen von diskreten Filtern ist es üblich, mit der Übertragungsfunktion anstelle des Frequenzgangs zu arbeiten. H(z) ist eine Laurentreihe. Laurentreihen gehören zum Fundament der Funktionentheorie. Eine gute Referenz dazu ist das Buch von K. Meyberg, P. Vachenauer (2001). Setzt man voraus, dass die Koeffizienten hk exponentiell beschränkt sind, d.h. |hk | ≤ c1 rk und |h−k | ≤ c2 ̺k für alle k ≥ k0 mit geeigneten c1 ,c2 ,k0 , dann konvergiert diese Laurentreihe im Kreisring A = {z ∈ C | r < |z| < R = 1/̺} und divergiert außerhalb von A (Vergleichskriterium mit der geometrischen Reihe). Für ̺ = 0 setzt man R = +∞. Für r ≥ R ist A die leere Menge. Die Reihe konvergiert in jedem abgeschlossenen Kreisring r1 ≤ |z| ≤ R2 in A absolut und gleichmäßig. Über die Konvergenz auf dem Rand |z| = r und |z| = R gibt es keine allgemein gültige Aussage. ∞ X Für kausale Filter ist H(z) definiert, wenn die Potenzreihe hk xk einen Konvergenzk=0
radius ̺ > 0 besitzt. Dann ist das Konvergenzgebiet von H durch |z| > r gegeben, wobei r = 1/̺ 6= 0 oder r = 0 für ̺ = +∞ ist. Es gilt dann H(z) → h0 für |z| → ∞. Eine kausale Impulsantwort h eines diskreten Filters, die zum Raum X ∩ S ′ gehört, hat polynomial beschränkte Koeffizienten, da b h eine verallgemeinerte Fourierreihe ist (vgl. Abschnitt 8.1). Ihre z-Transformierte H konvergiert dann jedenfalls für |z| > 1. Gehört die Kreislinie |z| = 1 zum Konvergenzkreisring einer z-Transformierten X, dann ist das 2π/a-periodische Spektrum x b des zugehörigen Signals x ∈ ld1 stetig und durch die Werte von X auf dem Einheitskreis gegeben (a ist die auf S. 275 gewählte Schrittweite). Die Koeffizienten xk von x b sind gerade die Koeffizienten der Laurentreihe X. Es ist dann x b(ω) =
+∞ X
k=−∞
xk e
−jkωa
jωa
= X(e
a ) und xk = 2π
2π/a ˆ
X(ejωa ) ejkωa dω .
0
Für alle im Folgenden verwendeten Signale x, h etc. sei ab jetzt generell vorausgesetzt, dass sie wie oben beschrieben exponentiell beschränkte Koeffizienten besitzen, d.h. dass ihre z-Transformierten in einem Kreisring r < |z| < R konvergieren, wenn r 6= R ist.
Für explizit angegebene Signale kann man das Konvergenzgebiet ihrer z-Transformierten oft mit dem aus der Grundlagen-Analysis bekannten Quotientenkriterium oder auch mit dem Wurzelkriterium berechnen.
306
10 Grundlagen über Lineare Filter
Beispiele. 1. Für R > 0 und r > 0 sei x =
+∞ X
xk δk gegeben durch xk =
k=−∞
Die z-Transformierte von x ist dann X(z) =
−1 X
Rk z −k +
k=−∞
+∞ X
rk z −k =
k=0
Rk rk
für k < 0 . für k ≥ 0
z z + , R−z z−r
wobei die beiden geometrischen Reihen konvergieren, wenn sowohl |z/R| < 1 als auch |r/z| < 1 sind. Die z-Transformierte ist daher im Kreisring r < |z| < R definiert und stellt dort eine holomorphe Funktion dar, wenn r < R ist. +∞ X Folgerung: Für x = δk ist die z-Transformation nicht definiert. k=−∞
2. Das diskrete Analogon zur Einheitssprungfunktion ist u mit Koeffizienten uk = 0 für k < 0 und uk = 1 für k ≥ 0. Dann ist die z-Transformierte U (z) =
+∞ X
k=0
z −k =
1 . 1 − z −1
Die Reihe konvergiert für |z| > 1, also im Äußeren der Einheitskreisscheibe.
Grundlegende Eigenschaften der z-Transformation Wir beschränken uns auf diejenigen elementaren Eigenschaften der z-Transformation, die wir in unseren Anwendungsbeispielen verwenden. Eine weitergehende Behandlung ihrer Eigenschaften und zahlreichen Anwendungsmöglichkeiten und auch eng verwandte andere Transformationen können interessierte Leser in den Büchern von E. I. Jury (1973), von A. V. Oppenheim, R. W. Schafer (1999) oder H. W. Schüßler (2008) finden. 1. Linearität Die z-Transformation ist linear, da man konvergente Reihen gliedweise addieren und mit Skalaren multiplizieren kann. Für die Summenbildung zweier z-Transformierten ist dabei vorauszusetzen, dass ein gemeinsamer Konvergenzkreisring existiert. 2. z-Transformation von Translationen Hat ein Signal x die z-Transformierte X(z), dann zeigt die Definition von X(z), dass die Translation x ∗ δk um ka die z-Transformierte z −k X(z) hat. Beispiel: Sei x das bei k = 0 beginnende 2N -periodische Rechteck-Signal mit xk = 1 für k = 0, . . . ,N −1, xk = 0 für k = N, . . . ,2N − 1 und xk+2N = xk (k ≥ 0), also N −1 ∞ X X z N +1 x= δk ∗ δ2N k . Dann ist die z-Transformierte X(z) = . (z − 1)(z N + 1) k=0
k=0
10.6 Diskrete lineare Filter, z-Transformation
307
3. Differentiation von z-Transformierten Laurentreihen dürfen in ihrem Konvergenzring gliedweise differenziert werden. Wenn +∞ X daher ein diskretes Signal x = xk δk die z-Transformierte X(z) besitzt, dann ist k=−∞ +∞ X
−zX ′ (z) die z-Transformierte von
kxk δk .
k=−∞
4. z-Transformierte komplex konjugierter Signale Hat ein Signal x die z-Transformierte X(z), dann besitzt das komplex konjugierte Signal x die z-Transformierte X(z). 5. z-Transformation von Faltungen Gegeben sei ein diskretes lineares Filter L : Z → A und h = Lδ in einem der betrachteten 7 Fälle von S. 301. Wenn X(z) im Kreisring A1 und H(z) im Kreisring A2 konvergieren und A = A1 ∩ A2 nicht leer ist, dann gilt für y = x ∗ h und z ∈ A Y (z) = H(z) · X(z). Beweis. Für x und h mit Koeffizienten xk und hk und z ∈ A gilt ! ! +∞ +∞ X X X −n −n −k < +∞. |hk ||xn−k ||z| ≤ |xn ||z| |hk ||z| n,k∈Z
n=−∞
k=−∞
Da die Funktion (n,k) → hk xn−k z −k summierbar über Z2 ist, kann sie nach dem Satz von Fubini (Anhang B, S. 416) in jeder Umordnung summiert werden. Daher erhält man für y = x ∗ h ! +∞ +∞ +∞ +∞ X X X X Y (z) = hk z −k xn−k z −(n−k) , hk xn−k z −n = n=−∞
k=−∞
k=−∞
n=−∞
woraus die Behauptung für alle z ∈ A folgt. 6. z-Transformation der Impulsantwort stabiler kausaler diskreter Filter Ein diskretes Filter mit Übertragungsfunktion H ist genau dann stabil, wenn die Einheitskreislinie im Konvergenzkreisring der Reihe enthalten ist. Für kausale Filter ist dies genau dann der Fall, wenn alle Singularitäten von H im Inneren der Einheitskreisscheibe liegen. Dies folgt sofort aus dem Satz auf Seite 303 zur Charakterisierung stabiler kausaler Filter, denn Übertragungsfunktionen H kausaler Filter mit exponentiell beschränkten Koeffizienten haben ein Konvergenzgebiet der Form |z| > r ≥ 0 (vgl. S. 305) und gehören zu einem stabilen Filter genau dann, wenn r < 1 gilt. 7. Umkehrung der z-Transformation Nach dem Identitätssatz für Laurentreihen ist die z-Transformation umkehrbar. Man kann die Koeffizienten xn eines Signals x bei gegebener z-Transformierter X auf verschiedene Weise berechnen:
308
10 Grundlagen über Lineare Filter (a) Durch Laurentreihenentwicklung von X. (b) Durch ein Umlaufintegral mit Hilfe des Residuensatzes. Die Funktion f : C\{0} → C mit f (z) = z k , k ∈ Z, ist stetig in einer Umgebung der Kreislinie γ(t) = r ejt mit r > 0 und 0 ≤ t < 2π. Das Umlaufintegral im mathematisch positiven Sinn ist ‰
k
z dz = γ
ˆ2π
k jkt
r e
jt
jr e dt = jr
k+1
ˆ2π
e
j(k+1)t
dt =
0
0
0 2πj
für k 6= −1, für k = −1.
Es ist insbesondere unabhängig vom Radius r. Eine z-Transformierte X ist entlang eines positiv durchlaufenen Kreises γ in ihrem Konvergenzring absolut und gleichmäßig konvergent. Vertauschung von Integration und Summation ergibt für die Koeffizienten des Signals x Darstellungen als Kurvenintegrale: 1 2πj
‰
γ
X(z) · z n−1 dz =
‰ +∞ 1 X xk ·z n−1−k dz = xn . 2πj γ k=−∞
Die Auswertung der Umlaufintegrale kann mit Hilfe des Residuensatzes aus der Funktionentheorie geschehen (siehe Anhang A). In der Praxis verwendet man bei linearen Filtern überwiegend rationale Übertragungsfunktionen. Die Rücktransformation ihrer Partialbrüche kann dann mit Hilfe geometrischer Reihen (vgl. nachfolgend Beispiel 4 und Beispiel 1 auf S. 314) oder mittels Tabellen, die in Formelsammlungen vorliegen, erfolgen. Auch mit Computeralgebrasystemen wie Maple oder Mathematica und dem insbesondere in Ingenieurbereichen weit verbreiteten Matlab können z-Transformationen und ihre Inversen berechnet werden. So sind Anwendungen der z-Transformation auch Lesern verfügbar, die bisher noch keine Erfahrung mit den in den folgenden Beispielen verwendeten Sätzen der Funktionentheorie haben. Erste Anwendungsbeispiele Mit den Transformationsregeln findet man schnell neue Korrespondenzpaare von Signalen und ihren z-Transformierten. Die z-Transformation von Faltungen erlaubt es, bei kausalen linearen Filtern, die durch Differenzengleichungen beschrieben sind, sofort die Übertragungsfunktion anzugeben. Das erste Beispiel zeigt diese Anwendung auf Faltungen. 1. z-Transformation für Differenzengleichungen. Die Koeffizienten yn der Systemantwort eines kausalen Filters y = x ∗ h auf X mit Impulsantwort h = δ0 + δ1 erfüllen für alle n ∈ Z die Differenzengleichung yn = xn + xn−1 . Die Übertragungsfunktion des Filters ist H(z) = 1 + z −1 = (z + 1)/z mit dem Konvergenzgebiet |z| > 0. Ebenso wird die Differenzengleichung yn + yn−1 = xn + 2xn−1 + xn−2 für die Koeffizienten von x und y erfüllt. Dieser für alle Koeffizienten von x und y gültigen Beziehung entspricht folgende Faltungsgleichung für die Signale insgesamt: y ∗ (δ0 + δ1 ) = x ∗ (δ0 + 2δ1 + δ2 ).
10.6 Diskrete lineare Filter, z-Transformation
309
z-Transformation beider Seiten der Gleichung führt auf Y (z)(1 + z −1 ) = X(z)(1 + 2z −1 + z −2 ), und damit auf die gleiche Übertragungsfunktion H für |z| > 0 H(z) =
1 + 2z −1 + z −2 z+1 = . 1 + z −1 z
Die Gleichung Y (z) = H(z)X(z) gilt für z mit |z| > 0 im Konvergenzgebiet von X. 2. Anwendung der Differentiationsregel. Das diskrete Signal u =
+∞ X
δk besitzt die z-
k=0 ′
z z mit |z| > 1. Dann ist X(z) = −zU (z) = z−1 (z − 1)2 +∞ X mit |z| > 1 die z-Transformierte von x = kδk .
Transformierte U (z) =
k=0
3. Anwendung der komplexen Konjugation. Gegeben sei ein reelles diskretes Signal s, das aus der Abtastung einer cos-Funktion mit Abtastintervall a > 0 entsteht: s=
+∞ X
cos(ω0 ka + ϕ)δk .
k=0
Das Signal s ist dann der Realteil des komplexen Signals sc =
+∞ X
ej(ω0 ka+ϕ) δk .
k=0
Die z-Transformierte von sc ist jϕ
Sc (z) = e
+∞ jω0 a k X e k=0
z
=
z ejϕ . z − ejω0 a
Dann ergibt sich die z-Transformierte S von s = (sc + sc )/2 als z 2 cos(ϕ) − z cos(ω0 a − ϕ) z ejϕ z e−jϕ 1 = + . S(z) = 2 z − ejω0 a z − e−jω0 a z 2 − 2z cos(ω0 a) + 1 4. Laurentreihenentwicklung. Gegeben sei X(z) = die geometrischen Reihen
X(z) = z −4
∞ X
k=0
z −3 . Es gibt die Entwicklungen in z+4
(−4z −1 )k für |z| > 4 oder
∞ z −3 X z k für 0 < |z| < 4. − X(z) = 4 4 k=0
310
10 Grundlagen über Lineare Filter Im ersten Fall ist das Signal x mit z-Transformierter X im Gebiet |z| > 4 gegeben durch die Koeffizienten k−4 für k ≥ 4, xk = (−4) 0 sonst. Im zweiten Fall hat das Signal x mit z-Transformierter X im Kreisring 0 < |z| < 4 die Koeffizienten 3−k 1 1 für k ≤ 3, xk = 4 − 4 0 sonst. Wenn ein Signal x ∈ X eine z-Transformierte besitzt, dann ist die z-Transformierte eindeutig bestimmt. Man erkennt im Beispiel aber, dass verschiedene Signale durchaus den gleichen algebraischen Ausdruck als z-Transformierte besitzen können. Um die Inverse zu bestimmen, muss daher der interessierende Konvergenzbereich der Laurentreihe gegeben sein. Ist zur oben angegebenen rationalen Funktion X etwa zusätzlich bekannt, dass sie die z-Transformierte eines kausalen Signals ist, dann kommt nur die Laurentreihe des ersten Falles in Frage.
5. Inversion mit dem Kurvenintegral und dem Residuensatz. Wir betrachten als Beispiel die z-Transformierte X(z) = z(z − z1 )−1 , z1 6= 0 und |z| > |z1 | als Konvergenzgebiet. Bezeichnen wir mit fn (z) = X(z)z n−1 den Integranden des Kurvenintegrals oben in 7(b), dann folgt mit dem Residuensatz (vgl. Anhang A, S. 405): a) Für n ≥ 0 mit dem Pol bei z1 ‰ 1 fn (z) dz = Res(fn ,z1 ) = lim (z − z1 )fn (z) = z1n . xn = z→z1 2πj |z|=2|z1 | b) Für n < 0 hat fn einen weiteren Pol bei z = 0. Das Residuum für z = 0 erhält man durch die Laurentreihenentwicklung um den Nullpunkt +∞
fn (z) =
X z n+k zn zn 1 . =− =− z − z1 z1 1 − z/z1 z1k+1 k=0
Das Residuum ist der Koeffizient von z −1 , also −z1n . Mit einer Kurve C im Residuensatz (S. 405), die für n < 0 beide Pole von fn umläuft, kompensieren sich in der Summe also die beiden Residuen für z = 0 und z = z1 . +∞ X z1n δn . Die inverse z-Transformierte von X lautet daher x = n=0
Auf die gleiche Weise erhält man mit dem Residuensatz für X(z) = z(z − z1 )−2 und n ≥ 0 mit fn wie oben xn = lim
z→z1
d [(z − z1 )2 fn (z)] = nz1n−1 dz
und analoge Formeln bei Polen höherer Ordnung.
10.6 Diskrete lineare Filter, z-Transformation
311
Kausale Filter mit rationaler Übertragungsfunktion, Differenzengleichungen Mit Blick auf Anwendungen betrachten wir ab jetzt diskrete Filter y = h ∗ x für kausale Signale x ∈ ld∞ , bei denen der Zusammenhang zwischen den Koeffizienten von y und x durch eine lineare Differenzengleichung mit konstanten Koeffizienten gegeben ist: M X
bk yn−k =
N X
am xn−m mit b0 = 1.
m=0
k=0
Damit das Ausgangssignal y eindeutig bestimmt ist, setzen wir außerdem voraus, dass das Filter kausal sein soll. Damit werden nicht-triviale Lösungen der homogenen Gleichung ausgeschlossen. Die z-Transformation der zugehörigen Faltungsgleichung für x und y lässt sich dann direkt an der Differenzengleichung ablesen (vgl. Beispiel 1 auf S. 308): ! ! N M X X am z −m X(z). bk z −k Y (z) = m=0
k=0
Nach Voraussetzung konvergiert X(z) jedenfalls für |z| > 1 und H(z) für z mit einem hinreichend großen Betrag (vgl. S. 305). Daraus folgt nach dem Faltungssatz (S. 307) die rationale Übertragungsfunktion H des Filters N X
am z −m Q(z) . H(z) = = m=0 M P (z) X −k bk z k=0
Die vorausgesetzte Kausalität des Filters ergibt für den Eingangsimpuls x = δ0 , dass für Indizes k < 0 alle Filterkoeffizienten hk = 0 sein müssen. Speziell sind dann die Anfangswerte h−M = . . . = h−1 = 0 zur rekursiven Lösung der Differenzengleichung festgelegt, so dass damit alle hk für k ≥ 0 und somit die eindeutig bestimmte Impulsantwort h folgen. Wir erhalten für das kausale Filter mit der rationalen Übertragungsfunktion H(z) = Q(z)/P (z) die Gleichung ! ! M N +∞ X X X −k −n = am z −m . bk z hn z n=0
k=0
m=0
Berechnung der Koeffizienten im Reihenprodukt der linken Seite, Koeffizientenvergleich und Auflösen nach den gesuchten Koeffizienten hn ergeben damit die folgenden Rekursionsgleichungen für die Koeffizienten der Impulsantwort des Filters h0 = a0 und hn = an −
n X
bk hn−k für n = 1,2, . . . (b0 = 1)
k=1
wobei an = 0 für n > N und bk = 0 für k > M gesetzt werden.
312
10 Grundlagen über Lineare Filter
Realisierung von Filtern mit rationaler Übertragungsfunktion Die nachfolgende Darstellung zeigt ein in der Elektrotechnik übliches Bildnetzwerk (im Bildbereich der z-Transformation), mit Multiplikatoren ⊗, Addierern ⊕ und Haltegliedern für je einen Zeitschritt a, die mit z −1 bezeichnet werden. Das Blockschaltbild zeigt eine mögliche Realisierung – als Schaltung oder mittels Software – des zuletzt besprochenen kausalen Filters, wobei wir ohne Einschränkung M = N setzen können. Durch Umstellen der Differenzengleichung kann man das Blockschaltbild gut nachvollziehen: yn = a0 xn +
N X
(am xn−m − bm yn−m )
m=1
x
⊗a
⊗a
N
⊕ ⊗ −b
z−1
N
⊗a
2
⊕ ⊗ −b
z−1
2
⊗a
1
⊕ ⊗ −b
z−1
⊕
0
y
1
Es gibt auch andere Realisierungsmöglichkeiten des gleichen Filters (charakterisiert durch andere Klammersetzungen in der Differenzendarstellung oder Varianten in der Darstellung von H). Hierzu sei verwiesen auf schon zitierte Literatur zur Schaltungsentwicklung wie U. Tietze, Ch. Schenk (2002), R. Unbehauen (1984), H. W. Schüßler (2008) u.a. Bemerkung. Andere Schrittweiten a > 0 bei den betrachteten diskreten Signalen x ergeben entsprechend andere Perioden 2π/a bei den Spektren x b und andere Bandbreiten der betrachteten Filter. Die Multiplikation einer z-Transformierten X mit z −k entspricht für k > 0 bei einer Schrittweite a > 0 einer Verzögerung um ka. Man erkennt an dem Blockschaltbild auch, dass es durch variable Wahl der Koeffizienten ak , bk möglich ist, ganz unterschiedliche Übertragungsfunktionen mit der gleichen Schaltung oder mit der gleichen Software zu realisieren – ein Sachverhalt, der weitreichende technische Möglichkeiten eröffnet. Gleiches gilt für analoge Frequenzgänge mit dem Blockschaltbild von S. 194. Diese einfachen Realisierungsmöglichkeiten erklären die herausragende Rolle, die Filter mit rationalen Übertragungsfunktionen in der Technik einnehmen. Beispiel. Lösung einer Differenzengleichung für die Fibonacci-Zahlen Die Fibonacci-Zahlen fn , zu Beginn des 13. Jahrhunderts erschienen in dem Buch Liber Abaci von Leonardo da Pisa, auch Leonardo Fibonacci genannt, haben zahlreiche Anwendungen. Bei Interesse können Leser schnell solche Anwendungen recherchieren, etwa bei der Laufzeitberechnung von Algorithmen wie dem Euklidischen Algorithmus zur Berechnung größter gemeinsamer Teiler und andere mehr. Wir betrachten das kausale Filter zur Differenzengleichung
10.6 Diskrete lineare Filter, z-Transformation
313
fn − fn−1 − fn−2 = xn−1 . Die Koeffizienten der Impulsantwort des Filters für n ≥ 0, hier als fn notiert, bilden die Fibonacci-Folge (f0 , f1 , f2 , . . .) = (0,1,1,2,3,5,8, . . .). Mit der z-Transformation findet man leicht eine geschlossene Darstellung der FibonacciZahlen. Als Übertragungsfunktion H, deren Koeffizienten die Fibonacci-Zahlen fn sind, erhält man z z −1 = , H(z) = −1 −2 1−z −z (z − z1 )(z − z2 ) mit
√ √ 1+ 5 1− 5 z1 = und z2 = . 2 2 z1 1 z2 Partialbruchzerlegung von H(z) = √ und dann Entwicklung der − z − z2 5 z − z1 Partialbrüche in Laurentreihen im Gebiet |z| > |z1 | wie schon in Beispielen vorher (vgl. Beispiel 1 auf S. 306) ergibt für n ≥ 0 1 fn = √ (z1n − z2n ). 5 √ Die Quotienten fn+1 /fn konvergieren für n → ∞ p gegen g = (1 + 5)/2. Für zwei Intervalle mit Längen L und S < L, so dass S = L(L − S) gilt, ist S der Goldene Schnitt und es gilt S = L/g. Es gilt die Abschätzung g n−2 ≤ fn für n ≥ 2 (Übung). Kausalität und Stabilität von Filtern mit rationaler Übertragungsfunktion Eine rationale Übertragungsfunktion H mit Polstellen z1 , . . . ,zM ist die z-Transformierte eines Filters mit kausaler Impulsantwort h genau dann, wenn man als Konvergenzgebiet A von H festlegt A = {z ∈ C : |z| > r} mit r = max{|z1 |, . . . ,|zM |} und wenn der Grad des Zählerpolynoms von H den Grad des Nennerpolynoms nicht übersteigt. (Hinweis: Man notiere H in Beispielen nicht wie vorher mit Potenzen von z −1 , sondern als Polynombruch mit Potenzen z k , k ≥ 0.) Begründung: Man erkennt sofort, dass h nicht kausal sein kann, wenn der Zählergrad von H größer als der Nennergrad ist und damit H einen Polynomanteil besitzt. Umgekehrt zeigt Laurentreihenentwicklung der Partialbrüche für rationale H im Gebiet A die Kausalität der damit gewonnnenen Impulsantwort h, wenn der Zählergrad den Nennergrad nicht übersteigt. Eine entsprechende Entwicklung in einem Ringgebiet mit |z| < r (d.h. mit einem Pol im Außengebiet) führt auf eine Laurentreihe mit einem analytischen Potenzreihenanteil und damit zu einer nicht-kausalen assoziierten Impulsantwort h (vgl. Beispiel 4, S. 309 und Aufgabe 12 am Kapitelende). Ein kausales Filter mit rationaler Übertragungsfunktion H hat nur Pole als Singularitäten und ist stabil genau dann, wenn diese innerhalb des Einheitskreises liegen (Nr. 6, S. 307).
314
10 Grundlagen über Lineare Filter
Stabile inverse Filter, stabile Signalrekonstruktion Wir betrachten weiterhin kausale Filter y = h ∗ x mit rationaler Übertragungsfunktion H und einer zugehörigen Differenzengleichung wie auf S. 311. H hat dann höchstens so viele Nullstellen wie Pole. Die Eingangssignale x seien wie zuletzt kausale Signale aus ld∞ . Das inverse Filter entsteht, wenn man die Rollen von Eingangs- und Ausgangssignalen vertauscht. Zunächst seien Beispiele betrachtet, die zeigen, was dabei zu beachten ist. Beispiele. 1. (Kausale stabile inverse Filter) Gegeben sei das kausale stabile Filter y = h ∗ x mit endlicher Impulsantwort h = δ0 − δ1 /4 − δ2 /8 und Übertragungsfunktion 1 (z − 1/2)(z + 1/4) 1 H(z) = 1 − z −1 − z −2 = 4 8 z2 für |z| > 0 sowie zugehöriger Differenzengleichung
1 1 yn = xn − xn−1 − xn−2 . 4 8 Die Anzahl der Nullstellen und Pole von H stimmt überein und alle Nullstellen und Pole liegen im Inneren des Einheitskreises. Daher gibt es ein kausales stabiles inverses Filter: Auflösen der Differenzengleichung nach xn ergibt xn = yn +xn−1 /4+xn−2 /8 und damit das inverse Filter mit der Übertragungsfunktion Hinv (z) =
1 1−
z −1 /4
−
z −2 /8
=
z2 1 = . (z − 1/2)(z + 1/4) H(z)
Hinv hat folgende Partialbruchzerlegung und Laurentreihendarstellung für |z| > 1/2 (hier Lesern als kleine Rechenübung aufgegeben, vgl. S. 410 und S. 309): ∞ 1/3 1/12 1 X 4 k+1 1 z −(k+1) . + (−1) Hinv (z) = 1 + − =1+ z − 1/2 z + 1/4 12 2k 4k k=0
Das inverse Filter mit Impulsantwort hinv , der inversen z-Transformierten von Hinv (z) (|z| > 1/2), ist daher kausal und auch stabil (vgl. S. 313). Es hat allerdings eine unendlich lange Impulsantwort und ist damit ein sogenanntes IIR-Filter (engl. Infinite Impulse Response Filter). Es gilt h ∗ hinv = hinv ∗ h = δ0 und für kausale Signale x aus ld∞ sind die Faltungen hinv ∗ (h ∗ x) = (hinv ∗ h) ∗ x = x assoziativ (vgl. S.162). Der Frequenzgang b hinv ist wie b h wegen des exponentiell schnellen Abfallens seiner Fourierkoeffizienten unendlich oft differenzierbar, wie generell bei stabilen Filtern mit rationaler Übertragungsfunktion (vgl. S. 41, das 1/f -Theorem von N. Wiener in Abschnitt 5.6 und die Laurentreihen der Partialbrüche von H und Hinv ). ∞ ∞ ∞ X X X Haben für y = h∗ x, y k δk = h k δk ∗ xk δk die Eingangssignale x eine feste k=0
k=0
k=0
Länge N + 1, d.h. xk = 0 für k > N , und setzt man x = (x0 ,x1 , . . . ,xN )T , dann kann man x bereits mit y = (y0 ,y1 , . . . ,yN )T und den ersten N + 1 Koeffizienten von hinv rekonstruieren, die sich nachfolgend auch in der zu H inversen Matrix H −1 zeigen:
10.6 Diskrete lineare Filter, z-Transformation
315
y = H x und x = H −1 y,
H=
h0 h1 h2 .. .
0 h0 h1
0 ... 0 ... h0 . . . .. .
hN hN −1 . . .
0 0 0
hinv,0 hinv,1 hinv,2 .. .
0
0 0
hinv,0 −1 h inv,1 hinv,0 und H = 0 h0 hinv,N hinv,N −1 . . .
... ... ... .. .
0 0 0
0
hinv,0
2. (Kausale instabile inverse Filter) Inversion des stabilen kausalen Filters y = h ∗ x mit yn = xn − xn−1 ergibt durch Auflösung nach xn das inverse Filter mit der Differenzengleichung xn = yn + xn−1 für das Eingangssignal y und Ausgangssignal x. Das inverse Filter, der Akkumulator von S. 301, ist kausal, aber instabil, da aus der Nullstelle z = 1 von H ein Pol von Hinv = 1/H auf der Einheitskreislinie wird. Bei fehlerbehafteten Werten yn werden dann bei der Inversion von y = h ∗ x sämtliche Fehler in yk für k ≤ n in xn aufaddiert. Dies kann bei der Inversion zu einem Ergebnis führen, das mit dem Ursprungssignal x wenig mehr gemein hat. 3. (Nicht-kausale stabile inverse Filter) H(z) = z −1 , |z| > 0, ergibt mit h = δ1 ein kausales stabiles Filter , Hinv (z) = z, z ∈ C, mit hinv = δ−1 ein stabiles nichtkausales Filter. Hier ist der Grad des Zählers von H kleiner als der Grad des Nenners. Die Übertragungsfunktion H(z) = 1 − 2z −1 = (z − 2)/z, (|z| > 0), des kausalen Filters mit Impulsantwort h = δ0 − 2δ1 hat die Nullstelle z = 2. Die Laurentreihe von 1/H im Gebiet |z| < 2 als z-Transformierte der Inversion mit der Impulsantwort ∞ X hinv = − 2−k δ−k ergibt ein stabiles nicht-kausales Filter (vgl. S. 313). k=1
4. (Nicht-kausale instabile inverse Filter) Wählt man in Beispiel 1 für die Impulsantwort hinv die Koeffizienten einer Laurentreihenentwicklung von 1/H in einem Gebiet A mit |z| < |z0 | für eine Nullstelle z0 von H und alle z ∈ A, dann ist hinv nicht-kausal. Weil dort dann die Einheitskreislinie nicht in A liegt, ist das zugehörige Filter instabil. Folgerungen. 1) Ist der Grad des Zählerpolynoms von H kleiner als der Grad des Nennerpolynoms, dann ist das inverse Filter nicht-kausal. Wählt man für die Laurentreihenentwicklung von 1/H einen Konvergenzkreisring mit einer Nullstelle von H im Außengebiet, dann wird das zugehörige inverse Filter nicht-kausal. Stabilität des inversen Filters bleibt nach dem 1/f -Theorem von N. Wiener (vgl. S. 64) erhalten, wenn die Einheitskreislinie in einem solchen Gebiet liegt (Beweis: Reihenentwicklung der Partialbrüche von 1/H). 2) Hat man als Konvergenzbereich für die Laurentreihenentwicklung von 1/H das Gebiet A = {z ∈ C : |z| > r} mit r = max{|z1 |, . . . ,|zN |} mit so vielen Nullstellen z1 , . . . ,zN von H wie H Pole hat, dann ist die zugehörige Impulsantwort hinv kausal. Wenn die Einheitskreislinie nicht in diesem Gebiet enthalten ist, ist das inverse Filter instabil. Gehört sie jedoch zu diesem Gebiet, dann ist auch das inverse Filter stabil. Man kann dann aus den Werten von y = h ∗ x mit Kenntnis von h das Eingangssignal stabil rekonstruieren, d.h. beschränkte Störungen von y haben auch nur beschränkte Fehler bei der Rekonstruktion von x zur Folge. Die Kombination von Kausalität und Stabilität eines Filters mit rationaler
316
10 Grundlagen über Lineare Filter
Übertragungsfunktion H bleibt bei der Inversion also nur dann erhalten, wenn alle Nullund Polstellen von H im Inneren der Einheitskreisscheibe liegen und H so viele Nullstellen wie Pole hat. Filter mit dieser Eigenschaft sind sogenannte Minimalphasen-Filter (vgl. Aufgabe A13 am Kapitelende). Amplitudengang, Phasengang, Gruppenlaufzeit Für ein diskretes Filter mit einem stückweise differenzierbaren Frequenzgang b h(ω) ist |b h(ω)| der Amplitudengang, Φ(ω) = arg(b h(ω)) der Phasengang, die bis auf endlich viele Stellen definierte Funktion D(ω) = − dΦ(ω) / dω seine Gruppenlaufzeit (vgl. S. 280).
Eine rationale Übertragungsfunktion H 6= 0 eines Filters wie auf S. 311 wird häufig in faktorisierter Form dargestellt. Wie dort sei der Koeffizient des Nennerpolynoms b0 = 1. Weiter sei r der kleinste Index, so dass ar unter den Koeffizienten des Zählers Q nicht Null ist. Für N > r und M ≥ 1 hat H mit den Nullstellen ck , den Polstellen dk und eventuell dem Nullpunkt als |M − N |-fache Pol- oder Nullstelle die Gestalt
H(z) =
N −r Y
ar z M−N k=1 M Y k=1
(z − ck )
.
(z − dk )
Geübte Ingenieure erkennen an der Lage der Nullstellen ck und der Polstellen dk oft schnell charakteristische Eigenschaften des Filters. Die Impulsantwort kann bei konkret gegebenen Null- und Polstellen durch Partialbruchzerlegung von H erhalten werden, wie in Beispielen schon gezeigt. Ist das Filter stabil mit dem Frequenzgang b h(ω) = H(ejωa ), so zeigt Logarithmieren des Amplitudengangs 20 log10 |b h(ω)| = 20 log10 |ar | +
N −r X k=1
20 log10 | ejωa −ck | −
M X
k=1
20 log10 | ejωa −dk |.
Dabei wird die logarithmische Einheit dB (Dezibel) verwendet und man sieht: Die Amplitudendämpfung in dB für die Kreisfrequenz ω setzt sich additiv zusammen aus der Konstante |ar | und den Längen der Nullvektoren nk = ejωa −ck abzüglich der Längen der Polvektoren pk = ejωa −dk , alle gemessen in dB. Dabei entspricht eine Amplitudendämpfung um 6 dB etwa einem Amplitudenabfall um die Hälfte. Ebenso additiv verhält sich der Phasengang. Für 0 ≤ ω < 2π/a gilt M −r NX X Φ ejωa −dk . Φ ejωa −ck − Φ(ω) = Φ ar ejωa(M−N ) + k=1
k=1
Entsprechende Beziehungen für die oben ausgeschlossenen Fälle N = r oder M = 0 sieht man analog. Für N = r wird der Zähler von H zu ar z M−r , für M = 0 bei nicht-rekursiven Filtern wird der Nenner von H gleich Eins. Die Darstellungen der Amplitudendämpfung in dB und des Phasengangs sind dann entsprechend anzupassen.
10.6 Diskrete lineare Filter, z-Transformation
317
Für Anwendungen in der Praxis haben Filter mit linearer Phase eine große Bedeutung. Man vergleiche etwa die Bemerkung auf S. 280 zu Phasenverzerrungen von nur wenigen Millisekunden bei Filtern in Audioanwendungen oder denke an Übertragungssysteme, die Phasenmodulationsverfahren verwenden. Für Filter y = h ∗ x mit linearer Phase ist die mit Ausnahme eventueller Sprungstellen der Phasenfunktion definierte Gruppenlaufzeit die konstante frequenzunabhängige Phasenverzägerung des Filters. Filterbeispiele, Filterentwurf Die bisherigen Ausführungen sollen nun natürlich auch durch konkrete Filterbeispiele ergänzt werden. Eine Hauptaufgabe des Filterentwurfs in der Praxis ist, ideale, oft nichtrealisierbare Filter innerhalb gegebener Toleranzbereiche durch realisierbare stabile Filter zu approximieren. Wir beschränken uns im Folgenden auf je ein signifikantes Beispiel zu den zwei wesentlichen Filtertypen der FIR-Filter (Finite Impulse Response Filter) und der IIR-Filter (Infinite Impulse Response Filter). Wenn bei Lesern das Interesse geweckt wird, die dargelegten Grundbegriffe mit der reichhaltigen weiterführenden Literatur über diskrete Signalverarbeitung und ihre Anwendungen zu vertiefen, so finden sie exzellente Quellen in den Büchern von A. V. Oppenheim, R. W. Schafer (1999), E. I. Jury (1973), H. Wupper (1998), U. Tietze, Ch. Schenk (2002), K.-D. Kammeyer, K. Kroschel (2012) u.v.a.m. Kausale FIR-Filter mit reellen Koeffizienten und linearer Phase FIR-Filter sind Filter mit endlicher Impulsantwort. Solche Filter sind immer stabil, da ihre Frequenzgänge trigonometrische Polynome sind. Wir zeigen zunächst, dass kausale FIRFilter mit reellen Koeffizienten und konstanter Gruppenlaufzeit dadurch konstruiert werden können, dass an die Filterkoeffizienten gewisse Symmetriebedingungen gestellt werden. Man betrachte dazu ein Filter der Länge N ≥ 1 mit einer Übertragungsfunktion H der Form N −1 X H(z) = hn z −n n=0
mit reellen Koeffizienten hn und der Symmetrie hn = hN −1−n . Damit folgt 2H(z) =
N −1 X
hn (z n+1−N + z −n ) = z (1−N )/2
n=0
N −1 X n=0
hn z n−(N −1)/2 + z −n+(N −1)/2 .
Mit z = ejωa (a unsere Zeitschrittweite) erhalten wir den zugehörigen Frequenzgang b h mit der konstanten Gruppenlaufzeit (N − 1)a/2: N −1 X b h(ω) = H ejωa = ej(1−N )ωa/2 hn cos n=0
N −1 − n ωa . 2
318
10 Grundlagen über Lineare Filter
Bemerkung. FIR-Filter mit der oben verwendeten Koeffizientensymmetrie nennt man FIRFilter vom Typ I, wenn N ungerade ist, und FIR-Filter vom Typ II, wenn N gerade ist. Ganz analog kann man Filter der sogenannten Typen III und IV konstruieren, wenn man die obige Symmetriebedingung durch die Bedingung hn = −hN −1−n ersetzt. Man bezeichnet FIR-Filter auch als nicht-rekursive Filter, während man IIR-Filter rekursive Filter nennt. Da die Koeffizientenanzahl des Filters bei einer schaltungstechnischen Realisierung oder Programmierung der Anzahl der Multiplikatoren entspricht (vgl. S. 312), ist eine bezüglich der Anzahl von Multiplikationen sparsamere Darstellung unter Ausnutzung der gegebenen Symmetrie nützlich. Man rechne als Übung nach, dass für eine gerade Filterlänge N ≥ 2 die Übertragungsfunktion unseres FIR-Filters oben dargestellt wird durch H(z) =
(N −2)/2
X
hn (z −n + z −N +n+1 )
n=0
und für ungerade N ≥ 3 durch H(z) = h(N −1)/2 z
−(N −1)/2
+
(N −3)/2
X
hn (z −n + z −N +n+1 ).
n=0
Entwurf von FIR-Filtern durch Approximation mit einer Fensterfunktion Da die Frequenzgänge diskreter Filter periodisch sind, liegt es nahe, sie durch gewichtete Partialsummen ihrer Fourierreihenentwicklungen zu approximieren. Für Eingangssignale endlicher Zeitdauer, d.h. aus X ∩ E ′ , oder Signale aus ld2 betrachten wir dazu exemplarisch den Ω-periodischen Frequenzgang eines idealen Tiefpass-Filters mit Grenzkreisfrequenz 0 < ωg < Ω/2 = π/a 1 für |ω| ≤ ωg gb(ω) = 0 für ωg < |ω| < Ω/2. 1 Mit gn = Ω
+ω ˆ g
ejnωa dω wäre die Übertragungsfunktion G gegeben durch
−ωg
G(z) =
+∞ X
n=−∞
z −n gn =
+∞ 2ωg X −n sin(nωg a) . z Ω n=−∞ nωg a
Diese Übertragungsfunktion hat unendlich viele Koeffizienten und ist zudem nicht kausal. Eine Approximation mit einer Partialsumme, d.h. eine Näherung durch Multiplikation von G mit einem Rechteckfenster, hat beim Frequenzgang das Gibbs-Phänomen zur Folge (vgl. S. 20 und S. 113). Analog zur Beseitigung des Gibbs-Phänomens durch Fejér-Mittel, d.h. durch Gewichtung mit einem Dreiecksfenster (vgl. S. 25), kann man andere Fensterfunktionen verwenden. Es gibt viele verschiedene Fensterfunktionen, die in der Praxis Anwendung finden. Allen Fenstern ist gemeinsam, dass die verwendeten Gewichte wn zu den höheren Frequenzen hin bis auf Null abfallen und dadurch dem Gibbs-Phänomen entgegenwirken.
10.6 Diskrete lineare Filter, z-Transformation
319
Man vergleiche hierzu auch den nachfolgenden Abschnitt 11.5, in dem wir Fenstereffekte bei der diskreten Fouriertransformation noch einmal genauer betrachten. Eine ausführliche Diskussion gebräuchlicher Fensterfunktionen findet man bei D. Slepian (1983) oder D. Harris (1978). N −1 X Mit einem symmetrischen diskreten Fenster der Form w = wn δn und w−n = w+n n=1−N
e gebildet wird nun zu G die modifizierte Übertragungsfunktion G e G(z) =
N −1 X
wn z −n gn .
n=1−N
e gewinnt man schließlich eine kausale Aus dieser nicht-kausalen Übertragungsfunktion G Übertragungsfunktion H, mit welcher das Tiefpass-Filter approximiert wird. Durch Verzögerung, hier Multiplikation mit z 1−N ergibt sich mit der Symmetrie der Werte gn und wn die kausale approximierende Übertragungsfunktion H mit e jωa )| |H(ejωa )| = |G(e
e = H(z) = z 1−N G(z)
2(N −1)
X
n=0
z −n wN −n−1 gN −n−1 .
Ergebnis. Wir haben mit H eine Übertragungsfunktion eines kausalen Filters der Länge (2N −1) erhalten, das reelle Koeffizienten hat und die konstante Gruppenlaufzeit (N −1)a besitzt (a war der verwendete Zeitschritt bei unseren diskreten Signalen). Die folgende Darstellung zeigt für zwei verschiedene Fenster den Amplitudengang dieses Filters in db. Wir wählen N = 20 als Anzahl N der Filterkoeffizienten, ωg = Ω/4 und zwei cos-Fenster der Form ( 2nπ nπ + γ cos für 1 − N ≤ n ≤ N − 1 α + β cos wn = N −1 N −1 0 sonst. Das erste Beispiel verwendet mit α = 0.54, β = 0.46, γ = 0 das vielgebrauchte sogenannte Hamming-Fenster, das zweite mit α = 0.42, β = 0.5, γ = 0.08 das sogenannte Blackman-Fenster mit einer etwas höheren Dämpfung im Sperrbereich um den Preis eines weniger steilen Flankenabfalls im Übergangsbereich im Vergleich zum Entwurf mit dem Hamming-Fenster. Wegen seiner Periodizität ist der Frequenzgang b h eines diskreten Filters im Allgemeinen nur bis zur halben Abtastfrequenz 1/(2a) sinnvoll nutzbar. Aufgetragen ist jeweils der Amplitudengang in dB als Funktion von sΩ, 0 ≤ s ≤ 1/2, die Grenzkreisfrequenz ωg liegt auf der Abszisse also jeweils skaliert bei s = 1/4.
320 0 -20 -40 -60 -80 -100 -120 -140 0.0
10 Grundlagen über Lineare Filter
0.1
0.2
0.3
0.4
0.5
0 -20 -40 -60 -80 -100 -120 -140 0.0
0.1
0.2
0.3
0.4
0.5
Alternative Entwurfsmethoden für FIR-Filter gehen von einem Toleranzschema wie auf S. 283 aus und berechnen die Filterkoeffizienten nach vorgegebenen Optimalitätskriterien. Solche Kriterien können eine Minimierung des maximalen Approximationsfehlers oder auch frequenzgewichtete Fehlerkriterien sein. Als häufig verwendete Methode dieses Typs ist etwa der Algorithmus von Parks-McClellan zu nennen. Er wird ausführlich in dem Buch von A. V. Oppenheim, R. W. Schafer (1999) erörtert, auf das wir hierzu verweisen. Heute typische Filterlängen N von FIR-Filtern liegen etwa im Bereich von N = 58 in Mehrband-Grafik-Equalizern bis N = 160 und mehr bei Verwendung in CD-Playern. Besonders wichtige Anwendungsgebiete von FIR-Filtern sind das adaptive Filtern auf der Empfangsseite zur Kompensation von Verzerrungen in Übertragungskanälen und die Multiraten-Signalverarbeitung in Systemen mit unterschiedlichen Abtastraten. Dabei finden FIRFilter Verwendung bei der Dezimation und bei der Interpolation. Auch hierzu sei wieder auf die oben schon zitierte Spezialliteratur über digitale Signalverarbeitung verwiesen. Entwurf von IIR-Filtern mit der bilinearen Transformation Rationale Übertragungsfunktionen, deren Nennerpolynom nicht konstant ist, haben wegen der im Blockschaltbild auf S. 312 zu sehenden Rückführungen eine unendlich lange Impulsantwort. Sie heißen daher IIR-Filter (Infinite Impulse Response). Wie bei FIR-Filtern gibt es auch für IIR-Filter je nach Zweck unterschiedliche Entwurfsmethoden. Als Beispiel erläutern wir im Folgenden die Methode der bilinearen Transformation, mit der durch eine Transformation der Frequenzachse aus dem Frequenzgang eines stabilen Analogfilters ein entsprechendes stabiles diskretes Filter konstruiert wird. Gegeben sei also ein rationaler Frequenzgang R(jω) eines stabilen Analogfilters (vgl. Seite 289). Um daraus einen 2π/a-periodischen Frequenzgang eines stabilen diskreten Filters zu gewinnen, bildet man die Frequenzachse des Analogfilters bijektiv auf das Intervall ] − π/a,π/a[ ab. Eine Abbildung T , die das leistet, ist ωa 2 Ωa 2 mit der Umkehrabbildung T −1 (Ω) = V tan = ω. T (ω) = arctan a 2V a 2 Dabei bezeichnen Ω die Kreisfrequenz im diskreten Fall, 1/a die Abtastfrequenz des beabsichtigten diskreten Systems und V einen Faktor, mit dem eine Vorverzerrung erreicht werden kann, so dass etwa eine gewünschte Grenzfrequenz ωg /(2π) ein Fixpunkt unter der Abbildung T ist. Damit definieren wir den gewünschten Frequenzgang b h(Ω) des gesuchten diskreten Filters durch i π πh b h(Ω) = R(jT −1 (Ω)) f u ¨r Ω ∈ − , . a a
10.6 Diskrete lineare Filter, z-Transformation
321
Dass dieser Frequenzgang b h rational in z = ejΩa ist, erkennt man folgendermaßen: Die Möbius-Abbildung B : C → C der durch Hinzunahme des Punktes ∞ kompaktifizierten komplexen Ebene, definiert durch B(z) =
2V 1 − z −1 2V = s fu ¨r z ∈ C, B(−1) = ∞, B(∞) = , a 1 + z −1 a
ist bijektiv mit der Umkehrabbildung B −1 (s) = (2V /a + s)/(2V /a − s) = z für s ∈ C. Diese Abbildung B wird bilineare Transformation genannt. Man rechnet leicht die folgenden Eigenschaften der bilinearen Transformation B nach, welche die Stabilität des damit entworfenen diskreten Filters sichern: Für den Realteil von s = B(z) gelten die Äquivalenzen ℜ(s) = ℜ(B(z)) < 0 ⇐⇒ |z| < 1
ℜ(s) = ℜ(B(z)) = 0 ⇐⇒ |z| = 1
Für z = e
jΩa
ℜ(s) = ℜ(B(z)) > 0 ⇐⇒ |z| > 1
folgt aus j tan(x) = (1 − e−2jx )/(1 + e−2jx ), dass b h rational in z ist: 2V 1 − z −1 b h(Ω) = R(jT −1 (Ω)) = R = R(B(z)). a 1 + z −1
Ergebnis. H(z) = R(B(z)) ist die rationale Übertragungsfunktion des diskreten linearen Filters mit dem 2π/a-periodischen Frequenzgang b h(Ω) = H ejΩa . Ist R(jω) wie vorausgesetzt der Frequenzgang eines stabilen Analogfilters, dann ist auch das diskrete Filter mit der Übertragungsfunktion H stabil. Beispiel. Wir demonstrieren das Verfahren am Beispiel des Butterworth-Filters dritter Ordnung, dessen Frequenzgang wir auf S. 286 berechnet haben. Seine Grenzfrequenz war ωg /(2π) = 4.2 kHz. Um bei dem wie oben erzeugten diskreten Tiefpass-Filter diese Grenzfrequenz invariant zu lassen, wählen wir als Vorverzerrung V = ωg a/2 cot(ωg a/2). Damit folgt also T (ωg ) = ωg = T −1 (ωg ) und b h(ωg ) = R(jωg ). Der Frequenzgang R(jω) unseres Beispiels war 1 R(jω) = (1 + jω/ωg )(1 + jω/ωg + (jω/ωg )2 ) Ersetzen von jω durch B(z) ergibt mit c = ωg a als Übertragungsfunktion H(z) des diskreten Analogons, das man nach dem Blockschaltbild auf S. 312 realisieren könnte: −1 −1 2V 1 − z −1 2V 1 − z −1 4V 2 (1 − z −1 )2 H(z) = 1 + 1 + + . c 1 + z −1 c 1 + z −1 c2 (1 + z −1 )2 Die nachfolgenden Darstellungen – jeweils als Funktion von sωg , 0 ≤ s ≤ 4 – zeigen im linken Bild den Amplitudengang des analogen Butterworth-Filters und den wie oben erzeugten (2π)/a-periodischen Amplitudengang des entsprechenden diskreten Filters, im rechten Bild die Phasengänge der beiden Filter. Als Abtastfrequenz 1/a wurde 44.1 kHz gewählt. Die dicker gezeichneten Kennlinien sind die des diskreten Filters. Die Grenzkreisfrequenz ωg liegt auf der Abszisse bei s = 1.
322
10 Grundlagen über Lineare Filter 1.0
3 2 1 0 -1 -2 -3
0.8 0.6 0.4 0.2 0.0
0
1
2
3
4
0
1
2
3
4
Zum Vergleich ein paar Kennzahlen: An der Passband-Ecke 3 kHz hat der Frequenzgang des Analogfilters den Amplitudenbetrag 0.9395, der des diskreten Filters 0.9443. Die entsprechenden Werte an der Stoppband-Ecke 10 kHz sind 0.0739 beim Analogfilter, 0.0455 beim diskreten Filter. Bei der halben Grenzfrequenz 2.1 kHz ist der Wert 0.9923 beim Analogfilter, 0.9932 beim diskreten Filter. Bei der Grenzfrequenz 4.2 kHz haben beide Frequenzgänge aufgrund der gewählten Vorverzerrung den gleichen Amplitudenbetrag 0.7071. Auf analoge Weise lassen sich auch andere Filtertypen als Tiefpass-Filter mit der bilinearen Transformation gewinnen. Als alternative Entwurfsmethoden sind Verfahren zu nennen, aus Abtastwerten der Impulsantwort oder des Frequenzgangs eines nachzubildenden analogen Filters ein entsprechendes diskretes Filter zu konstruieren. Dabei ist wie bei der diskreten Fouriertransformation und dem im folgenden Abschnitt behandelten Abtastsatz von Shannon auf Alias-Effekte bei zu geringer Abtastfrequenz zu achten. Man findet diese Methoden in weiter oben schon zitierter Literatur zur digitalen Signalverarbeitung. Ein Vorteil von IIR-Filtern im Vergleich zu FIR-Filtern liegt darin, dass man zur Approximation eines gewünschten Amplitudengangs mit einer viel geringeren Filter-Ordnung als bei FIR-Filtern auskommt. Nachteile sind nichtlineare Verzerrungen der Frequenzachse wie bei der bilinearen Transformation, ein kaum erreichbarer linearer Phasengang, das Feedback von Rundungs- und Quantisierungsfehlern mit Auswirkungen auf die Stabilität u.a.m., die bei der Implementierung von IIR-Filtern große Sorgfalt erfordern. Bei anhaltendem Interesse greife man daher zur reichhaltigen Literatur zum Thema. Hinweise auf Anwendungen nicht-kausaler diskreter Filter Da unser Hauptaugenmerk bisher auf kausale lineare Filter gerichtet war, soll zum Abschluss dieses Kapitels nicht unerwähnt bleiben, dass in vielen Anwendungsbereichen durchaus auch nicht-kausale Filter verwendet werden können. Sieht man nämlich von Realzeit-Signalverarbeitung ab und denkt stattdessen an die Verarbeitung von komplett vorliegenden Datensätzen, wie Audiodaten von Musikstücken auf einer CD oder Bilddaten, dann erkennt man sofort, dass für die Verarbeitung auch nicht-kausale Filter eingesetzt werden können. Den meisten Lesern wird eine ganze Reihe verschiedener Filter aus Bildbearbeitungsprogrammen – etwa zur Kantenschärfung oder -glättung u.a. – schon geläufig sein. Auch hierzu sei nochmals auf die Literatur zu Spezialgebieten verwiesen. Ebenso können nicht-kausale Filter aber auch für Zeitreihen bei einer „Nahe-Realzeit-Verarbeitung“ mit ausreichender Daten-Pufferung verwendet werden. Als interessante Anwendungsmöglichkeit seien nicht-kausale Glättungsfilter in der Radio-Telemetrie genannt, wie sie von W. J. Hurd (1997) und in weiteren Quellen etwa zum Deep Space Network Galileo Telemetry System auf dem NASA Technical Reports Server besprochen wurden.
10.7 Übungsaufgaben
323
Zusammenfassung. Fourier-Analysis und Distributionentheorie haben ermöglicht, analoge und diskrete translationsinvariante lineare Systeme L : Z → A einheitlich und effektiv mit den gleichen mathematischen Mitteln darzustellen und zu behandeln. Solche Systeme unterscheiden sich im mathematischen Modell im Wesentlichen nur durch verschieden gewählte Signalräume Z und A. Grundlegende Systemeigenschaften bei geeigneten Signalräumen und Stetigkeitsbedingungen folgen aus den Darstellungen als lineare Filter und deren Charakterisierungen durch die Impulsantwort und den Frequenzgang. In Beispielen haben wir gesehen, wie man lineare Filter nach vorgegebenen Kriterien konstruieren kann. Im mathematischen Modell werden durch den Operator L Funktionen oder Distributionen, im Spezialfall diskreter Systeme Impulsfolgen verarbeitet. In der realen Praxis werden die idealisierten Modelle näherungsweise realisiert, bei analogen Filtern durch geeignete Schaltungen wie exemplarisch am Beispiel des Butterworth-Tiefpassfilters gezeigt. Bei diskreten Systemen sind die Koeffizienten der Impulsfolgen des mathematischen Modells in der Praxis sehr oft proportional zu quantisierten Abtastwerten analoger Signale. Die Signalverarbeitung durch lineare Filter kann dann in Prozessoren durch Verarbeitung nur der Koeffizienten erfolgen. So entstehende Koeffizientenfolgen von Ausgangssignalen können durch eine Digital-Analog-Wandlung zu einer Pulsfolge wieder in Analogsysteme eingespeist werden. Als Beispiele betrachte man etwa die Signalverarbeitung von Bildern oder Musik oder bei WLAN, DSL, DVB-T u.v.a.m. Eine schematische Darstellung in einem Signalflussdiagramm sehen wir im nachfolgenden Abschnitt 11.2 über Abtastverfahren und Interpolationen mit linearen Filtern. Alle besprochenen Filter sind heute zu geringen Kosten als Bauteile verfügbar oder als Software in zahllosen Anwendungen vertreten.
10.7 Übungsaufgaben Für die folgenden Aufgaben ist es nützlich, Mathematik-Software wie etwa Mathematica, Maxima, Maple oder Matlab in geeigneter Weise zu verwenden. A1) Beim Anschluss elektrischer Geräte an das Stromnetz wird oft ein Entstörfilter verwendet, das hochfrequente Schwingungen vom Benutzer fernhalten soll: L
Ue
C
R
Ua (t)
L
Wie groß ist die Amplitude von Ua bei kleinen Frequenzen (|ω| → 0) und bei hohen Frequenzen (|ω| → ∞) einer Eingangsgröße Ue (t) = U0 sin(ωt) ? A2) Berechnen Sie ein Butterworth-Tiefpassfilter (vgl. S. 283) zur Gleichspannungsverstärkung K=1, Passband-Ecke ω1 /(2π) = 3 kHz, Stoppband-Ecke ω2 /(2π) = 5 kHz, ˆ 1 = 0.9 und maximaler Stoppbandverstärkung mit minimaler Passbandverstärkung h ˆ h2 = 0.1.
324
10 Grundlagen über Lineare Filter
A3) Die dargestellte aktive Schaltung mit einem Operationsverstärker wird bei geeigneter Wahl der Kapazitäten C1 und C2 und Widerstände R1 und R2 ein Tiefpass-Filter zweiter Ordnung (Sallen-Key Biquad Filtertyp).
(a) Leiten Sie den Frequenzgang der Schaltung her. (b) Berechnen Sie mit C1 = 8 nF, C2 = 4 nF und Grenzfrequenz 10 kHz die Widerstände R1, R2, so dass die Schaltung ein√Butterworth-Tiefpassfilter 2. Ordnung mit Frequenzgang b hTP (ω) = 1/(1 + j 2ω/ωg − ω 2 /ωg2 ) ergibt.
(c) Wenn Sie in der Schaltung die Widerstände und die Kapazitäten vertauschen (bei analoger Nummerierung), erhalten Sie ein Hochpass-Filter 2. Ordnung. Berechnen Sie Übertragungsfunktion, Amplituden- und Phasengang des entstehenden Filters mit C1 = C2 = 100 nF und ωg /(2π) = 1000 Hz, so dass (jω)2 b hTP (ω) mit dem Butterworthdas Filter den Frequenzgang b hHP (ω) = ωg2 Frequenzgang b hTP aus (b) besitzt (Tiefpass-Hochpass-Transformation, S. 291).
A4) Verifizieren Sie die Aussagen in Beispiel 2 auf S. 292.
A5) (a) Verifizieren Sie die Aussagen in den Beispielen 3 und 4 auf S. 293. (b) Berechnen Sie mit den dort gegebenen Daten die Amplituden- und Phasengänge des Bandpass- und des Bandsperren-Filters in den Grafiken auf S. 293. (c) Berechnen Sie mit B = 1/3 die Pole im rechten Bild auf S. 292, die in den Beispielen 2 bis 4 auf den Seiten 292 - 293 für die Übertragungsfunktionen von Hochpass-, Bandpass- und Bandsperren-Filter genannt waren. Verwenden Sie dazu ein Computeralgebra-System und die Umkehrung der JoukowskyAbbildung wie in Aufgabe A26 von Kapitel 5 angegeben. (d) Erzeugen Sie aus dem Bandpass-Filter in (b) mit der bilinearen Transformation ein entsprechendes diskretes Filter. Plotten Sie Amplituden und Phasengang des Filters. Vergleichen Sie Analog-Filter und diskretes Filter. A6) Gegeben sei die Dreieckfunktion f (t) = (1 − |t|)(s(t + 1) − s(t − 1)), s(t) der Einheitssprung.
10.7 Übungsaufgaben
325
(a) Berechnen Sie eine DFT (vgl. Abschnitt 5.7) mit 8 äquidistanten Abtastwerten von f und Schrittweite 1/4 im Intervall [−1,1]. Stellen Sie mit den berechneten DFT-Koeffizienten eine erste Näherung für die (reelle, gerade) Fouriertransformierte von f durch einen Polygonzug grafisch dar (vgl. S. 232 und S. 296). Achten Sie dabei auf die richtige Zuordnung der Frequenzen und Zeitdauer T der Abtastung. (b) Erweitern Sie dann den Vektor der Abtastwerte von f durch Anhängen von 2040 Nullen (engl. „Zero Padding“). Führen Sie mit diesem erweiterten Vektor wieder eine DFT durch und stellen Sie damit wie oben eine weitere Näherung für fb grafisch dar. Vergleichen Sie die Ergebnisse und erklären Sie, warum die Näherung durch das Zero Padding besser geworden ist. A7) Ein realisierbares diskretes Filter besitze die Übertragungsfunktion H(z) = Geben Sie die Impulsantwort an. A8) Sei X(z) die z-Transformierte des Signals x = Beziehungen zu den z-Transformierten von x− =
+∞ X
k=−∞
x−k δk , xα =
+∞ X
k=−∞
αk xk δk
+∞ X
z2 + 1 . z2 − 1
xk δk . Berechnen Sie dafür
k=−∞
(α 6= 0) und v =
+∞ X
kxk δk .
k=−∞
A9) Ein analoger Frequenzgang eines Bandsperren-Filters (engl. Notch Filter), das die A0 (1 + (jω/ωg )2 ) . Kreisfrequenz ωg sperrt, ist R(jω) = 1 + jω/(ωg Q) + (jω/ωg )2 (a) Stellen Sie den Amplituden- und Phasengang des Filters für A0 = 1 und für zwei verschiedene Gütefaktoren Q1 = 0.5 und Q2 = 10 grafisch dar. (b) Diskrete Bandsperren-Filter. Erstellen Sie ein Programm, welches mittels bilinearer Transformation ein diskretes Bandsperren-Filter mit Güte Q, Abtastfrequenz 1/a und Sperrfrequenz ωg /(2π) realisiert. (c) Besorgen Sie sich eine Audio-Aufnahme eines Fußball-Spiels der Weltmeisterschaft 2010 in Südafrika mit starkem Vuvuzela-Lärm. Erstellen Sie durch Kaskadierung ein Filter passender Güte, das die Grundfrequenz der Vuvuzela von etwa 233 Hz (die Note ais) und die drei folgenden Obertöne (8va, Quint, 8va) sperrt und durch Tiefpassfilterung das Ausgangssignal auf die Sprachbandbreite begrenzt. Wenden Sie Ihr „Anti-Vuvuzela-Filter“ auf die Aufnahme an und testen Sie das Ergebnis. A10) Diskrete Tschebyscheff-Tiefpass-Filter. Erzeugen Sie aus dem Analogfilter von Aufgabe 26 zu Kapitel 5 mit der bilinearen Transformation ein diskretes TschebyscheffFilter mit der gleichen Grenzfrequenz und zu gleichen Dämpfungsvorgaben. A11) Berechnen Sie die Impulsantworten und die Frequenzgänge der Filter mit den Über60 − 8z −1 − 4z −2 und Hinv = 1/H(z). tragungsfunktionen H(z) = 60 + 15z −2
326
10 Grundlagen über Lineare Filter
A12) Diskrete Allpass-Filter. In der Aufgabe werden alle Filter als diskrete kausale und stabile Filter mit rationaler Übertragungsfunktion H vorausgesetzt. Es gilt dann |b h(ω)|2 = C(ejωa ) = H(ejωa )H ∗ (e−jωa ) mit H ∗ (z) = H(z). N Y
(1 − ck z −1 )
(a) Die Übertragungsfunktion besitze die Gestalt H(z) = a0 z −n k=1 , M Y −1 (1 − dk z ) k=1
die als vollständig gekürzt vorausgesetzt sei mit ck 6= 0, dk 6= 0, M,N ∈ N, n ∈ N0 und a0 ∈ C. Zeigen Sie, dass |b h(ω)|2 = 1 genau dann gilt, wenn H die M −1 Y z − ak hat mit ak ∈ C, |ak | < 1 und ϕ ∈ [0,2π[. Form H(z) = ejϕ z −n 1 − ak z −1 k=1
(b) Zeigen Sie, dass ein Allpass-Filter wie in (a) eine positive Gruppenlaufzeit hat.
A13)⋆ Diskrete Minimalphasen-Filter. Diskrete kausale stabile Filter mit rationaler Übertragungsfunktion, die so viele Nullstellen wie Pole besitzen und deren Nullstellen und Pole im Inneren des Einheitskreises liegen, heißen Minimalphasen-Filter (vgl. A. V. Oppenheim, R. W. Schafer (2004)). Sie haben kausale stabile Inverse. (a) Zeigen Sie, dass diskrete kausale stabile Filter mit rationaler Übertragungsfunktion H dargestellt werden können durch H = Hmin Hall oder H = Hmin Huc Hall mit der Übertragungsfunktion Hmin eines Minimalphasen-Filters, der Übertragungsfunktion Huc eines Filters, dessen Nullstellen auf der Einheitskreislinie liegen, und der Übertragungsfunktion Hall eines Allpass-Filters. Führen Sie die Zerlegung an Beispielen mit Hilfe einiger Pol-Nullstellen-Diagramme durch. (b) Folgern Sie, dass ein Minimalphasen-Filter unter allen Filtern mit gleichem Amplitudengang die kleinste Gruppenlaufzeit hat. A14)⋆ Ideal DC-Blocking Operator. Man betrachte den Operator Lx =
+∞ X
ym δm mit
m=−∞
ym = xm − m(C,1) (x), definiert auf denjenigen x ∈ ld∞ , für welche der Limes +N X 1 xk der Cesáro-Mittel existiert. L soll zu einem m(C,1) (x) = lim N →∞ 2N + 1 k=−N
stetigen linearen translationsinvarianten Operator auf ganz ld∞ fortgesetzt werden.
Man betrachte dazu die Menge M = {x ∈ ld∞ : m(C,1) (x) = 0} und die Menge K = {P ∈ ld∞ ′ : P (M ) = 0, kP k = 1 = P (1)} wie im Beispiel auf S. 302 und zeige wie dort, dass es ein translationsinvariantes Funktional P0 in K gibt. Zeigen Sie, dass Lx = x − 1 · P0 (x) stetig und translationsinvariant, aber kein Faltungsope∞ X rator ist. Betrachten Sie dazu Lδ0 und Lu für u = δk . k=0
327
11
Weitere Anwendungsbeispiele für die Fouriertransformation
11.1 Der Abtastsatz von Shannon Den theoretischen Ausgangspunkt für Verfahren der Signalübertragung, in denen statt eines kontinuierlichen Analogsignals f (t) diskrete Näherungswerte von f übertragen werden, aus denen später das Signal näherungsweise rekonstruiert wird, bildet der Abtastsatz von C. Shannon (1949). Als lesenswerte Arbeit zur Historie des Satzes und zu seinen Weiterentwicklungen mit einer Fülle an relevanten Quellenhinweisen sei der Artikel „Sampling – 50 Years After Shannon“ von M. Unser (2000) empfohlen. Der Shannonsche Abtastsatz für bandbegrenzte Funktionen Ist f eine integrierbare Funktion, die durch ωg > 0 bandbegrenzt ist, d.h. fb(ω) = 0 für |ω| > ωg , und ist mit f (t) auch tf (t) integrierbar, dann gilt für alle t ∈ R mit ta = π/ωg +∞ +∞ X X sin(ωg (t − kta )) kπ sin(ωg t − kπ) = f (kta ) . f (t) = f ωg ωg t − kπ ωg (t − kta ) k=−∞
k=−∞
Beweis. Aus den Voraussetzungen folgt, dass die Spektralfunktion fb stetig differenzierbar
ist (vgl. S. 239). Sie wird daher durch ihre Fourierreihe in [−ωg ,ωg ] punktweise dargestellt und diese Reihe ist absolut und gleichmäßig konvergent (vgl. S. 23): fb(ω) =
+∞ X
ck e−jkωta
(ta = π/ωg , |ω| ≤ ωg )
k=−∞
1 ck = 2ωg
+ω ˆ g
−ωg
π fb(ω) ejkωta dω = f (kta ). ωg
Die gliedweise Integration der Reihe ist möglich, weil die Reihe gleichmäßig konvergiert. Da bandbegrenzte Funktionen unendlich oft differenzierbar sind (vgl. S. 239), folgt nun der Abtastsatz aus der Fourierschen Umkehrformel: 1 f (t) = 2π
+ω ˆ g −ωg
=
+∞ X
k=−∞
1 fb(ω) ejωt dω = 2π
1 f (kta ) 2ωg
+ω ˆ g
−ωg
+ω ˆ g
+∞ X
ck e−jkωta ejωt dω
−ωg k=−∞
ejω(t−kta ) dω =
+∞ X
k=−∞
f
kπ ωg
sin(ωg t − kπ) . ωg t − kπ
328
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Der Abtastsatz ergibt eine Formel, mit der bei Kenntnis aller diskreten Werte f (kπ/ωg ), k ∈ Z, die Werte von f zu Zeiten t 6= kπ/ωg interpoliert werden können. Die Abtastfrequenz muss dabei mindestens doppelt so hoch wie die Grenzfrequenz ωg /(2π) sein. Bei Erhöhung der Abtastfrequenz ωg /π gilt die Formel für Signale entsprechend größerer Frequenzbandbreite. Bei geringerer Abtastfrequenz als ωg /π und gegebener Bandbreite ωg von f kommt es mit der Abtastreihe zu Alias-Effekten (siehe nachfolgend S. 330). Für eine direkte praktische Umsetzung in der Signalübertragung ist die Formel nicht geeignet, weil sie nicht kausal ist. Man würde zur Rekonstruktion von f (t0 ) zur Zeit t0 auch alle Werte f (kπ/ωg ), kπ/ωg > t0 benötigen. Aber eine Funktion f , deren Spektrum fb außerhalb eines Intervalles [−ωg ,ωg ] verschwindet, ist nicht zeitbegrenzt (vgl. S. 256), d.h. die Abtastformel verlangt nichtverschwindende Werte von f aus aller Zukunft t > t0 . Dennoch ist der Abtastsatz Ausgangspunkt für praktische Näherungsverfahren zur Rekonstruktion von f aus Abtastwerten. Dabei verwendet man dann ein realisierbares Filter zur Interpolation, dessen Impulsantwort die des unten verwendeten idealen Tiefpasses ersetzt. Zur Erläuterung betrachten wir endlich viele Abtastwerte f (kπ/ωg ), − M ≤ k ≤ N . +N π π π X δ t−k als Eingangssignal f k Bildet man damit die Impulsfolge ωg ωg ωg k=−M für ein ideales Tiefpass-Filter mit dem Frequenzgang b h(ω) = A0 e−jωt0 für |ω| ≤ ωg , b h(ω) = 0 für |ω| > ωg , dann ergibt sich am Ausgang des Tiefpassfilters +N kπ A0 sin (ωg (t − t0 )) π π X δ t− ∗ f k ωg ωg ωg π(t − t0 ) k=−M
= A0
+N X
k=−M
f
π sin (ωg (t − t0 ) − kπ) . k ωg ωg (t − t0 ) − kπ
Bis auf einen Faktor und die Zeitverzögerung um t0 ist die rechte Seite eine Näherung für f , die für N,M → ∞ gegen A0 f (t − t0 ) konvergiert. Ideales TiefpassFilter L der Bandbreite ωg
π ωg
+N X
k=−M
f
sin ωg (t − t0 ) − kπ +N X π π π L f k δ t−k −−−−−−−→ A0 k ωg ωg ω ωg (t − t0 ) − kπ g k=−M
r
ωg sin(ωg t − kπ) (k ∈ Z) bilden ein vollπ ωg t − kπ ständiges Orthonormalsystem im Raum der durch ωg bandbegrenzten L2 -Funktionen. Die Abtastformel ist daher gerade die Entwicklung vonqf bezüglich dieser Basisfunktionen.
Bemerkungen. 1) Die Funktionen ek (t) =
Der Beweis des Abtastsatzes zeigt, dass ebk (ω) =
π/ωg e−jωkπ/ωg für |ω| ≤ ωg gilt,
11.1 Der Abtastsatz von Shannon
329
ebk (ω) = 0 sonst. Vollständigkeit und Orthogonalität der Funktionen ek (t) folgen daher aus der Parsevalgleichung (S. 262) und der Tatsache, dass die Funktionen ebk (ω) ein vollständiges Orthogonalsystem in L2 ([−ωg ,ωg ]) sind. Man siehe hierzu später auch Abschnitt 12.1. 2) Die Abtastreihe konvergiert sehr langsam, da die Interpolationsfunktion sin(t)/t für |t| → ∞ nur langsam abfällt. Mit Überabtastung (engl. Oversampling), d.h. Ersetzen der Abtastzeitpunkte kπ/ωg durch kπ/(αωg ) mit α > 1, kann man an Stelle der Funktion sin(t)/t eine Interpolationsfunktion erhalten, die für |t| → ∞ abfällt wie 1/t2 . Um dies genau zu sehen, löse man die zugehörige Aufgabe A1 im Übungsteil 11.9. 3) Unter zusätzlichen Annahmen über f , etwa Information über die Energieverteilung von f oder über das Abklingverhalten, können Fehlerabschätzungen für den Abschneidefehler der obigen Näherung gezeigt werden. Ebenso gibt es Fehlerabschätzungen für den Fall, dass die Abtastzeitpunkte nicht genau eingehalten werden und statt f (kπ/ωg ) die Werte f (kπ/ωg + εk ) abgetastet werden (sogenannte Jitter-Fehler). Außerdem werden bei der Digitalisierung der Abtastwerte in praktischen Übertragungssystem nicht die kontinuierlich vielen möglichen Werte übertragen, sondern man diskretisiert den Wertebereich und lässt nur eine endliche Anzahl von gerundeten Werten zur Übertragung zu. Die entstehende Verfälschung eines Signals, das Quantisierungsrauschen, entspricht im Zeitbereich der Addition einer Impulsfolge mit der Konsequenz eines breitbandigen Störspektrums. Auch über die hierdurch entstehenden Rundungsfehler gibt es Untersuchungen. Lesern, die sich in die Fehleranalysis einarbeiten wollen, seien zum Einstieg etwa H. Babovsky et al. (1987) oder A. Jerri (1977) empfohlen. 4) Abtastverfahren mit irregulär verteilten Abtastzeitpunkten spielen eine Rolle zum Beispiel in der Radartechnik. Hierzu sei verwiesen auf Arbeiten von H.-G. Feichtinger und K. Gröchenig (detaillierte Quellenangaben findet man bei M. Unser (2000)). Verallgemeinerungen Es gibt zahlreiche Verallgemeinerungen des vorgestellten Abtasttheorems. Hierzu zählen insbesondere auch Abtastsätze für zeitbegrenzte, allgemeiner nicht-bandbegrenzte Funktionen mit Aussagen über die Approximationsgüte der betrachteten Abtastreihen. Im Allgemeinen werden dabei für Funktionen f bestimmter Funktionenklassen und Bandbreiten Ω Darstellungen der Form X π X π ϕ(Ωt − kπ) oder f (t) = lim ϕ(Ωt − kπ) f k f (t) = f k Ω→∞ Ω Ω k∈Z
k∈Z
gesucht und Approximationseigenschaften der Abtastreihe aus den Annahmen über die Funktion f und aus den Eigenschaften der Kerne ϕ hergeleitet. Solche Eigenschaften können Zeit- oder Bandbegrenztheit, Abfallverhalten u.a.m. sein. Hier soll nicht weiter auf dieses Thema eingegangen werden, sondern stattdessen auf weiterführende Literatur wie H. Babovsky et al. (1987), P. L. Butzer, R. L. Stens (1992) oder M. Unser (2000) und dort genannte Referenzen verwiesen werden. Weitere Aspekte findet man auch in den nachfolgenden Abschnitten 11.4 zur Zeit-Frequenz-Analyse (vgl. S. 355) und Abschnitt 12.2 zu Wavelets (vgl. S. 392).
330
11 Weitere Anwendungsbeispiele für die Fouriertransformation
11.2 Sampling als Grundlage digitaler Übertragungstechnik Sampling, kritische Abtastung, Über- und Unterabtastung. Äquidistante Abtastung (engl. Sampling) einer bandbegrenzten – und daher unendlich oft differenzierbaren – Funktion f mit einer Abtastfrequenz 1/ta lässt sich beschreiben als Multiplikation von f mit einer Folge von Impulsen zu den Zeiten kta . Mit der Bemerkung auf S. 135 und Impulsstärken ta f (kta ) haben das entstehende diskrete Signal fd und f sowie fbd und fb jeweils gleiche physikalische Einheiten (vgl. auch S. 331 zur Rekonstruktion von f aus Abtastwerten oder Literatur zur Funktionsweise von D/A-Wandlern für Spannungssignale in Volt). Für fd – als Distribution mit Zeitparameter t verstanden – gilt dann +∞ +∞ X X ta δ(t − kta ) = ta f (kta )δ(t − kta ). fd (t) = f (t) · k=−∞
k=−∞
Daher folgt aus den Sätzen über Konvergenz von Faltungen (S. 163) und über Fouriertransformationen von Impulskämmen (S. 252) und von Produkten (S. 254) folgende fundamentale Beziehung zwischen dem Spektrum fb von f und dem periodischen Spektrum des diskreten Signals fd :
Satz. Das Spektrum des diskreten Signals fd , das durch Abtastung einer bandbegrenzten Funktion f mit Abtastfrequenz 1/ta entsteht, ist gegeben durch fbd (ω) = fb ∗
+∞ X
k=−∞
δ(ω − 2πk/ta ) =
+∞ X
k=−∞
fb(ω − 2πk/ta ).
Für k 6= 0 nennt man die Spektren fb(ω − 2πk/ta ) auch „Spiegelspektren“ von fb. Bei kritischer Abtastung mit der als Nyquist-Frequenz bezeichneten Abtastrate 1/ta = ωg /π schließen diese Spiegelspektren unmittelbar aneinander an. Eine Rekonstruktion von f aus den Abtastwerten mit einem realisierbaren Tiefpass-Filter ist dann im Allgemeinen nicht möglich, da dieses einen Übergangsbereich vom Passband in das Stoppband benötigt (vgl. S. 286). Dieser Übergangsbereich entsteht erst bei Abtastraten 1/ta > ωg /π, d.h. durch Überabtastung. Bei Unterabtastung mit Raten 1/ta < ωg /π entstehen im Spektrum von fd Überlappungen der Spiegelspektren. Eine Rekonstruktion von f aus den zugehörigen Abtastwerten ist dann nicht möglich, da es – insbesondere bei höheren Frequenzen – im Signalspektrum zu Alias-Effekten kommt. Nachfolgend schematisch skizziert die erste Grafik ein Betragsspektrum von fd mit Überabtastung ta < π/ωg , die zweite ein Betragsspektrum von fd mit Unterabtastung ta > π/ωg .
11.2 Sampling als Grundlage digitaler Übertragungstechnik
331
Das Schema der digitalen Nachrichtenübertragung in der Praxis Bei der praktischen Realisierung entnimmt man dem Abtastsatz das Rezept, dass Tiefpassfilterung der Impulsfolge, die aus den Abtastwerten gewonnen wird, eine Näherung des kontinuierlichen Signals ergibt. Einen Eindruck gibt das nachfolgende Diagramm. Die Abtastung geschieht technisch durch Abtast-Halteglieder (S&H, Sample and Hold Circuit). Die Werte der entstehenden Treppenfunktion sind proportional zu quantisierten Abtastwerten des Signals. Die Pulsfolge zur Rekonstruktion aus den quantisierten Abtastwerten wird durch eine Folge von Rechteck-Pulsen näherungsweise realisiert. Ein Impuls δ(t − kta ) wird bei Abtastfrequenz F S = 1/ta (engl. DAC sampling frequency clock F S) dabei ersetzt durch das Rechteck R(t − kta )/ta , R die Indikatorfunktion von [0 , ta [ („Rechteckfläche“ gleich Eins), d.h. ein Impuls ta δ(t − kta ) der Stärke ta wird ersetzt durch die Faltung ta δ(t − kta ) ∗ R(t)/ta = R(t − kta ). Dadurch entsteht eine Treppenfunktion mit den quantisierten Abtastwerten, d.h. außer den Quantisierungsfehlern kommt es zu Verzerrungen im Vergleich mit dem Spektrum des diskreten Signalmodells fd , da das Spektrum ta e−jωkta eines Impulses ta δ(t − kta ) multipliziert wird mit dem Spektrum e−jωta /2 sin(ωta /2)/(ωta /2) des Rechtecks R(t)/ta (vgl. S. 232). Diese Verzerrungen können durch ein Korrekturfilter (engl. Inverse sin(x)/x Filter) kompensiert werden, mit digitaler Filterung vor der D/A-Wandlung oder danach mit einem Analogfilter. Ganz konkret überträgt man zum Beispiel im digitalen Fernsprechverkehr beim ISDN, ganz analog auch bei neueren Verfahren wie Voice over IP, einen Frequenzbereich bis 3700 Hz und filtert mit einem Stoppband ab 4000 Hz. Bei Standard-Telefonqualität tastet man entsprechend dem Abtasttheorem Sprachsignale mit 8 kHz ab, d.h. im Zeitabstand von jeweils 125 µs . Übertragen werden nur quantisierte, gerundete Werte, die als 8 bit lange digitale Codewörter verschlüsselt werden können. Bei Voice over IP werden optional auch verlustbehaftete Komprimierungen verwendet, ähnlich wie bei der nachfolgend noch angesprochenen MP3-Kodierung, d.h. es werden Codewörter mit weniger als 8 bit pro Abtastwert benutzt, um letztlich die benötigte Bandbreite bei der Übertragung zu verringern. Eingangssignal Sendeseite
Bandbegrenzung durch Tiefpass
f
AbtastHalteglied
Treppenfunktion mit quantisierten Abtastwerten
Analog-Digital-Wandlung
Ausgangssignal: Näherung des Signals f Empfangsseite
Digital-Analog-Wandlung
Umsetzung in digitale Codewörter
Übertragung digitaler Codewörter
Pulsfolge Tiefpass- und Erzeugung einer der Korrekturfilter: Rechteck-Pulsfolge. Glättung und quantisierten Deren Werte sind die Interpolation Abtastwerte quantisierten Abtastwerte
Im europäischen PCM30-System (PCM steht für Puls-Code-Modulation) für Festnetzanschlüsse werden pro Übertragungseinrichtung 32 Kanäle in einem Bitrahmen von 32 × 8 bit = 256 bit pro Pulsrahmen, d.h. alle 125 µs übertragen. Einer der 32 Kanäle enthält ein Rahmenmeldewort, ein weiterer Kanal Signalisierungsinformation (z.B. gewählte Telefonnummern), die restlichen 30 Kanäle enthalten die Sprachsignale von 30 verschiedenen
332
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Gesprächen, die man durch zyklisches Zusammenfassen (multiplexen) über gemeinsame Leitungsstrecken vermitteln kann (siehe folgende Grafik zu einem PCM30-Bitrahmen). Die Übertragung mehrerer Signale gleichzeitig über eine gemeinsame Leitung zwischen den Vermittlungsstellen ist möglich durch Zeitausnutzung zwischen den Abtastzeitpunkten eines Signals. In dieser Zeit werden andere Signale abgetastet und übertragen. Bei dieser Technik beträgt die Bitrate pro Fernsprechkanal 8 × 8 000 bit = 64 kbit/s, die einer Übertragungseinrichtung für 32 Kanäle damit 32 × 64 kbit/s = 2.048 Mbit/s . Der wirtschaftliche Nutzen beim digitalen Fernsprechverkehr ist eine Erhöhung der Vermittlungskapazität und der hohe Nutzungsgrad teuerer Leitungen zwischen den Vermittlungsstellen. Diese Technik ist noch im Einsatz, wird jedoch zunehmend von der oben schon genannten Internet-Telefonie abgelöst, die durch höhere Bandbreitennutzung und auch billigere Betriebsmittel in den Vermittlungsstellen noch einmal Kosten für die Betreiber spart. 0 1 2 3 4 5 6 7 0
1
2
... 4 3,9 µs 256 bit in 125 µs
3
31
0
1 ...
PCM30-Bitrahmen mit 8 bit-Codewort pro Abtastwert des Gesprächs auf Kanal 4
Ein bekanntes weiteres Anwendungsbeispiel des Abtasttheorems sind auch Audio-Dateien im sogenannten WAV-Format. Dabei wird mit 44100 Werten pro Sekunde abgetastet, d.h. es wird etwa eine Bandbreite von 20 kHz erreicht. Beim MP3-Format wird der Frequenzbereich in mehrere Subbänder unterteilt. Die FFT-Werte von Zeitausschnitten des akustischen Signals werden dann nach psychoakustischen Kriterien je nach Lage im Frequenzbereich als Grundlage für eine Datenkompression mit unterschiedlich vielen Bits quantisiert und übertragen. Beim Empfänger wird eine Näherung des Signals aus diesen Spektralwerten rekonstruiert. Details dazu findet man bei Interesse schnell in einer MP3-Spezifikation. Modulation mit Nyquist-Pulsen Ausgangspunkt der diskreten Signalverarbeitung in heutigen digitalen Übertragungsverfahren sind diskrete Werte xk , k ∈ Z, in welchen die Nutzinformation transportiert wird. X X Im mathematischen Modell liegt eine Impulsfolge xd = ta xk δk = ta xk δ(t − kta ) k∈Z
k∈Z
vor, aus der durch ein lineares Filter mit regulärer Impulsantwort h ein kontinuierliches Signal s = xd ∗ h generiert wird. Wir setzen dabei voraus, dass die Faltung xd ∗ h möglich ist und alle Abtastwerte h(nta ) existieren (zum Beispiel Tr(xd ) beschränkt, h ∈ S ′ stetig). X s(t) = (xd ∗ h)(t) = xk ta h(t − kta ). k∈Z
Mit h seien Sende- und Empfangsfilter und ein lineares Filter, das den Übertragungskanal beschreiben soll, zusammengefasst, d.h. s(t) sei das Empfangssignal. Man erkennt sofort, dass die Abtastwerte s(nta ) = xn , d.h. genau die gewünschte Nutzinformation ergeben, wenn ta h(0) = 1 und h(nta ) = 0 für n 6= 0 gilt. Filter h, auch Pulsformen genannt, mit dieser Eigenschaft (engl. zero crossing property) heißen Nyquist-Pulse.
11.2 Sampling als Grundlage digitaler Übertragungstechnik
333
Beispiel. Verwendet man für die Werte xk die Abtastwerte xk = f (kta ) einer durch ωg bandbegrenzten Funktion f wie im vorangehenden Shannonschen Abtastsatz und die sin(ωg t) mit ωg = π/ta , dann ist nach dem Beweis des Abtastsatzes Funktion h(t) = πt s(t) = f (t). Die Funktion h ist ein Nyquist-Puls, ebenso Produkte von h mit Funktionen g, die bei Null den Wert g(0) = 1 haben. Das vielfach in der Praxis verwendete sogenannte „Raised Cosine Filter“ hRC,α , das für |t| → ∞ viel schneller als h abfällt, ist dafür ein Beispiel (vgl. auch später S. 339, dort als Pulsform im Frequenzbereich): hRC,α (t) =
sin(πt/ta ) cos(παt/ta ) . · πt 1 − (2αt/ta )2
Der Parameter α steuert die Bandbreiten-Erweiterung (engl. excess bandwidth) im Vergleich mit dem Spektrum des sinc-Pulses h. Das Spektrum b hRC,α mit abfallenden CosFlanken, denen diese Pulsform den Namen verdankt, ist in Aufgabe A10 zu Kapitel 9, S. 272 angegeben (dort π/ta = b, a = αb). Anwendungen verschiedener Nyquist-Pulse findet man bei K. D. Kammeyer, A. Dekorsy (2018) oder J. G. Proakis (2001). Nyquist-Pulse h gestatten die Rekonstruktion der Werte xk durch Sampling von s(t) auch, wenn h und damit s nicht bandbegrenzt sind, also trotz Aliaseffekten im Spektrum +∞ X der Pulsfolge sd (t) = ta s(kta )δ(t − kta ). In Anwendungen ist h häufig eine Funkk=−∞
tion mit beschränktem Träger (vgl. später S. 336). Bezeichnet man die xk als Symbole, die übertragen werden sollen, dann sind Übertragungen mit Nyquist-Pulsen frei von InterSymbol-Interferenz (Abk. ISI). Modulationen mit Pulsformen, die keine Nyquist-Pulse sind Betrachtet man die Aufgabe, aus Abtastwerten sk = s(kta ), k ∈ Z, des Empfangssignals s(t) die Werte xk zu rekonstruieren, als ein diskretes lineares Filterproblem, dann erhält man mit den Ergebnissen über inverse diskrete Filter (vgl. 10.6, S. 314 und 7.7, S. 162): X Besitzt für eine Pulsform h das diskrete Filter mit Impulsantwort hd = ta h(kta )δk eine Inverse mit Impulsantwort hd,inv =
X k∈Z
k∈Z
gk δk , so dass (xd ∗ hd ) ∗ hd,inv = xd ∗ (hd ∗ hd,inv )
assoziativ ist 10 , dann rekonstruiert man xd = ta diskrete Faltung xd = sd ∗ hd,inv , d.h. xn =
X k∈Z
X k∈Z
xk δk wegen sd = xd ∗ hd durch die
sk gn−k für n ∈ Z.
Sätze über diskrete Filter auf unterschiedlichen Signalräumen, zu Stabilität, Kausalität, Invertierbarkeit und mögliche Entwurfsmethoden für FIR- oder IIR-Filter wurden in Abschnitt 10.6 bereits vorgestellt. Ausgehend von der Modulation diskreter Information mit verschiedenen Pulsformen als Impulsantworten linearer Filter wurde eine Vielzahl von Algorithmen zur Signalverarbeitung entwickelt. Einige Aspekte dazu folgen in den Abschnitten 11.4 zur Zeit-Frequenz-Analysis und 12.2 zu Wavelets. Für ein vertieftes Studium verschiedener Methoden zur anwendungsspezifischen Signalverarbeitung sei hier nur auf die 10
Die z-Transformierten von xd , hd , hd,inv müssen einen gemeinsamen Konvergenz-Kreisring besitzen.
334
11 Weitere Anwendungsbeispiele für die Fouriertransformation
vielfältige Literatur zum Thema hingewiesen, zum Einstieg etwa auf A. Papoulis (1977) zur Signal-Analysis, H. Schulze, C. Lüders (2005), K. D. Kammeyer, A. Dekorsy (2018), J. G. Proakis (2001), L. W. Couch (2007) zu digitalen Kommunikationssystemen, T. Salditt, T. Aspelmeier, S. Aeffner (2017) zu bildgebenden Verfahren in der Biomedizin oder auf bereits am Ende von Abschnitt 11.1 genannte Arbeiten und Referenzen dort. Ein Studium der digitalen Signalverarbeitung, die heute nahezu jeden Lebensbereich und alle Wissenschaftsgebiete durchdringt, erfordert spezialisierte Einarbeitung im Umgang mit den mathematischen Methoden und schließlich mit der Technik, durch die entworfene Algorithmen realisiert werden können. Ebenso erforderlich ist, Verantwortung zu übernehmen für weitreichende Konsequenzen, die aus der Durchdringung der Gesellschaft mit den Anwendungen von Algorithmen zur Signal- und Datenverarbeitung folgen. Die Grundidee der Mehrträger-Übertragung mit OFDM Zum Abschluss dieses Abschnitts soll die Grundidee der Mehrträgerverfahren OFDM geschildert werden. OFDM (engl.) steht für Orthogonal Frequency Division Multiplexing. Nahezu jeder nutzt heute dieses Verfahren im Alltag fast rund um die Uhr, denn OFDM wird übergreifend verwendet für die Übertragung von WLAN, DSL, digitalem Rundfunk (DAB) und TV (DVB), bei Powerline-Communication und im Mobilfunk mit LTE, LTE+ und zukünftigen 5G-Standards. Ein OFDM-Einsatz bei optischen Übertragungssystemen mit Bandbreiten bis zu 1 Tb/s ist in der Entwicklung (vgl. etwa Y. Ma et al. (2010)). Die Historie von Frequency Division Multiplexing (FDM), damals mit Analog-Technik, geht zurück auf erste Patente zur Multiton-Telegrafie in den Jahren 1875-1876 von Alexander Graham Bell, Elisha Gray und Thomas Edison. Eine lesenswerte Darstellung über die Entwicklung der OFDM-Verfahren findet man bei S. Weinstein (2009). Heutige digitale OFDM-Verfahren, bei ADSL und VDSL auch als DMT (engl. Discrete Multitone Transmission) bezeichnet, gehen zurück auf Arbeiten von R. Chang (1966) und S. Weinstein, P. Ebert (1971). Sie sind eine Kombination von Anwendungen der DFT, des Abtastsatzes mit Filtertechnik zusammen mit der Verwendung von Kodierungs- und Verschlüsselungsalgorithmen. Hinzu kommen Methoden zur Schätzung von Eigenschaften der Übertragungskanäle, auf deren Grundlage beim Empfänger Übertragungsfehler zu korrigieren sind, um die Nutzinformation zurück zu gewinnen. Physikalisch realisiert werden die OFDM-Verfahren mit hoch entwickelter Hardware in Elektro- und Nachrichtentechnik. Charakteristisch für die OFDM-Übertragung ist, dass große Teile der erforderlichen Sende- und Empfangstechnik aus diskreter Signalverarbeitung bestehen, die mit einmalig entwickelten Algorithmen auf integrierten Schaltkreisen (IC’s) im Vergleich mit Analogtechnik kostengünstig realisiert werden kann. Nur deshalb kann man heute etwa einen WLAN-USB-Stick oder digitale Mediengeräte inklusive nötiger Software als Massenprodukte für vergleichsweise wenige Euro erhalten. In der Literatur zur Nachrichtentechnik gibt es eine ganze Reihe schnell zu recherchierender Lehrbücher, die detailliert den OFDM-Verfahren gewidmet sind. Es sollen hier daher in aller gebotenen Kürze nur die wesentlichen Ideen vorgestellt werden, soweit sie mit den im vorliegenden Text behandelten Methoden der Fourier-Analysis leicht verstanden werden können. Sie mögen Lesern als Anreiz dienen, bei Interesse ihr Wissen dann mit Spezialliteratur zu vertiefen.
11.2 Sampling als Grundlage digitaler Übertragungstechnik
335
Mathematische Bausteine eines OFDM-Übertragungssystems 1. Vom kodierten Bitstrom mit QAM-Modulation zu trigonometrischen Polynomen Auf der Sendeseite liegt ein Bitstrom vor, d.h. eine 01-Folge von Daten, die übertragen werden sollen. Die Daten sind in der Regel kodiert und verschlüsselt (Stichworte: Fehlerkorrigierende Codes, Interleaving, evtl. WPA2-Verschlüsselung usw.). Um OFDM an einem Beispiel zu erläutern, nehmen wir an, dass mit der 16-QAMModulation übertragen werden soll. 16-QAM steht dabei für Quadratur-AmplitudenModulation mit einem Alphabet aus 16 komplexen Zahlen. Dabei werden aus dem Bitstrom Blöcke mit je 4 Bits injektiv in eine Menge von 16 komplexen Zahlen, auch als QAM-Symbole bezeichnet, abgebildet. Eine 16-QAM-Modulation ist mit ihren Zuweisungen nachfolgend√dargestellt. Alle komplexen Werte werden noch mit dem Skalierungsfaktor A = 1/ 10 multipliziert. Damit wird die normalisierte Leistung einer mit 16-QAM modulierten gleichverteilten 01-Zufallsfolge von Bits im Sendesignal auf Eins normiert (vgl. K. D. Kammeyer, A. Dekorsy, A. (2018)). 16-QAM Gray Coded Symbol Mapping ohne Faktor A
Nebenstehend eine Zuordnung von jeweils 4 Bits mit einem Gray-Code zu Zahlen in der komplexen Ebene (Abszisse: Realteil, Ordinate: Imaginärteil). Für ein nachfolgend weiter geführtes Beispiel setzen wir vier 16-QAM-Zuordnungen: 1110 → c1 = A(1 + 3j) 1011 → c2 = A(3 + j) 0010 → c3 = A(−3 + 3j) 0101 → c4 = A(−1 − j)
Zur Erzeugung eines OFDM-Symbols Si mit N Trägern für einen Zeitabschnitt von iT bis (i + 1)T wird der sequentielle Bitstrom in n ≤ N 4-Bit-Blöcke parallelisiert, die mit 16-QAM auf n komplexe Zahlen ci,k wie oben abgebildet werden. Mit den N Trägern ej2πkt/T und den komplexen Amplituden ci,k bildet man ein trigonometrisches Polynom mit einer Bandbreite B ≤ (N − 1)/T Hz, das durch Multiplikation mit einem Zeitfenster T gi,T (t) = T gT (t − iT ) in der Dauer auf das Intervall [iT,(i + 1)T ] begrenzt wird, und erhält so das OFDM-Symbol Si im Basisband: Si (t) = T
N −1 X
ci,k ej2πkt/T gi,T (t).
k=0
N − n Träger, deren Frequenzen zwischen Sende- und Empfangsseite fest vereinbart sind, bleiben mit ci,k = 0 unbesetzt, oder sie können mit festgelegten Amplituden als Pilot-Träger oder – im Symbol vorangestellt – als Präambeln beim Empfänger zur Kanalschätzung und Synchronisierung genutzt werden (vgl. auch Beispiel 4, S. 73). Die Nutzinformation von 4n Bits liegt damit in den zugeordneten komplexen Amplituden ci,k von Si vor. Die Funktion gT ist die Impulsantwort des Sendefilters.
336
11 Weitere Anwendungsbeispiele für die Fouriertransformation Wir setzen im Folgenden zur Darstellung der Grundidee von OFDM für gi,T zunächst ein Rechteckfenster voraus und betrachten nur einen einzigen Zeitschritt mit i = 0. Zur vereinfachten Notation wird daher im Folgenden der Index i einfach weggelassen und T gi,T = wT = 1[0,T [ gesetzt (wT also die Indikatorfunktion des Intervalls [0,T [). Der Anteil des trigonometrischen Polynoms im OFDM-Symbol S belegt das Frequenzband [0,(N − 1)/T ]. Das Produkt mit einem Zeitfenster wT ist aber nicht mehr bandbegrenzt, d.h. das Spektrum von S hat eine Außerbandstörung zur Folge. Bei Realisierungen wird man daher andere Fenster wT wählen, deren Amplitudenspektrum schneller abfällt als das eines Rechteckfensters. Die Funktionen ej2πkt/T wT (t), k = 0, . . . ,N − 1, bilden ein Orthogonalsystem im Raum L2 ([0,T ]), das Frequenzband [0,(N − 1)/T ] ist durch die Trägerfrequenzen mit festem Frequenzabstand 1/T unterteilt und alle QAM-Werte werden während der Symboldauer T gemeinsam übertragen. Wegen dieser Eigenschaften heißt das Verfahren Orthogonal Frequency Division Multiplexing, abgekürzt OFDM. Wegen der Orthogonalität der Träger hat eine Übertragungsstörung bei einer der Trägerfrequenzen keine Auswirkung auf die anderen Träger, d.h. es gibt keine Inter-Carrier-Interferenz (ICI) – jedenfalls solange der Übertragungskanal keine Frequenzdispersion aufgrund von Dopplereffekten bei bewegten Empfängern wie im Mobilfunk bewirkt und vernachlässigt wird, dass ein wegen des Rechteckfensters wT nicht-bandbegrenztes Signal über einen bandbegrenzten Kanal übertragen wird. Verzerrungen eines linearen zeitinvarianten Kanals etwa durch Mehrwege-Ausbreitung und Superpositionen von mehreren verzögert beim Empfänger eintreffenden Signalabschnitten können dort - bei mäßigem Rauschen - durch Schätzung der Kanalimpulsantwort korrigiert werden. Die folgende Grafik zeigt die Betragsspektren von ck ej2πkt/T wT (t) für k = 1 und k = 4. Man erkennt, dass die Spektren Nyquist-Pulse im Frequenzbereich sind (vgl. S. 333), d.h. |ck w bT (ω − 2πk/T )| = 0 an jeder Maximalstelle ω der Betragsspektren |cn w bT (ω − 2πn/T )| für n 6= k (0 ≤ k, n ≤ N − 1). T |c1 |
T |c4 |
ω 0
2 π /T
8 π /T
2. Reellwertiges Sendesignal, Quadratur-Modulation und Demodulation Ein reelles Sendesignal erhält man aus S durch Quadratur-Modulation (kurz QM) mit einer Zwischenkreisfrequenz ωc . Das damit generierte reellwertige Signal SR ist ! N −1 X SR (t) = ℜ ejωc t ck ej2πkt/T wT (t). k=0
11.2 Sampling als Grundlage digitaler Übertragungstechnik
337
Wir erhalten folgende Darstellung, in der I(t) als Inphase- und Q(t) als QuadraturKomponente von S(t) bezeichnet wird: SR (t) = cos(ωc t)
N −1 X k=0
− sin(ωc t)
N −1 X k=0
(ℜ(ck ) cos(2πkt/T ) − ℑ(ck ) sin(2πkt/T )) wT (t) (ℜ(ck ) sin(2πkt/T ) + ℑ(ck ) cos(2πkt/T )) wT (t)
= (I(t) cos(ωc t) − Q(t) sin(ωc t))wT (t).
Paarweise Orthogonalität der Träger und Signal-Bandbreite bleiben bei der QM erhalten. Das Signalspektrum wird zur Zwischenfrequenz fc = ωc /(2π) hin verschoben (bei WLAN ist fc etwa 2.4 GHz oder 5 GHz). Erneute QM und Tiefpass-Filterung zur Unterdrückung höher-frequenter Reste beim Empfänger liefern die komplexwertige Funktion S im Basisband zurück, wenn keine Einflüsse des Übertragungskanals das Signal verzerren. Mit Additionstheoremen für Cos- und Sin-Funktionen findet man 2 cos(ωc t)SR (t) = I(t) + höher-frequenter Rest 2 sin(ωc t)SR (t) = Q(t) + höher-frequenter Rest S(t) = I(t) + jQ(t). Aus Abtastwerten von S kann dann der Empfänger mit einer DFT die Amplituden ck und mit Inversion der 16-QAM-Abbildung schließlich die übertragenen Bit-Gruppen rekonstruieren. Im Folgenden soll nun erläutert werden, wie man von diesem AnalogModell mit diskreter Signalverarbeitung zu den heute verbreiteten digitalen Übertragungsverfahren kommt, durch die man viel aufwändige Analogtechnik einspart. 3. Einsatz diskreter Signalverarbeitung mit einer IDFT Um mit diskreter Signalverarbeitung ein Sendesignal zu erzeugen, werden aus den Amplituden ck des OFDM-Symbols M ≥ N Abtastwerte von S generiert. Hierzu genügt – ohne aufwändigen Hardware-Einsatz – eine IDFT (vgl. Abschnitt 5.7) der Amplituden c0 , . . . ,cM−1 . Für ein „upsampling“ auf M Werte wird dabei mit „zeropadding“ (vgl. S. 296) einfach eine Nullsequenz der Länge M − N an die Amplituden ck angefügt. Die anschließende IDFT hat die Länge M und liefert M Abtastwerte (yn )0≤n≤M−1 . Für in der Praxis verwendete Radix-2-IFFT/FFT-Algorithmen ist M eine Zweier-Potenz, etwa M = 2048 bei LTE mit 20 MHz Bandbreite, 1201 genutzten Trägern pro OFDM-Symbol, 15 kHz Trägerabstand und 30.72 MHz Abtastfrequenz. Mit hinreichend vielen Abtastwerten, ggf. nach weiterem „upsampling“ der IDFTWerte mit CIC-Filtern (engl. für Cascade Integrator Comb Filter), kann man auch die Quadratur-Modulation ohne analoge Mischer diskret durchführen, indem man die Real- und Imaginärteile der IDFT-Liste mit den Werten der modulierenden Cos- und Sin-Funktionen an den zugehörigen Abtaststellen multipliziert und die entstehenden Listen punktweise subtrahiert. Hierzu verwendet man in Bauteilen DDS-Komponenten (engl. Direct Digital Synthesizer11 ). Im Ergebnis liegen dann Abtastwerte des reellen Sendesignals SR vor, die man einer D/A-Wandlung zuführt (vgl. S. 328-330). 11
Passend zu Bandbreite und Bit-Auflösung des nachfolgenden D/A-Wandlers. Ein Tutorial zu DDS findet man
338
11 Weitere Anwendungsbeispiele für die Fouriertransformation Beispiel. Mit den Daten T = 1/2 s, c0 = 0, c1 , . . . c4 wie auf S. 335, M = 64, ωc = 64π rad/s zeigen die folgenden Grafiken links die QM-Modulation des Analogsignals S(t) (dünn gezeichnet) und die Näherung (dicker), die wie geschildert aus IDFT-Werten und diskreter QM-Modulation generiert ist 12 . Die zweite Kurve ist dabei zur sichtbaren Unterscheidung mit Werte-Offset +0.4 gezeichnet. Die zweite Grafik zeigt das Amplitudenspektrum der ersten Kurve in dB. Für beide Fälle wurde das Rechteck-Zeitfenster w = 1[0,T [ verwendet, zur Interpolation der Abtastwerte im zweiten Fall die Reihe aus dem Shannonschen Abtastsatz mit Bandbreite B = 128π rad/s. Man erkennt das mäßige Abfallverhalten des Amplitudenspektrums, das praktischen Anforderungen hinsichtlich zulässiger Außerbandstrahlung nicht genügt 13 .
3
-1
-2
-3
-
-4
-
-5
-3 -
QM-modulierte Signale über Zeit t, Analogsignal und Näherung aus Abtastwerten mit Offset
-6
2
4
6
8
Amplitudenspektrum in dB, aufgetragen über Frequenz (fc = ωc /(2π) = 32 Hz)
4. Verminderte Außerbandstrahlung durch andere Pulsformen, Cyclic Prefix und Postfix In der Praxis wird eine stärkere Dämpfung im Außerband verlangt. In den Spezifikationen für WLAN, DAB usw. werden dafür Spektralmasken definiert, die für die Übertragung eingehalten werden müssen. Es gibt verschiedene Methoden, eine bessere Dämpfung im Außerband zu erreichen. Man findet schnell eine große Anzahl von Publikationen zu diesem Thema unter Stichworten wie „OFDM Pulse Shaping“. Zum Einsatz können Methoden wie geglättete Zeitfenster (W-OFDM für Windowed OFDM) kommen, Filterbänke zur Pulsformung (FBMC, "Filter Bank Based Multicarrier Systems") und andere Varianten des Mehrträgerverfahrens. Wichtige Aspekte dabei sind die Unschärfe-Relation von Heisenberg und die von Balian-Low, was die Zeit-Frequenz-Lokalisation von Signalen angeht (vgl. die folgenden Abschnitte dieses Kapitels). Im Folgebeispiel wird gezeigt, wie mit Hilfe einer Verlängerung der Signaldauer T und einem an den Flanken verrundeten Zeitfenster wT (1+α) der Dauer T (1 + α), α > 0, an Stelle des bisher verwendeten Rechteck-Fensters das Signalspektrum im Außerband gedämpft werden kann. Dabei wird zugleich durch zyklische Erweiterung des Signals ein „Cyclic Prefix“ (CP) und ein „Postfix“ eingeführt. Während w bT ein Nyquist-Puls
12 13
z.B. unter https://www.analog.com/en/education/education-library/technical-tutorial-dds.html, ein HardwareDatenblatt dort unter http://www.analog.com/media/en/technical-documentation/data-sheets/AD9857.pdf. Beide Dokumente seien für einen Eindruck von realer Übertragungstechnik zur Lektüre empfohlen. Das Beispiel findet man – mit Mathematica gerechnet – beim Bonus-Material des Autors zum Buch unter http://www.stiftung-swk.de/mathematica/. Dort sieht man auch ein typisches WLAN-Amplitudenspektrum. Das Spektrum im Beipiel ist eine Summe. Summanden sind daher im Bild rechts nicht einzeln zu erkennen.
11.2 Sampling als Grundlage digitaler Übertragungstechnik
339
im Frequenzbereich ist, gilt dies für w bT (1+α) nicht mehr. Im Sendesignal hat dies eine gewisse Inter-Carrier-Interferenz (ICI) zur Folge, da die Träger ej2πkt/T wT (1+α) (t), k = 0, . . . ,N − 1, nicht mehr orthogonal zueinander sind. Diese Methode ist andererseits einfach zu implementieren und wird in realen Systemen auch so verwendet (vgl. L. Montreuil et al. (2013), Broadcom Recommendations for Tx Symbol Shaping). Ein wichtiger Vorteil des Cyclic Prefix ist, dass die Faltung mit der Kanal-Impulsantwort h eines zeitinvarianten Übertragungskanals als zyklische Faltung dargestellt werden kann, wenn diese Impulsantwort nicht länger andauert als das Prefix. Dies ermöglicht eine Entstörung mit Hilfe von Abtastwerten b h(2πk/T ) des geschätzten KanalFrequenzgangs b h. Mehr dazu im Punkt 7). Das Zeit-Intervall mit dem Cyclic Prefix heißt Guard Interval (GI). Es umfasst oft 1/4 der Kernsymbol-Dauer (z.B. LTE 14 ). Beispiel.
Pulsformung mit „Raised Cosine Window“, Cyclic Prefix und Postfix
Die IDFT-Werte des vorangehenden Beispiels werden hier nun zyklisch um ein Prefix mit den 16 letzten IDFT-Samples und um ein Postfix mit den ersten 4 IDFT-Samples fortgesetzt. Die neue Liste hat dann L = 84 Elemente. An Stelle des RechteckZeitfensters wird ein Fenster mit Cos-Flanken (engl. „Raised Cosine Window“) wie in den vorab zitierten Broadcom-Empfehlungen15 verwendet. Außerdem wird nun ein realisierbares (analoges) Butterworth-Tiefpassfilter zur Interpolation der Abtastwerte von SR an Stelle der Shannonschen Abtastreihe benutzt, um die D/A-Wandlung zu modellieren. Für die Gewichtung der IDFT-Liste mit Zeitfenster-Werten dient als Ausgangspunkt das Zeitfenster wT (1+α) (t) = T p(t) mit α = T /16 und T (1 − α) 1/T für 0 ≤ |t| < 2 1 T (1 − α) T (1 − α) π T (1 + α) p(t) = 1 + cos |t| − für ≤ |t| ≤ 2T αT 2 2 2 0 sonst. T (1 + α) Gewichtung der zyklisch erweiterten IDFT-Liste mit Werten von T p t − 2 zu den Zeiten tn = T (1 + α)(2n + 1)/(2L), n = 0, . . . L − 1, führt im Ergebnis dazu, dass die ersten 3 Prefix-Werte und die letzten 3 Postfix-Werte in die Cos-Flanken des Fensters gelangen und so die OFDM-Pulsform „verrundet“ wird. Nachfolgend links das interpolierte Signal mit Tiefpass-Verzögerung und zyklischen Erweiterungen am Beginn und am Ende, rechts dick gezeichnet das resultierende Amplitudenspektrum im Vergleich mit dem dünn gezeichneten bei Verwendung des Rechteck-Fensters (zu den detaillierten Berechnungen siehe Fußnote12 , S. 338, oder man rechne selbst nach).
14 15
An der Fouriertransformierten pb (vgl. A10, S. 272) lässt sich erkennen, dass das Amplitudenspektrum des OFDM-Signals im Außerband nun weitaus stärker als mit dem Rechteck-Fenster gedämpft wird, deutlich auch im folgenden Bild rechts zu sehen: sin(ωT /2) cos(αωT /2) pb(ω) = . ωT /2 1 − (αωT /π)2
LTE mit 64-QAM, 20 MHz Bandbreite: 1201 Nutzträger, Kernsymbol T = 66.67 µs, GI (lang) 16.67 µs. Broadcom ist ein Ausrüster z.B. für DSL bei Festnetz-Anschlüssen (DSLAM’s) verschiedener Anbieter.
340
11 Weitere Anwendungsbeispiele für die Fouriertransformation Das Butterworth-Filter zur Interpolation wurde mit folgenden Daten entworfen: Passbandgrenze 48 Hz, Stoppbandgrenze 96 Hz, minimale Passbandverstärkung 0.9, maximale Stoppbandverstärkung 0.005, Gleichspannungsverstärkung K = 1. Die Ordnung des Filters ist dann 9, die Gruppenlaufzeit etwa 21 ms im Passband (vgl. S. 286). &
3 "
-%&
1
-'& -1
-(&
-" -3 !
!"
!#
!$
QM-moduliertes Signal mit dem Raised Cosine Window über Zeit t, nach Interpolation mit Butterworth-Tiefpassfilter, Gruppenlaufzeit im Passband ∼ 21 ms
-)& -%&
&
%&
'&
(&
)&
*&&
dB-Amplitudenspektren über Frequenz f (fc = ωc /(2π) = 32 Hz), dick mit Raised Cosine Window, dünn mit Rechteck-Fenster. Für f < fc Fenster-Wirkung, über Stoppbandgrenze 96 Hz zusätzlich Tiefpasswirkung
5. Rekonstruktion der Nutzinformation mit einer DFT bei identischem Empfang von SR Bei identischem Empfang ohne Verzerrungen durch den Übertragungskanal gewinnt der Empfänger durch Entnahme eines Zeitabschnitts der Dauer T und Inversion der Quadratur-Modulation die Inphase-Komponente I(t) und die Quadratur-Komponente Q(t) des Signals zurück. Nach einer N -Punkte-DFT von I(t)+jQ(t) über diesen Zeitabschnitt kann entschieden werden, welchen komplexen Amplituden ck des OFDMAlphabets das DFT-Ergebnis zugeordnet wird. Ein erster Vorteil der Periodisierung mit Prefix und Postfix ist dabei, dass man mäßige Synchronisierungsfehler (Phasenversatz) leicht korrigieren kann, wenn man Pilotwerte unter den Amplituden kennt. Beispiel. Abtastung im oben schon gerechneten Beispiel16 mit Abtastzeitpunkten tn = nT /N + ∆t, N = 5, n = 0, . . . ,N − 1 und ∆t = 0.226 s, d.h. asynchron beginnend im Prefix, ergibt zunächst die DFT-Liste dft dft = ( − 0.00136 + 0.00096j, − 2.10649 + 2.35922j, − 2.37870 + 2.08454j, + 3.02492 − 2.97252j, − 0.37881 + 1.36073j).
Verwendung von c1 als Pilotwert ergibt nach Phasenkorrektur (vgl. Beispiel 4, S. 73) das Ergebnis (e c0 , . . . ,e c4 ), das man nun mit den Werten (c0 , . . . ,c4 ) auf S. 335 vergleichen kann. Die Abweichungen zwischen beiden Listen sind auf Rundungen bei den diskreten Fouriertransformationen und leichte Inter-Carrier-Interferenzen, die das Fenster wT (1+α) verursacht, zurückzuführen: 1 (e c0 , . . . ,e c4 ) = ( −0.0013644 + 0.00095966j, 1.00016 + 3.00049j, A 3.0015 + 0.997246j, − 2.99428 + 3.00339j, − 1.00272 − 0.994806j) 1 (c0 , . . . ,c4 ) = ( 0, 1 + 3j, 3 + 1j, − 3 + 3j, − 1 − 1j ). A 16
Empfehlung: Rechnen Sie das Beispiel mit Hilfe eines Computeralgebra-Systems einmal selbst nach.
11.2 Sampling als Grundlage digitaler Übertragungstechnik
341
6. Energiedichte und spektrale Leistungsdichte einer OFDM-Übertragung Eine OFDM-Übertragung ist wie der betrachtete Abschnitt ein zeitbegrenztes und daher ein Energiesignal. Es gibt deshalb keine im üblichen Sinn vorhandene LeistungscR (ω) im Beispiel stellt entsprechend dichte ungleich Null. Das Betragsquadrat von S seiner physikalischen Dimension eine Energiedichte dar. Das Spektrum der Näherung für SR ist, wie man im Beispiel schon erkennt, dann im Wesentlichen bestimmt durch die Varianz des OFDM-Alphabets und durch die Fouriertransformierten der Fensterfunktion und des interpolierenden Tiefpass-Filters. In theoretischen Ansätzen kann man eine OFDM-Übertragung als unendlich andauernden zyklostationären stochastischen Prozess modellieren und dafür eine mittlere spektrale Leistungsdichte angeben. Berechnungen hierzu unter verschiedenen Annahmen über das Modulationsverfahren findet man bei L. W. Couch (2007), J. G. Proakis (2001) oder W. A. Gardner, A. Napolitano, L. Paura (2008). In den Spezifikationen der Übertragungsverfahren (WLAN, DVB-T u.a.) sind Spektralmasken für spektrale Leistungsdichten vorgegeben, die eingehalten werden müssen – für Signale in Volt dann mit der Einheit V2 /Hz. Der Nachweis dafür wird in der Praxis durch Simulationen zur Spektralschätzung erbracht. Hierfür werden einige tausend OFDM-Symbole mit einer Zufalls-Bitfolge erzeugt und eine Mittelung der interpolierten (diskreten) DFT-Spektren zur Spektralschätzung verwendet. Es sind verschiedene Mittelungsverfahren in Gebrauch (averaged periodogram technique, Bartlett’s method, Welch’s method u.a.). Eine ausführliche Behandlung des Themas Spektralschätzung mit Aussagen zu Konsistenz, Erwartungstreue und Varianz verschiedener Schätzungen findet man zum Beispiel im Lehrbuch zur digitalen Signalverarbeitung von K. D. Kammeyer, K. Kroschel (2012). 7. Einflüsse des Übertragungskanals, Nutzen von Präambeln, Piloten und Cyclic Prefix Der Übertragungskanal für OFDM, leitungsgebunden oder drahtlos, hat vielfältige Einflüsse auf Funktionalität und Qualität der Transmission. Man fasst sie unter dem Begriff „Schwund“ (engl. Fading) zusammen. Hierzu zählen Echo-Effekte und Zeitverzögerungen bei Mehrwegeausbreitung mit der Folge möglicher Auslöschungen oder Intersymbol-Interferenzen (ISI), Dämpfungen aus unterschiedlichen Gründen (Senderabstand, Wetter), Frequenzdispersion durch Dopplereffekte bei bewegten Sendern oder Empfängern. Hinzu kommen Rauschen, nichtlineare Verzerrungen der HF-Verstärker, insbesondere in Massenprodukten, die mit Kosten- und Energie-Optimierungen herzustellen sind, Jitter-Effekte in Oszillatoren bei Bauteilen u.v.a.m., was Nachrichtentechniker für ein robust funktionierendes Gesamtsystem bei Konzeption und Ausführung zu meistern haben. Einen ersten Eindruck zum Thema Kanal-Entzerrung (engl. channel equalizing) geben folgende Überlegungen: Es sei vorausgesetzt, dass beim Empfänger der Übertragung Abtastwerte r(nT /N ) (0 ≤ n ≤ N − 1) des empfangenen Signalausschnitts vorliegen. Der Kanal sei als rauschfreies kausales lineares Filter angenommen. Seine Impulsantwort h soll innerhalb der Dauer eines dem OFDM-Symbol vorangestellten Cyclic Prefix abklingen. Durch eine Erweiterung des Symbols mit Prefix und Postfix wie im Beispiel und das Abklingen transienter Anteile der Faltung des Signals S mit h innerhalb der Zeitdauer des Prefix kann man die Werte r(nT /N ) als Abtastwerte der Faltung von h mit der T periodischen Fourierreihe ST auffassen, die durch Periodisierung des OFDM-Symbols
342
11 Weitere Anwendungsbeispiele für die Fouriertransformation entsteht. Da Tr(h) beschränkt ist, ist b h ein Multiplikator in S ′ . Mit Abtastwerten des Kanal-Frequenzgangs b h gilt daher für das ebenfalls periodisierte Empfangssignal rT (vgl. S. 254 und S. 294): rT (t) = ST ∗ h =
N −1 X k=0
h(2πk/T ) ej2πkt/T . ck b
N −1 X h(2πk/T ) ej2πkn/N , d.h. r(nT /N ) ist Es folgt r(nT /N ) = rT (nT /N ) = ck b k=0 . Eine DFT der Werte h(2πk/T ) die n-te Komponente einer IDFT von ck b k=0,...,N −1
r(nT /N ) mit Ergebnis rbk (0 ≤ k ≤ N − 1) in der k-ten Komponente zeigt also für eine gesuchte komplexe Amplitude ck des OFDM-Symbols ck =
rbk . b h(2πk/T )
Beim Empfänger bekannte Präambeln und Pilotsymbole können zur Synchronisation und zur Schätzung der Impulsantwort h resp. des Kanal-Frequenzgangs b h genutzt werden. Diese zunächst sehr einfach anmutende Kanal-Entzerrung muss jedoch mit Vorsicht gesehen werden. Die notwendige Dauer des Prefix und der Kanal-Frequenzgang b h müssen zuverlässig geschätzt werden, die Werte b h(2πk/T ) dürfen nicht Null werden (vgl. Abschnitte 5.6 und 10.6 zu Faltungsinversen) und die Faltungsgleichung r = S∗h ist ein typisches schlecht-gestelltes Problem (vgl. Aufgabe A12 zu Kap. 8). Sehr kleine Werte von b h(2πk/T ) bewirken oben beim Quotienten für ck eine starke Anhebung von Rauschanteilen im Empfangssignal, die nicht berücksichtigt waren. Es gibt daher in der realen Praxis eine ganze Reihe modifizierter Entzerrungsalgorithmen, bei bekanntem b h – etwa bei leitungsgebundenen Übertragungen zwischen zwei Knoten – zum Teil mit einer Vorentzerrung schon beim Sender, sonst empfangsseitig.
8. Abschließende Bemerkungen und Hinweise zur weiterführenden Nachrichtentechnik
Es gibt viele weitere Themen, die für eine praxistaugliche Übertragung in Realzeit (innerhalb weniger µs pro OFDM-Symbol, vgl. Fußnote14) mit OFDM oder Modifikationen des Verfahrens (OFDMA, COFDM, FBMC, GFDM etc.) beherrscht werden müssen. Hierzu zählen insbesondere Spitzenwert-Reduktion (bei vielen gleichen Amplituden ck im OFDM-Symbol, engl. Peak-to-Average Power Ratio Reduction, PAPR Reduction), Kanal-Entzerrung bei mehrfach frequenz-selektiven Kanälen (DopplerEffekte bei bewegten Sendern oder Empfängern mit Frequenzdispersion) u.v.a.m. Trotz einfacher Prinzipien ist es ein weiter Weg zu robuster Technik, der Ingenieuren und Informatikern hohes Können abverlangt. Da dieser Text keinesfalls eine weitreichende Einführung in die Kunst der Nachrichtentechnik sein kann, sondern nur einige grundlegende Ideen, die ihren Ursprung in der Fourier-Analysis haben, schildern und im Wesentlichen Anregungen geben will, bei Interesse weiteres Wissen zum Thema zu erwerben, sei für alles Weitere nochmals die im Text schon mehrfach zitierte Fachliteratur zur Nachrichten- und Kommunikationstechnik empfohlen.
11.3 Die Heisenbergsche Unschärferelation
343
11.3 Die Heisenbergsche Unschärferelation Bereits in früheren Abschnitten hatten wir qualitativ erkannt, dass die spektrale Breite eines Signals umso größer ist, je kürzer die zeitliche Signaldauer ist. Umgekehrt hält etwa die Impulsantwort eines Tiefpassfilters zeitlich umso länger merklich an, je kleiner die Grenzfrequenz des Filters ist. Der gleiche Aspekt zeigt sich an der Skalierungseigenschaft 1 b ω der Fouriertransformation für α 6= 0 oder an der Tatsache, dass ein f f (αt) |α| α zeitbegrenztes Signal f eine Fouriertransformierte fb besitzt, die in keinem Frequenzintervall vollständig verschwindet (vgl. S. 256). Zur Veranschaulichung betrachte man noch einmal die Beispiele in den Abschnitten 9.1 und 10.2, etwa Rechtecks- oder Dreiecksfunktionen mit ihren Fouriertransformierten auf S. 232 oder die Korrespondenzen δ(t) 1 2πδ(ω). und 1 Um quantitative Aussagen über die beobachtete Kopplung von Kompression und Expansion im Zeit-Frequenz-Bereich zu erhalten, benötigt man ein Maß für die Zeitdauer und die Bandbreite von Signalen. Eine für die immense Vielfalt möglicher Signale einheitliche Definition von Zeitdauer und Bandbreite gibt es zwar nicht, jedoch eignet sich für eine große Klasse von Signalen die Definition der Streuung, um diese Begriffe einzuführen. Über die im Folgenden betrachteten Signale f setzen wir voraus, dass die Funktionen f stetig und stückweise stetig differenzierbar sind. Außerdem sollen mit f (t) auch tf (t) und f˙(t) quadratisch integrierbar sein. Den Parameter t interpretieren wir als Zeitparameter. Definition. 1. Die Streuung ∆2a (f ) von f 6= 0 um den Punkt a ist definiert durch ∆2a (f )
=
+∞ ´
−∞
(t − a)2 |f (t)|2 dt +∞ ´
−∞
|f (t)|2
.
dt
2. Die effektive Zeitdauer Dt (f ) von f 6= 0 ist definiert durch +∞ ´ t|f (t)|2 dt −∞ Dt (f ) = ∆a (f ) mit a = +∞ . ´ |f (t)|2 dt −∞
3. Die effektive Bandbreite Dω (f ) von f 6= 0 ist definiert durch +∞ ´ ω|fb(ω)|2 dω −∞ Dω (f ) = ∆b (fb) mit b = +∞ . ´ 2 b |f (ω)| dω −∞
Die Streuung ∆2a (f ) ist ein Maß dafür, wie gut oder schlecht f „um a herum konzentriert“ ist. Ist |f (t)| außerhalb einer kleinen Umgebung von a sehr klein, dann macht der
344
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Faktor (t − a)2 den Zähler von ∆2a (f ) klein im Vergleich zum Nenner und die Streuung ist klein. Ist |f (t)| groß für (t − a)2 > 1, dann bewirkt derselbe Faktor eine Vergrößerung des Zählers im Vergleich zum Nenner und die Streuung wird groß. Interpretiert man die Funk+∞ +∞ ˆ ˆ 2 2 tion |f (t)| als Massendichte, dann sind S = t|f (t)| dt |f (t)|2 dt der Schwer−∞
−∞
punkt und ∆2S (f ) das Trägheitsmoment bezüglich des Schwerpunktes. Interpretiert man +∞ ˆ 2 die Funktion |f (t)| |f (t)|2 dt als Dichte einer Wahrscheinlichkeitsverteilung, dann −∞
sind S der Erwartungswert und ∆2S (f ) die Varianz der Wahrscheinlichkeitsverteilung. Beispiele 2
2
1. Für f (t) = (2πσ 2 )−1/4 e−(t−m) /(4σ ) , σ > 0, ist die Funktion |f (t)|2 die aus der Wahrscheinlichkeitstheorie bekannte Dichte der Gaußverteilung mit Erwartungswert m und Varianz σ 2 . Die effektive Zeitdauer von f ist also nach der vorangehenden Bemerkung Dt (f ) = σ. Mit der Parsevalgleichung und der Differentiationsregel für die Fouriertransformation folgt die effektive Bandbreite: Dω2 (f )
=
∆20 (fb)
1 = 2π
+∞ +∞ ˆ ˆ 1 b 2 b 2 ω |f (ω)| dω = |f˙(ω)|2 dω 2π
−∞
−∞
+∞ +∞ ˆ ˆ 1 1 2 ˙ (t − m)2 |f (t)|2 dt = 2 . = |f (t)| dt = 4σ 4 4σ −∞
−∞
1 Das Produkt aus effektiver Zeitdauer und Bandbreite ergibt Dt (f )Dω (f ) = . 2 A(1 − |t|/T ) für |t| ≤ T 2. Für die Dreiecksfunktion f (t) = berechnet man 0 für |t| > T +∞ ˆ 2A2 T |f (t)|2 dt = 3
T und die effektive Zeitdauer Dt (f ) = √ . 10 +∞ −∞ ˆ 2 4πA T Nach der Parsevalgleichung ist dann |fb(ω)|2 dω = . Der Schwerpunkt von 3 −∞
|fb|2 ist Null, weil |fb|2 eine gerade Funktion ist. Wie im ersten Beispiel folgt
+∞ +∞ +∞ ˆ ˆ ˆ 4πA2 b 2 b 2 2 ˙ . ω |f (ω)| dω = |f (ω)| dω = 2π |f˙(t)|2 dt = T
−∞
−∞
−∞
√ Die effektive Bandbreite ist also Dω (f ) = 3/T . Das Zeitdauer-Bandbreite-Produkt √ √ ist Dt (f )Dω (f ) = 3/ 10 ≈ 0.548, also etwa 9.6% größer als im ersten Beispiel bei der Gaußfunktion.
11.3 Die Heisenbergsche Unschärferelation
345
Anschaulich. Die Rechnungen in diesen Beispielen zeigen uns, dass ω fb(ω) genau dann quadratisch integrierbar ist, wenn f˙(t) diese Eigenschaft hat. Da die Bandbreite durch ein Integral über das Betragsquadrat der Ableitung f˙ eines Zeitsignals f gegeben ist, muss also eine Kompression des Signals f durch simultan wachsende Steigungen eine Vergrößerung der Bandbreite bewirken. Die Funktionen f und fb können daher nicht simultan in der Nähe einzelner Punkte konzentriert sein. Eine quantitative Beschreibung dieses Sachverhaltes gibt die Heisenbergsche Unschärferelation. Sie wurde von W. Heisenberg 1927 in der Quantenmechanik entdeckt. Ihre Bedeutung für die Signalübertragung wurde von D. Gabor (1946) untersucht. Sie lautet in unserem Kontext wie folgt: Unschärferelation für das Zeitdauer-Bandbreite-Produkt. Für quadratisch integrierbare Signale f 6= 0 und beliebige a,b ∈ R gilt
1 ∆2a (f )∆2b (fb) ≥ . 4 1 Insbesondere gilt für das Zeitdauer-Bandbreite-Produkt immer Dt (f )Dω (f ) ≥ . Es gilt 2 1 genau dann Gleichheit Dt (f )Dω (f ) = , wenn |f | eine Gaußfunktion ist, d.h. wenn 2 2 2 f (t) = c ejat e−(t−m) /(4σ ) mit beliebigen reellen Konstanten a, m, c 6= 0, σ 6= 0 ist. Beweis. Wir können annehmen, dass mit f auch tf (t) und f˙(t) quadratisch integrierbar sind, da andernfalls ∆2a (f ) = ∞ oder ∆2b (fb) = ∞ gelten würde und die Ungleichung trivialerweise erfüllt wäre. Für a = b = 0 ergibt partielle Integration ˆβ α
also
β ˆβ |f (t)|2 + tf (t)f˙(t) dt , tf (t)f˙(t) dt = t|f (t)| − 2
ˆβ α
2
|f (t)| dt = −2ℜ
α
ˆβ
α
tf (t)f˙(t) dt
α
β + t|f (t)|2 . α
Aufgrund der Voraussetzungen über f (vgl. S. 343) existieren die Grenzwerte der Integrale für α → −∞, β → +∞ und es ist lim α|f (α)|2 = lim β|f (β)|2 = 0. Damit folgt α→−∞
+∞ ˆ −∞
|f (t)|2 dt = −2ℜ
β→+∞
tf (t)f˙(t) dt .
+∞ ˆ
−∞
Mit der Cauchy-Schwarz-Ungleichung und der Parsevalgleichung erhält man hieraus +∞ +∞ +∞ ˆ 2 ˆ ˆ |f (t)|2 dt ≤4 t2 |f (t)|2 dt |f˙(t)|2 dt −∞
−∞
−∞
+∞ +∞ ˆ ˆ 1 2 b 2 2 2 ω |f (ω)| dω =4 t |f (t)| dt 2π −∞
−∞
346
11 Weitere Anwendungsbeispiele für die Fouriertransformation
1 und damit die Unschärferelation ∆20 (f )∆20 (fb) ≥ . 4 Den allgemeinen Fall für a 6= 0 oder b 6= 0 erkennt man mit g(t) = e−jbt f (t + a). Da ∆2a (f ) = ∆20 (g) und ∆2b (fb) = ∆20 (b g ) gelten, folgt 1 ∆2a (f )∆2b (fb) = ∆20 (g)∆20 (b g) ≥ . 4
Die Cauchy-Schwarz-Ungleichung oben wird genau dann eine Gleichung, wenn tf (t) und f˙(t) linear abhängig sind, wenn also die Differentialgleichung ktf (t) = f˙(t) gilt (vgl. S. 261). Die einzigen nichttrivialen, quadratisch integrierbaren Lösungen dieser Differenti2 algleichung sind von der Form f (t) = c ekt /2 mit c 6= 0, k < 0. Mit k = −1/(2σ 2 ) folgt daher die letzte Aussage des Satzes. Bemerkung. Auf die Glattheitsvoraussetzungen von S. 343 an f kann wie bei der Parsevalgleichung verzichtet werden (vgl. S. 241), d.h. die Heisenbergsche Unschärferelation gilt für beliebige quadratisch integrierbare Funktionen f . Einen Beweis dieser allgemeineren Aussage haben 1931 W. Pauli und H. Weyl gegeben. Man findet ihn zum Beispiel in dem Buch von H. Dym und H. P. McKean (1985).
Anwendungsbeispiele 1. Auflösung im Zeitbereich. In der elektrischen Messtechnik ist bekannt, dass beispielsweise mit einem Oszilloskop von 100 MHz effektiver Bandbreite (Dω = 2π·100 MHz) nur eine zeitliche Auflösung in der Größenordnung von 1 ns möglich ist, mit Dω wie oben also Dt ≥ 1/(2Dω ) ≈ 0.8 · 10−9 s. Bei Signalen kürzerer effektiver Zeitdauer wirkt das Oszilloskop als Tiefpass, die Signale werden nicht mehr getreu wiedergegeben, sondern in der Wiedergabe geglättet und in der Dauer verlängert. Start- und Stoppimpulse zur Messung von Zeitintervallen unterhalb der durch die Unschärferelation gegebenen Dauer verschmelzen dann bei der Wiedergabe; eine Zeitmessung so kurzer Intervalle ist daher nicht mehr möglich. 2. Auflösung im Frequenzbereich. Die effektive Zeitdauer Dt , die man einen Ton singen oder mit einem Instrument spielen muss, um ihm eine Tonhöhe bzw. Frequenz mit der Genauigkeit Dω zuzuordnen, beträgt nach dem Unschärfeprinzip mindestens 1/(2Dω ). Ist etwa Dω = 2π·1 Hz, dann muss Dt größer als etwa 8·10−2 s sein. In sehr schnellen Passagen eines Musikstückes lassen sich daher leichte Intonationsschwächen der Virtuosen nicht bemerken. Amateurmusikern sind daher möglichst schnelle Musikstücke für einen eventuellen Vortrag zu empfehlen. 3. Ultrakurzpulslaser hoher Bandbreite. Die Pulsdauer heutiger modengekoppelter Kurzpulslaser liegt im Bereich weniger Femtosekunden (1 fs = 10−15 s) mit heute typischen Pulswiederholungsraten von 80-100 MHz bis hin zu 20-30 GHz. Die entsprechend enormen Bandbreiten ermöglichen zeitaufgelöste Spektroskopie, zum Beispiel bei der Analyse chemischer Reaktionen. In der Terahertz Time Domain Spektroskopie (THz-TDS) steht damit eine nicht-invasive breitbandige Methode zur Erforschung
11.3 Die Heisenbergsche Unschärferelation
347
von Materialeigenschaften im fernsten Infrarot zur Verfügung. Anwendungsbereiche sind zum Beispiel Untersuchungen von Kristallstrukturen, biomedizinische Diagnostik oder pharmazeutische Qualitätskontrolle. An Lasertechnik interessierte Leser seien auf die Lehrbücher von A. E. Siegman (1986) und C. Rullière (1998), für eine Übersicht zu Anwendungsgebieten auf K. Jesse (2005) hingewiesen. Die Heisenbergsche Unschärferelation in der Quantenmechanik Die Atomphysik hat mit der Quantenmechanik seit der Kopenhagener Konferenz im Jahr 1927 eine wahrscheinlichkeitstheoretische Deutung erfahren. In dieser Deutung wurden die experimentellen Erfahrungen, ihre theoretische Beschreibung und Interpretation zusammengeführt und sowohl das Wellenmodell als auch das Teilchenmodell der Materie widerspruchsfrei vereint. Darstellungen der historischen Entwicklung der Quantenmechanik und ihrer mathematischen Grundlegung findet man etwa bei bei W. Greiner (2008), bei A. Messiah (2003) oder in anderer einschlägiger Literatur. Eine zentrale Stellung in der Entwicklung und Interpretation der Quantentheorie nimmt die Heisenbergsche Unschärferelation ein. Um sie in der Sprache der Quantenmechanik zu formulieren, betrachten wir ein freies Elektron, das sich entlang der x-Achse bewegt. Sein Zustand zu einer festen Zeit kann jedoch nicht wie in der klassischen Mechanik durch einen Ort x0 ∈ R und einen Impuls p0 ∈ R angegeben werden, sondern wird durch eine komplexwertige, quadratisch integrierbare „Wellenfunktion“ ψ(x) beschrieben, deren L2 Norm +∞ ˆ 1/2 kψk2 = |ψ(x)|2 dx =1 −∞
˙ ist (vgl. S. 261). Mit ψ(x) werden auch die Funktionen xψ(x) und ψ(x) als quadratisch integrierbar vorausgesetzt. Die Funktion |ψ|2 ist als Dichte der Aufenthaltswahrscheinlichkeit des Elektrons zu interpretieren. Der Ort des Teilchens ist danach eine Zufallsgröße +∞ ˆ mit dem Erwartungswert a = x|ψ(x)|2 dx und der Varianz ∆2a (ψ). Die Wahrschein−∞
lichkeit dafür, dass eine Ortsmessung im Zustand ψ einen Wert x ∈ [x1 ,x2 ] ergibt, ist ˆx2 |ψ(x)|2 dx.
x1
Die Varianz ∆2a (ψ) ist ein Maß für die Unbestimmtheit des Ortes, denn je größer die Varianz ist, desto größer ist die Aufenthaltswahrscheinlichkeit in Intervallen, welche den Erwartungwert a nicht enthalten. Ist die Varianz sehr klein, dann nennt man den Ort scharf bestimmt. Die Aufenthaltswahrscheinlichkeit in sehr kleinen Intervallen um a ist dann groß, weil die Dichtefunktion |ψ|2 bei kleiner Varianz um a herum konzentriert ist. Der Impuls des Elektrons ist im Wesentlichen durch die Fouriertransformierte von ψ, nämlich durch die Funktion b e ψ(p) = (2π~)−1/2 ψ(p/~)
348
11 Weitere Anwendungsbeispiele für die Fouriertransformation
gegeben. Die Konstante ~ ist die Plancksche Konstante. Auch der Impuls ist eine Zufallse 2 ist als Dichte für die Wahrscheinlichkeitsverteilung des Impulses größe. Die Funktion |ψ| zu interpretieren. Der Erwartungswert b für eine Impulsmessung ist dann +∞ +∞ ˆ ˆ ~ 2 2 e b b= p|ψ(p)| dp = p|ψ(p)| dp . 2π −∞
−∞
e ist ein Maß für die Unbestimmtheit des Teilchenimpulses. Der Impuls Die Streuung ∆2b (ψ) e ist. Für das Produkt der Varianzen von ψ und ist umso schärfer bestimmt, je kleiner ∆2b (ψ) b ≥ 1/4. Aus b ψ gilt nach S. 345 die Unschärferelation ∆2a (ψ)∆2b/~ (ψ) e ∆2b (ψ)
1 = 2π~
+∞ ˆ p 2 (p − b)2 ψb dp ~
−∞
~2 = 2π
+∞ ˆ
−∞
b p− ~
2
2 b b |ψ(p)| dp = ~2 ∆2b/~ (ψ)
ergibt sich die folgende, von W. Heisenberg (1901-1976) im Jahre 1927 entdeckte Unschärferelation. Sie ist eine der fundamentalen Aussagen der Quantenmechanik. Heisenbergsche Unschärferelation. Ort und Impuls eines Elektrons im Zustand ψ sind nicht simultan scharf bestimmt, sondern mit einer Unbestimmtheit behaftet. Für die Wellenfunktionen ψ und ψe gilt die folgende Unschärferelation e ≥ ~/2. ∆a (ψ)∆b (ψ)
Die Aussage gilt auch für Wellenfunktionen im dreidimensionalen Raum. Man hat nur die Fouriertransformation für Funktionen mehrerer Variablen anzuwenden. Die Unschärferelation beruht nicht etwa auf Grenzen von Messgenauigkeiten, sondern ist eine generelle Eigenschaft von Funktionen. Zum Beispiel kann man von der Frequenz einer Schwingung „im reinen Sinn“ nur sprechen, wenn der Schwingungsvorgang periodisch und damit insbesondere zeitlich unbegrenzt ist. Eine Zeitdauer ist dann gänzlich undefiniert. Je kürzer andererseits der Vorgang währt, desto fragwürdiger ist es, von Periodizität und damit von Frequenz zu reden; der Begriff selbst wird unscharf, der Vorgang ist mathematisch durch die zugehörige Spektralfunktion an Stelle einer reinen Frequenz zu beschreiben, und es ergeben sich Unschärferelationen. In der Elektrotechnik kennt man diesen Sachverhalt, wie wir gesehen haben, etwa beim Zeitdauer-Bandbreite-Produkt. Die Quantenmechanik zeigt, dass auch Ort und Impuls bei der physikalischen Beschreibung atomarer Teilchen durch Aufenthaltswahrscheinlichkeiten solchen Unschärfen unterworfen sind. Gleiches gilt für andere Größen, deren Produkt eine Wirkung ergibt. So erhält man etwa eine analoge Unschärferelation für das Produkt aus Energie und Zeitdauer eines atomaren Ereignisses. Anwendungen der Unschärferelation auf Fragestellungen der Physik, zum Beispiel die Erklärung des Tunneleffektes, findet man etwa bei W. Greiner (2008).
11.4 Zeit-Frequenz-Analyse, gefensterte Fouriertransformationen
349
11.4 Zeit-Frequenz-Analyse, gefensterte Fouriertransformationen Für viele Zwecke der Signalverarbeitung ist die Fouriertransformation in ihrer ursprünglichen Form nicht geeignet. Weil sich das Fourierintegral über die gesamte Zeitachse erstreckt, wäre zur Analyse der spektralen Eigenschaften eines Signals die volle Kenntnis seines Zeitverlaufs nötig, bei der Analyse zu einem festen Zeitpunkt t0 also auch die Kenntnis aller Signalwerte in der Zukunft t > t0 . An den asymptotischen Eigenschaften der Fouriertransformierten ist außerdem ersichtlich, dass selbst zeitlich eng begrenzte Störungen das gesamte Spektrum beeinflussen (vgl. S. 239). In ihrer klassischen Form bietet die Fouriertransformation auch nicht die Möglichkeit einer simultanen Zeit-Frequenz-Analyse. Zum Beispiel hat Sprache oder ein Musikstück in unserer Alltagserfahrung ein bestimmtes „Zeitmuster“ und gleichzeitig ein bestimmtes „Frequenzmuster“. Die Spektralfunktion eines Signals zeigt aber nicht, zu welchen Zeiten und mit welchen jeweiligen Amplituden eine bestimmte Kreisfrequenz ω in einem Signal f vorkommt, sondern sammelt über den gesamten Zeitverlauf von f die Beiträge gleicher Kreisfrequenz ω in fb(ω) kumulativ an. Diese Nachteile für Zwecke der Signalverarbeitung bemerkte schon D. Gabor (1900-1979), der 1946 in seiner Arbeit „Theory of Communication“ eine Zeit-Frequenz-Lokalisation durch Fouriertransformation mit Fensterfunktionen vorschlug. Um Information über das „Zeit-Frequenz-Muster“ eines Signals zu erhalten, bestimmt man nicht die Spektralfunktion fb des gesamten Signals, sondern die Spektralfunktionen für Zeitausschnitte von f . Zeitausschnitte eines Signals f erhält man durch Multiplikation von f mit Funktionen endlicher effektiver Zeitdauer. Solche Funktionen bezeichnet man als Fensterfunktionen oder Zeitfenster. Gefensterte Fouriertransformationen, Gabortransformation Alle Signale f und Fensterfunktionen w setzen wir im Folgenden als stückweise stetig differenzierbar und quadratisch integrierbar voraus. Für die Fensterfunktionen w gelte w 6= 0 und außerdem, dass mit w(t) und w(ω) b auch tw(t) und ω w(ω) b quadratisch integrierbar sein sollen. Die Fensterfunktionen w besitzen dann endliche effektive Zeitdauer und Bandbreite (vgl. 11.3). Insbesondere sind auch |t|1/2 w(t) und (1 + |t|)w(t) quadratisch integrierbar, und die Cauchy-Schwarz-Ungleichung für das Produkt (1 + |t|)−1 (1 + |t|)w(t) zeigt, dass w(t) integrierbar ist. Analog erhält man, dass w(ω) b integrierbar ist. Die Funktionen w(t) und w(ω) b sind dann auch stetig. Wie schon in früheren Abschnitten (vgl. S. 265) verwenden wir die Schreib+∞ ˆ weisen hf (t)|g(t)i = f (t)g(t) dt für das innere Produkt quadratisch integrierbarer −∞
Funktionen und kf k = hf (t)|f (t)i1/2 für die Norm von f aus L2 (R). Die Größen t∗ = htw(t)|w(t)i/kwk2 bzw. ω ∗ = hω w(ω)| b w(ω)i/k b wk b 2
bezeichnen wir als Zeitzentrum bzw. Frequenzzentrum eines Fensters w 6= 0 (vgl. S. 344).
350
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Definition. Die Transformation Gw , die ein Signal f auf die Funktion Gw f = fe abbildet, +∞ ˆ jωs e definiert durch f (ω,t) = hf (s)|w(s − t) e i = f (s)w(s − t) e−jωs ds , nennt man −∞
die gefensterte Fouriertransformation mit dem Zeitfenster w. Sie wird abgekürzt auch als STFT bezeichnet (Short Time Fourier Transform). Die gefensterte Fouriertransformation 2 mit dem Gaußfenster w(t) = gα (t) = (4πα)−1/2 e−t /(4α) , α > 0, wird als Gabortransformation Gα bezeichnet.
Anstelle periodischer harmonischer Schwingungen ejωt verwendet die gefensterte Fouriertransformation also Translationen amplitudenmodulierter Schwingungen mit der Einhüllenden w. Um eine anschauliche Interpretation von fe(ω0 ,t0 ) für fest gewählte ω0 und t0 zu geben, betrachten wir einen Ausschnitt einer Notenzeile aus der Musik:
Das „Zeit-Frequenz-Muster“ ist in der Notenschrift durch die Positionen und die Notenwerte der einzelnen Noten gegeben, ergänzt durch Dynamikangaben wie „forte“ oder „piano“. Ganz ähnlich kann man für ein Zeitfenster w mit dem Zeitzentrum t∗ und dem Frequenzzentrum ω ∗ die Funktion wω0 ,t0 (s) = w(s − t0 ) ejω0 s als eine „Note“ auffassen, welche im Frequenzbereich um ω0 + ω ∗ mit der effektiven Bandbreite Dω (w) und im Zeitbereich um t0 + t∗ mit der effektiven Zeitdauer Dt (w) lokalisiert ist. ω } Dω (w)
ω0 + ω ∗ Dt (w) t0 + t∗
t
Zeit-Frequenz-Lokalisation der „Note“ wω0 ,t0 im Zeit-Frequenz-Fenster [t0 + t∗ − Dt (w),t0 + t∗ + Dt (w)] × [ω0 + ω ∗ − Dω (w),ω0 + ω ∗ + Dω (w)]
Die komplexe Zahl fe(ω0 ,t0 ) = hf (s)|wω0 ,t0 (s)i gibt dann an (vgl. S. 48), mit welchem Anteil die „Note“ wω0 ,t0 im Signal f vorkommt, d.h. ob näherungsweise zur Zeit t0 + t∗ die Kreisfrequenz ω0 + ω ∗ im Signal vertreten ist, und wenn ja, mit welcher Amplitude und Phase. Der Näherungsfehler ist bedingt durch die Zeitdauer Dt (w) > 0 und die Bandbreite Dω (w) > 0 des Fensters w 6= 0 und damit durch die Tatsache, dass die Werte von wω0 ,t0 und w bω0 ,t0 im zugehörigen Zeit-Frequenz-Fenster (vgl. Bild) mit entsprechendem Gewicht in das Integral bω0 ,t0 (ω)i fe(ω0 ,t0 ) = hf (s)|wω0 ,t0 (s)i = (2π)−1 hfb(ω)|w
eingehen. Je kleiner Dt (w) ist, desto besser können fe(ω,t1 ) und fe(ω,t2 ) für benachbarte Zeitpunkte t1 und t2 unterschieden werden, d.h. desto eher können im Signal vorhandene
11.4 Zeit-Frequenz-Analyse, gefensterte Fouriertransformationen
351
Frequenzen den unterschiedlichen Zeiten zugeordnet werden, zu denen sie vorkommen. Je kleiner also Dt (w) ist, desto besser ist die Zeitauflösung durch fe. Je kleiner die Bandbreite Dω (w) ist, desto besser ist die entsprechende Auflösung unterschiedlicher Frequenzen. Wie wir aber im letzten Abschnitt gesehen hatten, sind der Güte einer simultanen ZeitFrequenz-Lokalisation wegen der Unschärferelation Dt (w)Dω (w) ≥ 1/2 Grenzen gesetzt. Den besten Kompromiss mit Blick auf die Unschärferelation bietet daher die von D. Gabor vorgeschlagene gefensterte Fouriertransformation mit Gaußfenstern, die als Gabortransformation bezeichnet wird (vgl. S. 345). Beispiel. Ein Kurzzeit-Modell für einen Sirenenton oder Chirp ist etwa die Funktion f (t) = A sin(g(t)) mit g(t) = 2πt αt + βt2 für 0 ≤ t ≤ 10 s und Konstanten A, α, β.
Die Ableitung des Arguments g ′ (t) = 2πt(2α + 3βt) kann als Momentan-Kreisfrequenz zur Zeit t aufgefasst werden. Das mit A = 1, α = 4 [1/s2 ], β = −4/15 [1/s3 ] über T = 10 s näherungsweise berechnete Betragsspektrum zeigt zwar eine Vielzahl von Frequenzen bis zur Maximalfrequenz 20 Hz, jedoch nicht die parabel-förmige Frequenzmodulation und nicht die Momentanfrequenzen zu unterschiedlichen Zeiten (linkes Bild unten). Die Grafik einer Näherung für |fe|, fe die gefensterte Fouriertransformierte von f mit dem „Hann-Fenster“ w(t) = 0.5 − 0.5 cos(ω0 t) für 0 ≤ t ≤ 1 s, w(t) = 0 sonst (ω0 = 2π rad/s), zeigt dagegen deutlich das Anwachsen und Abfallen der Momentanfrequenzen und entspricht unserem gewohnten Eindruck der variablen Frequenz des Sirenentons (rechtes Bild). Zur Berechnung der Näherungen von |fb| und |fe| mit der DFT vergleiche man auch S. 296 und den folgenden Abschnitt 11.5. Verwendet wurde links eine 512Punkte-DFT über insgesamt T = 10 s, aufgetragen sind die DFT-Koeffizienten |b ck T | als Näherung für |fb(2πk/T )|. Im zweiten Fall sind 50 Hann-Fenster der Dauer 1 s im Abstand von jeweils 0.2 s benutzt. Pro Zeitausschnitt wurde eine 128-Punkte-DFT durchgeführt und die entstandenen (halbseitigen) DFT-Betragsspektren zum zweiten Bild zusammengefügt. Keine der Darstellungen zeigt die konstante Amplitude A = 1. Ein Grund sind die starken Alias-Effekte durch die Frequenzmodulation. Die Summe der |b ck |2 des linken Bildes stimmt numerisch sehr gut mit dem quadratischen Mittel von f in [0,T ] überein (in beiden Fällen ist der Wert etwa 0.5). Numerische Integration zur Berechnung von |fe| für 20 Hz bei t0 = 5 s ergibt etwa 0.24 wie in der folgenden Grafik rechts. Die Signalwerte (und damit A) lassen sich erst durch ein Interpolationspolynom aus der Signal-DFT oder durch die Formel für diskrete Rekonstruktion auf Seite 355 aus den Daten näherungsweise zurückgewinnen.
1.2 1.0
0.2 0.1 0.0
0.8 0.6
10
0.4 Fenster-Nr.
0.2 0.0
0
100
200
300
400
500
20 40
10 Hz
25
352
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Rekonstruktion eines Signals aus seiner gefensterten Fouriertransformierten Gegeben sei nun für ein fest gewähltes Fenster w 6= 0 die Transformierte Gw f = fe eines Signals f . Eine Umkehrformel zur Rekonstruktion des Ausgangssignals f aus den Werten von fe kann man erhalten, wenn man den lokalen Anteil fs (t) = w(t − s)f (t) als Fourierintegral darstellt. Bei festem s ∈ R ist fe(ω,s) die Fouriertransformierte von fs (t): fe(ω,s) = fbs (ω) = hf (t)|w(t − s) ejωt i = hf (t)w(t − s)| ejωt i.
Nach unseren Voraussetzungen über f und w (vgl. S. 349) ist fs integrierbar nach t und stückweise stetig differenzierbar, so dass mit der Fourierschen Umkehrformel für jede Stetigkeitsstelle t von f gilt (vgl. S. 228) 1 w(t − s)f (t) = fs (t) = 2π
+∞ ˆ fe(ω,s) ejωt dω .
−∞
Multiplikation beider Seiten dieser Gleichung mit w(t − s), anschließende Integration nach +∞ ˆ 2 s und Division durch kwk ergibt wegen |w(t − s)|2 ds = kwk2 die gesuchte Rekonstruktionsformel. −∞ Rekonstruktionsformel. An jeder Stetigkeitsstelle t einer stückweise stetig differenzierbaren, quadratisch integrierbaren Funktion f lässt sich f (t) aus der gefensterten Fouriertransformierten von f zurückgewinnen durch 1 f (t) = 2πkwk2
+∞ ˆ +∞ ˆ fe(ω,s)w(t − s) ejωt dω ds .
−∞ −∞
An Sprungstellen t von f ergibt die rechte Seite wie bei der Fourierschen Umkehrformel den Wert [f (t+) + f (t−)]/2. Versteht man fe(ω,s) = hf (t)|wω,s (t)i als Projektion des Signals auf seine Zeit-FrequenzKomponenten, dann ist die Rekonstruktionsformel die „Rückprojektion“, durch die das Signal aus der Überlagerung seiner Komponenten zurückerhalten wird. +∞ ˆ +∞ ˆ 2 Bemerkungen. Aus kwk hf (t)|f (t)i = |fs (t)|2 dt ds < ∞ folgt, dass die Funk−∞ −∞
tionen fs für fast alle s nach t quadratisch integrierbar sind (vgl. Anhang B, Satz von Fubini). Anwendung der Parsevalgleichung auf das innere Integral ergibt dann mit w 6= 0 1 kf k = 2πkwk2 2
+∞ ˆ +∞ ˆ |fe(ω,s)|2 dω ds =
−∞ −∞
1 kfek2 . 2πkwk2
11.4 Zeit-Frequenz-Analyse, gefensterte Fouriertransformationen
353
Diese Gleichung entspricht der Parsevalgleichung bei der Fouriertransformation und hat zur Folge, dass man die gefensterte Fouriertransformation Gw zu einer auf ganz L2 (R) definierten, stetigen injektiven Abbildung nach L2 (R2 ) fortsetzen kann (vgl. S. 262). Das Bild V = Gw (L2 (R)) ist ein abgeschlossener Teilraum von L2 (R2 ), und jede Funktion h ∈ L2 (R2 ) lässt sich eindeutig zerlegen (vgl. S. 48 und später 12.1, S. 382) in der Form h = hV + h⊥ V mit hV ∈ V und hv|h⊥ Vi
+∞ ˆ +∞ ˆ = v(ω,s)h⊥ V (ω,s) dω ds = 0 . −∞ −∞
Die Funktion hV ist die Orthogonalprojektion von h auf V . Der zum Operator Gw adjun∗ ∗ gierte Operator Gw : L2 (R2 ) → L2 (R) ist definiert durch die Gleichung hf |Gw gi = 2 2 −1 e 2 hGw f |gi . Aus kf k = (2πkwk ) kf k folgt mit der Polarisationsgleichung (vgl. S. ∗ 240), dass hf1 |f2 i = (2πkwk2 )−1 hf1 |Gw Gw f2 i für alle f1 , f2 ∈ L2 (R) gilt. Hieraus 2 −1 ∗ folgt f = (2πkwk ) Gw Gw f für alle f ∈ L2 (R). Die Umkehrtransformation zu Gw ist ∗ daher die Einschränkung von (2πkwk2 )−1 Gw auf das Bild V von Gw . Für die von uns betrachteten Signale ist sie als Integraltransformation durch die rechte Seite der Rekonstruktionsformel gegeben. Besitzt h ∈ L2 (R2 ) die Zerlegung h = hV + h⊥ V mit dem zu V ∗ ⊥ ⊥ orthogonalen Anteil h⊥ , dann gilt hf |G h i = hG f |h i = 0 für alle f ∈ L2 (R), also w V w V V ∗ ⊥ 2 −1 ∗ Gw hV = 0. Mit f = (2πkwk ) Gw hV , Gw f = hV folgt ∗ ∗ h = (2πkwk2 )−1 Gw Gw hV = hV . (2πkwk2 )−1 Gw Gw ∗ Die Orthogonalprojektion von L2 (R2 ) auf V ist also die Abbildung (2πkwk2 )−1 Gw Gw . Für genauere Einzelheiten über adjungierte Operatoren und Orthogonalprojektionen sei etwa auf J. Weidmann (1980) verwiesen. Mit diesen Bemerkungen lässt sich erkennen, wie man in der Signalverarbeitung erwünschte Zeit-Frequenz-Eigenschaften approximieren kann.
Signalverarbeitung mit gefensterten Fouriertransformationen Gegeben sei eine gefensterte Fouriertransformation Gw zu einem fest gewählten Fenster w 6= 0. Da die Funktionen Gw f , f ∈ L2 (R), beschränkt sind und L2 (R2 ) auch unbeschränkte Funktionen enthält, kann nicht jede quadratisch integrierbare Funktion h(ω,t) die gefensterte Fouriertransformierte einer Funktion f ∈ L2 (R) sein: V = Gw (L2 (R)) 6= L2 (R2 ). Andernfalls ließen sich – im Widerspruch zur Heisenbergschen Unschärferelation – auch Signale mit beliebigen Zeit-Frequenz-Eigenschaften konstruieren. Man kann jedoch folgendermaßen verfahren, um Signale zu erhalten, die erwünschte Zeit-Frequenz-Eigenschaften in möglichst guter Näherung besitzen: Man berechnet für ein gegebenes Signal f (t) die gefensterte Fouriertransformierte fe = Gw f und verarbeitet fe nach Wunsch zu h aus L2 (R2 ), zum Beispiel durch filtern, verschieben von Werten, verstärken etc. Die Funktion h ist das Modell der erwünschten ZeitFrequenz-Eigenschaften. Jedoch gibt es in der Regel kein Signal g mit h = Gw g. Das Signal fh in L2 (R), dessen Zeit-Frequenz-Eigenschaften denen von h sehr nahekommen, ist
354
11 Weitere Anwendungsbeispiele für die Fouriertransformation
∗ fh = (2πkwk2 )−1 Gw h, weil nach den vorangehenden Bemerkungen die Funktion feh als Orthogonalprojektion von h auf V den mittleren quadratischen Fehler kh− fek, f ∈ L2 (R), minimiert (vgl. auch später 12.1, S. 382).
Diskrete gefensterte Fouriertransformation Von großer Bedeutung für die numerische Approximation und damit für die digitale Signalverarbeitung ist die Frage, ob man ein Signal aus Abtastwerten seiner gefensterten Fouriertransformierten wieder rekonstruieren kann. Wir zeigen einen Abtastsatz, der bei G. Kaiser (1994) zu finden ist, und verdeutlichen daran einige prinzipielle Aspekte der diskreten Zeit-Frequenz-Analyse mit gefensterten Fouriertransformationen. Bei sonst gleichen Voraussetzungen wie für die Rekonstruktionsformel von S. 352 nehmen wir an, dass die Fensterfunktion w 6= 0 außerhalb eines Intervalls [a,b] verschwindet. Für fest gewähltes s ist dann der Träger von fs (t) = w(t − s)f (t) in [a+s,b+s] enthalten. Fourierreihenentwicklung von fs in diesem Intervall ergibt für jede Stetigkeitsstelle t von f in [a + s,b + s] fs (t) =
+∞ X
ck (s) ejkω0 t
mit ω0 =
k=−∞
1 ck (s) = b−a
2π , b−a
b+s ˆ ω0 e f (kω0 ,s). f (t)w(t − s) e−jkω0 t dt = 2π
a+s
Multiplikation von fs (t) mit w(t− s) ergibt mit den Funktionen wkω0 ,s , die definiert waren durch wkω0 ,s (t) = w(t − s) ejkω0 t : |w(t − s)|2 f (t) =
+∞ ω0 X e f (kω0 ,s)wkω0 ,s (t). 2π k=−∞
Anstatt diese Gleichung wie bei der Rekonstruktionsformel auf S. 352 nach s zu integrieren und durch kwk2 zu dividieren, bildet man eine diskrete Approximation für kwk2 = +∞ ˆ +∞ X |w(t − s)|2 ds durch At0 (t) = t0 |w(t − nt0 )|2 und summiert über sn = nt0 , n=−∞
−∞
n ∈ Z:
At0 (t)f (t) =
+∞ +∞ ω 0 t0 X X e f (kω0 ,nt0 )wkω0 ,nt0 (t). 2π n=−∞ k=−∞
Wegen des beschränkten Trägers von w hat die Reihe zu At0 (t) nur endlich viele Summanden ungleich Null. Nun ergibt sich der gesuchte Abtastsatz, d.h. eine diskrete Rekonstruktionsformel unter der Bedingung At0 (t) 6= 0:
11.4 Zeit-Frequenz-Analyse, gefensterte Fouriertransformationen
355
Diskrete Rekonstruktion. Gilt überall At0 (t) 6= 0, dann ist das Signal f an jeder Stetigkeitsstelle t gegeben durch f (t) =
+∞ +∞ ω 0 t0 X X e f (kω0 ,nt0 )wkω0 ,nt0 (t)At0 (t)−1 . 2π n=−∞ k=−∞
Je besser die Zeit-Frequenz-Lokalisation des Fensters w ist, desto schneller werden die Werte |wkω0 ,nt0 (t)| klein. In der Praxis ergeben dann bei bandbegrenzten Signalen f endliche Partialsummen der rechten Seite mit diskreten Approximationen der Werte von fe gute Näherungen für f (t). An der Herleitung der Formel stellt man folgende Bedingungen für eine stabile Rekonstruktion fest: 1. Für eine numerisch stabile Rekonstruktion muss mehr als At0 (t) > 0 verlangt werden, nämlich inf At0 (t) > 0. Andernfalls würden kleine Fehler bei der Berechnung der t∈R
Werte fe(kω0 ,nt0 ) zu sehr großen Fehlern bei f (t) an Stellen t führen, an denen der Wert At0 (t) sehr nahe bei Null liegt. Dies ist eine Bedingung an die Abtastrate, denn es gilt lim At0 (t) = kwk2 6= 0 für alle t, wenn das Fenster wie vorausgesetzt stetig t0 →0+
ist. Für genügend kleines t0 lässt sich also diese Stabilitätsbedingung einhalten.
2. Eine notwendige Bedingung, die erfüllt sein muss, damit At0 (t) > 0 gelten kann, ist 0 < t0 ≤ b − a, da sonst At0 (t) = 0 ist für b < t < a + t0 . Die angegebene diskrete Rekonstruktion ist also sicher nicht möglich, wenn ω0 t0 > 2π ist. Solche Bedingungen sind typisch bei der Suche nach stabilen diskreten Rekonstruktionsformeln. Betrachtet man auch Fenster w, die nicht zeitbegrenzt sind, wird man analog zu Punkt 1 fordern, dass sup At0 (t) < ∞ gilt, und dass sowohl diese obere Schranke als auch t∈R
die untere Schranke aus Punkt 1 für t0 → 0+ gegen kwk2 konvergieren. Die mathematische Aufgabenstellung bei der Suche nach Abtastformeln ist es, Bedingungen an die Fensterfunktion und an die Menge der Abtaststellen (kω0 ,nt0 ), k,n ∈ Z, zu ω0 ,t0 , der ein Signal auf die Folge (hf (t)|wkω0 ,nt0 (t)i)k,n∈Z finden, so dass der Operator Gw ω0 ,t0 abbildet, injektiv ist. Um numerisch stabile Formeln zu erhalten, muss darüberhinaus Gw in einem geeigneten Sinn stetig sein und eine stetige Umkehrabbildung besitzen. Diese Aufgabenstellung führt in der modernen Signalverarbeitung auf das Studium vollständiger Orthonormalsysteme in geeigneten Funktionenräumen. An die Stelle punktweise konvergenter Abtastreihen treten dann Reihen, welche die analysierten Signale in der Norm des verwendeten Funktionenraums approximieren. Die betrachteten Signale können auch Funktionen f (t,~x) sein, die außer von der Zeit t etwa von einer Ortsvariablen ~x abhängen. Solche Signale treten zum Beispiel in der Bildverarbeitung auf. Man verwendet dann entsprechend Systeme von Funktionen mit mehreren Variablen. Leser, denen dieser Abschnitt angesichts der Bedeutung digitaler Signalverarbeitung etwa in der Audio- und Videotechnik – aber auch in vielen anderen Bereichen der Ingenieur- und Naturwissenschaften – ein Anreiz zur Vertiefung ist, seien auf die weiterführende Literatur hingewiesen, zum Beispiel auf C. Blatter (2003), I. Daubechies (1992), H. G. Feichtinger, T. Strohmer (1998 und 2003), K. Gröchenig (2001), M. Holschneider (1995), G. Kaiser (1994), D. Kölzow (1994), A. K. Louis, P. Maaß, A. Rieder (1998) oder Y. Meyer (1993).
356
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Zum Abschluss seien einige zentrale Ergebnisse der diskreten Zeit-Frequenz-Analyse mit gefensterten Fouriertransformationen zitiert: 1. Gilt für das Produkt ω0 t0 > 2π, dann gibt es bei beliebiger Wahl des Fensters w immer Signale f ∈ L2 (R), f 6= 0, die orthogonal zu allen Funktionen wkω0 ,nt0 sind. Eine ω0 ,t0 f Rekonstruktion solcher Signale aus ihren gefensterten Fouriertransformierten Gw ist daher nicht möglich. Diskrete Rekonstruktionsformeln unterliegen generell der Bedingung ω0 t0 ≤ 2π. 2. Wenn das Funktionensystem wkω0 ,nt0 , k,n ∈ Z, ein vollständiges Orthogonalsystem in L2 (R) bildet, dann muss notwendigerweise ω0 t0 = 2π gelten. 3. Auch für ω0 t0 = 2π bilden die Funktionen wkω0 ,nt0 , k,n ∈ Z, mit dem von D. Ga2 bor vorgeschlagenen Gaußfenster w(t) = (2π)−1/4 e−t /4 kein Orthonormalsystem in 2 L (R). Man kann zeigen, dass n o X inf kf k−2 |hf |wkω0 ,nt0 i|2 : f ∈ L2 (R),f 6= 0 = 0 k,n∈Z
gilt. Obwohl die Funktionen wkω0 ,nt0 , k,n ∈ Z, ein vollständiges System in L2 (R) bilden (d.h. jedes f ∈ L2 (R) kann bezüglich der Norm von L2 (R) beliebig gut durch Linearkombinationen der wkω0 ,nt0 approximiert werden), ist eine numerisch stabile Rekonstruktion von Signalen f ∈ L2 (R) aus den Koeffizienten hf |wkω0 ,nt0 i im Allgemeinen nicht möglich. 4. Wenn auch Orthogonalitätsrelationen für die Funktionen wkω0 ,nt0 wünschenswert wären, so erzwingen praktische Anforderungen an eine gute Zeit-Frequenz-Lokalisation der Fenster sogar ω0 t0 < 2π, d.h. es sind höhere Abtastraten nötig als solche, welche Orthogonalität des Systems wkω0 ,nt0 ermöglichen. Diese Aussage ist enthalten im Unschärfeprinzip von R. Balian und F. Low: Bilden für ein Fenster w ∈ L2 (R) die Funktionen wkω0 ,nt0 ein vollständiges Orthonormalsystem in L2 (R) für ω0 t0 = 2π, dann gilt +∞ ˆ t2 |w(t)|2 dt = ∞ oder
−∞
+∞ ˆ 2 ω 2 |w(ω)| b dω = ∞ .
−∞
5. Für ω0 t0 < 2π gibt es Fenster w und zugehörige vollständige Funktionensysteme (sogenannte Gabor-Frames) wkω0 ,nt0 , k, n ∈ Z, die eine stabile Rekonstruktion mit sehr guter Zeit-Frequenz-Lokalisation ermöglichen, d.h. mit +∞ ˆ t2 |w(t)|2 dt < ∞ und
−∞
+∞ ˆ 2 ω 2 |w(ω)| b dω < ∞ .
−∞
Eine Herleitung und ausführliche Diskussion dieser Ergebnisse und Weiterentwicklungen in der Signal-Analysis mit Wavelets (vgl. auch Abschnitt 12.2) findet man zum Beispiel im schon genannten Buch von I. Daubechies (1992) oder bei K. Gröchenig (2001).
11.5 Zeitfenster bei der diskreten Fouriertransformation
357
11.5 Zeitfenster bei der diskreten Fouriertransformation In der Praxis lässt sich das Spektrum eines Signals f oft nicht exakt berechnen. Statt dessen verwendet man als Näherung meist die Spektralfunktion eines Signalausschnitts f wT mit einem Zeitfenster wT 6= 0. Auch bei der Analyse unbekannter Signale f ist die Beobachtungsdauer T notwendigerweise endlich, so dass nur Information über Zeitausschnitte f wT verarbeitet werden kann. Bei der Zeit-Frequenz-Analyse wie im letzten Abschnitt gilt das Interesse ebenfalls den Spektralfunktionen solcher Zeitausschnitte des Signals. Zur näherungsweisen Berechnung der Fouriertransformierten von f wT wird dann häufig die diskrete Fouriertransformation benutzt (vgl. S. 296 und Abschnitt 5.7). Das Spektrum fd wT des Signalsegments f wT ist gegenüber dem tatsächlichen Spektrum fb von f verändert. Ist wT ein Zeitfenster mit Träger in [0,T ], dann gilt nach dem Modulationstheorem von S. 239 für quadratisch-integrierbare oder bandbegrenzte Signale f 1 b fd wT = f ∗w cT . 2π
(11.1)
Die Spektralfunktion von f wT ist durch die Faltung von fb mit w cT im Vergleich zu fb „verschmiert, geglättet und unschärfer“. Je kürzer die Beobachtungsdauer T ist, desto größer ist nach der Unschärferelation die Bandbreite von wT , desto schlechter wird also die Frequenzlokalisation von wT und damit von f wT (vgl. 11.3 und 11.4). Ein typisches Problem ist dann etwa die Auflösung periodischer Signalanteile eng benachbarter Frequenzen, insbesondere dann, wenn diese Signalanteile sehr unterschiedliche Amplituden besitzen. Die Beobachtungsdauer T und die Gestalt des Zeitfensters wT haben auch eine Auswirkung auf die Güte der Näherungen für fd wT , die mit einer endlichen diskreten Fouriertransformation aus Abtastwerten von f wT gewonnen werden. Beim Einsatz der diskreten Fouriertransformation sind daher einige grundlegende Aspekte über das Zusammenwirken zwischen der Beobachtungsdauer T , den Eigenschaften der Gewichtsfunktion wT und der Abtastrate, die man zur diskreten Fouriertransformation verwendet, zu beachten. Abschneideeffekte bei der diskreten Fouriertransformation Bei der diskreten Fouriertransformation werden aus endlich vielen Werten yn = f (n∆t), ∆t > 0, n = 0, . . . ,N − 1, eines Signals f die Fourierkoeffizienten N −1 1 X yn e−jkn2π/N ck = b N n=0
für k = 0, . . . ,N − 1 berechnet (vgl. 5.7, S. 66). Das Signal f setzen wir als stetig in [0,T [ mit Grenzwert f (T −) und stückweise stetig differenzierbar voraus. Den abgetasteten Zeitausschnitt von f über den Abtastzeitraum der Dauer Ta = (N − 1)∆t hinaus kann man sich willkürlich fortgesetzt denken zu einer periodischen Funktion fp mit der Periode p = N ∆t = T , zum Beispiel wie im folgenden Bild, in dem wir zwischen Ta und T ein Geradenstück ergänzt haben, so dass fp stetig wird.
358
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Bezeichnen wir mit wT das Rechteckfenster wT (t) = 1 für 0 ≤ t < T, wT (t) = 0 sonst, dann sind die Größen b ck einerseits Näherungen für Fourierkoeffizienten ck (fp ) von fp , andererseits ergeben sie nach S. 296 auch Näherungen für Abtastwerte von fd wT und damit Näherungen für die Fourierkoeffizienten ck = ck (f wT ) von f wT . In vielen Anwendungen dient dann b ck T auch als Schätzwert für fb(2πk/T ) (vgl. auch Aufgabe A4 von Kapitel 10). 1
1
0
0 f (t)
−1 0
fp (t)
−1
Ta T
0
Ta T
Ist etwa N im Folgenden eine gerade Zahl, dann verwendet man den Wert b ck für die Indizes k = 0, . . . ,(N − 2)/2 jeweils als Näherung für den Fourierkoeffizienten ck von f wT . Für k = (N + 2)/2, . . . ,N − 1 dient b ck entsprechend als Näherung für c−N +k und b cN/2 als Näherung für (c−N/2 + cN/2 )/2 (vgl. S. 69). Die zugehörigen Schwingungen zur Grundkreisfrequenz ω0 = 2π/T v0 (t) = 1, v1 (t) = ejω0 t , . . . . . . ,v(N −2)/2 (t) = ej(N −2)ω0 t/2 , vN/2 (t) = cos(N ω0 t/2), v(N +2)/2 (t) = e−j(N −2)ω0 t/2 , . . . . . . ,vN −1 (t) = e−jω0 t ,
erzeugen einen N -dimensionalen Funktionenvektorraum V in L2 ([0,T ]) (vgl. S. 9). Für das Rechteckfenster wT besitzt die T -periodische Fortsetzung von f wT Sprungstellen bei t = kT , k ∈ Z, wenn f (0) 6= f (T −) ist. Nach S. 67 gelten dann mit stetigem fp wie oben die Alias-Beziehungen ck = b
+∞ X
m=−∞
ck+mN (f wT ) +
+∞ X 1 (f (0) − f (T −)) = ck+mN (fp ). 2N m=−∞
(11.2)
Ist das Signal f ein Gemisch von harmonischen Schwingungen der Kreisfrequenzen kω0 , N −1 X k = 0, . . . ,N/2, d.h. ist f (t) = αk vk (t) eine Linearkombination der Funktionen k=0
v0 , . . . ,vN −1 , dann ist f (0) = f (T −) und mit dem inneren Produkt von S. 9 folgt aus der Alias-Beziehung (11.2) 1 b ck = hf (t)|vk (t)i = T
ˆT
f (t)vk (t) dt = αk .
(11.3)
0
Die Orthogonalprojektionen von f auf die von den Funktionen vk erzeugten eindimensionalen Teilräume von V ergeben dann die exakten Spektralwerte von f .
11.5 Zeitfenster bei der diskreten Fouriertransformation
359
Anders verhält es sich, wenn die Periodisierung von f wT bei t = T eine Sprungstelle hat oder wenn das ursprünglich beobachtete Signal f harmonische Schwingungen enthält, deren Periodendauer nicht mit T übereinstimmt. In der Praxis wird dies bei der Analyse von unbekannten Signalen f , die man über einen willkürlich gewählten Zeitraum abtastet, sogar der Regelfall sein. Einfache Beispiele für solche Fälle ergeben sich mit den Funktionen f1 (t) = cos(t) und f2 (t) = − cos(t/2) + cos(t)/2. Für T = π hat die T -periodische Fortsetzung von f1 wT mit dem Rechteckfenster wT bei T eine Sprungstelle, die von f2 wT ist stetig, aber f2 ist nicht T -periodisch. Ist f wT (0) 6= f wT (T −), so hat jede T -periodische Fortsetzung, T = N ∆t, von f über das Intervall [0,Ta ] hinaus, Ta = (N − 1)∆t, Sprungstellen oder steile Flanken in den Umgebungen der Stellen kT , k ∈ Z (siehe letztes Bild). Aus den Überlegungen zur Asymptotik von Fourierkoeffizienten (S. 39) ergibt sich, dass dann die Beträge der Koeffizienten ck einer T -periodischen Fortsetzung des Signalausschnitts für |k| → ∞ nur langsam abfallen. Folgen sind nach Gleichung (11.2) Aliaseffekte in den Koeffizienten b ck der diskreten Fouriertransformation. Selbst wenn zufällig f wT (0) = f wT (T −) gilt wie im Beispiel f2 wT oben, entstehen Aliaseffekte, sobald f Schwingungsanteile mit Frequenzen ν 6= k/T besitzt, und auch dann, wenn diese innerhalb des Nyquist-Intervalls mit der Grenzfrequenz N/(2T ) liegen. Jeder Signalanteil mit einer Kreisfrequenz ω1 6= 2πk/T besitzt nichtverschwindende Projektionen in allen von den Funktionen vk , k = 0, . . . ,N − 1, erzeugten Teilräumen von L2 ([0,T ]): hejω1 t wT (t)|vk (t)i = 6 0 für alle k = 0, . . . ,N − 1. Beispiel. Betrachtet man etwa das Signal g(t) = A ejω1 t , dann folgt für den k-ten Fourierkoeffizienten ck (gwT ) von gwT mit dem Rechteckfenster wT zum Intervall [0,T [ nach (11.1) und S. 296 mit gb(ω) = 2πAδ(ω − ω1 ): 1 2πk 2πk 1 = (11.4) dT (b g∗w cT ) ck (gwT ) = gw T T 2πT T A 2πk = e−j(2πk/T −ω1 )T /2 w cT − ω1 T T sin(πk − ω 1 T /2) = (−1)k A ejω1 T /2 . πk − ω1 T /2 Diese Koeffizienten verfälschen nach (11.2) die Amplituden und Phasen der Schätzungen ck von Signalanteilen der Frequenzen k/T , k ≤ N/2, wenn ω1 6= 2πk/T ist. Sie gehen b bei Verwendung Xdes Rechteckfensters nach (11.2) und (11.4) dann als Alias-Effekte mit den Beiträgen ck+mN (gwT ) in alle DFT-Koeffizienten b ck ein. Sie werden also auf die m∈Z
Schwingungen der Frequenzen k/T „verteilt“ (man vgl. das nächste Bild). Diese Tatsache wird in der Signalverarbeitung als spektraler Leckeffekt (engl.: spectral leakage) bezeichnet. Hinzu kommt noch bei allen b ck der konstante additive Anteil (g(0) − g(T −))/(2N ), wenn die T-periodische Fortsetzung von gwT bei T eine Sprungstelle hat.
360
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Der spektrale Leckeffekt tritt mit veränderten Koeffizienten ck (gwT ) auch beim Gebrauch anderer Fensterfunktionen wT an Stelle des Rechteckfensters auf und ist eine Folge der Unschärferelation für das Zeitdauer-Bandbreite-Produkt des Fensters wT . Die folgende Veranschaulichung zeigt einige absolute Gewichte gk = |ck (gwT )/A|, mit denen die Amplitude A von gwT auf die Fourierkoeffizienten der zu ω1 benachbarten Kreisfrequenzen kω0 = 2πk/T durch die Periodisierung mit wT verteilt wird. |w cT (ω − ω1 )/T |
1
0 0
ω0 ω1 3ω0 2ω0 4ω0 Die Pfeile zeigen die absoluten Gewichte gk bei kω0
5ω0
Wir betrachten noch kurz ein Beispiel, das die diskutierten Abschneideeffekte durch das Rechteckfenster anhand einiger konkreter Daten zu einem gegebenen Signal f verdeutlicht. Beispiel. Für die 4π-periodische Funktion f (t) = cos(t/2) hat der Ausschnitt f wT mit 2 + 8kj . Die πdem Rechteckfenster wT der Länge T = π das Spektrum ck = − π(16k 2 − 1) periodische Fortsetzung mit f wT (0) = f wT (π) hat den Mittelwert c0 = 2/π auf [0,π[ und Sprungstellen der Höhe S1 = √ 1 bei t = kπ (k ∈ Z). Eine 3-Punkte-DFT in [0,π[ √ ergibt √ c1 = b c2 = (3 − 3)/12 − j(3 − 3)/12. die DFT-Koeffizienten b c0 = (3 + 3)/6 und b ∞ ∞ X 4 X 1 Wir betrachten exemplarisch nur b c0 . Die Reihe (c3m + c−3m ) = − π 144m2 − 1 m=1 √ m=1 2+ 3 2 . Mit bekannten hat nach (11.2) den Grenzwert S2 = b c0 − c0 − S1 /6 = − + π 6 ′ Gleichungen für die Digamma-Funktion Ψ = Γ /Γ kann man S2 auch erhalten durch S2 =
Ψ(11/12) − Ψ(1/12) − 12 2 cot(π/12) =− + . 6π π 6
In dezimaler Näherung ergibt sich für b c0 nun die Zerlegung
c0 = c0 + S1 /6 + S2 ≈ 0.636619 + 0.166667 − 0.014611 = 0.788675. b
Es sei dem Leser überlassen, bei Interesse in analoger Weise auch b c1 aufzuschlüsseln. Wahl von Zeitfenstern bei der diskreten Fouriertransformation
Durch geeignete Wahl der Fensterfunktion wT kann man eine Verminderung der Verfälschungseffekte im Spektrum der diskreten Fouriertransformation erreichen und damit eine Verringerung des Fehlers bei der Schätzung des Spektrums von f wT bzw. von f . Die Frequenzlokalisation ist nach den Überlegungen zur Unschärferelation in Abschnitt 11.3 umso besser, je schneller |w cT (ω)| für wachsende |ω| abfällt.
11.5 Zeitfenster bei der diskreten Fouriertransformation
361
1. Man wählt meist eine möglichst glatte Fensterfunktion wT 6= 0 mit Träger in [0,T ] und wT (0) = wT (T ) = 0. Dann besitzt die T -periodische Fortsetzung von f wT bei stetigen Signalen f keine Sprungstellen, und die durch Formel (11.2) beschriebenen Aliaseffekte werden verringert, wenn die Fourierkoeffizienten dieser Fortsetzung schnell fallen (vgl. 4.5). Man erhält dann mit b ck T eine bessere Schätzung als mit dem Rechteckfenster für den in Anwendungen oft gesuchten Wert fb(2πk/T ).
2. Man wählt eine möglichst lange Beobachtungsdauer T . Je kleiner T ist, desto größer wird die Bandbreite von wT , d.h. desto schlechter wird die Frequenzlokalisation. 3. Man wählt eine möglichst hohe Anzahl N von Abtastwerten. Es werden dann mehr Signalfrequenzen exakt aufgelöst (vgl. Gleichung (11.3)). Bei vollständig beobachteten zeitbegrenzten Signalen verbessert „Zero Padding“ die Näherungen für fb (man vgl. hierzu Aufgabe A4 in Kapitel 10).
4. Der Leckeffekt wirkt sich umso weniger aus, je schneller die Nebenmaxima von |w cT | im Vergleich zum Hauptmaximum abfallen (man vgl. das vorangehende Bild). Man wählt daher oft Fensterfunktionen, bei denen diese Nebenmaxima von |w cT | stark abfallen.
In der Praxis sind viele verschiedene Gewichtsfunktionen wT in Gebrauch. Der Einsatz spezieller Fensterfunktionen und damit der Kompromiss, den man aufgrund der Unschärferelation immer eingehen muss, hängt vom Zweck der jeweiligen Anwendung ab. Kriterien neben dem Abklingverhalten von w cT und der Bandbreite des Fensters sind zum Beispiel auch seine Energiekonzentration in einem gegebenen Frequenzband oder einfache Berechnungs- und Implementierungsmöglichkeiten beim Software-Einsatz. Eine ausführliche vergleichende Diskussion gebräuchlicher Fensterfunktionen findet man etwa bei D. Slepian (1983) oder bei F. Harris (1978). Beispiel.
Wir betrachten zum Abschluss als Demonstrationsbeispiel das Signal f (t) = A1 cos(2πν1 t) + A2 cos(2πν2 t)
mit A1 = 1, A2 = 0.03, ν1 = 10.25 Hz und ν2 = 12 Hz. Das erste Bild zeigt die diskrete Fouriertransformation mit dem Rechteckfenster wT , T = 2 s, für N = 128. Die Signalfrequenz ν2 ist nicht zu entdecken. Bei gleichem T und N wird im zweiten Bild das oft gebrauchte Hann-Fenster wT , wT (t) = 0.5 − 0.5 cos(2πt/T ), 0 ≤ t ≤ T verwendet. In der dritten Grafik ist dieses Fenster noch einmal benutzt mit T = 5 s und N = 1024. Am Ergebnis dieser DFT im dritten Bild kann man die 12 Hz-Signalfrequenz immerhin vermuten. Dargestellt ist jeweils das halbseitige DFT-Betragsspektrum.
362
11 Weitere Anwendungsbeispiele für die Fouriertransformation
0.4
0.4
0.25
0.3
0.3
0.20
0.2
0.2
0.1
0.1
0.0
0.0
0.15 0.10
0
10
20
30
40
50
60
0.05 0
10
20
30
40
50
60
0.00
0
10 20 30 40 50 60 70
128-Punkte-DFT, T = 2 s
128-Punkte-DFT, T = 2 s
1024-Punkte-DFT, T = 5 s
mit Rechteck-Fenster
mit Hann-Fenster
mit Hann-Fenster
Man bemerkt an den Darstellungen, dass die Höhe der „Peaks“ keineswegs den wirklichen (halben) Amplitudenwerten der beiden Schwingungen entspricht. Dies ist eine Folge des Aliaseffekts und der Dämpfungen durch die hinzugefügten Gewichtsfunktionen. Es ist also Vorsicht geboten und Zusatzinformation über die Natur eines Problems gefragt, wenn man DFT-Spektren unbekannter Signale vernünftig interpretieren will, die in der Praxis weit komplexer als dieses kleine Beispiel und oft noch mit Störungen behaftet sind. Hierzu ein immer noch einfaches Beispiel eines DFT-Spektrums eines realen Signals, das mit dem Rechteckfenster berechnet wurde. Es zeigt die 8820-Punkte-DFT eines Audiosignals von 4 s Dauer, bestehend nur aus den Tönen F4, A4, C5, F5 des F-Dur Akkords, gespielt auf dem Piano und angereichert mit den Tönen F4, Es5, F5, gespielt mit dem Altsaxophon. Die Töne haben in gleichschwebend temperierter Stimmung die Frequenzen F4=349.23, A4=440, C5=523.25, Es5=622.25 und F5=698.46 Hz. Mit dem Vorwissen über das Signal erkennt man die gespielten Noten (die 2. Oktave erfordert beim Altsax Intonationsausgleich; beim F5 hat der Autor leider etwa 8 Hz zu hoch intoniert). Ebenso sieht man eine ganze Reihe mitschwingender Obertöne (Oktaven und Quinten nach oben), aber auch subharmonische Frequenzen (F3, C4, Es4) und ein breites Spektrum von Beimischungen durch die Instrumentencharakteristiken und durch DFT-Aliaseffekte. Man stelle sich das Spektrum eines ganzen Orchesters oder einer Band mit Drums, Gitarre, E-Bass und Bläsersatz vor und bedenke, was ein gut ausgebildetes Gehör beim Musik-Genuss zu unterscheiden vermag.
Single Sided Amplitude Spectrum 0.5 Es 4 0.4
Es 5
F4
F5
C6 B5
0.3 0.2 0.1 0 0
C4
A4
C5 A5
F3 200
G5 400
600 Frequency in Hz
800
1000
1200
11.6 Anfangswertprobleme für stabile zeitinvariante lineare Systeme
363
11.6 Anfangswertprobleme für stabile zeitinvariante lineare Systeme In Abschnitt 8.2 hatten wir kausale Anfangswertprobleme für Differentialgleichungen der Form P (D)u = Q(D)f mit Polynomen P und Q für t ≥ 0 und distributionelle rechte ′ Seiten f ∈ D+ behandelt. Solche Probleme treten bei zeitinvarianten linearen Übertragungssystemen auf, die zum Anfangszeitpunkt t = 0 geladene Energiespeicher aufweisen. Die Korrespondenzen der Fouriertransformation rationaler Funktionen auf S. 253 zeigen, dass man solche Probleme auch mit Hilfe der Fouriertransformation lösen kann, wenn f ′ zum Raum S+ gehört, d.h. f ∈ S ′ und Tr(f ) ⊂ [0,∞[, und wenn weiter die Polynome Q und P keine gemeinsamen Linearfaktoren besitzen und alle Polstellen von Q/P negative Realteile haben. Beispiel. Wir behandeln exemplarisch noch einmal den RCL-Schwingkreis aus Beispiel 3 auf S. 193. Die Differentialgleichung 1 2 ˙ Ua = U1 δ˙ und Ua (0−) = U0 , U˙a (0−) = 0 Ua + U¨a + √ LC LC beschrieb den Schwingkreis bei kritischer Dämpfung (R2 = 4L/C) mit Eingangsspannung Ue (t) = U1 s(t) und gegebenen Anfangswerten. Die Lösung ist der Spannungsverlauf an der Induktivität. Die homogene Differentialgleichung ist asymptotisch stabil und die rechte Seite ist temperiert. Wir interessieren uns wie in Abschnitt 8.2 unter Ausblendung der Vergangenheit t < 0 für die Lösung ab dem Anfangszeitpunkt t = 0. Die eindeutige Lösung T ∈ S ′ mit Tr(T ) ⊂ [0,∞[ erhält man nach dem Satz auf S. 187 aus der distributionellen Gleichung 2U0 2 ˙ 1 ˙ T = U1 δ˙ + √ T¨ + √ T+ δ + U0 δ. LC LC LC Da aufgrund der Voraussetzungen 1/P nur Pole mit negativen Realteilen hat und daher 1/P (jω) ein Multiplikator in S ′ ist, ergibt Fouriertransformation dieser Gleichung und Auflösen nach Tb 2U0 1 (U1 + U0 )jω + √ . Tb(ω) = P (jω) LC
Die inverse Fouriertransformation der Partialbrüche mit den Korrespondenzen von S. 253, die dem Leser als Übung überlassen sei, ergibt dann die gleiche Lösung T mit Träger in [0,∞[ wie auf S. 194. Dabei bezeichnet wie dort s(t) die Heavisidesche Sprungfunktion. (U0 − U1 )t −t/√LC e √ s(t). T (t) = U0 + U1 + LC Für die gezeigte Lösungsmethode reicht die Bedingung, dass alle Polstellen von Q/P negative Realteile besitzen, nicht aus, wenn Q und P gemeinsame Linearfaktoren mit Nullstellen haben, deren Realteil r ≥ 0 ist. Wir betrachten dazu das folgende Beispiel.
364
11 Weitere Anwendungsbeispiele für die Fouriertransformation
′ Beispiel. Das kausale zeitinvariante System auf S+ , beschrieben durch die Differentialgleichung P (D)u = u ¨ + u˙ − 2u = f¨ + 2f˙ − 3f = Q(D)f
ist stabil bei verschwindenden Anfangswerten. Es hat die Impulsantwort h(t) = δ(t) + e−2t s(t) und den Frequenzgang b h = Fh
jω + 3 b . h(ω) = jω + 2
Die allgemeine Lösung der homogenen Gleichung P (D)u = 0 ist uH (t) = k1 et +k2 e−2t mit k1 ,k2 ∈ R. Die Lösung uH ist nicht temperiert und für nichtverschwindende Anfangswerte c0 , c1 ist das zugehörige kausale Anfangswertproblem (vgl. S. 187) u ¨ + u˙ − 2u = f¨ + 2f˙ − 3f + (c0 + c1 )δ + c0 δ˙ ′ in S+ im Allgemeinen nicht durch Fouriertransformation zu lösen. Der Grund liegt darin, dass sich bei verschwindenden Anfangswerten die gemeinsamen Linearfaktoren zur Nullstelle z = 1 von P und Q kompensieren, während man bei nichtverschwindenden Anfangswerten und Vorgehen wie oben eine nicht-kausale Lösung erhält.
Wie man mit Hilfe der Fouriertransformation auch Anfangswertprobleme für gewisse partielle Differentialgleichungen lösen kann, zeigen wir im folgenden Abschnitt.
11.7 Anfangswertprobleme für Wellen- und Wärmeleitungsgleichung In früheren Abschnitten hatten wir einige Randwertprobleme für die Schwingungs- und die Wärmeleitungsgleichung mit Hilfe von Fourierreihen gelöst. Als Anwendung der Fouriertransformation erhalten wir jetzt Lösungen von Anfangswertaufgaben für Wellen- und Wärmeleitungsgleichungen im unbegrenzten Raum. Weil die Fouriertransformation die Differentiation in die einfache algebraische Multiplikationsoperation überführt, transformiert sie die jeweiligen partiellen Differentialgleichungen in leicht lösbare gewöhnliche Differentialgleichungen. Das Anfangswertproblem für die homogene Wellengleichung im Raum Die homogene Wellengleichung beschreibt zum Beispiel die Ausbreitung kleiner Störungen in reibungsfreien, kompressiblen Flüssigkeiten oder Gasen beim Fehlen äußerer Kräfte. Im homogenen, isotropen Raum lautet das zugehörige Anfangswertproblem in kartesischen Koordinaten ∂ 2u (~x,t) = c2 ∆~x u(~x,t) ∂t2 ∂u u(~x,0+) = f (~x) , (~x,0+) = g(~x). ∂t
(11.5)
11.7 Anfangswertprobleme für Wellen- und Wärmeleitungsgleichung
365
Dabei sind ~x ∈ R3 , t > 0 und ∆~x der auf die räumlichen Parameter bezogene LaplaceOperator. Beschreibt die Gleichung etwa eine Schallausbreitung, dann ist u(~x,t) die Druckabweichung zur Zeit t gegenüber dem normalen Atmosphärendruck an der Stelle ~x. Die Lösung u hängt von der Anfangsstörung ∂u ∂u (~x,0+) = lim (~x,t) t→0+ ∂t ∂t
u(~x,0+) = lim u(~x,t) und t→0+
ab. Die Anfangsbedingungen f und g setzen wir als schnell fallende Funktionen in S(R3 ) voraus. Auf die Ortskoordinaten bezogene Fouriertransformation der Gleichungen ergibt bei Vertauschung des Fourierintegrals mit der Differentiation nach t ˆ ˆ ∂2u b ∂2 3 −j~ ω ·~ x 2 (~ω ,t) = 2 u(~x,t) e b(~ω ,t) dλ (~x) = c ∆~x u(~x,t) e−j~ω·~x dλ3 (~x) = −c2 |~ω|2 u ∂t2 ∂t R3
R3
u b(~ω ,0+) = fb(~ω ) ,
∂b u (~ ω ,0+) = b g(~ ω ). ∂t
(11.6)
Für jedes feste ~ω ist dies ein Anfangswertproblem für eine gewöhnliche Differentialgleichung in t mit der eindeutigen Lösung sin(ct|~ω |) u b(~ ω ,t) = fb(~ ω ) cos(ct|~ ω |) + b g(~ω ) . c|~ω|
d sin(ct|~ ω |) Wegen cos(ct|~ω |) = genügt es, die inverse Fouriertransformierte von dt c|~ ω | sin(ct|~ω |) zu bestimmen. Dies haben wir auf S. 268 bereits getan: c|~ω | 1 sin(ct|~ω |) δ(|~x| − ct) . 4πc2 t c|~ω | δ(|~x| − ct) ist die singuläre Distribution, die durch das Integral über die Kugeloberfläche |~x| = ct gegeben ist. Mit dem Faltungssatz folgt jetzt die als Welle bezeichnete Lösung u.
Ergebnis. Das Anfangswertproblem (11.5) für die Wellengleichung im Raum besitzt für ~x ∈ R3 und t > 0 die Lösung ˆ ˆ 1 ∂ 1 f (~x − ~ y ) do(~y ) + g(~x − ~y) do(~y ) u(~x,t) = ∂t 4πc2 t 4πc2 t ∂ t = ∂t 4π
|~ y |=ct
ˆ |~ n|=1
t f (~x + ct~n) do(~n) + 4π
|~ y |=ct
ˆ
g(~x + ct~n) do(~n) .
(11.7)
|~ n|=1
Die Voraussetzungen an die Anfangsbedingungen können abgeschwächt werden. Wenn f dreimal und g zweimal stetig differenzierbar sind, ergibt sich eine klassische zweimal stetig differenzierbare Lösung u. Die in (11.6) vorgenommene Vertauschung von Differentiationen und Integralen ist erlaubt. Man kann zeigen, dass die Lösung u mit (11.7) durch
366
11 Weitere Anwendungsbeispiele für die Fouriertransformation
die Vorgabe der Anfangsbedingungen f und g eindeutig bestimmt ist. Die Lösungsformel (11.7) zeigt, dass sich Anfangsstörungen mit der Zeit durch den Raum ausbreiten, und dass bei Anfangsbedingungen f und g aus S(R3 ) oder solchen mit beschränkten Trägern die Lösung u für wachsende Zeiten t mindestens so schnell wie 1/t abfällt. Die Lösung u(~x,t) an einer Stelle ~x hängt zur Zeit t nur von den Werten der Anfangsbedingungen auf der Kugeloberfläche um ~x mit dem Radius ct ab. Ausbreitung lokaler Störungen. Eine räumlich begrenzte Anfangsstörung führt bei der Wellenausbreitung im Raum zu einem zeitlich begrenzten Effekt. Zur Erklärung betrachten wir eine Anfangsstörung, deren Träger eine beschränkte Menge U mit der Randfläche ∂U ist. Es sind dann f (~x) = g(~x) = 0 außerhalb von U . Konkret stelle man sich etwa ein Geräusch vor, das zur Zeit t = 0 in U erzeugt ist. Nun seien ~x eine Stelle außerhalb von U und d bzw. D der minimale bzw. maximale Abstand zwischen ~x und den Punkten von U . Für t < d/c liegt die Sphäre Sct (~x) um ~x mit dem Radius ct außerhalb von U , f und g sind dort Null und es folgt u(~x,t) = 0 für t < d/c. Für t = d/c berührt Sct (~x) die Menge U , die Welle erreicht ~x: Für Zeiten t zwischen d/c und D/c schneiden sich Sct (~x) und U , bei ~x können Effekte u(~x,t) 6= 0 auftreten. Für Zeiten t > D/c liegt U innerhalb der Sphäre Sct (~x), es folgt wieder u(~x,t) = 0, d.h. die Störung hat ~x passiert. In ~x ist also nur im Zeitintervall d/c ≤ t ≤ D/c eine Auswirkung u(~x,t) 6= 0 wahrzunehmen. Es gibt eine vordere und eine hintere Wellenfront. Zu einer gegebenen Zeit t hat die vordere Wellenfront die Form einer Fläche, die jene Punkte, die noch nicht von der Welle erreicht sind, von den Punkten trennt, in denen die Störung wirkt oder schon gewirkt hat. Die Punkte dieser Fläche haben den Abstand ct zum Rand ∂U von U , liegen also auf der Einhüllenden aller Sphären mit Mittelpunkten auf ∂U und Radien ct (Huyghenssches Prinzip). Entsprechend trennt die hintere Wellenfront jene Punkte, die nicht mehr von der Störung betroffen werden, von allen anderen. Die Konstante c ist die endliche Ausbreitungsgeschwindigkeit der Wellenfronten. Zur Veranschaulichung betrachte man folgendes Bild. u=0 u6=0
t=
t0
>
0
ct0
R3
R3
f =g=0
t=
0
t
Es ist daher möglich, im dreidimensionalen Raum Signale als scharf begrenzte Wellen zu übertragen, deren Träger eine sphärische oder schalenförmige Gestalt haben. Dies ist ein für die Nachrichtenübertragung äußerst bedeutsamer Sachverhalt.
11.7 Anfangswertprobleme für Wellen- und Wärmeleitungsgleichung
367
Das Anfangswertproblem für die homogene Wellengleichung in der Ebene Die Wellengleichung in der Ebene beschreibt Probleme, bei denen die Anfangsbedingungen f und g nur von zwei Ortskoordinaten abhängen. Wir betrachten dreimal stetig differenzierbare Funktionen f und zweimal stetig differenzierbare Funktionen g, die für ~x = (x1 ,x2 ,x3 ) nur von x1 und x2 abhängen, fassen die zugehörige Anfangswertaufgabe (11.5) in der Ebene als räumliches Problem mit der Symmetrieachse x1 = x2 = 0 auf, und verwenden dessen schon bekannte Lösung (11.7): Wir berechnen die Oberflächenintegrale in (11.7), indem wir ϕ = f oder ϕ = g setzen und mit Hilfe von Kugelkoordinaten integrieren. Dann gilt für ~x = (x1 ,x2 ,x3 ) und von x3 unabhängige Funktionen ϕ(~x) = ϕ(x1 ,x2 ) ˆ
ϕ(~x + ct~n) do(~n) =
ˆ2πˆπ 0
|~ n|=1
ϕ(x1 + ct sin θ cos φ,x2 + ct sin θ sin φ) sin θ dθ dφ .
0
Wir integrieren über die obere und die untere Halbkugeloberfläche getrennt, d.h. wir zerlegen den Integrationsbereich des inneren Integrals bei π/2 in zwei Teilintervalle. Mit der Substitution θ = arcsin r, dθ = (1 − r2 )−1/2 dr folgt ˆ1 ˆπ/2 ϕ(x1 + ctr cosφ,x2 + ctr sinφ) √ ϕ(x1 +ct sinθcosφ,x2 +ct sinθsinφ) sinθdθ = rdr . 1 − r2 0
0
Für das zweite Teilintegral von π/2 bis π erhält man dasselbe Ergebnis. Einsetzen in das Oberflächenintegral ergibt dann für ~x = (x1 ,x2 ,x3 ) ˆ
ϕ(~x + ct~n) do(~n) = 2
ˆ2πˆ1 0
|~ n|=1
0
ϕ(x1 + ctr cos φ,x2 + ctr sin φ) √ r dr dφ . 1 − r2
Dies ist ein von x3 unabhängiges Integral über die Einheitskreisscheibe in der x1 x2 -Ebene. Hängen also f und g für ~x = (x1 ,x2 ,x3 ) nur von den beiden ersten Koordinaten ab, dann ist auch die Lösung des Anfangswertproblems (11.5) unabhängig von x3 . Wegen der Unabhängigkeit der Integranden von der Höhe x3 kann man die Oberflächenintegrale aus (11.7) durch je zwei gleiche Integrale über die Einheitskreisscheibe in der Ebene x3 = 0 ausdrücken. Wir erhalten damit die Lösung der Anfangswertaufgabe (11.5) für ebene Probleme und solche mit der Symmetrieachse x1 = x2 = 0. Ergebnis. Das Anfangswertproblem (11.5) für die Wellengleichung in der Ebene besitzt für ~x = (x1 ,x2 ) ∈ R2 und t > 0 die Lösung ˆ ˆ ∂ t f (~x + ct~y ) 2 g(~x + ct~y) 2 t p p u(~x,t) = dλ (~y ) + dλ (~y ) . (11.8) 2 ∂t 2π 2π 1 − |~y | 1 − |~y |2 |~ y |≤1
|~ y|≤1
Für dreidimensionale Probleme mit der Symmetrieachse x1 = x2 = 0 ist die Lösung zur Zeit t > 0 an einer Stelle ~z = (x1 ,x2 ,x3 ) = (~x,x3 ) mit u(~z,t) = u(~x,t) ebenfalls durch die Formel (11.8) gegeben.
368
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Ausbreitung lokaler Störungen. Beim Anfangswertproblem der Wellengleichung in der Ebene führt eine örtlich begrenzte Anfangsstörung an jedem Punkt zu einem zeitlich unbegrenzten Effekt. Die Lösung u(~x,t) in einem Punkt ~x = (x1 ,x2 ) in der Ebene hängt zur Zeit t > 0 von den Werten der Anfangsbedingungen in der gesamten Kreisscheibe um ~x mit dem Radius ct ab. Lokale Störungen in der Ebene breiten sich mit der Geschwindigkeit c aus und wirken dann in Punkten, die von der Welle einmal erreicht sind, stets nach. Man lege etwa ein Herbstblatt auf eine ruhende Wasserfläche und werfe einen Stein ins Wasser. Die davon ausgehende Welle wird das Blatt erreichen und sich weiter ausbreiten. Das Blatt wird noch lange weiterschaukeln, nachdem es von der Ausbreitungsfront passiert wurde. Dies mag eine Anschauung des Sachverhaltes geben, auch wenn Wasserwellen nur in sehr grober Näherung durch die zweidimensionale Wellengleichung (11.5) beschrieben werden. Der Unterschied im Vergleich zur vorher diskutierten Ausbreitung räumlich lokaler Störungen ist leicht verständlich, wenn man das ebene Problem als ein dreidimensionales Problem mit der Symmetrieachse x1 = x2 = 0 liest. Eine Anfangsbedingung mit beschränktem Träger in der Ebene entspricht dabei einer Störung, deren Träger ein unendlich ausgedehnter Zylinder im Raum ist. Auch zu beliebig großen Zeiten wird dann ein Punkt (x1 ,x2 ) der Ebene noch von Störungen aus großer Höhe x3 erreicht. Das Anfangswertproblem für die homogene Wärmeleitungsgleichung Das Anfangswertproblem für die homogene Wärmeleitungsgleichung im homogenen, isotropen Raum lautet ∂u (~x,t) = k∆~x u(~x,t) , u(~x,0+) = f (~x). ∂t
(11.9)
Dabei ist u(~x,t) die absolute Temperatur an einer Stelle ~x ∈ Rp zur Zeit t > 0. Die Raumdimension p ist beliebig. Die Konstante k > 0 ist die Temperaturleitfähigkeit. Wie bei der Wellengleichung setzen wir die Anfangstemperatur f ≥ 0 zunächst als glatte, schnell fallende Funktion voraus und erhalten mit der auf die Ortskoordinaten bezogenen Fouriertransformation der Gleichungen in (11.9) die gewöhnliche Differentialgleichung ∂b u (~ ω ,t) = −k|~ ω |2 u b(~ ω ,t) , u b(~ω,0+) = fb(~ω ). ∂t
2 Ihre eindeutige Lösung ist u b(~ ω ,t) = fb(~ ω ) e−k|~ω| t . Mit der inversen Fouriertransformierten 2 2 Kt (~x) = (4πkt)−p/2 e−|~x| /(4kt) von e−k|~ω| t folgt die Lösung von (11.9) durch Faltung von f mit Kt .
Ergebnis. Das Anfangswertproblem (11.9) für die homogene Wärmeleitungsgleichung besitzt für ~x ∈ Rp und t > 0 die Lösung ˆ 2 u(~x,t) = (4πkt)−p/2 f (~y ) e−|~x−~y| /(4kt) dλp (~y ) . (11.10) Rp
11.8 Der Satz von Malgrange-Ehrenpreis
369
Wegen des schnellen Abfallens des Wärmeleitungskerns Kt (~x) ergibt sich auch für Anfangsbedingungen f ∈ S ′ (Rp ) noch eine glatte Lösung (vgl. S. 254). Man kann beweisen (vgl. etwa F. John (1981)), dass für f ≥ 0 die Lösung u in (11.10) die einzige nichtnegative Lösung des Wärmeleitungsproblems (11.9) ist. Wenn bis zur Zeit t = 0 überall die Temperatur Null herrscht und an einer Stelle ~ y zur Zeit t = 0 die Temperatur f (~y ) erzeugt wird, dann beschreibt die Dichtefunktion f (~y )Kt (~x − ~y) die von ~y aus in ~x erzeugte Temperatur zur Zeit t. Der Wärmeleitungskern zeigt also örtlich und zeitlich den Temperaturausgleich, das Faltungsintegral (11.10) die Superposition der Einflüsse, die durch die Anfangstemperaturen aller Raumpunkte ~y zur Zeit t in ~x wirken. Auch inhomogene Anfangswertprobleme für Wellen- und Wärmeleitungsgleichungen lassen sich mit der Fourierschen Methode lösen. Man hat hierzu Grundlösungen der Gleichungen zu bestimmen. Für die Wärmeleitungsgleichung ist dies als Aufgabe A6, für die 3D-Wellengleichung als Aufgabe A7, für die Schrödingergleichung als Aufgabe A8 am Kapitelende gestellt. Für die 3D-Potentialgleichung hatten wir bereits auf S. 196 eine Grundlösung hergeleitet, im 2D-Fall in Aufgabe A7 von Kapitel 8. Grundlösungen zu weiteren Problemen findet man in weiterführender Literatur über partielle Differentialgleichungen. Als Quellen seien etwa W. A. Strauss (1995), H. Triebel (1980), F. Tr`eves (1966), L. Hörmander (2003) und N. Ortner, P. Wagner (2013 und 2015) genannt. Dass es für alle linearen partiellen Differentialoperatoren P (∂) mit konstanten Koeffizienten Grundlösungen E gibt, d.h. P (∂)E = δ, zeigt uns der folgende Abschnitt.
11.8 Der Satz von Malgrange-Ehrenpreis Ziel des Schlussabschnitts in diesem Kapitel ist ein Beweis des berühmten Theorems von Malgrange-Ehrenpreis über die Existenz von Grundlösungen linearer partieller Differentialgleichungen mit konstanten Koeffizienten. Dieses Theorem ist aus Sicht des Autors ein Höhepunkt der Fourier-Analysis und Distributionentheorie überhaupt und damit auch des hier den Lesern vorgelegten Einführungstextes zu diesem Thema. Für die Lektüre dieses Abschnitts sei zunächst an die Notation für Differentialoperatoren bei mehreren Variablen mit Hilfe von Multi-Indizes erinnert, die in Abschnitt 7.6 eingeführt wurde. Ein Polynom vom Grad ≤ m in ξ = (ξ1 , . . . ,ξn ) notieren wir mit Hilfe von MultiIndizes k = (k1 , . . . ,kn ) ∈ Nn0 mit |k| = k1 + k2 + . . . + kn durch X X ak ξ k . ak ξ1k1 ξ2k2 · · · ξnkn = P (ξ) = P (ξ1 , . . . ,ξn ) = |k|≤m
|k|≤m
Bezeichnet C[ξ] die Menge Xaller Polynome, so ist C[∂] die Menge aller linearen Differenak ∂ k mit konstanten Koeffizienten. Dabei sind m ∈ N und tialoperatoren P (∂) = |k|≤m
die Koeffizienten ak ∈ C für k ∈ Nn0 beliebig wählbar. Für einen Index k ∈ Nn0 bedeuten ξ k = ξ1k1 · · · ξnkn und ∂ k = ∂1k1 · · · ∂nkn für ∂ = (∂1 , . . . ,∂n ), wobei ∂i = ∂/∂xi ist. Die Distribution δ ist wie bisher das Dirac-Maß im Ursprung des Rn .
370
11 Weitere Anwendungsbeispiele für die Fouriertransformation
In diesem Abschnitt verzichten wir aus Gründen der Übersichtlichkeit in der Notation von Variablen aus Rn oder Cn auf die bisher verwendeten Vektorpfeile, schreiben also x statt wie bisher ~x. Das fundamentale Resultat von Malgrange-Ehrenpreis lautet nun: Satz 1 (Malgrange-Ehrenpreis-Theorem, abstrakte Fassung). Für jedes nicht-konstante Polynom P ∈ C[ξ] hat die partielle Differentialgleichung P (∂)T = δ eine Lösung T ∈ D′ (Rn ). Dieses fundamentale Ergebnis wurde erstmals von L. Ehrenpreis (1954) und B. Malgrange (1955) bewiesen. Inzwischen gibt es eine Reihe weiterer Beweise, zum Beispiel zu finden bei W. Rudin (1991), J. P. Rosay (1991), H. König (1994), W. Walter (1994), bei N. Ortner , P. Wagner (1994 und 1997), P. Wagner (2009) oder bei J. J. Duistermaat, J. A. C. Kolk (2010). Der hier vorgestellte Beweis wurde durch die Arbeit von P. Wagner (2009) angeregt und stammt von meinem Kollegen H. Leinfelder (2012). Dieser Beweis folgt im Wesentlichen der bei P. Wagner (2009) dargelegten Linie und ist völlig elementar. Es werden nur die Produktregel und die Fouriertransformation verallgemeinerter Ableitungen, die Taylorformel und die Cramersche Regel zur Lösung regulärer linearer Gleichungssysteme benutzt. Bevor wir zum Beweis von Satz 1 kommen, erinnern wir uns noch an weitere Notationen. Der Buchstabe n ist für die Dimension des zugrunde liegenden Raumes Rn reserviert. Wie bisher bezeichnet j die komplexe Einheit mit j 2 = −1. Das Produkt ξx auf dem Rn steht als Abkürzung für den Ausdruck ξ1 x1 + · · · + ξn xn . Wir benutzen das Symbol als Platzhalter für Variablen des Rn , so dass damit eζ bzw. j die Funktionen (eζ )(x) = eζx für ζ, x ∈ X Rn bzw. (j )(ξ) = jξ für ξ ∈ Rn darstellen. Ein linearer Differentialoperator X ak ∂ k nicht ak ∂ k hat den Grad m, wenn sein Hauptteil Pm (∂) = P (∂) = |k|=m
|k|≤m
verschwindet. Wir betrachten beim Malgrange-Ehrenpreis-Theorem nur den interessanten Fall nicht-konstanter Polynome P . Was die Notation für Distributionen betrifft, sei auf die Kapitel 7 und 9 verwiesen. Für die Fouriertransformation auf S ′ (Rn ) verwenden wir wie in Kapitel 9 die Bezeichnung F . Für P ∈ C[ξ] und ζ ∈ Rn gelten folgende Operatoridentitäten auf D′ (Rn ) bzw. S ′ (Rn ): e−ζ P (∂) eζ = P (∂ + ζ)
(11.11)
F P (∂) F −1 = P (j )
(11.12)
Zum Verständnis der ersten Formel beachte man, dass nach der Produktregel für Ableitungen gilt: ∂i (eζ T ) = ζi eζ T + eζ ∂i T = eζ (∂i + ζi )T. Hieraus folgt durch mehrfache Anwendung ∂iki (eζ T ) = eζ (∂i + ζi )ki T und damit ∂ k (eζ T ) = eζ (∂1 + ζ1 )k1 (∂2 + ζ2 )k2 . . . (∂n + ζn )kn T = eζ (∂ + ζ)k T. X ak ξ k Durch Multiplizieren mit ak und Aufsummieren ergibt sich für P (ξ) = |k|≤m
11.8 Der Satz von Malgrange-Ehrenpreis
371
P (∂) eζ T = eζ P (∂ + ζ)T. Multiplikation beider Seiten dieser Gleichung mit e−ζ zeigt die Operatoridentität (11.11). Die zweite Formel (11.12) folgt mit der Linearität der Fouriertransformation sofort aus der Korrespondenz Nr. 5 in der Tabelle auf Seite 269. Der Beweis des Malgrange-Ehrenpreis-Theorems wird über zwei Hilfssätze (sog. Lemmata) erbracht, die auch für sich allein von Interesse sind. Dabei verwenden wir im Folgenden drei technische Hilfsmittel, die der Analysis und Linearen Algebra zuzurechnen sind. Diese drei Aussagen, bezeichnet mit (C1) – (C3), und ihre Beweise sind in einem kurzen Anhang am Ende des Abschnitts zusammengestellt. Zunächst sei bemerkt, dass für Polynome P , Q ∈ C[ξ] mit jeder Grundlösung E von P (∂), d.h. P (∂)E = δ, durch T = Q(∂)E eine Distributionslösung von P (∂)T = Q(∂)δ gegeben ist (man vgl. auch noch einmal S. 183). Gewissermaßen eine Art Umkehrung hierzu wird im folgenden Lemma ausgesprochen. Lemma 1. Seien P und Q Polynome aus C[ξ] vom Grad m ∈ N bzw. p ∈ N und Qp der Hauptteil von Q. Für ein ω ∈ Rn mit Qp (ω) 6= 0 und paarweise verschiedene η0 ,η1 , . . . ,ηp ∈ Rn aus der Geraden Rω sei vorausgesetzt, dass gewisse Eη0 ,Eη1 . . . ,Eηp aus D′ (Rn ) Lösungen der partiellen Differentialgleichung (11.13)
P (∂)E = Q(∂ + η)δ
sind, wenn man jeweils η = ηk für 0 ≤ k ≤ p in (11.13) einsetzt. p Y (λk − λq )−1 (0 ≤ k ≤ p) , dann ist Wählt man λk so, dass ηk = λk ω, und ak = q=1,q6=k
die Distribution
p
1 X E= ak Eηk Qp (ω) k=0
eine Grundlösung von P (∂). Beweis: Wir benutzen die zweite Formel aus (C 1), dort mit P = Q, η = λω, und erhalten damit die Operatorformel Q(∂ + η) = Q(∂ + λω) = λp Qp (ω) +
p−1 X
λq Vq (∂)
(11.14)
q=0
mit Vq (∂) =
X
ω α Q(α) (∂)/α!. Unter den gegebenen Voraussetzungen setzen wir nun
|α|=q
ηk = λk ω für k = 1, . . . ,p in die Gleichung (11.13) ein. Damit ergeben sich wegen der Operatorengleichung (11.14) mit den Distributionen Tq = Vq (∂)δ die Identitäten P (∂)Eηk = λpk Qp (ω)δ +
p−1 X q=0
λqk Tq .
(11.15)
372
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Die Gleichungen (11.15) multiplizieren wir mit den ak , die im Lemma 1 oben angegeben sind, und summieren über k = 0, . . . ,p auf. Hieraus folgt dann die Gleichung ! ! ! p p−1 p p X X X X q p ak λk Tq . (11.16) P (∂) ak λk Qp (ω) δ + ak Eηk = q=0
k=0
k=0
k=0
Wegen der Wahl der Koeffizienten ak gelten nach dem Ergebnis (C 2) aus dem Anhang (dort mit m = p) p X
ak λpk = 1 und
p X
k=0
k=0
ak λqk = 0 (0 ≤ q ≤ p − 1).
Somit folgt aus (11.16) P (∂)
p X
k=0
ak Eηk
!
= Qp (ω)δ ,
d.h. P (∂)E = δ, und damit ist E eine Grundlösung von P (∂).
Wegen Lemma 1 ist ein Beweis des Malgrange-Ehrenpreis-Theorems dann gesichert, wenn für alle η ∈ Rn die Lösbarkeit von (11.13) für irgendein von Null verschiedenes Polynom Q garantiert ist. Äquivalent damit ist die Lösbarkeit von P (∂)E = Q(∂ − 2η)δ
(11.17)
für alle η ∈ Rn . Um (11.17) für ein beliebig gewähltes η ∈ Rn zu lösen, verwenden wir für E den Ansatz (11.18) E = eζ F −1 S mit ζ ∈ Rn und S ∈ S ′ (Rn ). Mit den Beziehungen
eζ δ = δ und F δ = 1 lautet dann Gleichung (11.17) für die nun gesuchte Distribution S ∈ S ′ (Rn ) P (∂) eζ F −1 S = Q(∂ − 2η) eζ F −1 1 .
(11.19)
Multipliziert man (11.19) von links zunächst mit e−ζ und wendet dann die Fouriertransformation F an, so folgt (11.20) F e−ζ P (∂) eζ F −1 S = F e−ζ Q(∂ − 2η) eζ F −1 1 . Eine Anwendung der Formeln (11.11) und danach (11.12) vom Beginn dieses Abschnitts auf die Gleichung (11.20) ergibt die Beziehung P (j + ζ)S = Q(j + ζ − 2η).
(11.21)
11.8 Der Satz von Malgrange-Ehrenpreis
373
Entscheidend ist nun, dass ζ und Q ∈ C[ξ] noch frei wählbar sind. Wir setzen ζ = η sowie Q(ξ) = Pe (−ξ). Dabei ist mit Pe (ξ) das Polynom P (ξ) notiert (d.h. die komplexe Konjugation bezieht sich nur auf die Koeffizienten von P ). Die Gleichung (11.21) wird dann erfüllt durch die reguläre Distribution S=
Pe (−j + η) P (j + η) = . P (j + η) P (j + η)
(11.22)
Man beachte, dass für P 6= 0 die Nullstellenmenge N (P (j + η)) eine Lebesguesche Nullmenge ist (siehe (C 3)). Wegen |S| ≤ 1 fast-überall ist S ∈ S ′ (Rn ). Eingesetzt in (11.18) ergibt daher diese Distribution S eine Lösung E von (11.17). Damit haben wir folgendes Resultat gezeigt: Lemma 2. Wählt man zu P ∈ C[ξ] das Polynom Q ∈ C[ξ] mit Q(ξ) = Pe(−ξ), so ist ! P (j + η) E = Eη = eη F −1 (11.23) P (j + η) für jedes η ∈ Rn eine Distributionslösung von P (∂)E = Q(∂ − 2η)δ.
Anmerkung. Gleichung (11.17) hat auch für Q ∈ C[ξ] gegeben durch Q(ξ) = Pe (−ξ)R(ξ) mit beliebigem R ∈ C[ξ] eine Distributionslösung E. Nun zum Beweis des Malgrange-Ehrenpreis-Theorems (Satz 1).
Beweis: Setzt man für ein nicht-konstantes Polynom P in Lemma 2 für η = −e η /2, so ist die partielle Differentialgleichung P (∂)E = Q(∂ + ηe)δ für alle ηe ∈ Rn und Q(ξ) = Pe (−ξ) lösbar. Damit ist die Voraussetzung (11.13) in Lemma 1 für ω mit Pm (ω) 6= 0 und passend gewählte ηk ∈ Rω erfüllt. Nach Lemma 1 hat somit P (∂) eine Grundlösung.
Mit ein klein wenig mehr Mühe lässt sich aus Lemma 1 und 2 sogar eine konstruktive, explizite Fassung des Satzes von Malgrange–Ehrenpreis gewinnen.
Satz 2 (Malgrange-Ehrenpreis-Theorem, konstruktive Fassung). Sei P ∈ C[ξ] ein nicht-konstantes Polynom vom Grad m. Weiter sei ω ∈ Rn mit Pm (ω) 6= 0 und es seien λ0 ,λ1 , . . . ,λm ∈ R paarweise verschieden. Für 0 ≤ k ≤ m seien ηk = λk ω sowie m Y ak = (λk − λq )−1 . Dann ist q=0,q6=k
E=
1
m X
Pm (2ω) k=0
ak eηk F −1
P (j + ηk ) P (j + ηk )
!
∈ D′ (Rn )
eine Grundlösung von P (∂), d.h. P (∂)E = δ. Beweis. Wir setzen ω e =−2ω, ηek =λk ω e und Q(ξ)= Pe (−ξ). Die nach (11.23) in Lemma 2 bestimmten Distributionen Eηk erfüllen dann die Gleichungen P (∂)Eηk = Q(∂ + ηek )δ. m X 1 Nach Lemma 1 ist dann die Distribution E = ak Eηk eine Grundlösung von Qm (e ω) k=0 P (∂). Man beachte dabei, dass Qm (e ω ) = Pem (−e ω) = Pem (2ω) = Pm (2ω) 6= 0 gilt.
374
11 Weitere Anwendungsbeispiele für die Fouriertransformation
Die Bedeutung des Satzes von Malgrange-Ehrenpreis liegt in der Lösbarkeit von partiellen Differentialgleichungen. Hier ein typisches Resultat. Korollar. Ist P ∈ C[ξ], E eine Grundlösung von P (∂) und F eine Distribution mit kompaktem Träger. Dann ist die Distribution T = E ∗ F eine Lösung von P (∂)T = F. Beweis. P (∂)T = P (∂)(E ∗ F ) = (P (∂)E) ∗ F = δ ∗ F = F.
Abschließende Bemerkungen. 1) Satz 2 zeigt die große Vielfalt möglicher Grundlösungen bei partiellen Differentialgleichungen. Auch wenn in diesem Satz eine explizite Formel für eine Grundlösung E von P (∂) angegeben wurde, ist diese zur konkreten Berechnung von E nur bedingt geeignet. Dies liegt an der Schwierigkeit der Berechnung von F −1 (P (j + ηk )/P (j + ηk )). Bereits am Beispiel eines beliebigen, nicht-konstanten Polynoms P in einer Variablen ξ = t lässt sich erahnen, dass andere Methoden einfacher (aber sicher nicht trivial) zum Ziel führen. Während in diesem Fall die rechte Seite der Formel (11.18) durchaus noch berechnet werden kann, lässt sich mit Hilfe der bei Ingenieuren viel gebrauchten rechtsseitigen Laplace-Transfomation L jedoch eine kausale Grundlösung E ohne jede Rechnung in der Form E = L−1 (1/P ) oder auch mit der Fouriertransformation durch E = F −1 (1/P (j )) angeben, da in diesem Fall 1/P (j ) stets zu S ′ gehört. Im zweiten Fall ist diese Grundlösung nicht kausal, wenn P Nullstellen mit nicht-negativen Realteilen hat (vgl. S. 288). Gehört 1/P (j ) zu S ′ (Rn ), dann ist F −1 (1/P (j )) eine mögliche Grundlösung für P (∂). Man siehe hierzu die Gleichungen (11.21) und (11.18) mit Q = 1, ζ = 0. Ist 1/P (j ) integrierbar, dann ist F −1 (1/P (j )) die einzige temperierte Grundlösung von ′ P (∂). Sie ist dann eine schnell fallende Distribution aus OC (Rn ). Für Details hierzu und zu Aussagen über Regularitätseigenschaften von Grundlösungen sei verwiesen auf F. Tr`eves (1966), L. Hörmander (2003) und andere Literatur zu partiellen Differentialgleichungen. 2) In Faltungsgleichungen der linearen Systemtheorie stellt sich die Frage, zu welchen Faltungskernen T es Fundamentallösungen E gibt, d.h. wann T ∗ E = δ lösbar ist, und damit die Frage nach der Lösbarkeit von Faltungsgleichungen. Auch hierzu gibt es Aussagen für Faltungskerne, die einen kompakten Träger haben, in der schon zitierten Arbeit von P. Wagner (2009) und bei L. Hörmander (2003). Grundlösungen für spezielle Differentialoperatoren sind zu finden in der Arbeit von N. Ortner (1980) und in den Büchern von N. Ortner, P. Wagner (2013 und 2015). Anhang: Technische Hilfsmittel (C 1) Sei P ∈ C[ξ] ein Polynom vom Grad m ∈ N sowie λ ∈ R und x, ω ∈ Rn . Dann ist m−1 X P (α) (x) X P (x + λω) = λm Pm (ω) + λk ωα α! k=0
|α|=k
mit Pm dem Hauptteil von P , P (α) = ∂ α P ∈ C[ξ] und α! = (α1 !)(α2 !) · · · (αn !). Analog gilt im Sinne von Operatoren auf S ′ (Rn )
11.8 Der Satz von Malgrange-Ehrenpreis
375
P (∂ + λω) = λm Pm (ω) +
m−1 X k=0
X P (α) (∂) λk ωα . α! |α|=k
Beweis. Die zweite Formel in (C 1) folgt aus der ersten Formel mit der Linearität der Fouriertransformation, wenn man x durch jx ersetzt und Formel (11.12) in der Form P (∂) = F −1 P (j )F anwendet. Zum Nachweis der ersten Formel in (C 1) setzen wir abkürzend y = λω. Mit Hilfe der Taylorformel (siehe W. Walter (1990)) folgt m X X (∂ α P )(x) X (∂ α P )(x) yα = ω α λk . P (x + y) = α! α! k=0
|α|≤m
Schreibt man P (x) =
X
|α|≤m
|α|=k
aα xα , so sieht man, dass (∂ α P )(x) = aα α! für |α| = m ist,
X (∂ α P )(x) X also aα ω α = Pm (ω) mit Pm dem Hauptteil von P . Für ωα = α! |α|=m |α|=m m−1 X X P (α) (x) ω α λk . y = λω folgt P (x + λω) = λm Pm (ω) + α! k=0
|α|=k
(C 2) Wenn λ0 ,λ1 , . . . ,λm ∈ C paarweise verschieden sind, dann hat das Gleichungssystem m X ak λqk = δqm (0 ≤ q ≤ m) k=0
in den Unbekannten ak für 0 ≤ k ≤ m die eindeutige Lösung ak =
m Y
q=0,q6=k
(λk − λq )−1 .
Hierbei ist δqm das Kronecker-Symbol, d.h. δqm = 0 für q 6= k und δmm = 1.
Beweis. Zu obigem linearen Gleichungssystem gehört eine Vandermonde-Determinante, die nicht verschwindet, weil λ0 ,λ1 , . . . ,λm paarweise verschieden sind. Damit können die Unbekannten a0 ,a1 , . . . ,am mit der Cramerschen Regel berechnet werden. So errechnet sich zum Beispiel für den interessanten Fall m > 1 die Unbekannte a0 wie folgt: Mit 1 1 ... 1 01 ... 1 λ0 0 λ1 λ1 . . . λm . . . λm .. .. .. . . . .. .. A = . . und B = .. . m−1 m−1 m−1 m−1 m−1 λ 0 λ λ1 . . . λm . . . λm 0 1 λm λm . . . λm 1 λm . . . λm 0 1 m 1 m gilt nach der Cramerschen Regel a0 = det A/det B, also −1 m m m Y Y Y a0 = (−1)m (λq − λk ) (λq − λk ) = (λ0 − λq )−1 . 1≤k ωg . Sei weiter α > 1. (a) Zeigen Sie, dass für |ω| ≤ αωg gilt:
+∞ π X kπ b e−jkπω/(αωg ) . f (ω) = f αωg αωg k=−∞
(b) Sei w cα eine spektrale Fensterfunktion der nachfolgend skizzierten Gestalt: w\ α (ω)
1
−αωg −ωg
Zeigen Sie, dass wα (t) =
0
ωg
αωg
ω
cos(ωg t) − cos(αωg t) gilt. π(α − 1)ωg t2
(c) Es gilt fb = w cα fb. Zeigen Sie damit die Abtastformel f (t) =
+∞ π X kπ kπ f wα t − , αωg αωg αωg k=−∞
d.h. eine Abtastformel mit Oversampling, in der die Basisfunktionen wα (t) für |t| → ∞ abfallen wie 1/t2 (vgl. Bemerkung 2 auf S. 329). A2) Erstellen Sie mit einem Computeralgebrasystem die Grafik einer Näherung für |fe|, fe die gefensterte Fouriertransformierte von f (t) = sin(40πt2 ), 0 ≤ t ≤ 10. Verwenden Sie dazu das Hann-Fenster aus dem Beispiel von S. 351.
A3) Wie groß ist die effektive Bandbreite des in den Abschnitten 11.4 und 11.5 verwendeten Hann-Fensters wT ? n wT (t) = 0.5 − 0.5 cos(2πt/T ) für 0 ≤ t ≤ T 0 sonst A4) Wie lautet die der Formel (11.4) aus 11.5 entsprechende Formel für die Fensterfunktion n wT (t) = 1 − 2|t − T /2|/T für 0 ≤ t ≤ T ? 0 sonst Mit welchen Gewichten wirkt sich der spektrale Leckeffekt bei einer mit dem Dreieckfenster durchgeführten diskreten Fouriertransformation aus?
378
11 Weitere Anwendungsbeispiele für die Fouriertransformation
A5) Lösen Sie das folgende kausale Anfangswertproblem für t ≥ 0 mit der Fouriertransformation wie in Abschnitt 11.6: x(3) (t) + 4x′′ (t) + 6x′ (t) + 4x(t) = sin(t)s(t) + δ(t) mit der Einheitssprungfunktion s(t) zu den folgenden Anfangsbedingungen: x(0−) = 1, x′ (0−) = 2 und x′′ (0−) = 1. Bestimmen Sie die rechtsseitigen Grenzwerte x(0+), x′ (0+), x′′ (0+) der Lösung. A6)⋆ (a) Bestimmen Sie die Grundlösung g der Wärmeleitungsgleichung mit g(~x,t) = 0 für t < 0 und ∂ g(~x,t) − k∆~x g(~x,t) = δ(~x) ⊗ δ(t). ∂t (b) Zeigen Sie, dass die inhomogene Wärmeleitungsgleichung ∂u (~x,t) = k∆~x u(~x,t) + F (~x,t) , ∂t
u(~x,0) = 0, F (~x,t) = 0 falls t < 0
für ~x ∈ R3 , t > 0 und F so, dass das Faltungsintegral existiert, gelöst wird durch ˆt ˆ Ks (~y )F (~x − ~y,t − s) dλ3 (~y ) ds , u(~x,t) = 0 R3 2
Ks (~y ) = (4πks)−3/2 e−|~y| /(4ks) der Lösungskern der homogenen Gleichung. Geben Sie eine hinreichende Bedingung für F an, so dass das oben angegebene Faltungsintegral existiert. (c) Lösen Sie das entsprechende Problem für u(~x,0) = f (~x) ≥ 0, f ∈ S(R3 ). A7)⋆ Lösen Sie die der letzten Aufgabe entsprechenden Fragestellungen für die inhomogene Wellengleichung. Suchen Sie auch hier eine hinreichende Bedingung für die Inhomogenität F , so dass das in der Lösung auftretende Faltungsintegral Sinn macht. A8)⋆ Die Schrödinger-Gleichung ∂ψ ~ (~x,t) = j ∆~x ψ(~x,t) ∂t 2m beschreibt in der nicht-relativistischen Quantenmechanik die Wellenfunktion ψ eines freien Teilchens der Masse m beim Fehlen äußerer Kräfte. Man löse diese Gleichung für t > 0 zur Anfangsbedingung ψ(~x,0) = ψ0 (~x) ∈ S(R3 ).
379
12
Ausblicke auf weiterführende Konzepte
Als Anreiz zum weiteren Studium sei zum Abschluss eine Skizze einiger fundamentaler Ideen gegeben, die aus der Fourier-Analysis entstanden sind. Diese Ideen haben die Entwicklung großer Teilbereiche der Mathematik und weiter Teile ihrer Anwendungsbereiche seit Beginn des 20. Jahrhunderts entscheidend geprägt und sind heute feste Bestandteile der angewandten Wissenschaften.
12.1 Hilberträume, spezielle vollständige Orthonormalsysteme Ein grundlegender Aspekt der in den zurückliegenden Kapiteln vorgestellten Anwendungen der Fourier-Analysis ist die Darstellung von Funktionen oder Distributionen als Superposition von Funktionen eines gegebenen Funktionensystems. Die „Bausteine“ ej2πkt/T , k ∈ Z, bzw. ejωt , ω ∈ R, führen zu Reihen- bzw. Integraldarstellungen der Form f (t) =
+∞ X
hf (t)| ej2πkt/T i ej2πkt/T
k=−∞
1 bzw. f (t) = 2π
+∞ ˆ fb(ω) ejωt dω .
−∞
Für quadratisch integrierbare Funktionen f aus L2 ([0,T ]) bzw. L2 (R) ergeben sich Näherungen fN (t) =
+N X
k=−N
hf (t)| e
j2πkt/T
ie
j2πkt/T
1 bzw. fΩ (t) = 2π
ˆ+Ω fb(ω) ejωt dω
−Ω
für die dargestellte Funktion f , die man mit dem inneren Produkt in L2 ([0,T ]) bzw. L2 (R) (vgl. S. 49 und S. 261) als Orthogonalprojektionen auf Teilräume auffassen kann. Sie weisen daher unter allen Näherungen aus diesen Teilräumen den kleinsten mittleren quadratischen Fehler zu f auf. Im ersten Fall ist fN die Orthogonalprojektion auf den Teilraum von L2 ([0,T ]), der von den trigonometrischen Polynomen bis zum Grad N erzeugt wird. Im zweiten Fall ist fΩ die Orthogonalprojektion auf den Teilraum von L2 (R), der aus den durch Ω bandbegrenzten Funktionen besteht (vgl. S. 271). Wegen des Abschneidens hochfrequenter Anteile sind die Näherungen fN bzw. fΩ auch als Glättungen der jeweiligen Originalfunktion f zu verstehen. Technisch gesprochen sind sie Ergebnis einer Tiefpassfilterung von f (vgl. 10.2). Die Funktionen des trigonometrischen Systems treten z.B. als Eigenfunktionen bei Differentialgleichungen (vgl. 1.2 und 6.4) und bei zeitinvarianten linearen Systemen L im stationären Zustand auf (vgl. 5.2 und 10.2). Als Eigenfunktion eines linearen Operators L
380
12 Ausblicke auf weiterführende Konzepte
bezeichnet man eine Funktion e 6= 0 mit Le = λe. Der Faktor λ heißt Eigenwert von L zur Eigenfunktion e. Schematisch: Für ek (t) = ej2πkt/T und ein stabiles, zeitinvariantes lineares Filter L mit rationalem Frequenzgang b h gilt im stationären Zustand (vgl. S. 294) für f ∈ L2 ([0,T ]) f (t) =
+∞ X
ck ek (t)
Lf (t) =
ck hk ek (t)
k=−∞
k=−∞
L ck =< f | ek >
+∞ X
hk = b h(2πk/T )
Die Funktionen ek (t) aus L2 ([0,T ]) sind Eigenfunktionen von L, die Spektralwerte hk sind die zugehörigen Eigenwerte des Operators L auf L2 ([0,T ]). Man nennt die rechte +∞ X Seite hk hf | ek iek eine Spektraldarstellung von L. Die Koeffizienten hk hf | ek i sind k=−∞
quadratisch summierbar und die Reihe konvergiert in L2 ([0,T ]) gegen die Funktion Lf .
Bemerkung. Betrachtet man für schnell fallende Anregungen des Systems den Operator L auf S (vgl. 9.5), dann lässt sich für ϕ ∈ S auch die Fouriersche Integraldarstellung Lϕ(t) = +∞ ˆ 1 ϕ(ω) b b h(ω) ejωt dω als Entwicklung von Lϕ nach Eigenfunktionen von L interpre2π −∞
tieren. Zwar gehören die Funktionen eω (t) = e−jωt weder zu S noch zu L2 (R), sie lassen sich aber als Elemente von S ′ in folgendem Sinn als verallgemeinerte Eigenfunktionen c auffassen: Für alle ϕ ∈ S gilt nach dem Faltungssatz hLϕ,eω i = Lϕ(ω) =b h(ω)hϕ,eω i. Bezeichnet man aufgrund dieser Gleichung eω als verallgemeinerte Eigenfunktion von L zum Eigenwert b h(ω), dann kann die Fouriersche Umkehrformel oben als Spektraldarstellung von L mit verallgemeinerten Eigenfunktionen gelesen werden. Genaue Details zu verallgemeinerten Eigenfunktionen und ihren Anwendungen findet man bei I. M. Gel’fand, G. E. Shilov, N. Ya. Vilenkin (1964). Die mit der Fourier-Analyse erreichten Spektraldarstellungen erleichtern das Verständnis der Wirkung von L (vgl. S. 280 und S. 294). Die Darstellung von L als Multiplikationsoperator, die damit erzielt wird, ist ein Analogon zu der aus der linearen Algebra bekannten Hauptachsentransformation symmetrischer Matrizen A, d.h. zur Darstellung der linearen Abbildung A als Multiplikationsoperator auf den Eigenräumen von A (vgl. etwa H. Niemeyer, E. Wermuth (1987)). Viele technische oder physikalische Probleme lassen sich in linearer Näherung mathematisch durch Gleichungen der Form Lf = g beschreiben, wobei L ein linearer Operator auf einem geeigneten Funktionenraum H ist, dem die rechte Seite g und die gesuchte Funktion f angehören. Ist H wie L2 ([0,T ]) oder L2 (R) ein vollständiger Vektorraum mit einem inneren Produkt hh1 |h2 i für h1 ,h2 ∈ H, und der zugehörigen Norm khk = hh|hi1/2 , h ∈ H, und ist {ek | k ∈ N0 } irgendein Orthonormalsystem von Funktionen in H, d.h. hek | ek i = 1 und hek | em i = 0 für k 6= m, dann ergeben sich ganz analog zur klassischen Fourier-Analysis folgende Feststellungen:
12.1 Hilberträume, spezielle vollständige Orthonormalsysteme
381
1. Jedes Element g aus dem von den ek erzeugten abgeschlossenen Teilraum von H lässt sich mit den Funktionen ek in eine Reihe entwickeln, die in H gegen g konvergiert: g=
∞ X
k=0
hg | ek iek .
Man bezeichnet diese Reihe als die Fourierreihe der Funktion g zum Orthonormalsystem {ek | k ∈ N0 }. Diese Darstellung von g verallgemeinert die gewohnte Zerlegung von Vektoren endlich-dimensionaler Vektorräume in ihre Komponenten bezüglich einer Orthonormalbasis und die Fourierreihenentwicklung von Funktionen aus L2 ([0,T ]). 2. Besitzt ein linearer Operator L auf H die Spektraldarstellung Lf =
∞ X
k=0
λk hf | ek iek
für f ∈ H mit Eigenwerten λk 6= 0, dann kann man die Gleichung Lf = g für eine ∞ X hg | ek iek durch Koeffizientenvergleich lösen, sofern rechte Seite g ∈ H mit g = ∞ X 2 k=0 hg | ek i < ∞ ist. Eine Lösung f ist gegeben durch λk k=0 ∞ X λk−1 hg | ek iek . f= k=0
Die Reihe konvergiert in H gegen f genau dann, wenn ihre Koeffizienten quadratisch summierbar sind (vgl. Parsevalgleichung, S. 384).
Bemerkung. Bei vielen konkreten Problemen dieses Typs bilden die ihrer Größe nach geordneten Eigenwerte λ1 ≥ λ2 ≥ . . . eine Nullfolge. Das Problem Lf = g ist dann ein sogenanntes schlecht gestelltes Inversenproblem, weil selbst kleine Datenfehler, d.h. kleine Abweichungen in den Koeffizienten hg | ek i, bei den Divisionen durch λk wegen λk → 0 gewaltig verstärkt werden. Man verwendet dann statt der obigen „naiven“ Reihenlösung Näherungen, die weniger störempfindlich sind. Solche Näherungen gewinnt man durch sogenannte Regularisierungsverfahren (vgl. auch Aufgabe 12 von Kapitel 8). Darstellungen von Regularisierungsmethoden und Lösungen konkret gegebener Probleme aus verschiedenen Anwendungsbereichen – z.B. Computer-Tomographie, Bildrekonstruktion, Bodenerforschung in der Geologie, Spektroskopie und vieles mehr – findet man bei H. Engl, C. Groetsch (1987), C. Groetsch (1993) oder A. K. Louis (1989). Schon diese wenigen Bemerkungen zeigen, dass sich die Methoden der Fourier-Analysis auf Problemstellungen übertragen lassen, die durch lineare Operatoren L mit Spektraldarstellungen in geeigneten Funktionenräumen H beschrieben werden. Die auftretenden Eigenfunktionen ek von L müssen keineswegs trigonometrische Funktionen sein, mithin auch keine unmittelbare Interpretation durch Schwingungen und Frequenzen bieten. Die „Anschaulichkeit“ eingeübter Frequenzbegriffe aus der klassischen Fourier-Analyse wird ersetzt durch die Anwendungsvielfalt einfacher Darstellungs- und Berechnungsmöglichkeiten mit Hilfe anderer „Bausteine“ ek , welche die trigonometrischen Funktionen ersetzen.
382
12 Ausblicke auf weiterführende Konzepte
Bevor wir Beispiele betrachten, die den Nutzen von Reihenentwicklungen nach Funktionen ek demonstrieren, definieren wir den Begriff des Hilbertraumes. Er gehört zum Fundament der Theorie linearer Probleme, zu der David Hilbert (1862-1943) bahnbrechende Arbeiten geleistet hat. Hilberträume Wir betrachten im Folgenden Vektorräume H über dem Körper C der komplexen Zahlen. Definition. 1. Ein inneres Produkt auf einem Vektorraum H ist eine Abbildung h . | . i : H × H → C, so dass für alle x,y,z ∈ H und α,β ∈ C folgende Bedingungen erfüllt sind: a) hαx + βy|zi = αhx|zi + βhy|zi hx|αy + βzi = αhx|yi + βhx|zi
b) hx|yi = hy|xi
c) hx|xi > 0 für x 6= 0. 2. Ein Hilbertraum H ist ein Vektorraum mit einem inneren Produkt, der mit der Norm kxk = hx|xi1/2 vollständig ist. Die Vollständigkeit eines Hilbertraumes H bedeutet, dass jede Cauchy-Folge von Elementen xn in H gegen ein Element x ∈ H konvergiert, d.h. lim xn existiert in H n→∞
genau dann, wenn kxn − xm k → 0 für n,m → ∞ gilt. Man erkennt sofort, dass die endlich-dimensionalen Vektorräume Rp und Cp mit dem üblichen Skalarprodukt Beispiele für Hilberträume sind. Unendlich-dimensionale Beispiele sind Funktionenräume wie etwa L2 ([0,T ]) oder L2 (R) (vgl. 9.7 und 11.4). Wie beim Skalarprodukt von Vektoren im Rp gilt für Elemente x,y ∈ H die CauchySchwarz-Ungleichung |hx|yi| ≤ kxk kyk. Man nennt x,y ∈ H orthogonal, wenn hx|yi = 0 ist. Jeder abgeschlossene Teilraum V eines Hilbertraumes H ist wieder ein Hilbertraum mit dem auf V eingeschränkten inneren Produkt. Sein orthogonales Komplement V ⊥ ist die Menge aller x ∈ H mit hx|vi = 0 für alle v ∈ V . V ⊥ ist wieder ein abgeschlossener Teilraum von H. Jedes x ∈ H besitzt ⊥ ⊥ eine eindeutige Zerlegung x = xV + x⊥ V mit xV ∈ V und xV ∈ V . Die Abbildung PV : H → H, x 7→ xV , heißt Orthogonalprojektion von H auf V . Die zentrale Bedeutung von Hilberträumen liegt in der Verbindung analytischer und geometrischer Begriffe wie Winkel und Orthogonalität, die durch das innere Produkt in H ermöglicht wird. Als Beispiel diene folgender Satz (vgl. etwa J. Weidmann (1980)), der in endlich-dimensionalen Vektorräumen wohlbekannt ist. Satz. Zu jedem Element x eines Hilbertraumes H und zu jedem abgeschlossenen Teilraum V von H gibt es eine eindeutig bestimmte beste Approximation xV ∈ V für x, d.h. kx − xV k < kx − yk für alle y 6= xV aus V . Diese beste Näherung für x in V ist die Orthogonalprojektion PV (x) von x auf V .
12.1 Hilberträume, spezielle vollständige Orthonormalsysteme
383
Anwendungen des Satzes in Funktionenräumen findet man in den Abschnitten 8.5 und 11.4. Ohne Nachweis der definierten Eigenschaften seien einige typische Beispiele von Hilberträumen gegeben, die in Anwendungen auftreten. Beispiele einiger Hilberträume 1. Quadratisch integrierbare Funktionen. Für ein Gebiet G in Rp ist der Vektorraum L2 (G) aller auf G quadratisch integrierbaren Funktionen ein Hilbertraum mit dem ˆ f (~x)g(~x) dλp (~x).
inneren Produkt hf |gi =
G
2. Bandbegrenzte Funktionen. Der Vektorraum P WΩ aller durch Ω > 0 bandbegrenzten Funktionen f in L2 (R), d.h. aller reellwertigen quadratisch integrierbaren f mit Tr (fb) ⊂ [−Ω,Ω], ist ein abgeschlossener Teilraum von L2 (R), also ein Hilbertraum. Er wird mit P WΩ bezeichnet nach R. Paley (1907-1933) und N. Wiener (1894-1964), die bedeutende Resultate über bandbegrenzte Funktionen gezeigt haben (siehe etwa W. Rudin (1990), W. Walter (1994) oder R. M. Young (1980)). 3. Sobolevräume. Für ein Gebiet G im R2 ist auf dem Raum D(G) der reellwertigen Testfunktionen auf G (vgl. 7.6) ein inneres Produkt definiert durch ˆ hϕ1 |ϕ2 i = (ϕ1 (x,y)ϕ2 (x,y) + grad ϕ1 (x,y) · grad ϕ2 (x,y)) dx dy . G
Ähnlich wie sich die Menge Q der rationalen Zahlen zum vollständigen Vektorraum R erweitern lässt, kann D(G) zu einem Vektorraum erweitert werden, der bezüglich der zum inneren Produkt gehörigen Norm vollständig und damit ein Hilbertraum ist. Er wird mit H01 (G) bezeichnet und ist enthalten in L2 (G). So abstrakt diese Konstruktion auch anmuten mag, so wichtig ist sie für Anwendungen. H01 (G) ist der Sobolevraum, in dem in Abschnitt 8.5 die Lösung und die Näherungslösungen mit Finiten Elementen für das Dirichletsche Problem −k∆u = f auf G, u = 0 auf ∂G gefunden wurden. Seine Elemente sind die Funktionen, die auf dem Rand ∂G von G verschwinden und zusammen mit ihrer verallgemeinerten ersten Ableitung quadratisch integrierbar sind. Allgemeiner lassen sich Sobolevräume auch für Gebiete im Rp einführen. Sie sind Vektorräume regulärer Distributionen, deren Ableitungen bis zu einer gewissen Ordnung ebenfalls regulär sind. Wie oben können dann Ableitungen beim inneren Produkt mit einbezogen (siehe auch Anhang B, S. 422). Sobolevräume sind von fundamentaler Bedeutung beim Studium partieller Differentialgleichungen und in der Approximationstheorie. Man vgl. etwa H. J. Schmeisser, H. Triebel (1987), H. Triebel (1980), K. Atkinson, W. Han (2005) und die in Abschnitt 8.5 genannten Quellen. 4. Quadratisch summierbare Folgen. Die Menge l2 (N) aller Folgen komplexer Zahlen zk , ∞ X die quadratisch summierbar sind, d.h. für die |zk |2 < ∞ gilt, ist ein Hilbertraum mit dem folgenden inneren Produkt: k=1
384
12 Ausblicke auf weiterführende Konzepte h(ak )k | (bk )k i =
∞ X
ak b k .
k=1
Die Vektorraum-Operationen in l2 (N) sind komponentenweise definiert. Dieser Hilbertraum wurde von W. Heisenberg zur Formulierung der Quantenmechanik verwendet (vgl. etwa A. Messiah (2003)). Vollständige Orthonormalsysteme in Hilberträumen Definition. Ein Orthonormalsystem von Elementen ek , k ∈ N0 , eines Hilbertraumes H heißt vollständig, wenn für jedes x ∈ H gilt: x=
∞ X
k=0
hx | ek iek .
Bezüglich eines vollständigen Orthonormalsystems kann also jedes x ∈ H durch seine Fourierreihe mit den Fourierkoeffizienten hx | ek i dargestellt werden. Man kann folgende Sätze beweisen (vgl. etwa H. Triebel (1980) oder J. Weidmann (1980)): Satz. Für ein Orthonormalsystem (ek )k∈N0 in einem Hilbertraum H sind äquivalent: 1. Das System der ek , k ∈ N0 , ist vollständig. 2. Für x ∈ H gilt genau dann x = 0, wenn hx | ek i = 0 ist für alle k ∈ N0 . 3. Für jedes x ∈ H gilt die Parsevalgleichung kxk2 =
∞ X
k=0
|hx | ek i|2 .
Satz. Für ein Orthonormalsystem (ek )k∈N0 in einem Hilbertraum H und Koeffizienten ∞ X ck ek genau dann in H, wenn die Koeffizienten ck ck , k ∈ N0 , konvergiert die Reihe ∞ k=0 X quadratisch summierbar sind, d.h. wenn |ck |2 < ∞ gilt. k=0
Satz. Seien (ek )k∈N0 ein Orthonormalsystem in einem Hilbertraum H und V der davon erzeugte abgeschlossene Teilraum von H. Die Orthogonalprojektion xV eines Elementes x ∈ H auf V ist dann gegeben durch xV =
∞ X
k=0
hx | ek iek .
Ohne Beweise geben wir einige Beispiele an, wie die Entwicklung nach vollständigen Orthonormalsystemen in Hilberträumen angewendet werden kann. An Stelle der abzählbaren Indexmenge N0 wie oben können auch andere abzählbare Mengen als Indexmengen des Orthonormalsystems gewählt sein.
12.1 Hilberträume, spezielle vollständige Orthonormalsysteme
385
Beispiele spezieller vollständiger Orthonormalsysteme in Hilberträumen 1. Die trigonometrischen Funktionen. Im Hilbertraum L2 ([0,T ]) der reellwertigen, quadratisch integrierbaren Funktionen bilden die Funktionen für k ∈ N 1,
√
2 cos(2πkt/T ) und
√ 2 sin(2πkt/T )
mit dem auf S. 9 definierten Skalarprodukt ein vollständiges Orthonormalsystem. Für den Hilbertraum der komplexwertigen L2 -Funktionen auf [0,T ] stellen die Funktionen ej2πkt/T mit k ∈ Z ein solches System dar. 2. Die Tschebyscheff-Polynome. Die Tschebyscheff-Polynome Tn , für n ∈ N0 gegeben durch Tn (x) = cos(n arccos x), bilden ein vollständiges Orthogonalsystem im reellen Hilbertraum L2w ([−1,1]) mit der p Gewichtsfunktion w(x) = 1/ 1 − x2 und dem in Abschnitt 5.7 auf S. 86 eingeführten inneren Produkt. Dort waren Anwendungen bei Interpolation, Approximation, numerischer Integration und beim Entwurf von Tiefpassfiltern gezeigt. 3. Die Hardyschen Funktionen. Im Hilbertraum P WΩ der durch Ω bandbegrenzten L2 Funktionen, versehen mit dem inneren Produkt von L2 (R), bilden die Funktionen r Ω sin(Ωt − kπ) ek (t) = π Ωt − kπ ein vollständiges Orthonormalsystem (k ∈ Z), benannt nach G. H. Hardy (1877-1947). Die Reihenentwicklung f =
+∞ X
k=−∞
hf | ek iek ergibt den Shannonschen Abtastsatz
(vgl. 11.1) für Funktionen f aus P WΩ . Die Shannonsche Abtastreihe einer Funktion f ∈ P WΩ konvergiert im quadratischen Mittel gegen f . 4. Legendre-Polynome und Kugelflächenfunktionen. Für k ≥ 0 versteht man unter dem k-ten Legendre-Polynom Pk auf [−1,1] die Funktion Pk (t) =
1 dk 2 (t − 1)k . 2k k! dtk
Die Legendre-Polynome bilden ein vollständiges Orthogonalsystem im reellen Vektorˆ+1 2 raum L ([−1,1]) mit dem inneren Produkt hf |gi = f (t)g(t) dt. Sie ermöglichen für −1
Funktionen aus diesem Hilbertraum polynomiale Approximationen mit kleinstem mittp leren quadratischen Fehler. Ihre Norm in L2 ([−1,1]) ist jeweils kPk k = 2/(2k + 1). Mit den Legendre-Polynomen werden die Kugelflächenfunktionen Yn,m , n ∈ N0 , m aus Z, |m| ≤ n, definiert. Für Kugelkoordinaten θ ∈ [0,π], φ ∈ [0,2π[, ist
386
12 Ausblicke auf weiterführende Konzepte
Yn,m (θ,φ) =
s
2n + 1 (n − |m|)! Pn,|m| (cos θ) ejmφ 4π (n + |m|)!
dm Pn (t) für 0 ≤ m ≤ n. Die Kugelflächenfunktionen dtm Yn,m , n ∈ N0 , |m| ≤ n, auf der Einheitssphäre S des R3 bilden ein vollständiges Orthonormalsystem in L2 (S). Sie finden Anwendungen bei der Lösung von Potentialproblemen mit gegebenen Randwerten auf einer Kugelsphäre und bei der Reihenentwicklung von Potentialen, die durch räumlich begrenzte Ladungsverteilungen erzeugt werden. Diese Reihen nennt man in der Physik Multipolentwicklungen. Hierzu sei verwiesen etwa auf G. Folland (1992), W. Greiner (2008) oder H. Triebel (1980). mit Pn,m (t) = (1 − t2 )m/2
5. Hermite-Funktionen. Die Hermite-Funktionen hn , n ≥ 0, auf R sind gegeben durch √ 2 2 dn hn (x) = (−1)n (2n n! π)−1/2 ex /2 n e−x . dx
Sie bilden ein vollständiges Orthonormalsystem in L2 (R). In der Quantenmechanik wird ein eindimensionaler harmonischer Oszillator durch den Hamilton-Operator Hf (x) = −
κ ~2 ′′ f (x) + x2 f (x) 2m 2
in L2 (R) beschrieben. Er besitzt die Funktionen hn (αx), α = (κm)1/4 /~1/2 , n ≥ 0, als Eigenfunktionen. Die zugehörigen Eigenwerte sind die diskreten Energieniveaus p En = ~ κ/m(n+1/2), die der harmonische Oszillator im stationären Zustand haben kann. Interessierte Leser seien auf die einschlägige Literatur zur Quantenmechanik verwiesen. Die genannten Beispiele verdeutlichen, dass die skizzierten Hilbertraummethoden ein reiches Instrumentarium zur Lösung vielfältiger Probleme verfügbar machen. Es gibt eine umfangreiche Literatur zu Orthonormalsystemen aus speziellen Funktionen. Sie ermöglichen Lösungen von Approximationsaufgaben, von klassischen Differential- und Integralgleichungen der mathematischen Physik und das Verständnis der Quantenmechanik im Rahmen der Hilbertraumtheorie. Die Theorie linearer Probleme in Hilberträumen wird entwickelt in der Literatur zur Funktionalanalysis.
12.2 Wavelets Eine jüngere Entwicklung der angewandten Mathematik ist die Wavelet-Theorie. Ein Wavelet ist eine spezielle Funktion, mit der unter geeigneten Bedingungen ein vollständiges Orthonormalsystem in einem Hilbertraum H wie L2 (R) konstruiert werden kann. Elemente f aus H lassen sich dann wie im vorangehenden Abschnitt mit diesem Orthonormalsystem in Reihen entwickeln. Wavelets und zugehörige Reihenentwicklungen waren schon seit A. Haar (1885-1933) in der Mathematik, in der Physik und in den Ingenieurwissenschaften zu unterschiedlichen Anwendungszwecken in Gebrauch, eine einheitliche
12.2 Wavelets
387
Theorie entstand seit Ende der 70er Jahre. Einen Überblick über die historische Entwicklung der Theorie gibt Y. Meyer (1993). Detaillierte Darstellungen findet man zum Beispiel bei C. Blatter (2003), I. Daubechies (1992), L. Grafakos (2008 und 2010), M. Holschneider (1999), G. Kaiser (1994), D. Kölzow (1994), A. K. Louis, P. Maaß, A. Rieder (1998), S. Mallat (2009), Y. Meyer (1995) oder H.-G. Stark (2005). Wavelets sind besonders bekannt geworden durch Erfolge bei der Signalkompression. Diese Erfolge beruhen insbesondere auf schnellen rekursiven Algorithmen zur Berechnung von Waveletzerlegungen. Ziele dieses Abschnitts sind im Folgenden die Darstellung einiger wesentlicher Grundgedanken der Wavelet-Theorie im Vektorraum L2 (R) und die Erarbeitung der Algorithmen für die schnelle Wavelettransformation. Zum Abschluss zeigen wir ein Beispiel einer Bilddatenkompression mit Wavelets und die Bildrekonstruktion aus den komprimierten Daten. Hierzu knüpfen wir zunächst an die Ausführungen zur ZeitFrequenz-Analyse in Abschnitt 11.4 an. In der Bildverarbeitung ist später der Zeitparameter durch einen Ortsparameter zu ersetzen. Zeit-Frequenz-Analyse mit der gefensterten Fouriertransformation Die klassische Fouriertransformation verwendet die periodischen Funktionen ejωt , ω ∈ R, zur Signalanalyse. Alle diese Funktionen gehen durch Skalierung aus der Funktion ejt hervor. Der Skalenparameter ist die Kreisfrequenz ω. Die Spektralfunktion fb eines Signals f zeigt summarisch die Anteile der Schwingungen ejωt im Signal, gibt jedoch keinen Aufschluss über das Zeit-Frequenz-Muster des analysierten Signals f (vgl. S. 349). Eine Möglichkeit zur Zeit-Frequenz-Analyse bietet die gefensterte Fouriertransformation. Für ein geeignet gewähltes Zeitfenster w 6= 0 ist die zugehörige gefensterte Fouriertransformation Gw , Gw f = f˜ mit f˜(ω,t) = hf (s)|w(s − t) e
jωs
+∞ ˆ i= f (s)w(s − t) e−jωs ds , −∞
eine stetig umkehrbare Abbildung von L2 (R) nach L2 (R2 ) (vgl. S. 352). In der Umkehrformel (kwk die L2 -Norm von w) 1 f (t) = 2πkwk2
+∞ ˆ +∞ ˆ f˜(ω,s)w(t − s) ejωt dω ds
−∞ −∞
von S. 352 wird das Signal f als Superposition der Funktionen wω,s (t) = w(t − s) ejωt dargestellt. Die „Bausteine“ wω,s (t) der gefensterten Fouriertransformation entstehen wieder aus Skalierungen ejωt der „Mutterfunktion“ ejt , zusätzlich amplitudenmoduliert mit den Fenstern w(t − s), so dass die Funktionen wω,s zu L2 (R) gehören. Durch die Translationen des Fensters mit dem Parameter s wird die gesamte Zeitachse erfasst. Unter geeigneten Bedingungen an die Fensterfunktion w und die Abtaststellen (kω0 ,nt0 ) im Zeit-Frequenz-Bereich (k,n ∈ Z) lassen sich in L2 (R) vollständige Systeme von Funktionen wkω0 ,nt0 finden, die diskrete Rekonstruktionsformeln, d.h. Reihendarstellungen für
388
12 Ausblicke auf weiterführende Konzepte
Signale f ∈ L2 (R) mit den „Bausteinen“ wkω0 ,nt0 ermöglichen (vgl. S. 355). Nachteile der gefensterten Fouriertransformation zeigen jedoch die Aussagen auf S. 356. Ein Nachteil ist auch die stets gleiche Zeitdauer und Bandbreite aller Funktionen wω,s (vgl. S. 350). Die durch das Fenster w festgelegten Unschärfen in der Zeit– und Frequenzauflösung sind im gesamten Zeit-Frequenz-Bereich für alle Funktionen wω,s immer gleich groß. Weil aber die Frequenz proportional zur Anzahl von Schwingungen pro Zeiteinheit ist, benötigt man für eine präzise Analyse kurzzeitiger hochfrequenter Signalanteile eine schärfere zeitliche Auflösung, d.h. eine kleinere Zeitdauer des Fensters als für Signalanteile mit großen Wellenlängen, die ein weites Zeitfenster erfordern (vgl.auch 11.7). Die gefensterte Fouriertransformation ist daher schlecht geeignet zum Studium von Signalen, die sowohl sehr große als auch sehr kleine Frequenzen enthalten. Zeit-Skalen-Analyse mit der Wavelettransformation In der Wavelet-Theorie verwendet man zur Analyse von Signalen an Stelle der amplitudenmodulierten Schwingungen wω,s Skalierungen und Translationen einer einzigen, fast beliebig wählbaren „Fensterfunktion“ ψ. Die Funktion ψ nennt man ein Wavelet. Definition. Eine Funktion ψ ∈ L2 (R), welche die Zulässigkeitsbedingung +∞ ˆ 2 b |ψ(ω)| 0 < Cψ = dω < ∞ |ω| −∞
erfüllt, heißt Wavelet. Wψ f einer Funktion f ∈ L2 (R) ist mit Die Wavelettransformierte t−b definiert durch ψa,b (t) = |a|−1/2 ψ a +∞ ˆ t−b −1/2 Wψ f (a,b) = hf (t)|ψa,b (t)i = f (t)|a| dt . ψ a −∞
Die Wavelettransformierte Wψ f ist also eine Funktion der zwei Parameter a ∈ R \ {0} und b ∈ R. Einige grundlegende Eigenschaften der Wavelettransformation 1. Mit der Zulässigkeitsbedingung für ein Wavelet ψ lässt sich zeigen, dass die Wavelettransformation Wψ eine stetige Umkehrabbildung besitzt. Man vergleiche die Umkehrformel weiter unten. Motivation und Bedeutung der Zulässigkeitsbedingung für das Auffinden der Umkehrformel findet man ausführlich dargelegt etwa bei G. Kaiser (1994). Für integrierbare Wavelets ψ folgt wegen der Stetigkeit von ψb aus dieser Be+∞ ˆ b dingung ψ(0) = ψ(t) dt = 0. Hat ψ einen beschränkten Träger, dann sieht der −∞
12.2 Wavelets
389
Graph von ψ aufgrund dieser Bedingung wie eine „kleine Welle“ aus und erklärt den Begriff „Wavelet“ (siehe Bilder auf S. 390 und 401). Man kann zeigen, dass die Menge der Funktionen, welche die Zulässigkeitsbedingung erfüllen, dicht in L2 (R) ist. 2. Hat ein Wavelet ψ die Zeitdauer Dt (ψ) mit dem Zeitzentrum t∗ (vgl. S. 349) und die Bandbreite Dω (ψ) mit dem Frequenzzentrum ω ∗ 6= 0, dann besitzen die „AnalyseBausteine“ ψa,b die Zeitdauer Dt (ψa,b ) = aDt (ψ) mit dem Zeitzentrum b + at∗ und die Bandbreite Dω (ψa,b ) = a−1 Dω (ψ) mit dem Frequenzzentrum a−1 ω ∗ . Mit dem Skalenparameter a wird also die Frequenzlokalisation verändert. Zeitdauer und Bandbreite von ψa,b sind Maße für die Unschärfe in der Zeit- und Frequenzauflösung bei der Analyse von Signalen mit der Familie ψa,b (vgl. 11.4). Stellt man sich zur Veranschaulichung ein Wavelet ψ als Zeitfenster vor, das außerhalb eines beschränkten Intervalles verschwindet, dann verschiebt der Parameter b das Wavelet so, dass Wψ f (a,b) = hf |ψa,b i lokale Information über f um den Zeitpunkt b + at∗ enthält. Der Parameter a steuert die Weite des Fensters. Kurzzeitige hochfrequente Anteile von f , etwa mit der Kreisfrequenz ω0 , werden durch kleine Parameter a = ω ∗ /ω0 mit hoher zeitlicher Auflösung lokalisiert, da die Zeitdauer aDt (ψa,b ) des Fensters ψa,b mit a klein wird. Niederfrequente Signalanteile können entsprechend mit großen Parameterwerten a, weiten Zeitfenstern und hoher Frequenzauflösung lokalisiert werden. Diese „Zoom-Eigenschaft“, d.h. Anpassung der Fensterweite in verschiedenen Frequenzbereichen, ist ein entscheidender Vorteil der Wavelettransformation gegenüber der gefensterten Fouriertransformation bei der Analyse des ZeitFrequenz-Musters von Signalen. 3. Mit der Parsevalgleichung folgt für die Wavelettransformierte eines Signals f aus L2 (R) die „Frequenzdarstellung“ |a|1/2 |a|1/2 b b e−jωb i = hf (ω)|ψ(aω) Wψ f (a,b) = 2π 2π
+∞ ˆ b ejωb dω . fb(ω)ψ(aω)
−∞
b Ist etwa ψb um ω ∗ 6= 0 konzentriert, dann ist ψ(aω) um ω ∗ /a konzentriert. Für festes a wird dann die Wavelettransformierte Wψ f (a,b) als Funktion von b hauptsächlich durch die Frequenzen von f um ω ∗ /a bestimmt. Assoziiert man mit unterschiedlichen Frequenzen Details unterschiedlicher Größe, dann wird nochmals die Bedeutung des Skalenparameters a deutlich: Für festes a enthält die Wavelettransformierte Wψ f (a,b) die Information über Details der „Größe“ ω ∗ /a, die das Signal f in einer zeitlichen Umgebung von b + at∗ enthält. Weil die Detailauflösung durch den Skalenparameter a bestimmt wird, bezeichnet man die Signalanalyse mit der Wavelettransformation als Zeit-Skalen-Analyse. Wψ f entspricht für festes a einer Filterung von f mit dem b (vgl. 10.2). Je größer a ist, desto stärker wird f Frequenzgang |a|1/2 (2π)−1 ψ(aω) geglättet, je kleiner a wird, desto mehr Details von f werden durch die „Optik“ dieses Filters sichtbar.
390
12 Ausblicke auf weiterführende Konzepte
Das Haar-Wavelet. Das Haar-Wavelet ist die Funktion für 0 ≤ t < 1/2 1 1/2 ≤ t < 1 ψ(t) = −1 für 0 sonst.
Das nach A. Haar (1885-1933) benannte Funktionensystem ψn,k , n und k aus Z, ψn,k (t) = 2n/2 ψ(2n t − k),
ist ein klassisches vollständiges Orthonormalsystem im reellen Vektorraum L2 (R), das durch Skalierungen und Translationen aus ψ entsteht. Einen Beweis dieser Aussage findet man zum Beispiel bei I. Daubechies (1992). Die Fouriertransformierte von ψ ist sin(ω/4)2 −j(ω−π)/2 b e ψ(ω) = . ω/4
Die Konstante Cψ (vgl. S. 388) lautet Cψ = 4π ln(2). Die nachfolgenden Bilder zeigen das Haar-Wavelet ψ, die Funktion ψ2,12 (t) = 2ψ(4(t − 3)) (unten links), die Funktion f (im mittleren Bild) t für 0 ≤ t < 1 2 − t für 1 ≤ t < 2 f (t) = für 3 ≤ t < 4 1 0 sonst und die Wavelettransformierte von f für 0 < a < 2 und 0 < b < 4 (unten rechts). Die Wavelettransformierte hat hier entsprechend der groben Struktur von f größere Ausprägungen für die höheren Werte von a und verschwindet für a → 0, weil f keine „Feinstrukturen“ aufweist. Genauere Aussagen zur Interpretation von Wavelettransformierten, zum Beispiel über Zusammenhänge zwischen lokalen Eigenschaften von Funktionen f und Wachstumseigenschaften ihrer Wavelettransformierten, findet man in der schon zitierten weiterführenden Literatur.
0.5 0 - 0.5
0 1 a
0 1 b
2 3
4 2
Die Umkehrformel für die Wavelettransformation Auf ähnliche Weise wie bei der gefensterten Fouriertransformation lässt sich für die Wavelettransformation eine Umkehrformel beweisen. Im Folgenden bezeichnen wir mit W den Vektorraum L2 (R2 , a−2 da db) aller Funktionen f (a,b), für die
12.2 Wavelets
391 +∞ ˆ +∞ ˆ |f (a,b)|2 a−2 da db < ∞
−∞ −∞
gilt. W ist ein Hilbertraum mit dem inneren Produkt hf |giW
+∞ ˆ +∞ ˆ = f (a,b)g(a,b)a−2 da db . −∞ −∞
Aus der Parsevalgleichung und aus der „Frequenzdarstellung“ der Wavelettransformierten (S. 389) folgt für f und g aus L2 (R) und ein Wavelet ψ mit Vertauschung der Integrationsreihenfolge die Orthogonalitätsrelation hWψ f |Wψ giW = Cψ hf |gi. −1/2
Dabei ist Cψ die Konstante in der Zulässigkeitsbedingung für ψ. Insbesondere ist Cψ Wψ eine normerhaltende lineare Abbildung von L2 (R) nach W , die eine normerhaltende Um−1/2 −1/2 kehrabbildung besitzt. Wegen Cψ kWψ f kW = kf k lässt sich Cψ Wψ f als Energiedichte des Signals f in der (a,b)-Ebene interpretieren. kf k ist die Norm von f in L2 (R). 2 1 e−(s−t) /(4α) , gα,t (s) → δ(s − t) für α → 0+ (vgl. S. 151) folgt Mit gα,t (s) = √ 2 πα für stetige Wavelets ψ und stetige Signale f Cψ−1 hWψ f |Wψ gα,t iW = hf |gα,t i −→ f (t). α→0+
t−b für α → 0+. Zusammengefasst erhält a man folgende Aussagen über die Wavelet-Rücktransformation: Andererseits gilt Wψ gα,t (a,b) → |a|−1/2 ψ
Umkehrformel. 1. Für ein Wavelet ψ ist die Wavelettransformation Wψ eine stetige, stetig umkehrbare Abbildung von L2 (R) nach W = L2 (R2 , a−2 da db) mit 1/2
kWψ f kW = Cψ kf k. 2. Für stetige Signale f ∈ L2 (R) und stetige Wavelets ψ gilt an jeder Stelle t f (t) =
Cψ−1
+∞ ˆ +∞ ˆ t − b da db −1/2 . Wψ f (a,b)|a| ψ a a2
−∞ −∞
Analog zu den Umkehrformeln der klassischen Fouriertransformation und der gefensterten Fouriertransformation ist hier f mit der Wavelettransformation als eine Superposition der „Bausteine“ ψa,b mit den „Amplituden“ hf |ψa,b i = Wψ f (a,b) dargestellt. Mathematische Anwendungen findet die kontinuierliche Wavelettransformation zum Beispiel beim Studium lokaler und globaler Regularitätseigenschaften von Funktionen (man vgl. dazu etwa M. Holschneider (1999)).
392
12 Ausblicke auf weiterführende Konzepte
Diskrete Wavelettransformation und Multiskalen-Analyse In numerischen Anwendungen lassen sich Werte Wψ f (a,b) der Wavelettransformierten eines Signals f meist nur für Parameterwerte (a,b) aus einer abzählbaren, diskreten Menge S berechnen. Es stellt sich dann die Frage, unter welchen Bedingungen an das Wavelet ψ und an die Menge S der Abtaststellen eine stabile Rekonstruktion des Signals f aus den Werten Wψ f (a,b) = hf |ψa,b i, (a,b) ∈ S, seiner Wavelettransformierten möglich ist. Stabilität bedeutet dabei, dass kleine Störungen in den Koeffizienten hf |ψa,b i auch nur kleine Abweichungen von f bei der Rekonstruktion zur Folge haben. Dies ist genau dann der Fall, wenn die Abbildung f 7→ (hf |ψa,b i)(a,b)∈S von L2 (R) nach l2 (S) (vgl. S. 383) umkehrbar und stetig in beiden Richtungen ist, d.h. wenn es Konstanten A > 0 und B > 0 gibt, so dass für alle f ∈ L2 (R) folgende Ungleichung gilt: X 2 |hf |ψa,b i| ≤ B kf k2 . A kf k2 ≤ (a,b)∈S
Stabilität liegt wegen der Parsevalgleichung immer vor, wenn die Familie ψa,b , (a,b) ∈ S, ein vollständiges Orthonormalsystem in L2 (R) ist. Wir beschränken unsere Darstellung im Folgenden auf solche Systeme. Reihenentwicklungen nach vollständigen Orthonormalsystemen ermöglichen dann stabile diskrete Rekonstruktionsformeln. Ein erstes Beispiel einer diskreten Rekonstruktion ergibt sich mit dem Haar-Wavelet ψ (vgl. S. 390). Die Funktionen ψn,k (t) = 2n/2 ψ(2n t − k)
(n, k ∈ Z)
bilden ein vollständiges Orthonormalsystem in L2 (R). Jedes Signal f ∈ L2 (R) hat daher die diskrete Waveletzerlegung f=
+∞ X
+∞ X
n=−∞ k=−∞
hf |ψn,k iψn,k .
(12.1)
Die diskrete Menge S ist dabei die Menge der Paare (2−n ,2−n k) mit n und k aus Z. Von derselben Form sind Reihendarstellungen, die man mit anderen Wavelets ψ erhält, wenn geeignet skalierte Translate ψn,k von ψ mit n, k ∈ Z wieder ein vollständiges Orthonormalsystem in L2 (R) ergeben. Für die unmittelbare Anwendung der Reihenentwicklung müssten die Integrale hf |ψn,ki berechnet werden. In den Jahren 1986-1989 wurde von S. Mallat und Y. Meyer jedoch eine neue Methode entwickelt, die es gestattet, diskrete Waveletentwicklungen vollständig rekursiv durchzuführen. Diese für Berechnungen ideale Methode ist die MultiskalenAnalyse. Die Algorithmen der schnellen Wavelettransformation, die aus der MultiskalenAnalyse hervorgehen, und ihre Anwendungen in der Signalverarbeitung, zum Beispiel bei der Datenkompression, haben die Wavelet-Analysis innerhalb kurzer Zeit zu einem wichtigen mathematischen Werkzeug in den technischen Disziplinen gemacht. Wir schildern nun die Multiskalen-Analyse, auch Multiresolutionsanalyse genannt, mit dem Haar-Wavelet und geben danach Resultate an, die zeigen, dass die exemplarisch erläuterten Algorithmen auch für andere, geeignet konstruierte Wavelets gelten.
12.2 Wavelets
393
Multiskalen-Analyse mit dem Haar-Wavelet Das Verständnis der Multiskalen-Analyse und der daraus resultierenden schnellen WaveletAlgorithmen bedarf einiger vorbereitender Überlegungen über die Struktur der von den Wavelets erzeugten Vektorräume und über die Struktur des Wavelets selbst. Bis auf weiteres beziehen sich alle Überlegungen auf das Haar-Wavelet für 0 ≤ t < 1/2 1 ψ(t) = −1 für 1/2 ≤ t < 1 0 sonst. Die durch die Haar-Wavelets erzeugten Vektorräume von Treppenfunktionen
Entscheidend für die diskrete Waveletanalyse sind die Eigenschaften der von den Wavelets ψn,k erzeugten Teilräume in L2 (R). Für jedes feste n ∈ Z bilden die Funktionen ψn,k , k ∈ Z, des Haar-Systems ein vollständiges Orthonormalsystem eines abgeschlossenen Teilraumes Wn von L2 (R). Je zwei Teilräume Wn und Wm sind für n 6= m zueinander orthogonal, und alle Vektorräume Wn , n ∈ Z, zusammen spannen L2 (R) auf (vgl. (12.1)). Man sagt, L2 (R) ist die direkte Summe der Wn : L2 (R) =
+∞ M
Wn ,
n=−∞ +∞ X d.h. jedes f ∈ L2 (R) hat genau eine Darstellung f = fn mit fn ∈ Wn . Nach (12.1) +∞ n=−∞ X ist fn = hf |ψn,k iψn,k . Für jedes n ∈ Z bildet man nun den Vektorraum k=−∞
Vn =
n−1 M
l=−∞
Wl = . . . ⊕ Wn−3 ⊕ Wn−2 ⊕ Wn−1 .
Die Elemente vn ∈ Vn haben dann die Form vn =
n−1 X
+∞ X
l=−∞ k=−∞
hvn |ψl,k iψl,k .
Aus der Gestalt des Wavelets ψ folgt, dass die Elemente von Vn Treppenfunktionen sind, die auf den Intervallen [2−n k,2−n (k + 1)[, k ∈ Z, konstant sind. Anschaulich gesprochen haben also ihre „kleinsten Details“ die Breite 2−n : Vn = {f ∈ L2 (R) | f konstant auf [2−n k,2−n (k + 1)[ , k ∈ Z} . Im Folgenden bezeichnen nun ϕ = 1[0,1[ die charakteristische Funktion des Einheitsintervalls und ϕn,k , n und k aus Z, ihre normierten skalierten Verschiebungen ϕn,k (t) = 2n/2 ϕ(2n t − k).
394
12 Ausblicke auf weiterführende Konzepte
Weil jede Treppenfunktion vn ∈ Vn als Summe ihrer einzelnen Stufen gelesen werden kann, lässt sich vn auch durch folgende Reihe darstellen: vn =
+∞ X
k=−∞
(12.2)
hvn |ϕn,k iϕn,k .
Anders gesagt: Die Funktionen ϕn,k , k ∈ Z, bilden ein vollständiges Orthonormalsystem in Vn . Die Orthogonalitätsbedingung hϕn,k |ϕn,k′ i = 0 für k 6= k ′ ist erfüllt, weil die Träger von ϕn,k und ϕn,k′ höchstens gemeinsame Randpunkte besitzen. +∞ n−1 M M Jedes Signal f ∈ L2 (R) kann nun wegen L2 (R) = Wn und Vn = Wl mit n=−∞
l=−∞
einem beliebigen M ∈ Z in seine Orthogonalprojektion PM f aus VM und eine eindeutig bestimmte Funktion QM f aus dem orthogonalen Komplement von VM in L2 (R) zerlegt werden: f = PM f + QM f, +∞ +∞ X +∞ X X f = hf |ϕM,k iϕM,k + hf |ψl,k iψl,k . k=−∞
(12.3)
l=M k=−∞
Die erste Reihe in dieser Entwicklung stellt die Projektion PM f dar (vgl. S. 384) und ist eine grobe Approximation von f durch eine Treppenfunktion mit minimaler Stufenbreite +∞ X 2−M . Die Reihen hf |ψl,k iψl,k sind für l = M,M + 1, . . . Funktionen aus Wl und k=−∞
fügen immer feinere Details zu PM f , jeweils auf der Skala 2−l , hinzu. Die Projektion PM f zeigt den über die Intervalle [2−M k,2−M (k + 1)[, k ∈ Z, gemittelten Verlauf von f . Für M → −∞ werden diese Intervalle immer breiter, die Projektionen PM f immer weniger detailliert. Für M → +∞ bleiben umgekehrt immer feinere Details von f in den Projektionen PM f erhalten. Man erkennt die hervorragende Zeit-Lokalisation der Wavelet-Darstellung (12.3), weil sowohl die Träger der Funktionen ϕM,k für genügend großes M als auch die Träger der Haar-Wavelets ψl,k , l ≥ M und k ∈ Z, nur kleine Intervalle sind. Verschwindet f in einem Intervall I, dann sind die Koeffizienten derjenigen Funktionen ϕM,k und ψl,k Null, die ihre Träger in I haben. In der Praxis bedeutet dies, dass von kurzzeitigen Störungen eines Signals f nur wenige Koeffizienten in (12.3) beeinflusst werden, während solche Störungen bei klassischer Fourier-Analyse in der Regel das gesamte Spektrum verändern (vgl. 4.5 und 9.4). Wir fassen zusammen: Die Vektorräume Vn haben folgende Eigenschaften: (E1) Vn ⊂ Vn+1 für alle n ∈ Z:
. . . V−2 ⊂ V−1 ⊂ V0 ⊂ V1 ⊂ . . .
(E2) Die Vereinigung aller Vn ist dicht in L2 (R), d.h. jedes f ∈ L2 (R) kann beliebig gut durch seine Orthogonalprojektionen Pn f auf Vn , n ∈ Z, in der Norm von L2 (R) approximiert werden: lim kf − Pn f k = 0. n→∞
12.2 Wavelets
395
(E3) Der Durchschnitt aller Vn ist der Nullraum:
+∞ \
n=−∞
(E4) Für alle n ∈ Z gilt Vn+1 = Vn ⊕ Wn .
Vn = {0}.
(E5) Für alle n ∈ Z gilt: f (t) ∈ Vn genau dann, wenn f (2t) ∈ Vn+1 . (E6) Für jedes n ∈ Z bilden die Funktionen ϕn,k (t) = 2n/2 ϕ(2n t − k)
(k ∈ Z)
ein vollständiges Orthonormalsystem von Vn . Im Gegensatz zu den paarweise orthogonalen Räumen Wn sind die Räume Vn ineinandergebettet wie in (E1) beschrieben. (E2) ist ein Ergebnis der Integrationstheorie (vgl. Anhang B). (E3) bedeutet, dass mit fallenden n ∈ Z die Energie der Signalprojektionen Pn f auf Vn immer kleiner wird: lim kPn f k = 0 für f ∈ L2 (R). n→−∞
Multiskalen-Analyse von Treppenfunktionen über der Skala der Vektorräume Vn Wir betrachten nun ein Signal f , das für ein geeignetes M ∈ Z eine Treppenfunktion aus (M) einem der Räume VM ist. Die Funktion f besitze die Koeffizienten fk : f=
+∞ X
(M)
fk
ϕM,k .
k=−∞
Aus praktischer Sicht sei f eine hinreichend gute Näherung für ein beobachtetes Signal S, (M) dessen Mittelwerte mk = 2M/2 fk über die Intervalle [2−M k,2−M (k + 1)[ für k ∈ Z be2 kannt seien. Jedes Signal S ∈ L (R) lässt sich mit genügend groß gewähltem M beliebig gut durch eine solche Treppenfunktion approximieren (vgl. (E2) oben). Die Signalverar(M) beitung erstreckt sich dann auf die Koeffizienten fk der Näherungsfunktion f . −M Die minimale Stufenbreite von f sei also 2 . Nach (E4) in den vorangehenden Überlegungen kann f eindeutig zerlegt werden in f = vM−1 + wM−1 mit vM−1 ∈ VM−1 und wM−1 ∈ WM−1 . Die Treppenfunktion vM−1 hat die minimale Stufenbreite 2−M+1 und damit in der Regel einen gröberen, weniger detaillierten Verlauf als f . Die feineren Variationen von f , die bei der Orthogonalprojektion von f auf vM−1 verloren gehen, werden als „Differenzinformation“ ergänzend in wM−1 = f − vM−1 festgehalten. Die minimale Treppenbreite von wM−1 stimmt mit der von f überein. Man vergleiche hierzu das anschließende Beispiel. Durch eine entsprechende Zerlegung von vM−1 in der Form vM−1 = vM−2 + wM−2 mit vM−2 ∈ VM−2 und wM−2 ∈ WM−2 , also f = vM−2 + wM−2 + wM−1 ,
396
12 Ausblicke auf weiterführende Konzepte
erhält man die Information über den Verlauf von f aus der im Vergleich zu vM−1 wieder weniger variierenden Funktion vM−2 und den Funktionen wM−1 und wM−2 , in denen ergänzend die feineren Details von f und vM−1 enthalten sind. Dieser Prozess lässt sich fortführen und ergibt, wie wir sehen werden, unter Verwendung der Eigenschaft (E5) einen effektiven Algorithmus zur Darstellung des Signals f durch Information über seinen groben Verlauf anhand einer Projektion vM−N ∈ VM−N und über seine Feinstruktur anhand der Funktionen wM−1 , . . . ,wM−N ,N > 0: (12.4)
f = vM−N + wM−1 + wM−2 + . . . + wM−N .
Die rechte Seite ist eine Aufspaltung von f in Anteile jeweils verschiedener Detailgröße. Die Detailgrößen von vM−N , wM−1 , . . . ,wM−N sind bestimmt durch die unterschiedlichen Werte des Skalenparameters 2−p in den Wavelets ψp,k mit p = M − N, . . . ,M − 1, k ∈ Z. Man nennt deshalb die Zerlegung eine Multiskalen-Analyse des Signals f . Die grundlegende Aufgabe bei der numerischen Verarbeitung des zerlegten Signals ist dann die effektive Berechnung der Koeffizienten in den Reihenentwicklungen der Funktionen vM−N , wM−1 , . . . ,wM−N . Möglichkeiten zur Datenkompression in der Signalverarbeitung ergeben sich, wenn viele dieser Koeffizienten so klein sind, dass sie ohne merklichen Qualitätsverlust in der Rekonstruktion durch Null ersetzt werden können. Beispiel. 1
v−1 ∈ V−1
1/2 2
0 | {z 1 }2
v0 = v−1 + w−1 v0 ∈ V0
1
3
2−1/2 ϕ−1,0
5 }6 4 | {z
| {z }
21/2 ϕ−1,1
1 0
1
2
3
4
5
6
t
2−1/2 ϕ−1,2
t
w−1 ∈ W−1
1/2 0
1
3
2
4
5
6
t
−1/2 −1 | {z }
−2−1/2 ψ−1,0
| {z }
2−1/2 ψ−1,2
| {z }
21/2 ψ−1,1
Die Funktion v0 ∈ V0 zeigt Details der Treppenbreite 1, die Funktion v−1 zeigt nur noch gröbere Details der Treppenbreite 2. Beide Funktionen sind mit den Stufenfunktionen ϕ0,k und ϕ−1,k zu beschreiben durch v0 =
5 X
k=0
hv0 |ϕ0,k iϕ0,k
und v−1 =
2 X
hv0 |ϕ−1,k iϕ−1,k .
k=0
12.2 Wavelets
397
v−1 ist eine über die Intervalle [0,2[, [2,4[ und [4,6[ gemittelte Version von v0 . Die Funktion w−1 enthält die ergänzende Information über Details von v0 mit der Treppenbreite 1 und wird mit dem Haar-Wavelet dargestellt durch w−1 =
2 X
hv0 |ψ−1,k iψ−1,k .
k=0
Die Information über v0 ist in den 6 Koeffizienten hv0 |ϕ0,k i, k = 0, . . . 5, oder alternativ in den zusammen ebenfalls 6 Koeffizienten von v−1 und w−1 enthalten. Skalierungsfunktion und Skalierungsgleichung der Multiskalen-Analyse Das Geheimnis der Multiskalen-Analyse und resultierender schneller Algorithmen liegt in der Beobachtung, dass nicht nur die Räume Wn , n ∈ Z, durch eine einzige Funktion erzeugt werden können, nämlich mit dem Haar-Wavelet und den daraus hervorgehenden Basisfunktionen ψn,k , sondern dass auch die Skala der Räume Vn durch eine einzige Funktion ϕ erzeugt wird, und dass das Wavelet ψ durch diese Funktion ϕ bestimmt ist. Die Funktion ϕ ist die charakteristische Funktion ϕ = 1[0,1[ des Einheitsintervalls. Ihre skalierten Translate ϕn,k , k ∈ Z, spannen nach (E6) die Vektorräume Vn auf. Man nennt ϕ die Skalierungsfunktion oder auch Vaterfunktion für das Wavelet ψ. Das Wavelet ψ wird Mutter-Wavelet der Haarschen Multiskalen-Analyse genannt. Da sowohl ϕ als auch das Wavelet ψ zu V1 gehören und V1 von den Funktionen ϕ1,k (t) = 21/2 ϕ(2t − k) erzeugt wird, gelten folgende Gleichungen: +∞ √ X hk ϕ(2t − k) ϕ(t) = 2
(12.5)
k=−∞
und
+∞ √ X gk ϕ(2t − k) ψ(t) = 2
(12.6)
k=−∞
mit geeigneten Koeffizienten hk und gk , k ∈ Z. Die Gleichung (12.5) heißt die Skalierungsgleichung der Multiskalen-Analyse für die Skalierungsfunktion ϕ. Nach Gleichung (12.6) ist das Mutter-Wavelet ψ durch die Funktion ϕ bestimmt. In unserem Beispiel mit dem Haar-Wavelet sind h0 = h1 = 2−1/2 , hk = 0 sonst. Mit den Koeffizienten gk besteht die Beziehung: gk = (−1)k h1−k für k ∈ Z.
(12.7)
Mit Blick auf andere Beispiele notieren wir in (12.5) und (12.6) Reihen statt endlicher Summen und rechnen wie gewohnt in C, weil später im Allgemeinen auch komplexwertige Funktionen und Wavelets zugelassen werden. Die Gleichungen (12.5) bis (12.7) sind der Schlüssel zu schnellen Algorithmen, mit denen die Koeffizienten in Multiskalen-Zerlegungen von Signalen f berechnet werden können. Sie sind auch der Ausgangspunkt für Multiskalen-Analysen mit anderen Skalierungsfunktionen ϕ und Wavelets ψ, die nach (12.6) und (12.7) aus ϕ konstruiert werden können (Satz von S. Mallat, S. 400).
398
12 Ausblicke auf weiterführende Konzepte
Mit den Gleichungen (12.5) bis (12.7) erhalten wir nun die Algorithmen der schnellen Wavelettransformation zur Berechnung der Koeffizienten in der Waveletzerlegung (12.4) unserer Treppenfunktion f ∈ VM und ebenso zur Rekonstruktion von f aus diesen Koeffizienten. Schnelle Wavelettransformation mit dem Haar-Wavelet (M)
Gegeben seien die Koeffizienten fk
eines Signals f =
+∞ X
(M)
fk
ϕM,k aus VM . Zur
k=−∞
Berechnung der Koeffzienten in der Waveletzerlegung (12.4) von S. 396 f = vM−N + wM−1 + wM−2 + . . . + wM−N bezeichnen wir die Koeffizienten einer Projektion PM−l f = vM−l , 1 ≤ l ≤ N , mit (M−l) (M−l) fk , diejenigen der Funktionen wM−l mit dk . Die Koeffizienten hk und gk sind durch (12.5) bis (12.7) gegeben. (M−N ) (M−l) Die gesuchten Koeffizienten fk und dk lassen sich nun ohne Integrationen vollständig rekursiv berechnen. Die Algorithmen der schnellen Wavelettransformation nach S. Mallat (1989) lauten wie folgt: Zerlegungsalgorithmus von Mallat. Für l = 1, . . . ,N und k ∈ Z gelten (M−l)
fk
=
+∞ X
(M−l+1) hm−2k , fm
(12.8)
(M−l+1) gm−2k fm
(12.9)
m=−∞ (M−l)
dk
=
+∞ X
m=−∞ (M)
fk
(M−1)
fk
(M−2)
(M−1)
dk
fk
...
(M−N )
fk ...
(M−2)
dk
(M−N )
dk
(M)
Analog erhält man einen Algorithmus zur Rekonstruktion der Koeffizienten fk (M−N ) (M−1) (M−2) (M−N ) aus den Koeffizienten fk und dk , dk , . . . ,dk .
von f
Rekonstruktionsalgorithmus von Mallat. Für l = N,N − 1, . . . ,1 und k ∈ Z gilt (M−l+1)
fk
=
+∞ h i X (M−l) (M−l) fm hk−2m + dm gk−2m .
(12.10)
m=−∞ (M−N )
fk
(M−N )
dk
fk
dk
(M−N +1)
fk
(M−N +2)
(M−N +1)
dk
(M−N +2)
...
... (M−1)
dk
(M)
fk
12.2 Wavelets
399
Beweisskizze: Den Beweis der Algorithmen (12.8) und (12.9) führt man mit vollständiger Induktion. Wir zeigen zur Demonstration nur den Induktionsbeginn für (12.8). Alle anderen Beweisschritte für (12.8) und (12.9) verlaufen analog. +∞ √ ˆ ϕ(t)ϕ(2t − k) dt Für l = 1 und k ∈ Z gilt wegen hk = 2 X +∞ −∞ (M−1) (M) fk = hf |ϕM−1,k i = fm ϕM,m | ϕM−1,k m=−∞
+∞ X
=
(M) fm
m=−∞ +∞ X
=
−∞ (M) fm
m=−∞
=
+∞ X
+∞ ˆ 2M/2 ϕ(2M t − m)2(M−1)/2 ϕ(2M−1 t − k) dt
+∞ ˆ √
−∞
2ϕ(2x − (m − 2k))ϕ(x) dx
(M) fm hm−2k .
m=−∞
Zum Beweis von (12.10) betrachten wir den Fall l = N und vM−N +1 =
+∞ X
(M−N +1)
fk
ϕM−N +1,k .
k=−∞
Aus den (12.5) und (12.6) entsprechenden Skalierungsgleichungen für ϕ(2M−N t−m) und ψ(2M−N t − m) folgt mit kurzer Rechnung vM−N +1 = vM−N + wM−N +∞ i h X (M−N ) ) M−N ϕ(2M−N t − m)+d(M−N ψ(2 t − m) = 2(M−N )/2 fm m m=−∞
=
+∞ X
+∞ h X
k=−∞ m=−∞
i (M−N ) ) fm hk−2m + d(M−N gk−2m ϕM−N +1,k . m
Koeffizientenvergleich ergibt (12.10) für l = N , analog durchgeführte vollständige Induktion den Rekonstruktionsalgorithmus. Multiskalen-Analyse mit anderen Wavelets Die Wavelet-Analyse mit dem Haar-Wavelet hat den Nachteil, dass die Haar-Funktionen unstetig sind. Daher ist jede endliche Partialsumme der Entwicklungen (12.1) oder (12.3) unstetig, wie glatt das approximierte beobachtete Signal auch sein mag. Ein weiterer Nachteil ist die schlechte Frequenzlokalisation des Haar-Wavelets. Seine Fouriertransformierte fällt für |ω| → ∞ nur wie 1/|ω|. Der Durchbruch der Wavelet-Theorie in den Anwendungen gelang, als man zeigen konnte, dass auch mit anderen, geeignet konstruierten Wavelets
400
12 Ausblicke auf weiterführende Konzepte
eine Multiskalen-Analyse möglich ist. Wir fassen einige wichtige Ergebnisse zusammen. Im Folgenden ist L2 (R) der Vektorraum der komplexwertigen, quadratisch integrierbaren Funktionen auf R. Definition. Eine Funktion ϕ ist eine Skalierungsfunktion einer Multiskalen-Analyse, wenn sie eine Folge (Vn )n∈Z abgeschlossener Teilräume in L2 (R) mit den Eigenschaften (E1) bis (E6) von Seite 394 erzeugt. Die Folge der Teilräume Vn wird die zu ϕ gehörige MultiskalenAnalyse genannt. Bezeichnet Wn das orthogonale Komplement von Vn in Vn+1 , dann gilt folgender entscheidende Satz von S. Mallat (1989): Satz von Mallat. Zu jeder Multiskalen-Analyse (Vn )n∈Z mit Skalierungsfunktion ϕ(t) =
+∞ √ X hk ϕ(2t − k) 2 k=−∞
gibt es ein Wavelet ψ, so dass ψ(t) =
+∞ √ X gk ϕ(2t − k) mit gk = (−1)k h1−k ist. 2 k=−∞
Für jedes n ∈ Z bilden die Funktionen ϕn,k (t) = 2n/2 ϕ(2n t − k), k ∈ Z, ein vollständiges Orthonormalsystem in Vn , die Funktionen ψn,k (t) = 2n/2 ψ(2n t − k), k ∈ Z, ein vollständiges Orthonormalsystem in Wn . Für jedes n ∈ Z ist die Menge ϕn,k , ψm,k | k ∈ Z,m ≥ n
ein vollständiges Orthonormalsystem in L2 (R). Mit den gleichen Beweisen wie im erläuterten Beispiel folgen die Algorithmen (12.8) bis (12.10) der schnellen Wavelettransformation auch allgemein für jede Multiskalen-Analyse mit Skalierungsfunktion ϕ aus den Gleichungen (12.5) bis (12.7). Hat die Koeffizientenfolge hk , k ∈ Z, der Skalierungsfunktion ϕ eine endliche Länge, dann sind (12.8) bis (12.10) nicht-rekursive Filter (vgl. S. 92), auch FIR-Filter (Finite Impulse Response Filter) genannt. Andernfalls sind (12.8) bis (12.10) IIR-Filter (Infinite Impulse Response Filter). In der Elektrotechnik werden die Algorithmen auch als „Subband Filtering Schemes“ bezeichnet (vgl. I. Daubechies (1992)). Die Schwierigkeiten von Multiskalen-Analysen liegen in der konkreten Konstruktion von ϕ, ψ und der Filterfolge hk , k ∈ Z. Neben der bereits zitierten Literatur sei hierzu auf den Übersichtsartikel „How To Make Wavelets“ von R. Strichartz (1993) verwiesen. Daubechies-Wavelets. Es gibt verschiedene bekannte stetige Skalierungsfunktionen, die zu einer Multiskalen-Analyse führen. 1988 gelang I. Daubechies die Konstruktion einer Familie von Multiskalen-Analysen mit stetigen Skalierungsfunktionen und Wavelets ψm , m > 0, die beschränkte Träger und Filterfolgen (hk )k∈Z endlicher Länge besitzen. Die Trägereigenschaften ermöglichen eine gute Zeit- bzw. Orts-Lokalisation. Die Approximations-, Regularitäts- und Lokalisationseigenschaften der zugehörigen Waveletzerlegungen hängen von der mit m wachsenden Filterlänge der jeweils verwendeten Daubechies-Wavelets ψm
12.2 Wavelets
401
ab. Die Wavelets ψm lassen sich nicht explizit angeben, sondern sind algorithmisch definiert. Die zugehörigen Koeffizienten hk kann man tabellieren. Solche Tabellen findet man bei I. Daubechies (1992). Die folgende Abbildung zeigt das Daubechies-Wavelet mit Filterlänge 4, zu finden bei I. Daubechies (1992) unter der Bezeichnung 2 Ψ auf Seite 197.
1.5 1.0 0.5 0.0 - 0.5 - 1.0 -3
-2
-1
0
1
2
3 (M)
4 (M)
Für Signale der Länge n (d.h. in (12.8) gilt n = max{k|fk 6= 0} − min{k|fk 6= 0}) hat die schnelle Wavelettransformation bei endlicher Filterlänge und einer Zerlegungstiefe N ≪ n einen Aufwand, der nur linear mit der Signallänge wächst und damit günstiger als der Aufwand für die schnelle Fouriertransformation ist (vgl. S. 96). Es gibt Weiterentwicklungen der Multiskalen-Analyse, in denen statt einer Waveletbasis {ψn,k |n,k ∈ Z} in L2 (R) zwei sogenannte „biorthogonale“ Basen {ψn,k |n,k ∈ Z} und {ψg n,k |n,k ∈ Z} verwendet werden. Das Beispiel am Ende des Abschnitts, das die Leistungsfähigkeit von Wavelets in der Datenkompression demonstrieren soll, wurde mit solchen biorthogonalen Waveletbasen verarbeitet. Eine detaillierte Darstellung der Theorie von „Biorthogonalzerlegungen“ findet man bei A. Cohen, I. Daubechies, J. Faveau (1992). Anwendungsgebiete Signalkompression Einer der bekanntesten Anwendungsbereiche für die diskrete Wavelettransformation ist die Signalkompression. Ein Signal f ∈ L2 (R) wird dabei repräsentiert durch endlich viele Koeffizienten einer Näherung vM im Raum VM einer Multiskalen-Analyse. Ist f glatt und vM = vM−N + wM−1 + . . .+ wM−N die Waveletzerlegung seiner Näherung vM (N > 0), dann fallen die Koeffizienten der Waveletentwicklungen wM−n für wachsendes n ab. Die Koeffizienten von vM−N , wM−1 , . . . ,wM−N werden quantisiert, d.h. man unterteilt ihren Wertebereich in Intervalle und rundet alle Koeffizienten, die im gleichen Intervall liegen, auf denselben Wert. Hinreichend kleine Werte, oft alle Koeffizienten ab einer gewissen „Detailstufe“ wM−N +l , 0 ≤ l ≤ N − 1 geeignet, können dann häufig ohne gravierenden Detailverlust bei der Rekonstruktion von vM durch Null ersetzt werden. Die eigentliche Datenkompression ergibt sich durch solche Quantisierungen und eine effektive Codierung der quantisierten Daten. Der am Ende von Kapitel 5 bereits erwähnte JPEG2000-Standard zur Bilddatenkompression verwendet solche Waveletverfahren.
402
12 Ausblicke auf weiterführende Konzepte
Bilddatenverarbeitung, zweidimensionale Multiskalen-Analyse In der Bilddatenverarbeitung wird eine Multiskalen-Analyse von Signalen f ∈ L2 (R2 ), die von zwei Ortsvariablen abhängen, benötigt. Vollständige Orthonormalsysteme in L2 (R2 ) lassen sich mit Hilfe von Tensorwavelets konstruieren. Wir fassen die wesentlichen Aussagen zusammen. Mehr Details findet man bei I. Daubechies (1992) oder Y. Meyer (1995). 1. Aus einer Multiskalen-Analyse (Vn )n∈Z mit Skalierungsfunktion ϕ und Mutterwavelet ψ entsteht aus den Tensorprodukten Ψ(h) (x,y) = ϕ(x)ψ(y),
Ψ(v) (x,y) = ψ(x)ϕ(y),
Ψ(d) (x,y) = ψ(x)ψ(y)
(q)
ein vollständiges Orthonormalsystem Ψn,k1 ,k2 von L2 (R2 ). (q)
Die Funktionen Ψn,k1 ,k2 sind für n, k1 , k2 ∈ Z, q ∈ {h,v,d} definiert durch (q)
Ψn,k1 ,k2 (x,y) = 2n Ψ(q) (2n x − k1 ,2n y − k2 ). 2. Für jedes n ∈ Z erzeugen die Linearkombinationen der Tensorprodukte (vgl. S. 158) b n f ⊗ g(x,y) = f (x)g(y), f und g aus Vn , den abgeschlossenen Teilraum Vn = Vn ⊗V 2 2 2 2 von L (R ). Die Folge (Vn )n∈Z ist eine Multiskalen-Analyse für L (R ): Die Eigenschaften (E1) - (E4) von S. 394 gelten analog, wenn Wn wie dort das orthogonale Komplement von Vn in Vn+1 ist. Wie in (E5) ist eine Funktion f (x,y) ∈ Vn genau dann, wenn f (2x,2y) ∈ Vn+1 . Analog zu (E6) bilden nun die Tensorprodukte Φn,k1 ,k2 (x,y) = 2n ϕ(2n x − k1 )ϕ(2n y − k2 ) für (k1 ,k2 ) ∈ Z2 ein vollständiges Orthonormalsystem von Vn . (q)
3. Entsprechend wird Wn vom Orthonormalsystem der Funktionen Ψn,k1 ,k2 erzeugt (mit (k1 ,k2 ) ∈ Z2 , q ∈ {h,v,d}), und L2 (R2 ) ist die direkte Summe der Räume Wn , n ∈ Z. Aufgrund der Konstruktion der Räume Vn aus Tensorprodukten gilt für alle n∈Z b n ) ⊕ (Wn ⊗V b n ) ⊕ (Wn ⊗W b n ). Wn = (Vn ⊗W (q)
b n , diejeDie Basisfunktionen Ψn,k1 ,k2 mit q = h erzeugen dabei den Anteil Vn ⊗W b nigen zu q = v erzeugen Wn ⊗Vn , die zum Index q = d schließlich den Teilraum b n (h steht für „horizontal“, v für „vertikal“, d für „diagonal“). Wn ⊗W
4. Die Algorithmen von Mallat lassen sich auf den mehrdimensionalen Fall erweitern.
In der Anwendung sind Bilddaten (Grauwerte von Pixeln) in einer Matrix C (0) gespeichert. (0) Die Koeffizienten ck1 ,k2 von C (0) entsprechen den Koeffizienten hf (0) |Φ0,k1 ,k2 i eines SiX hf (0) |Φ0,k1 ,k2 iΦ0,k1 ,k2 aus dem Raum V0 einer Multiskalen-Analyse gnals f (0) = k1 ,k2
von L2 (R2 ). Im ersten Schritt einer Multiskalenzerlegung
f (0) = f (−1) + w(−1,h) + w(−1,v) + w(−1,d)
12.2 Wavelets
403
b −1 , w(−1,v) ∈ W−1 ⊗V b −1 , w(−1,d) ∈ W−1 ⊗W b −1 , mit f (−1) ∈ V−1 , w(−1,h) ∈ V−1 ⊗W (−1) (0) ist dann f eine vergröberte Version von f , während die ergänzenden feineren Details von f (0) in horizontaler Richtung (x-Richtung) in w(−1,h) , die in vertikaler Richtung in w(−1,v) , und diejenigen in diagonaler Richtung in w(−1,d) festgehalten sind. Ist die Ausgangsmatrix C (0) eine 2N ×2N -Matrix, dann haben die zugehörigen Koeffizientenmatrizen (h) C (−1) = hf (0) |Φ−1,k1′ ,k2′ i , D(−1,h) = hf (0) |Ψ−1,k′ ,k′ i , 1
2
entsprechend auch D(−1,v) und D(−1,d) die Größe 2N −1 ×2N −1 . Wie im eindimensionalen Fall kann die Multiskalen-Analyse mit einer Zerlegung von f (−1) fortgesetzt werden. Schematisch dargestellt und nachfolgend konkret für eine nur 1-stufige Zerlegung eines Bildes von J. B. Fourier (vgl. S. 14) mit dem Haar-Wavelet erhält man:
C (−1)
D(−1,h)
(− C
(− D
C (0) D(−1,v)
D(−1,d)
2)
v) 2,
(− D
h) 2,
(− D
d) 2,
D(−1,v)
D(−1,h)
D(−1,d)
In der Praxis fallen die Koeffizienten der Funktionen f (−m) , w(−m,q) , m ≥ 1, q ∈ {h,v,d}, mit wachsendem Index m oft schnell ab. Geeignete Quantisierungs- und Codierungsverfahren führen dann zu hervorragenden Ergebnissen in der Bilddatenkompression. Je dunkler die Pixel im Beispiel oben sind, desto kleiner sind die zugehörigen Koeffizienten, schwarz entspricht Null. Das Computeralgebra-System Mathematica bietet zahlreiche bereits implementierte Algorithmen zur Wavelet-Analysis, mit denen interessierte Leser Erfahrungen sammeln und konkrete Aufgaben lösen können.
404
12 Ausblicke auf weiterführende Konzepte
Die folgenden Bilder zeigen zum Abschluss noch ein Datenkompressionsbeispiel, das ich der freundlichen Unterstützung der MeVis GmbH, Universität Bremen, verdanke. Die Bilddatenmatrix des ersten Bildes hat die Größe 2048×2048 (ca. 4.2 MB). Das zweite Bild zeigt das Ergebnis einer Datenkompression mit dem bisherigen JPEG-Verfahren. Die Ausgangsdaten wurden dabei auf ca. 14.5 KB komprimiert. Das dritte Bild zeigt die Rekonstruktion aus Wavelet-komprimierten Daten. Die Daten wurden mit biorthogonalen Wavelets (Cohen-Daubechies-Faveau 7/9 Tap-Filter) analysiert, quantisiert und so komprimiert, dass die Daten nach Quantisierung und Codierung ebenfalls ca. 14.5 KB einnahmen. Die verwendeten Codierungsalgorithmen entstammen den Arbeiten von J. Tian, R. O. Wells Jr. (1996). Analoge Wavelet-Algorithmen werden im neueren JPEG2000Standard verwendet.
Weitere Anwendungsgebiete Es gibt viele weitere Anwendungsgebiete der Wavelet-Analysis. EKG-Analyse, Mustererkennung und „Denoising“, Anwendungen bei der Regularisierung schlecht gestellter Inversenprobleme, etwa in der Computertomographie, Finite-Elemente-Methoden mit Wavelet-Ansätzen, Anwendungen beim Studium von Wellenausbreitungen, etwa von Radaroder Sonarwellen, sind nur einige Beispiele. Man findet sie in der bereits zu Beginn des Abschnitts zitierten Literatur.
405
A
Der Residuensatz und der Fundamentalsatz der Algebra
Der Residuensatz Wir folgen in diesem ersten Anhang der Darstellung des Residuensatzes bei K. Meyberg, P. Vachenauer (2001), Band 2, Kapitel 10. Eine Funktion f , die analytisch in einem Gebiet G \ {z0 } der komplexen Ebene sei, besitze für 0 < |z − z0 | < r die Laurentreihenentwicklung ∞ ∞ X X c−k ck (z − z0 )k . + f (z) = (z − z0 )k k=0
k=1
Dann folgt aus der Cauchy-Integralformel, dass die Koeffizienten ck für k ∈ Z gegeben sind durch ‰ f (z) 1 dz , ck = 2πj C (z − z0 )k+1
wobei C eine in G \ {z0 } verlaufende, geschlossene, stückweise stetig differenzierbare Kurve sei, die z0 einmal im positiven Sinn umläuft. ∞ X
c−k in der Laurentreihe von f im Kreisring (z − z0 )k k=1 0 < |z − z0 | < r heißt Hauptteil von f zum Entwicklungspunkt z0 . Der Koeffizient c−1 von 1 in der Laurentreihe von f heißt das Residuum von f in z0 , notiert durch z − z0 ‰ 1 Res(f,z0 ) = c−1 = f (z) dz , 2πj C
Definition. Der Anteil H(f,z0 ) =
mit einer wie oben beschriebenen geschlossenen Kurve C. Eine Verallgemeinerung dieses Zusammenhangs des Kurvenintegrals von f mit dem Residuum in einer Singularität von f ist der Residuensatz. Residuensatz. Eine Funktion f sei bis auf isolierte Singularitäten in einem Gebiet G ⊂ C analytisch. C sei eine geschlossene, stückweise stetig differenzierbare und positiv orientierte Kurve, die endlich viele Singularitäten z1 ,z2 , . . . ,zn einmal umläuft, ohne selbst durch eine Singularität zu gehen. Dann gilt: ‰
C
f (z) dz = 2πj
n X
k=1
Res(f,zk ).
406
A Der Residuensatz und der Fundamentalsatz der Algebra
Der Residuensatz findet vielfache Anwendungen bei der Berechnung reeller Integrale, bei Null- und Polstellen zählenden Integralen und etwa auch bei der Stabilitätsanalyse von Übertragungssystemen mit Rückkopplungen. Wir haben auf diesen Satz in Kapitel 10 bei der Berechnung von z-Transformationen Bezug genommen. Alle genannten Anwendungen findet man im schon genannten Lehrbuch von K. Meyberg, P. Vachenauer (2001). Beispiel zur Berechnung von Residuen. Das Residuum in einem m-fachen Pol z0 einer dm−1 1 (z − z0 )m f (z). Denn aus der Laurentlim Funktion f ist Res(f,z0 ) = (m − 1)! z→z0 dz m−1 reihe von f in einem Kreisring 0 < |z − z0 | < r entsteht (z − z0 )m f (z) = c−m + . . . + c−1 (z − z0 )m−1 + c0 (z − z0 )m + . . . . In dieser Taylorreihe steht der Koeffizient c−1 als Faktor bei (z − z0 )m−1 und ist damit durch die angegebene Formel eindeutig bestimmt. z Konkret ist etwa für f (z) = mit der doppelten Polstelle bei z = 1 das (z − 1)2 (z + 1) ′ 1 z = . Residuum Res(f,1) = lim z→1 z + 1 4
Analytische Funktionen und Fundamentalsatz der Algebra Eine grundlegende Rolle überall dort, wo mit Polynomen gearbeitet wird, hat der Fundamentalsatz der Algebra. Er besagt, dass jedes nicht-konstante Polynom mindestens eine komplexe Nullstelle besitzt. Es gibt eine Vielzahl verschiedener Beweise dieses Satzes, unterschiedlich in der Zugangsweise und mit unterschiedlichen Voraussetzungen an den Leser über zugrunde liegende mathematische Teilgebiete. Ein lesenwertes Buch dazu ist die Quelle B. Fine, G. Rosenberger (1997). Zunächst seien einige Sätze aus der Funktionentheorie über analytische Funktionen f : G → C, d.h. komplex differenzierbare Funktionen auf einem einfach zusammenhängenden Gebiet G in C zusammengefasst, deren Beweise man schnell in den schon zitierten Quellen finden kann. Eigenschaften analytischer Funktionen f : G → C
G sei ein einfach zusammenhängendes Gebiet in C, C eine stückweise glatte, einfach geschlossene Kurve in G mit positivem Umlaufsinn und f : G → C analytisch. 1. Es gilt der Cauchy-Integralsatz:
‰
f (z) dz = 0.
C
‰ n! f (ζ) 2. Es gelten die Cauchy-Integralformeln f (z) = dζ 2πj C (ζ − z)n+1 für alle z aus dem Inneren des von C umschlossenen Gebiets und n ∈ N0 . (n)
3. Für a ∈ G gilt die Taylor-Entwicklung f (z) =
∞ X f (n) (a) (z − a)n . n! n=0
A Der Residuensatz und der Fundamentalsatz der Algebra
407
Mit der Cauchy-Integralformel für f ′ folgt dann schnell der Satz von Liouville und damit ein üblicher Beweis des Fundamentalsatzes der Algebra. Satz von Liouville. Ist f auf C analytisch und beschränkt, dann ist f konstant. Beweis. Es gelte |f | ≤ M . Für z ∈ C und jeden einfach durchlaufenen Kreis C um z mit Radius r und positiver Umlaufrichtung gilt nach der Cauchy-Integralformel ‰ ˆ2π 1 |f (z + r ejt )| M 1 f (ζ) dζ dt ≤ . ≤ |f (z)| = 2πj C (ζ − z)2 2π r r ′
0
Mit r → ∞ folgt f ′ (z) = 0 für alle z ∈ C und damit die Behauptung.
Fundamentalsatz der Algebra. Jedes nicht-konstante Polynom P hat mindestens eine Nullstelle in C. Beweis. Sei P (z) 6= 0 für alle z ∈ C. Dann ist f = 1/P in C analytisch und es gilt lim |f (z)| = 0. Dann ist f beschränkt und nach dem Satz von Liouville konstant. Ein
|z|→∞
nicht-konstantes Polynom muss daher eine Nullstelle besitzen.
Durch Polynomdivision und Linearfaktorzerlegung erhält man daraus leicht die Aussage, dass ein Polynom vom Grad n ≥ 1 genau n Nullstellen in C besitzt, die nicht notwendig verschieden sein müssen. Einen Alternativbeweis des Fundamentalsatzes findet man bei H. Leinfelder (1983), der hier aufgeführt sei, weil er ähnlich dem Beweis von J.-R. Argand (1814) mit elementarer Analysis geführt werden kann. Man verwendet dazu als Hilfssatz. Für ein Polynom P (z) = z n + q(z) vom Grad n ≥ 1 mit q(z) =
n−1 X
ak z k gibt
k=0
es ein r > 0, so dass |P (z)| ≥ r für alle z ∈ C außerhalb der offenen Kreischeibe um Null mit Radius r gilt. Beweis. Man setze r = 1 +
n−1 X k=0
|ak | und betrachte z mit |z| ≥ r ≥ 1. Dann gilt |q(z)| ≤
|z|n−1 (r − 1) ≤ |z|n−1 (|z| − 1). Mit der Dreieicksungleichung folgt für |z| ≥ r die Abschätzung |P (z)| ≥ |z n + q(z)| ≥ |z|n − |q(z)| ≥ |z|n−1 ≥ r ≥ 1. Folgerung. Die stetige Funktion |P | hat in der abgeschlossenen Kreisscheibe mit Radius r ein Minimum, das wegen |P (0)| = |a0 | < r im Inneren der Kreisscheibe liegt und auch Minimum von |P | auf ganz C ist.
Alternativbeweis des Fundamentalsatzes. z0 sei Minimalstelle von |P | im Kreis Kr (0), r wie im Hilfssatz gewählt. Wir können o.E.d.A. annehmen, dass z0 = 0 ist (ggf. Koordinatentransformation z → z − z0 ). Weiter sei nun P (z) = a0 + ak z k + . . . an z n mit ak 6= 0, d.h. k der erste Index m > 0, für den am 6= 0 ist. Wir zeigen, dass für nicht-konstantes P gilt: P (0) = a0 = 0. Sei dazu w ∈ C mit |w| = 1. Für t ≥ 0 sei f (t) = |P (tw)|2 = P (tw)P (tw). Dann gilt:
408
A Der Residuensatz und der Fundamentalsatz der Algebra
f (t) − f (0) = (a0 ak wk + a0 ak w k )tk + tk+1 Q(t) = 2ℜ(a0 ak wk )tk + tk+1 Q(t)
mit einem reellen Restpolynom Q. Weil f in t = 0 lokal minimal ist, gilt für hinreichend kleine t > 0 f (t) − f (0) = 2ℜ(a0 ak wk ) + tQ(t). 0≤ tk Mit t → 0+ folgt 0 ≤ 2ℜ(a0 ak wk ). Da ak 6= 0 ist und die Multiplikation mit w k eine Drehung im Argument der rechten Seite bewirkt, könnte die rechte Seite für passend gewählte w aber auch kleiner als Null werden, falls a0 6= 0 wäre. Dies wäre ein Widerspruch. Daher muss a0 = P (0) = 0 sein. Zu Nullstellenschranken für Polynome Häufig sind Abschätzungen zur Lage der Nullstellen interessant. Für ein Polynom P (z) = n−1 X z n + Q(z) = z n + ak z k vom Grad n ≥ 1, r = 1 + |an−1 | + . . . + |a0 | und |z| ≥ r k=0
folgt aus der Dreiecksungleichung mit |Q(z)| ≤ |z|n−1 (|z|− 1), dass |P (z)| ≥ |z|n−1 ≥ 1 ist. Diese Ungleichung zeigt, dass alle Nullstellen von P in der offenen Kreisscheibe um Null mit Radius r liegen. Weitere Abschätzungen für Nullstellenschranken findet man bei M. Dehmer (2006) oder bei G. Schmeißer, H. Schirmeier (1976). Zwei Abschätzungen aus diesen Quellen sind etwa: 1. Alle Nullstellen eines Polynoms P (z) =
n X
k=0
ak z k vom Grad n ≥ 1 mit |an | ≥ |ak |
für k = 0, . . . ,n − 1 liegen in der abgeschlossenen Kreisscheibe um Null mit Radius r = 2. n X 2. Sei P (z) = ak z k ein Polynom mit a0 an 6= 0, n ≥ 1. Weiter seien k=0
an−k an−k 1/k . und β = max α = max 1≤k≤n 1≤k≤n an an
Dann gilt für jede Nullstelle s von P die Abschätzung
|s| < min{2α,1 + β}.
Schließlich sei an dieser Stelle noch auf den Satz von Gerschgorin über die Lage der Nullstellen des charakteristischen Polynoms einer quadratischen Matrix, d.h. also über die Lage der Eigenwerte hingewiesen. Man findet den Satz von Gerschgorin zum Beispiel in dem Buch von J. Stoer, R. Bulirsch (2007) zur Numerischen Mathematik. Der Satz besagt: Die Vereinigung aller Kreisscheiben n X Ki = z ∈ C : |z − ai,i | ≤ |ai,k | k=1,k6=i
enthält alle Eigenwerte einer (n × n)-Matrix A = (ai,k )1≤i,k≤n .
A Der Residuensatz und der Fundamentalsatz der Algebra
409
Partialbruchzerlegung rationaler Funktionen Satz über die komplexe Partialbruchzerlegung rationaler Funktionen. Sei Q/P eine echt gebrochen-rationale Funktion, d.h. Grad Q < Grad P , und es sei P (z) = c(z − z1 )n1 · · · (z − zk )nk eine Faktorisierung von P mit seinen Nullstellen z1 , . . . ,zk und ihren jeweiligen Vielfachheiten n1 , . . . ,nk . Dann besitzt die Funktion Q/P eine Partialbruchzerlegung, d.h. eine Summendarstellung der Form a12 a1n1 a11 Q(z) + + ...+ + = 2 P (z) z − z1 (z − z1 ) (z − z1 )n1 a21 a22 a2n2 + + + ...+ + 2 z − z2 (z − z2 ) (z − z2 )n2 .. . ak1 ak2 aknk + + + ...+ 2 z − zk (z − zk ) (z − zk )nk
mit Koeffizienten apq ∈ C, 1 ≤ p ≤ k, 1 ≤ q ≤ np . Die Darstellung ist eindeutig bis auf Permutation der Nullstellen von P . Beweis. Man kann den Satz mit vollständiger Induktion nach dem Grad von P beweisen. Ist Grad P = 1, dann ist Grad Q = 0 und die Aussage schon richtig. Es gelte nun die Behauptung für alle echt gebrochen-rationalen Funktionen, für die der Grad des Nenners nicht größer als n − 1 ist, und es sei Grad P = n, n > 1. Dann ist P (z) = (z − z1 )n1 P1 (z) mit P1 (z1 ) 6= 0, P1 (z) = c(z − z2 )n2 · · · (z − zk )nk . Für A = Q(z1 )/P1 (z1 ) ist dann Q(z) − AP1 (z) A Q(z) = . − n 1 P (z) (z − z1 ) (z − z1 )n1 P1 (z)
Falls Q = AP1 ist, folgt die Behauptung mit Q(z)/P (z) = A/(z − z1 )n1 und apq = 0 für (p,q) 6= (1,n1 ).
Für Q 6= AP1 ist der Zähler der rechten Seite ein Polynom mit der Nullstelle z1 , und daher von der Form (z − z1 )Q1 (z) mit einem Polynom Q1 6= 0. Also gilt dann Q1 (z) A Q(z) + = n 1 P (z) (z − z1 ) (z − z1 )n1 −1 P1 (z)
und Grad Q1 < n − 1 = Grad ((z − z1 )n1 −1 P1 (z)). Mit der Induktionsvoraussetzumg folgt hieraus die Behauptung über die Summendarstellung von Q/P . Zum Beweis der Eindeutigkeit der Zerlegung sei angenommen, dass Q/P eine weitere Darstellung mit Koeffizienten bpq statt der apq ∈ C besitze. Multiplikation beider Darstellungen mit (z − z1 )n1 und Grenzwertbildung für z → z1 ergibt dann b1n1 = a1n1 . Subtrahiert man dann a1n1 /(z − z1 )n1 = b1n1 /(z − z1 )n1 von Q(z)/P (z) und multipliziert die Differenz mit (z − z1 )n1 −1 , dann erhält man entsprechend a1(n1 −1) = b1(n1 −1) . Fortsetzung des Verfahrens auf stets analoge Weise ergibt schließlich die Gleichheit aller Koeffizienten apq = bpq .
410
A Der Residuensatz und der Fundamentalsatz der Algebra
Berechnung einer Partialbruchzerlegung Es gibt verschiedene Möglichkeiten, die Partialbruchzerlegung für eine gegebene rationale Funktion zu berechnen. Zu nennen sind etwa die Einsetzmethode oder Koeffizientenvergleich zwischen beiden Seiten der vorangehenden Summendarstellung. Man hat dabei ein lineares Gleichungssystem für die gesuchten Koeffizienten apq zu lösen. Eine weitere Möglichkeit, die auf eine geschlossene Formel für die gesuchten Koeffizienten führt, ist die Berechnung mit der aus der Grundlagen-Analysis bekannten Taylorformel. Dies wird nachfolgend schrittweise erläutert und an einem einfachen Beispiel demonstriert. 1. Man zerlegt durch Polynomdivision eine gegebene rationale Funktion r in r = g + f mit einem Polynom g und ihrem echt gebrochen-rationalen Anteil f = Q/P . Dann berechnet man die Nullstellen z1 , . . . ,zk von P und deren Vielfachheiten n1 , . . . ,nk . 2. Für eine Nullstelle zp sind die Koeffizienten apq , 1 ≤ q ≤ np , in der Partialbruchzerlegung von f die Koeffizienten des Hauptteils H(f,zp ) der Laurentreihe von f zum Entwicklungspunkt zp . Man erhält sie daher aus der Taylorentwicklung der in einer Umgebung von zp analytischen Funktion f1 (z) = (z − zp )np f (z), d.h. f1 (z) = αp0 +αp1 (z−zp )+. . .+αp(np −1) (z−zp )np −1 +. . . mit αpm = Dm f1 (zp )/m! (Dm f1 die Ableitung der Ordnung m von f1 , m ∈ N0 ). Hieraus liest man ab αp(np −1) αp1 αp0 + + ...+ . H(f,zp ) = n n −1 p p (z − zp ) (z − zp ) (z − zp ) 3. Koeffizientenformel. Aus 2. erhält man die Koeffizienten apq der Partialbruchzerlegung von f in der Form des vorangehenden Satzes für 1 ≤ p ≤ k und 1 ≤ q ≤ np : 1 np −q np Q(z) lim D . (z − zp ) apq = αp(np −q) = (np − q)! z→zp P (z) Q(z) 1 mit z1 = 0, z2 = j ergeben sich aus der Formel = P (z) (z − z1 )(z − z2 )2 1 1 die Koeffizienten apq der Partialbruchzerlegung, nämlich a11 = 2 = −1, a21 = − 2 = 1 j j 1 Q(z) 1 1 j und a22 = = −j. Also ist . =− + − j P (z) z z−j (z − j)2 In Kap. 9, S. 253 und in Kap. 10 hatten wir auf Partialbruchzerlegungen Bezug genommen, um die inversen Fouriertransformierten rationaler Funktionen zu bestimmen. Hat das Nennerpolynom einer rationalen Funktion f = Q/P einen Grad P > 4, dann berechnet man seine Nullstellen zp näherungsweise, etwa mit dem Bairstow-Verfahren. Die damit erzeugte Partialbruchzerlegung ist dann entsprechend eine Näherung für Q/P . Abschließend sei bemerkt, dass die Überlegungen zur Gewinnung der Hauptteile H(f,zp ) von f zu den Entwicklungspunkten zp (1 ≤ p ≤ k) einen weiteren Beweis der Partialbruchzerlegung ergeben, wenn man beachtet, dass F (z) = f (z) − H(f,z1 ) − . . . − H(f,zk ) zu einer auf ganz C analytischen Funktion fortgesetzt werden kann, die im Unendlichen verschwindet. F ist daher beschränkt und nach dem Satz von Liouville konstant Null, d.h. Beispiel. Für
f (z) = H(f,z1 ) + . . . + H(f,zk ).
411
B
Hilfsmittel aus der Integrationstheorie
Bei der Arbeit mit physikalischen Größen sind vielfältige Maßzahlen, die man den Größen zuordnet, von grundlegender Bedeutung. Man denke etwa an Größen wie kontinuierliche oder punktartige Verteilungen von Massen oder Ladungen, an elektrische Spannungen oder Stromstärken, und an Maßzahlen wie Durchschnittsgeschwindigkeiten, Trägheitsmomente von Massen, Effektivwerte von Wechselspannungen usw. Das mathematische Werkzeug für solche mit Mittelwertbildungen verknüpfte Begriffe liefert die Maß- und Integrationstheorie. Im Folgenden sollen daher einige Grundlagen aus der Lebesgueschen Integrationstheorie verfügbar gemacht werden. Wir begnügen uns dabei mit einer Zusammenstellung der benötigten Begriffe und wichtigsten Sätze. Interessierte Leser finden kompakte Einführungen in die Integrationstheorie zum Beispiel in den Lehrbüchern von W. Hackenbroch (1987), J. Weidmann (1980) oder R. Wheeden, A. Zygmund (1977).
Maße, Nullmengen und Integrale Ein Intervall des Rn ist das kartesische Produkt von n Intervallen aus R. Sind diese alle beschränkt, dann ist ihr Produkt beschränkt. Das Lebesgue-Maß λn (J) eines Intervalls n Y J = I1 × I2 × . . . × In im Rn ist λn (J) = |Ik |, wobei |Ik | = bk − ak die „Länge“ k=1
eines Intervalles Ik = [ak ,bk ] ist und es keine Rolle spielt, ob die Ik offen, halboffen oder abgeschlossen sind. Einpunktige Intervalle [a,a] und die leere Menge haben die „Länge“ Null. Zum Beispiel ist ein Intervall im R3 ein Quader und sein Lebesgue-Maß ist, wenn alle Koordinatenachsen Längeneinheiten tragen, sein Volumen. Allgemein richtet sich die Maß-Einheit nach den jeweiligen Einheiten der Koordinaten. Bezeichnet J die Menge aller beschränkten Intervalle im Rn , so besitzt die Funktion n λ : J → R+ 0 offensichtlich folgende Eigenschaften: 1. λn ist monoton, d.h. λn (J1 ) ≤ λn (J2 ) für Intervalle J1 ,J2 ∈ J mit J1 ⊂ J2 . 2. λn ist additiv, d.h., λn (J1 ∪ J2 ) = λn (J1 ) + λn (J2 ) für Intervalle J1 ,J2 ,J1 ∪ J2 in J mit J1 ∩ J2 = ∅. 3. λn ist regulär, d.h., zu jedem Intervall J1 ∈ J und jedem ε > 0 gibt es ein offenes Intervall J2 ∈ J , so dass J1 ⊂ J2 und λn (J1 ) ≤ λn (J2 ) < λn (J1 ) + ε. Neben dem Lebesgue-Maß gibt es viele andere Intervall-Funktionen m : J → R+ 0 , die monoton, additiv und regulär sind. Jede solche Funktion m heißt ein Maß.
412
B Hilfsmittel aus der Integrationstheorie
Beispiele 1. Für eine Menge M ⊂ Rn , die keine Häufungspunkte besitze, sei jedem Punkt ~x ∈ MX eine reelle Zahl g(~x) ≥ 0 zugeordnet. Die Intervall-Funktion m auf J , m(J) = g(~x), ist ein Maß. Stellt man sich g(~x) als die Masse des Punktes ~x ∈ M vor, ~ x∈M∩J
während alle Punkte in Rn \ M masselos sind, dann misst m(J) die in J enthaltene, diskret verteilte Gesamtmasse. Man nennt m ein diskretes Maß oder auch eine diskrete Verteilung.
2. Ist m1 ein Maß im Rp , m2 ein Maß im Rq , dann ist das Produkt m1 ⊗ m2 (J1 × J2 ) = m1 (J1 )m2 (J2 ) mit beschränkten Intervallen J1 in Rp und J2 in Rq ein Maß auf Rp+q . Das Maß m1 ⊗ m2 heißt Produktmaß zu m1 und m2 . Man sieht sofort, dass das Lebesgue-Maß λp+q im Rp+q das Produktmaß zu λp und λq ist. 3. Ist F : R → R eine beliebige monoton wachsende, rechtsseitig stetige Funktion, dann wird durch F (b) − F (a) für J = ]a,b] F (b) − F (a−) für J = [a,b] (a ≤ b) m(J) = F (b−) − F (a) für J = ]a,b[ F (b−) − F (a−) für J = [a,b[ ein Maß auf R definiert. Man nennt F die zu m gehörige Verteilungsfunktion. Etwa ist F (x) = x die Verteilungsfunktion zum Lebesgue-Maß λ in R.
Für ein Maß m im Rn ist eine Menge N eine m-Nullmenge, wenn es zu jedem ε > 0 ∞ ∞ X [ n m(Ji ) < ε ist. Ji und eine Intervallfolge Ji ⊂ R , i ∈ N, gibt, so dass N ⊂ i=1
i=1
Jede Teilmenge einer m-Nullmenge ist eine m-Nullmenge, abzählbare Vereinigungen und Durchschnitte von m-Nullmengen sind wieder m-Nullmengen. Zum Beispiel sind endliche Mengen λn -Nullmengen, die Menge Q der rationalen Zahlen in R und damit auch Qn in Rn sind Nullmengen für das Lebesgue-Maß in R bzw. in Rn . Zum Nachweis verwendet man die Abzählbarkeit der rationalen Zahlen q1 ,q2 , . . . , und nimmt die i-te Zahl als Mittelpunkt eines Intervalls der Länge 3−i · ε/2. Dann ist λ(Q) < ε. Ein ausgeartetes Intervall [a,b] × [c,c] ist eine λ2 -Nullmenge, anders gesagt, ein Geradenstück besitzt das LebesgueMaß Null im R2 . Hyperebenen im Rn , d.h., Mengen von Punkten ~x = (x1 , . . . ,xn ) im Rn , welche eine Gleichung der Form a0 + a1 x1 + . . . + an xn = 0, a0 , . . . ,an ∈ R, erfüllen, sind λn -Nullmengen. Auch die Sphäre einer Kugel im R3 ist eine λ3 -Nullmenge. Für das diskrete Maß m in Beispiel 1 oben ist Rn \ M eine Nullmenge. Zwei Funktionen f und g auf Rn sind m-fast überall gleich, wenn sich ihre Werte höchstens auf einer m-Nullmenge unterscheiden. Man sagt auch f (~x) = g(~x) für m-fast alle ~x. Eine Folge von Funktionen fk konvergiert m-fast überall gegen eine Funktion f , wenn es eine m-Nullmenge N gibt, so dass lim fk (~x) = f (~x) für alle ~x ∈ Rn \ N gilt. k→∞
B Hilfsmittel aus der Integrationstheorie
413
Eine Funktion f : Rn → C ist eine Treppenfunktion, wenn es endlich viele, paarweise disjunkte, beschränkte Intervalle J1 , . . . ,Jl in Rn gibt, so dass f auf Jk , 1 ≤ k ≤ l, jeweils konstant ist, und Null außerhalb der Jk . Für eine Treppenfunktion f mit Konstanzintervallen J1 , . . . ,Jl , f (Jk ) = ck , f = 0 außerhalb der Jk , 1 ≤ k ≤ l, ist das Integral mit dem Maß m definiert durch ˆ l X f dm = ck m(Jk ). k=1
Für Treppenfunktionen ist dann das Integral mit dem Lebesgue-Maß gleich dem RiemannIntegral und hat dieselben bekannten Eigenschaften. Eine Funktion f : Rn → C heißt m-messbar, wenn es eine Folge von Treppenfunktionen gibt, die m-fast überall gegen f konvergiert. Alle stetigen Funktionen und alle Funktionen mit endlich oder abzählbar vielen Unstetigkeitsstellen sind messbar bezüglich aller Maße m, die wir in den Beispielen auf S. 412 angegeben haben. Summen und Produkte mmessbarer Funktionen f und Verkettungen g ◦ f mit stetigen Funktionen g sind m-messbar. Auch Limiten f von m-fast überall konvergenten Folgen m-messbarer Funktionen sind wieder m-messbar. Diese Beispiele zeigen, dass bei Maßen wie in unseren Beispielen und bei Funktionen, die in den technischen Anwendungsdisziplinen vorkommen, die Messbarkeit kein ernsthaftes Problem darstellt. Die Messbarkeit der im Folgenden betrachteten Funktionen ist eine Bedingung, um Integrale bezüglich einer vielfältigen Klasse von Maßen mathematisch einwandfrei begründen zu können. Es gilt der folgende grundlegende Satz von B. Levi (1875-1961): Satz von der monotonen Konvergenz. Ist (fk )k∈N eine Folge von reellwertigen Treppenfunktionen aufˆRn , so dass für jedes k ∈ N m-fast überall fk (~x) ≤ fk+1 (~x) gilt, und liegen alle Integrale
fk dm unterhalb einer geeigneten, gemeinsamen Schranke K ∈ R, dann
gibt es eine m-messbare Funktion f : Rn → R, so dass m-fast überall lim fk (~x) = f (~x) k→∞ ist.
Mit der Monotonie der Folge (fk )k∈N und der gleichmäßigen Beschränktheit der Integrale lässt sich nämlich zeigen, dass die Folge (fk )k∈N höchstens auf einer m-Nullmenge divergiert. Außerdem folgt aus den Voraussetzungen des Satzes sofort, dass der Grenzwert ˆ lim
k→∞
durch
fk dm existiert. Das m-Integral der Funktion f im letzten Satz wird dann definiert ˆ
f dm = lim
k→∞
ˆ
fk dm .
Dadurch ist das Integral bezüglich eines Maßes m für alle reellwertigen Funktionen f eingeführt, zu denen es wie im obigen Satz eine m-fast überall gegen f konvergente, nicht-fallende Folge von Treppenfunktionen mit beschränkter Integralfolge gibt. Man kann zeigen, dass das wie oben definierte Integral von f unabhängig von der Wahl der approximierenden Folge von Treppenfunktionen ist. Bezeichnet T die Menge aller solcher Funktionen f , dann sind alle Funktionen g in dem von T erzeugten Vektorraum von der Form g = f1 − f2 mit f1 ,f2 in T , und man definiert ihr Integral durch ˆ ˆ ˆ g dm = f1 dm − f2 dm .
414
B Hilfsmittel aus der Integrationstheorie
Das Integral von g ist wieder unabhängig von der Wahl der Funktionen f1 und f2 in T , die man zur Darstellung von g verwendet. Die m-integrierbaren Funktionen allgemein sind diejenigen Funktionen f : Rn → C, für die sowohl Realteil ℜ(f ) als auch Imaginärteil ℑ(f ) in dem von der Menge T erzeugten reellen Vektorraum liegen, mit anderen Worten, diejenigen f : Rn → C, für die mit der imaginären Einheit j gilt f = ℜ(f ) + jℑ(f ) = (f1 − f2 ) + j(f3 − f4 ) mit f1 ,f2 ,f3 ,f4 in T . Das m-Integral von f wird dann in naheliegender Weise definiert durch ˆ ˆ ˆ f dm = ℜ(f ) dm + j ℑ(f ) dm . Damit hat man den Integralbegriff auch auf komplexwertige Funktionen ausgedehnt. Die m-integrierbaren Funktionen bilden einen Vektorraum über C, der H. Lebesgue zu Ehren mit L1 (Rn ,m) bezeichnet wird. Für das Lebesgue-Maß m = λn wird statt L1 (Rn ,λn ) nur kurz L1 (Rn ) notiert. Man nennt eine Teilmenge E des Rn eine m-messbare Menge, wenn die Indikatorfunktion 1E eineˆm-messbare Funktion ist. Eine m-messbare beschränkte Menge E hat das Maß m(E) =
1E dm. Jede m-Nullmenge ist m-messbar. Alle beschränkten Intervalle sind
m-messbare Mengen. Komplemente, Vereinigungen und Durchschnitte abzählbar vieler m-messbarer Mengen sind wieder m-messbar. Für diskrete Maße m ist sogar jede Teilmenge E des Rn m-messbar. Für unsere Beispiele von Maßen m und für Mengen wie Rn , Intervalle, Ebenen, Kugelsphären, und deren Komplemente, abzählbare Vereinigungen und Durchschnitte ist also die m-Messbarkeit stets gesichert. Das Integral von f ∈ L1 (Rn ,m) über eine m-messbare Teilmenge E ist ˆ ˆ f dm = f · 1E dm . E
Ist f nur auf einer Teilmenge E des Rn definiert, so setzt man f außerhalb von E Null und definiert das Integral von f als Integral von f · 1E , wenn dieses existiert. Etwa ist für das diskrete Maß m aus Beispiel 1 und eine E des Rn eine Funktion ˆ beliebige Teilmenge X f : Rn → C über E m-integrierbar mit f dm = f (~x)g(~x) genau dann, wenn E
~ x∈E∩M
die Reihe auf der rechten Seite absolut konvergiert. Für Integrale mit dem Lebesgue-Maß sind folgende Schreibweisen üblich: ˆ ˆ ˆ ˆ ˆ ˆ f dλn = f (~x) dλn (~x) = f (~x) d~x = . . . f (x1 , . . . ,xn ) d(x1 , . . . ,xn ) . | {z } n-mal ˆ ˆ Analog notiert man auch für andere Maße f dm = f (~x) dm(~x), wenn man die Integrationsvariable aus Gründen der Übersichtlichkeit anzeigen will. Für Maße m mit der
B Hilfsmittel aus der Integrationstheorie
415
Verteilungsfunktion F schreibt man auch
ˆ
f dF statt
Rechnen ist zunächst folgende Feststellung:
ˆ
f dm. Wichtig für das praktische
Alle (eigentlich) Riemann-integrierbaren Funktionen sind auch Lebesgue-integrierbar. Die eingeübten Regeln im Umgang mit Riemann-Integralen und Methoden zu ihrer Berechnung gelten für diese Funktionen unverändert auch bei Lebesgue-Integralen. Riemannund Lebesgue-Integrale stimmen für solche Funktionen überein. Einen ersten Vorteil des Lebesgue-Integrals gegenüber dem Riemann-Integral zeigt folgendes, gut bekannte Extrembeispiel: Die Dirichletsche Sprungfunktion 0 für x ∈ [0,1] \ Q f (x) = 1 für x ∈ [0,1] ∩ Q ist bekanntlich nicht Riemann-integrierbar. Sie ist aber Lebesgue-integrierbar mit ˆ
f dλ =
ˆ1
f (x) dx =
ˆ
f (x)1[0,1] (x) dx = 0,
0
[0,1]
weil sich f nur auf der λ-Nullmenge [0,1] ∩ Q von der Nullfunktion unterscheidet. Einbeziehung von Nullmengen schon in die Definition integrierbarer Funktionen und ihrer Integrale in dem Sinn, dass das Verhalten der Funktionen auf Nullmengen völlig belanglos wird, dass sie schließlich überhaupt nur fast überall definiert sein müssen, hat also die Klasse der integrierbaren Funktionen erweitert. Dies ermöglicht zum Beispiel auch eine Integralrechnung für Funktionen mit unendlich vielen Unstetigkeitsstellen, die mit dem Riemann-Integral nicht geleistet werden kann. Wir fassen einige grundlegenden Sätze aus der Integrationstheorie zusammen. Dabei ist m ein beliebiges Maß. Beweise dieser Sätze findet man in der schon zu Beginn des Kapitels angeführten Literatur. Grundlegende Sätze aus der Integrationstheorie 1. (a) Eine m-messbare Funktion f ist genau dann m-integrierbar, wenn auch die Funktion |f | m-integrierbar ist. (b) Für m-integrierbare Funktionen f , g und komplexe Zahlen α, β gilt ˆ ˆ ˆ (αf + βg) dm = α f dm + β g dm .
(c) Für m-integrierbare, reellwertige Funktionen f und g mit f ≤ g m-fast überall gilt ˆ ˆ f dm ≤
Insbesondere gilt
ˆ
f dm ≤
ˆ
|f | dm .
g dm .
416
B Hilfsmittel aus der Integrationstheorie (d) Für eine m-messbare Funktion f gilt f = 0 m-fast überall genau dann, wenn f ˆ m-integrierbar ist und
|f | dm = 0 ist.
2. Eine uneigentlich Riemann-integrierbare Funktion f ist Lebesgue-integrierbar, wenn mit f auch |f | uneigentlich Riemann-integrierbar ist. Ihr Lebesgue-Integral ist dann gleich dem uneigentlichen Riemann-Integral. 3. Der Satz von Lebesgue über majorisierte Konvergenz. Für eine Folge m-integrierbarer Funktionen fk und eine Funktion f gelte lim fk (~x) = f (~x) m-fast überall. k→∞
Weiter gebe es eine m-integrierbare Funktion g, so dass |fk | ≤ g für jedes k ∈ N gilt. Dann ist auch f m-integrierbar und die Limesbildung darf mit der Integration vertauscht werden: ˆ ˆ f dm = lim fk dm . k→∞
4. Vertauschung der Integrationsreihenfolge. Die Möglichkeit, Mehrfachintegrale auf die Berechnung iterierter Integrale mit jeweils nur einer Variablen zurückzuführen, und die Vertauschbarkeit der Integrationsreihenfolge wird durch den folgenden Satz von G. Fubini (1879-1943) und L. Tonelli (1885-1946) sichergestellt. Dabei wird der Vektorraum Rn als kartesisches Produkt Rn = Rp × Rq , p + q = n, aufgefasst. Einen Punkt ~z aus Rn schreiben wir in der Form ~z = (~x,~y) mit ~x ∈ Rp und ~y ∈ Rq . Auf Rn sei das Produkt m1 ⊗ m2 zweier Maße m1 auf Rp und m2 auf Rq gegeben. Satz von Fubini-Tonelli
(a) Eine m1 ⊗ m2 -messbare Funktion f : Rn → C besitze die Eigenschaften: i)
ii)
Für m1 -fast alle ~x ∈ Rp sei f~x (~y ) = f (~x,~y ) m2 -integrierbar auf Rq . ˆ Man definiere F (~x) = |f (~x,~y )| dm2 (~y ), falls f~x ∈ L1 (Rq ,m2 ), Rq
F (~x) = 0 sonst. Die Funktion F sei auf Rp m1 -integrierbar. Dann ist f auf Rn = Rp × Rq integrierbar mit dem Produktmaß m1 ⊗ m2 .
(b) Ist f auf Rn integrierbar mit dem Produktmaß m1 ⊗ m2 , dann ist für m1 -fast alle ~x ∈ Rp die Funktion f~x m2 -integrierbar auf Rq . Entsprechend ist für m2 fast alle ~y ∈ Rq die Funktion fy~ (~x) = f (~x,~y ) m1 -integrierbar auf Rp . Es gilt: ˆ ˆ ˆ f (~x,~y ) dm1 (~x) ⊗ m2 (~y ) = f (~x,~y ) dm2 (~y ) dm1 (~x) Rp
Rn
=
ˆ
Rq
Rq
ˆ
Rp
f (~x,~y ) dm1 (~x) dm2 (~y ) .
B Hilfsmittel aus der Integrationstheorie
417
5. Die Substitutionsregel für Lebesgue-Integrale. Seien U und V nicht-leere, offene Teilmengen des Rn . A : U → V sei eine stetig differenzierbare, bijektive Abbildung mit stetig differenzierbarer Umkehrabbildung A−1 : V → U und f : V → C sei λn messbar. Die Funktion f ist genau dann λn -integrierbar über die Menge V , wenn n (f ◦ A)| det ∂A| über U ist. Dabei ist det ∂A die Determinante der λ -integrierbar ∂Ak , Ak : U → R die Komponenten von A = (A1 , . . . ,An ). Jacobi-Matrix ∂xi 1≤k≤n 1≤i≤n Es gilt dann ˆ ˆ n f (~x) dλ (~x) = (f ◦ A)(~x)| det ∂A(~x)| dλn (~x) . U
A(U)=V
Für den Fall n = 1 ist dies die bekannte Substitutionsformel für Integrale. Beispiele
α für x0 ∈ J das Maß zur Punktmasse α > 0 0 für x0 6∈ J in x0 ∈ R und λ das Lebesgue-Maß auf R. Für eine Funktion f : R2 → C sei fx0 (y) = f (x,y) Lebesgue-integrierbar. Dann ist f nach dem Satz von Fubini-Tonelli (m ⊗ λ)-integrierbar mit ˆ ˆˆ ˆ f (x,y) dm(x) ⊗ λ(y) = f (x,y) dm(x) dλ(y) = α f (x0 ,y) dy .
1. Für Intervalle J in R sei m(J) =
Das Integral mit diesem Produktmaß ist also das Lebesgue-Integral von f längs der Gerade x = x0 im R2 , multipliziert mit dem Gewicht α von x0 . 2. Integration in Kugelkoordinaten: Die Koordinatentransformation A von Kugelkoordinaten in kartesische Koordinaten A : U = {(r,θ,φ) | r > 0, 0 < θ < π, 0 < φ < 2π} → R3 A(r,θ,φ) = (x,y,z) = (r sin θ cos φ,r sin θ sin φ,r cos θ) ist injektiv und stetig differenzierbar mit det ∂A = r2 sin(θ) > 0 für θ ∈ ]0,π[. Die Menge R3 \ A(U ) = {(x,y,z) ∈ R3 | y = 0} ist eine λ3 -Nullmenge. Mit dem Substitutionssatz und dem Satz von Fubini-Tonelli folgt für f aus L1 (R3 ) ˆ R3
3
f dλ =
ˆ A(U)
3
f dλ =
ˆ∞ˆ2πˆπ
f (A(r,θ,φ))r2 sin(θ) dθ dφ dr .
0 0 0
Integration über eine Kugelsphäre Das von der Riemannschen Integralrechnung her gewohnte Oberflächenintegral auf einer Kugelsphäre im R3 lässt sich zum Lebesgue-Integral wie folgt erweitern:
418
B Hilfsmittel aus der Integrationstheorie
Für eine Teilmenge E der Kugelsphäre SR um den Nullpunkt mit Radius R setze man E ∗ = {r~x | 0 < r < R,~x ∈ E}. Ist der Kugelsektor E ∗ λ3 -messbar, so definiert man das Oberflächenmaß von E durch 3 o(E) = λ3 (E ∗ ). R Damit ist ein Maß auf allen Teilmengen E von SR definiert, für die E ∗ λ3 -messbar ist. Diese Mengen E sind die o-messbaren Mengen auf der Sphäre SR . Es ergibt sich ˆ ˆ 3 1E do = 1E ∗ dλ3 . R Hieraus folgt bei Benutzung von Kugelkoordinaten für eine Menge E der Gestalt E = {A(R,θ,φ) | 0 < θ1 ≤ θ ≤ θ2 < π, 0 < φ1 ≤ φ ≤ φ2 < 2π}, A(r,θ,φ) wie oben: ˆ
3 1E do = R
ˆφ2ˆθ2ˆR φ1 θ 1 0
2
r sin(θ) dr dθ dφ =
ˆφ2ˆθ2
R2 sin(θ) dθ dφ .
φ1 θ 1
Durch Wiederholung des Prozesses zur Einführung integrierbarer Funktionen mittels Approximation durch Treppenfunktionen auf o-messbaren Mengen erhält man den Vektorraum L1 (SR ,o) der o-integrierbaren Funktionen f auf der Sphäre SR , und Integration in Kugelkoordinaten zeigt ˆ
f do =
ˆ2πˆπ
f (R sin θ cos φ,R sin θ sin φ,R cos θ)R2 sin(θ) dθ dφ .
0 0
Das Oberflächenelement do in Kugelkoordinaten ist R2 sin(θ) dθ dφ. Alle auf der Sphäre SR o-messbaren, beschränkten Funktionen, insbesondere alle auf SR stetigen Funktionen sind o-integrierbar. Jede Lebesgue-messbare Funktion f : R3 → C besitzt eine o-messbare Einschränkung auf SR , die genau dann o-integrierbar ist, wenn für ihre Betragsfunktion das iterierte Integral nach dθ und dφ auf der rechten Seite der letzten Gleichung existiert. Die im letzten Abschnitt angegebenen Sätze der Integrationstheorie gelten auch, wenn eines der dort vetretenen Maße das Oberflächenmaß o ist. Die besondere Bedeutung des Lebesgueschen Oberflächenmaßes o im Vergleich zu anderen Maßen auf der Sphäre liegt darin, dass es charakterisiert wird durch die Gültigkeit des Divergenzsatzes von Gauß. Wir formulieren diesen Satz für die Kugel KR im R3 mit Radius R. Er gilt auch für allgemeinere Gebiete und deren Randmaße. Man vergleiche hierzu die bereits zu Beginn des Anhangs genannte Literatur. Der Divergenzsatz von Gauß und die Greenschen Formeln. Ist F~ : KR → R3 ein Vektorfeld, das auf der abgeschlossenen Kugel KR stetig, stetig differenzierbar im Inneren der Kugel und o-integrierbar auf der Sphäre SR ist, und besitzt F~ eine über die Kugel λ3 ∂F2 ∂F3 ~ ∂F1 + + , F = (F1 ,F2 ,F3 ), dann gilt mit der integrierbare Divergenz div F~ = ∂x ∂y ∂z Einheitsaußennormale ~n der Sphäre
B Hilfsmittel aus der Integrationstheorie ˆ
419
div F~ dλ3 =
ˆ
F~ · ~n do .
SR
KR
F~ ·~n bezeichnet das punktweise auf der Sphäre zu bildende Skalarprodukt zwischen F~ und ~n im R3 . Die Einheitsaußennormale auf der Sphäre SR ist in Kugelkoordinaten gegeben durch ~n(θ,φ) = (sin θ cos φ, sin θ sin φ, cos θ) (Übungsaufgabe). Setzt man F~ = g grad ϕ mit zweimal stetig differenzierbaren Skalarfeldern g und ϕ im R3 und beachtet man div (g grad ϕ) = g∆ϕ + grad g · grad ϕ, ∆ der Laplace-Operator, so ergibt sich aus dem Satz von Gauß die erste Greensche Formel (hier wieder für die Kugel KR ): ˆ ˆ (g∆ϕ + grad g · grad ϕ) dλ3 = g grad ϕ · ~n do . SR
KR
Vertauschung der Rollen von g und ϕ und Subtraktion der beiden entstehenden Gleichungen liefert die zweite Greensche Formel: ˆ ˆ 3 (g∆ϕ − ϕ∆g) dλ = (g grad ϕ − ϕ grad g) · ~n do . SR
KR
Diese Sätze aus der Vektoranalysis spielen eine wesentliche Rolle bei der Lösung räumlicher Potentialprobleme (vgl. Abschnitt 8.4).
Maße mit Dichten Ist m ein Maß im Rn und f eine m-messbare, reellwertige Funktion, so dass f ≥ 0 m-fast überall ist, dann wird auf den m-messbaren Mengen E durch ˆ ̺(E) = f dm E
ein Maß definiert. Die Funktion f heißt die Dichte von ̺ bezüglich m. Man schreibt kurz ̺ = f · m oder d̺ = f dm.
Beispiel. Ist m = λ3 das Lebesgue-Maß im R3 und beschreibt eine λ3 -integrierbare Funktion f ≥ 0 eine räumliche, stetige dann ist für Lebesgue-messbare Mengen ˆ ˆ Massendichte, ˆ
E ⊂ R3 das Integral
f dλ3 =
d̺ =
E
E
f (~x) d~x die in E enthaltene Gesamtmasse.
E
Analoge Modelle mit stetigen elektrischen Ladungsverteilungen gemäß einer Lebesgueintegrierbaren Ladungsdichte f = f + − f − , die bei negativen Ladungen negativ wird, liefern nach ˆAufspaltungˆvon f in Positivteil f + und Negativteil f − die summarische Geˆ f dλ3 =
samtladung
E
f + dλ3 −
E
f − dλ3 von E, wobei sich entgegengesetzt gela-
E
dene Anteile gleichen Betrages zu Null kompensieren. Das Maß m+ mit der Dichte f + heißt Positivteil, das Maß m− mit der Dichte f − Negativteil des Maßes m. Da das Maß m auch negative Werte annehmen kann, nennt man es ein signiertes Maß.
420
B Hilfsmittel aus der Integrationstheorie
Faltungen Für 1 ≤ p < ∞ und ein Gebiet Ω ⊂ Rn bezeichnet Lp (Ω) den Vektorraum aller Lebesguemessbaren komplexwertigen Funktionen f auf Ω mit 1/p ˆ kf kp = |f |p dλn < ∞. Ω
p
Die Funktionen f ∈ L (Ω) heißen p-fach integrierbar mit der p-Norm kf kp . Funktionen, die sich nur auf einer Lebesgue-Nullmenge unterscheiden, werden identifiziert. Die Elemente von Lp (Ω) sind also genau genommen die Äquivalenzklassen aller so identifizierten Funktionen. Für den Fall p = ∞ ist L∞ (Ω) der Vektorraum aller wesentlich beschränkten Funktionen. Eine Lebesgue-messbare Funktion f auf Ω ist wesentlich beschränkt, wenn kf k∞ = inf α ∈ R | λn ({~x ∈ Ω : |f (~x)| ≥ α}) = 0 < ∞.
Die Zahl kf k∞ heißt wesentliches Supremum von f , weil dann |f (~x)| ≤ kf k∞ λn -fast überall ist. Mit der gleichen Identifikation wie oben ist dann kf k∞ eine Norm, die als Supremumsnorm bezeichnet wird. Die Lp -Räume sind für 1 ≤ p ≤ ∞ vollständige normierte Räume. Es gelten die folgenden Ungleichungen: 1 1 1 = 0) seien Hölder-Ungleichung. Für 1 ≤ p ≤ ∞ und + = 1 (mit der Konvention p q ∞ p q 1 f ∈ L (Ω) und g ∈ L (Ω). Dann ist f g ∈ L (Ω) und es gilt kf gk1 ≤ kf kp kgkq .
Minkowski-Ungleichung. Für 1 ≤ p ≤ ∞, f, g ∈ Lp (Ω) gilt kf + gkp ≤ kf kp + kgkp .
Für beschränkte Ω, λn (Ω) < ∞, und 1 ≤ p ≤ q ≤ ∞ gilt Lq (Ω) ⊂ Lp (Ω). Für unbeschränkte Ω gilt im Allgemeinen weder Lq (Ω) ⊂ Lp (Ω) noch die umgekehrte Inklusion. Faltungen. Für Faltungen f ∗ g von Funktionen f ∈ Lp (Rn ) und g ∈ Lq (Rn ), ˆ f ∗ g(~x) = f (~y)g(~x − ~y ) dλn (~y ) , Rn
gilt folgender Satz (vgl. etwa R. Wheeden, A. Zygmund (1977) oder D. Werner (2011)). Dabei vereinbart man die Konvention 1 1 1 1 = 0 für p = ∞ und r = ∞ für = + − 1 = 0. p r p q 1 1 1 1 1 Satz. Es seien 1 ≤ p,q ≤ ∞, + ≥ 1 und = + − 1. Für f ∈ Lp (Rn ) und p q r p q g ∈ Lq (Rn ) gehört die Faltung f ∗ g zu Lr (Rn ), und es gilt die Youngsche Ungleichung kf ∗ gkr ≤ kf kp kgkq . 1 1 Für + − 1 = 0 ist f ∗ g stetig und beschränkt. p q
B Hilfsmittel aus der Integrationstheorie
421
Faltungen in Folgenräumen Für 1 ≤ p < ∞ ist lp (Z) der Vektorraum aller Folgen x = (xn )n∈Z komplexer Zahlen, für die gilt !1/p +∞ X p kxkp = |xn | < ∞. n=−∞
∞
Der Raum l (Z) ist der Vektorraum aller beschränkten Folgen x = (xn )n∈Z . Er wird versehen mit der Norm kxk∞ = sup{|xn | : n ∈ Z}. Alle Räume lp (Z), jeweils versehen mit der Norm k.kp für 1 ≤ p ≤ ∞, sind vollständige normierte Räume. Die Hölder- und die Minkowski-Ungleichung gelten analog und es sind folgende Inklusionen erfüllt l1 (Z) ⊂ l2 (Z) ⊂ . . . ⊂ l∞ (Z). 1 1 1 1 1 + ≥ 1 und = + − 1. Für x = (xn )n∈Z ∈ lp (Z) p q r p q ∈ lq (Z) existiert die diskrete Faltung
Satz. Es seien 1 ≤ p,q ≤ ∞, und y = (yn )n∈Z
(x ∗ y) = (fn )n∈Z , fn =
+∞ X
xn−k yk .
k=−∞
Diese Faltung x ∗ y gehört zu lr (Z) und es gilt die Youngsche Ungleichung kx ∗ ykr ≤ kxkp kykq .
Der Sobolevraum H01 (Ω) und die Poincaré-Friedrichs-Ungleichung In Abschnitt 8.5 wurde bei der Formulierung des Dirichletschen Randwertproblems für eine belastete Membran Bezug genommen auf den Sobolevraum V = H01 (Ω), Ω ⊂ R2 ein beschränktes Lipschitz-Gebiet. Beide Begriffe sollen nachfolgend präzise definiert werden. Definition. Ein beschränktes Gebiet Ω ⊂ Rn (n ≥ 2) heißt ein Lipschitz-Gebiet oder auch Gebiet mit Lipschitzrand ∂Ω, wenn sich ∂Ω durch endlich viele offene Mengen U1 , . . . ,Um überdecken lässt, so dass ∂Ω ∩ Uk für k = 1, . . . ,m der Graph einer Lipschitz-stetigen Funktion ist und für jedes k das Gebiet Ω ∩ Uk auf jeweils einer Seite dieses Graphen liegt. Viele Gebiete, die in Anwendungsproblemen vorkommen, haben einen Lipschitzrand, zum Beispiel konvexe Polygone, sternförmige nicht-konvexe Polygone u.v.a.m. Für solche Gebiete ist daher die in Kap. 8 vorgestellte Lösung eines Dirichletschen Randwertproblems im dort verwendeten und nachfolgend definierten Vektorraum V = H01 (Ω) möglich. Typische Beispiele für Gebiete, die keinen Lipschitzrand haben, sind etwa Kreisscheiben oder Kugeln mit einem Riss.
422
B Hilfsmittel aus der Integrationstheorie
Definition. Für ein Gebiet Ω ⊂ Rn ist H 1 (Ω) der Raum aller reellwertigen Funktionen f ∈ L2 (Ω), deren sämtliche verallgemeinerte Ableitungen erster Ordnung ebenfalls zu L2 (Ω) gehören, versehen mit der Norm 1/2 X k∂ k vk22 . kvkH 1 = |k|≤1
Dabei ist k ein Multi-Index aus
Nn0 .
Man kann zeigen, dass H 1 (Ω) mit dieser Norm ein Hilbertraum ist. Für Lipschitz-Gebiete Ω gilt folgender Satz über die sogenannte Spur-Abbildung τ : Satz. Für ein Lipschitz-Gebiet Ω existiert ein stetiger linearer Operator τ : H 1 (Ω) → L2 (∂Ω),
so dass für alle v ∈ C(Ω ∪ ∂Ω) ∩ H 1 (Ω) und x ∈ ∂Ω gilt: (τ v)(x) = v(x).
Die Existenz einer Spur erlaubt es, von Randwerten einer H 1 -Funktion zu sprechen, und daher den Raum der H 1 -Funktionen, die am Rand von Ω verschwinden, zu definieren. Eine Funktion, die im Inneren eines Lipschitz-Gebiets zu H 1 gehört, hat am Rand eine Spur, die zu L2 gehört. Wir schreiben dann einfach v|∂Ω = τ v. Definition. Für ein Lipschitz-Gebiet Ω ⊂ Rn ist der Raum H01 (Ω), versehen mit der Norm von H 1 (Ω), definiert durch H01 (Ω) = {v ∈ H 1 (Ω) : τ v = v|∂Ω = 0 }.
Man kann zeigen, dass H01 (Ω) die Vervollständigung des Raums D(Ω) der Testfunktionen auf Ω mit der Norm von H 1 (Ω) ist. Insbesondere ist mit H 1 (Ω) auch H01 (Ω) ein Hilbertraum. Schließlich war entscheidend bei der Lösung des Variationsproblems in Abschnitt 8.5, dass die dort verwendete Bilinearform a(u,v) auf H01 (Ω) positiv definit ist. Dies wird durch die Poincaré-Friedrichs-Ungleichung sichergestellt. Poincaré-Friedrichs-Ungleichung. Sei Ω ein Lipschitz-Gebiet. Dann gibt es eine nur von Ω abhängige Konstante c, so dass für alle v ∈ H01 (Ω) die Poincaré-FriedrichsUngleichung kvkH 1 ≤ c |v|H 1 1/2 X k∂ k vk22 . gilt. Dabei ist |v|H 1 = |k|=1
Insbesondere ist |.|H 1 eine zu k.kH 1 äquivalente Norm in H01 (Ω). Diese stimmt bis auf einen Faktor mit der in Abschnitt 8.5 auf S. 208 verwendeten Energienorm a(v,v)1/2 für v ∈ H01 (Ω) überein, und H01 (Ω) ist auch damit ein Hilbertraum.
Lesern mit Interesse an den im Anhang nicht ausgeführten Beweisen – und generell an weiterführender Literatur zur Funktionalanalysis und ihren zahlreichen Anwendungen – seien zum Abschluss noch einmal die auf S. 206 und an anderen Stellen schon genannten Lehrbücher zur Funktionalanalysis und partiellen Differentialgleichungen empfohlen.
423
C
Lösungen zu den Übungsaufgaben
Zu den Aufgaben von Kapitel 3 A1) Zu (a) und (b): Die Fourier-Reihe Sf von f besitzt die Entwicklung 1 1 2 3 sin(2x) Sf (x) = A + − 2 cos(x) − sin(x) + − 4 π π 2π {z } | {z } | 0.377 sin(x−2.575) 0.159 sin(2x+3.142) 2 1 1 + − 2 cos(3x) − sin(3x) + − sin(4x) 9π 3π 4π | {z } | {z } 0.108 sin(3x−2.932) 0.08 sin(4x+3.142) + 0.064 sin(5x − 3.015) + . . . Die Fourier-Reihe konvergiert für x = 0 gegen A2) Die Fourier-Reihe Su (t) von u(t) lautet 1 2 1 + sin(ω0 t) − Su (t) = uˆ π 2 π
A . 2
1 cos(nω t) 0 (n2 − 1) n=2,4,6,... X
A3) (a) Die Fourierkoeffizienten sind ck = (ak − jbk )/2 mit 2 ak = T bk =
2 T
ˆ0 ω 2 t cos(kωt) dt = − sin 2 π(4k 2 − 1)
−T /2 ˆ0 −T /2
− sin
ωt 2
sin(kωt) dt =
4(−1)k k π(4k 2 − 1)
! n 2 1 X (−1)k+1 T = + + Rn . (b) Bei T /2 gilt für n ∈ N: Sf 2 π 2 4k 2 − 1 k=1 2Rn 2 < Leibniz-Kriterium: < 0.5 · 10−3 für n ≥ 17. π π(4(n + 1)2 − 1)
1 1 − gilt nach der Abschätzung auf S. 20 in A4) Für ε > 0, h > 0 und N ≥ h 2 ε sin( 2 ) N X sin(kt) 1 Abschnitt 3.1: S(t) − ≤ ε. ≤ k (N + 21 ) sin( h2 ) k=1
424
C Lösungen zu den Übungsaufgaben
Zu den Aufgaben von Kapitel 4 A1) Die Fourier-Reihe von f ist für t 6= kπ die Ableitung von F (t) = | sin t| = −
∞ ∞ 2 4X cos(2kt) 2 X ej2kt = − . 2 π 4k − 1 π π (2k − 1)(2k + 1) k=−∞
k=1
F ist stetig, f stückweise stetig differenzierbar. Daher gehört zu f die Fourierreihe Sf (t) =
∞ 4X 2k sin(2kt). π (2k − 1)(2k + 1) k=1
A2) (a) h(t) =
4 π
sin(t) sin(3t) + + ... 1 3
+∞ X
=
k = −∞ k 6= 0
j (−1)k − 1 ejkt πk
1 (b) g(t) = −3h α(t − ) mit α = π/2. 2 +∞ X j (−1)k − 1 e−jkπ/4 Ergebnis: g(t) = (−3) πk
↑
k = −∞ k 6= 0
↑
Amplitudenfaktor
(c) (d) (e)
ejktπ/2
↑
Frequenzänderung
cos(2t) cos(4t) + . 3 3·5 4 4 4 4 4 , , , , ,0, . . .) . (2|ck |)k∈Z = (. . . ,0, 15π 3π π 3π 15π Die amplitudenmodulierte Funktion cos(6t)f (t) = cos(3ω0 t)f (t) besitzt das Amplitudenspektrum 2|dk | = |ck−3 + ck+3 | . 2 2 2 2 2 g(t) = − cos(2t) − cos(4t) + cos(6t) − cos(8t) − cos(10t). 15π 3π π 3π 15π ∞ a0 X + ak cos(kω0 t) Allgemeiner gilt für f (t) = 2
A3) (a) f (t) = (b)
Phasenverschiebungen
·
2 4 − π π
k=1
cos(N ω0 t)f (t) =
∞
aN X a|k−N | + ak+N + cos(kω0 t). 2 2 k=1
sin(3x) sin(5x) sin(x) + + + ... . 3 5 ˆ2πˆt π 1 f (x) dx dt = Nach S. 38 folgt mit c0 = 0 und F0 = 2π 2
A4) Für x 6= kπ, k ∈ Z, gilt f (x) =
4 π
0
0
C Lösungen zu den Übungsaufgaben ˆt 0
4 π f (x) dx = − 2 π
A5) Man substituiert in
+N X
N X
425 cos(3x) cos(5x) cos(x) + + + ... . 32 52 cm dn ej(m+n)t mit k = m + n (man vgl. hiermit
m=−N n=−N
auch das bekannte Cauchy-Produkt bei Potenzreihen, dessen Koeffizienten ebenso durch eine diskrete Faltung entstehen). A6) Suchen Sie Beispiele in Formelsammlungen wie L. Råde, B. Westergren (2000). A7) Die Fourierreihe des Rechteckmäanders lautet F (t) =
∞ 4 X sin((2k − 1)t) . π 2k − 1 k=1
∞ 4X Gliedweise Differentiation führt auf die Reihe cos((2k − 1)t). π k=1
Für t = (2m + 1)π/2, m ∈ Z, und alle k ∈ N ist cos((2k − 1)(2m + 1)π/2) = 0. An diesen Stellen hat die Reihe den Grenzwert Null. Sonst divergiert die Reihe: Die Annahme cos((2k − 1)t0 ) → 0 für ein t0 6= (2m + 1)π/2, k → ∞, führt auf cos(2kt0 ) cos(t0 ) =
1 [cos((2k + 1)t0 ) + cos((2k − 1)t0 )] → 0, 2
also cos(2kt0 ) → 0 für k → ∞; analog hätte man sin(2kt0 ) → 0 oder sin(t0 ) = 0 .
Man erhält den Widerspruch t0 = mπ für ein geeignetes m ∈ Z und damit | cos((2k − 1)t0 )| = 1 für k ∈ N oder cos2 (2kt0 ) + sin2 (2kt0 ) → 0 für k → ∞. ∞ X π2 1 1 n+1 1 = = , Beispiel 1, S. 42: (−1) . A8) Beispiel 1, S. 32: 4n2 − 1 2 n2 12 n=1 n=1 ∞ X
Mit der Fourierreihe zu f (t) = t(π−|t|), t ∈]−π,π[:
∞ X
(−1)n+1
n=1
1 π3 = . (2n − 1)3 32
A9) Lernen Sie, mit den Möglichkeiten von Computeralgebra- oder Numerik-Software zu Ihrem Nutzen umzugehen. A10) Der Beweis der Aussage – einer Vermutung von L. Fej´er – geht auf E. Landau (1933) N X sin(kt) . Es gilt S1 (t) > 0 in ]0,π[. Sei nun SN −1 (t) > 0 zurück. Sei SN (t) = k k=1 in ]0,π[ als Induktionsvoraussetzung angenommen. Aus der Annahme SN (t) ≤ 0 für ein t ∈]0,π[ folgt, dass es ein t0 in ]0,π[ gibt, so ′ dass SN (t0 ) ≤ 0 ist und SN bei t0 ein lokales Minimum hat, also SN (t0 ) = 0. ′ SN (t) =
sin((N + 1/2)t) − sin(t/2) 2 sin(t/2)
für t 6= 2πn, n ∈ Z,
426
C Lösungen zu den Übungsaufgaben also dann mit 0 < t0 /2 < π/2: sin((N + 1/2)t0 ) = sin(t0 /2) > 0, und bei Phasenverschiebung um π/2 auch | cos((N + 1/2)t0 )| = cos(t0 /2) > 0 .
Mit sin(N t0 ) = sin((N + 1/2)t0 ) cos(t0 /2) − cos((N + 1/2)t0 ) sin(t0 /2) also sin(N t0 ) ≥ 0, und daraus der Widerspruch SN −1 (t0 ) ≤ SN (t0 ) ≤ 0 .
Die Funktionen SN sind ungerade, also SN (t) < 0 in ] − π,0[ für alle N ∈ N. Der Sägezahn kann daher mit ε > 0 in Toleranzbereichen B der folgenden Gestalt approximiert werden: Si(π)
−π
π/2 ε ε
Bereich B mit Gibbs-Phänomen ε > 0 beliebig klein
π ε ε −π/2 −Si(π)
A11) (a) folgt mit z = ejt durch Berechnung des Imaginärteils von
n X
zk.
k=1
(b) Gliedweise Integration wie auf S. 38 ergibt ˆt
f (x) dx =
0
∞
∞
k=1
k=1
X bk X −bk cos(kt) + ak sin(kt) a0 t+ + < ∞. 2 k k
Anmerkung: Die Integrierbarkeit von f auf [0,2π] würde nach einer allgemeineren Variante des Satzes von Dirichlet als im vorliegenden Text für die Darstellbarkeit der Integralfunktion durch ihre Fourierreihe schon ausreichen. Bemerkenswert ist, dass im Gegensatz zu den Sinuskoeffizienten einer klassischen ∞ X Fourierreihe bei den Cosinuskoeffizienten nicht ak /k < ∞ gelten muss. Beispiel: Die Fourierreihe
∞ X
k=1
cos(kt)/ ln(k) (A. Zygmund (2003), dort V.1).
k=2
(c) folgt mit an = sn − sn−1 , s0 = 0 und (d) Mit rn =
n X
k=1
n X
k=1
sk−1 bk =
n X
k=1
sk bk+1 − sn bn+1 .
ak bk und (c) folgt für n > m, dass |rn − rm | ≤ 2M bm+1 ,
und hieraus mit dem Cauchy-Konvergenzkriterium die Aussage. Insbesondere: Ersetzt man die Zahlen ak , bk durch Funktionen ak (t), bk (t) auf einem abgen X schlossenen Intervall I, so dass in I die Partialsummen ak (t) gleichmäßig k=1
C Lösungen zu den Übungsaufgaben
427
beschränkt bleiben und die bk (t) monoton und gleichmäßig von oben gegen ∞ X Null konvergieren, dann konvergiert ak (t)bk (t) auf I gleichmäßig. k=1
(e) Der erste Teil folgt aus (a) und (d) mit ak (t) = sin(kt), bk (t) = 1/ ln(k). k+1 ˆ ∞ X 1 dx 1 divergent: > für k ≥ 2 und Andererseits ist k ln(k) k ln(k) x ln(x) k=2 k b lim ln(ln(x)) 2 = ∞. Daher folgt nun aus (b): Die Reihe stellt keine auf [0,2π] b→∞
integrierbare Funktion dar. Für mehr Einzelheiten darüber, wann trigonometrische Reihen Fourierreihen im klassischen Sinn sind und warum Fourierreihen seit Riemann auch Anlass geboten haben, über den Integralbegriff nachzudenken, siehe N. K. Bary (1964), A. Zygmund (2003) oder auch das Buch von C. S. Rees, S. M. Shah, C. V. Stanojevi´c (1981). In Abschnitt 8.1 zeigt sich, dass eine Unterscheidung zwischen trigonometrischen Reihen einerseits und Fourierreihen andererseits nicht mehr nötig ist, wenn wir alle konvergenten trigonometrischen Reihen einfach als periodische Distributionen lesen.
Zu den Aufgaben von Kapitel 5 A1) (a) K ≈ 0.53, (b) K ≈ 0.44 X 2 a A2) (f ∗ g)2π (t) = j k+1 2 3 (−1)k − 1 ejkt ist stetig differenzierbar. π k k6=0
A3) Die T -periodische Übertragungsfunktion gT und Ua lauten mit ω0 = 2π/T gT (t) =
+∞ X
k=−∞
Ua (t) = −
R R−
k 2 ω02 RCL
+ jkω0 L
ejkω0 t
+∞ 2 X U0 R ej2kω0 t π (4k 2 − 1)(R − k 2 ω02 RCL + jkω0 L) k=−∞
A4) Für n = Grad P ≥ 3 folgt aus der Dreiecksungleichung |P (z)| ≥ |z|n−1 für n X |z| > |ak | > 1 (an = 1) und damit |P (jk)|−1 ≤ |k|−2 für genügend große |k|. k=0
Für n = 2 und hinreichend große |k| ist |P (jk)|−1 ≤ |k 2 − a0 |−1 ≤ |k|−3/2 .
A5) Berechnen Sie die Fourierkoeffizienten der auf ]0,2π[ betrachteten Funktion e−a0 t . Folgern Sie hieraus die Aussagen der Aufgabe und die auf S. 52 angegebenen einseitigen Grenzwerte π(coth(a0 π) ± 1) für t → 0 und t → 2π.
428
C Lösungen zu den Übungsaufgaben
A6) u(r,φ) =
∞ U0 4U0 X r k cos((2k − 1)φ) + 2 2 π R (2k − 1)2 k=1
A7) Mit den Koeffizienten an , bn von S. 59 und den Additionstheoremen nπ 1 h nπ nπ i cnπ sin t sin x = (x + ct) + sin (x − ct) cos l l 2 l l nπ nπ nπ cnπ cos (x − ct) − cos (x + ct) = 2 sin x sin t l l l l sowie an = An sin(ϕn ), bn = An cos(ϕn ) folgen die angegebenen Darstellungen. √ A8) Der Ansatz u(x,t) = v(x)w(t) ergibt mit λn = nπ k/l, den Fourier-Sinuskoeffi∞ nπ X 2 zienten bn von f und Superposition die Lösung u(x,t) = bn e−λn t sin x . l n=1 A9) Mit dem Ansatz v(x,t) =
∞ X
vk (t) sin(kπx/l) erhält man durch Koeffizientenver-
k=1
gleich die Gleichung vk′′ (t) + ωk2 vk (t) = Fk (t), ωk = ckπ/l. Hieraus folgt die ˆt 1 Fk (τ ) sin(ωk (t − τ )) dτ (Variation der Konstanten oder Lösung mit vk (t) = ωk 0
später mit Grundlösung, S. 182). Berechnen Sie mit einem Computeralgebra-System explizit die Lösung17 für f = g = 0, F (x,t) = A sin(ωt) mit A > 0, ω > 0. ∞ X
nπx
n 2 π 2 c2 − κ2 . Die 2 l l n=1 an = fn die Fourierkoeffizienten der Anfangsauslenkung f , bn = (gn + κfn )/λn mit den Fourierkoeffizienten gn von g. Die Schwingung ist mit der Zeit exponentiell abklingend. Für das inhomogene Problem16 : siehe etwa G. P. Tolstov (1976).
A10) u(x,t) =
2 A11) bk = kπ
ˆπ 0
e−κt (an cos(λn t) + bn sin(λn t)) sin
cos(kϕ − kε sin(ϕ)) dϕ =
A12) Für n > N ist yn =
N X
k=0
, λ2n =
2 Jk (kε), Jk k-te Besselfunktion erster Art. k
b ak cos((n − k)ωT ) = ℜ |b h(ω)| ej(nωT +arg(h(ω)) .
A13) P ist wegen Wm (tn − tk ) = 2m für n = k, Wm (tn − tk ) = 0 für n 6= k an den Knoten tk (k = 0, . . . ,2m − 1) interpolierend und damit das eindeutig bestimmte trigonometrische Interpolationspolynom P2 für f im Raum Vm (vgl. S. 78). 17
Vgl. bei Interesse Notebooks des Autors unter der URL www.stiftung-swk.de/mathematica/.
C Lösungen zu den Übungsaufgaben
429
A14) Mit N = 15 ist b c0 = (f (0) − f (π−))/(2N ), und mit den Fourierkoeffizienten ck +∞ X von f ist b c1 = c1+mN + (f (0) − f (π−))/(2N ). Das zugehörige trigonomem=−∞
trische Interpolationspolynom interpoliert bei Null den Wert 1 und kann daher nicht ungerade sein. Eine DFT nach Änderung von f mit dem Wert f (0) = 0 ergibt eine ungerade Interpolationsfunktion für die dann ungerade 2π-periodisch fortsetzbare Funktion, die aber, anders als in Abschnitt 5.7 vorausgesetzt, nicht stetig in [0,π[ ist. X X ′′ ′′ A15) P2 (t) − f (t) = (b ck − ck ) ejkt − ck ejkt . Die Aussage folgt dann mit |k|≤N/2
|k|≥N/2
der Dreiecksungleichung aus b ck − ck =
X
ck+l N . Fehlerabschätzungen nach
l∈Z,l6=0
anderen Kriterien finden Sie z.B. bei M. Hanke-Bourgeois (2008).
A16) Man braucht mindestens 320 Abtastwerte in 2 s, also Abtastfrequenz ν ≥ 160 Hz. A17) a) b c24 6= 0 und b c104 6= 0. b) 28 Hz-Alias: b c28 6= 0, b c100 6= 0.
A18) Die DFT-Werte können erzeugt sein durch jede Linearkombination von Schwingungen mit den Frequenzen 45, 211, 301, 467 oder 557 Hz. Um solche Mehrdeutigkeiten auszuschließen verwendet man in der Praxis Anti-Alias-Filter.
A19) Mit m = 2000, N = 400, T = 0.2 · 10−3 s detektiert man mit Unterabtastung durch eine DFT der Zeitdauer T mit N Abtastwerten die Schwingung f mit den DFT-Koeffizienten b c30 = −j/2 und b c370 = j/2 (vgl. S. 68).
A20) Man setze z = 2˜ c1 /A mit dem erhaltenen DFT-Koeffizienten c˜1 für den Pilotträger. Man erhält das Spektrum (ck )−4≤k≤4 von f mit N = 8 aus den DFT-Koeffizienten c˜k durch c0 = c˜0 , ck = c˜k z −k und c−N/2+k = c˜N/2+k z N/2−k für 1 ≤ k < N/2, und cN/2 = c−N/2 = c˜N/2 /(z N/2 + z −N/2 ). A21) Wenden Sie die IDFT auf die Faltung der DFT-Koeffizienten der xn und yn an und rechnen Sie analog wie auf S. 75. Beachten Sie eventuell andere Normierungen bei anderen Autoren und bei Software. A22) Verwenden Sie ein Computeralgebra-System zur Lösung. Sie werden feststellen, dass die Clenshaw-Curtis-Quadratur i.A. besser als die Trapezregel ist.
A23) Erstellen Sie ein Programm zur Lösung der Aufgabe. Sie können das Beispiel auch bei den Mathematica-Notebooks unter der URL http://stiftung-swk.de/mathematica/ des Autors finden. A24) hTn , Tm iw ergibt Null für n 6= m, π/2 für m = n ≥ 1, π für m = n = 0. Es gilt Tk (x) = ℜ(z k ) für z = ejϕ , ϕ = arccos(x). Aus der Periodizität der komplexen Exponentialfunktion folgt, dass an den Stellen xn = cos(nπ/m), 0 ≤ n ≤ m alle Tschebyscheff-Polynome Tn , T2m−n , T2m+n , T4m−n , T4m+n , T6m−n . . . gleiche Werte haben. Die Funktion f hat also an den Stellen xn lauter Nullstellen.
430
C Lösungen zu den Übungsaufgaben
A25) Man erhält mit L : [−1,1] → [−3,7], L(t) = 5t + 2, für g das gleiche Interpolationspolynom P wie in Aufgabe 22 mit 13 Tschebyscheff-Abszissen xn als Knoten. Das umskalierte Polynom P ◦ L−1 interpoliert f an den Knoten L(xn ). A26) (a) Beide Seiten stimmen für reelle Variable überein und sind ganze Funktionen auf R. Daher gibt es eine eindeutig bestimmte analytische Fortsetzung auf C. Diese ist dann durch (a) angegeben. (Identitätssatz für Potenzreihen). p p p 2 2 2 (b) Es gilt stets p w(z) = z ± z − 1, wegen2 z − 1 = ±z 1 − 1/z also 2 w(z) = z ± z 1 − 1/z . Für |z| > 1: 1 − 1/z liegt im Kreis pum Eins mit Radius r = 1, mit dem Hauptwert der Wurzel also −π/4 < arg( 1 − 1/z 2) < π/4, p 2 daher ℜ( 1 − 1/z p ) > 0. Damit folgt für w wie im Fall |z| > 1 angegeben, dass 2 |w(z)| = |z| |1 + 1 − 1/z p| > |z| > 1 ist. p Für |z| ≤ 1, z ∈ / [−1,1] ist z 2 − 1 = ±j 1 − z 2 . Im oberen Halbkreis ℑ(z) > 0 p 2 gilt das Plus-Vorzeichen: Für jε, ε > 0 folgt damit |w(jε)| = ε+ 1 + ε > 1. Gäbe es ein z0 im oberen Halbkreis mit |w(z0 )| ≤ 1, dann wegen Stetigkeit von |w(z)| auch ein z1 auf dem Geradenstück von jε nach z0 mit |w(z1 )| = 1. Das wäre ein Widerspruch, da dann z1 ∈ [−1,1] wäre. Also |w(z)| > 1 im oberen Halbkreis. Die angegebene Formel für den unteren Halbkreis sieht man analog p p mit w(−jε) = −jε − j 1 + ε2 durch Betrachtung des Betrags |w(−jε)| = ε + 1 + ε2 > 1. Um Tn (z) = (wn + w−n )/2 zu sehen, setzen Sie z = cos(x + jy) und berechnen Sie (wn + w−n )/2. Zu (c): Die Pole von Q liegen auf einer Ellipse mit den Brennpunkten ±jωg symmetrisch zur rellen und zur imaginären Achse. Die Lösungen der zwei Gleichungen cos(n(x + jy)) = cos(nx) cosh(ny) − j sin(nx) sinh(ny) = ±j/ε zeigen jeweils alle Pole von Q. Die gesuchten n Pole zk /(jωg ) = cos(xk + jyk ) mit negativen Realteilen erhalten Sie mit den angegebenen xk ∈ ]0,π[ und dann stets sin(xk ) > 0, wenn Sie konstant yk = y = − arsinh(1/ε)/n < 0 aus den Gleichungslösungen auswählen. (d) Programmieren Sie die Lösung der Aufgabe. Sie können das Beispiel auch bei den Mathematica-Notebooks unter der URL http://stiftung-swk.de/mathematica/ des Autors finden.
Zu den Aufgaben von Kapitel 6 A1)
n−1 X k=0
2j sin ((2k + 1)πt) = −4
A2) Si(π) ≈
4 X
(−1)k
k=0
ejnπt
2
− 2 + e−jnπt ejπt − e−jπt
2 !
=
sin2 (nπt) . sin(πt)
π 2k+1 ≈ 1.852 . (2k + 1)!(2k + 1)
A3) n-te Partialsumme des Sägezahns: Sn′ (0) = n, Steigung des Fejér-Mittels n/2.
C Lösungen zu den Übungsaufgaben
431
1 A4) Man modifiziert den Beweis des Fejér-Satzes auf S. 110 mit T
T /2 ˆ
Kn (t) dt = 1.
−T /2
Eine Reihe gebräuchlicher Summationskerne finden Sie etwa bei J. S. Walker (1988). 2 A5) f (t) = (S(t) − S(t − π)), S die Sägezahnfunktion. Hieraus folgt die Aussage π mit Aufgabe A10 aus Kapitel 4. A6) (a) Durchsicht des Beweises zum Satz von Dirichlet auf S. 108 zeigt, dass die Integrierbarkeitsbedingung und die Existenz der einseitigen Grenzwerte von f und der rechts- und linksseitigen Ableitungen bei t0 ausreichen, um die Konvergenz der Fourierreihe gegen (f (t0 +) + f (t0 −))/2 zu erhalten. (b) Es genügt die Integrierbarkeit auf [0,π/3] zu zeigen. π/3 ˆπ/3 ε ˆ t cos(t/2 f (t) dt = −ε ln 2 sin dt . − 2 2 sin(t/2) ε
ε
Der erste Summand der rechten Seite verschwindet für ε → 0, im zweiten Summanden bleibt der Integrand dabei beschränkt. (c) f ist 2π-periodisch, gerade. Für die Fourier-Cosinus-Koeffizienten folgt durch Integration a0 = 0 und für an , n ≥ 1, mit S(0+) = π/2 und sin(nt) cos(t/2) = 1/2 · (sin((n + 1/2)t) + sin((n − 1/2)t) nach partieller Integration an = −1/n. Da f für alle t 6= 2kπ, k ∈ Z, differenzierbar ist, folgt nun (c) aus (a).
(d) Mit x = t − π folgt ln |2 cos(x/2)| = ln |2 sin(t/2)| und damit das Ergebnis. A7) Die Lösung ist die Ritz-Galerkin-Lösung u4 auf S. 213, Abschnitt 8.5.
Zu den Aufgaben von Kapitel 7 A1) T ist die Dirac-Distribution δ. G, H und R sind stetig auf D, aber nicht linear. S ist nicht für alle ϕ aus D definiert, z.B. ϕ(t) = et h(t) mit einer Testfunktion h = 1 in einer Nullumgebung. U ist eine Distribution. ¨ = 2δ(t). ˙ = 0, tδ(t) ¨ = −2δ(t), ˙ ˙ = −δ(t), t2 δ(t) t2 δ(t) A2) tδ(t) (m) A3) Wenden Sie pf (t−2 ), pf (t−2 auf eine Testfunktion tϕ(t) an (siehe S. 139). + ) und δ
1 A4) vp (t−1 ) = α(t) vp (t−1 ) + (1 − α(t)) mit einer Testfunktion α ≥ 0, α = 1 in t einer Nullumgebung. A5) Die Aussage folgt aus der Definition des Cauchy-Hauptwerts mit dem Mittelwertsatz und dem Lebesgueschen Satz über majorisierte Konvergenz (Anhang B, S. 416).
432
C Lösungen zu den Übungsaufgaben
A6) h(tλ+ )′ , ϕi = − lim
ε→0
ˆ∞
tλ ϕ′ (t) dt . Die Aussage folgt durch partielle Integration mit
ε
ϕ′ (t) dt = du, u(t) = ϕ(t)− ϕ(0), v(t) = tλ und Anwendung des Mittelwertsatzes. h π i ˙ + 2s t − π . + δ(t) + αδ(t) A7) f¨(t) = − sin(t) s(t) − s t − 2 2 Veranschaulichen Sie das Ergebnis mit einer Skizze. A8) Für ψh (t) = (ϕ(t + h) − ϕ(t))/h, h 6= 0, gilt nach dem Mittelwertsatz mit einem geeigneten λ ∈]0,1[: |ψh (t) − ϕ′ (t)| = |ϕ′ (t + λh) − ϕ′ (t)| ≤ sup |ϕ′′ (t)| |h|, t∈R
d.h., für h → 0 konvergieren die Funktionen ψh gleichmäßig gegen ϕ′ . Analog zeigt man für Ableitungen von ψh beliebiger Ordnung n die gleichmäßige Konvergenz gegen die Ableitung ϕ(n+1) von ϕ für h → 0. D.h., ψh → ϕ′ in D für h → 0. Für ϕ ∈ D folgt damit aus der Stetigkeit von Distributionen T auf D ϕ(t − ∆t) − ϕ(t) T (t + ∆t) − T (t) −→ hT (t), − ϕ′ (t)i . ,ϕ(t) = T (t), ∆t→0 ∆t ∆t
sin(t) − t ist stetig ergänzbar für t = 0 mit f (t) = 0. Riemann-Lebesguet sin(t) ˆπ/2 f (t) sin((2n + 1)t) dt = 0. Hiermit folgt (a). Lemma: lim
A9) (a) f (t) =
n→∞
0
(b) Man erhält (vgl. Rechnungen zu Sägezahnfunktion und Gibbs-Phänomen) ˆ∞ 0
" t=π/2 # n X sin(t) π π sin(2kt) = . dt = lim +2 n→∞ 2 t 2k 2 t=0 k=1
(c) Für ϕ ∈ D: ˆ∞ ˆ∞ ˆ∞ sin(nt) ϕ(t) − ϕ(0) sin(nt) ϕ(t) dt = dt + ϕ(0) dt . sin(nt) πt πt πt −∞ −∞ −∞ {z } | =1
ϕ(t) − ϕ(0) ist stetig, beschränkt, und hat einen beschränkten Träger. Deshalb πt verschwindet das erste Integral auf der rechten Seite für n → ∞ , und das heißt D′ -lim n→∞
1 (d) Aus 2π
ˆn −n
e
jωt
sin(nt) = δ(t). πt
sin(nω) ergibt sich dann D′ -lim dt = n→∞ πω
ˆn
−n
ejωt dt = 2πδ(ω).
C Lösungen zu den Übungsaufgaben A10) Aus T (t) = −π
∞ X
k=−∞
433
˙ − 2kπ) folgt hT (t) , ϕ(t − 1 )i = π 16 e−4/3 . δ(t 2 9
˙ − a) ∗ s(t − b) = δ(t − (a + b)), (b) δ(t ˙ − a) ∗ δ(t ˙ − b) = δ(t ¨ − (a + b)) A11) (a) δ(t t−a ˆ (c) s(t − a) ∗ f (t) = f (u) du (d) (t − (a + b))s(t − (a + b)) −∞
(e) s(t) ∗ [ln(t + 1)s(t + 1)] = s(t + 1)[ln(t + 1) − 1](t + 1) +∞ ˆ 2 1 −v 2 /2 e e−u /2 dy mit = ∗ A12) Nach dem Hinweis folgt 2πστ −∞ √ στ σ 2 m2 + τ 2 (x − m1 ) σ2 + τ 2 √ . Mit dy = √ y− u= du ergibt sich 2 2 2 στ σ +τ σ + τ2 1 Gm σ
1 Gm σ
∗
2 Gm τ (x)
2 Gm τ (x)
2 1 e−v /2 = √ 2 2 2π σ + τ
+∞ ˆ 2 e−u /2 du .
−∞
A13) Für ~x im Komplement von Tr (f ) + Tr (g) gilt bei beliebigem ~y ∈ Rn wegen ~x = ~y + (~x − ~y) immer ~y 6∈ Tr (f ) oder (~x − ~y) 6∈ Tr (g), also f (~y)g(~x − ~y) = 0 und damit (f ∗ g)(~x) = 0. A14) Für x 6∈ Tr (T ) gibt es eine Umgebung U von x, so daß für alle ϕ ∈ D mit Tr (ϕ) ⊂ U gilt: hT,ϕi = 0. Wäre x ∈ Tr (T˙ ), dann gäbe es ein ϕ ∈ D mit Tr (ϕ) ⊂ U und hT˙ , − ϕi = hT,ϕ′ i 6= 0. Wegen Tr (ϕ′ ) ⊂ Tr (ϕ) wäre dies ein Widerspruch zu x 6∈ Tr (T ). Also gilt R \ Tr (T ) ⊂ R \ Tr (T˙ ).
˙ ∗ s = 0 6= 1 = 1 ∗ (δ˙ ∗ s) mit der Einheitssprungfunktion s. A15) (1 ∗ δ)
A16) Man wähle a > 0 mit Tr(G) ∩ ] − a,a[= ∅, ψ ∈ D mit Tr(ψ) ⊂ [−a,a], 0 ≤ ψ ≤ 1 und ψ = 1 in [−a/2 , a/2]. Mit g(t) = (1 − ψ(t))/t ist dann T0 = gG eine spezielle Lösung, T0 + kδ (k ∈ C) die allgemeine Lösung von tT (t) = G(t). A17) Zum Beispiel T = δ m mit m ≥ n.
˙ A18) Die Lösungen lauten s(t), eαt s(t) und δ. ′ A19) Es gilt S˙ = s′ ∗ T = δ ∗ T = T . Für U ∈ D+ mit U˙ = T ist (S − U )′ = 0, also S − U = c konstant. Aus der Trägerbedingung folgt c = 0, also U = S.
A20) Da man eine Gleichung n-ter Ordnung (auch im Sinn von Distributionen) in ein System ~y ′ = A(t)~y erster Ordnung überführen kann, genügt es, solche Systeme zu betrachten. Für eine beliebige Lösung ~y ∈ D′n , eine Fundamentalmatrix F (t) des Systems mit F (0) = E (Einheitsmatrix) und ~u = F −1 ~y folgt durch Differentiation mit ~y ′ − A~y = ~0, dass F ~u ′ = 0, also ~u = ~c konstant. Daher ist y eine Linearkombination der Spalten von F , die aus unendlich oft differenzierbaren Funktionen bestehen.
434
C Lösungen zu den Übungsaufgaben
Zu den Aufgaben von Kapitel 8 2A 2A 4A δ(t + T ) − δ(t + T /2) − δ(t − T /2). T T T Darstellung der zugehörigen periodischen Impulsfolge durch eine verallgemeinerte Fourierreihe und zweimaliges (verallgemeinertes) gliedweises Differenzieren der Fourierreihe von f (t) liefert mit ω0 = π/T und Koeffizientenvergleich
A1) Für −T ≤ t < T ist f¨(t) =
3A 4A cos(2ω0 t) cos(3ω0 t) f (t) = + 2 cos(ω0 t) − + ∓ ... . 4 π 2 9 A2) Impulsantwort. Man löst das homogene Anfangswertproblem (vgl. S. 182) ¨ (t) + RC U˙ (t) + U (t) = 0, U (0) = 0, U˙ (0) = 1 . LC U LC Mit den Nullstellen des charakteristischen Polynoms P und den Bezeichnungen ωd = √
1 R > 0, ω1 = |α2 − ωd2 |1/2 > 0, α = 2L LC
ergeben sich drei Fälle für die Impulsantwort h(t). Die Funktion s(t) bezeichnet die Einheitssprungfunktion. (a) ωd = α
(doppelte reelle Nullstelle von P ): h(t) = ωd2 t e−αt s(t)
(b) ωd < α
(zwei reelle Nullstellen von P ): h(t) =
(c) ωd > α (komplexe Nullstellen von P ): h(t) =
ωd2 sinh(ω1 t) e−αt s(t) ω1
ωd2 sin(ω1 t) e−αt s(t) ω1
Sprungantwort. a(t) = (h ∗ s)(t). ωd2 1 − e−αt −αt e−αt s(t) 2 α α −αt s(t) (b) a(t) = 1 − (cosh(ω1 t) + sinh(ω1 t)) e ω1 α (c) a(t) = 1 − (cos(ω1 t) + sin(ω1 t)) e−αt s(t) ω1 (a) a(t) =
für ωd = α, für ωd < α, für ωd > α.
Systemantwort auf ein Rechtecksignal. Für Ue (t) = U0 s(t) − U0 s(t − T ) ist Ua (t) = U0 (a(t) − a(t − T )). Für t → ∞ klingt Ua (t) ab, lim Ua (t) = 0. t→∞
Periodische Lösung für eine Sinusanregung. Für das Eingangssignal Ue (t) = U0 sin(ωt) berechnet man unabhängig von den 1 Werten R, C und L die Lösung mit dem Frequenzgang b h(ω) = : 1 + jωRC − ω 2 LC
C Lösungen zu den Übungsaufgaben Ua (t) = U0 ωd2
435
2αω ωd2 − ω 2 sin(ωt) − cos(ωt) . (ωd2 − ω 2 )2 + 4α2 ω 2 (ωd2 − ω 2 )2 + 4α2 ω 2
Zu (c) Wenn Sie ein System erster Ordnung so transformieren, dass die Systemmatrix A nach der Terminologie der Regelungstechnik in der sogenannten Beobachtungsnormalform wie auf S. 194 gegeben ist, dann finden Sie die Impulsantwort in der Komponente a31 s(t) von eAt s(t). Mit Maple als Hilfsprogramm können Sie eAt mit den Befehlen „with(linalg): exponential(A*t)“ berechnen lassen. A3) (a) y ′′′ + 4y ′′ + 6y ′ + 4y = f mit Inhomogenität f . (b) yH (t) = c1 e−2t +c2 e−t sin(t) + c3 e−t cos(t). 1 −2t e (c) h(t) = + e−t sin(t) − e−t cos(t) s(t), s(t) der Einheitssprung. 2 ˙ (d) X = AX + F + ~x0 δ mit Anfangswerten ~x0 , der Matrix 0 0 −4 f A = 1 0 −6 und F = 0 . 0 1 −4 0
Dann ist wie auf S. 194 die dritte Komponente von X die Lösung y aus (a). Eine Fundamentalmatrix ist G(t) = eAt . G31 (t)s(t) zeigt wieder die Impulsantwort h aus (c). Für ~x0 = ~0 und Tr(f ) ⊂ [0,∞[ ist die kausale Lösung des inhomogenen Problems die Faltung eAt s(t) ∗ F ; für stetige F ist dies die Formel der Variation der Konstanten. Beispiele mit ausgerechneten MatrixExponentialfunktionen und konkreten rechten Seiten F kann man auf der schon genannten Website des Autors unter www.stiftung-swk.de/maple_menu finden.
A4) Für |z| > l: u(0,0,z) = −γρ0
ˆ+l −l
1 p dw = −γρ0 sgn(z) ln (z − w)2
z+l z−l
.
Die Äquipotentialflächen sind Rotationsellipsoide. Mit den Substitutionen p p l1 = x2 + y 2 + (z − l)2 , l2 = x2 + y 2 + (z + l)2 ,
1 1 und elliptischen Koordinaten v = (l1 + l2 ), w = (l1 − l2 ) folgt l1 = v + w, 2 2 l2 = v − w, lz = −vw. Für das Argument der Potentialfunktion (vgl. S. 199, Abschnitt 8.4) folgt (v + l)l + w(l + v) v+l l1 + l − z = = . l2 − l − z (v − l)l + w(v − l) v−l Damit sind die Äquipotentialflächen durch die Gleichungen v = konst gegeben. Sie sind Rotationsellipsoide, da l1 + l2 = 2v die Summe der Abstände eines Punktes (x,y,z) 6∈ S zu den beiden Brennpunkten (0,0,l) und (0,0, − l) ist. Potenzreihenentwicklung des Potentials zeigt, daß u für sehr große Abstände v ≫ l dem Potential einer Punktmasse im Nullpunkt gleicht.
436
C Lösungen zu den Übungsaufgaben
A5) Für das Potential u gilt im Nullpunkt nach der Coulomb-Formel (S. 199) 1 u(~0) = 4πε0
ˆ2π ˆπ/2 0
0
σ0 cos(θ) 2 Rσ0 ≈ 169.5 kV. R sin(θ) dθ dφ = R 4ε0
A6) Für die Kugel K um Null mit Radius r und das innere Dirichlet-Problem ∆u = 0 in K, u = f auf ∂K 1 lautet die Greenfunktion G(~x,~y ) = 4π
1 r − |~x − ~y | |~y | |~x −
r2 y| |~ y |2 ~
!
.
Man kann G(~x,~y ) auch in folgender Form schreiben: 1 2 −1/2 2 2 4 −1/2 . (|~x| − 2~x · ~y + ~y · ~ y) − r(|~x| ~y · ~y − 2r ~x · ~y + r ) G(~x,~y ) = 4π Partielle Ableitung nach y1 , y2 bzw. y3 ergibt den Gradienten grady~ G(~x,~y ) für ~x ∈ K \ ∂K, ~ y = (y1 ,y2 ,y3 ) ∈ ∂K, |~y | = r: grady~ G(~x,~y ) =
(|~x|2 − r2 )~y . 4πr2 |~x − ~y|3
Für |~y | = r, ~n = ~n(~y ) = ~y /r, ~x ∈ K \ ∂K folgt die Normalableitung |~x|2 − r2 dG . (~x,~y ) = grady~ G(~x,~y ) · ~n(~y ) = d~n 4πr|~x − ~y |3 Mit Formel (8.5), S. 201, erhält man eine Darstellung des Potentials u(~x) für ~x in K \ ∂K anhand der gegebenen Randwerte: ˆ r2 − |~x|2 f (~y ) u(~x) = do(~y ) . 4πr |~x − ~y |3 |~ y|=r
Dies ist die Poissonsche Integralformel für die Kugel. Für ~x = ~0 und R < r folgt mit den Randwerten u(~y) für |~y | = R die Mittelwertformel für Potentialfunktionen ˆ 1 ~ u(~y) do(~y ) , u(0) = 4πR2 |~ y|=R
allgemeiner mit Koordinatentransformation u(~x) =
1 4πR2
ˆ
u(~y ) do(~y ) .
|~ y−~ x|=R
Damit lässt sich zum Beispiel das Maximumprinzip für Potentialfunktionen im R3 beweisen (vgl. S. 56). Interessierte Leser seien für Weiteres verwiesen auf die Literatur zur Potentialtheorie und zu partiellen Differentialgleichungen.
C Lösungen zu den Übungsaufgaben
437
A7) (a) Zu zeigen ist h∆g,hi = hg,∆hi = h(~0). für h ∈ D(R2 ). Mit dem Laplace-Operator in Polarkoordinaten berechnet man lim
ε→0+
ˆ2πˆ∞ ε
0
i)
1 ∂ 1 ∂2 ∂2 h(r,φ) r dr dφ . + + ln(r) ∂r2 r ∂r r2 ∂φ2
Mit partieller Integration folgt: ˆ∞
r ln(r)
ε
∂2 ∂h h(r,φ) dr = −ε ln(ε) (ε,φ) + (ln(ε) + 1)h(ε,φ) 2 ∂r ∂r +
ˆ∞ ε
ˆ∞ ε
ii)
1 h(r,φ) dr , r
∂ ln(r) h(r,φ) dr = − ln(ε)h(ε,φ) − ∂r
ˆ∞
und 1 h(r,φ) dr . r
ε
Da h(r,φ) in der Variablen φ 2π-periodisch ist, folgt ˆ2π 0
φ=2π 1 1 ∂2 ∂ ln(r) 2 h(r,φ) dφ = ln(r) h(r,φ) = 0. r ∂φ r ∂φ φ=0
Zusammengefasst erhält man ˆ2πˆ∞ 0
ln(r)
ε
ˆ2π 0
1 ∂ 1 ∂2 ∂2 h(r,φ) r dr dφ = + + ∂r2 r ∂r r2 ∂φ2
h(ε,φ) dφ −
ˆ2π
ε ln(ε)
∂ h(ε,φ) dφ . ∂r
0
Das erste Integral konvergiert für ε → 0+ gegen 2πh(~0), das zweite Integral ∂h gegen Null, da beschränkt ist und lim ε ln(ε) = 0 ist. ε→0+ ∂r (b) Die Green-Funktion für die Kreisscheibe K um Null mit Radius R lautet 1 |~y| R2 G(~x,~y ) = − ln(|~x − ~y |) − ln |~x − 2 ~y| . 2π R |~y | (c) Analog zur vorangehenden Aufgabe findet man für ~x ∈ K, |~y | = R, ~n = |~x|2 − R2 dG . (~x,~y ) = grady~ G(~x,~y ) · ~n = ~y/R die Normalableitung d~n 2πR|~x − ~y |2 Einsetzen in die Formel (8.5) auf S. 201, bei der entsprechend der Greenschen
438
C Lösungen zu den Übungsaufgaben Formel in der Ebene das Oberflächenintegral über den Rand der Kugel durch das Linienintegral über die Kreislinie zu ersetzen ist, ergibt für einen Punkt in K mit Polarkoordinaten (r,φ) wieder die Poissonsche Integralformel mit dem ˆ2π R2 − r 2 U (ψ) Randpotential U : u(r,φ) = dψ . 2 2 2π R + r − 2Rr cos(φ − ψ) 0
A8) (a) Mit der Methode der Spiegelladung findet man die Green-Funktion für den Halbraum H = { (x1 ,x2 ,x3 ) ∈ R3 : x1 > 0 }: G(~x,~y ) =
1 1 − . 4π|~x − ~y| 4π|~x − ~ys |
Dabei ist ~ ys = (−y1 ,y2 ,y3 ) der Spiegelpunkt zu ~y = (y1 ,y2 ,y3 ). (b) Ihre Normalableitung lautet mit ~n = (−1,0,0) und |~x − ~y| = |~x − ~ys | für ~x = x1 ∂G (~x,~y ) = − . (x1 ,x2 ,x3 ), ~ y = (0,y2 ,y3 ): grady~ G(~x,~y ) · ~n = − ∂y1 2π|~x − ~y |3 ̺ in H, u = f in der Ebene y1 = 0, an (c) Für die Lösung u von ∆u = − ε0 einer Stelle ~x ∈ H ergibt Formel (8.5), wobei das Randmaß der Kugel durch das Lebesgue-Maß in der Ebene y1 = 0 zu ersetzen ist, den Ansatz u(~x) =
+∞ ˆ +∞ ˆ ˆ ∂G ̺(~y ) f (y2 ,y3 ) (~x,~y ) G(~x,~y ) dλ3 (~y ) . dy2 dy3 + ∂y1 ε 0 y1 =0
−∞ −∞
H
(d) Mit den gegebenen Daten ̺(~y ) = qδ(~y − ~x0 ), ~x0 = (2,0,0) und u = 0 in der Ebene y1 = 0 folgt für ~x = (x1 ,x2 ,x3 ) ∈ H i q h ((x1 − 2)2 + x22 + x23 )−1/2 − ((x1 + 2)2 + x22 + x23 )−1/2 . u(~x) = 4πε0 Für weitere Potentialprobleme sei verwiesen auf W. Strauss (1995). A9) Man löse zum Beispiel mit Maple, Mathematica, Maxima oder Matlab das auf S. 217 angegebene lineare Gleichungssystem. Der Näherungswert für u(L/2,L/2) lautet 0.1827 m. Zur graphischen Darstellung wie auf S. 218 verbindet man die Näherungswerte der Lösung durch Polygonzüge. Die ganze Rechnung findet man bei Interesse auch bei den Maple-Beispielen des Autors unter www.stiftung-swk.de/maple_menu. A10) Wie in der vorangehenden Aufgabe schreibt man ein kleines Programm für ein Computeralgebra- oder Numeriksystem. Für einen inneren Knoten xk der Intervallzerlegung lautet die zugehörige Basisfunktion Hp (x − xk−1 ) für xk−1 ≤ x ≤ xk L vk (x) = Hp − (x − xk+1 ) für xk ≤ x ≤ xk+1 . L
C Lösungen zu den Übungsaufgaben
439
Mit a(u,v) und l(v) von S. 209 stellt man das Gleichungssystem auf und berechnet die gesuchten Näherungslösungen: T (L/6) ≈ 274.271 ◦ K, T (L/3) ≈ 276.414 ◦ K, T (2L/3) ≈ 279.628 ◦ K. Bemerkung: Die analytische Lösung des Problems ist stückweise linear, stetig und im vorliegenden Fall konkav. Sie lautet 3k2 x + T0 für 0 ≤ x ≤ L/3 (T1 − T0 ) L(2k1 + k2 ) T (x) = 3k1 (x − L) + T1 für L/3 ≤ x ≤ L. (T1 − T0 ) L(2k1 + k2 )
A11) Die Fourier-Reihe von f1 (x) können Sie mit Hilfe des Ähnlichkeitssatzes aus Formelsammlungen entnehmen. Für die Folge der Amplituden Ak , k ∈ N ergibt sich 1 1 4al (A1 ,A2 ,A3 ,A4 ,A5 , . . .) = 2 1,0, ,0, ,0, . . . . π 9 25
Die Obertöne werden schnell sehr schwach im Vergleich zum Grundton, die Oktave fehlt, der Ton klingt rein und weich. Für die 2l-periodische, ungerade Fortsetzung von f2 (x) ergibt die Impulsmethode ∞ X kπ 2n2 h kπ sin sin x . Für von S. 179 schnell f2 (x) = (−1)k+1 (n − 1)k 2 π 2 n l k=1 n = 2, h = al/2 ist als Spezialfall f2 (x) = f1 (x) enthalten. Für die Amplituden Ak folgt z.B. mit n = 100 näherungsweise (A1 ,A2 ,A3 ,A4 , . . .)≈
6.3428h (1 , 0.5 , 0.3312 , 0.2484 , . . .) π2
Vergleich dieser Amplitudenwerte untereinander zeigt, daß sie für wachsende k ungefähr abfallen wie 1/k, der Klang ist eher hart und grell. Dies entspricht der Erfahrung, die man beim Anzupfen einer Gitarre in der Nähe des Steges macht. Für wachsende n ∈ N wird mit f2 eine Funktionenfolge (f2,n )n∈N erzeugt, die 2h π punktweise gegen den Sägezahn − S (x − l) konvergiert (vgl. S. 35). π l kπ 2n2 h für sin Entsprechend konvergieren die Amplituden Ak,n = (n − 1)k 2 π 2 n 2h n → ∞ gegen die Amplituden A˜k = dieses Sägezahns. Die Lösungen der kπ Schwingungsgleichung sind für die Auslenkungen f1 (x) und f2 (x) nicht differenzierbar, also nur als Distributionslösungen zu verstehen.
440
C Lösungen zu den Übungsaufgaben
A12) Zu (a) und (b): Die Impulsantwort ist h(t) = ts(t), s(t) der Einheitssprung. Naive n X Diskretisierung der Faltungsgleichung in der Form x(tk ) = ∆ h(tk − si )f (si ) i=1
mit ∆ = T /n, 1 ≤ i,k ≤ n und äquidistanten Stützstellen führt auf eine numerische Lösung wie nachfolgend im linken Bild (exakte Lösung dick, numerische Lösung stark oszillierend mit wachsender Amplitude). Tichonov-Regularisierung wie angegeben mit der gleichen Systemmatrix A zur Lösung im rechten Bild, wobei die exakte Lösung dick mit offset +0.1 dargestellt ist, damit man die zwei Kurven deutlich unterscheiden kann. Die Determinante von A im Beispiel ist ungefähr 10−200 .
1 t e−t/(RC) s(t). Verfälschen Sie die (RC)2 Lösung x(t) der Faltungsgleichung für ω0 = 2 rad/s, RC = 1 s, U0 = 1 V
Zu (c): Die Impulsantwort ist h(t) =
U s(t) 0 , (h ∗ f )(t) = x(t) = −4 cos(ω0 t) − 3 sin(ω0 t) + e−t/(RC) (4 + 10 ω0 t) 25
und berechnen Sie damit numerische Näherungslösungen für das inverse Problem. Sie bekommen qualitativ ähnliche Ergebnisse wie in (a) und (b). Nehmen Sie für die Rechnungen ein Computeralgebra-Programm wie Mathematica oder Maple zu Hilfe.
Zu den Aufgaben von Kapitel 9 √ 2 1 ω2 4j b 2 b b e−ω /4 , , f2 (ω) = 3 , f3 (ω) = π − A1) f1 (ω) = jω ω 2 4 r π −(ω2 +2jωb)/(4a) c+b2 /(4a) b b e e f4 (ω) = , f5 (ω) = 2πj − e−ω s(ω) + δ(ω) . a
A2) f (t) =
U0 T sin(ω0 t) sin(2ω0 t) πω0 t2
b A3) F\ a ∗ Fb = Fa+b
C Lösungen zu den Übungsaufgaben
A4)
ˆ∞
441
π sin(ax) sin(bx) dx = min(a,b) x2 2
0
1 A5) g(t) = 2π
ˆ+Ω fb(ω) ejωt dω ist die Orthogonalprojektion von f auf den Teilraum
−Ω
P WΩ von L2 (R), welcher die durch Ω bandbegrenzten Funktionen enthält. sin(ωT ) b sgn(ω) A6) S(ω) = −2πj ω
A7) Etwa f (t) = s(t) Einheitssprungfunktion für (a) und (b), g(t) = cos(ωt)s(t). ( 2(ω cos(1) sin(ω) − sin(1) cos(ω)) für |ω| 6= 1 A8) fb(ω) = ω2 − 1 1 + sin(2)/2 für |ω| = 1. Der Multiplikationssatz gilt, da cos c einen kompakten Träger hat und die Fouriertransformierte von s(t + 1) − s(t − 1) eine langsam wachsende unendlich oft differenzierbare Funktion ist. A9) Zu (a) und (c): Es gilt f = h. Man siehe auch Beispiel 1 auf S. 288. 1 1 1 p p (b) Mit fb(ω) = − − jωb 2b(jω − j b/a) 2b(jω + j b/a) folgt mit den Korrespondenzen auf S. 253 r !! √ !2 1 1 b ab 1 − cos t sgn(t) = sin t sgn(t). f (t) = 2b a b 2a A10) a) F −1 (fb)(t) = j 4 ej3t + e−j3t e−2t s(t). b) Mit cos(x)2 = (1 + cos(2x))/2 und cos(x + π/2) = sin(−x) erhält man durch partielle Integration mit S. 231 (b hRC,α ist reellwertig und gerade) hRC,α )(t) =
sin(bt) cos(at) , πt 1 − (2at/π)2
später mit b = π/ta , a = αb die Pulsform auf S. 333, mit b = T /2, a = αb und der Regel F (fb)(t) = 2πf (−ω) die Korrespondenz zwischen p und pb auf S. 339. Man verifiziere trotz unterschiedlicher Form: b hRC,α (t)/(2b) = b hRC,α (t)/T = p(t).
2 2 π A11) fb1 (ω1 ,ω2 ) = − ω1 ω2 e−(ω1 +ω2 )/4 . Um fb2 zu erhalten, ist die Fouriertransformier4 te der Kreisblende auf S. 267 mit e−j(ω1 +ω2 ) zu multiplizieren.
A12) f ist stetig und beschränkt, also gehört mit f auch f˙ zu S ′ . Die mit der Kettenregel berechnete Ableitung ist die verallgemeinerte Ableitung von f als Distribution in D′ . Diese ist aber nicht temperiert. Die verallgemeinerte Ableitung von f als stetiges lineares Funktional auf S ist eine Fortsetzung dieses Funktionals von D auf S.
442
C Lösungen zu den Übungsaufgaben
2n! 1 2 ˙ g (ω) = , b h(ω) = − 2 + jπ δ(ω), A13) fb(ω) = − 2 , b n+1 ω (jω) ω (−j)n πω n−1 pb(ω) = sgn(ω), qb(ω) = 2 pf(|ω|−λ ) cos(λπ/2) Γ(λ). (n − 1)!
p π ; f ist also für a = π/2 a cosh(πω/(2a)) √ eine Eigenfunktion der Fouriertransformation zum Eigenwert 2π.
A14) Die Fouriertransformierte ist fb(ω) =
A15) (a) Verwenden Sie den Transformationssatz für Integrale (vgl. Anhang B, S. 417). Berechnen Sie zuerst F (ϕ ◦ AT ) für die transponierte Matrix AT und ϕ ∈ S(Rp ), damit dann F (TA ). (b) Bilden Sie mit einer Matrix A das Parallelogramm auf das Quadrat −1 ≤ x,y ≤ 1 4 ab. Mit (a) folgt dann fc sin(ω1 ) sin(ω1 + ω2 ). P (ω1 ,ω2 ) = ω1 (ω1 + ω2 )
Zu den Aufgaben von Kapitel 10 A1) Der Widerstand R stellt den Verbraucher dar. 1 . |b h(ω)| = p 2 (1 − 2LCω )2 + 4ω 2 L2 /R2
ca → U ce für ω → 0 und U ca → 0 für |ω| → ∞. Die Schaltung ist ein Tiefpaß; es gilt U
A2) Der Filtergrad ist n = 6, die Grenzfrequenz ωg /(2π) ist 3.397 kHz.
A3) (a) Mit den komplexen Impedanzen Z1 = 1/(jωC1), Z2 = 1/(jωC2) und den üblichen Bezeichnungen der Wechselstromrechnung mit Großbuchstaben gilt V1 V1 − Vout Vin − V1 = + . Die Spannung v+ am OpeI1 = I2 + I3 und R1 R2 + Z2 Z1 rationsverstärker findet man wie bei einem Spannungsteiler mittels v1 : V + = V1 Z2/(R2 + Z2). Der „op-amp“ ist gegengekoppelt, d.h. im stationären Zustand wird die Eingangsspannung des op-amp Null, also gilt dann vout = v+. Aus der letzten Gleichung folgt dann V1 = Vout (R2 + Z2)/Z2. Hieraus mit der zweiten Gleichung Vout = Vin Z1Z2/(Z1Z2 + Z1(R1 + R2) + R1R2). Schließlich Vout 1 b h(ω) = = . Vin 1 + jωC2(R1 + R2) − ω 2 R1R2C1C2
(b) Koeffizientenvergleich der Lösung aus (a) mit dem Butterworth-Frequenzgang ergibt R1 = R2 = 2813.49 Ω. (c) Man erhält ein Hochpass-Filter mit der Übertragungsfunktion HHP (s) =
s2 1 + s2 + s( R2C1
1 R2C2 )
+
1 R1R2C1C2
.
C Lösungen zu den Übungsaufgaben
443
Koeffizientenvergleich mit dem Butterworth-Polynom analog zu (b) ergibt R2 = 2R1, R1 = 1125.4 Ω. Plotten Sie Amplituden- und Phasengang und die Gruppenlaufzeit des Filters. A4) Verifizieren Sie die Aussagen zur Tiefpass-Hochpass-Transformation, ausgehend von n n Y Y einem Tiefpass-Frequenzgang b hTP (ω) = (−zk )/ (jω − zk ) der Ordnung n k=1
k=1
mit dc-gain K = 1 und den Polen zk seiner Übertragungsfunktion.
A5) (a), (b) Man erhält die Aussagen durch Einsetzen in die Übertragungsfunktionen resp. die Frequenzgänge, ausgehend von einem Tiefpass-Filter wie in der vorangehenden Aufgabe. Etwa beim Bandpass-Filter w1,n , w2,n als positive Lösungen der Gleichungen 1/B(js + 1/(js)) = −j und 1/B(js + 1/(js)) = j; für die Bandsperre analog. (c) Ausgehend vom Tiefpass-Pol z0 = jωg ejπ/6 berechnet man mit der Umkehrung der Joukowsky-Abbildung die entsprechenden Pole zBP,1 zBP,2 beim Bandpass: zBP,1 /ωg = −0.095278 + j1.15133, zBP,2 /ωg = −0.0713887 − j0.862654. Da es sich beim Beispiel um Butterworth-Filter handelt, sind die Bandsperren-Pole zu den Bandpass-Polen konjugiert komplex. Der Hochpass-Pol ist konjugiert komplex zum Tiefpass-Pol. (d) Verwenden Sie ein Computeralgebra-System und die bilineare Transformation von S. 321. Vergleichen Sie das diskrete mit dem analogen Filter. A6) Eine DFT-Näherung der Fouriertransformierten von f mit 8 Abtastwerten ist dürftig (linkes Bild). Im rechten Bild als dicke Linie fb über der Kreisfrequenz aufgetragen, gestrichelt die Näherung mit 2040 Nullen an die Abtastwerte aus Tr(f ) angefügt. Abweichungen der beiden Näherungen von der Spektralfunktion fb sind unvermeidbar und durch die Aliaseffekte der DFT begründet, im zweiten Fall geringer durch Hinzunahme vieler Abtastwerte außerhalb des Trägers von f . 1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
A7) h = δ + 2
0 2 4 6 8 10 Ergebnis ohne Zero Padding
∞ X
12
0.0
0 2 4 6 8 10 Ergebnis mit Zero Padding
12
δ2n .
n=1
z 1 A8) Die z-Transformierte von x− : X , von xα : X , von v: −zX ′(z). z α
444
C Lösungen zu den Übungsaufgaben
A9) (a) Plotten Sie mit einem Computeralgebra-System. (b) Die Übertragungsfunktion des diskreten Notchfilters, die man durch bilineare Transformation erhält ist H(z) =
a0 + a1 z −1 + a2 z −2 b0 + b1z −1 + b2 z −2
A0 (1 + L2 ) 2A0 (1 − L2 ) , N = 1 + L/Q + L2 , L = cot(wg a/2), a1 = , N N 2 2 1 − L/Q + L 2(1 − L ) , b2 = . a2 = a0 , b0 = 1, b1 = N N Für A0 = 1, a = 1/44100s, ωg = 2π · 466 Hz und Q = 10 ergibt sich wie im Bild links der Amplitudengang als Funktion der Frequenz, rechts der Phasengang eines diskreten Notchfilters, das 466 Hz sperrt. Zur Aufgabe (c) kaskadiert man 4 solcher Filter. Ein Audio-Demonstrationsbeispiel eines so erzeugten Anti-Vuvuzela-Filters findet man beim Lehrmaterial des Autors unter www.stiftung-swk.de/rolf_brigola.
mit a0 =
A10) Das Filter der Ordnung n = 5 hat folgenden Amplitudengang und Phasengang:
Dämpfung an der Passband-Ecke 0.199 dB, an der Stopband-Ecke 49.181 dB. A11) Man erhält die Impulsantworten der beiden kausalen stabilen Filter mit den Übertragungsfunktionen H und Hinv = 1/H durch Partialbruchzerlegungen und Laurentreihenentwicklungen der Partialbrüche. H hat die Nullstellen z0,1 = 1/3 und z0,2 = −1/5 und die Pole z∞,1 = j/2 und z∞,2 = −j/2. Aus
C Lösungen zu den Übungsaufgaben
445
H(z) = 1 −
4 − 19j 4 + 19j − 60(z − j/2) 60(z + j/2)
folgt die kausale Impulsantwort durch Laurentreihenentwicklung für |z| > 1/2 h = δ0 −
k ∞ k ∞ 4 + 19j X −j 4 − 19j X j δk+1 − δk+1 . 60 2 60 2 k=0
k=0
h hat reelle Koeffizienten und lässt sich auch mit ein wenig Rechenarbeit umschreiben in die Form (−1)1+k/2 ∞ für k gerade X 15 · 2k−1 h = δ0 + hk+1 δk+1 mit hk+1 = (k+1)/2 k=0 19 · (−1) für k ungerade 15 · 2k+1
Die ersten Filterkoeffizienten – man erhält sie auch mit den Rekursionsgleichungen auf S. 311 – lauten (h0 ,h1 ,h2 ,h3 ,h4 ,h5 , . . .) = (1, −
2 19 1 19 1 ,− , , ,− , . . .). 15 60 30 240 120
Entsprechend ergeben sich Hinv = 1 +
87 65 − 96(z − 1/3) 160(z + 1/5)
und damit die zugehörige kausale Impulsantwort hinv
∞ X 65 1 k+1 87 1 δk+1 . + (−1) = δ0 + 96 3k 160 5k k=0
Da beide Filter stabil sind, sind die Frequenzgänge einfach b h(ω) = H ejωa und b hinv (ω) = Hinv ejωa .
Mit den Impulsantworten oder den Laurentreihen der Übertragungsfunktionen kann man die Frequenzgänge auch als gleichmäßig konvergente Fourierreihen notieren. Für die Rechnungen und ggf. grafische Darstellungen von Amplituden- und Phasengängen oder Gruppenlaufzeiten kann ein Computeralgebrasystem wie Mathematica oder Maple gute Dienste leisten. A12) (a) Aus |b h| = 1 folgt C(z) = 1 für alle |z| = 1. Multiplikation mit dem Nenner in dieser Gleichung ergibt zwei gleiche Polynome, also M = N , dk = 1/ck und den Rest der Behauptung. (b) Berechnen Sie die Gruppenlaufzeit eines Faktors (z −1 − ak )/(1 − ak z −1 ) und verwenden Sie die vorausgesetzte Kausalität und Stabilität (n ≥ 0, |ak | < 1).
446
C Lösungen zu den Übungsaufgaben
A13) (a) Betrachten Sie folgendes Pol-Nullstellen-Diagramm. Die Vierecke bezeichnen Pole, die Kreise Nullstellen der Übertragungsfunktion H(z). Setzen Sie die Veranschaulichung in einen mathematischen Beweis der gewünschten Aussage um.
Zu H(z)
Zu Hmin (z)
Zu Huc (z)
Zu Hall (z)
(b) folgt aus Teil (a) der Aufgabe und aus Teil (b) der vorherigen Aufgabe A12. Anmerkung: Minimalphasen-Filter sind in der Literatur nicht einheitlich definiert. Hier wurde wie bei A. V. Oppenheim, R. W. Schafer (2004) verlangt, dass das inverse Filter stabil sein soll. In anderer Literatur, etwa H. W. Schüßler (2008), sind dagegen auch Nullstellen vom Betrag Eins für Minimalphasen-Filter noch zugelassen. A14) Gehen Sie ganz analog wie beim Beweis des Beispiels auf S. 302 vor.
Zu den Aufgaben von Kapitel 11 A1) Rechnen Sie analog wie beim Beweis des Abtast-Theorems. A2) Die gefensterte DFT zeigt eine mit der Zeit linear ansteigende Frequenz. 1 (4π 2 − 30)1/2 ≈ 0.513 6 Testen Sie an Beispielen die Frequenzlokalisation verschiedener Fensterfunktionen bei unterschiedlichen Signalen.
A3) Für das Hann-Fensters ist Dt (wT )Dω (wT ) =
C Lösungen zu den Übungsaufgaben
447
A4) Die für den spektralen Leckeffekt maßgebenden Gewichte gk für das Dreieckfenster wT lauten bei einem Signal der Form f (t) = A ejω1 t wT (2πk/T − ω1 ) 1 sin(kπ/2 − ω1 T /4) 2 gk = . = 2 T kπ/2 − ω1 T /4
Ergänzung: Vergleichen Sie die entsprechenden Gewichten des Rechteckfensters (Größe der lokalen Maxima von w bT , Abfallverhalten etc.). Berechnen Sie kw bT k.
A5) Die Nullstellen des charakteristischen Polynoms haben negative Realteile. Fouriertransformation der Gleichung x(3) + 4¨ x + 6x˙ + 4x = sin(t)s(t) + 16δ + 6δ˙ + δ¨ führt durch Auflösen nach x b, Partialbruchzerlegung und inverse Transformation zur Lösung x(t) mit Träger in [0,∞[ 73 −t 1 41 −2t 29 −t e e e − cos(t) + sin(t) − cos(t) . x(t) = s(t) 10 10 10 5 Analog kann man auch die Laplace-Transformation zur Lösung verwenden (siehe etwa K. Meyberg, P. Vachenauer (2001) und R. Brigola, P. Singer (2009)). Der rechtsseitige Grenzwert der zweiten Ableitung der Lösung ist x′′ (0+) = 2. A6) (a) Die Grundlösung g entspricht der Temperaturverteilung im R3 zur Zeit t, die resultiert, wenn bei verschwindenden Anfangsbedingungen zur Zeit t = 0 im Ursprung die Temperatur um eine Einheit erhöht wird. Fouriertransformation bzgl. der Ortskoordinaten ergibt für feste ~ω eine Differentialgleichung in t: ∂ g(~ b ω ,t) + k|~ ω |2 b g(~ ω ,t) = δ(t), ∂t
gb(~ω ,t) = 0 für t < 0.
Inverse Fouriertransformation (bzgl. der Koordinaten von ~ω ) der Lösung ergibt die gesuchte Grundlösung, hier im 3D-Fall mit n = 3, g(~x,t) = (4πkt)−n/2 e−|~x|
2
/(4kt)
s(t).
(b) Die zugehörige Lösung der inhomogenen Wärmeleitungsgleichung lautet für rechte Seiten F , für die das Faltungsintegral existiert, ˆ ˆ F (~y,s)g(~x − ~y,t − s) dλ3 (~y ) ds . u(~x,t) = (F ∗ g)(~x,t) = R R3
Ist F (~x,t) = 0 für t < 0, dann erstreckt sich das Zeitintegral nur über [0,t]. Eine hinreichende Bedingung für die Gültigkeit der Formel ist, dass für jedes Intervall [0,t] und ε > 0 eine Konstante Ct,ε existiert, so dass für alle ~x gilt: 2
|F (~x,t)| ≤ Ct,ε eε|~x| . (c) Das entsprechende Anfangswertproblem mit u(~x,0) = f (~x) besitzt die Lösung u = (F ∗ g) + w mit der Lösung w des homogenen Problems zur Anfangsbedingung f aus Formel (11.10) auf S. 368.
448
C Lösungen zu den Übungsaufgaben
A7) Man erhält mit analogem Vorgehen wie in der vorherigen Aufgabe eine Grundlösung g(~x,t) mit g(~x,t) = 0 für t < 0 mit der Einheitssprungfunktion s(t) durch sin(ct|~ω|) s(t). c|~ ω| 2 −1 Inverse Fouriertransformation ergibt g(~x,t) = (4πc t) δ(|~x| − ct) für t > 0 0 für t ≤ 0. Dabei bezeichnet δ(|~x| − ct) das Lebesguesche Oberflächenmaß auf der Kugel um den Nullpunkt mit dem Radius ct (vgl. S. 197, 9.7). gb(~ ω ,t) =
Diese Grundlösung g wird als retardiertes Potential bezeichnet. Für F (~x,t) so, dass das Faltungsintegral existiert, wird in der Kirchhoffschen Formel die Lösung u(~x,t) = (F ∗ g)(~x,t) =
ˆ ˆ∞ R3 0
F (~x − ~y ,t − s)g(~y ,s) ds dλ3 (~y )
zur Zeit t ausgedrückt durch die Werte von F zu früheren Zeiten t − s, s > 0.
Eine hinreichende Bedingung für die Gültigkeit ist, dass F lokal-integrierbar ist. Addition der Lösung aus Formel (11.7), S. 365 ergibt die Lösung der Wellengleichung im R3 für nichtverschwindende Anfangsbedingungen. ge(~x,t) = g(~x, − t) ist eine Grundlösung, die als avanciertes Potential bezeichnet wird.
A8) Analoges Vorgehen wie in den vorangehenden Aufgaben führt mit k = ~/(2m) für ∂ b b ω ,t) = 0, ψ(~ b ω ,0) = ψb0 (~ω ). ω ,t) + jk ψ(~ t > 0 auf die Differentialgleichung ψ(~ ∂t Inverse Fouriertransformation der Lösung ergibt für t > 0 ˆ 2 ψ(~x,t) = (4πkt)−3/2 e−j3π/4 ψ0 (~x − ~y ) ej|~y| /(4kt) dλ3 (~y ) . R3
Da dieses Buch natürlich in keiner Weise eine Einführung in die Theorie der partiellen Differentialgleichung sein kann, sondern nur die Fouriertransformation als eines von vielen Hilfsmitteln für dieses Gebiet vorstellen will, seien interessierte Leser für alles Weitere noch einmal auf die vielen hervorragenden, im Text genannten Lehrbücher über solche Gleichungen hingewiesen.
449
Literaturverzeichnis Albrecht, E., Neumann, M. (1979) Automatische Stetigkeitseigenschaften einiger Klassen linearer Operatoren, Math. Ann. 240, 251-280, Springer, New York Albrecht, E. (2011) Zur Stetigkeit kausaler diskreter linearer Systeme, Private Mitteilung Alt, H. W. (2006) Lineare Funktionalanalysis, Springer, Berlin Atkinson, K., Han, W. (2005) Theoretical Numerical Analysis, Springer, New York Babovsky, H., Beth, T., Neunzert, H., Schulz-Reese, M. (1987) Mathematische Methoden in der Systemtheorie: Fourieranalysis, Teubner, Stuttgart Banach, S. (1932) Op´erations Lin´eaires, Monografje Matematyczne, I, Warszawa Barrak, R., Ghazel, A., Ghannouchi, F. (2009) Optimized Multistandard RF Subsampling Receiver Architecture, IEEE Transactions on Wireless Comm. 8, No.6, 2901-2909 Bary, N. K. (1964) Treatise on Trigonometric Series, Elsevier, Amsterdam Blatter, C. (2003) Wavelets - Eine Einführung, Vieweg, Wiesbaden Bracewell, R. N. (1999) The Fourier Transform and its Applications, McGraw-Hill, NY Braess, D. (1992) Finite Elemente, Springer, Berlin Brass, H., Petras, K. (2011) Quadrature Theory, AMS, Providence, RI Briggs, W. L., Van Emden Henson (1995) The DFT, An Owners Manual for the Discrete Fourier Transform, SIAM, Philadelphia Brigola, R., Singer, P. (2009) On initial conditions, generalized functions and the Laplace transform, El. Eng. (Archiv für Elektrotechnik), 91, 9-13 Brown, J. W., Churchill, R. V. (2006) Fourier Series and Boundary Value Problems, McGraw-Hill, New York Butterworth, S. (1930) On The Theory of Filter Amplifiers, Wireless Engineer, London, Vol. 7, 536-554 Butzer, P. L., Stens, R. L. (1992), Sampling Theory For Not Necessarily Band-Limited Functions: A Historical Overview, SIAM REVIEW, Vol. 34, No. 1, 40-53 Butzer, P. L., Stens, R. L., Splettstößer, W. (1988) The sampling theorem and linear prediction in signal analysis, Jber. d. Dt. Math.-Verein. 90, 1-70 Carleson, L. (1966) On the convergence and growth of partial sums of Fourier series, Acta Math. 116, 135-157 Champeney, D. C. (1989) A Handbook of Fourier Theorems, Cambridge University Press Chandrasekharan, K. (1989) Classical Fourier Transforms, Springer, Berlin Chang, R. W. (1966) High-Speed Multichannel Data Transmission with Bandlimited Ortogonal Signals, Bell Sys. Tech. J., vol. 45, 1775-1796 Chernoff, P. R. (1980) Pointwise Convergence of Fourier Series, AMS Monthly, Vol. 87, No. 5, 399-400 Choi, J., Cvijovi´c, D. (2007) Values of the polygamma functions at rational arguments, J. Phys. A: Math.Theor. 40, 15019-15028 Choi, J., Cvijovi´c, D. (2010) Corrigendum, Values of the polygamma functions at rational arguments, J. Phys. A: Mat. Theor. 43, 239801
450
Literaturverzeichnis
Clenshaw, C. W., Curtis, A. R. (1960) A method for numerical integration on an automatic computer, Numerische Mathematik 2, 197-205 Cohen, A., Daubechies, I., Faveau, J. C. (1992) Biorthogonal Bases of Compactly Supported Wavelets, Comm. Pure Appl. Math. 45, 485-500 Colombeau, J. F. (1984) Elementary Introduction to New Generalized Functions. North Holland, Amsterdam Colombeau, J. F. (1992) Multiplication of Distributions – A tool in Mathematics, Numerical Engineering and Theoretical Physics, Lect. Notes in Math. 1532, Springer, Berlin Cooley, J., Tukey, J. (1965) An algorithm for the machine calculation of complex Fourier series, Math. Comp. 19, 297-301 Couch, L. W. (2007) Digital and Analog Communication Systems, Pearson Prentice Hall, Upper Saddle River, New Jersey Courant, R., Hilbert, D. (1993) Methoden der Mathematischen Physik, Springer, Berlin Cox, I., Miller, M., Bloom, J., Fridrich, J., Kalker, T. (2008) Digital Watermarking and Steganography, Morgan Kaufmann Publishers, Amsterdam/Boston Cumming, I.G., Wong, F.H. (2005) Digital Signal Processing of Synthetic Aperture Radar Data: Algorithms and Implementation, Artech House, Boston Dahlke, S., Novak, E., Sickel, W. (2010) Optimal approximation of elliptic problems by linear and nonlinear mappings IV: Errors in L2 and other norms, J. of Complexity 26, 102-124 Daubechies, I. (1992) Ten Lectures on Wavelets, SIAM, Philadelphia Dautray, R., Lions, J. L. (1992) Mathematical Analysis and Numerical Methods for Science and Technology, 6 Bd., Springer, Berlin David, K., Benkner, T. (2013) Digitale Mobilfunksysteme Day, M. M. (1961) Fixed-Point Theorems For Compact Convex Sets, Illinois J. Math., 5, 585-590 Dehmer, M. (2006) On the location of zeros of complex polynomials, J. of Inequalities in Pure and Applied Math., 7 No.1, Articel 26 Dirichlet, P. L. (1829) Sur la convergence des s´eries trigonom´etriques qui servent `a repr´esenter une fonction arbitraire entre des limites donn´ees, J. reine und angewandte Mathematik 4, 157-169 Duhamel, P., Vetterli, M. (1990) Fast Fourier Transforms: A Tutorial Review And The State Of The Art, Signal Processing 19, 259-299 Dym, H., McKean, H. P. (1985) Fourier Series and Integrals, Academic Press, New York Edwards, R. E. (1982) Fourier Series, A Modern Introduction, Vol. 2, Springer, Berlin Ehrenpreis, L. (1954) Solution of some problems of division. Part I. Division by a polynomial derivation, Am. J. Math. 76, 883-903 Engl, H., Groetsch, C. W. (1987) Inverse and Ill-posed Problems, Academic Press, NY Erdös, P., Turàn, P. (1937) On interpolation, I. Quadrature and mean convergence in the Lagrange interpolation, Ann. of Math. 38, 142-155 Faber, G. (1912), Über die interpolatorische Darstellung stetiger Funktionen, Deutsche Math. Jahr. 23, 192-210. Feichtinger, H. G., Strohmer, T. (1998) Gabor Analysis and Algorithms, Birkhäuser, Boston Feichtinger, H. G., Strohmer, T. (2003) Advances in Gabor Analysis, Birkhäuser, Boston Fej´er, L. (1904) Untersuchungen über Fouriersche Reihen, Math. Ann. 58, 501-569
Literaturverzeichnis
451
Fej´er, L. (1933) On the infinite sequences arising in the theories of harmonic analysis, of interpolation, and of mechanical quadratures, Bulletin of the AMS 39, 521-534 Fichtenholz, G. M. (1997) Differential- und Integralrechnung, Bd. 1-3, H. Deutsch, Frankfurt a. M. Fine, B., Rosenberger, G (1997) The Fundamental Theorem Of Algebra, Springer, NY Föllinger, O. (2008) Regelungstechnik, Hüthig, Berlin Folland, G. B. (1995) Introduction to Partial Differential Equations, Princeton Univ. Press, Princeton, N.J. Folland, G. B. (1992) Fourier Analysis And Its Applications, Wadsworth, Pacific Grove Four`es, Y., Segal, I. E. (1955) Causality And Analyticity, Transactions AMS, 78, 385-405 Fourier, J. B. (2009) The Analytical Theory of Heat, Cambridge University Press Forster, O. (2008) Analysis 1, Vieweg, Wiesbaden Gabor, D. (1946) Theory of Communication, J. Inst. Electr. Engrg. London 93, 429-457 Gardner, W. A., Napoletano, A., Paura, L. (2008) Cyclostationarity: Half a century of research, Signal Processing, 639-697 Gasquet, C., Witomski, P. (1998) Fourier Analysis and Applications, Springer, Berlin Gel’fand, I. M., Shilov, G. E., Vilenkin, N. Ya. (1964) Generalized Functions, Vol. 1-4, Academic Press, New York Gibbs, J. W. (1898) Fourier’s Series, Nature 59, 200 Glisson, T. H. (1986) Introduction To System Analysis, McGraw-Hill, New York Goldberg, R. R. (2009) Fourier Transforms, Cambridge Univ. Press, London Goodman, A., Newman, D. J. (1984) A Wiener Type Theorem For Dirichlet Series, Proc. AMS 92, 521-527 Gottlieb, D., Shu, C.-W. (1997) On the Gibbs phenomenon and its resolution, SIAM Review, 39(4), 644-668 Grafakos, L. (2008) Classical Fourier Analysis, Springer, NewYork Grafakos, L. (2010) Modern Fourier Analysis, Springer, New York Greiner, W. (2008) Theoretische Physik, Bd. 3-4, H. Deutsch, Frankfurt a. M. Gröchenig, K. (2001) Foundations of Time-Frequency Analysis, Birkhäuser, Boston Groetsch, C. W. (1993) Inverse Problems in the Math. Sciences, Vieweg, Wiesbaden Grosjean, C. C. (1984) Formulae concerning the computation of the Clausen integral Cl2 (θ), J. Comp. Appl. Math., 11, 331-342 Hackbusch, W. (1996) Theorie und Numerik elliptischer Differentialgleichungen, Teubner, Stuttgart Hackenbroch, W. (1987) Integrationstheorie, Teubner, Stuttgart Hadamard, M. (1932) Le probl`eme de Cauchy et les ´equations aux d´eriv´ees partielles lin´eaires hyperbolic, Hermann, Paris Hanke-Bourgeois, M. (2008) Grundlagen der Numerischen Mathematik und des Wissenschaftlichen Rechnens, Teubner, Wiesbaden Harris, F. J. (1978) On the Use of Windows for Harmonic Analysis with Discrete Fourier Transform, Proc. IEEE 66 (1), 51-83 Helmberg, G., Wagner, P. (1997) Manipulating Gibbs’ Phenomenon for Fourier Interpolation, J. Funct. Analysis 89, 308-320 Henrici, P. (1979) Fast Fourier Methods In Computational Complex Analysis, SIAM Review 21 (4), 481-527
452
Literaturverzeichnis
Heuser, H. (2009) Lehrbuch der Analysis, Teubner, Stuttgart Hirzebruch, F., Scharlau, W. (1991) Einführung in die Funktionalanalysis, Spektrum Akad. Verlag, Heidelberg Hoeg, W., Lauterbach, T. (2003) Digital Audio Broadcasting, Wiley, Chichester Hörmander, L. (1960) Estimates For Translation Invariant Operators In Lp Spaces, Acta Math. 104, 93-140 Hörmander, L. (2003) The Analysis of Linear Partial Differential Operators, Springer, NY Holschneider, M. (1999) Wavelets: An Analysis Tool, Oxford Univ. Press, Oxford Hughett, P. (1998) Representation theorems for semilocal and bounded linear shift-invariant operators on sequences, Signal Processing, 199-209 Hurd, W. J. (1997) Optimum and Practical Noncausal Smoothing Filters for Estimating Carrier Phase With Phase Process Noise, The Telecommunications and Data Acquisition Progress Report, 42-128, pp. 1-7, Jet Propulsion Laboratory, Pasadena, California Jackson, D. (1912) On approximation by trigonometric sums and polynomials, Trans. AMS, 14, 491-515 Jerri, A. (1977) The Shannon Sampling Theorem - its Various Extensions and Applications: A Tutorial Review, Proc. IEEE, 65 (11), 1565-1596 John, F. (1981) Partial Differential Equations, Springer, Berlin Jury, E. I. (1973) Theory and Application of the z-Transform, Krieger Pub. Co., Malabar Kailath, T. (1980) Linear Systems, Prentice Hall, Englewood Cliffs Kaiser, G. (1994) A Friendly Guide to Wavelets, Birckhäuser, Berlin Kammeyer, K.-D., Dekorsy, A. (2018) Nachrichtenübertragung, Vieweg+Teubner, Wiesbaden Kammeyer, K.-D., Kroschel, K. (2012) Digitale Signalverarbeitung, Springer Vieweg, Wiesbaden Kawata, T. (1972) Fourier Analysis in Probability Theory, Academic Press, New York Kincaid, D., Cheney, W. (2002) Numerical Analysis, Brooks/Cole, Pacific Grove Koepf, W. (1998) Hypergeometric Summation, Vieweg, Wiesbaden Kölzow, D. (1994) Wavelets: A Tutorial and a Bibliography, Rend. di Mat. Univ. di Trieste, Vol. 26, Suppl., 49-220 König, H. (1959) Zur Theorie der linearen dissipativen Transformationen, Archiv Math., 10, 447-451 König, H. (1994) An explicit formula for fundamental solutions of linear partial differential operators with constant coefficients, Proc. AMS 120, 1315-1318 Königsberger, K. (2003) Analysis 1 und 2, Springer, Berlin Körner, T. W. (1989) Fourier Analysis, Cambridge University Press, Cambridge Küpfmüller, K. (1984) Einführung in die theoretische Elektrotechnik, Springer, Berlin Kufner, A., Kadlec, J. (1971) Fourier Series, Academia, Prag Landau, E. (1933) Über eine trigonometrische Ungleichung, Math. Zeitschrift,37, 36 Lauterborn, W., Kurz, T., Wiesenfeldt, M. (1993) Kohärente Optik, Springer, Berlin Leinfelder, H. (2009) Der n-te Beweis des Fundamentalsatzes der Algebra, Priv. Mitteilung Leinfelder, H. (2012) Über einen neuen Beweis des Malgrange-Ehrenpreis-Theorems, Preprint, Department für Mathematik, Westböhmische Universität Pilsen. Louis, A. K. (1989) Inverse und schlecht gestellte Probleme, Teubner, Stuttgart
Literaturverzeichnis
453
Louis, A. K., Maaß, P., Rieder, A. (1998) Wavelets: Theorie und Anwendungen, Teubner, Stuttgart Ma, Y., Yang, Q., Tang, Y., Chen, S., Shieh, W. (2010) 1-Tb/s Single-Channel Coherent Optical OFDM Transmission With Orthogonal-Band Multiplexing and Subwavelength Bandwidth Access, J. Lightwave Techn. 28(4), 308-315 ´ Malgrange, B. (1955) Existence et approximation des solutions des ´equations aux d´eriv´ees partielles et des ´equations de convolution, Ann. Inst. Fourier 6, 271-355 Mallat, S. (1989) Multiresolution Approximations and Wavelet Orthonormal Bases of L2 (R), Trans. AMS, 315 (1), 69-87 Mallat, S. (2009) A Wavelet Tour of Signal Processing, Academic Press, London Mason, J. C., Handscomb, D. (2002) Chebyshev Polynomials, CRC Press, Boca Raton Messiah, A. (2003) Quantum Mechanics, Dover, New York Meyberg, K., Vachenauer, P. (2001) Höhere Mathematik 1 und 2, Springer, Berlin Meyer, Y. (1995) Wavelets and operators, Cambridge University Press, Cambridge Meyer, Y. (1993) Wavelets, Algorithms and Applications, SIAM, Philadelphia Moler, C., Van Loan, C. (2003) Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty Five Years Later, SIAM Review 45, No.1, 3-49 Montreuil, L., Prodan, R., Kolze, T. (2013) Broadcom Recommendations Tx Symbol Shaping, www.ieee802.org/3/bn/public/jan13/montreuil_01a_0113.pdf Müller-Gronbach, T., Novak, E., Ritter, K. (2012) Monte-Carlo-Methoden, Springer, Berlin Natanson, I. P. (1981) Theorie der Funktionen einer reellen Veränderlichen, H. Deutsch, Frankfurt a. M. Neumann, M. (1980) Automatic Continuity of Linear Operators, Functional Analysis, Surveys and Recent Results II, K.-D. Bierstedt, B. Fuchssteiner (eds.), North Holland, Amsterdam Newman, D. J. (1975) A Simple Proof of Wiener’s 1/f Theorem, Proc. AMS, Vol. 48, 264-265 Niemeyer, H., Wermuth, E. (1987) Lineare Algebra, Vieweg, Wiesbaden Novak, E., Ritter, K., Schmitt, R., Steinbauer A. (1999) On a recent interpolatory method for high dimensional integration, J. Comput. Appl. Math. 112, 215-228 Nussbaumer, H. J. (1982) Fast Fourier Transform and Convolution Algorithms, Springer, Berlin Oberguggenberger, M. (1992) Multiplication of Distributions and Applications to Partial Differential Equations, Volume 259 of Pitman Research Notes in Mathematics, Longman, Harlow, U.K. Oppenheim, A V., Schafer, R. W. (2004) Zeitdiskrete Signalverarbeitung, Pearson Studium, München Oppenheim, A. V. (1978) Applications of Digital Signal Processing, Prentice Hall, Englewood Cliffs Ortner, N. (1980) Regularisierte Faltung von Distributionen, Teil 1; Zur Berechnung von Fundamentallösungen, Teil 2: Eine Tabelle von Fundamentallösungen, ZAMP, 31, 133-173 Ortner, N., Wagner, P. (1994) A short proof of the Malgrange-Ehrenpreis theorem, Functional Analysis - Trier, Proc. Int. Workshop, ed. S. Dierolf et al., pg. 343-352, De Gruyter, Berlin
454
Literaturverzeichnis
Ortner, N., Wagner, P. (1997) A survey on explicit representation formulae for fundamental solutions of linear partial differential operators, Acta Appl. Math. 47, 101-124 Ortner, N., Wagner, P. (2013) Distribution-Valued Analytic Functions – Theory and Applications, edition swk, Hamburg Ortner, N., Wagner, P. (2015) Fundamental Solutions of Linear Partial Differential Operators, Springer, Cham Paley, R., Wiener, N. (1934) Fourier Transforms in the Complex Domain, AMS, Providence, Rhode Island Pandey, J. N. (1995) The Hilbert Transform Of Schwartz Distributions And Applications, Wiley, New York Papoulis, A. (1968) Systems and Transforms with Applications in Optics, McGraw Hill, New York Papoulis, A. (1977) Signal Analysis, McGraw-Hill, Tokyo Papoulis, A. (1987) The Fourier Integral And Its Applications, McGraw-Hill, New York Partington, J. R. (2004) Linear Operators and Linear Systems (2004) London Math. Soc. Student Texts 60, Cambridge University Press, Cambridge Pathak, R. S. (1997) Integral Transforms of Generalized Functions and Their Applications, Gordon and Breach, Amsterdam Pennebaker, W. B., Mitchell, J. L. (1993) Still Image Data Compression Standard, Van Nostrand Reinhold, New York Peters, K. H. (2004) Schönheit, Exaktheit, Wahrheit: Der Zusammenhang von Mathematik und Physik am Beispiel der Geschichte der Distributionen, GNT Verlag, Diepholz Pohl, V., Boche, H. (2010) Advanced Topics in System and Signal Theory, Springer, Berlin Preuß , H. und W., Bleyer, A. (1985) Distributionen und Operatoren, Springer, Wien Proakis, J. G. (2001) Digital Communications, McGraw-Hill, New York Råde, L., Westergren, B. (2000) Springers Mathematische Formeln, Springer, Berlin Rao, K. R., Hwang, J. J. (1996) Techniques & Standards For Image, Video & Audio Coding, Prentice Hall, Upper Saddle River, NJ Redheffer, R. (1984) Convergence of Fourier Seriees at a Discontinuity, SIAM J. Math. Analysis 15, No.5, 1007-1009 Reed, S. M., Simon B. (1979) Methods of Modern Mathematical Physics, 3 Vol., Academic Press, New York Rees, C. S., Shah, S. M., Stanojevi´c, C. V. (1981) Theory and Applications of Fourier Analysis, Dekker, New York Rivlin, T. J. (1974) The Chebyshev Polynomials, Wiley, New York Rivlin, T. J. (2010) An Introduction to the Approximation of Functions, Dover, New York Rosay, J. P. (1991) A very elementary proof of the Malgrange-Ehrenpreis theorem, Amer. Math. Monthly 98, 518-523 Rudin, W. (1972) Invariant means on L∞ , Studia Math. 44, 219-227 Rudin, W. (1991) Functional Analysis, McGraw-Hill, New York Rullière, C. (ed.) (1998) Femtosecond Laser Pulses, Springer, New York Runge, C. (1901) , Über empirische Funktionen und die Interpolation zwischen äquidistanten Ordinaten, Zeitschrift für Mathematik und Physik 46, 224-243 Salditt, T., Aspelmeier, T., Aeffner, S. (2017) Biomedical Imaging, de Gruyter, Berlin
Literaturverzeichnis
455
Sandberg, I. W. (2001) A Note on the Convolution Scandal, IEEE Signal Processing Letters, Vol. 8, No. 7, 210-211 Schep, A. R. (2009) A Simple Complex Analysis and an Advanced Calculus Proof of the Fundamental Theorem of Algebra, Amer. Math. Monthly, 116, 67-68 Schlitt, H. (1994) Stochastische Vorgänge in linearen und nichtlinearen Regelkreisen, Vieweg, Wiesbaden Schmeisser, H. J., Triebel, H. (1987) Topics in Fourier Analysis and Function Spaces, Wiley, New York Schmeißer, G., Schirmeier, H. (1976) Praktische Mathematik, De Gruyter, Berlin Schönhage, A. (1971) Approximationstheorie, De Gruyter, Berlin Schüßler, H. W. (2008) Digitale Signalverarbeitung 1, Springer, Berlin Schulze, H., Lüders, C. (2005) Theory and Applications of OFDM and CDMA, Wiley, Chichester Schwartz, L. (1957) Théorie des distributions, Hermann, Paris Schwartz, L. (1966) Mathematics for the Physical Sciences, Hermann, Paris Shannon, C. E. (1949) Communication in the presence of noise, Proc. IRE 37, 10-21 Sirovich, L. (1988) Introduction to Applied Mathematics, Springer, Berlin Shapiro, J. M. (1993) Embedded Image Coding Using Zerotrees of Wavelet Coefficients, IEEE Transactions of Signal Processing 41/12, 3445-3462 Shilov, G. E. (1968) Generalized Functions and Partial Differential Equations, Gordon and Breach, New York Slepian, D. (1983) Some Comments on Fourier Analysis, Uncertainty and Modelling, SIAM Review 25 (3), 379-393 Sobolev, S. L. (1964) Einige Anwendungen der Funktionalanalysis auf Gleichungen der mathematischen Physik, Akademie-Verlag, Berlin Spiegel, M. R. (1976) Fourier-Analysis, Theorie und Anwendung, McGraw-Hill, Düsseldorf Stark, H.-G. (2005) Wavelets and Signal Processing: An Application-Based Introduction, Springer, Berlin Stein, E. M., Weiss, G. (1971) Introduction to Fourier Analysis on Euclidean spaces, Princeton Univ. Press Stoer, J., Bulirsch, R. (2007) Numerische Mathematik, 2 Bd., Springer, Berlin Strauss, W. A. (1995) Partielle Differentialgleichungen, Vieweg, Wiesbaden Strichartz, R. (1993) How To Make Wavelets, Am. Math. Monthly, 100, 539-556 Strichartz, R. (1994) A Guide to Distribution Theory and Fourier Transforms, CRC Press, Boca Raton Taubman, D. S., Marcellin, M. (2001) Jpeg2000: Image Compression Fundamentals, Standards and Practice, Kluwer, Amsterdam Tian, J., Wells Jr., R. O. (1995) Image Compression Through Reduction of Indices of Wavelet Transform Coefficients, Preprint Tian, J., Wells Jr., R. O. (1996) A Lossy Image Codec Based on Index Coding, Proc. of the IEEE Data Compression Conference, Snowbird, Utah, ed. by J. Storer, M. Cohn, IEEE Computer Society Press Tietze, U., Schenk, Ch. (2002) Halbleiter-Schaltungstechnik, Springer, Berlin Tolstov, G. P. (1976) Fourier Series, Dover, New York
456
Literaturverzeichnis
Trefethen, L. N. (2008) Is Gauss quadrature better than Clenshaw-Curtis?, SIAM Review 50 (1), 67-87 Tr`eves, F. (1966) Linear Partial Differential Equations with Constant Coefficients, Gordon and Breach, New York Triebel, H. (1980) Höhere Analysis, H. Deutsch, Frankfurt a. M. Triebel, H. (1983) Theory of Function Spaces, Birkhäuser, Basel Unbehauen, R. (1984) Synthese elektrischer Nertzwerke, Oldenbourg, München Unbehauen, R. (2002) Systemtheorie, 2 Bände, Oldenbourg, München Unser, M. (2000) Sampling – 50 Years After Shannon, Proc. IEEE, 2000, 88, No. 4 Vladimirov, V. S. (2002) Methods of the Theory of Generalized Functions, Taylor and Francis, London Vogl, G., Nickel, J.-C. (2003) EMV-Messungen mit „Nachbrenner“, Test in der ElektronikEntwicklung, EMV-Messtechnik, Test-Kompendium Wagner, P. (2009) A new constructive proof of the Malgrange-Ehrenpreis theorem, Amer. Math. Monthly, 116, 457-462 Waldvogel, J. (2003) Fast construction of the Fejér and Clenshaw-Curtis quadrature rules, BIT Numerical Mathematics, Vol. 43, No. 1, 1-18 Walker, J. S. (1988) Fourier Analysis, Oxford University Press, Oxford Walter, W. (1990) Analysis II, Springer, Berlin Walter, W. (1994) Einführung in die Theorie der Distributionen, BI Wissenschaftsverlag, Mannheim Weidmann, J. (1980) Linear Operators in Hilbert Spaces, Springer, Berlin Weinstein, S. B., Ebert, P. M. (1971)Data Transmission by Frequency-Division Multiplexing Using the Discrete Fourier Transform, IEEE Transactions on Comm. Tech., Vol. COM-19, No. 5, 628-634 Weinstein, S. B. (2009) The History of Orthogonal Frequency-Division Multiplexing, IEEE Communications Magazine, November 2009, 26-35 Weiss, G. (1991) Representation of shift-invariant operators on L2 by H∞ transfer functions, Math. Control Signals Systems 4, 193-203 Werner, D. (2011) Funktionalanalysis, Springer, Berlin Wheeden, R. L., Zygmund, A. (1977) Measure And Integral, An Introduction to Real Analysis, Dekker, New York Wiener, N (1933) The Fourier Integral and Certain of its Applications, Cambridge Univ. Press, New York Wilbraham, H. (1848) On a Certain Periodic Function, Cambridge and Dublin Mathematical Journal 3, 198-201 Wupper, H. (1998) Einführung in die digitale Signalverarbeitung, Hüthig, Heidelberg Wupper, H. , Niemeyer, U. (1996) Elekronische Schaltungen 2, Springer, Berlin Young, R. M. (1980) An Introduction to Nonharmonic Fourier Series, Academic Press, New York Zemanian, A. H. (2010) Distribution Theory and Transform Analysis, Dover, New York Zemanian, A. H. (1995) Realizability Theory For Continuous Linear Systems, Dover, NY Zygmund, A. (2003) Trigonometric Series, Cambridge University Press, Cambridge
457
Symbolverzeichnis und physikalische Größen N, Z R, C N0 , R+ 0 j, j 2 = −1 ℜ(z), ℑ(z) z
die Mengen der natürlichen und der ganzen Zahlen, 4 die Mengen der reellen und der komplexen Zahlen, 7 N ∪ {0} und die Menge der nicht-negativen reellen Zahlen, 2 komplexe Einheit, 3 Real- und Imaginärteil von z, 7 konjugiert komplexer Wert von z, 8
f (t+) = lim f (x)
rechtsseitiger Limes von f für x → t, x > t, 2, 22
x→t+
f (t−) = lim f (x) x→t−
linksseitiger Limes von f für x → t, x < t, 22
~x · ~y
inneres Produkt zweier Vektoren ~x und ~y, 48
hf |gi hT,ϕi kf k2
inneres Produkt von f und g, 9 Wert einer Distribution T für eine Testfunktion ϕ, 132 L2 -Norm von f , 43, 396
(f ∗ g)T f ∗g T ∗G
T -periodische Faltung, 50 Faltung von f und g, 157, 396 Faltung zweier Distributionen T und G, 157
s(t) 1A δ, δ(t) δn , δ(t − na) pv(t−1 ), vp(t−1 ) pf(t−m ) T˙ , T (k) Tr(T )
Einheitssprungfunktion, 126 Indikatorfunktion einer Menge A, 165, 336 Dirac-Distribution, Dirac-Impuls, 128, 133 Dirac-Impuls bei na, 271 Cauchy-Hauptwert von t−1 , 134 Pseudofunktion zu t−m , 135 verallgemeinerte Ableitungen von T , 138 Träger einer Distribution T , 156
∂i , ∂ k P (D)
partielle Ableitungen, 151 gewöhnlicher linearer Differentialoperator mit konstanten Koeffizienten, 180 partieller linearer Differentialoperator mit konstanten Koeffizienten, 347 Laplace-Operator angewandt auf u, 192
P (∂) ∆u F fb, F f Gw f = fe
Fouriertransformation, 224 Fouriertransformierte von f , 224, 241 gefensterte Fouriertransformation von f zu gegebener Fensterfunktion w, 328
458
Symbolverzeichnis
L2 ([0,T ]) L2 (R) Lp (Ω) L∞ (Ω) ldp ld∞
Raum der auf [0,T ] quadratisch integrierbaren Funktionen, 49 Raum der auf R quadratisch integrierbaren Funktionen, 257 Raum der p-fach integrierbaren Funktionen auf Ω, 396 Raum der wesentlich beschränkten Funktionen auf Ω, 396 Raum der diskreten Signale mit p-fach summierbaren Koeffizienten, 271 Raum der diskreten Signale mit beschränkten Koeffizienten, 271
D D′ D(Ω) D′ (Ω) ′ DR ′ D+
Raum der Testfunktionen auf R, 124 Raum der Distributionen auf R, 132 Raum der Testfunktionen auf einem Gebiet Ω, 151 Raum der Distributionen auf einem Gebiet Ω, 151 Raum der kausalen Distributionen auf R, 270 Raum der Distributionen mit Träger in [0,∞[, 181
S OM S′ ′ SR ′ S+
Raum der schnell fallenden Funktionen auf R, 238 Raum der langsam wachsenden Funktionen auf R, 241 Raum der temperierten Distributionen auf R, 241 Raum der kausalen temperierten Distributionen auf R, 270 Raum der temperierten Distributionen auf R mit Träger in [0,∞[, 341
E′ ′ OC X
Raum der Distributionen auf R mit kompaktem Träger, 164 Raum der schnell fallenden Distributionen, 270 Raum der diskreten Signale, 270
Verwendete physikalische Größen N γ
Kraft, Gravitationskonstante,
Newton, Gamma,
N, kg m/s2 m3 /(kg s2 )
U u
Spannung, elektrisches Potential oder Gravitationspotential,
Volt,
V V m2 /s2
I R C L q
Stromstärke, Widerstand, Kapazität, Induktivität, elektrische Ladung,
Ampere, Ohm, Farad, Henry, Coulomb,
A Ω, V/A F, As/V H, Vs/A C, As
̺
pro m3 , C/m3 2 pro m oder m, C/m2 oder C/m oder Massendichte, analog mit kg statt C elektrische Feldkonstante, F/m, As/(Vm) Temperaturleitfähigkeit, m2 /s reduziertes Plancksches Wirkungsquantum Js
ε0 k ~
elektrische Ladungsdichte
459
Index Ähnlichkeitssatz, 32 Übertragungsfunktion, 288 — T -periodische, 52 — diskrete Filter, 304, 305 Übertragungsverhalten, 183 Ableitung — verallgemeinerte, 143 Abtastsatz von Shannon, 327 Abtastung — Überabtastung, 330 — Nyquist-Frequenz, 330 — Unterabtastung, 330 Amplitudengang, 280, 316 Amplitudenmodulation, 35 Anfangsrandwertproblem, 2, 219 Anfangswertproblem — auf Halbgerade, 187 — kausales, 185 — System erster Ordnung, 190 asymptotisch stabil, 51 Basisband-Signal, 69 Bernoulli, 1, 221 Bessel-Ungleichung, 39 Bildladung, 202 Butterworth-Tiefpass, 195, 285 Butterworth-Tiefpass, Impulsantwort, 195 Cauchy-Hauptwert, 138, 146 Cauchy-Schwarz-Ungleichung, 261, 382 Chebyshev-Polynome, 85 Clenshaw-Curtis-Quadratur, 82 Coulomb-Formel, 199 D’Alembert, 221 dB, Dezibel, 286, 316 DFT, 66 — Abtastfrequenz, 68 — Alias-Effekt, 68 — Analog-Digital-Wandlung, 71 — Bandbreite, 69, 70 — Bandpass Sampling, 70 — Basisband, 69 — Basisband-Signal, 69 — DCT I, 79 — DCT II, 80 — DCT-2D, 99
— FFT, 95 — IDFT, 74 — JPEG, 98 — Kehrlage, 72 — Lattenzauneffekt, 68 — Leckeffekt, spectral leakage, 70, 359 — Nyquist-Frequenz, 70 — Nyquist-Intervall, 70 — trigonometrische Interpolation, 76 — Undersampling, Sub-Sampling, 70 — Zeitfenster, 357 — zero padding, 296, 325 Differentialoperatoren, 183 Differenzengleichung, 311 Differenzierglied, 130 digitale Wasserzeichen, 99 Dirac-Impuls, 132 Dirichlet-Kern, 11, 23, 108, 174, 229 Dirichletsches Randwertproblem, 55, 199, 205 diskrete Cosinus-Transformation, DCT, 79 Diskrete Fouriertransformation, DFT, 66, 75 Distributionen, 136 — δ-Impuls, 129, 132 — Ableitung, 141 — Anfangswertprobleme, 185 — Definition, 135 — Faltung, 160, 254 — Grundlösung, 180 — kausale, 168, 182 — Kettenregel, 154 — komplex, 156 — Konvergenz, 150, 156 — Koordinatentransformation, 154, 156 — mehr Variable, 155, 196 — periodische, 173 — Produktregel, 143 — Pseudofunktion, 139 — Reflexion, 161 — reguläre, singuläre, 137 — Reihen, 153 — Stetigkeit, 157 — temperierte, 245, 264 — Tensorprodukt, 158 — Träger, 128, 160 — unbestimmte Integrale, 149 — wesentlicher Punkt, 160
460 Effektivwert, 43 Eigenschwingung, 4 Energie, 60 Energieerhaltungssatz, 61 Euler-Konstante, 250 exponentiell beschränkt, 305 Faltung, 160 — Eigenschaften, 162 — Impulsfolgen, 165, 257 — periodische, 50, 55, 75, 178 Faltungsgleichungen — Tichonov-Regularisierung, 226 fast überall, 412 Fejér-Kern, 109, 235 Fibonacci-Zahlen, 312 Filter — Übertragungsfunktion, 288, 304 — Allpass-Filter, 291 — analog, 277 — Bandpass-Filter, 292 — bilineare Transformation, 321 — Butterworth, 283, 321 — Butterworth-Hochpass, 324 — diskret, 91 — diskrete, 298 — FIR-Filter, 317 — Frequenzgang, 279, 287 — Frequenztransformationen, 291 — Gruppenlaufzeit, 280 — Hochpass-Filter, 291 — IIR-Filter, 320 — Integrator, 281 — inverse diskrete, 314 — kausal, 283, 313, 314 — minimal-phasig, 316 — Minimalphasen-Filter, 326 — nicht-rekursiv, 91 — Notch-Filter, 325 — Phasengang, 280 — Raised Cosine, 333 — rekursiv, 91 — Stabilität, 289, 303 — Tiefpass, 282 — Tiefpass-Filter, 318 — Tschebyscheff-Tiefpass, 90, 106, 286 Filter, Stabilität, 283, 313, 314 Finite Elemente, 205, 214 Fourier, 1, 221 Fourierkoeffizienten, 7, 13, 40, 117, 179 Fourierkoeffizienten, Größenordnung, 41 Fourierreihen, 22, 26, 31
Index — 1/f-Theorem, 63 — Ableitung, 37 — beste Approximation, 47 — Eigenschaften, 31 — Gibbs-Phänomen, 20 — Impulsmethode, 179 — Integration, 38 — Koeffizientenvergleich, 177 — Konvergenz im quadratischen Mittel, 48 — mehr Variablen, 116 — periodische Faltung, 50 — Polarform, 10 — Produkt, 260 — verallgemeinerte, 154, 173 Fouriertransformation, 228, 243 — Eigenschaften, 235 — Faltung, 236, 254 — gefensterte, 350 — Gibbs-Phänomen, 234 — Impulsfolgen, 257 — Koordinatentransformation, 272 — Kreis-Blende, 267 — mehr Variable, 264 — Multiplikationssatz, 239 — Parseval-Gleichung, 239 — rationaler Funktionen, 253 — Rechteck-Blende, 266 — reeller Funktionen, 230 — STFT, 350 — temperierter Distributionen, 245 — Umkehrformel, 228 Frequenzgang, 54, 92, 279 — diskrete Filter, 304 Fundamentalsatz der Algebra, 406 Funktion — harmonische, 57 — kausale, 182 — lokal-integrierbar, 137 — messbare, 413 — schnell fallende, 264 — stückweise stetige, 22 — Träger, 128 — verallgemeinerte, 132, 136 Gabortransformation, 350 Gammafunktion, 250 Gefensterte Fouriertransformation, 350 Gewichtsfunktion, 126 Gibbs-Phänomen, 20, 87, 113, 234 Green-Funktion, 182, 201 Greensche Formel, 197
Index Grundlösung — 2D-Potentialgleichung, 224, 439 — 3D-Potentialgleichung, 196 — 3D-Wärmeleitung, 450 — 3D-Wärmeleitungsgleichung, 378, 449 — 3D-Wellengleichung, 378, 450 — Schrödingergleichung, 378 Grundlösungsverfahren, 180, 196 Gruppenlaufzeit, 280, 286, 316 Hölder-Ungleichung, 249 Haar-Wavelet, 393 Heisenbergsche Unschärferelation, 345 Hilbertraum, 382 Huyghenssches Prinzip, 366 IDFT, 74, 337 Impuls, 134 Impulsantwort, 183, 278 Impulsfolgen — periodische, 175 Impulsstärke, 134 inneres Produkt, 9, 382 Interpolation — trigonometrische, 76 — Tschebyscheff-Polynome, 88 Joukowsky-Abbildung, 106, 293 kausal, 182, 274, 276, 303 Klirrfaktor, 27, 49 kompakt, 155 kompakte Menge, 128 komplexe Amplitude, 10 komplexe Wechselstromrechnung, 53 Konvergenz — gleichmäßige, 16 — punktweise, 16 Kugelkoordinaten, 417 Lösung — verallgemeinerte, 219 Laplace-Gleichung, 54, 195 Laplace-Operator, 196, 205 Lebesgue-Integral, 413 Lebesgue-Maß , 411 Leistung, 43 lineare Filter, siehe Filter, 277 lineare Systeme, 51, 276 — Anfangswertprobleme, 184 — Impulsantwort, 183 — Sprungantwort, 183 — Systeme erster Ordnung, 190
461 Möbius-Abbildung, 321 majorisierte Konvergenz, 416 Malgrange-Ehrenpreis-Theorem, 369 Matrix-Exponentialfunktion, 190, 191 Maximumprinzip, 56 Maxwell-Gleichung, 196 Mehrträger-Übertragung, 334 Membran, 119, 205 messbar, 414 Minimal-Phasen-Filter, 316 Mittelwerte, 125–127, 137 Mittelwerteigenschaft, 17, 19 Multi-Index, 155 Multiskalen-Analyse, 392, 400 Nullmengen, 412 Numerische Integration, 82 Nyquist-Puls, 332 Oberflächenmaß, 417 OFDM, 71, 93, 334 — 16-QAM, 335 — Intercarrier-Interferenz, 336 — Pulsform, 335 Ohm, 60 Orthonormalitätsrelationen, 8, 9 Parseval-Gleichung, 44, 117 Partialbruchzerlegung, 409 Phasengang, 280, 316 Poisson-Integralformel, 56, 198 Poissonsche Summenformel, 296 Polarisationsgleichung, 240 polynomial beschränkt, 176, 245 Potentialgleichung, 54, 195, 196 Produktmaß, 412 Raised Cosine Filter, 333 Raised Cosine Pulse, 339 Randwertproblem, 55 Residuensatz, 405 Riemann-Lebesgue-Lemma, 40, 108, 117, 229, 238 Ritz-Galerkin-Lösung, 211 Sägezahnfunktion, 19 Saite, 2, 58, 219 Sampling, 330 Satz von — Abel-Dirichlet, 46 — Albrecht, 299 — Albrecht-Neumann, 278 — Dirichlet, 23, 107 — Fejér, 23, 109, 235
462 — Fubini-Tonelli, 416 — Gauß, 418 — Hahn-Banach, 302 — Jackson, 85 — Jordan, 266 — Lax-Milgram, 207 — Lebesgue, 416 — Malgrange-Ehrenpreis, 191, 369, 370 — Schwartz, 169 — Shannon, 327 — Weierstraß, 62, 118 — Wiener, 63 Schnelle Wavelettransformation, 398 Schrödinger-Gleichung, nicht-relativistisch, 378 Signalräume, 273 Spektralfunktion, 230 Spektrum, 26, 27, 43 — Amplitudenspektrum, 26 — Betragsspektrum, 26 — Gleichanteil, 26 — Phasenspektrum, 26 Stabilität — Analogfilter, 289 — diskrete Filter, 303, 314 Steifigkeitsmatrix, 212 STFT, 350 Streuung, 343 Stroboskop-Effekt, 70 Temperatur, stationäre, 56 Tensorprodukt, 158 Testfunktionen, 128 — komplexwertig, 156 — Konvergenz, 128
Index — mehr Variable, 155 Tichonov-Regularisierung, 226 Tiefpass-Filter, 70 Tiefpassfilter, 53 Träger, 160 Translationsoperator, 168 Treppenfunktion, 413 trigonometrische Polynome, 7, 10, 13 — Nullstellen, 11 Tschebyscheff-Abszissen, 88 Tschebyscheff-Polynome, 85 Tschebyscheff-Tiefpass, 90, 105, 106 Unschärferelation, 343 Vektorpotential, 196 Wärmeleitungsgleichung, 1, 54, 368 Wavelettransformation, 388 Wechselstromrechnung, 53 Wellengleichung, 2, 364 — avanciertes Potential, 450 — retardiertes Potential, 450 Zeit-Frequenz-Analyse, 349 Zeitdauer-Bandbreite-Produkt, 344 zero-padding, 296, 337 Zusammenfassung — Darstellung durch Fourierreihen, 23 — DFT, 75 — Distributionen, 222 — Fouriertransformation, 269 — Lineare Filter, 301 — tabellarisch, 13 — trigonometrische Polynome, 13