172 55 16MB
German Pages 195 [196] Year 1977
Beiträge zur Numerisehen Mathematik 6
Beiträge zur Numerischen Mathematik 6 Herausgegeben von Frieder Kuhnert und Jochen W. Schmidt
#
R. Oldenbourg Verlag München Wien 1977
CIP-Rurztitelaufnähme der Deutsehen Bibliothek Beiträge zur Numerischen Mathematik / hrsg. von Frieder Kuhnert u. Jochen W. Schmidt. — München, Wien: Oldenbourg. N E : Kuhnert, Frieder [Hrsg.] 6. - 1. Aufl. - 1977. ISBN 3-486-21461-6
© VEB Deutscher Verlag der Wissenschaften, Berlin 1977 Printed in the German Democratic Republic Lizenz-Nr. 206 • 435/99/77 Gesamtherstellung: VEB Druckhaus „Maxim Gorki", Altenburg ISBN: 3-486-21461-6
Inhalt
G. A L B F E L D , Karlsruhe An exclusion theorem for the solutions of operator equations
7
N. APOSTOLATOS, Athen Eine allgemeine Betrachtung von numerischen Algorithmen
11
W . BURMEISTER,
Dresden
Semilokale Konvergenzsätze mit Anwendungen auf Mehrschritt-Iterationsverfahren . . .
27
G.-P. E H L E and H. S C H W E T L I C K , Dresden Rapidly convergent methods for minimizing a sum of squares
49
U. F L E M M I N G , Karl-Marx-Stadt Fehlerabschätzungen für Näherungseigenwerte und -eigenvektoren bei der Pseudostöriteration 61 XI. GROH, K a r l - M a r x - S t a d t
Untersuchungen zum Projektions-Iterationsverfahren von J . D.
SOKOLOV
69
Karl-Marx-Stadt Zur Anwendung des Differenzenverfahrens bei Aufgaben mit freiem Rand
81
Karl-Marx-Stadt Untersuchungen zum Kummerschen Verfahren zur numerischen Behandlung nichtlinearer Eigenwertaufgaben
97
B . HEINEICH,
U . LANGES,
und U . FLEMMTNG, Karl-Marx-Stadt Die Berechnung einfacher Eigenwerte und Eigenvektoren symmetrischer Matrizen mittels Pseudostöriteration 111 A . MEYER
W . M Ö N C H , Freiberg, und H . - D . N I E P A G E , Berlin Iteration mit veränderlichen Schrankenoperatoren zur Lösungseinschließung bei nichtlinearen Gleichungen 121
Rostock Eigenschaften einer nach dem Projektionsverfahren auf Schnitträume von Hyperebenen berechneten verallgemeinerten Matrixinversen 127 W . PETERS,
6
Inhalt
H. R A T S C H E K , Düsseldorf Mittelwertsätze für Intervallfunktionen E . SCHTNCKE,
Halle—Wittenberg, und H.
133 NEUBERT,
Leipzig
Numerische Behandlung statischer Lagerhaltungsmodelle mit stochastischem Bedarf . . . 145 J . W. SCHMIDT, Dresden Eine Anwendung des Brouwerschen Fixpunktsatzes zur Gewinnung von Fehlerschranken für Näherungen von Polynomnullstellen 157 K. S T R E H M E L und J . K Ö H L E R , Halle—Wittenberg Ein neues Prediktor-Verfahren mit Exponentialanpassung für Anfangswertaufgaben gewöhnlicher Differentialgleichungssysteme 1. Ordnung 165 Freiberg Gleichmäßige Abschätzungen mittels Differenzenverfahren bei Randwertproblemen 3. Ordnung 179 W . VOIGT,
P. W E I G A N D , Karl-Marx-Stadt Spline-Approximationen vom Defekt 2 und lineare Mehrschrittformeln zur numerischen Lösung gewöhnlicher Differentialgleichungen 189
Beitrâge zur Ntimeriachen Mathematik 6 (1977), 7 - 1 0
A n exclusion t h e o r e m for the solutions of operator equations GOTZ A L E P E L D
L e t F be a nonlinear mapping from a Banach space X into a Banach space Y. We prove a theorem which yields a ball containing no solution of the equation F(x) = 0. This ball is obtained after having performed one step of Newton's method.
1.
Introduction
Let F be a nonlinear mapping of the Banach space X into the Banach space i". There are many results which assure the existence of a solution of the (nonlinear) equation F(x) = 0. In many cases there are also error estimates for such a solution. Famous results in this direction follow from the contraction mapping principle. Another well known result is the Kantorovic theorem on Newton's method ( H A L L [3]). Thereby one step of Newton's method is performed and then under certain conditions we get a ball in which a solution of the equation F(x) = 0 exists and to which Newton's method will converge. Another interesting result in this direction was proved by W . B U R M E I S T E R in [ 2 ] . Correspondingly in this note we give a ball which does not contain any solution of the equation F(x) = 0. This ball is also obtained after having performed one step of Newton's method. Of course every ball K of the Banach space X, not containing a solution of the equation F(x) = 0, also yields an inclusion set X.\K for all solutions of F(x) = 0. The following theorem contains as a special case a result for real functions which was proved in [1], page 113.
2.
Exclusion theorem Theorem. Let X and Y be Banach spaces. Let F:DczX^Y
be Frechet-differentiable
in the open set D0 cz D. Suppose that the
Frechet-derivative
8
GOTZ ALEFELD
of F is Lipschitz-continuous with Lipschitz-constant y > 0 in the ball K0 = {x | \\x — z0|| ^ r0} cz D0, that F'(x0) is invertible, that IR^O)-1!! = P, and that 0 PY
=2 r0
Y
be Frechet-differentiable in the open set D0 cz D. Suppose that the Frechet-derivative of F is Lipschitz-continuous in the ball K0 = {x\ \\x — a j ^ r 0 ) c: D0 with Lipschitz-constant y Hi'^o)-1!!
0, that F'(x0) is invertible and that
= p.
If the equation F(x) = 0 has a solution x* in the ball K0 = {x | \\x — Zo|| ^ r 0 ),
r0^f0,
then x*dK1
= {x | \\x -
Xi =
-
^H ^ r j
where F'(xo)-1 F(x0),
rx = j
(¡yr*.
P r o o f . By Taylor's theorem (RALL [3], page 124) we have I
F{x0) -
Fix*)
= J F'(x* o
+ 0(x0 -
x*)) ix0 -
x*) dd
I
= F'ix0) (a-0 -x*)
+J
[F'{x*
+ dix0 -
a*)) -
i " ( z 0 ) ] ix0 -
x*) d6.
An exclusion theorem for the solutions of operator equations
9
From this it follows that r* —
z* - {x0 - F'(x0)-i i-(ao))|| F'(xo)-1 j [F'{x* + B(x0 - x*)) - *"(*„)] (x0 - **) dd 0 ^ f3y\\x0 - x*\\* j (I - 6) d6
holds, which is the assertion. P r o o f of t h e t h e o r e m . If K0 contains a solution x* of F(x) = 0 then by the preceding lemma x* is contained in K , and K0 n K1 =|= 0 . Therefore if K0 n K1 = 0, F(x) = 0 has no solution in K0. The equation K0 n K1 = 0 holds if and only if
Ifo — «ill > H + rx holds. This is again the case if and only if
T flyrf + holds. Because of r 0 0
||Z0 - Z|| ^ ||Z6 - l\\ und ||Z6 - Z|| g \\la - Z[| 114 - «II = Iß» - «II
zu 4.
Da V a, b € A die zulässigen Lösungen la und lb eindeutig definiert sind, folgt unmittelbar, daß auch die nichtnegativen Zahlen |lla — Z|| und ||Z,j — l\\ eindeutig definiert sind (vgl. dazu die Bemerkung nach dem Beispiel 3.1). Darausfolgt, daß \\la - l\\ < ||Z„ - l\\ oder \\lb - l\\ ^ \\la - l\\ gilt und folglich auch a Z> oder b iS a.
B e i s p i e l 3.1. Wir betrachten nun das folgende Problem: Es sei die Menge der Gleichungen kx — [i = 0 gegeben, wobei k, fi negative ganze Zahlen sind. Dieses Problem hat V k, /j, mit k 4= 0 genau eine exakte Lösung x := l = — £ Q+. k Algorithmus
o
Algorithmus
b
Abb. 1
Nun setzen wir voraus, daß zur Lösung dieses Problems die Menge A = ja, b) der Algorithmen a und b zu unserer Verfügung steht. Dabei sind die Algorithmen a und b mit Hilfe der in Abb. 1 angegebenen Flußdiagramme definiert. Wir nehmen als Norm in L den absoluten Betrag. Ferner setzen wir — = v + Q, k wobei v 6 Z und Q £ Q mit v 0 und 0 sS Q < 1 gilt. Dann erhalten wir folgende Ergebnisse: a) Für g = — =$1 = v —, la = v ->r 1, lb — v a — b.
Eine allgemeine Betrachtung von numerischen Algorithmen
b) Für
e
> i-
||la -l\\ = l -
e
,
- l\\ =
e
15
a < b.
JU
c) Für 0 < o < — =#>& la = lb = l. B e m e r k u n g . Aus dem obigen Beispiel geht hervor, daß im Fall einer Klasse p von ähnlichen Problemen anstelle des Satzes 3.1 gilt : „Die Relation iS erklärt eine Halbordnung auf der Menge A der Algorithmen". Dabei muß man jeweils unter l bzw. la die entsprechende exakte bzw. zulässige Lösung eines konkreten Problems aus der Klasse p verstehen. D e f i n i t i o n 3.3. Es sei A1 C A, A, 4= 0- Ein Element a* 6 Ax heißt ein optimales Element von A1, wenn gilt a* SS a1, V ax oo Bedingung der Existenz des lim at = a\ L-->OO
Im allgemeinen kann man diese Frage für ein gegebenes Problem p folgendermaßen formulieren: Wie kann man eine Iterationsmethode e = a — («;) wählen, damit gilt: 1) 3 lim a{ = a, 2) a • p = (Zj? Diese Frage wird allerdings nur in spe¿->00 ziellen Fällen behandelt. Offenbar gelten die Sätze: Satz 4.2. Jede antitone fast konstante Folge a — (a;) von Algorithmen aus A besitzt einen Limes.
Eine allgemeine Betrachtung von numerischen Algorithmen
19
S a t z 4.3. Falls A eine endliche Menge ist, dann ist jede antitone Folge a = (a¡) aus A eine fast konstante Folge. Bekanntlich gilt in der Algebra der S a t z 4.4. Jede Äquivalenzrelation bildung zä: M
ä auf einer Menge M definiert gemäß der Ab-
$(itf) mit zä(x) = \y € M A yäx\
(4.3)
eine Zerlegung zä von M mit den disjunktiven Teilmengen zä(x), x 6 M. Wenden wir diesen Satz auf die Menge A der Algorithmen zur Lösung des Problemsp an, so erhalten wir die folgenden Äquivalenzklassen der Äquivalenzrelation = , nämlich z=(a)
= \b 6 A Ab — a).
Bekanntlich heißt die Abbildung (4.3) die Projektion menge Mjä. So gilt speziell für die Menge A das K o r o l l a r 4.2. Für die Äquivalenzrelation z=: A
von M auf die Quotienten-
= auf A existiert eine
Funktion
A/=,
die die Menge A auf die Quotientenmenge A/=
abbildet.
Offenbar sind die Äquivalenzklassen von = die Elemente von
A/=.
Wegen des Auswahlaxioms (vgl. [13]) existiert eine Funktion z: A/= -> A, deren Argumente die Elemente von A/= sind (und folglich Untermengen von A sind), und deren Werte für jedes Element A1 aus A/= ein Element von Ax ist. Offenbar gilt: a 6 A =¿> z(z = (a)j = a. Dabei ist die Relation = im Sinne der Äquivalenzrelation in A zu verstehen. Darüber hinaus können wir unter Verwendung der Äquivalenzrelation = in A schreiben: z = z = _ 1 . Da gleiche Algorithmen aus A dieselbe zulässige Lösung des Problems p liefern, können wir uns in der Praxis auf die Menge z(A/=), d. h. auf den Wertevorrat von z beschränken. Dabei bedeutet z(A/—) im Grunde die Menge der verschiedenen Algorithmen aus A. Es gilt der S a t z 4.5. Falls L endlich ist, dann ist auch t(A/=)
endlich.
Da bei jedem Rechenmittel die zur Verfügung stehenden Informationen immer endlich viele sind, ist man gezwungen, sich in der Praxis auf endliche Mengen L zu beschränken. Darüber hinaus ergibt sich, daß man wegen der Sätze 4.2, 4.3 und des Korollars 4.1 im allgemeinen mit solchen Mengen A von Algorithmen zu tun hat, bei denen zu jeder Folge a = (a,) von Algorithmen aus A der lim a¡ existiert. i—>oo 5. Es seien M j und M2 zwei beliebige Mengen, deren Elemente nichtleere Mengen sind. Wir betrachten die Abbildung (5.1) 2*
20
NIKOLAOS APOSTOLATOS
Diese Abbildung erfüllt die Teilmengeneigenschaft (TE), wenn gilt: V A,B£M1
mit
A (TE). B e w e i s . Es seien A,B AQf{A)
und =
£ M j mit A C B. Wegen der (OE) folgt: B C f{B), f(B) C
f(A),
und wegen der (OOE) => f(A) n f(B) = f{A)
f{A) C f(B), d. h. die (TE).
B e m e r k u n g . Für die Abbildung / gilt nicht die Aussage (OE) + (TE) => (OOE). Wenn die Abbildung / die (TE) und (OE) bzw. die (OOE) erfüllt, heißt sie eine Intervallbildung bzw. eine optimale Intervallbildung. Es sei jetzt M eine nichtleere halbgeordnete Menge und I(M) bezeichne die Menge der abgeschlossenen Intervalle von M. Ferner nehmen wir eine nichtleere Teilmenge I*(M) von I(M) mit der Eigenschaft A, B e I*(M) ^ A n B € I*(M), und es bezeichne M* die Menge der Endpunkte der Intervalle von I*(M). Dann gilt der S a t z 5.2. Falls die Abbildung f: 5ß(ilf) eine optimale Intervallbildung ist, dann ist die Menge M* ein Raster von M (unterer und oberer). B e w e i s . Wir beweisen den Satz im Fall des unteren Rasters. Analog verläuft der Beweis im Fall des oberen Rasters. Im Anschluß an die Definition 1.5 bezeichnen wir für jedes a 6 M mit U(a) die Menge aller b 6 M: b ^ a. Zunächst zeigen wir, daß M* n U(a) =j= 0 gilt. Nach Definition sind beide Mengen M* und U(a) nichtleer. Für « 6 M gilt aber [a, 6] € ^S(Af) und folglich f([a,a])=:[b1,bi]eI*(M).
(5.2)
Wegen der (OE) gilt dann bt ^ a ^ b2. Daraus folgt ^ € U{a). Aus [bu b2] £ I*(M) folgt auch, daß 6 t 6 M*. Folglich gilt M* n ü(a) 4= 0. Gemäß der Definition des
Eine allgemeine Betrachtung von numerischen Algorithmen
21
unteren Rasters bleibt noch die folgende Aussage zu beweisen: V a £ M 3 x £ U(a) n M* : kein b =f= x existiert mit b £ U{a) n M* und x ^ b.
(5.3)
Aus (5.2) und der (OOE) folgt, daß kein Element b £ M* existiert, so daß b, < b < b2 gilt. Daraus und wegen der Beziehung ig a ^ b2 ergibt sich, daß entweder a £ M* oder (a — b1 oder a = b2) ist. Im Fall a — b2 nehmen wir x = b2, dann gilt offenbar die Aussage (5.3). Ist nun a 4= b2, so nehmen wir x = blt dann haben wir Mb ^a
mit
b £ ü (a) n M* => b
V « : = {m ] m = maximales Element von U(a) n T),
A : H —>
H): V a £ H => A® : = \m \ m = minimales Element von 0(a) n T\.
Es gilt der S a t z 5.3. (H, sí) sei eine Halbordnung, T C II ein Raster (unterer und oberer) von H und I(T) C I(M) die Menge aller Intervalle aus I{M), deren Endpunkte Elemente von T sind. Weiter setzen wir voraus, daß T eine Wohlordnung ist, d. h. i, m2 £ A : m1 ^ a iS m2, V a £ A (Bezeichnung: m1 — A, m2 = A). Wir betrachten die Abbildung /:
I(T), wobei V A £
=> f(A) = [o„ a,]
mit »i = / n v«\, «2 = (n a « \ • \ae-4 ) i a€V»,A«CÍ'^UVffl,UAíiCr. aíA aíA Da aber nach Voraussetzung T eine Wohlordnung ist, folgt weiter, daß die Elemente i = ( U V«\ \ne¿ /
a
und
a2 = / U A«\ ^ae.4 J
existieren und Elemente von T sind. Ferner gilt a1 iS a2 und folglich [a 1 ; a2] £ I(T). Nun zeigen wir, daß / eine optimale Intervallbildung ist. Aus der Definition von /
22
NIKOLAOS APOSTOLATOS
folgt unmittelbar, daß / die (TE) erfüllt. Da T eine Wohlordnung ist, folgt weiter: V a £ H => V a = {ü(a)
n T)
und A « = {0(a) n T\
4 U V « = {i7(a) n T, M a^A)
und
(5.4)
U A » = |Q(a) n T, V a € 4 } .
(5.5)
Wegen (5.4) erhält man U(a) n T ^ a ^ 0(a) n T und wegen (5.5) ^ a a x * € E7(a) bzw. a 2 * € 0(a) => «!* € i7(a) n T bzw. a 2 * 6 0(a) n T. Aus aj < « j * bzw. a 2 * < a 2 folgt weiter 3 a ^ € U(a) n T : a,* > t/(a) n T bzw. 3 a 2 * € 0(a) n T : a2* < 0(a) n T. Widerspruch. Damit ist der Satz bewiesen. B e m e r k u n g . Eine Verschärfung des Satzes 5.3 erhält man, wenn statt der Voraussetzung ,,T ist eine Wohlordnung" die folgende Voraussetzung gilt: V a £ II 3 % € U(a) n T und a2 6 0(a) n T: V bx 6 U(a) n T bzw. b2 £ 0(a) nT =>b1 2/2, • • •> 2/») € R" ist a; ^ i/, wenn X; ^ ?/; V i = 1(1) n gilt, dann gilt der S a t z 5.4. Es sei H eine beliebige Teilmenge von R*1 mit der
Eigenschaft:
3 mly m2 £ H: m1 h i i m2, V h € H. Ferner sei l1: z = z(t) 10 iS t 1 eine stetige, ganz in II verlaufende Kurve mit den Eigenschaften a) z(0) = m 1; z(l) = m2 und b) V tx ^ t2 =5> z{tx) sS z(t2). Dann ist die Menge T = {z \ z £ T"1) ein Raster (unterer und oberer) von H. B e w e i s . Es ist leicht zu beweisen, daß die Mengen U(a) n T und O(a) n T V« 6 II kompakt sind. Daraus und weil die Menge T offensichtlich eine Ordnung ist, folgt, daß die Menge U{a) n T bzw. 0(a) n T \fa d H genau ein maximales Element ai bzw. ein minimales Element a2 besitzt (vgl. Abb. 2 im Fall n = 2). Folglich ist nach Definition R ein Raster von H.
Eine allgemeine Betrachtung von numerischen Algorithmen
23
K o r o l l a r 5.1. Es sei H = [x, y~\, x, y € R", x y und T : z = z(t) = x(l — t) + yt 10 t 1. Dann ist T — \z\z f T\ ein Raster von H. K o r o l l a r 5.2. Sei H = R" und T: z = z(i) = x(l — t) + j/ 0, i=l
wobei s-t = b^ + • • • + bt,
A = e2 - 2hs/fi ^ 0 und die
Enthaltenseinsrelation
K = Le ||a; - xk\\ ^ ( 2h _ - 1) c 1 0 ist die Konvergenzordnung der Folge ja;") nicht kleiner als die positive Wurzel der Gleichung i. xk = Kk-x + Beweis. Es wird gezeigt, daß man die Bedingungen (B) und (C) des Satzes 1 erfüllen kann, indem man 2J M; + i= 1
sk
6
\ ök, j
ß(t, ök,...,
k
öj) = y bfii i=l
setzt. Die Bedingung (C) folgt dann direkt aus (3.2), für den Nachweis von (B) ist ||F(zk) - F(zk~1) — H^z"-1, ..., z°) {zk ^ (S/ill^- ^H + y
z^W
Hz"- zMl) II** -
(3-3)
zu zeigen. Aus (3.1) und (3.2) ergibt sich leicht ||ü» - ¿¡»II
2g IIHn(u, «,...,«)-
Htt+1(v, «,..., u)II
+ ll#„+1(^ « , . . . , « ) - i"(t>)ii ^
- «ll,
daher ist wegen der Konvexität von D \\F(zk) - Ffr*-1) — F'iz"-1) (zk - s1'-1)!! ^ — ||zk- z*-1^, und schließlich mit (3.1) und der Dreiecksungleichung IliV-1)
- Hn(z"-\ ..., z«)|| ^ £ b ^ ¡=1
-
¿ ' ¿ s ^ - z ^ ||. ¡=1
z^ll
Semilokale Konvergenzsätze mit Anwendungen
37
(3.3) ist jetzt eine Folge der letzten beiden Ungleichungen. Um Satz 2 anwenden zu können, genügt es, q = oc zu setzen (vgl. Bemerkung 3 in Abschnitt 2.3); dann geht (2.3.1) mit o{t) = h(t — tk) in h(t
-
tk) -
|
-
ti-J
+
Y
(i -
fe-i))
(* -
über; d. h., wenn t0, . . . , t k gemäß tk — = c und werden, ergibt sich die quadratische Gleichung U
~ "2" (t ~
~
it_l)
{t
)
4-1} =
~
\\x{
k-i) =
0
a;i_1|| = i; — tt-x
—
gewählt
°
mit der kleineren Lösung t*
=
h-x
+
—
c
s +
l/A
(3: t k , d a j / z l
^ e ^ h ) .
Nach Satz 2 und den in Satz 3 getroffenen Voraussetzungen sind damit alle Voraussetzungen von Satz 1 erfüllt. Um die Behauptung über die Konvergenzordnung zu beweisen, genügt es nach (2.1.1), die Folge {fn} zu betrachten. Nach der Eigenschaft von q (vgl. Satz 2) nimmt die Vergleichsiteration (2.1.2) die Form