203 58 9MB
German Pages 127 [128] Year 1970
de Gruyter Lehrbuch Hornfeck • Lucht • Mathematik
Einführung in die Mathematik
von
Dr. Bernhard Hornfeck o. Professor an der TU Clausthal
Dr. Lutz Lucht Assistent an der TU Clausthal
Walter de Gruyter & Co • Berlin 1970 vormals G. J. Göschen'sche Verlagshandlung • J. Guttentag, Verlagsbuchhandlung • Georg Reimer • Karl J. Trübner • Veit & Comp.
Copyright 1970 by Walter de Gruyter & Co., vormals G. J. Göschen'sche Verlagshandlung - J. Guttentag, Verlagsbuchhandlung - Georg Reimer Karl J. Trübner - Veit & Comp., Berlin 30. - Alle Rechte, einschl. der Rechte der Herstellung von Photokopien und Mikrofilmen, vom Verlag vorbehalten. Archiv-Nr. 12 44 70 1 - Satz: IBM-Composer, Walter de Gruyter & Co. - Druck: J. Schönwald KG, Berlin - Printed in Germany
Vorwort
Dieses Buch gibt den Inhalt einer Vorlesung wieder, die seit einiger Zeit in jedem Semester an der Technischen Universität Clausthal gehalten wird. Es wird der Versuch unternommen, zwischen der Schulmathematik und den Grundvorlesungen der ersten Semester eine Brücke zu schlagen, die den Beginn des Studiums der Mathematik als Haupt- oder Nebenfach erleichtert. Diesem Konzept ist die Stoffauswahl angepaßt. Grundlegende mathematische Sätze und Techniken werden mit ihren Anwendungen ausführlich besprochen. Es handelt sich dabei vielfach um Dinge, die in den anderen mathematischen Vorlesungen zwar ständig gebraucht, aus Zeitmangel aber dort nicht vertieft werden können. Dies betrifft in der Regel Studierende der Mathematik ebenso wie Naturwissenschaftler, die Mathematik als Nebenfach haben. So wendet sich das vorliegende Buch zunächst an die Studienanfänger. Es kann aber auch von angehenden Abiturienten benutzt werden, die sich auf ihr Studium vorbereiten wollen. Damit sich der Text zum Selbststudium eignet, sind Aufgaben eingefügt und ihre Lösungen am Schluß zusammengestellt. Wir danken Frau Almut Hornfeck für die Reinschrift des Manuskripts und dem Verlag für die Herausgabe unseres Buches. B. Hornfeck L. Lucht
Inhaltsverzeichnis
§ 1 Grundlagen § 2 Summen- und Produktzeichen § 3 Vollständige Induktion § 4 Elementare Kombinatorik § 5 Ungleichungen § 6 Gruppen § 7 Ringe § 8 Vektorrechnung § 9 Abzählbarkeit, Uberabzählbarkeit § 10 Komplexe Zahlen § 1 1 Äquivalenzrelationen, Kongruenzrelationen § 12 Der Zahlbegriff Lösungen der Aufgaben Namen- und Sachverzeichnis
9 15 20 23 27 32 43 51 74 81 89 95 107 125
§1 Grundlagen (1.1) Zur Beschreibung mathematischer Sachverhalte bedarf es einer Sprechweise, die die Ungenauigkeiten der normalen Umgangssprache vermeidet. Wir werden also genau darzulegen haben, was wir unter gewissen Begriffen verstehen wollen. Die Notwendigkeit solcher Vereinbarungen zeigt etwa der umgangssprachliche Gebrauch des Wortes „oder". In der deutschen Sprache wird es sowohl in der Bedeutung verwendet, daß genau eine von zwei Möglichkeiten im Sinne des lateinischen aut.. .aut zutrifft, als auch, daß mindestens eine von zwei Möglichkeiten im Sinne des lateinischen vel zutrifft. Mehrdeutigkeiten dieser Art können wir uns nicht leisten; wir werden „oder" stets in der letztgenannten Bedeutung benutzen. Verabredungen mathematischer Vokabeln bezeichnen wir als Definitionen. Jedes sinnvolle sprachliche Gebilde, das entweder falsch oder wahr ist, nennen wir eine Aussage und eine wahre mathematische Aussage einen Satz. Um die Richtigkeit einer Aussage festzustellen, bedarf es eines Beweises. Wir sagen von einem Satz, er sei bewiesen, wenn er durch logische Schlüsse auf bereits bekannte Sätze zurückgeführt ist. Offenbar können wir diesen Prozeß nicht unbegrenzt fortsetzen. Deshalb ist es erforderlich, zu Beginn einer mathematischen Theorie ein System von Aussagen als wahr anzunehmen. Solche Aussagen bezeichnen wir als Axiome. Axiome gehen als ziemlich willkürliche Setzungen in die Mathematik ein. Sie sind nur dann mathematisch brauchbar, wenn sie widerspruchsfrei sind, das heißt, es darf nicht möglich sein, aus einem vorgelegten Axiomensystem einen Satz und zugleich sein Gegenteil abzuleiten. Solche Untersuchungen sowie die Präzisierung dessen, was wir zum Beispiel in den Begriffen „wahr", „falsch", „logisches Schließen" als intuitiv bekannt vorausgesetzt haben, sind Aufgaben der mathematischen Logik. Wir gehen darauf nicht weiter ein.
(1.2) Mathematische Sätze werden uns in verschiedenen Aussageformen begegnen. Zu ihrem Verständnis ist es daher unumgänglich, die Formulierungsmöglichkeiten zu kennen. Sie alle beruhen nur auf dem exakten Gebrauch der deutschen Sprache. Sind A und B beliebige Aussagen, so bedeutet A => B die Aussage „wenn A, so B"; wir sagen dafür auch A
B
wenn A, so B, aus A folgt B, A ist hinreichend für B, B ist notwendig für A, A nur wenn B, B wenn A.
§ 1 Grundlagen
10
Wir nennen A die Voraussetzung, B die Behauptung der Implikation A =• B. A=>B besagt lediglich, daß jedesmal, wenn A wahr ist, auch B wahr ist. Insbesondere wird in dem Fall, in dem A falsch ist, überhaupt nichts ausgesagt. Es brauchen also weder A noch B wahr zu sein. Anstelle von A => B schreibt man mitunter auch B [ B => A], und die Anwendung dieser Implikation auf die Aussage B => A liefert weiter [B => A] [A B], insgesamt _ _ [A => B] [B => A]. Die Aussagen A => B, B A sind also gleichwertig. Dies ist das wichtige Schema des indirekten Beweises: Wollen wir nachweisen, daß B aus A folgt, so dürfen wir stattdessen A aus B folgern. Mitunter ist das einfacher. (1.3) Unter einer Menge verstehen wir die Zusammenfassung von bestimmten wohlunterschiedenen Objekten zu einem Ganzen. Diese Objekte heißen auch Elemente der Menge. Wir schreiben m G M, wenn m ein Element der Menge M ist, und sagen auch, m liegt in M oder m gehört zu M. Andernfalls schreiben wir m € M. Wir geben eine Menge M explizit an, indem wir ihre Elemente in geschweiften Klammern aufzählen oder deren Gesamtheit durch Eigenschaf-
§ 1 Grundlagen
11
ten beschreiben. Beispielsweise enthält M = {1, 2, 3} die Elemente 1, 2 , 3 ; N = {(x, y) : x, y reell, x 2 + y 2 = 1 > ist die Menge aller Punkte (x, y) des Einheitskreises. Auf die Reihenfolge, in der die Elemente aufgeführt werden, kommt es nicht an. Enthält eine Menge überhaupt keine Elemente, so heißt sie leer. Wir bezeichnen die leere Menge mit L; üblicher ist allerdings 0 oder einfach 0 . Auch für einige andere Mengen, die wiederholt auftreten werden, wählen wir feste Bezeichnungen: Es seien N = {1, 2, 3 , . . . } die Menge der natürlichen Zahlen, Z = {0, 1, - 1, 2, - 2 , . . . } die Menge der ganzen Zahlen, Q = { ™ : m , n 6 Z , n i t 0 } die Menge der rationalen Zahlen, R die Menge der reellen Zahlen, aufgefaßt als Dezimalbrüche. Diese Mengen sowie das Rechnen in ihnen setzen wir als bekannt voraus. Die Anzahl der Elemente einer Menge M sei IMI. Bei unendlichen Mengen schreiben wir IMI = 00 ; sonst ist IM I eine nichtnegative ganze Zahl und speziell ILI = 0. Ist jedes Element der Menge A auch Element der Menge B, so heißt A Teilmenge von B, in Zeichen: A C B. Wir sagen auch, A ist in B enthalten oder B umfaßt A. Für jede Menge M gilt speziell M C M und L C M . Zwei Mengen heißen einander gleich, wenn sie aus denselben Elementen bestehen: A = B o A C B und B C A . Wollen wir ausdrücken, daß A C B, aber A Teilmenge von B.
B gilt, so sagen wir, A ist echte
Unter der Vereinigung A U B zweier Mengen A, B verstehen wir die Menge aller Elemente aus wenigstens einer der Mengen A oder B: A U B = D f {x: x e A oder x G B>. A U B ist schraffiert dargestellt.
Durch das Zeichen „= D f " (lies: definitionsgleich) weisen wir daraufhin, daß die linke Seite nur eine andere Bezeichnung für die rechte ist oder umgekehrt. Den Durchschnitt A H B zweier Mengen A, B definieren wir durch A n B = £>f { x : x € A und x G B } .
A n B ist schraffiert dargestellt.
12
§ 1 Grundlagen
Gilt A n B = L, so heißen A, B elementefremd
oder disjunkt.
Zur Bestätigung der folgenden Rechenregeln zeigt man jeweils die elementweise Übereinstimmung der Mengen beiderseits des Gleichheitszeichens. Das ist eine Sache des exakten Umganges mit „und", „oder". (1)
(2) (3)
Assoziativgesetze
( A n B j n c = A n (B n c j
}
A UB=BUA A n B= Bn A
\ f
v
A n (A U B) = A
}
Absorptionsgesetze
A u (B n C) = (A u B) n (A u C) 1 A n (B u C) = (A n b) u (A n C) J
w
t t. t Kommutativgesetze
Distributivgesetze UlstnDutlv esetze
g
Die Assoziativgesetze erlauben das klammerfreie Aufschreiben von Vereinigung bzw. Durchschnitt beliebig vieler Mengen. Wir setzen abkürzend Ax
u
a
2
und lassen durch
u
... u U Av,
V=1
A
n
= ü a„, P=1
a.
n
a,
n... n
An =
n a„ v=l
D Av auch die Vereinigungs- bzw. Durchschnittsbil-
1>=1
dung unendlich vieler Mengen zu. Eine ganz andersgeartete Verknüpfung zweier Mengen A, B ist das cartesische Produkt AX B (R. Descartes, 1596-1650): AX B = Df {(a, b): a G A , b G B > ; es besteht also aus allen Paaren (a, b), deren erste Komponente a aus A und deren zweite Komponente b aus B stammt; (a, b) = ( a \ b') gilt genau dann, wenn a = a' und b = b' ist. Entsprechend wird das cartesische Produkt mehrerer Mengen definiert. Anschaulich bedeutet R 2 = D f R X R die Menge aller Punkte der Ebene. (1.4) Eine Vorschrift f, die jedem Element a einer Menge A genau ein Element b einer Menge B als Bild zuordnet, heißt eine Abbildung (Funktion) von A in B. Wir schreiben f : A - > B und bezeichnen das Bild b G B von a G A mit b = f(a). Beispiele für Abbildungen sind 1) 2) 3) 4)
f: f: f: f:
R R R2 R R ->• R R -*• R
vermöge vermöge vermöge vermöge
f(x) = sin x für jedes x G R , f((x, y)) = x für jedes (x, y ) G R 2 , f(x) = arctgx für jedes x € R , f(x) = x 3 für jedes x G R .
Wie die Beispiele 1) und 3) zeigen, braucht zu vorgelegtem b G B kein a G A mit b = f(a) zu existieren. Eine Abbildung f: A -»• B, bei der jedes b G B als
13
§ 1 Grundlagen
Bild auftritt, heißt Surjektion, surjektive Abbildung oder Abbildung von A auf B. Die Abbildungen f aus den Beispielen 2) und 4) sind suijektiv. Gibt es zu vorgelegtem b G B ein a G A mit f(a) = b, so muß es nicht eindeutig bestimmt sein; jedes a mit f(a) = b heißt ein Urbild oder Original von b. Eine Abbildung f: A -*• B, bei der jedes b £ B höchstens einmal als Bild auftritt, für die also aus f(a) = f(a') stets a = a' folgt, heißt Injektion, injektive Abbildung oder eineindeutige Abbildung von A in B. Die Abbildungen f aus den Beispielen 3) und 4) sind injektiv, die anderen hingegen nicht. Eine eineindeutige Abbildung f: A - > B von A auf B, also eine Abbildung, die sowohl suijektiv als auch injektiv ist. nennt man auch bijektiv oder umkehrbar eindeutig. Es sei f eine Abbildung von A in B und M C A ; dann heißt f(M) = of { f ( x ) : x G M > das Bild der Menge M. Offenbar ist f genau dann suijektiv, wenn f(A) = B ist. Ist N C B, so nennen wir f" 1 (N) =
Df{x:x€A,f(x)GN>
die Urbildmenge von N. Dann und nur dann besitzt jedes b G B genau ein Urbild a G A mit f(a) = b, wenn f bijektiv ist: . a=Dff"1(b); die so definierte Abbildung f" 1 : B ->• A heißt die Umkehrabbildung von f: A-» B. In naheliegender Weise nennen wir zwei Abbildungen f j : A -*• B, f 2 : A B einander gleich, in Zeichen: f i = f 2 , wenn fj(a) = f 2 (a) für jedes a G A gilt: Die Abbildungen f x , f 2 haben auf jedes a G A die gleiche Wirkung. (1.5) Aufgabe 1: A und B seien Aussagen. Man beweise [A=>B]o[(AundB)=>Ä]. Aufgabe 2: Man beweise die Gültigkeit der Distributivgesetze aus (1.3): Sind A, B, C Teilmengen einer Menge R, so gilt A u (B n C) = (A u B) n (A u C), A n (B u c) = (A n B) u (A n c). Aufgabe 3: A, B, C seien Teilmengen einer Menge R; dann gilt (A n B) u (B n C) u (C n A) = (A u B) n (B u C) n (C u A). Beweis? Aufgabe 4: A, B, C seien endÜche Teilmengen einer Menge R. Man zeige
lAUBl=lAl+lBl-lAOBl
und leite daraus eine entsprechende Formel für ¡ A U B U C l her.
14
§ 1 Grundlagen
Aufgabe 5: Es sei R eine Menge und T C R; T' = D f {r: r G R, r $ T> heißt das Komplement von T in R. Man zeige: a) (T')' = T, T U T' = R, T n T' = L; b) A, B C R => (A U B)' = A' n B', (A n B)' = A' U B'. Aufgabe 6: Es seien f eine Abbildung der Menge A in die Menge B und M, N C A. Man beweise a) f(M U N) = f(M) U f(N), b) f(M n N) C f(M) n f(N) und gebe ein Beispiel dafür, daß in b) nicht notwendig das Gleichheitszeichen steht. Aufgabe 7: A und B seien Mengen, f eine Abbildung von A in B, M C A und N C B . Dann gilt a) M C f _1 (f(M)), b) N D f(f _1 (N)). Beweis?
§ 2 Summen- und Produktzeichen (2.1) Für Summen und Produkte endlich vieler reeller Zahlen wollen wir abkürzende Bezeichnungen einführen. Ihre Nützlichkeit wird sich bald zeigen. Es sei f eine Abbildung von Z in R; m, n seien ganze Zahlen und zunächst m kleiner oder gleich n, in Zeichen: m < n oder n > m. Wir setzen f(m) + f(m + 1) + . . . + f(n) = D f
(*)
I f(v), w=m
f ( m ) . f ( m + l ) - . . . - f(n) = D f
Yl f0>). i>=m Die rechter Hand stehenden Symbole 2 (Sigma) für Summe, n (Pi) für Produkt sollen also ausdrücken, daß die Zahlen f(i>) zu addieren bzw. zu multiplizieren sind, wobei der Parameter v jeweils die ganzen Zahlen von m aufsteigend bis n durchläuft. Seine Benennung ist gleichgültig; zur Vermeidung von Mehrdeutigkeiten ist lediglich darauf zu achten, daß als Parameter nicht gerade einer der Buchstaben n oder m verwendet wird. Für ganze Zahlen m und n, wobei jetzt n kleiner als m ist, in Zeichen: n < m oder m > n , stehen linker Hand in (*) überhaupt keine Summanden bzw. Faktoren da. Wir setzen noch die „leere Summe" bzw. das „leere Produkt" für n < m durch £ f(*0 = D f O , fi f(i;) = p=m v=m
D f
l
fest. Das wird sich als zweckmäßig erweisen. Unmißverständlich ist auch die gelegentlich benutzte Schreibweise s
f(^),
n
UP).
Analog schreiben wir Summen und Produkte indizierter Größen, zum Beispiel a
i
+ a
2
+
• • • + ak
=
k J j ax>
a
k ! - a 2 • . . . • a k = n^ a K .
Für das Produkt der ersten n natürlichen Zahlen geben wir noch die Definition: n Für n € N sei n! = D f ü i > = l - 2 - 3 - . . . - n (lies: n Fakultät), ferner v= 1 0 ! = D f 1. Die Gültigkeit der folgenden Rechenregeln für den Umgang mit dem Summenzeichen ist aus der Definition ersichtlich: (1)
n n c 2 a v = E ca„
(c G R),
16
§ 2 Summen- und Produktzeichen
(2) r
m K
p=l
(4)
2
ji=x
*
r
m
p=i
jj =i
a„ + k =
^
M
aM
(k6Z).
Für die in (3) auftretende Doppelsumme ist auch die Schreibweise 2
a
jx^
Pb"
m
gebräuchlich; man notiert also unter einem Summenzeichen sämtliche Summationsbefehle und spart dadurch Platz ein. Häufig wird die Aufgabe gestellt, Summen oder Produkte reeller Zahlen auszurechnen, das heißt, einen in gewissem Sinne einfacheren Ausdruck dafür hinzuschreiben. Wir geben einige Beispiele und bemerken dazu, daß
n
2
V =1
1 (n £ N)
definitionsgemäß n Summanden enthält, von denen jeder gleich Eins ist. Folglich gilt 2 1 = n (nGN). V=1 Beispiel 1: Es sei q eine reelle, 0 < n eine ganze Zahl. Dann ist
l + q + q + ... + q = 2 2
n
q = y
"l - q n + 1 für q=£ 1, { 1 -q n+ 1
für q = 1.
Für q = 1 steht in der Summe (n + l)-mal der Summand 1; dieser Fall ist also trivial. Es sei nun q ¥= 1; dann gilt J
o
q " = l + q + q2 + . . . + qn,
q-J
o
q"=
q + q2 + . . . + qn + q n + 1 ,
also bei Differenzbildung d-q)oder wegen q ^ 1
n
v=on
Soq"-l-q l-a
1- q
n + 1
n + 1
i 2 Summen- und Produktzeichen
17
Beispiel 2: Für jede natürliche Zahl n gilt 1+2 + 3 + . . . + n= 2
2
Wir schreiben die Summe zweimal auf: 1 + 2 + 3 + . . . + (n - 1 ) + n, n + (n - 1 ) + (n - 2) + . . . + 2 +1 und addieren die übereinanderstehenden Summanden. Es folgt 2 2 v= 2 u+ 2 (n + l-i>) = £ (n + l) = n(n + l) v=l f=l v=l y=l und daraus das obige Resultat. Wir geben noch eine zweite Herleitung an, die etwas umständlicher, dafür aber verallgemeinerungsfähig ist. Wir betrachten nämlich die Summe n+l .2 2 v
v=l
und formen um:
n+l 2 « n « 2 v = 2 0 + 1) = 2 (y + v=l v=0 p=0 n Subtraktion von 2 v liefert
n - n n +1) = 2 v2 + 2 2 v+ 2 1. v=l i>=l v=0
(n + l) 2 = 2 2 v+ 2 1 = 2 2 f + (n + l), v=l
v=0
v=l
also wieder ! v=i
„ = 2k n
+
l)Mn
I ) ) « L? ^ .
+
Beispiel 3: Nach dem Vorbild von Beispiel 2 berechnen wir
n
v
,
( n £ N).
n+l , n , n n „ n n 2 V3 = 2 (v + l ) 3 = 2 f 3 + 3 2 v2 + 3 2 v+ 2 1
v=l
v=0
v=l
v=l
v=l
v=0
(n + l ) 3 = 3 2 v2 + | n ( n + 1) + (n + 1). v=i
2
Dabei haben wir das Ergebnis von Beispiel 2 benutzt. Es folgt 2 „ 2 = n(n + 0 ( 2 n + l) p=i 6 Offenbar haben wir ein Verfahren gefunden, das die schrittweise Berechnung von 2 i>k für k = 1, 2, 3 , . . . gestattet.
V =1
2 Hornfcck
18
§ 2 Summen- und Produktzeichen
Beispiel 4: Auszurechnen ist die Summe aller ungeraden Quadratzahlen von 1 bis (2n - l ) 2 (n G N). Die Summenschreibweise macht diese Aufgabe einfach: Es ist l 2 + 3 2 + 5 2 + . . . + (2n - 1 ) 2 = 2
V=1
(2t>-l)2 = 4 2
V=1
f
2
- 4 £ » + S 1, M=1 V=1
und die rechter Hand stehenden Summen sind uns schon bekannt. Einsetzen und Umformen liefert 2 (2P - 1 ) 2 = —(2n - l)2n(2n + 1)
(n G N).
6
v=i
Beispiel 5: Zu berechnen ist das Produkt
n 1 n (1 — T )
v=2
v
(n G N).
l
Für n = 1 erhalten wir das leere Produkt, das vereinbarungsgemäß den Wert 1 hat. Es sei nun n > 2 :
a (,->>. n d j l . y=2 v ¡j y = 2 v2
n v=2
fr-D VV
^
o
J
^ n
Da dieses Ergebnis auch für n = 1 formal richtig ist, gilt
y*=2
V2
=^
CneN).
2n
(2.2) Aufgabe 1: Man berechne für n G N a)
£ y , K=1
Aufgabe 2: Man berechne für n G N
b)
£
V—l
(-l)"-1^.
^
n v nv=2 v
v=2
_ (n - 1 ) ! (n + 1 ) ! _ n + 1 n! n! 2 2n
» n
"
§ 2 Summen- und Produktzeichen
19
Aufgabe 3: Man berechne für n € N a)
'
n
n
v =l
i + v( - i' r ' \ ,
\
v
Ä n
b) M
)
Aufgabe 4: Für n G N gilt
Beweis?
2*
n
2
-1 1
2
v=i
Z
,
V = 2 „3 _ 1
— < n. v
§ 3 Vollständige Induktion (3.1) In diesem Paragraphen werden wir ein Beweisprinzip kennenlernen, das nur auf einen speziellen Typus von Sätzen anwendbar ist. Es handelt sich um Sätze der Gestalt (*)
Für alle n G N ist die Aussage A wahr.
Trifft A auf eine natürliche Zahl n zu, so schreiben wir kurz A(n). Beispiele dafür haben wir in § 2 bereits kennengelernt, etwa gilt die Aussage A: £
„-^LÜifflrallenGN. 2
Häufig gelangen wir durch die Betrachtung von Spezialfällen nur zu Vermutungen gewisser mathematischer Sachverhalte, sind aber nicht in der Lage, einen direkten Beweis dafür anzugeben. Hat die Vermutung die Gestalt (*), so können wir uns sehr oft in folgender Weise helfen: Wir zeigen zuerst A(l), sodann die Gültigkeit der Implikation [A(n) => A(n + 1)] für jedes n G N . Das Prinzip der vollständigen Induktion besagt dann, daß A auf alle n € N zutrifft. Dies bedarf einiger Erläuterungen: Wir folgern A(n + 1) aus der Induktionsannahme, daß A für die beliebige, aber feste natürliche Zahl n wahr ist. In diesem Induktionsschluß [A(n) ==• A(n + 1)] zeigen wir also nur „wenn A(n), so A(n + 1)" und nehmen dadurch keineswegs die zu beweisende Behauptung vorweg. Da wir aus dem Induktionsbeginn A(l) schon wissen, daß die Aussage A auf I S N zutrifft, schließen wir schrittweise weiter, daß sie auch für 1 + 1 = 2 G IM, also 2 + 1 = 3 G N usw. wahr ist. Das Induktionsprinzip sagt aus, daß wir auf diese Weise A(n) für alle n G N erhalten. Es ist dies eine in den sogenannten Peano-Axiomen (G. Peano, 1858—1932) verankerte Grundeigenschaft der Menge N der natürlichen Zahlen. Wir notieren das Induktionsprinzip nochmals in Kurzform und geben eine gleichwertige Fassung an. A sei eine Aussage über natürliche Zahlen. 1. Form: A(l) A(n) => A(n + 1) =>A(n) für alle n G N. 2. Form:
A(l) [A(l) und A(2) und . . . und A(n)] => A(n + 1) =>A(n) für alle n G N .
Es kann vorkommen, daß eine Aussage A erst von einer natürlichen Zahl n 0 an wahr ist: A(n 0 - 1 + n) für alle n G N . Der Induktionsbeginn für den Nachweis der Aussage A wird dann einfach auf n 0 G N verlegt.
21
§ 3 Vollständige Induktion
Wir geben wieder Beispiele. Beispiel 1: Die Aussage A:
n
n
(
2 v=—
K=1
n
+ J") 2
- für alle n G N ist durch vollstän-
dige Induktion nachzuweisen. Induktionsbeginn: Für n = 1 steht auf beiden Seiten der Gleichung 1; also ist A ( l ) wahr. Induktionsschluß: Unter der Induktionsannahme, daß A auf ein beliebiges n S N zutrifft, müssen wir A(n + 1), also
« - 1 und n G N gilt die Ungleichung von Jacob Bernoulli ( 1 6 5 4 - 1 7 0 5 ) : (1 + x) n > 1 + nx. Es gilt 1 + x = 1 + x, erst recht 1 + x > 1 + x. Dies ist die behauptete Ungleichung für n = 1. Aus der Annahme, es sei schon (1 + x) n > 1 + nx richtig für ein n £ N, folgt durch Multiplikation mit 1 + x > 0 (1 + x ) n + 1 = (1 + x) n (l + x) > (1 + nx)(l + x) = 1 + (n + l ) x + nx 2 > 1 + (n + l)x und daraus die Behauptung.
22
§ 3 Vollständige Induktion
Wir verschärfen die obige Ungleichung: Für x 6 R , x>-l, n 1, gilt sogar (1 + x) n > (1 + nx).
x
0, und n G N ,
Für n = 2 (Induktionsbeginn) ist (1 + x) 2 = 1 + 2x + x 2 > 1 + 2x wahr, denn für reelles x ^ O ist x 2 > 0 . Es sei (1 + x ) n > (1 + nx) wahr für ein n G N , n 1; dann folgt (1 + x) n + 1 = (1 + x) n (l + x) > (1 + nx)(l + x) = 1 + (n + l)x + nx 2 > 1 + (n + l)x und daraus wieder die behauptete Ungleichung. (3.2) Aufgabe 1: Man beweise das Resultat von Aufgabe 2b) aus (2.2) durch vollständige Induktion: n u n+? 2 21 = 2 - 5 - ü für alle n G N . v=i 2" 2" Aufgabe 2: Es sei n eine natürliche und x eine reelle Zahl mit 0 < x < 1. Dann gilt 1 (l-x)n< 1 + nx Beweis? Aufgabe 3: Es sei n> 5 eine natürliche Zahl. Dann gilt n 2 < 2". Beweis? Aufgabe 4: M sei eine Menge. Die Menge P(M) = D f{T: T C M} aller Teilmengen von M heißt die Potenzmenge von M. M sei endlich mit IM I = n > 0 Elementen. Man berechne IP(M) I.
§ 4 Elementare Kombinatorik
(4.1) Ein für die Kombinatorik typischer Fragenkomplex bezieht sich auf die Ermittlung gewisser Anzahlen. Wir verabreden zunächst eine passende Terminologie. Unter einem n-tupel (a 1? a 2 , . . ., a n ) verstehen wir ein Element des cartesischen Produktes Aj X A 2 X . . . X A n der Mengen A l t A 2 , . . . , A n ; entsprechend § 1 sind zwei n-tupel (a t , a 2 , . . . , a n ), (a'1; a 2 , . .., a'n) genau dann gleich, wenn sie komponentenweise übereinstimmen: a„ = aj, für v = 1, 2 , . . ., n. Offenbar gilt für endliche Mengen Ai, A 2 , . . A n die Anzahlbeziehung lAj X A 2 X . . .X A„l= l A j • lA 2 l • . . . • IA„I, im Falle der Gleichheit der n Mengen kürzer lA n l=lAl n . Aus § 3 kennen wir bereits die Anzahl der Permutationen von n Objekten. Wir formulieren das Resultat noch einmal in zweckmäßig abgewandelter Form als Satz 1: Die Anzahl der n-tupel (a l5 a 2 , . . . , a n ) mit paarweise verschiedenen Komponenten a ^ a 2 , . .., a n e {1, 2 , . . . , n} beträgt n!. Die n-tupel (aj, a 2 , . -., a n ) lassen sich durch Umordnen der Komponenten aus dem n-tupel ( 1 , 2 , . . . , n) gewinnen. Für das Folgende definieren wir das Symbol (£) (lies: n über k) für k , n £ N durch n - y _ n ( n - l ) . . . ( n - k + l). k " D f ,=o k ^ k(k-l)...l ' ferner gelte (Q) = (Q) = 1 und (£) = 0. Beispielsweise ist ( 3 ) = der
' ^ ' ^ = 35. Die Bedeutung des Symbols ( k ) zeigt
Satz 2: Die Menge M sei endlich mit IM I = n > 0 . Dann gibt es genau (£) Teilmengen T C M mit IT I = k > 0. Wir erledigen zunächst die trivialen Fälle: Jede Menge M mit IM I = n > 0 Elementen besitzt genau eine nullelementige Teilmenge, nämlich L, und in der Tat ist auch 1 = (Q) für n G N U {0}. Da es offenbar keine Teilmenge T C M mit ITI > iMl > 0 gibt, ist für k e N, n G N U {0}, k > n, die Beziehung (P) = 0 nachzuweisen. Sie ist wahr, denn 0 entweder ist n = 0 und ( j c ) ~ 0 für alle k G N oder im Zähler von
24
§ 4 Elementare Kombinatorik
il-. _ n(n - 1 ) . . . (n - k + 1) k(k - 1 ) . . . 1
(k,n€N,k>n)
tritt der Faktor ( n - n) = 0 auf. Es bleibt noch der Fall IMI = n > ITI = k > 0 zu untersuchen: Sämtliche k-elementigen Teilmengen T von M erhalten wir, indem wir auf alle möglichen Arten k Elemente aus M auswählen. Jede derartige Auswahl kennzeichnen wir dadurch, daß wir unter jedes zu T gehörige Element von M ein „+"-Zeichen, unter jedes andere ein „-"-Zeichen setzen. Wir verteilen also genau k „+"-Zeichen und genau (n - k) „-"-Zeichen. Wären sämtliche Zeichen voneinander verschieden, so gäbe es nach Satz 1 genau n! mögliche Verteilungen. Da jede der k! Permutationen der „+"-Zeichen unter sich und jede der ( n - k ) ! Permutationen der „-"-Zeichen unter sich aber dieselbe Auswahl von Elementen aus M liefert, erhalten wir auf diese Weise jede k-elementige Teilmenge T C M genau k!(n - k)! Male. Insgesamt bekommen wir also nur genau n! _ n(n - 1 ) . . . (n - k + 1) k!(n - k)! k(k - 1 ) . . . 1
-
k-elementige Teilmengen von M. Damit ist Satz 2 bewiesen. Wir können das Resultat im nichttrivialen Fall auch so aussprechen: Für k , n S N gibt es ( £ ) k-tupel (aj, a 2 , . . . , a k ) mit 1 < ax < a 2 < . . . < a k < n und a!, a 2 , . . . , a k 6 N. Von jedem derartigen k-tupel sagen wir, es sei eine Auswahl {Kombination) von k aus n Objekten ohne Wiederholung. Als Folgerungen vermerken wir: 1) Di°
7aW
» n f 11 ^
°°nau dann, wenn k > n ist. Sonst gilt ( £ ) e N
und Man pflegt die Zahlen ( £ ) in einer dreieckförmigen Liste, ftzsca/sches Dreieck genannt, darzustellen (ß. Pascal, 1623-1662): n=0 n=1 n=2 (|)= 1
n= 3
§ 4 Elementare Kombinatorik
25
2) Das Produkt von k aufeinanderfolgenden natürlichen Zahlen ist durch k! teilbar, denn wegen 1) ist ja stets (n - k + 1) (n - k + 2) . . . (n - l)n _ ik k! 3) Es seien a, b € R , n € N; dann gilt der binomische Satz (a + b) n = 2 ( ! V b n - k . k=0 k Zum Nachweis denken wir uns die n Klammern als Produkt (a + b) • (a + b) • . . . • (a + b) ausgeschrieben. Nach Satz 2 können wir k der n Klammern (0 < k < n) auf genau (£) Arten auswählen. Beim Ausmultiplizieren nehmen wir aus jeder der k ausgewählten Klammern den Faktor a, aus den restlichen n - k Klammern jeweils den Faktor b. Wir bekommen genau (£) Male den Summanden a k b n ~ k , insgesamt also die rechter Hand stehende Summe. Wegen dieses binomischen Satzes heißen die Zahlen (£)
Binomialkoeffizienten.
Als wichtigsten Spezialfall des binomischen Satzes notieren wir (l+x)n= 2 i> = 0
v
(x6R,nGN).
(4.2) Durch die Sätze 1 und 2 sind die beiden häufigsten kombinatorischen Aufgaben gelöst. Man sollte noch die Lösung einer dritten kennen: Es seien n > 1 paarweise voneinander verschiedene Objekte gegeben. Auf wieviel verschiedene Arten kann man k > 1 von ihnen auswählen, wenn dabei (im Unterschied zu Satz 2) noch zugelassen wird, daß ein und dasselbe Objekt wiederholt gewählt wird? Für die Anzahl dieser Auswahlen (Kombinationen) von k aus n Objekten mit Wiederholung gilt (man vergleiche die Bemerkung im Anschluß an den Beweis von Satz 2) der Satz 3: Es seien k , n £ N . Dann gibt es genau ( n
+
^ ~ *) k-tupel
(a 1( a 2 , . . . , a k ) mit 1 < a! < a 2 < . . . < a k < n und a x , a 2 , . . . , a k £ N . Beweis: Es sei M = {(a^ a 2 , . . . , a k ): 1 < a! < a 2 < . . . < a k < n , a 1 ; a 2 , . . . , a k € N } ; die Behauptung des Satzes lautet l M l = ( n von k-tupeln durch
+
£ ~ V Es sei weiter eine Menge N
N = { ( b ! , b 2 , . . .,b k ): 1 < b ! < b 2 < . . . < b k < n+k-1, bu b 2 , . . . , b k e N>
26
§ 4 Elementare Kombinatorik
definiert. Aus Satz 2 wissen wir l N l = ( n definieren wir eine Abbildung f: M
+
£ _ 1 ) . Wir zeigen lMl = lNl. Dazu
N durch f f t a ^ a 2 , a 3 , . . a k ) ) = (a!,a 2 + 1, a 3 + 2 , . . a k + k - 1 )
und zeigen, daß sie bijektiv ist. In der Tat erhält jedes k-tupel aus M durch f ein Bild in N, und jedes k-tupel aus N besitzt genau ein Original in M, nämlich ^ ( ( b , , b 2 , b 3 , . . b k ) ) = (b 1 ; b 2 - 1, b 3 - 2 , . . b k - k + 1). Also enthalten M und N gleich viele Elemente, und das war zu zeigen. (4.3) Aufgabe 1: Wieviel k-tupel (ai, a 2 , . . . , a k ) mit paarweise verschiedenen Zahlen a 1 , a 2 , . . . , a k e < l , 2 , . . . , n > , l < k < n , gibt es? Aufgabe 2: An drei Spieler wird ein Skatspiel verteilt. Wieviel verschiedene Verteilungen der 32 Karten sind möglich? Aufgabe 3: Ein Skatspiel wird verteilt. a) In wieviel Prozent der möglichen Fälle liegt wenigstens ein Bube im Skat? b) In wieviel Prozent der möglichen Fälle liegt der Kreuz-Bube im Skat? Aufgabe 4: Es sei k eine natürliche Zahl. Dann gilt ( n S N U {0}) Beweis? Welche Bedeutung hat diese Beziehung für den Aufbau desPasca/schen Dreiecks? Aufgabe 5: Man beweise den binomischen Lehrsatz durch vollständige Induktion nach dem Exponenten n. Aufgabe 6: Man beweise ( k , n £ N U {0})
c)
j ^ n ^ ^ k M )
Aufgabe 7: Es seien d¥=0 und n ganze Zahlen; d heißt ein Teiler von n, in Zeichen: d|n, wenn n = d • d' mit einer ganzen Zahl d' gilt. Eine natürliche Zahl p > l heißt Primzahl, wenn aus d G N und d|p entweder d = 1 oder d = p folgt. Für jede Primzahl p und jede natürliche Zahl n gilt p|n p - n. Beweis?
§ 5 Ungleichungen (5.1) In den vorangehenden Paragraphen haben wir die Möglichkeit, die reellen Zahlen auf der Zahlengeraden zu veranschaulichen, dazu ausgenutzt, die Sprechweise einzuführen, die reelle Zahl a sei größer als Null oder positiv, in Zeichen: a > 0. Wir wollen nun das Rechnen mit diesem Symbol systematisieren und nehmen dazu den naiven Standpunkt ein, a > 0 bedeute, daß a auf der Zahlengeraden rechts von der Null liegt. -1
0
1
...
a
a > 0.
Es ist klar, daß für jedes a S R genau eine der Relationen a > 0 oder a = 0 oder - a > 0 gilt und daß aus a > 0, b > 0 (a, b S R) sowohl a + b > 0 als auch a • b > 0 folgt. Mitunter ist es praktisch, Modifikationen zur Verfügung zu haben: Es seien a, b reelle Zahlen; a > b bedeute a - b > 0, und b < a ist nur eine andere Schreibweise dafür. Ferner bedeute a > b, daß a > b oder a = b gilt, und b < a heißt dasselbe. Beispielsweise gilt \ > \ . Aus diesen Eigenschaften ergeben sich unmittelbar die nachstehenden Rechenregeln (a, b, c, d S R): (1) (2) (3) (4)
a > b = > a + c > b + c; a > b =>a + c > b + c. (a > b und c > d) => a + c > b + d; (a > b und c ^ d) => a + c > b + d. (a > b und c > 0) => ac > bc; (a > b und c > 0) => ac > bc. (a > b und c < 0) => ac < bc; (a > b und c < 0) => ac < bc.
(5)
0 ± a und lal = I- al. Es folgt zunächst lal + l b l > a + b, lal + Ibl > - a - b , also lal + l b l > l a + bl, und durch Ersetzen von b durch - b weiter lal + Ibl > la± bl. Danach wird lal = la + b - b I < la + b I + Ibl, also l a l - l b l < l a + bl, und durch Vertauschen von a und b auch Ibl - lal < la + bI. Ausbeidem folgt llal - Ibll < la ± b l . Es ist klar, daß sich durch sukzessive Anwendung der eben nachgewiesenen Ungleichung la + b l < l a l + lbl allgemeiner
§ 5 Ungleichungen
28
I £ a „ | < 2 la„l ' l» = 1 I v=l
(a„a2
a„£R)
ergibt. Schließlich notieren wir noch für den Betrag eines Produktes (7)
la • bl = lal • Ibl
(a,b6R).
(5.2) Wir wenden uns zwei oft gebrauchten speziellen Ungleichungen zu und fuhren zunächst abkürzende Bezeichnungen ein: Die Zahl i ( a x + a 2 + . . . + a n ) heißt das arithmetische Mittel von aj, a 2 , . . a n G R. Sind die Zahlen aj, a 2 , . . ., a n positiv, so heißt V a j a 2 . . . a n > 0 ihr geometrisches Mittel. Satz 1: Die Zahlen ai, a 2 , . . a n seien positiv und a ihr arithmetisches, y ihr geometrisches Mittel. Dann gilt a > y. Das Gleichheitszeichen steht dann und nur dann, wenn alle a„ (y = 1, 2 , . .., n) einander gleich sind. Den Beweis führen wir in zwei Schritten. 1) Wir zeigen zuerst: Ist das Produkt der n positiven Zahlen x 1 ; x 2 , . . . , x n gleich Eins, so ist ihre Summe größer oder gleich n, und Xj + x 2 + . . . + x n = n gilt genau dann, wenn Xi = x 2 = . . . = x n ist (also alle x„ gleich Eins sind). Diese Aussage A(n) beweisen wir durch vollständige Induktion nach n. A(l) ist richtig. Unnötigerweise zeigen wir noch A(2): Aus x 1 - x 2 = l und Xj = x 2 = 1 folgt X! + x 2 = 2. Es gelte also Xj • x 2 = 1 und etwa Xi < 1, also x 2 > 1. Wir müssen Xi + x 2 > 2 zeigen; in der Tat gilt X! + x 2 = 2 + ( x 2 - l ) ( l - Xi) > 2. Es sei n > l fest gewählt, und es gelte A(n), das heißt: Für je n positive Zahlen sei die Aussage richtig. Zu zeigen ist A(n +1). Ist XjX2 . . . x n + 1 = 1 und X! = x 2 = . . . = x n + 1 (= 1), so folgt x x + x 2 + . . . + x n + 1 = n + 1. Zu zeigen bleibt: Ist x j x 2 - . . x n + i = 1, und sind nicht alle x„ (1 < y < n + 1) einander gleich, so gilt x t + x 2 + . . . + x n + 1 > n + 1. Sind nicht alle x„ einander gleich, so darf man X j < 1 , x n + i > 1 annehmen. Aus ( x i x n + i ) • x 2 . . . x n = 1 und der Induktionsvoraussetzung folgt XiXn+i + x 2 + . . . + x n > n und hieraus Xi + x 2 + . . . + x n + i = > = > a, a-> 2) Es ist y - y - - -
a„
(xix n + 1 + x 2 + . . . + x n ) + x n + i - x i x n +1 +Xx (n + 1) - 1 + x n + 1 - x i x n + 1 + xi (n+l) + (xn+1-l)(l-x,) n+1. a> a? an nach 1) also j + f + . . . + j>n
oder
a>y,
§ 5 Ungleichungen
29
und das Gleichheitszeichen steht dann und nur dann, wenn — = — = . . . = — , T T T also ai = a 2 = . . . = a„ ist. Damit ist Satz 1 nachgewiesen. Wir bemerken noch, daß seine Aussage im Fall n = 2 ganz leicht zu sehen ist: a+b
> V ä b o (a + b) 2 > 4ab ~ (a - b) 2 > 0.
Der nun folgende Satz 2 beinhaltet die Schwarz sehe Ungleichung (H. A. Schwarz, 1843-1921). Satz 2: Es ist (a„, b ^ S R für i> = 1 , 2 , . . . , n) /
n
\ 2
( 2 a„bJ \i> = 1
/
n
,
< 2 a2- 2 v=l
n
i>=l
,
b2.
Hierin steht dann und nur dann das Gleichheitszeichen, wenn es ein x € R gibt mit a„ = xb„ für alle v oder b„ = xa y für alle v, 1 < v < n. Beweis: Ist
2^ b 2 = 0, so gilt b„ = 0 für 1 < v < n, und dafür ist die Schwarz-
sche Ungleichung trivialerweise richtig. richtig Es sei also sehe
b„ > 0. Wir erhalten die
für jedes x € R gültige Abschätzung 0 < 2 (&v - xb„) 2 = x 2 2 b 2 - 2 x 2 a y b„ + 2 a 2 v=l v=l i>=l i» = l u n d daraus m i t p =
(*)
Df
2 a„b„ „v-l =1 — 2" 2b„ v"= l >2
>q
_
=
Df
a „2= ia„ "
" b„ 2
weiter
f ( x ) = D f x 2 - 2 p x + q > 0 für jedes x G R.
Wäre die behauptete Ungleichung falsch, also p 2 > q, so wäre aber f(p) = q - p 2 < 0 im Widerspruch zu (*). Sie ist damit bewiesen. Wir wenden uns nun der Diskussion des Gleichheitszeichens zu: Es gebe ein x mit a„ = xb„ für alle v, 1 < v < n. Dann folgt ( 2 a p b„) 2 = x 2 ( 2 b 2 Y = 2 x 2 b 2 • 2 b 2 = 2 a 2 - 2 b 2 , und der Fall b„ = xa„ für alle v, 1 < v < n, erledigt sich analog. Umgekehrt gelte jetzt n n 2 a„bJ = 2 a 2 • 2 b 2 \i> = l / v=l v=1
30
mit
§ 5 Ungleichungen n
,
^ b y X ) , das heißt bei Verwendung der obigen Bezeichnungen: P 2 = q-
Dann ist
f(p)= £ ( a „ - p b [ ; ) 2 = - p 2 + q = 0, v=l
also in der Tat a„ = pb„ für alle v, 1 < v < n. Gilt aber
n
,
E b„ = 0, so ist b„ = 0 für alle v, 1 < v < n; es gibt dann ein v=i
x S R , nämlich x = 0, so daß b„ = xa„ für alle v richtig ist. Damit ist der Satz 2 vollständig bewiesen. Setzt man in Satz 2 alle bv gleich Eins (1 < v < n), so ergibt sich die manchmal nützliche Folgerung: (a, + a 2 + . . . + a n ) 2
2 eine natürliche Zahl. Dann gilt
Beweis? Aufgabe 2: Es sei n > 2 eine natürliche Zahl. Dann gilt
Beweis?
^
n
- "
V
n /
Aufgabe 3: Für alle natürlichen Zahlen n > 6 gilt
qr/3 Vn Beweis? Aufgabe 6: Es seien k und n natürliche Zahlen. Dann gilt „k+i < n k+1 Beweis?
1k + 2 k + 3k +
___ + n k < ( nfr,+4. 1 )nk+i k+1
§ 6 Gruppen
(6.1) Bisher haben wir in gewissen Zahlenbereichen gerechnet, ohne uns Gedanken über die Art und die Eigenschaften der in ihnen definierten Rechenoperationen zu machen. Wir wenden uns nun der Untersuchung abstrakter Rechenbereiche zu. Im Vordergrund der Betrachtungen stehen dabei nicht die Rechenobjekte, sondern die Beziehungen zwischen ihnen. Wir beginnen mit der folgenden Definition: Es sei M eine nicht leere Menge. Wenn jedem Paar (a, b) von Elementen a, b € M genau ein Element m € M zugeordnet ist (also eine Abbildung von M X M in M erklärt ist), so sagt man, auf M sei eine Verknüpfung definiert und schreibt etwa a o b = m, a + b = m, a • b = m usw. Eine Menge M # L, auf der wenigstens eine Verknüpfung definiert ist, heißt algebraische Struktur. Algebraische Strukturen mit gewissen zusätzlichen Eigenschaften der Verknüpfungen tragen Namen wie Gruppen, Ringe, Körper, Verbände. Die Algebra ist im wesentlichen die Lehre von den algebraischen Strukturen; Teilgebiete sind etwa Gruppen- oder Körpertheorie. Beispiele für algebraische Strukturen haben wir in Z(+), Z(+, •), Q(+, •) und P(M) (bezüglich U, n ) schon kennengelernt. Definition: Eine Verknüpfung o von M heißt assoziativ, wenn für alle a, b, c G M gilt: (a o b) o c = a o (b o c). Sie heißt kommutativ, wenn für alle a, b S M gilt: a o b = b o a. In den oben genannten Beispielen sind die Verknüpfungen assoziativ und kommutativ. Daß dies nicht immer so sein muß, zeigt die durch die Verknüpfungstafel
0 1 2
0
1
2
1 1 2
0 0 2
2 2 2
auf der Menge M = {0, 1,2} definierte Verknüpfung o . Schon in der Teilstruktur T = { 0 , 1 } bezüglich o sind die Assoziativität und die Kommutativität verletzt; aus dem quadratischen Schema lesen wir ab: (0o0)ol = l o l = 0 = M = 0 o 0 =0o(0ol),
0 o l = 0 ^ 1 = lo0.
Die Kommutativität läßt sich aus der Symmetrie einer vorgelegten Verknüpfungstafel leicht feststellen. Assoziativitätsnachweise sind dagegen oft unbequem zu führen; die Verknüpfungstafel leistet dabei nur wenig Hilfe und entfällt ohnehin für unendliche Strukturen. Bei der Definition spezieller algebraischer Strukturen läßt man sich im allgemeinen von Eigenschaften bekannter Rechenbereiche leiten, die als Modelle dafür in
§ 6 Gruppen
33
Frage kommen. So definiert man im Hinblick auf das Modell P(M): Eine algebraische Struktur V mit zwei assoziativen und kommutativen Verknüpfungen U, n heißt ein Verband, wenn für alle a , b £ V die Absorptionsgesetze a U (a n b) = a und a f l ( a U b ) = a gelten (vgl. § 1). Sind überdies für alle a , b , c £ V die Distributivgesetze a U (b H c) = (a U b) n (a U c) und a n (b U c) = (a n b) U (a n c) gültig, so heißt V ein distributiver Verband. Es ist naheliegend, anschließend zu untersuchen, welche Eigenschaften des Modells P(M) sich noch auf beliebige Verbände übertragen lassen. Sind beispielsweise die für jede Menge A £ P(M) gültigen Regeln A U A = A und A H A = A in Verbänden generell wahr? In der Tat folgt aus a £ V durch zweimalige Anwendung der im Verband V bestehenden Absorptionsgesetze die Aussage a U a = a U (a n (a U a)) = a, und, da die als U und n bezeichneten Verknüpfungen in der Definition des Verbandes gegeneinander ausgetauscht werden dürfen. gilt ebenfalls die duale Aussage a f i a = a für jedes a £ V. Wir haben damit zwei Sätze der Verbandstheorie gewonnen. (6.2) Diesem Muster folgend, behandeln wir den grundlegenden Begriff der Gruppe. Definition: Eine nicht leere Menge G heißt eine Gruppe, wenn auf ihr eine Verknüpfung o mit folgenden Eigenschaften erklärt ist: (1) (a o b) o c = a o (b o c) für alle a, b, c £ G. (2) Es gibt ein Element e £ G mit e o a = a o e = a für jedes a £ G. (3) Zu jedem a £ G gibt es ein Element a"1 £ G mit a " ' o a = a o a " 1 = e. Die Elementeanzahl IG I heißt die Ordnung der Gruppe G. Die Gruppe G heißt kommutativ oder abelsch (N. H. Abel, 1802-1829), wenn die Verknüpfung kommutativ ist. Hieraus ziehen wir einige direkte Folgerungen: Die in (1) geforderte Assoziativität der Verknüpfung bewirkt, daß die durch a ai o a2 o a 3 = D f (ai c a 2 ) ° 3 3 , ° ° a 3 ° a 4 = Df ( a i 3) ° a 4 usw. definierten Verknüpfungsresultate von der Art der Klammersetzung nicht abhängen (vgl. Aufgabe 1 in (6.5)). Ferner wäre es noch denkbar, daß es neben e ein weiteres Element e' mit der Eigenschaft (2) in G gibt. Dann wäre aber e o e' sowohl e als auch e', also e = e'. Das neutrale Element e ist daher eindeutig bestimmt. Die Gleichungen a » x = b und y o a = b sind in G eindeutig lösbar. Gäbe es etwa für a o x - b zwei Lösungen gi, g 2 £ G, so wäre jedenfalls a"1 o (a o g , ) = a"1 o (a o g 2 ) oder (a"1 o a ) o g , = (a"1 o a) o g 2 , also gi = g 2 . Wenn also a o x = b lösbar ist, so nur auf eine Weise. Nun geben wir eine Lösung an: x = a " ' o b . Entsprechend ist y = b o a"1 die eindeutig bestimmte Lösung von y o a = b.
3 Hornfeck
§ 6 Gruppen
34
Insbesondere gibt es zu jedem a S G genau ein inverses Element a " ' e G ; es ist die Lösung von a o x = e. Weiterhin gilt a = (V 1 )" 1 , denn sowohl a als auch (a -1 )" 1 sind Lösungen von a"1 o x = e, und analog zeigt die eindeutige Lösbarkeit der Gleichung (a t o ° • • • ° a n) ° x = e die Gültigkeit von (a t o a 2 o . . . o a n ) _1 = a„ o . . . o a^1 o a",1. Man rechnet also in Gruppen ähnlich, wie man es von der normalen Multiplikation reeller Zahlen gewohnt ist. Daher wählt man häufig andere bequemere Schreibweisen für die Gruppenverknüpfung: Bei der multiplikativen Schreibweise setzt man für a o b einfach das Produkt a • b oder kurz ab, für das neutrale Element e oft 1 und bezeichnet es als Einselement. Definiert man noch aa = a 2 , aaa = a 3 , a"1 a"1 = a~2, a° = e usw., so gelten für m , n S Z die Potenzrechenregeln (a m ) n = a m n , a m a n = a m + n . Diese suggestive Notierung darf aber nicht über gewisse Unterschiede zur normalen Multiplikation hinwegtäuschen: zum Beispiel ist in einem Produkt von Gruppenelementen im allgemeinen die Reihenfolge der Faktoren zu beachten, es sei denn, die vorgelegte Gruppe ist abelsch. In diesem Fall schreibt man die Gruppenverknüpfung auch gern additiv. Aus a o b wird dann die Summe a + b, aus dem neutralen Element e Aas Nullelement 0; fernersteht - a für a" 1 , a - b für a + ( - b ) , und man setzt a + a = 2a, a + a + a = 3a, - a - a = - 2 a usw. Wir werden im folgenden die der jeweiligen Situation gemäße Schreibweise wählen. Als geläufige Beispiele für Gruppen nennen wir Z(+), Q(+), R(+), Qo(0> R 0 (-), wobei Q 0 und R 0 die Mengen der von Null verschiedenen rationalen bzw. reellen Zahlen sind. Dagegen sind etwa N(+) oder Q( ) keine Gruppen: in N gibt es beispielsweise kein additionsneutrales Element, und zu O S Q existiert kein multiplikatives Inverses. Die aufgeführten Gruppen sind alle von unendlicher Ordnung; wir wollen uns nun Beispiele von Gruppen endlicher Ordnung ansehen. Es gibt genau eine Gruppe G = {e} der Ordnung Eins: Sie besteht aus dem neutralen Element e mit ee = e. Andere Modelle unterscheiden sich von ihr nur durch die Schreibweise. Wollen wir durch die Einführung einer (multiplikativ geschriebenen) Verknüpfung aus der zweielementigen Menge G = {e, a} eine Gruppe mit dem Einselement e gewinnen, so müssen wir ee = e, ea = ae = a definieren. Weiter muß aa = e gesetzt werden; wäre nämlich aa = a, so gäbe es kein zu a inverses Element in G. Die einzig mögliche Verknüpfungstafel lautet daher
e a
e a
a e
und man prüft leicht nach, daß die so definierte Struktur wirklich eine Gruppe bildet. Abgesehen von Änderungen der Schreibweise gibt es also genau eine
§ 6 Gruppen
35
Gruppe der Ordnung 2. Entsprechend zeigt sich, daß die in diesem Sinne einzige Gruppe der Ordnung 3, G = {e, a, b>, die Verknüpfungstafel
e a b
a b e
b e a
besitzt. Die erste Zeile und die erste Spalte geben die Verknüpfungsergebnisse mit dem Einselement e an und liegen daher fest. Da wegen der eindeutigen Lösbarkeit der Gleichungen gx = h, yg = h (g, h (= G) in keiner Zeile oder Spalte zweimal dasselbe Element stehen darf, ergibt sich der weitere Aufbau der Verknüpfungstafel zwangsläufig. Wieder prüft man nach, daß auf diese Weise tatsächlich eine Gruppe entstanden ist. Lediglich der Nachweis des Assoziativgesetzes ist etwas unbequem. Die Bestimmung aller Gruppen der Ordnung 4 (Aufgabe 3 in (6.5)) liefert bereits vier mögliche Verknüpfungstafeln, von denen allerdings drei bei Umbenennung der Gruppenelemente zusammenfallen. Es erscheint nützlich zu präzisieren, wann zwei Gruppen „bis auf die Schreibweise gleich" genannt werden sollen. Wir tun dies in der folgenden Definition: Zwei Gruppen G(o), H(«) heißen isomorph, G —H, wenn es eine bijektive Abbildung f: G H mit f(a o b) = f(a) • f(b) für alle a, b G G gibt. Diese Eigenschaft heißt Relationstreue, die vermittelnde Abbildung f ein Isomorphismus von G auf H. Isomorphe Gruppen werden vom gruppentheoretischen Standpunkt aus nicht als verschieden angesehen. Wenn wir später für gewisse Gruppen feste Bezeichnungen vereinbaren, so ist dadurch stets das im Sinne der Isomorphie eindeutig festgelegte abstrakte Modell gemeint. Zum Beispiel sind die dreielementigen Gruppen G = {e, a, b} mit der oben aufgeführten Verknüpfungstafel und H = {0,1, 2} mit der Verknüpfungstafel
0 1 2
0
1
2
0 1 2
1 2 0
2 0 1
isomorph. Sie gehen durch die Identifikation e = 0, a = 1, b = 2 meinander über. Die zweite Darstellung wird besonders durchsichtig, wenn die Verknüpfung von H additiv gelesen wird: das Verknüpfungsergebnis zweier Elemente aus H ist einfach der kleinste nichtnegative Rest bei Division ihrer in Z ermittelten normalen Summe durch die Gruppenordnung 3.
3*
36
§ 6 Gruppen
Wir geben noch die naheliegende Definition: Eine nicht leere Teilmenge U der Gruppe G heißt Untergruppe von G, wenn U eine Gruppe bezüglich der Verknüpfung von G ist. Hiernach sind {e} und G stets Untergruppen der Gruppe G mit dem neutralen Element e. Die Menge 2Z aller geraden ganzen Zahlen bildet hinsichtlich der normalen Addition eine Gruppe, ist also eine Untergruppe von Z(+). Überdies gilt Z(+) 2Z(+): Die durch f(k) = 2k definierte Abbildung f: Z->2Z ist offenbar ein Isomorphismus; die Relationstreue ergibt sich aus f(r) + f(s) = 2r + 2s = 2(r + s) = f(r + s). Es kann also (bei Gruppen unendlicher Ordnung) durchaus vorkommen, daß eine Gruppe zu einer ihrer echten Untergruppen isomorph ist. (6.3) Wir behandeln nun ein sehr allgemeines Konstruktionsverfahren für Gruppen und fügen dadurch den bisher gefundenen Beispielen für Gruppen weitere hinzu. Insbesondere lernen wir nichtkommutative Gruppen kennen; die kleinste hat sechs Elemente. Es seien zwei Abbildungen f: A->B und g: B->-C gegeben. Wir setzen h(a) = g(f(a)) für jedes a S A . Auf diese Weise ist eine Abbildung h: A -»• C definiert; wir nennen sie die Produktabbildung von f und g und schreiben h = g o f. Es ist also für jedes a S A ( g ° f ) ( a ) = D fg(f(a)). Wieder ist die multiplikative Schreibweise gf statt g o f praktisch; wir benutzen sie im folgenden und schreiben für (gf) (a) noch kürzer gf(a). Es sei M L eine Menge und die Abbildung e: M -* M definiert durch e(m) = m für alle m S M . Dann heißt e die identische Abbildung von M. Identische Abbildungen verschiedener Mengen unterscheiden wir notfalls durch Indizes: e M bedeutet die identische Abbildung der Menge M. Ist zum Beispiel f: A -»• B bijektiv und f" 1 : B A die Umkehrabbildung von f, so gilt f " 1 f = e A , ff" 1 = e B . Ist f:M->M bijektiv, so gilt f"1 f = ff" 1 = e M =e. Wir gehen von dem Abbildungsschema A
f
B
g
C
h
D
aus und beweisen den wichtigen Satz 1: Das Produkt von Abbildungen ist assoziativ: h(gf) = (hg)f. Beweis: h(gf) und (hg)f sind Abbildungen von A in D; sie haben auf jedes a G A dieselbe Wirkung: h(gf) (a) = h(g(f(a))) = (hg)f(a), stimmen also überein.
§ 6 Gruppen
37
Unser Interesse gilt den bijektiven Abbildungen einer Menge M auf sich; wir vereinbaren abkürzende Bezeichnungen in der nachstehenden Definition: Eine bijektive Abbildung einer Menge M auf sich heißt eine Transformation von M. Eine Transformation einer endlichen Menge M heißt eine Permutation von M. Eine Permutation 7r einer n-elementigen Menge M = {aj, a 2 , . . . , a n > gibt man durch ein zweizeiliges Schema an:
in der oberen Zeile stehen alle Originale, darunter deren Bilder. Die untere Zeile enthält die gleichen Elemente wie die obere, lediglich die Reihenfolge hat sich im allgemeinen geändert. Dies bedeutet, daß die hier gegebene Definition und der in § 3 eingeführte Begriff der Permutation denselben Sachverhalt beschreiben. Ist insbesondere P die Menge aller Permutationen einer Menge M mit lMl = n £ N , so wissen wir bereits IPl = n ! . Daß es sich vom gruppentheoretischen Standpunkt aus lohnt, Permutationen einer Menge M zu betrachten, entnehmen wir dem Satz 2: Die Menge F aller Transformationen einer Menge M =/= L ist eine multiplikative Gruppe. Beweis: Sind f, g e F, so ist die Produktabbildung gf: M M erklärt. Sie gehört zu F, denn sie ist bijektiv: Da f und g suijektiv sind, gilt dies auch für gf. Aus gf(m) = gf(m ), m, m' G M, folgt wegen der Eineindeutigkeit von g zunächst f(m) = f(m') und wegen der Eineindeutigkeit von f weiter m = m', das heißt, gf ist insgesamt bijektiv. Das Produkt von Transformationen verhält sich nach Satz 1 assoziativ. Die identische Abbildung e von M auf sich ist das Einselement von F, und zu f € F existiert nach § 1 die Umkehrabbildung f : M -*• M und liegt ebenfalls in F. Wegen r 1 f = f f " 1 = e ist sie das zu f inverse Element. Für gewisse Permutationsgruppen wählen wir feste Bezeichnungen. Definition: Es sei M ¥= L eine Menge mit n Elementen. Die Gruppe aller Permutationen von M heißt die symmetrische Gruppe vom Index n; wir nennen sie S n . Wir wissen ISnl = n! . Die eben gegebene Definition hat einen Sinn, denn die Permutationsgruppen zweier Mengen M und M' mit gleicher Elementeanzahl n £ N sind offenbar isomorph. Zur Beschreibung von S n legen wir einfach die Menge M = { 1 , 2 , 3 , . . . , n} zugrunde.
38
§ 6 Gruppen
Die Permutationsgruppe Si der einelementigen Menge M = { 1 ) besteht aus der Identität e allein. Die Menge { 1 , 2 } besitzt die Permutationsgruppe
{c
i).(j
?)}=
wir kennen sie aus (6.2) und hatten sie dort nur einfacher geschrieben: {e, a> mit e 2 = a 2 = e, ea = ae = a. Die symmetrische Gruppe S3 enthält die 3! = 6 Permutationen der Menge { 1 , 2 , 3 } : f
8
=
M \2 /I \2
2 3 2 1
3)
3\ 3 >'
2 3\ \3 1 21' /l 2 3 \ \3 2 1 ) '
J \
2
11' 8
=
12 3 Vi 2 3 2 J \ 2 3\ 8 Vi 3 2 / ' e
J
Wir rechnen in S 3 , indem wir die Multiplikation der Permutationen gemäß ihrem Abbildungscharakter von rechts nach links ausführen; so wird beispielsweise ( l - * 2 - > 3 , also l - > 3 usw.) g f fg 8 ßf=
/ 1 2 3\ / 1 2 3\ _/ 1 2 3\ \ 2 3 1/ V2 1 3/ V3 2 1/ '
( 2 1 3) (2 3 ?) = ( l 3 2 ) ^ f g -
Die symmetrische Gruppe S 3 = {e, f, f 2 , g, fg, f 2 g } ist also nicht kommutativ, und man rechnet in ihr nach den Regeln f 3 = g 2 = e und f 2 g = gf. Betrachtet man in S n + 1 die Teilmenge aller Permutationen von M = {1, 2 , . . . , n, n + 1}, die etwa das Element n + l £ M fest lassen, so sieht man S n C S n + i . Dies hat zur Folge, daß sämtliche symmetrischen Gruppen S n für n > 3 nicht kommutativ sind. Ferner finden wir in S n spezielle abelsche Untergruppen, die wir noch nicht kennen. Das Element n 2 3 . . . n _ ! „x \2
3 4
...
n
lJ
G S n
erzeugt die Untergruppe U = {f, f 2 , . . . , f n ~ ' , f n = e } von S n . Es handelt sich wirklich um eine Untergruppe von S n mit genau n Elementen: U enthält lauter paarweise verschiedene Elemente, denn aus 0 < i < j < n - 1 folgt f ' ( l ) = i + 1 < j + 1 = f j ( l ) , also f j . Wegen f n = e liegt das Produkt zweier Elemente von U wieder in U. Das Assoziativgesetz braucht nicht nachgeprüft zu werden, da es sogar in S n gilt. Es ist f € U , und wegen f f " " 1 = f n = e, 0 < i < n - 1, gehört mit jedem Element auch dessen Inverses zu U. Offensichtlich ist U abelsch. Definition: Eine Gruppe, die nur aus den paarweise verschiedenen Potenzen a, a 2 , . . . , a n = e eines festen Elements a besteht, heißt zyklische Gruppe der
39
§ 6 Gruppen
Ordnung n; wir nennen sie Z n . Das Element a heißt erzeugendes von Z n .
Element
Aus der oben durchgeführten Konstruktion wissen wir die Existenz zyklischer Gruppen der Ordnung n für jede natürliche Zahl n. Da zwei zyklische Gruppen gleicher Ordnung isomorph sind, ist die Benennung Z n für die abstrakte zyklische Gruppe der Ordnung n gerechtfertigt. Damit gilt der Satz 3: Es sei n eine natürliche Zahl. Dann gibt es genau eine zyklische Gruppe der Ordnung n: Z n . Sie ist abelsch. Wählen wir statt der multiplikativen die additive Beschreibung von Z n , so ist die Verknüpfung der Elemente k, m e Z n = {0, 1 , 2 , . . ., n - 1 } durch k + m = r erklärt, wobei r der kleinste nichtnegative Rest ist, der bei normaler Addition von k, m in Z und anschließender Division durch n entsteht. Das Beispiel n = 3 kennen wir schon aus (6.2). Wir haben damit zu jeder natürlichen Zahl n eine abelsche Gruppe der Ordnung n gefunden. Auf die Frage nach sämtlichen abelschen Gruppen einer vorgegebenen Ordnung n gibt es eine befriedigende Antwort, hingegen kann man schon über die Anzahl der nichtkommutativen Gruppen der Ordnung n nur in Ausnahmefällen genaue Aussagen machen. Man weiß, daß es jeweils nur eine Gruppe von vorgegebener Primzahlordnung gibt: Ist p eine Primzahl, so existiert nur eine Gruppe der Ordnung p, nämlich die zyklische Gruppe Z p (Aufgabe 7 in (6.5)). Man kann zeigen, daß Z 6 und S 3 die einzigen Gruppen der Ordnung 6 sind; sie sind nicht isomorph, denn Z 6 ist abelsch, S 3 aber nicht. Alle Gruppen mit Ordnungen < 7 sind uns also nun bekannt.
(6.4) Wir geben zunächst eine vereinfachte Schreibweise für Permutationen an, zum Beispiel ( \ 2 3 4 5 6 7 8\ (2 1 3 7 5 8 6 4) = (12) O ) (5) (4768) oder, noch kürzer, (12) (4768). Das bedeutet: 4 geht in 7, 7 in 6, 6 in 8, 8 in 4 über; 1 geht in 2, 2 in 1 über; 3 und 5 bleiben fest. Jede Permutation läßt sich auf diese Weise als Produkt elementefremder Zyklen schreiben. Die Ausmultiplikation von Zyklen erfolgt, wie es für Abbildungen allgemein der Fall ist, von rechts nach links; aber das Produkt elementefremder Zyklen ist natürlich kommutativ: (12) (4768) = (4768) (12). Ein zweielementiger Zyklus, also eine Permutation, die zwei Elemente vertauscht und die übrigen festläßt, heißt Transposition. Aussagen über die Darstellung von Permutationen durch (nicht notwendig elementefremde) Transpositionen macht der folgende
40
§ 6 Gruppen
Satz 4: Es sei n > 2 und f G S n . a) Dann gibt es Transpositionen t i , t 2 , . . . , t k € S n mit f = t j t 2 . . . t^b) Sind f = t j t 2 - . -tk und f = - • . t ^ zwei derartige Darstellungen, so sind k und m entweder beide gerade oder beide ungerade Zahlen. Beweis: a) Die identische Permutation aus S n besitzt die Darstellung e = (12) (12). Es sei daher f =#= e und in , , „ . esn f = 1 2 3 ••• n Val a 2 33 • - • a J etwa ai = 1, a 2 = 2 , . . . , a^-i = X - 1 , a^ # X (1 < X < n). Linksmultiplikation von f mit der Transposition t j = (X a^) liefert (bj
b2
b3
. . . bn) ^ S "
mit bi = 1, b 2 = 2 , . . . , bx = X. Wiederholung des Verfahrens führt zu t k t k - i . . . t j f = e oder wegen t K t K = e zu f = t j t 2 - - .t k mit gewissen Transpositionen t K , 1 < k < k. b) Wir betrachten das Produkt P = P(l> 2 , . . n ) = (1 - 2) (1 - 3) (1 - 4 ) . . . (1 - n) (2-3) (2-4)...(2-n) (3 - 4) . . . (3 - n) (n-l-n) und ersetzen in ihm überall i (1 < i < n) durch f(i). Dann treten alle Faktorer (i - j), 1 < i < j < n, abgesehen von einem Vorzeichenfaktor ± 1, wieder auf. Es entsteht P(f(l), f ( 2 ) , . . . , f(n)) = c f P mit Cf=+1 oder C f = - 1 . Für Transpositionen t £ S n zeigt eine Auszählung c t = - l . Aus f = t ! t 2 . . .t k = t i t 2 . . - C folgt also c f P = c t l c t 2 . . .c, k P = c t 'jc,' 2 .. .c t - m P oder ( - l ) k = ( - l ) m und daraus der Rest der Behauptung. Satz 4 erlaubt die Definition: Ist f e S n das Produkt von k Transpositionen aus S n , so heißt ( - l ) k das Signum (Vorzeichen) sgn f von f. Die Permutation f heißt gerade, wenn sgn f = 1 ist, andernfalls ungerade. Satz 5: Es sei A n die Menge aller geraden Permutationen aus Sn,n> 2. Dann ist A n eine Untergruppe von S n mit ~n! Elementen. A n ist kommutativ nur für n = 2 und n = 3.
41
§ 6 Gruppen
Beweis: Die identische Abbildung e gehört zu A n . Da das Produkt zweier gerader Permutationen wieder eine gerade Permutation liefert, folgt aus f, g € A n also gf ), 2 < v < p - 2, besitzt ein, inverses Element in Z p . Es steht ebenfalls in der geschweiften Klammer und ist von K(f) verschieden, denn aus K(i^)K(f) = K(l) folgt (K(f) - K(l)),(K(i>) + K(l)) = K(0) : also wegen der Nullteilerfreiheit von Z p entweder K(f) = K(l) oder K(i>) = K(- 1). Die Restklassen K ( 2 ) , . . . , K(p - 2) lassen sich daher paarweise mit ihren jeweiligen Inversen zusammenfassen: {K(2) . . . K(p - 2)} = K(I). Es wird K((p -1)!) = K(1)K(- 1) = K(-1) oder (p -1)! = - 1 mod p. Das Bestehen dieser Kongruenz auch für p = 2 ist offensichtlich, der Satz damit nachgewiesen. (7.5) Aufgabe 1: Es sei R ein kommutativer Ring, und es werde für r £ R , k 6 N die Schreibweise kr = D f r + r + . . . + r (k Summanden r) verabredet. Dann gilt der binomische Lehrsatz r, •n Beweis?
(a + b) n = 2 ( vI V b " - " »=o
( a , b 6 R ; n £ N).
Aufgabe 2: Es sei R ein kommutativer Ring mit dem Einselement 1 G R. Ein Element r G R heißt Einheit, wenn es ein r' G R mit rr' = 1 gibt. Die Menge E der Einheiten aus R bildet bezüglich der Multiplikation aus R eine Gruppe, die sogenannte Einheitengruppe von R. Beweis? (Bemerkung: In einem Körper ist jedes von Null verschiedene Element also Einheit.) Aufgabe 3: Man löse die Kongruenz 8x = 11 mod 13.
4 Hornfeck
50
§ 7 Ringe
Aufgabe 4: Man löse das Kongruenzsystem 2x + 4y + 5z = 2 mod 7, y + 2z = 0 mod 7, 6x + 7y + 8z = 3 mod 7. Aufgabe 5: Jeder endliche Integritätsbereich ist ein Körper. Beweis? Aufgabe 6: Man gebe einen neuen Beweis des sogenannten kleinen Fermatschen Satzes der Zahlentheorie: Für jede natürliche Zahl n und jede Primzahl p gilt n p = n mod p (vgl. Aufgabe 7 aus (4.3)). Anleitung: Man rechne in Zp und verwende die Aufgabe 8 aus (6.5).
§8 Vektorrechnung (8.1) Im folgenden betreiben wir auf anschauliche Weise ebene und räumliche Geometrie. Zur rechnerischen Beschreibung geometrischer Sachverhalte führen wir geeignete Begriffe ein. Unter einem Vektor verstehen wir eine orientierte Strecke. Zwei Vektoren nennen wir genau dann gleich, wenn sie sich durch eine Parallelverschiebung ineinander überfuhren lassen, wenn sie also in Länge, Richtung und Orientierung übereinstimmen. Vektoren stellen wir durch Pfeile dar und bezeichnen sie mit kleinen deutschen Buchstaben: ,.. V (Pfeilspitze)
(Pfeilanfang)
Auf der Menge V der ebenen bzw. räumlichen Vektoren definieren wir eine additiv geschriebene Verknüpfung: Unter der Summe IM- + -fr- zweier Vektoren ix, -&- verstehen wir denjenigen Vektor, der vom Pfeilanfang von ut zur Pfeilspitze von ß- zeigt, wobei der Pfeilanfang von -ß- an die Pfeilspitze von ta. angelegt ist.
Der Summenvektor OL + -6- ist hierdurch wirklich definiert, denn eine Parallelverschiebung der Konstruktion läßt seine Länge, seine Richtung und seine Orientierung fest. Wir zeigen, daß V(+) eine abelsche Gruppe ist. Assoziativität und Kommutativität der Addition ergeben sich aus den nachstehenden Figuren.
01+O + («.+-&) -
4*
52
| 8 Vektorrechnung
Der Vektor tr € V der Länge Null erfüllt die Gleichung -oi-+ tr = «t für jeden Vektor V. Wir nennen ihn den Nullvektor. Schließlich existiert zu jedem ut G V ein Vektor -xxe V gleicher Länge und Richtung, aber entgegengesetzter Orientierung; für ihn gilt w. + (-•«-) =ty. Wie üblich schreiben wir wieder -ou- -&• statt Wir erklären noch eine Multiplikation, die jedem Paar (X,--, x erreichen läßt, erfüllen die zugehörigen Vektoren von O zu den Punkten X die Vektorgleichung Ag = «.+ X-&-+ fit
(ß-, -t linear unabhängig).
Umgekehrt entspricht jedem Paar (X, p) der Parameter \ , f i S R genau ein Punkt der Ebene. Bei koordinatenweiser Beschreibung bekommen wir wieder drei gewöhnliche Gleichungen
56
§ 8 Vektorrechnung
Ist eine Ebene durch drei nicht in einer Geraden liegende Punkte Q(o(), R(v) gegeben, so erhalten wir die zum Aufstellen der Ebenengleichung erforderlichen Vektoren etwa durch ut = x =v-p.
3) Häufig kommt die Aufgabe vor, zwei Geraden oder eine Gerade mit einer Ebene oder zwei Ebenen im Raum zu schneiden, das heißt, den Durchschnitt der entsprechenden Punktmengen zu bestimmen. Diese Aufgabe führt stets auf die Lösung eines Gleichungssystems, das drei lineare Gleichungen mit zwei, drei bzw. vier unbekannten Parameterwerten enthält. Gesucht sei etwa der Durchschnitt E! O E 2 der beiden Ebenen
Wir erhalten ihn durch die Lösung der Vektorgleichung -^j =^2» also durch Ermittlung sämtlicher Parameterwerte R, die das zugehörige Gleichungssystem X - 2/lx - v =-1 X + v - 4p = - 1 \ +2ß +v -2p = 3 erfüllen. Wir lösen es, indem wir nach einem übersichtlichen Rechenschema verfahren; dazu schreiben wir die durchnumerierten Gleichungen noch einmal in anderer Form auf: X „1
ß
v
p
-2
-1
0
ÍXO 1 -4 1 2 X 1 "2
-1
(I)
-1 3
(II) (III)
Es ist klar, daß die Lösungsgesamtheit von (*) sich nicht ändert, wenn in (**) eine der sogenannten elementaren Umformungen vorgenommen wird: a) Vertauschung zweier Zeilen, b) Vertauschung zweier Spalten, c) Addition des Vielfachen einer Zeile zu einer anderen Zeile. Wir benutzen diese Eigenschaften, insbesondere c), zur schrittweisen Elimination von Unbekannten; das entspricht der Erzeugung von Nullen unterhalb der in (**) gestrichelt eingezeichneten Linie:
§ 8 Vektorrechnung
57
X
v
P
1 -2 - 1 0 1 -4 1 0 1 2 1 -2
-1 -1 3
(I) (II) (III)
1 -2 0 2 0 4
-1 2 2
0 -4 -2
-1 0 4
(I) ( I I ) - (I) (III) - ( I )
1 -2 -1 0 2 2 0 0 -2
0 -4 6
-1 0 4
(I) (II) - (I) (III) - ( I )
Aus den letzten drei Gleichungen lesen Wir, schrittweise von unten nach oben verfahrend, ab: v=-2+3p , ß = 2p - v = 2p - ( - 2 + 3p) = 2 - p , X = - 1 + v + 2p = - 1 + ( - 2 + 3p) + 2(2 - p) = 1 + p . Für jeden Wert des Parameters p £ R ist dies eine Lösung von (*), und weitere Lösungen gibt es nicht. Dieses Resultat bedeutet, daß für jedes p G R die Vektorgleichung
r 2 = 0,a2ia22a23a24 • •., r = 3 0>a31a32a33a34 • • •> r 4 = 0,345342343844.. ., in der jedes r G R, 0 < r < 1, genau einmal vorkommt. Wir führen die Annahme zum Widerspruch, indem wir ein r G R , 0 < r < l , finden, das in der Liste nicht auftritt. Es sei nämlich r = 0,b u b22b33b 4 4... und darin b n n =/= a n n und b n n 0 für alle n G N gewählt. Es ist 0 < r < 1 und r ein nicht abbrechender Dezimalbruch. Enthielte unsere Liste die Zahl r, so gäbe es ein k G N mit r = r k . Insbesondere wäre dann wegen der erwähnten Eindeutigkeit der Darstellung a k k = b k k ; aber das ist unmöglich, da wir gerade b k k a k k gewählt hatten. Das in diesem Beweis verwendete Verfahren wird Cantorsches Diagonalverfahren genannt (G. Cantor, 1845-1918).
78
§ 9 Abzählbarkeit, Überabzählbarkeit
Wir betrachten nun die Mengen N C Z C Q C A C R . Da R als einzige von ihnen überabzählbar ist, gibt es insbesondere irrationale Zahlen und transzendente Zahlen (und zwar sogar überabzählbar viele). Die mengentheoretischen Hilfsmittel gestatten freilich nicht die konkrete Angabe auch nur einer einzigen irrationalen oder transzendenten Zahl. Sie ermöglichen nur reine Existenzbeweise. So ist man auf andere Methoden angewiesen, um irrationale oder transzendente Zahlen zu finden. In (9.1) haben wir die Irrationalität etwa von s/2 recht einfach bewiesen; Transzendenznachweise liegen dagegen wesentlich tiefer. Transzendent sind beispielsweise die in der Analysis definierten Zahlen e = 2,71828... und TT = 3,14159... (9.3) Wir setzen unser Vorhaben, unendliche Mengen gegeneinander abzugrenzen, fort mit einer weiteren Definition: Zwei Mengen A, B heißen gleichmächtig, in Zeichen: lAl = lBl, wenn es eine bijektive Abbildung 0: A - l A l , wenn es eine Teilmenge B* von B mit IAI = IB* I, aber keine Teilmenge A* von A mit lA*I = iBl gibt. Daß es sich hierbei wirklich um eine Definition handelt, die für endliche Mengen A, B überdies die in N U -{0} übliche Anordnung liefert, ist klar. Zwei endliche Mengen sind genau dann gleichmächtig, wenn sie gleich viele Elemente enthalten. Wir sehen nach, daß wir mit dem Symbol < auch im Fall unendlicher Mengen wie gewohnt rechnen dürfen: Offenbar ist für beliebige Mengen A, B höchstens eine der Aussagen l A K l B l , lAl = IBl, lAl > IBl wahr. Ferner folgt aus l A K l B l und I B K I C I stets l A K l C l . Denn l A K l B l liefert die Existenz einer Teilmenge B* C B und einer bijektiven Abbildung 0:A->-B*; wegen I B K I C I existieren entsprechend C* C C und eine bijektive Abbildung i//:B-»C*. Dann ist \p ° eine bijektive Abbildung von A auf i//(0(A)) C C. Andererseits existiert keine Teilmenge A* C A mit IA*I=ICI, denn sonst gäbe es wegen IAI = IB*I noch eine Teilmenge B** von B* C B mit I A*l = lB**l, und IB**I = ICI wäre ein Widerspruch zu I B K I C I . Viel tiefer liegt der hier nicht bewiesene Satz, daß auch mindestens eine der Aussagen l A K l B l , IAI = IBI, l A l > l B l wahr ist. Sem Beweis erfordert die sogenannte Wohlordnung der Mengen A, B. Aus Satz 3 entnehmen wir IQ I < IRI. Es stellt sich die Frage, ob die Skala der Mächtigkeiten hier abbricht. Daß dies nicht der Fall ist, es sogar überhaupt keinegrößte Mächtigkeit gibt, zeigt der folgende
§ 9 Abzählbarkeit, Überabzählbaikeit
79
Satz 4: Für jede Menge M gilt lMl {0,1}. Die Anzahl der letzteren ist aber 2 IMI . Dieses Verfahren bauen wir nun zu einem auch für beliebige Mengen M tragfähigen Beweis aus. Für M = L ist die Behauptung wahr, es sei daher M
L.
Zunächst gibt es eine Teilmenge E von P(M) mit IEI = IMI: sie bestehe nämlich etwa aus allen einelementigen Teilmengen {m} von M; offenbar ist die Abbildung x:M->-E mit x(m) = {m} bijektiv. Zu zeigen bleibt noch, daß es keine Teilmenge von M mit derselben Mächtigkeit wie P(M) gibt. Für jede Teilmenge T von M (oder: TGP(M)) definieren wir eine Abbildung f T : M -» {0,1} durch
Es sei F = {f T : T G P(M)} die Menge aller dieser Abbildungen; sie ist bijektiv abbüdbarauf P(M) durch 4>: P ( M ) ^ F mit 0(T) = f T . Also gilt lFl = lP(M)l, d. h. die Menge aller Abbildungen von M in {0,1} und die Potenzmenge von M sind gleichmächtig. Zum Beweis von Satz 4 genügt es also zu zeigen: Für keine Teilmenge U C M gilt IUI = IFI. Dazu benutzen wir eine verallgemeinerte Version des Cantorschsn Diagonalverfahrens. Angenommen, es gibt doch eine bijektive Abbildung i//:U-»F einer Teilmenge U von M auf F. Dann ist i//(u)GF für jedes u G U. Wir betrachten'die Zahlen (iK u )) (u) G {0,1}. Jede von ihnen ist entweder Null oder Eins. Also gibt es ein f G F mit f(u) (i//(u)) (u) für jedes u G U. Dieses f kann also unter den t//-Bildern der Elemente von U nicht auftreten. Die Annahme ist falsch, der Satz damit nachgewiesen. Als Folgerung bemerken wir, daß die Kette INI = iQl < IRI < lP(R)l < lP(P(R))l < . . . von Mächtigkeiten nicht abbricht. (9.4) Aufgabe 1: Eine Teilmenge I von R heißt ein Intervall, wenn I wenigstens zwei voneinander verschiedene reelle Zahlen enthält und mit a, b G I, a < b, auch jedes x G R , a < x < b , zu I gehört. Man zeige: Jede Menge paarweise disjunkter Intervalle ist endlich oder abzählbar.
80
§ 9 Abzählbarkeit, Überabzählbaikeit
Aufgabe 2: Es sei I = {x: x € R , 0 < x < 1}. Dann gilt IH = lRl. Beweis? Aufgabe 3: Man zeige die Irrationalität von \ f l + y/3 . Aufgabe 4: Genau dann ist f € R eine irrationale Zahl, wenn es unendlich viele rationale Zahlen — gibt, die der Bedingung
genügen. Beweis?
§10 Komplexe Zahlen (10.1) Bekanntlich ist in dem reellen Zahlkörper R(+, •) nicht jede quadratische Gleichung der Form x 2 + ax + b = 0 mit a , b 6 R lösbar. Dies folgt aus der Tatsache, daß für jede reelle Zahl r das Quadrat r 2 nicht negativ ist. Es liegt nahe, eine R(+, -) umfassende algebraische Struktur zu suchen — sofern es eine solche überhaupt gibt - , der dieser Mangel nicht anhaftet. Das Bedürfnis nach derartigen Erweiterungen ist uns nicht neu; beispielsweise ergibt sich Z(+) aus N(+) durch Hinzunahme der nicht in N gelegenen Lösungen von Gleichungen der Form a + x = b mit a, b G N. Entsprechend führt das Verlangen nach einem Rechenbereich, in dem jede Gleichung der Form ax = b mit a, b £ Z, a 0, lösbar ist, von Z(+, •) zu Q(+, •)• Wir gehen also davon aus, es sei i $ R eine Lösung der in R unlösbaren quadratischen Gleichung x 2 + 1 = 0, und geben die naive Erklärung ab: Eine komplexe Zahl ist ein Ausdruck der Gestalt a + bi, bestehend aus den Zahlen a, b € R und den Symbolen + und i. Die Menge der komplexen Zahlen sei C; wir wollen in ihr so rechnen wie in R(+, •) und dabei i 2 = - l setzen: C = {a + bi: a , b £ R > , i 2 = - l . Gemäß dieser Erklärung sehen wir zwei komplexe Zahlen a + bi, c + di mit a, b , c , d 6 R genau dann als gleich an, wenn a = c und b = d ist, a + bi = c + di ° a = c und b = d, und definieren eine Addition und eine Multiplikation auf C durch (a + bi) + (c + di) = D f (a + c) + (b + d)i, (a + bi) • (c + di) = D f (ac - bd) + (ad + bc)i. Ferner vereinbaren wir die Schreibweise a statt a + Oi und bi statt 0 + bi. Hieraus entnehmen wir sofort R C C und wegen i $ R sogar R J= C. Die obigen Festsetzungen sind plausibel, denn die Rechenoperationen auf C(+, •) stimmen auf der Teilstruktur R(+, •) mit der dort üblichen Addition und Multiplikation überein. Auch die Gleichheitsdefinition ist vernünftig, denn aus a + bi = c + di erhalten wir durch formale Anwendung der in R(+, •) üblichen Rechenregeln a - c = (d - b)i, und dies ist wegen i $ R nur dann sinnvoll, wenn d = b, also auch a = c, gilt. Es bleibt zunächst offen, ob die algebraische Struktur C(+, •) überhaupt existiert; die vorhin erklärten Rechenvorschriften könnten ja auf Widersprüche führen. Den konstruktiven Nachweis und damit die Rechtfertigung für alles Weitere erbringen wir in (10.4). Wir sehen nach, daß C(+, •) ein Körper ist. Hinsichtlich der Addition bildet C offenbar eine abelsche Gruppe. Dasselbe gilt für die Menge C 0 der von 0 6 C
6 Hornfeck
82
§ 10 Komplexe Zahlen
verschiedenen Elemente aus C hinsichtlich der Multiplikation. Nicht trivial ist neben dem Assoziativgesetz, das man nachrechnen muß, vor allem die Umkehrbarkeit der Multiplikation: Es sei a + bi € C 0 mit a, b G R (und a 2 + b 2 * 0). Wenn es zutrifft, daß C(+, •) ein Körper ist, so folgt durch formale Anwendung der Bruchrechenregeln 1 _ a - bi _ a - bi _ a b • 2 2 2 2 2 a + bi (a + bi) (a - bi) a +b a +b "a +b2 ' und dieses in C 0 gelegene Element ist wirklich das multiplikative Inverse zu a + bi € C 0 , denn ihr Produkt ergibt 1. Schließlich sind auch die Distributivgesetze, von denen wegen der Kommutativität der Multiplikation nur eines nachgeprüft zu werden braucht, erfüllt. Die Elemente des komplexen Zahlkörpers C(+, •) bezeichnen wir im folgenden abkürzend oft durch jeweils einen einzigen Buchstaben, etwa a, b, c, w, z, f usf. Es gelten in C(+, •) alle Rechenregeln, die wir in § 7 generell für Körper notiert (z1,z2GC) haben. Insbesondere ist C(+, •) nullteilerfrei, d. h. aus zlz2=0 folgt Zj = 0 oder z 2 = 0, es gelten der binomische Satz und die Bruchrechenregeln. Speziell sollte man wissen, wie sich Quotienten komplexer Zahlen umformen lassen, so daß der Nenner reell wird: Man erweitert c 2 + d 2 # 0) einfach mit c - di und erhält a + bi c + di
=
(a + bi) (c - di) (c + di) (c - di)
=
a
^
(a, b , c , d e R,
(a + bi) (c - di) c2 + d2
Wir bemerken noch, daß die ganzzahligen Potenzen i n (n £ Z) von i nur der vier Werte 1, i, - 1, - i fähig sind, je nachdem n bei Division durch 4 den Rest 0 , 1 , 2 , 3 läßt. Unsere ersten Untersuchungen beinhalten damit das Ergebnis: In C(+, •) kann wie gewohnt gerechnet werden; es ist nur i 2 = - l zu beachten.
(10.2) Es ist nützlich, sich die Menge C der komplexen Zahlen zu veranschaulichen. Dazu wählen wir in der Ebene ein rechtwinkliges cartesisches Koordinatensystem, bestehend aus einer x-Achse und einer y-Achse, und definieren eine Abbildung f : C - > R X R durch f(x + yi) = (x, y). Die Abbildung f ist offenbar bijektiv, jeder komplexen Zahl entspricht eineindeutig ein Punkt der sogenannten Gaußschen Zahlenebene. Insbesondere sind den Punkten der x-Achse genau die reellen Zahlen zugeordnet; daher bezeichnen wir die x-Achse auch als die reelle Achse, die y-Achse als die imaginäre Achse.
§ 1 0 Komplexe Zahlen
83
Es sei z eine komplexe Zahl, also z = x + yi mit x , y 6 R ; dann heißen x = DfRez,
y=
Df
Imz
der Realteil bzw. der Imaginärteil von z und z = x - yi die zu z konjugiert-komplexe
Zahl.
In der Gaußschen Zahlenebene liegen die „Punkte" z und z spiegelbildlich zur reellen Achse, und - z ergibt sich aus z durch Spiegelung am Ursprung. Die komplexe Zahl z ist ersichtlich genau dann reell, wenn z = z gilt; sie ist genau dann imaginär (d. h. es ist Re z = 0), wenn z = - z gilt. Da sich die Addition komplexer Zahlen und die Multiplikation einer komplexen Zahl mit einer reellen Zahl in der Gaußsehen Zahlenebene komponentenweise darstellen, folgt sofort: C ist hinsichtlich der in (10.1) eingeführten Addition und (eingeschränkten) Multiplikation ein Vektorraum über R. Die Addition der komplexen Zahlen zx, z 2 erfolgt anschaulich durch die Addition der Vektoren, die vom Ursprung nach den Punkten z 1 ; z 2 führen.
y
•yr, Zi + Z2
X
Setzen wir für z = x + yi £ C mit x , y G R noch den Betrag von z durch die
des Vektors z fest, so erhalten wir mit d ^ , z 2 ) = D f \z1 - z 2 l ( z ! , z 2 e C ) eine Metrik gemäß (8.8) auf C. Sie deckt sich mit dem normalen Abstandsbegriff in der Gaußschen Zahlenebene. Insgesamt gelten die nachstehenden Rechenregeln (z, zt, z 2 G C):
(1)
z = z,
(2)
1 R e z = i ( z + z), Im z = — ( z - z ) , 2 2i Izl = I z l ,
(3)
6*
84
(4) (5) (6)
§ 10 Komplexe Zahlen
- I z K Re z, Im z < Izl, Izl2 = z z , lz t +z 2 l < lz t l + lz 2 l.
Diese Regeln, speziell die Dreiecksungleichung (6) und ihre aus § 5 bekannten Verallgemeinerungen sind trivial; mit kurzen Rechnungen ergeben sich noch (7) (8)
Zj ± z 2 = T x ± z l , z ^ Izjzjl = Izjl lz 2 l.
= zTz2,
Dabei gelten (7) und (8) entsprechend auch für den Quotienten zweier komplexer Zahlen. Speziell ist I —
Izl
Daß es beim Nachweis der Regeln nicht immer nötig ist, auf die Darstellung von zGC durch z = x + yi mit x , y G R zurückzugehen,zeigen wir am Beispiel der Regel (8). Sie ist gleichwertig mit lz x z 2 l 2 = lzx I2 lz 2 l 2 , und dies folgt durch Ausrechnen der linken Seite mittels (5) und (7): lz 1 Z 2 l 2 = (z,z 2 ) ( z t z 2 ) = ZjZ2Zj" Z2 = (Z!Z7)(Z2Z^) = Izjl 2 l z 2 l 2 . Dieser Gleichung entnehmen wir eine zahlentheoretische Konsequenz, indem wir z x = a + bi, z 2 = c + di mit a, b, c, d £ Z setzen; es folgt (a 2 + b 2 ) (c 2 + d 2 ) = (ac - bd) 2 + (ad + bc) 2 , und dies bedeutet, daß sich die Eigenschaft ganzer Zahlen, als Summe zweier Quadratzahlen darstellbar zu sein, auch auf ihr Produkt überträgt. Die obige Identität läßt sich leicht direkt nachprüfen; die eigentliche Schwierigkeit besteht darin, sie zu finden. Ihre Herleitung mit Hilfe komplexer Zahlen ist überraschend und läßt deren Nützlichkeit vermuten. Wir geben noch eine weitere Anwendung des Rechnens mit komplexen Zahlen: Es sei ein Polynom p: C -*• C vom Grad n £ N durch p(z) = a n z n + an.jZ"" 1 + • • • + a 0 mit a n # 0, an.,, . . , a 0 € C definiert. Dann hat p höchstens n Nullstellen in C, was sich wie in § 9 ergibt. Sind die Koeffizienten a n , a , , ^ , . . . , a 0 sogar sämtlich reell und f £ C eine Nullstelle von p, so ist auch f E C Nullstelle von p. Wegen p(f) = 0 ist nämlich p(f) = 0 = 0, also aufgrund von (7) weiter ä i f n + ä ^ ? n - 1 + . . . + äi = 0 oder, da a„ = ^ E R für v = 0,1,.. ,,n gilt, a , J n + a„.i f"" 1 + • • • + a 0 = 0. Dies ist die behauptete Gleichung p ( f ) = 0. Die nicht reellen Nullstellen eines Polynoms mit reellen Koeffizienten treten daher stets in Paaren konjugiert-komplexer Zahlen auf.
§ 1 0 Komplexe Zahlen
85
(10.3) Um eine geometrische Deutung der Multiplikation komplexer Zahlen zu erhalten, führen wir Polarkoordinaten in der orientierten Gänschen Zahlenebene ein. Die Orientierung sei dabei wie üblich so vorgenommen, daß zu der mathematisch positiven Durchlaufung des Einheitskreises von 1 nach i der Winkel ~ modulo 2tt gehört. In z = x + yi ^ 0 (x, y £ R) schreiben wir x = r cos 0, y = r sin 0, also z = r(cos 0 + i sin 0). Hierin sind die Polarkoordinaten r = lzl der Betrag von z und 0 der bis auf ganzzahlige Vielfache von 2ir bestimmte Winkel zwischen dem positiven Teil der reellen Achse und der von 0 ausgehenden Halbgeraden durch z. Wir nennen 0 = of
ar
8z
(z^O)
das Argument von z G C ; es ist nur modulo 2n bestimmt. Jede komplexe Zahl z 0 ist eineindeutig durch die Angabe von Iz I und arg z festgelegt, und es gilt z = 0 genau dann, wenn Iz I = 0 ist. Es seien z ^ Z j G C von Null verschieden und - rj(cos = (a, b) (c + e, d + f) = (ac + ae - bd - bf, bc + be + ad + af) und (a, b) (c, d) + (a, b) (e, f) = (ac - bd, bc + ad) + (ae - bf, be + af) = (ac + ae - bd - bf, bc + be + ad + af) übereinstimmen, ist alles nachgewiesen. Es ist R X R (+, •) ein Körper. Jedes Element (a, b) e R X R läßt sich in der Gestalt (a, b) = (a, 0) + (0, b) oder (a,b) = (a, 0) + (b, 0) ( 0 , 1 ) schreiben; darin ist ( 0 , 1 ) (0, 1) = ( - 1 , 0). Wir betrachten nun die Teilmenge T C R X R mit T = {(a, 0): a E R}. Sie ist sogar eine Teilstruktur von R X R, denn die auf R X R definierten Operationen fuhren nicht aus T heraus. Die Abbildung f: R - » T mit f(a) = (a, 0) ist ersichtlich bijektiv und wegen f(a) + f(b) = (a, 0) + (b, 0) = (a + b, 0) = f(a + b) sowie f(a)f(b) = (a, 0) (b, 0) = (ab, 0) = f(ab) relationstreu. Wir übertragen den aus der Gruppentheorie bekannten Isomorphiebegriff und stellen fest: R und T sind isomorph. Wir tauschen in R X R (+, •) die Elemente von T gegen die Elemente von R aus, indem wir statt (a, 0) einfach a schreiben. Bezeichnen wir noch (0, 1) S R X R mit i und nennen den durch diese Änderung der
88
§ 10 Komplexe Zahlen
Schreibweise erhaltenen Körper C, so ist aus (a, b ) = (a, 0) + (b, 0) ( 0 , 1) n u n rechts a + bi geworden, u n d der Körper C = {a + bi: a , b G R } ,
i2 = - l ,
ist konstruiert. Aus den Regeln (*) e n t n e h m e n wir, daß wir in C(+, •) in der Tat so rechnen dürfen, wie wir es bislang getan h a b e n . Es hat sich ergeben: Wenn der reelle Zahlkörper R(+, •) existiert ( m a n also widerspruchsfrei in ihm rechnen kann), so gilt dies auch für den k o m p l e x e n Zahlkörper C(+, •).
(10.5) Aufgabe 1: Man berechne die Absolutbeträge von 3(2 + 0 ( 3 - 2 . ) J
(4 + 7 0 ( l - 2 i ) '
2-i
+
'
3
- ^ .
2 +i
Aufgabe 2: Man bestimme den geometrischen Ort aller P u n k t e z in der Gaußschen Zahlenebene mit a) Re z 2 = 0 , b) Im z 2 = 2, c)
\Z-J~\ =q iz - b1
(a.bSC.a^b;
qGR,q>0).
Aufgabe 3: Man berechne a) die dritten Wurzeln aus 2 - 2i, b) die sechsten Wurzeln aus 1, c) die Nullstellen von z 4 - (5 + 8i)z 2 + 4 8 - 20i. 2ir Aufgabe 4: Man berechne cos — .
(
2 + i\ -—; 1
n
= 1. Beweis?
§11 Äquivalenzrelationen, Kongruenzrelationen
(11.1) Des öfteren besteht in der Mathematik das Bedürfnis, Objekte als einander gleich anzusehen, die es von vornherein gar nicht sind. Beispielsweise in der Elementargeometrie unterscheidet man kongruente Dreiecke nicht. Im folgenden wollen wir die Berechtigung derartiger Abstraktionen überprüfen. Definition: Es sei M L eine Menge. Wir sagen, auf M sei eine Relation „~" erklärt, wenn für je zwei Elemente x, y aus M feststeht, ob x ~ y gilt oder nicht (x •f y). Ist R C M X M eine beliebige Teilmenge des cartesischen Produkts M X M, so ist durch ( x , y ) e R < > x ~ y eine Relation „ ~ " auf M definiert und umgekehrt. Es ist üblich, dann die Teilmenge R von M X M selbst als eine (zweistellige) Relation zu bezeichnen. Uns interessieren spezielle Relationen. Definition: Es sei auf der Menge M L eine Relation „ ~ " gegeben. Sie heißt eine Äquivalenzrelation auf M, wenn die drei nachstehenden Forderungen für alle Elemente x, y, z aus M erfüllt sind. (1) (2) (3)
x ~ x (Reflexivität), x ~ y =» y ~ x (Symmetrie), [x ~ y und y ~ z] => x ~ z (Transitivität).
Wir notieren Beispiele für Äquivalenzrelationen. Beispiel 1: Es sei M die Menge aller Dreiecke der Ebene, und „~ " bedeute „kongruent". Beispiel 2: Es sei M die Menge aller Dreiecke der Ebene, und „ ~ " bedeute „ähnlich". Beispiel 3: Es sei M die Menge aller orientierten Strecken des Raumes, und „ ~ " bedeute die Übereinstimmung in Länge, Richtung und Orientierung. Beispiel 4: Es sei M die Menge aller Abbildungen von R in sich, und es gelte f ~ g (f, g £ M) genau dann, wenn es eine reelle Zahl c gibt mit f(x) - g(x) = c für alle x'€ R. Beispiel 5: Es sei n eine feste natürliche Zahl, M = Z und a ~ b *> n|(a - b). In den beiden letzten Beispielen muß man im wesentlichen das Transitivgesetz nachsehen. Etwa in Beispiel 5 folgt aus a ~ b und b ~ c, daß n in (a - b) + (b - c) = a - c aufgeht, also a ~ c. Die beiden folgenden Beispiele benötigen wir später noch. Beispiel 6: Es sei M = N X N und (a, b) ~ (c, d)
a + d = b + c (a, b, c, d e N).
90
§ 1 1 Äquivalenzrelationen, Kongruenzrelationen
Beim Nachweis, daß „ ~ " eine Äquivalenzrelation auf N X N ist, kommen wir mit den Eigenschaften der Addition in N(+) aus. Wegen a + b = b + a gilt (a, b) ~ (a, b), also (1). Aus (a, b) ~ (c, d) oder a + d = b + c folgt c + b = d + a oder (c, d) ~ (a, b), wie in (2) verlangt. Schließlich bedeutet (a, b) ~ (c, d), (c, d) ~ (e, f) dasselbe wie a + d = b + c, c + f = d + e, und durch Addition entsteht (a + d) + (c + 0 = (b + c) + (d + e) oder (a + f) + (c + d) = (b + e) + (c + d), also a + f = b + e oder (a, b) ~ (e, f) und damit (3). Beispiel 7: Es sei M = Z X Z 0 und (a, b, c, d G Z; b # 0, d # 0) (a, b) ~ (c, d) ad = bc. Die Relation „ ~ " auf Z X Z 0 ist hierbei auf die Multiplikation in Z zurückgeführt. Es handelt sich wirklich um eine Äquivalenzrelation. Zunächst ist ab = ba gleichbedeutend mit (a, b) ~ (a, b), also „ ~ " reflexiv. Aus (a, b) ~ (c, d) oder ad = bc folgt cb = da oder (c, d) ~ (a, b) und damit die Symmetrie von „ ~ " . Zum Beweis der Transitivität von „ ~ " gelte (a, b) ~ (c, d), (c, d) ~ (e, f) mit a, c, e S Z und b, d, f G Z 0 . Das bedeutet ad = bc, cf = de, und Multiplikation liefert (ad) (cf) = (bc) (de) oder (af) (cd) = (be) (cd). Ist hierin neben d auch noch c von Null verschieden, so wird af = be oder (a, b) ~ (e, f)- Für c = 0 aber folgt wegen d 0 aus ad = bc schon a = 0 und aus de = cf entsprechend e = 0. Dann ist gewiß af = be, denn auf beiden Seiten dieser Gleichung steht Null. Wieder bekommen wir (a, b) ~ (e, 0» und das war zu zeigen. Die einfachste Äquivalenzrelation ist offenbar die Gleichheit. Die folgenden Überlegungen gestatten es zum Schluß, auch äquivalente Elemente einer Menge M in einem noch zu erörternden Sinn als dieselben zu bezeichnen. Definition: Eine Partition einer Menge M ^ L ist ein System P von paarweise disjunkten nicht leeren Teilmengen T von M mit M = ^ ^ T. Die Menge M wird also einfach durch paarweise elementefremde nicht leere Teilmengen T von M voll ausgeschöpft, und die Menge aller dieser T ist die Partition P. Jede Partition P von M erzeugt offenbar eine Äquivalenzrelation auf M: Für x , y £ M gelte x ~ y genau dann, wenn x und y in demselben T £ P liegen. Es gilt auch die Umkehrung, daß jede Äquivalenzrelation auf M eine Partition von M erzeugt. Es sei nämlich „ ~ " eine Äquivalenzrelation auf M. Mit jedem m € M bilden wir die Äquivalenzklasse K(m) = { x : x £ M , x ~ m } . Dann gilt für je zwei Äquivalenzklassen K(a), K(b) aus M entweder K(a) n K(b) = L oder K(a) = K(b). Denn aus c € K(a) n K(b) folgt a ~ c und b ~ c, also a ~ b, und das bedeutet die Übereinstimmung von K(a) und K(b). Wegen m G K ( m ) für jedes m ] [(a, b) + (c, d ) = (a', b ' ) + (c', d ' ) u n d (a, b) • (c, d) s (a', b ' ) - (c', d')]
oder gleichwertig [ab' = a'b u n d cd' = c'd] => [(ad + b c ) b ' d ' = ( a ' d ' + b ' c ' ) b d u n d ab'cd' = a ' b c ' d ] . Dies ist aufgrund der im Ring Z(+, •) gültigen Rechenregeln o f f e n b a r richtig. Der genauen Durchführung der K o n s t r u k t i o n von Z(+) u n d Q(+, •). die wir durch die Motivierung der beiden letzten Beispiele angedeutet h a b e n , ist u . a. der § 12 gewidmet. (11.3)
Wir schließen mit einem Rückblick auf § 8.
Dort h a t t e n wir Strecken des Raumes, die in Länge, Richtung u n d Orientierung übereinstimmen, nicht unterschieden u n d von „Gleichheit bis auf Parallelverschiebung" gesprochen. Verwenden wir die oben eingeführte Terminologie, so erzeugt die im Beispiel 3 notierte Äquivalenzrelation auf der Menge M der orientierten Strecken des Raumes eine Partition V. Sie besteht aus den sämtlichen paarweise verschiedenen Äquivalenzklassen. Mit ihnen h a t t e n wir genaugenommen in § 8 gerechnet. Sind beispielsweise K 1 ; K 2 zwei Klassen aus V, so haben wir ein t £ K t gewählt u n d ein 19. € K 2 , dessen Pfeilanfang mit der Pfeilspitze von t zusammenfiel. Wir setzten dann K ! + K 2 = K 3 , w o b e i K 3 die Klasse desjenigen Pfeiles war, der vom Pfeilanfang von o— • • • —
n
n
m
§ 12 Der Zahlbegriff
96
durch (4) ausgeschlossen: jeder Punkt hat höchstens einen Vorgänger. Also bricht die mit „1" begonnene Kette nicht ab, und sie verzweigt sich nicht. Daß sie notwendig alle Punkte von N enthält, sichert erst das Axiom (5); es schaltet das Bestehen mehrerer Ketten oder Zyklen, also etwa die Diagramme 1 o o
>o x>
x»
x>— • • • — •• •
oder
O
>o
•• •
oder
1O
»
*>
X>
•• •
O aus. Wir bemerken, daß das Beweisprinzip der vollständigen Induktion (vgl. § 3) durch das Induktionsaxiom (5) begründet ist. Zur Erläuterung des Umgangs mit einem solchen Axiomensystem beweisen wir die Aussage: Für jedes n G N ist n n*. Im Anschluß an die eben durchgeführte Veranschaulichung der Axiome (1) bis (5) ist es klar, daß das Axiom (5) wesentlich in den Beweis eingehen muß. Wir betrachten dazu die Menge T = {n: n G N, n n*} und zeigen T = N. Zunächst ist I G T nach Axiom (3). Sodann folgt aus t G T nach Definition von T sofort t # t*. Also ist auch t* ¥= (t*)*, denn andernfalls wäre nach Axiom (4) ja schon t = t* entgegen der Voraussetzung t t*. Damit ist [t G T => t* G T] nachgewiesen, und Axiom (5) liefert T = N, wie behauptet. Auf N lassen sich nun eine Addition und eine Multiplikation durch (6) und (7)
n + 1 = n*, n + m* = (n + m)* n • 1 = n, n • m* = n • m + n
(wobei wie üblich die Multiplikation stärker binden soll als die Addition) induktiv definieren. Wir verzichten auf die Durchführung des Beweises, daß durch (6) und (7) wirklich Verknüpfungen auf N erklärt sind, und verweisen auf das Buch „Grundlagen der Analysis" von E. Landau (1877-1938). In der so erhaltenen algebraischen Struktur N(+, •) sind beide Operationen assoziativ und kommutativ; es gelten die Distributivgesetze und die Kürzungsregeln
§ 12 Der Zahlbegriff
(8) (9)
97
x + n = y + n => x = y, x - n = y - n = * x = y,
n, x , y £ N , Der Nachweis jeder dieser Eigenschaften ist eine leichte Anwendung des Induktionsaxioms.
(12.2) Aus N(+, •) gewinnen wir den Ring Z(+, •) der ganzen Zahlen. Zunächst konstruieren wir aus der regulären Halbgruppe N(+) die additive Gruppe Z(+). Das Paarmengenaxiom (vgl. (10.4)) sichert die Existenz der Menge N X N ¥= L. Dem Beispiel 6 aus § 11 entnehmen wir, daß durch (a, b) ~ (c, d)
a+d =b+c
(a, b, c, d G N)
eine Äquivalenzrelation auf N X N definiert ist. Diese erzeugt nach Satz 1 aus § 1 1 eine Partition A von N X N, die aus den sämtlichen paarweise voneinander verschiedenen Äquivalenzklassen K((a, b)) = D f [a, b] besteht. Da nach Beispiel 6' aus § 11 die Äquivalenzrelation „ ~ " hinsichtlich der durch (a, b) + (c, d) = D f (a + c, b + d) auf N X N erklärten Addition sogar eine Kongruenzrelation „ = " ist, dürfen wir nach Satz 2 aus § 11 mit den Äquivalenzklassen [a, b] so rechnen wie mit den Repräsentanten. Durch [a, b] + [c, d] = D f [a + c, b + d] ist also auf A eine Addition festgelegt. Wir zeigen nun: A(+) ist eine abelsche Gruppe. Wegen der Assoziativität u n d der Kommutativität der Addition in N(+) ist auch die Addition in A assoziativ und kommutativ; sie ist ja komponentenweise auf die Addition in N(+) zurückgeführt. Da für alle a , x , y 6 N die Gleichung (a + x) + y = (a + y ) + x richtig ist, folgt (a + x, a + y) = (x, y) in N X N oder gleichwertig [a + x, a + y] = [x, y ] in A. Damit stellen wir fest, daß [ 1 , 1 ] Nullelement in A ist; denn es gÜt [a, b] + [ 1 , 1 ] = [a + 1, b + 1] = [a, b]. Wegen [a, b] + [b, a] = [a + b, a + b] = [ 1 , 1 ] ist [b, a ] G A das additive Inverse - [ a , b] zu [a, b] 6 A. Die behauptete Gruppeneigenschaft von A(+) ist nachgeprüft. Schließlich ändern wir die Schreibweise der Elemente aus A ab und betrachten dazu die Teilstruktur T = {[a + 1, 1]: a G N> von A. Wegen [ a + 1 , 1 ] + [b + 1 , 1 ] = [(a + b + 1) + 1 , 1 + 1] = [(a + b) + 1 , 1 ] führt die Addition nicht aus T heraus; es handelt sich wirklich um eine Teilstruktur. Die Abbildung f: N T mit f(a) = [a + 1 , 1 ] , a G N, ist bijektiv, denn f(a) = f(b) führt auf (a + 1, l ) = (b + 1 , 1 ) oder a = b, und wegen f(a + b) = [a + b + 1 , 1 ] = [a + 1 , 1 ] + [b + 1 , 1 ] = f(a) + f(b) ist sie relationstreu, d. h., in T(+) rechnet
7 Hornfeck
98
§ 12 Der Zahlbegriff
man genauso wie in N(+). Ein beliebiges Element [a, b ] 6 A hat die Gestalt [a,b] = [a + 1 , 1 ] + [1, b + 1] = [a + 1 , 1 ] + ( - [b + 1,1]) = D f [a + 1,1] - [b + 1, 1]. Ersetzen wir hierin die Elemente aus T durch die entsprechenden Elemente aus N, so geht [a, b] über in a - b . Statt [ 1 , 1 ] schreiben wir 0. Die durch diese Änderung der Schreibweise aus A(+) erhaltene Gruppe nennen wir Z(+); sie umfaßt N(+) und besitzt die gewünschten Eigenschaften: In Z(+) besitzt jede Gleichung der Gestalt a + x = b mit a, b S Z genau eine Lösung x, und es gilt entweder x G N oder x = 0 oder - x £ N . Andere Elemente enthält Z nicht. Die additive Gruppe Z(+) der ganzen Zahlen ist konstruiert. Wir erklären auf Z(+) noch eine Multiplikation derart, daß sie auf der Teilmenge IM C Z mit der dort nach (12.1) schon vorhandenen Multiplikation übereinstimmt und Z(+, •) ein Ring wird. Wenn diese Forderungen überhaupt erfüllbar sind, so nach den Ringrechenregeln nur auf eine Weise: ab - ((- a)b) Df
für a, b e N , für - a , b < E N ,
- (a(- b » für a, - b G IM, ( - a) ( - b) für - a, - b G IM, .0 für a = 0 oder b = 0.
Hierdurch ist eine Multiplikation auf Z definiert, denn jedem Paar (a, b) von Elementen a, b G Z wird eindeutig ein Produkt ab € Z zugeordnet. Da IM() eine Teilstruktur von Z(-) ist und die Multiplikation zweier von Null verschiedener Elemente aus Z auf die Multiplikation in N zurückgeführt ist, übertragen sich Assoziativität und Kommutativität. Ferner gelten in Z(+, •) die Distributivgesetze, von denen wegen der Kommutativität der Multiplikation nur eines, etwa a(b + c) = ab + ac für a, b, c G Z, nachziiprüfen bleibt. Hier sind einige einfache Fallunterscheidungen vorzunehmen. Man stellt fest, daß im wesentlichen a(b + c) = ab + ac für a € N , b + c £ N , b £ N , - c 6 N zu zeigen ist. Gleichwertig ist a(b + c) + a(- c) = ab + ac + a(- c) = ab, und das ist richtig, weil man links das in IM(+, •) gültige Distributivgesetz anwenden darf. Die Eins aus N(+, •) ist ferner die Eins im Ring Z(+, -), und wegen 0 $ IM, also ab 0 für alle a , b £ N , enthält auch Z(+, •) keine Nullteiler. Damit ist die Konstruktion des Ringes Z(+, •) der ganzen Zahlen abgeschlossen; er ist ein Integritätsbereich mit Eins. (12.3) Nun verlangen wir die Umkehrbarkeit der Multiplikation, also die Auflösbarkeit von Gleichungen der Gestalt ax = b mit a , b £ Z , a # 0 . Dies läuft auf die Konstruktion des Körpers Q(+, •) der rationalen Zahlen hinaus.
§ 12 Der Zahlbegriff
99
Es existiert die Menge Z X Z 0
L; durch die Äquivalenzrelation
(a, b) ~ (c, d) o ad = bc
(a, c G Z ; b , d G Z 0 )
(vgl. Beispiel 7 aus § 11) zerfällt Z X Z 0 in Äquivalenzklassen K((a, b)) = D f [a, b]. Auf Z X Z 0 erklären wir eine Multiplikation und eine Addition durch (a, b) + (c, d) = D f (ad + bc, bd), (a, b) • (c, d) = D f (ac, bd). Wegen der Nullteilerfreiheit von Z und b , d € Z 0 liegtauch bd in Z 0 , und es handelt sich wirklich um Verknüpfungen auf Z X Z 0 . Da die Äquivalenzrelation „ ~ " auf Z X Z 0 sogar eine Kongruenzrelation „ = " auf Z X Z 0 (+, •) ist (vgl. Beispiel 7' aus § 11), werden durch [a, b] + [c, d] = D f [ad + bc, bd], [a, b] • fc, d] = D f [ac, bd] eine Addition und eine Multiplikation auf der durch „ = " erzeugten Partition A von Z X Z 0 definiert. Wir zeigen, daß A(+, •) ein Körper ist. Die dazu erforderlichen Rechnungen können wir vereinfachen, indem wir (a, b) = (ax, bx) für x G Z 0 , also [a, b] = [ax, bx], beachten. Demnach dürfen wir „erweitern" und „kürzen", und es genügt, alle Körperrechenregeln für Klassen mit denselben von Null verschiedenen zweiten Komponenten nachzuweisen. Die Assoziativität der Addition folgt aus [a, d] + ([b, d] + [c, d]) = [a, d] + [b + c, d] = [z + (b + c), d] = [(a + b) + c, d] = [a + b, d] + [c, d] = ([a, d] + [b, d]) + [c, d]. Dies liegt offenbar an der Assoziativität der Addition in Z(+, •); entsprechend ergibt sich die Kommutativität der Addition in A(+, •), denn die Addition in Z(+, •) ist kommutativ. Weiter ist [ 0 , 1 ] € A Nullelement in A(+, •) und [ - a , d ] 6 A additives Inverses von [a, d ] E A : Es ist [a, d] + [ - a , d] = [0, d 2 ] = [0,1], letzteres wegen (0, d 2 ) = (0, 1). Hinsichtlich der Addition ist A(+, •) also eine abelsche Gruppe. Die Assoziativität und die Kommutativität der Multiplikation erhalten wir durch [a, d] ([b, d] [c, d]) = [a, d] [bc, dd] = [a(bc), d(dd)] = [(ab)c, (dd)d] = [ab, dd] [c, d] = ([a, d] [b, d]) [c, d] und [a, d] [b, d] = [ab, dd] = [ba, dd] = [b, d] [a, d]. Es ist [ 1 , 1 ] S A Einselement in A(+, •), und als multiplikatives Inverses von [a, d] € A, [a, d] [0, 1], d . h . a=£0, ergibt sich das Element [ d , a ] G A .
7*
§ 12 Der Zahlbegriff
100
Schließlich gelten die Distributivgesetze in A(+, •); nur eines von ihnen ist nachzuweisen: [a, d] ([b, d] + [c, d]) = [a, d] [b + c, d] = [a(b + c), dd] = [ab + ac, dd] = [ab, dd] + [ac, dd] = [a, d] [b, d] + [a, d] [c, d]. In dem so gewonnenen Körper A(+, •) ändern wir die Schreibweise seiner Elemente ab. Dazu betrachten wir die Teilmenge T = {[a, 1]: a G Z) von A. Wegen [a, l ] + [b, l ] = [a + b, 1 ] G T und [a, 1] [b, 1 ] = [ab, 1 ] G T ist T(+, •) eine Teilstruktur von A(+, •). Die Abbildung f: Z T mit f(a) — [a, 1] ist ersichtlich bijektiv und bezüglich beider Verknüpfungen relationstreu, d. h., Z(+, •) und T(+, •) sind isomorph. Jedes Element [a, b] aus A gestattet die Darstellung [a, b] = [a, 1] [1, b], und darin ist [ l , b ] das multiplikative Inverse [b, l]" 1 von [b, 1 ] G T . Ersetzen wir nun jedes Element [a, 1] aus T durch a G Z , so geht [a, b ] G A über in ab"1 = Df ^ > u n d den durch diese Änderung der Schreibweise aus A(+, •) entstandenen Körper nennen wir Q(+, •)• Er besteht aus allen „Brüchen" ^ mit a G Z, b G Z 0 und umfaßt insbesondere den Ring Z(+, •). Wir haben den Körper Q(+, •) der rationalen Zahlen konstruiert.
(12.4) Etwa im Ring Z(+, •) der ganzen Zahlen oder im Körper Q(+, •) der rationalen Zahlen, die wir bisher konstruiert haben, hat es einen Sinn zu sagen, eine Zahl sei größer als Null oder positiv. Wir hatten dies in § 5 aus unserer Anschauung begründet; unabhängig davon geben wir die folgende abstrakte Definition, die die Rechtfertigung unseres anschaulichen Vorgehens gestattet. Definition: Ein vom Nullring verschiedener Ring R(+, •) heißt angeordnet, wenn in ihm eine Relation > (größer) mit folgenden Eigenschaften erklärt ist. (1) Für jedes a G R trifft genau eine der Beziehungen a > 0 , a = 0, - a > 0 zu. (2) Aus a > 0, b > 0 folgt a + b > 0 und ab > 0. Es sei a G R von Null verschieden; gilt a > 0 , so heißt a positiv, andernfalls negativ. Damit sind die Elemente eines angeordneten Ringes R(+, •) in drei Klassen eingeteilt, den Positivbereich P, die Null und den Negativbereich N, und jede Anordnung von R(+, •) liegt fest, wenn der Positivbereich P bestimmt ist. Wir notieren einige Eigenschaften angeordneter Ringe. Jeder angeordnete Ring R(+, •) ist nullteilerfrei. Sind nämlich a, b G R von Null verschieden, so ist eines der Produkte ab = ( - a) ( - b) oder - ab = ( - a)b = a ( - b ) positiv und ab jedenfalls von Null verschieden.
101
§ 1 2 Der Zahlbegiiff
Jeder angeordnete Ring R(+, •) ist unendlich. Denn in R gibt es ein Element a > 0, und wegen (2) sind alle durch sukzessive Addition gewonnenen Ringelemente na = a + a + . . . + a (n Summanden a; n G IM) positiv. Sie sind auch paarweise voneinander verschieden. Wäre nämlich ra = sa und etwa s = r + n mit natürlichen Zahlen r, s, n, so würde nach den Ringrechenregeln na = 0 folgen im Widerspruch zu na > 0. In einem angeordneten Ring R(+, -) ist das Quadrat eines jeden von Null verschiedenen Elements positiv. Denn aus a > 0 oder - a > 0 folgt nach (2) und den Ringrechenregeln stets a 2 > 0. Besitzt R(+, •) eine Eins, so gilt speziell 1 = 12>0. Diese Überlegungen ermöglichen sofort die Angabe von Ringen, die sich nicht anordnen lassen, beispielsweise sämtliche Restklassenringe Z n (+, •), n € N, n =/= 1, denn sie sind endlich. Auch der komplexe Zahlkörper C(+, •) gestattet keine Anordnung, da sonst sowohl 1 > 0 als auch i 2 = - 1 > 0 wäre im Widerspruch zu (1). Dagegen können wir Z(+, •) und Q(+, •) wie folgt anordnen. Es sei n G Z positiv genau dann, wenn n G N gilt. Mit dieser Festsetzung wird Z(+,-) wirklich angeordnet, denn N(+, •) ist eine Teilstruktur von Z(+, -). Weiter sehen wir, daß dies die einzig mögliche Anordnung von Z(+, •) ist, denn aus 1 > 0 folgt nach (2) notwendig die Positivität von n • 1 = n G N. Da Z(+, •) eine Teilstruktur von Q(+, •) ist, erscheint es sinnvoll, eine Anordnung von Q(+, •) zu wählen, die mit der in Z(+, -) vorhandenen übereinstimmt. Wenn dies überhaupt möglich ist, so müssen wir (a, b G Z 0 ) genau dann als positiv erklären, wenn ^ b 2 = ab > 0 in Z(+, •) gilt. Durch j j > 0 o ab > 0 (a, b G Z 0 ) wird Q(+, •) wirklich angeordnet. Zunächst folgt aus ^ = ^ sofort ad = bc, also a b d 2 = b 2 c d und damit aus a b > 0 oder f > 0 b
auch c d > 0
oder ^ > 0. Die angegebene Vorschrift ist eine Definition. Sie legt den Positivbereich fest, und aus > 0, ^ > 0 folgt, indem man gleich c > 0 annimmt, a+b=ajhb>0und a . b > 0 alsQ(2) v c c c c c ' Es ist zweckmäßig, zwei beliebige Elemente a, b eines angeordneten Ringes R(+, •) miteinander vergleichen zu können. Dazu setzen wir a > b < * a - b > 0 fest, und statt a > b schreiben wir auch b < a. Ebenso sollen a > b oder b < a gleichbedeutend mit [ a > b oder a = b] sein. Dann gelten die Regeln (1) bis (5) aus § 5 allgemein in angeordneten Ringen bzw. Körpern. Die auf Z(+, •) und Q(+, •) erklärten Anordnungen zeichnen sich durch eine weitere Eigenschaft aus. Sind nämlich a, b Elemente aus Z oder Q mit 0 < a < b so gibt es stets ein n G N derart, daß n a > b wird. Der Nachweis läuft darauf hinaus zu zeigen, daß jede natürliche Zahl n durch eine geeignete
102
§ 1 2 Der Zahlbegriff
Summe von Einsen übertroffen wird, und dies ist wegen n* • 1 = n + 1 > n evident. Definition: Ein angeordneter Ring R(+, •) heißt archimedisch angeordnet, wenn es zu je zwei Elementen a, b aus R mit 0 < a < b ein n G N mit b < n a gibt. Die Ringe Z(+, •) und Q(+, •) sind, wie wir eben festgestellt haben, archimedisch angeordnet. Daß nicht jeder angeordnete Ring diese Eigenschaft besitzt, entnehmen wir dem nachstehenden Beispiel. Es seien auf der Menge F aller Polynome f: Q -*• Q mit f(x) = a n x n + an.jx" - 1 + . . . + a 0 , a„G Q, n > 0, eine Summe f + g G F und ein Produkt fg G F durch (f + g) (x) = D f f(x) + g(x) bzw. (fg) (x) = D f f(x)g(x) für alle x G Q erklärt. Ferner werde ein vom Nullpolynom o verschiedenes f G F positiv genannt, wenn sein höchster nicht verschwindender Koeffizient a n in Q(+, •) positiv ist. Es ist leicht zu erkennen, daß dann F(+, •) ein durch > angeordneter Ring ist. In ihm sind die durch a(x) = 1, b(x) = x definierten Abbildungen a, b positiv, aber es ist b - na > o, also b > na für jedes n G N .
(12.5) Es bleibt noch die Existenz des reellen Zahlkörpers R(+, •) nachzuweisen. Der anschauliche Hintergrund der nun durchzuführenden Konstruktion von R(+, •) aus Q(+, •) besteht etwa in folgendem: Jedem Punkt einer gegebenen Geraden wollen wir umkehrbar eindeutig eine Zahl zuordnen. Die zu den rationalen Zahlen gehörenden Punkte seien schon gemäß der in Q(+, •) erklärten Anordnung markiert; beispielsweise die Zahlen , a G Z, erzeugen auf der Geraden ein äquidistantes Raster, das um so feiner ausfällt, je größer die natürliche Zahl n gewählt wird. Es ist klar, daß in beliebiger Nachbarschaft irgendeines Punktes der Geraden solche „rationalen" Punkte vorkommen. Daher werden wir versuchen, jeden Punkt der Geraden durch Folgen „rationaler" Punkte zu charakterisieren, die ihm beliebig nahe kommen. Dies entspricht auch der anfangs abgegebenen Erklärung, eine reelle Zahl sei ein unendlicher Dezimalbruch. Wir haben die Vorstellung, etwa einen mit (\^2=) 1,4142... beginnenden Dezimal14 141 1414 14142 bruch aus einer Folge 1 > ¡ö ' I ö ( j ' Jööö ' IÖ5ÖÖ ' " ' V O n r a t i o n a l e n Z a h ] e n zu gewinnen. Die Möglichkeit, Mengen solcher Folgen zu bilden, verlangen wir axiomatisch: Ist M eine Menge, so existiert die Menge M°° = D f {(mj, m 2 , m 3 , . ..): mj G M} aller nicht abbrechenden Folgen mit Komponenten aus M. Hierin wählen wir M = Q und geben die Definition: Eine Folge (q1.q2.q3, • • •) aus CT heißt Cauchy-Folge, wenn zu jedem positiven e G Q ein Index N(e) existiert mit lq m - q n l < e für alle m, n > N ( e ) . Eine Folge (qi, q 2 , q 3 , . . . ) aus Q" heißt Nullfolge, wenn zu
§ 12 Der Zahlbegriff
103
jedem positiven e £ Q ein Index N 0 (e) existiert mit l q n l < e für alle n>N0(e). Eine Cauchy-Folge aus Q°° ist demnach eine Folge rationaler Zahlen mit folgender Eigenschaft. Für jedes e £ Q , e > 0 , unterscheiden sich/as?alle (d.h. alle bis auf endlich viele) Glieder der Folge um weniger als e. Eine vorgelegte Cauchy-Folge ^qj, q 2 , q 3 , . . .) ist beschränkt, d. h., es gibt ein q e Q mit lqnJ < q für alle n G IM. Zum Nachweis sei e = 1; dann gilt für alle m, n > N ( l ) = D f N die Ungleichung Iqm - q„I < 1. Speziell wird lqn - q N l < 1 und daher IqJ = !q n - q^j + q N l < lq„ - q N l + lqNl < 1 + lqNl für alle n > N . Nun wählen wir ein q 6 Q , das etwa gleich der größten der Zahlen 1 + Iqj I, 1 + l q 2 i , . . . , 1 + lqNl ist. Es erfüllt die Behauptung. Jede Nullfolge ( q 1 . q 2 . q 3 > - - - ) ist eine Cauchy-Folge, denn zu jedem e G Q , e > 0 , gibt es einen Index N(e) =
Df
N 0 ( ^ ) , so daß lqnl < ^ für alle n > N ( e )
gilt. Daraus folgt mit der Dreiecksungleichung sofort lq m - qnl < lqml + lqnl
< § + I = e fÜr alle m'n>
Die Menge der Cauchy-Folgen aus CT sei C. Nach unseren Vorbetrachtungen dürfen wir hoffen, aus der Menge C die reellen Zahlen zu bekommen. Da sich beispielsweise die Glieder q n = 2 und q„ = 2 - — 1 1 der Cauchy-Folgen (2, 2, 2 , . . . ) bzw. ( 2 - l , 2 - i , 2 - ± - , . . . ) beliebig nahe kommen, wenn nur der Index n genügend groß gewählt ist, wird es vernünftig sein, beide Folgen später nicht zu unterscheiden, sie also als Repräsentanten ein und derselben Zahl (nämlich der Zahl 2) anzusehen. Dies führt zu der Erklärung, zwei Cauchy-Folgen seien äquivalent, wenn sie sich nur durch eine Nullfolge unterscheiden, genauer: (qi. q2. qs. - • •) ~ (qi, qi. q-s. • • •) ° (qi -q'i. q 2 - qi. q3 -q-3,-• •) ist Nullfolge. Da mit q n und q'n alle Differenzen q n - q„ in Q liegen, ist hierdurch eine Relation auf C erklärt. Es handelt sich um eine Äquivalenzrelation: Weil (0, 0 , 0 , . . . ) £ C trivialerweise eine Nullfolge ist, ist ~ reflexiv. Mit (qi - qi. q2 - q2. q3 - q3. • • -) ist auch (qi - qi, q2 - q 2 , q'3 - q3. • • •) eine Nullfolge, und das bedeutet die Symmetrie von Zum Nachweis der Transitivität von ~ gelte (q l s q 2 , q 3 , . . .) ~ (qi, q 2 , q' 3 ,. . . ) , (qi, q 2 , q ' 3 , . . .) ~ (qi- q!z. q'3. • • •)• D a n n ist wegen lqn - q^l = lqn - q^ + q^ - q ^ l < lqn - q'n\ = a ls° + von einer Stelle N(e) an die rechte Seite kleiner als auch die linke Seite. Folglich ist (q x - q'i, q 2 - q 2 , q 3 - q ' 3 , . . . ) eine Nullfolge, und wir erhalten ( q 1 ; q 2 , q 3 , . . . ) ~ (q'j, q 2 , q'3,. . . ) , wie gewünscht. Hinsichtlich der Äquivalenzrelation ~ auf C zerfällt C in Äquivalenzklassen [ q 1 . q 2 . q 3 . - - -]- Die Menge A dieser Klassen müßte später der zu konstruie-
§ 1 2 Der Zahlbegriff
104
rende Körper R werden. Dazu erklären wir zunächst Verknüpfungen auf C und dann auf A . Wir definieren auf C in naheliegender Weise eine Addition und eine Multiplikation durch (P1.P2.P3. • • -) + ( q i , q 2 . q 3 . • • •) = Df (pi
+
qi>P2
+
q2.P3
+
q3. • • •)
und (Pi.P2.P3. • - •) • ( q i , q2.q3> - • •) = Df ( P i q i . P2q2>P3qs. • • •)• Daß diese Operationen wirklich Verknüpfungen auf C definieren, muß nachgesehen werden. Zunächst liegen die rechten Seiten in Q°°; wir haben zu zeigen, daß sie sogar in C liegen. Dazu sei ein beliebiges, aber festes e € Q, e > 0, vorgegeben. Da (p 1 ; p 2 , P 3 , . . . ) , ( q i , q 2 , q3, • • •) Cauchy-Folgen sind, gibt es einen Index N(e), so daß für alle m, n > N ( e ) zugleich lp m - p n l < ^ und lq m - q n l < ^ gilt. Es folgt lp m + q m - (p n + q n ) I = l(p m - p n ) + ( q m - q j l < lp m - pnl + lqm " qn' < e für alle m,n> N(e), also ( p j + q 1 ; p 2 + q 2 , p 3 + q 3 , . . . ) e C. Entsprechend verfahren wir bei der Multiplikation: Wir wissen die Existenz von q 6 Q ( q > 0 ) und N * ( e ) mit l p n K q . l q n K q für alle n E N und l p m - p n l
N*(e). Aus der Abschätzung
'Pmqm-Pnqn' = 'Pn^rn " P m q n + Pn^n " P n q J < 'PnJ l q m - q n l + l q j IPm-Pn 1 , e , e 2 q 2 q = 6 für m,n>
N * ( e ) folgt schließlich ( p ^ i , p 2 q 2 , P3q3,. . . ) G C.
Aus C ist die algebraische Struktur C(+, •) entstanden. Wir wollen die Verknüpfungen von C auf die Partition A der paarweise disjunkten Äquivalenzklassen von C übertragen durch [ P i . P2. P3. • • •] + [ q i . q2. q3. - • •] = bf [PI + q i . P2 + q2. P 3 + q3. • • •]. [ P i . P2. P3. • • •] • [ q i . q2. q3. • • •] = Df [ P i q i . P2q2> P3q3. • • •]. und dies ist nach Satz 2 aus § 11 genau dann statthaft, wenn ~ sogar eine Kongruenzrelation ist: Es gelte also ( p i , p 2 , p 3 , . . .) ~ (p'i, p 2 , p' 3 ,.. •), ( q x , q 2 , q 3 , . . . ) ~ (q'i, q 2 , q'3, - - •)• Dann wird von einem gewissen Index N(e) an KPn + q n ) - (Pn + qn) 1 < !p n - Pn1 + 'qn - ^2» ^3» • • •] S A. Lediglich die Ermittlung der zu [q 1 ; q 2 , q 3 , . . .] ^ [0, 0 , 0 , . . .] multiplikativ inversen Klasse bedarf einiger Sorgfalt. Das von Null verschiedene Element [Qi» q 3 ) • • •] e A enthält nur solche Repräsentanten ( q j , q 2 , q 3 , . -.), für die es ein q £ Q , q > 0 , gibt mit l q n l > q für fast alle Indizes n S N . Andernfalls wäre nämlich die Cauchy-Folge (qi, q 2 , q 3 , . . . ) eine Nullfolge und demnach [q 1 ; q 2 , q 3 , . . .] = [0, 0, 0 , . . .]. Da also (q 1 ; q 2 , q 3 , . . .) nur endlich viele Glieder q n mit l q n l < q enthält, können wir diese durch Einsen ersetzen und erhalten einen Repräsentanten (q'1( q 2 , q 3 , . . . ) ~ ( q j , q 2 , q 3 , . . .). Für ihn gilt l q „ l > q , also (und allein darauf kommt es uns an) auch q„ # 0, für alle n € N . Dann ist [ 4 - , 4-» 4 - . • • •] e A das multiplikative Inverse von Ql 12 13 [qi, q 2 , q 3 , . . .] = [ q t , q 2 , q 3 , . . . ] € A : Da das Produkt beider Klassen die Eins aus A liefert, bleibt nur noch nachzuweisen, daß [ 4 - , 4-> 4~ > • •-] in A hegt. Dies folgt aus der Abschätzung 1
1
qm
qn
=
'im " In' ^ 1 l ' 'l i T i i„"i < - 2a ' q m - q n ' lq' m llq;i q
Also ist A(+, •) ein Körper. Wir prüfen nach, daß der Körper A(+, •) die gewünschten Eigenschaften besitzt. Zunächst betrachten wir die Teilstruktur T = {[q, q, q , . . .]: q G Q } von A(+, •); sie ist isomorph zu Q, denn die Abbildung f : Q - * T mit f(q) = [q, q, q , . . .] ist bijektiv und relationstreu hinsichtlich beider Verknüpfungen. Abgesehen von der Schreibweise ist also Q in A enthalten. Jeder Dezimalbruch ± a , a 1 a 2 a 3 . . . mit a e N U , a , e { 0 , 1 , 2 , . . . , 9>, definiert eine Cauchy-Folge, nämlich l
10
10
100
10
100
1000
I
und repräsentiert demnach eine Klasse aus A. Umgekehrt überlegt man sich, daß jede Klasse aus A genau einen Repräsentanten dieser Art enthält. Indem wir die Elemente von A durch die entsprechenden Dezimalbrüche ersetzen, ändern wir lediglich die Schreibweise ab. Den so aus A(+, •) gewonnenen Körper nennen wir R(+, •), seine Elemente reelle Zahlen. Durch die Vereinbarung, die in Gestalt eines Dezimalbruchs geschriebene reelle Zahl a, a ! a 2 a 3 . . . sei positiv genau dann, wenn wenigstens eine der Zahlen a
§ 1 2 Der Zahlbegriff
106
oder a; positiv ist, ist auf R(+, •) eine archimedische Anordnung definiert, die die Anordnung von Q(+, •) aus (12.4) fortsetzt. Abschließend wollen wir noch untersuchen, ob jedem Punkt der anfangs zur Veranschaulichung gewählten Geraden nun umkehrbar eindeutig eine reelle Zahl entspricht. Dazu betrachten wir Cauchy-Folgen aus R°°, wobei wir unter einer Cauchy-Folge jetzt allgemeiner eine Folge (r 1( r 2 , r 3 , . . . ) aus R°° verstehen mit der Eigenschaft: Zu jedem positiven e € R existiert ein Index N(e) mit ' r m ~ r n ' < e für alle m, n > N(e). Entsprechend heißt eine Folge (r 1 ; r 2 , r 3 , . . . ) aus R~ Nullfolge, wenn zu jedem positiven e S R ein Index N 0 (e) existiert mit l r n l < e für alle n > N 0 (e). Es gibt zu jeder Cauchy-Folge aus R°° eine äquivalente Cauchy-Folge aus Q~, wobei die oben genannte Äquivalenzrelation zugrunde gelegt wird. Zum Nachweis nehmen wir eine beliebige Cauchy-Folge (r x , r 2 , r 3 , . . .) aus R°°. Man betrachte die Komponente r n . Liegt sie schon in Q, so lassen wir sie unverändert und schreiben lediglich r„ statt r n . Ist r n $ Q, so gibt es ein r„ G Q mit - Es gilt
( r j . r j . r a , . . .) ~ (r;, r 2 , r' 3 ,...).
Also liegt [r 1; r 2 , r 3 , . . .] = [r'j, r 2 , r 3 , . ..] in A oder in anderer Schreibweise bereits in R. Damit ist klar, daß durch die erneute Klassenkonstruktion von Cauchy-Folgen aus R°° der reelle Zahlkörper R(+, •) nicht mehr erweitert werden kann. Er ist vollständig. Jedem Punkt unserer Zahlengeraden läßt sich also eine reelle Zahl umkehrbar eindeutig zuordnen. Zusammengefaßt haben wir die Existenz des archimedisch angeordneten vollständigen Körpers R(+, -) nachgewiesen. Diese hier festgehaltenen Eigenschaften des Körpers R(+, •) bilden die Grundlage der reellen Analysis.
Lösungen der Aufgaben
§ l Aufgabe 1: Aus [A =» B]_folgt^ [B=*Ä] und erst recht [(A und B) => Ä]; es gilt also [A => B] => [(A und B) => A]. Für die Umkehrung beachten wir, daß die _ Negation von ( A u n d B ) lautet: ( A o d e r B ) . Damit wird auch [(A und B) => A] => [A => (A oder B)] => [A => B]. Beides zusammen liefert die Behauptung. Aufgabe 2: Es ist A U ( B f i C ) = { x : x € A oder ( x G B und x G C ) } = {x: x G A U B und x G A U C } = ( A U B ) n ( A U C ) und A n ( B U C ) = { x : x G A und ( x G B oder x G C » = {x: x G A O B oder x G A n C } = ( A f l B ) U ( A n C ) . Aufgabe 3: Links und rechts vom Gleichheitszeichen steht die Menge genau derjenigen x G R, die in wenigstens zwei der Mengen A, B, C liegen. — Man kann die Behauptung auch mit Hilfe der Distributivgesetze (4) nachrechnen: (A n B) u (B n c ) u (C n A) = ([(A n ß ) u B ] n [(A n B) U C]) U (C n A) = (B n [(A n B) u C]) u (C n A) = (B u c ) n (B u A) n [(A n B) u C] n (A u c ) = (A u B) n (B u c) n (c u A). Aufgabe 4: In l A l + l B l wird jedes x G A n B doppelt gezählt. In lAl + lBl -1A n BI wird also jedes x G R genau dann einmal gezählt, wenn es in A U B liegt. Es folgt l A U B l = lAl + IBI - l A O B l . Mehrfache Anwendung dieser Formel liefert mit Hilfe des Distributivgesetzes IAUBUCI = IAU(BUC)I = lAl + l B U C l - l A n ( B U C ) l = IAI +IBI +ICI - l B D C l - l ( A n B ) U ( A n C ) l = lAl+lBl+ICl-lAnBl-lAnCl-lBnCl + l(ADB)n(AnC)l = IAI + lBl + l c i - l A n B l - l A n c i - l B n c i + I A n B n c i . Auch dieses Ergebnis kann man durch eine direkte Auszählung leicht bestätigen. Aufgabe 5: a) Es ist (T')' = { r : r 6 R , r i T'} = {r: r G R, r G T> = T; in T U T ' liegen alle Elemente von R, und die Mengen T, T' haben kein gemeinsames Element. b) Es ist (AUB)' = { r : r £ R , r $ A U B } = { r : r G R , r liegt nicht in A oder B} = I + I + ( ! + !) + (!+ ... + !) + ... + ( J L + ... + _ L ) = H . 4 4 8 8 2" 2n_1 2 2 2
§3 Aufgabe 1: Für n = 1 ist die Behauptung wahr, und aus 2n
=i 2"
+ 1 folgt durch beiderseitige Addition von 0_ die behauptete Beziehung n+1 2" " y v—i
1
JL
=
2 -
n
2"
+
2
+
2"
n
+
2
1
=
2 -
n
n+1
+
2
3
n+1
für n + 1 an Stelle von n. Aufgabe 2: Aus (1 + x ) n > 1 + nx folgt (1 - x) n