201 74 3MB
German Pages 128 [130] Year 1966
Einführung in die Zahlentheorie von
Dr. Arnold Scholz f Dozent der Mathematik an der Universität Kiel überarbeitet und herausgegeben von
Dr. Bruno Schoeneberg api. Professor an der Universität Hamburg
4. Auflage
Sammlung Göschen Band 1131 Walter de Gruyter & Co * Berlin 1966 vormals G. J . Göschen'sche Verlagehandlung · J . Guttentag, Verlagsbuchhandlung · Georg Reimer · Karl J . Trübner · Veit & Comp.
© Copyright 1966 by Walter de Gruyter & Co., Berlin 30. — Alle Rechte, einschl. der Rechte der Herstellung von Photokopien und Mikrofilmen, von der Verlagshandlung vorbehalten.— Archiv-Nr. 7 7 1 0 66 6. Druck: Walter de Gruyter & Co., Berlin 3 0 . — Printed in Germany.
Inhalt I. Teilbarkeitscigenschaften § § § § § § § § §
1. 2. 3. 4. 5. 6. 7. 8. 9.
Seite
Der King der ganzen Zahlen Teilbarkeit, Primzahlen, F u n d a m e n t a l s a t z Größter gem. Teiler, kleinstes gem. Vielfaches Division mit R e s t , Moduln Euklidischer Algorithmus Klassischer Beweis des F u n d a m e n t a l s a t z e s Primzahlverteilung Spezielle Primzahlen Zahlentheoretische F u n k t i o n e n
5 9 12 16 19 24 25 29 32
II. Kongruenzen, Restklassen § § § § § § § § § §
10. 11. 12. 13. 14. 15. 16. 17. 18. 19.
R e c h n e n m i t Kongruenzen, Restklassenring Kongruenzdivision, Bruchdarstellung, Restklassenkörper . B i n Satz von Tliue. Wilsonscher S a t z Simultane Kongruenzen Kongruenzrechnung m i t P o l y n o m e n Reduktion der Moduln bei algebraischen Kongruenzen . . Der F e r m a t s c h e S a t z Primitivwurzeln, Restklassengruppe Potenzreste Darstellung durch Quadratsummen
37 41 44 46 49 52 56 60 64 67
III. Quadratische Reste § § § § § § §
20. 21. 22. 23. 24. 25. 26.
Zuriickführung der quadratischen Kongruenzen Legendre-Symbol, Eulersches K r i t e r i u m Gaußscheii L e m m a . Erweitertes Legendre-Symbol . . . H a u p t s a t z für quadratische R e s t e Das quadratische Reziprozitätsgesetz Der dritte Gaußsche Beweis des Reziprozitätsgesetzes . . Anwendungen. B i q u a d r a t i s c h e R e s t e
75 77 80 84 88 93 94
IV. Quadratische Formen § § § § § §
27. 28. 29. 30. 31. 32.
Klassen quadratischer F o r m e n Diskriminanten Darstellbarkeit Reduktion der definiten F o r m e n R e d u k t i o n der indefiniten F o r m e n Automorphe Substitutionen. Feilsche Gleichung
Sach- und Namenverzeichnis
. . . .
97 102 104 J 08 112 121
127
Weiterführende Literatur Dickson-Bodewig: Einführung in die Zahlentheorie. Leipzig 1931. D i r i c h l e t - D e d e k i n d : Vorlesungen über Zahlentheorie. Braunschweig. 3. Aufl. 1879; 4. Aufl. 1894. 'S. auch Dedekind, Ges. Werke. Gauß: Disquisitiones Arithmeticae. Leipzig 1801. Übersetzung von Maser: Untersuchungen über höhere Arithmetik. Berlin 1889. H a r d y and W r i g h t : An introduction to the theory of numbers. Oxford 1938. 4. Aufl. 1960. Hasse: Vorlesungen über Zahlentheorie. Berlinl950. 2. Aufl. 1964. Hecke: Vorlesungen über die Theorie der algebraischen Zahlen. Leipzig 1923. 2. Aufl. 1954. H i l b e r t : Bericht über die Theorie der algebraischen Zahlkörper. Jahresberichte der Deutschen Mathematiker-Vereinigung 4 (1894). S. auch Hilbert, Ges. Werke. K r a i t c h i k : Théorie des nombres I. Paris 1922, II, 1929; Récherches sur la théorie des nombres. Paris 1924. L a n d a u : Grundlagen der Analysis. Leipzig 1930. Englische Übersetzung: Foundations of Analysis. Chelsea 1951. Trost: Primzahlen. Basel 1953.
I. Teilbarkeitseigenschaften § 1. Der Bing der ganzen Zahlen Gegenstand der elementaren Zahlentheorie sind in erster Linie die natürlichen Zahlen 0 , 1 , 2, 3, 4 . . . . Die axiomatische Grundlegung der Lehre von den natürlichen Zahlen ist indes nicht Aufgabe der Zahlentheorie. F ü r sie stehen Existenz der natürlichen Zahlen und ihre Hauptverknüpfungsarten, Addition und Multiplikation, mit ihren Gesetzen schon fest. Auch die Erweiterung des Bereichs der natürlichen Zahlen zum Bereich der ganzen Zahlen . . . , — 3, — 2, — 1, 0 , 1 , 2, 3 , . . . mit seinen Gesetzen der Anordnung und Rechnung wird als vollzogen angesehen. Wir wollen alles zusammenstellen, was wir von den ganzen Zahlen als bekannt voraussetzen, und zwar in einer Form, die eine axiomatische Grundlegung der Lehre von den ganzen Zahlen andeutet. Dabei haben wir gleichzeitig Gelegenheit, später häufig auftretende Begriffe zu erklären.
A. Definition der natürlichen Zahlen 1. Die natürlichen Zahlen bilden eine Menge Ζ von unterschiedenen Elementen. Je zwei ihrer Elemente a, b sind entweder identisch, α = b, oder voneinander verschieden, α φ 5. 2. Je zwei verschiedene Elemente a, b aus Ζ stehen zueinander in einer durch „vor" oder „kleiner" ausgedrückten Beziehung derart, daß entweder „a vor b" oder „b vor a" gilt. Für „ a vor b" schreiben wir a a sollen dasselbe bedeuten, und α gì ft ist eine abkürzende Schreibweise für „a < b oder a = b". 3. W e n n für Elemente aus Ζ die Beziehungen a < b und b < c gelten, dann gilt auch a < c. Die Elemente aus Ζ erfüllen die Forderungen, die man an eine geordnete Menge stellt. 4. Die Menge Ζ besitzt ein erstes, allen vorangehendes Element, die Null.
6
Teilbarkeitseigenschaften
6. Zu jedem Element aus Ζ gibt es ein unmittelbar folgendes Element. 6. Jeder echte Abschnitt von Ζ besitzt ein letztes Element. Dabei verstehen wir unter einem Abschnitt von Ζ jede Teilmenge von Z, die mit irgendeinem Element auch jedes kleinere enthält, und unter einem echten Abschnitt einen solchen, der weder leer noch die volle Menge Ζ ist. Die natürlichen Zahlen bilden eine geordnete Menge Ζ mit den drei Eigenschaften 4., 5., 6. Das ist eine der möglichen Definitionen der natürlichen Zahlen. Endlich heißt eine Menge, die auf einen echten Abschnitt der natürlichen Zahlenreihe umkehrbar eindeutig abbildbar ist.
B. Sätze über die natürlichen Zahlen 1. Satz vom kleinsten Element: Jede nicht leere Menge von natürlichen Zahlen hat ein kleinstes Element. 2. Prinzip der vollständigen Induktion: Ist eine Behauptung für die Zahl 0 richtig und folgt aus ihrer Richtigkeit für alle natürlichen Zahlen n' mit n'^n (oder auch nur für η ) ihre Richtigkeit für die auf η unmittelbar folgende Zahl, so ist die Behauptung für jede natürliche Zahl richtig. 3. Anzahlsatz: Verschiedene Abschnitte der natürlichen Zahlenreihe haben verschiedene Anzahlen, d. h. es lassen sich ihre Elemente auch außer der Reihenfolge nicht gegenseitig eindeutig zuordnen. 4. Dirichletsches Schubfächerprinzip: Verteilt man η Dinge auf m Klassen und ist m 2. ab = ba (Kommutativgesetze); 3. (α + b) + c = α + (δ + c), 4. (ab)c = a(bc) (Assoziativgesetze); 5. (α + b)c = ac+lc (Distributivgesetz). 6. Zu jedem geordneten Elementepaar a, b aus R existiert ein eindeutig bestimmtes Element c aus R, so daß a + c = 6 ist (Gesetz der unbeschränkten und eindeutigen Substrahtion).
8
Teilbarkeitseigenschaften
Aus diesen Gesetzen können die bekannten Regeln des Btuhstabenrechnens hergeleitet werden, ohne daß den auftretenden Zeichen eine inhaltliche Bedeutung beigelegt wird. Außer dem Ring Γ treten im Folgenden noch weitere Ringe auf. Vgl. S. 39 und S. 49. Man spricht auch von einem Ring, wenn die Gültigkeit des Kommutativgesetzes der Multiplikation nicht gefordert wird. Den hier definierten Ring nennt man dann kommutativen Ring. E . Monotoniegesetze F ü r die ganzen Zahlen gelten noch folgende Gesetze: 1. Es ist a + c 0 und b > 0 ist. Allgemein gilt ab-j= 0, wenn α φ 0 und 6 =j= 0 ist. In Γ ist ein Produkt von zwei Faktoren dann und nur dann gleich Null, wenn mindestens ein F a k t o r gleich Null ist. Daraus folgt sofort die Eindeutigkeit der Division : Aus ab = ab' und a Φ 0 folgt b = b'. Anders formuliert: Die Gleichung α χ = .c besitzt für α φ 0 höchstens eine Lösung. Ist für α φ 0 die Gleichung α χ = e in Γ lösbar, so liegt eine Besonderheit vor, die uns ausführlich beschäftigen wird. Wir sagen dann, daß c durch a teilbar ist. Einen Ring, in dem ein Produkt von zwei Elementen nur dann gleich 0 ist, wenn mindestens ein F a k t o r gleich 0 ist, bezeichnet man als „Ring ohne Nullteiler". In ihm ist die Gleichung α χ = c bei α Φ 0 auf höchstens eine Weise lösbar. Denn aus α χ = α χ ' folgt α (χ — χ') = 0 und wegen der Nullteilerfreiheit χ — χ' = 0. Gibt es außerdem in dem Ring ein „Einselement" e, so daß a e = a für alle Elemente α des Ringes ist, so bezeichnet man den Ring als Integritätsbereich. Der Ring Γ der ganzen Zahlen ist Integritätsbereich.
Teilbarkeit, Primzahlen, Fundamentalsatz
9
§ 2. Teilbarkeit, Primzahlen, Fundamentalsatz Wir wenden uns jetzt der Teilbarkeitslehre im Integritätsbereich Γ zu. Alle vorkommenden kleinen lateinischen Buchstaben sollen Zahlen aus Γ bedeuten. Wir nennen die Zahl a durch b teilbar oder ein Vielfaches von b, wenn die Gleichung a = b χ lösbar ist. Zugleich heißt b ein Teiler von a oder eine in a aufgehende Zahl. Daß b ein Teiler von a ist, bezeichnen wir durch b | a; das Gegenteil bezeichnen wir durch b \ a. Für die Teilbarkeit gelten folgende Beziehungen, die unmittelbar aus ihrer Definition und den Eigenschaften von Γ folgen: ±_a\a, ± 1 | α , 0 für jedes α, 01 α nur für a = 0, a \ ¿ 1 nur für a = ¿ 1 , aus c\ b und b\a folgt c\ a, aus &!I ftj, b2\ a2 folgt &1621 a1a2, aus cb\ ca folgt δ| a, wenn c φ 0, aus b alt δ | a 2 folgt b \ mat + na2 für beliebige tn, n, aus b a und a| b folgt b = i a. Jedes a hat die trivialen Teiler± 1 , ¿ Í . Gilt t \ a, so nennt man t einen wesentlichen Teiler von a, wenn ί Φ ± 1 ist, und einen echten Teiler von a, wenn 14= i a ist. Besteht für α Φ 0 die Gleichung a = b c, also auch die Gleichung I a I = I b II c \, so folgt | b \ ^ | a |. Jedes α Φ 0 hat also nur endlich viele Teiler. Es gibt Zahlen, die nur triviale Teiler besitzen: ± 1, ± 2, i 3, i 5 , . . . . Da für jedes a aus Γ eine der beiden Zahlen ¿ a eine natürliche Zahl ist und mit b | a auch — b | a gilt, beschränken wir uns öfters für Teiler und Vielfache auf den Bereich der natürlichen Zahlen. Wir stellen uns die Aufgabe, für eine gegebene natürliche Zahl η > 1 eine Darstellung als Produkt von möglichst vielen Faktoren, die alle größer als eins sind, aufzusuchen. Zu diesem Zweck teilen wir die natürlichen Zahlen w > 1 ein: Eine natürliche Zahl ρ heißt Primzahl, wenn ρ > 1 ist und nur triviale Teiler besitzt. Die übrigen natürlichen Zahlen η > 1 heißen zusammengesetzte oder zerlegbare Zahlen.
10
Teilbarkeitseigenschaften
Satz 1: Jede natürliche Zahl a > 1 besitzt mindestens einen Primteiler, Beweis : Die Menge aller natürlichen Teiler t > 1 von a ist nicht leer, denn α | a. In ihr gibt es ein kleinstes Element q. Gilt nun ρ | q, so folgt ρ \ a. Da q der kleinste wesentliche Teiler von a ist, folgt ρ = q, wenn ψ > 1 ist. Also ist q ein Primteiler von a. Die Menge der Primzahlen ist entweder endlich, d. h. auf einen echten Abschnitt der natürlichen Zahlenreihe abbildbar oder sie ist unendlich und auf die ganze natürliche Zahlenreihe abbildbar. Wir beweisen mit Euklid Satz 2: Es gibt unendlich viele Primzahlen. Beweis: Ist q eine Primzahl, in der mit 2, 3, 5, 7 beginnenden natürlichen Reihenfolge etwa die η-te, q = pn, so bilde man das Produkt Ρ = p1p2... pn der ersten η Primzahlen bis q. Der kleinste wesentliche Teiler r von Ρ + 1 ist dann eine neue Primzahl > q. Denn r ist Primteiler von Ρ + 1, und alle Primzahlen plt p2,..., pn = q gehen in P, aber, weil sie größer als 1 sind, nicht in Ρ + 1 auf und sind daher von r verschieden. Also haben wir in r eine Primzahl >- q, u n d daraus folgt die Existenz einer unmittel-
bar auf q folgenden Primzahl. (Das ist nicht notwendig r.) Die Bedeutung der Primzahlen für den multiplikativen Aufbau der natürlichen Zahlen zeigt der Satz von der eindeutigen Primzerlegung, der Fundamentalsatz der elementaren Zahlentheorie. Satz 3: Jede natürliche Zahl a S: 1 ist als Produkt von s Primzahlen darstellbar: (1) a = p1 p2... ps ( s ^ 0). Die Darstellung ist, abgesehen von der Reihenfolge der Faktoren, eindeutig. Dabei verstehen wir unter dem Produkt aus einer Primzahl diese Primzahl selbst und unter dem Produkt aus 0 Faktoren die Zahl 1. Beweis: Die Aussagen der Existenz und der Eindeutigkeit sind für a = 1 richtig. Wir setzen voraus, daß beide Aussagen für alle α', wo 1 a' < a ist, zutreffen.
Teilbarkeit, Primzahlen, Fundamentalsatz
11
Die Existenz einer Zerlegung in Primfaktoren folgt nun für jedes daraus, daß a einen kleinsten Primteiler besitzt. Entweder ist α = ρ selbst Primzahl, womit eine Zerlegung gegeben ist, oder es besitzt eine Zerlegung a = p1a' mit dem kleinsten Primteiler γ1 von a und a' < a. Nach Induktionsvoraussetzung besitzt a' eine Primzerlegung und damit auch a. Dieser Beweis liefert zugleich ein bestimmtes Verfahren, eine Zerlegung für a zu gewinnen. Man spaltet vom übrigbleibenden Faktor a! wieder den kleinsten Primteiler p2 ab, a' = p2a", und wiederholt dieses Verfahren, bis nur noch ein Primfaktor übrigbleibt. So erhält man eine bestimmte Zerlegung a = p1 p2 .. . ps, und zwar ist p1 ¿ p2 ^ · · · £Ξ ρ,. Denn hätte in einer Teilzerlegung α = ρλ... pef der Restfaktor / einen Primteiler ρ < pe, so wäre auch p\pef und somit pe nicht der kleinste Teiler von pe f. Man braucht also für die Zerlegung von / nur Primzahlen ρ Ξϊ pe daraufhin zu untersuchen, ob sie in / aufgehen. Es genügen solche, deren Quadrat / nicht übersteigt; denn soll f = ph zerlegbar sein, und ist ρ2 > /, so ist h ein Teiler von / mit der Eigenschaft h 1) zugrunde. Man bestimme die höchste Potenz nk m und führe die Division von m durch nk mit Rest aus:
m = ak nk + rk, 1 ^ a¡¡ < η, 0
rk < nk.
Wiederholte Anwendungen führen schließlich zu
(8) m, = aknk +
wi_1 + · · · + axn + a0 ; 0 ^ α( < η ; 0 < ak. Unter Restdivision eines m durch ein w ^ 1 wird neben der Darstellung mit „kleinstem nicht-negativem Rest" ml ., . m = η — + r mit 0 ίΞ r < η auch die Darstellung mit „kleinstem Absolutrest" (9)
m = ην + w mit —
w
=
\
verstanden, z.B. 8 = 6 - 1 + 2, 9 = 6 · 1 + 3 , 1 0 = 6-2 — 2. Ein im folgenden viel gebrauchter Begriff ist der „Modul". Der allgemeine Modul ist eine Menge, in der eine assoziative und kommutative Addition definiert und die Subtraktion ungeschränkt möglich ist. Ein Modul ganzer Zahlen ist eine Teilmenge von Γ, in der die Addition wie üblich erklärt ist und zu der mit zwei Zahlen a, l· auch die Zahl a — b gehört. Dann gehören zur Teilmenge auch die Zahlen a — a = 0, 0 — b = - h, a — (-—•&) = a b und mit einer Zahl auch ihre Vielfachen. Die Vielfachen einer Zahl m bilden einen Modul (m) = (—m). Wir zeigen, daß es in Γ keine weiteren Moduln gibt. 2 Scholz-Schoeneberg, Zahlentheoric
18
Teilbarkeitseigenschaften
Satz 10: Jeder Modul ganzer Zahlen besteht aus den Vielfachen einer einzigen Zahl. Beweis: Enthält der Modul nur die Zahl 0, so ist der Satz trivial. Sei nun a =)= 0 eine Zahl aus dem Modul M, die gleich als positiv vorausgesetzt sei. Die nicht leere Menge der positiven Zahlen aus M besitzt ein kleinstes Element m. Nun dividiere man a = mv + r mit 0 ^ r < m. Da a, m, mv in M liegen, liegt auch a — m ν = r in M. kann wegen r < m nicht r > 0 sein, da m die kleinste tive Zahl in M ist. Daher ist r = 0, d. h. a = mv ein faches von m. Sind η ganze Zahlen .. ,,an gegeben, so heißt a fachsumme der «j, wenn sich a in der Form (10) a = ax + a2 x2 -Ì— ' + an xn mit ganzen xv . . ., xn darstellen läßt.
Also posiVielViel-
Satz 11: Die Gesamtheit der Vielfachsummen der a¡ bildet einen Modul. Jeder gemeinsame Teiler der Zahlen ist Teiler jeder ihrer Vielfachsummen und umgekehrt. D e n n m i t Σα^χ^ u n d Σα^ι
ist a u c h Σαίx¡
—¿"α, ί/j = Σα¿
(x¡—y¡) Vielfachsumme der «¡. Und ist t\a(, a¡ = tc¡, so ist Σα(Χ{ = ŒciXi. Umgekehrt ist ein gemeinsamer Teiler aller Za¡ x¡ auch Teiler aller a¡, da die α, selbst Vielfachsummen sind: η (11) a¿ = Σα·ί fy mit e,·,· = 0 für i φ j, ei{ = 1 . j-i Ist eine unendliche Folge · · ·, an, · · · gegeben, so sind die Vielfachsummen der an natürlich Summen nur je endlich vieler dieser an. Eine einzelne Vielfachsumme läßt sich also in der Form
ν=
aJEJ
+ · · · + αΓχΓ
mit einem von υ abhängigen r schreiben. Auch jetzt bilden die Vielfachsummen einen Modul und sind daher Vielfache der kleinsten positiven Vielfachsumme
s = αλζγ Η
+
amzm,
also auch Vielfachsummen einer vom einzelnen ν unabhängigen endlichen Teilmenge alt . . am der Zahlen an.
Euklidischer Algorithmus
19
Die Division mit Rest f ü h r t e eben zu einem Überblick über alle in Γ vorhandenen Moduln. Wir benutzen sie jetzt für einen neuen, von G. Klappauf stammenden Beweis der Eindeutigkeit der Primzerlegung: Entweder ist jedes m > 1 eindeutig zerlegbar, oder es gibt ein kleinstes Element m > 1 mit zwei verschiedenen Zerlegungen m = p1...ps
=
q1...qt.
Jedes ρ muß hier von jedem q verschieden sein; denn wäre 7YI etwa p1 = qv so besäße bereits -- < m zwei verschiedene Zerlegungen. Sei nun q1 die kleinste aller Primzahlen pi: qu so führe man f ü r alle p1 bis ps die Division mit q1 aus und erhält so f ü r ihr P r o d u k t m eine Darstellung m = (îiQi + h) (îiQa + r 2 ) . . .
+ rs) = q^Q + r,
in der alle Glieder bis auf r = r1 r 2 . . . rs, zu qfy zusammengefaßt sind. D a q1 < p¡ und qt \ p¡, sind alle 0 der Zahlen alt. . ., an ist nicht leer, und sie ist beschränkt, 1 a ¡ . Nach Definition gilt 1. φ , · ; damit ist d auch Teiler jeder Vielfachsumme der β,·, insbesondere Teiler der kleinsten positiven Vielfachsumme s. Mit d\s ist d fS s. Andererseits ist die Zahl s Teiler jeder Vielfachsumme der a¡; denn die Vielfachsummen bilden einen Modul, der aus den Vielfachen seines kleinsten positiven Elements besteht. Zu diesem Modul gehören auch die Zahlen a¡ selbst; also ist s|a,·, und wegen der Maximalität von d ist s ^ d. I m ganzen folgt also d = s = « j ^ ! + " ' ' + &nxn bei passenden xt. Aus dieser Gleichung ergibt sich dann noch die Eigenschaft 2. : aus t \ at folgt 11 d. Dieses neu definierte d stimmt mit dem früher konstruierten d überein. Das folgt daraus, daß auch f ü r das neue d die Eigenschaften 1. und 2. gelten oder auch daraus, daß der zuerst definierte gr.g. T. zugleich der größte im Sinne der Anordnung ist. Wir formulieren als Satz vom größten gemeinsamen Teiler: Satz 12: Der größte gemeinsame Teiler d = (αχ, ...,«„) der Zahlen av . . ., an ist als Vielfachsumme von av . . ., an darstellbar, (12) d = a ^ + · · · + anxn, und teilbar durch alle gemeinsamen Teiler. Er ist erzeugendes Element des Moduls der Vielfachsummen. Auch für unendlich viele a{ behalten unsere jetzigen Überlegungen ihren Sinn. Ferner betrachten wir die gemeinsamen Vielfachen der Zahlen a¡. Das P r o d u k t der a¡ ist ein gemeinsames Vielfaches, und es gibt ein im Sinne der Anordnung kleinstes positives gemeinsames Vielfaches e. Von diesem zeigen wir, wieder ohne die Primzerlegung der a¡ zur Konstruktion von e heranzuziehen,
Euklidischer Algorithmus
21
Satz 13: Das kleinste gemeinsame Vielfache geht in allen gemeinsamen Vielfachen auf. Es ist erzeugendes Element des Moduls der gemeinsamen Vielfachen. Beweis: Mit zwei Zahlen ist auch ihre Differenz ein gemeinsames Vielfaches. Die gemeinsamen Vielfachen bilden also einen Modul, der aus den Vielfachen seiner kleinsten positiven Zahl, hier des kl. g. V. der Zahlen av . ., an besteht. Das jetzt definierte kl. g. V. ist, wie man sofort sieht, mit dem früher konstruierten identisch. Auch die von uns auf S. 14 zusammengestellten Rechenregeln für die gr. g. T. und kl. g. V. sind von diesem Aufbau der Teilbarkeitslehre aus ohne Schwierigkeiten zu beweisen. Wir stellen zwei Kriterien'für das Bestehen der Gleichung (av ...,«„) = (Cj,..., cm) einander gegenüber: Notwendig und hinreichend für (a^, . . . , « „ ) = ( c j , . . . ,cm) ist 1. daß die Primzahlpotenzen, die in allen a¿ aufgehen, auch in allen aufgehen und umgekehrt, oder 2. daß die at und e¡ dieselben Vielfachsummen haben. Aus dem zweiten Kriterium, das eine unmittelbare Folge von Satz 12 ist, ergibt sich noch folgende wichtige Rechcnregel: Satz 14: Für beliebige ganze Zahlen a¡ und y¡ ist (av a2,. . . , an) = (a1: a2 — a^y^ ...,«„
—
α^η).
Beweis: Die rechts stehenden Zahlen sind als Vielfachsummen der links stehenden hingeschrieben, und die links stellenden Zahlen sind wegen a.· = (a¡ — a1 y¡) + a1 y i für i = 2 , . . . , η Vielfachsummen der rechts stehenden. Also stimmen die Vielfachsummen für beide Seiten überein. Dieser Satz führt zu einem Verfahren, den gr. g. T. von η Zahlen av . . . , an zu berechnen; f ü r η = 2 ist es der Euklidische „Algorithmus". Ist a1 die kleinste der als positiv angenommenen Zahlen an, deren gr. g. T. wir feststellen wollen, so dividiere man alle «,· durch α 1; am vorteilhaftesten mit kleinstem Absolutrest α ί = αι2i i U, 0 < 2r,· 0, wenn über alle natürlichen η > 0 summiert wird. Die Primzahlen liegen also dichter als die Quadratzahlen. Ein prägnantes Ergebnis ist der von Gauß vermutete und von Hadamard und de la Vallée-Poussin ijn Jahre 1896 bewiesene Primzahlsatz: Das Verhältnis der Anzahl π(η) der Primzahlen bis η und der Funktion n : log η strebt mit wachsendem η gegen 1. Ein Ergebnis über die Verteilung der Primzahlen auf gewisse Klassen stammt von Dirichlet. Er hat den berühmten Satz über die arithmetische Progression bewiesen: In jeder arithmetischen Progression (16)
a, a + m, a + 2m, a + 3 m , . . . ,
in der (a,m) = 1 gilt, gibt es unendlich viele Primzahlen. Dirichlet benutzt in seinem Beweis funktionentheoretische Hilfsmittel. Neuerdings kann man den Beweis mit „elementaren", wenn auch recht komplizierten Methoden führen. Der Dirichletsche Satz liefert sogar eine gewisse Gleichverteilung der Primzahlen auf die verschiedenen Progressionen a + nm, η = 1, 2 , . . . und (a,m) = 1. Merkwürdige Unregelmäßigkeiten in der Primzahlfolge finden sich auch in einzelnen arithmetischen Progressionen. So ist in der
28
Teilbarkeitseigenschaften
Kraitchikschen Tafel der Primzahlen von der Form 2®fc + 1 die erste 7 6 8 1 = 2 ' · 15 + 1, während eine Differenz der Mindestgröße 2 ' · 15 erst wieder nach der 37. Primzahl der Tabelle auftritt.
Während die lineare Funktion f(x) = a + m χ bei (α, m) = 1 unendlich viele Primzahlen darstellt, ist nicht
bekannt, ob ein entsprechender Satz auch für quadratische
Funktionen f(x) = a -+· bx + ex2 zutrifft. Man weiß nicht einmal, ob die einfachste quadratische Funktion f(x) = 1 + x* unendlich viele Primzahlen darstellt. Indessen gilt Satz 18: Jedes ganzzahlige Polynom A(x) = anxn -\ + axx + a0 (an > Ο, η > 0) besitzt unendlich viele Primteiler. Dabei heißt eine Primzahl ρ Primteiler von A(x), wenn p\A(a) für irgendein ganzzahliges a. Beweis: Wir konstruieren eine Folge von ganzen Zahlen XQ, x l t x2, . . . derart, daß die Zahlen y0 = A(x0), y1 = A(xl), y2 = A(x2), . . . immer neue Primteiler auf weisen. Wir wählen ein x0 > 4 maxd«^). Die weiteren x¡ bestimmen wir rekursiv: x1 = xg + y\, allgemein xs+1 = xs + y^. Zunächst ist y0 = A (x0) > 1, besitzt also mindestens einen Primteiler. Denn wegen a ; 0 > 4 max ( K l ) ist (®o) = (17)
α
ηχo
> > anx% - ~ «
1 ®n-11
"*"
K l «o·
· · · + 1) = a n x t
I ®o I ^
- f
- 1 ) > an ^ > 1.
Sei nun ρ irgendein Primteiler von y0 = A(x^). Dann geht φ in y1 in derselben Potenz wie in y0 auf. Das folgt aus yt = A (x0 + yl) = A (ζ0) + y\ Β (z0, y0) = = 2/o(l +2/oB(%2/o))· Also ist y1 = y0-q1 mit J/0) = 1· Wenn q1 überhaupt Primteiler besitzt, dann nur solche, die nicht in y0 aufgehen, also neu sind. Das ist wirklich der Fall, da y1 > y0 ist. Denn
Spezielle Primzahlen
29
wegen xt = x0 + > 4 max (| α,· |) darf x0 in (17) durch x1 ersetzt werden; also xf yl" Vi > α·η γ > -γ > VoEbenso gilt allgemein ys = j/ s _ 1 qs mit (qs, î/s_1) = 1 und qs > 1. Jedesmal kommt wenigstens ein neuer Primteiler hinzu. Obendrein haben wir den Satz gewonnen: Die Wertfolge 4 ( 0 ) , 4(1), .. ,,,A(n)... eines Polynoms besteht nicht aus lauter Primzahlen, sondern enthält auch zusammengesetzte Zahlen. Euler entdeckte, daß das Polynom A{x) = χ2 + χ + 41 für χ = 0 , 1 , . . . , 39 Primzahlen liefert. Das Polynom A(x) = χ 2 — χ + 41 stellt f ü r χ = 0 , 1 , . . . , 40 Primzahlen dar. W. H. Mills hat 1947 eine Funktion konstruiert, die nur Primzahlwerte annimmt: ist bei bestimmtem A > 1 für χ = 1, 2, 3 , . . . stets Primzahl. Bezeichnet π(χ) die Anzahl der Primzahlen χ und π2(χ) die Anzahl der Zwillingspaare sS x, so ist π (100000) = 9592, π (1000000) = 78498, π 2 (100000) = 1224, π 2 (1000000) = 8164. Die Anzahl π (IO9) hat man berechnet, ohne die Primzahlen IO9 einzeln zu kennen. Es ist π(10 9 ) = 50 847 478.
§ 8. Spezielle Primzahlen Die natürliche Zahl Ν heißt vollkommen, wenn sie gleich der Summe ihrer echten natürlichen Teiler ist, ζ. B. 6 = 1 + 2 + 3 . Bezeichnen wir die Summe aller Teiler von Ν durch σ (Ν) = ¿A, so ist die Definition der vollkommenen dfN
Zahl Ν durch a(N) = 2 Ν gegeben. Bei Euklid findet sich folgender Satz 19: Wenn Ν = 2 Í (2 Í + 1 - 1 ) ist und dabei ρ = 2 Í + 1 —1 prim, dann ist Ν eine vollkommene Zahl. Beweis: Die Teiler eines solchen Ν sind 1, 2 , . . . , 2', p, 2p,..., 2 also ist σ(Ν) = 1 + 2 + · · · + 2 ' + p + 2 p
30
Teilbarkeitseigenschaften
+ • · · + 2'p = (ρ + 1) (1 + 2 + • · • + 2«) = (ρ + 1) (2¡+i — 1) = 2 Í + 1 (2'+! — 1) = 2 Ν . Die Zahlen der Euklidischen Form sind notwendig gerade. Euler bewies die Umkehrung, nämlich Satz 20: Wenn Ν eine gerade vollkommene Zahl ist, so hat sie die Gestalt Ν = 2 t (2 í + 1 — 1), wo 2 « - 1 = ρ eine Primzahl ist. Beweis: Jede gerade ganze Zahl Ν läßt sich in der Form Ν = 2'm mit t ^ 1 und ungeradem it schreiben. Dann sind ihre Teiler die Zahlen 2 α · δ mit Ο α fg ί und ô | u. Betrachten wir nur die Teiler 2" · δ mit iestem α, so ist ihr Anteil an der Summe aller Teiler gleich 2 α σ(η), und die Gesamtsumme selbst ist α (Ν) = (1 + 2 + · · · + 2() a(u) = (2^-1) a(u). Da Ν nach Voraussetzung vollkommen ist, gilt σ(Ν) = 2 Ν, also (2 0). t i=i Pi - 1
Wir behandeln jetzt die umgekehrte Aufgabe, aus einem gegebenen F (ή) die Funktion / (n) so zu bestimmen, daß F(n)= Σ f (d) ist. Zunächst beweisen wir die Existenz und d(n Eindeutigkeit von / (η). Satz 24: Zu jeder zahlentheoretischen Funktion F (η) gibt es genau eine Funktion f (n) derart, daß F (η) die summatorische Funktion von f (n) ist. Beweis durch vollständige Induktion: Mit / (1) = -F (1) und nur mit diesem / (1) ist Σ Í (d) = F (η) richtig für din η = 1. Es sei richtig, daß es genau eine Funktion / (m) gibt, die für m < w definiert ist und für diese Zahlen die Eigen3
S c h o l z - S e h o e n e b e r g , Zahlentheorie
Teilbarkeitseigenschaften
34
schaft Σ t (d) = F (m) besitzt. Dann gibt es genau eine d[m
Fortsetzung / ( 1 ) , . . . , / (η — 1), / (n), für die auch Σ f (d) dln = F (η) wird. Man definiert nämlich f ( n ) = F ( n ) - H t ( d ) , Hin
wo d alle echten Teiler von η durchläuft. Dann ist F (η) = JS 1 {d) erfüllt, und das so definierte / (n) ist das einzig d/n
mögliche, nachdem / (1) bis / (η — 1) festliegen. Wir zeigen jetzt, daß für eine multiplikative Funktion F(n) auch f(n) multiplikativ ist. Dabei wird sich gleichzeitig ein geschlossener Ausdruck für f(n) ergeben. Zunächst ist f(p«) = F('pa) — F ( p " - 1 ) wegen F
(Va)
= / ( ! ) + / ( ? ) + · · · + /
(Va-1)
+
/ (Ρβ) -
(Das gilt noch für beliebige F (η)). Man definiere jetzt für alle η eine Funktion h (»)
=
Π
(F
(p«)
- F ( ρ " -
1
) ) ,
η =
Π
Va
ν
Diese ist multiplikativ und stimmt für η = ρ α mit /(η) überein: h(pa) = f(pa). Die summatorische Funktion Η (η) von h (η) ist nach Satz 23 ebenfalls multiplikativ. Wegen h (pa) = / (pa) ist H (pa) = F (pa). Da beide Funktionen multiplikativ sind, ist H (η) = F (η), woraus nach Satz 24 die Gleichung h(n) = / (n) folgt, also Satz 25: Funktion
(24)
Ist
die Funktion
/ (n),
wenn
/ (») =
Π ν
F (F
(η) {ρ1)
F =
(n)
multiplikativ,
Σ f (d) ist, djn
- F
(ρ"-1))
Wir wenden diesen Satz an auf die
so
und es gilt für
η =
Eukrsclie
Π
auch
die
überdies Va· Funktion
φ (η), die Anzahl der zu η teilerfremden Zahlen unter den Zahlen 1, 2 , . . . , n, eine Funktion von Bedeutung für das nächste Kapitel. Wir behaupten: (25) Σ φ (m) = η. min
Zahlentheoretische Funktionen
35
η = 1 2 3 4 6 6 7 8 9 10 11 12 13 14 15 16 φ(ή) = 1 1 2 2 4 2 6 4 6 4 10 4 12 6 8 8. Zum Beweise der Gleichung (25) fassen wir die Zahlen r = 1, 2 , . . . , η nach ihrem gr. g. T. mit η zu Komplexen zusammen: (r, w) = d. Alle Zahlen qd eines Komplexes genügen den Bedingungen 1
qd
η, (qd, η) = d.
Ihre Anzahl stimmt überein mit der Anzahl der q, für die
ist, und diese ist gleich φ
. Also ist
fi denn, wenn d alle Teiler von η durchläuft, so auch m = - j . Die Eulersehe Funktion φ (η) hat demnach die summatorische Funktion n. Nach Satz 25 ist sie selbst multiplikativ, und es gilt für η =IJ pa die Gleichung (26) φ (η) = Π {Va - Ρ"-1) = Π (ρ -1) ρ/η ρ/η
ρ"-1 = η Π f i - :1 ρ/η \ ρ,
Wir wollen jetzt für beliebiges — nicht notwendig multiplikatives — F(n) die nach Satz 24 existierende Funktion f(n) durch einen geschlossenen Ausdruck darstellen. Dazu ist die Mäbiussche Funktion μ(η) von Nutzen. Sie wird definiert durch (27)
μ (1) = 1 μ (η) = ( — l ) r für quadratfreies η = p1... pr, μ (η) = 0 für η = . . . parT mit einem α,· > 1.
Offensichtlich ist sie multiplikativ, also auch ihre summatorische Funktion ε (η). Damit ist Σ μ (ä) = ε (η) = π ε {ρα) für η = Π i¡n ρ 3*
Ρα·
36
Teilbarkeitseigenschaften
Nun ist ε (1) = 1, und f ü r α > 0 ist ε (ρ·) = μ (V) + μ (ρ«-1) + · · · + μ {ρ) + μ(1)
0.
Allgemein gilt daher (28) Die Bestimmung des / (w) zu gegebenem F (η) ist jetzt nach der Möbiusschen Umkehrformel möglich: Satz 26: Die zu beliebigem, F (η) existierende Funktion f in) mit der Eigenschaft F (η) = ¿ f (d) wird dargestellt durch d/n (29) Das ist die wichtigste Anwendung der Möbiusschen Funktion μ(η). Beweis von (29): Wegen F ^ j j =
f(d') ist, wenn wir ιd
die Summationsindizes der Deutlichkeit halber noch dazu schreiben, (d)F(4) = 2!μ(ά) d/n \Λ / d/n d d
2f{d·) = Σ m W / K ) ιη dd'/n » ¿ d,d' d' = |/( Ρ + ri\ nach Satz 16 folgt p\r2, also r 2 = Ö.
Kongruenzen. Restklassen
40
Der Umstand, daß der Restklassenring mod m, eine endliche Menge ist, wird uns manche wertvolle Sehl ußweise liefern und macht es ferner möglich, vollständige Additionsund Multiplikationstabellen aufzustellen. Add. mod 6
Mult, mod 6
0 1 2 3 4 5
1 2 3 4 5 0
1,2 2 3 3 4 4 5 6 0 0 1
3 4 5 4 6 0 6 0 1 0 1 2 1 2 3 2 3 4
2 3 4 0 0 3 2 0 4 3 0 0
4 6 0 2 4 0 0 3 0 4 2 0 2 1 0 0 0 0
Mult, mod 7 1 2 3 4 6 6
2 4 6 1 3 6
3 6 2 5 1 4
4 1 5 2 6 3
5 3 1 6 4 2
6 5 4 3 2 1
Das Produkt eines Restes r am linken Rand mit einem Rest s am oberen Rand steht in derselben Zeile wie r und in derselben Spalte wie s. Die Multiplikation 0 · r = r · 0 = 0 ist in der Tabelle mod 7 fortgelassen. Als Vertreter seiner Restklasse wurde jedesmal der kleinste nicht-negative Rest verwandt. Bemerkung 1. Der Restklassenring Rm mod m, geht allein schon aus dem Begriff der natürlichen Zahl hervor. Um die Restklasse — 1 zu definieren, braucht man die negativen Zahlen nicht einzuführen. Die Gleichung χ + 1 = δ ist lösbar durch die Restklasse χ = m —·1. Ähnlich verhält es sich mit der Umkehrung der Multiplikation im nächsten Paragraphen. Bemerkung 2. Den Ring der ganzen Zahlen kann man selbst als den „Restklassenring mod 0 " auffassen, weil in ihm die Restklasse Ö aus der den Modul (0) erschöpfenden Zahl 0 allein besteht. Die Nullteilerfreiheit, die bei ihm schon aus der Ordnung seiner Elemente folgt, hat er mit den Restklassenringen nach Primzahlmoduln gemein. Bei diesen hat man aber wie bei allen eigentlichen Restklassenringen nur eine zyklische Anordnung ihrer Elemente. F ü r den Übergang von einem Modul m = dt zu einem Modulteiler t gilt: Mit a' = a mod m ist a' = a mod t. '
Mit a' = a mod t umgekehrt.
ist a'd == ad mod m und
Denn t\m und m\(a' — a) haben t\a' —a zur Folge, und t\(a' — a) und dt\(da' — da) sind gleichwertig.
Kongruenzdivision. Bruchdarstellung. Restklassenkörper 41 § 11. Kongruenzdivision. Bruchdarstellung. Restklassenkörpcr Satz 27: Die Kongruenz ax = c mod m ist genau dann lösbar, wenn (a, m) | c. In diesem Fall besitzt sie (a, m) einander mod m inkongruente Lösungen. Für den Hauptfall (a,TO)= 1 gehört also zu jedem c eine mod m eindeutige Kongruenzlösung. Beweis: Ist χ eine Lösung von α χ = c (m), so heißt das m\ax — c, und die Diophantische Gleichung α χ — c = my oder (34) αχ — my = e ist in ganzen Zahlen χ, y lösbar. Umgekehrt folgt aus der Lösbarkeit dieser Gleichung die Lösbarkeit der Kongruenz. Da durch α χ — my gerade alle Vielfachen von (a, m) dargestellt werden, ist die Gleichung (34) und somit die Kongruenz dann und nur dann lösbar, wenn (a, m) | c. Trifft nun (a, m) \ c zu und ist {a, m) = d, m = m'd, a = a'd, c = c'd, so ist jedes χ mit α χ == c mod m nach (33) auch Lösung von a'x = c' mod m,' und umgekehrt. Ist x1 eine zweite Lösung der letzten Kongruenz, so ist a' (x — a^) = 0 mod m' ; wegen (a', m') = 1 gilt m'\x — xv also a^ = χ +m'y. Alle solche x1 sind Lösungen der Kongruenz a'x = c' (TO') und damit auch der Kongruenz ax = c(m). Unter ihnen sind genau die Zahlen χ, χ + m', χ + 2 m',..., χ + (d — 1) m' einander mod m inkongruent. Ihre Anzahl ist d = (a m). Ist von vornherein (a,TO)= 1, so gilt xx = x(m), und man hat für ax = c (TO) eine mod m eindeutige Lösung. Für (a, m) = 1 verwendet man zur Bezeichnung der eindeutigen Lösung der Kongruenz α χ = c mod m gern die f* Bruchform x = — mod TO. Mit dieser Bruchschreibweise a führen wir nicht die rationalen Zahlen ein, auch nicht die mit zu m fremdem Nenner. Wohl aber gelten hier dieselben Rechenregeln wie für gewöhnliche Brüche. Es sind nämlich, wenn die Nenner immer zu m teilerfremd gewählt werden :
Kongruenzen. Restklassen
42 .„_. (v 3 5 ) '
es e e r — = —; as a a s
er = —; as
e , r —4- — = a s
es ± ar as
. mod m .
Die R i c h t i g k e i t dieser K o n g r u e n z e n f o l g t u n m i t t e l b a r aus CS der D e f i n i t i o n u n s e r e r B r ü c h e . I s t z . B . y = — , so h e i ß t das asy
s s e s ; wegen (s, m) = 1 i s t ay = c und wegen ( a , m) = 1, f*
auch y = — .
Die
übrigen
Regeln
beweist
man
ent-
sprechend. D i e B r u c h s c h r e i b w e i s e k a n n die A u f l ö s u n g v o n enzen sehr v e r e i n f a c h e n .
Kongru-
Beispiele: 87,-1(100):, Λ oder 81 oder
189
s
—
67 — 1162 go
-
134 ~
81 72
9 oa 23 5
148
8~ 11« 116
—
=
5
8 — ORK 255 =
Ί Γ
ss «9 bo,
o 37 =
102
2
=
Man drückt also den Nenner des gegebenen Bruches dadurch allmählich auf 1 herab, daß man Zähler und Nenner durch kongruente Zahlen ersetzt, entweder kleinere oder so zerfallende, daß der Bruch nach (35) kürzbar wird. Bisweilen kann auch eine 81 162 Brucherweiterung wie oben = ^ ^ das Verfahren beschleunigen; der in Zähler und Nenner hinzukommende Faktor muß dabei aber zu m prim sein. In der Regel kommt man mit dem Bruchrechnungsverfahren viel schneller zum Ziel als durch Auflösung einer Diophantischen Gleichung nach dem Muster des Euklidischen Algorithmus. Umgekehrt lohnt es sich, wenn (34) gegeben ist, eine
Bruchkongruenz daraus zu machen, wobei noch die Auswahl
zwischen α und m als Modul möglich ist.
V o n b e s o n d e r e r W i c h t i g k e i t i s t der F a l l , d a ß der Modul eine P r i m z a h l ist. A u f i h n werden sich ( § 1 5 ) die K o n g r u enzen n a c h e i n e m b e l i e b i g e n Modul i m w e s e n t l i c h e n z u r ü c k f ü h r e n lassen. E s s i l t h i e r :
Kongruenzdivision. Bruchdarstellung. Restklassenkörper 4 3 Satz 28: Körper.
Der
Restklassenring
eines
Primzahlmoduis
ist
Körper heißt dabei ein nullteilerfreier King mit Einselement — ein Integritätsbereich —, wenn in ihm jede Gleichung a x = c für α φ 0 genau eine Lösung besitzt. Nun besitzt jeder_Restklassenring ein Einselement, nämlich die Restklasse 1 ; er ist, wie wir schon gesehen haben, nullteilerfrei, wenn der Modul eine Primzahl ist. Nach Satz 27 ist bei Primzahlmoduln ρ die Kongruenz ax = c mod ρ für jedes α φ 0 (ρ) lösbar, und zwar mod ρ eindeutig, weil dann (a, p) = 1. Im Restklassenring Rp mod ρ ist also die Gleichung äx = e für ä φ Ö eindeutig lösbar. Die Lösung χ = a' von αχ = 1 mod ρ heißt zu a reziproker Rest. Hat man eine Tafel der Reziproken mod ρ, so ist die Kongruenz ax = c(p) durch Multiplikation zu lösen: x^a'c (p). In der obigen Definition des Körpers haben wir mehr gefordert als nötig. Es genügt: Ein Körper ist ein Ring, in dem jede Gleichung ax = c für α Φ 0 mindestens eine Lösung besitzt. Das übrige ist dann eine Folgerung. Sei zunächst α Φ 0 fest gewählt. Dann ist αχ — a lösbar, etwa durch χ — ea. Mit diesem ea ist bei beliebigem b auch bea = b, wie aus aea = α durch Multiplikation mit einem solchen r folgt, daß ra = b ist. Es gibt also ein e mit ae = a für alle a. Ist weiter a · b = 0 und α φ 0 und a'a = e, so ist a'ab = b = 0. Und schließlich folgt die Eindeutigkeit der Lösung von ax = c für α Φ 0. Ist nämlich auch ax1 = c, so ist a(x — x¡) = 0, also a'a(x — x-¡) = χ —· xt = 0 .
Ist a = a! mod m und (α, m) = d, so ist auch (a', m) = d, wie aus a' = a + km folgt. Man kann demnach von dem gr. g. T. einer Restklasse mit m sprechen, insbesondere von den zu m teilerfremden Restklassen. Zu diesen gehört die Restklasse a = 1 mod m. Ferner gehört zu ihnen mit zwei Restklassen auch deren Produkt, denn aus (a,m) = (b,m) = 1 folgt (ab,m) = 1. Und schließlich gibt es nach Satz 27 zu jeder teilcrfremden Restklasse die inverse Restklasse. Bezeichnen wir einmal die zu m teilerfremden Restklassen mit A , B , . . . , so gilt: Die Elemente A, B,. .. bilden eine Menge mit folgenden Eigenschaften:
Kongruenzen. Restklassen
44
1. Je zwei Elementen -wird durch eine Verknüpfungsvorschrift ein Element der Menge zugeordnet: AB — C. 2. Diese Verknüpfung ist assoziativ: ( A B ) C = A(BC). 3. Es gibt ein Element E , so daß für alle Elemente A die Gleichung E A = A gilt. 4. Zu jedem'Element A gibt es ein Element A~1, so daß A - 1 • A = E ist. Ganz allgemein nennt man eine Menge mit diesen Eigenschaften Gruppe. Von einer inhaltlichen Bedeutung der Verknüpfung wird abgesehen. Die zum Modul teilerfremden Restkla,ssen bilden eine Gruppe mit der Restklassenmultiplikation als Verknüpfung. Man nennt sie die prime Restklassengruppe. Wegen AB = BA stellen sie eine besondere Gruppe, eine „abelsche Gruppe" dar. Die Anzahl ihrer Elemente — ihre Ordnung — ist (m). Ein Vertretersystem der toilerfremden Reste mod m heißt primes Restsystem. Da es sich bei der primen Restklassengruppe mod m nur um die Multiplikation handelt und diese auf die simultane Multiplikation in den primen Restklassengruppen mod m, zurückgeführt ist, sagt man: Die prime Restklassengruppe mod m ist das direkte Produkt der primen Restklassengruppen mod TOj.
Kongruenzrechnung mit Polynomen
49
Der Beweis des Hauptsatzes liefert ein Verfahren, das χ mod m für das Kongruenzensystem (39) zu berechnen. Statt hierzu die Gleichung 1 = q^ + · · · + qTyT zu lösen, genügt es, da die e¡ = qty( nur mod m in Betracht kommen, die Kongurenz 1 = q1yl + · · · + qryT{m) zu lösen, und dafür wieder genügt die Lösung von 1 = q¡yt(mt). Denn aus y'i == y i ( m i ) folgt q^', = ^ ¿ ( m ) . Wir behandeln als Beispiel das Kongruenzsystem: χ = 2 mod 7, χ = 4 mod 8, χ = 1 mod 9. (7,8) = (7,9) = (8,9) = 1; m = 7 · 8 · 9 = 504; q1 = 72, ? 2 = 63, q3 = 56; 7 2 y , = 2 & = 1(7), 6 3 y t = - y t = l(ß), 56y8^2y,sl(9) 2/1-4(7), y2 = — 1(8), y» ^ — 4 ( 9 ) ; ex = 72 · 4(504), e 2 = - 63(504), e3 = - 5 6 - 4 ( 5 0 4 ) . a = 2 · 288 — 4 · 63 — 1 · 224 = 100(504); 100 == «¡(to,·). Dies Verfahren ist vorteilhaft, wenn mehrere Kongruenzverbindungen nach denselben Moduln vorzunehmen sind. Liegt ζ. B. das System χ = 5 mod 7, χ = 1 mod 8, χ = 3 mod 9 außerdem noch vor, so ist mit denselben e¡ jetzt χ = —2 · 288 — 63 — 3 · 224 = —72 — 63 = — 303 = 201 mod 504.
168 ^
§ 14. Kongruenzrechnung mit Polynomen Unter ganzzahligen Polynomen versteht man Ausdrücke von der Form A(x) = a0 + a1x + — + anxn mit ganzzahligen Koeffizienten a¡. Die Rechenregeln für Polynome setzen wir als bekannt voraus. Die Polynome mit ganzzahligen Koeffizienten bilden einen Ring. (Vgl. S. 7.) Jedem Polynom mit einem von 0 verschiedenen Koeffizienten ordnet man als Grad den Index des letzten nicht verschwindenden Koeffizienten zu. Die ganzen Zahlen Φ 0, unter ihnen die Zahl 1, haben den Grad 0. Der Zahl 0 ordnet man keinen Grad zu. Ist A(x) = % + ·•• + anxn, B(x) = b0 + · · • + inX™ und an, hm Φ 0, so hat das Poly4
Scholz-Schoeneberg,
Zahlentheorie
Kongruenzen. Restklassen
50
nom Α (χ) Β (χ) als höchsten Koeffizienten anbm 4= 0. Die ganzzahligen Polynome bilden also einen Integritätsbereich. (Vgl. s. 8.) Wir werden auch die ganzzahligen Polynome nach einem Modul betrachten und definieren: (46) A(x) = B(x) m o d m , wenn alle Koeffizienten von A(x) — B(x) durch m teilbar sind. Wir schreiben auch A{x) = B(x) für die Polynome, deren Koeffizienten die zugehörigen Eestklassen sind; damit ist wieder jeder Kongruenz eine Gleichung zugeordnet. Den Index des letzten in A(x) vorkommenden Koeffiz i e n t e n ^ 0 mod m bezeichnet man als Grad vonA(x) modm. Dem Polynom A{x) = 0 modm wird kein Grad modm zugeordnet. Beispiel: 12z 3 + 9x 2 + 4 hat mod 5 den Grad 3, mod 4 den Grad 2, mod 3 den Grad 0 und ist z. B. = 2a 3 — χ — 1 mod 5, s a ; 2 mod 4, s i mod 3. Das Polynom χ 3 — χ hat mod 3 den Grad 3 und ist insbesondere φ 0, obwohl es für jedes χ = 0,1, 2 mod 3 den Rest 0 ergibt. Es können demnach verschiedene Polynome mit Koeffizienten aus einem Restklassenring an allen Stellen übereinstimmen. Gilt für die ganze Zahl r die Kongruenz A(r) = 0 mod m, so heißt r eine Wurzel von A(x) modm. Satz 33: Die ganze Zahl r ist genau dann Wurzel von A(x) mod m, wenn A(x) = (x — r) A^{x) modm ist mit einem ganzzahligen Polynom A^x). Beweis: Für jedes r gilt, sogar als Gleichung, A(x)—A(r) = a^x—r) + a2(x2— r2) -i hα„(»η—rn) = = (χ — r) A^x), da χ— r\x* — r'. Für A(r) = 0 ist daher A(x) = (x—r) kehrung ist trivial.
A^x);
die Um-
Für das Weitere setzen wir den Modul als Primzahlmodulp
voraus. Satz 3 4 : Sind rv .. .,rk von Α (χ) mod ρ, so isl
(17)
einander inkongruente Wurzeln
A(x) = (a; — » 1 ) . . . (κ — r t ) Ak(x) mod p.
Kongruenzrechnung mit Polynomen
51
Zunächst gilt nämlich nach Satz 33 die Kongruenz A(x) = (χ —Tj) A^x). Ist nun A(r2) = 0 und r2 φ rv so folgt aus 0 = (r2 — r¡) A1 (r2), da der Modul eine Primzahl ist, die Kongruenz A 1 (r2) = 0, also nach Satz 33 die Zerlegung A^x) = (x—r2) A2(x). Daraus folgt der Satz für k = 2; allgemein folgt er durch vollständige Induktion. Ist in (47) der Grad von A(x) mod ρ gleich η, so ist der Grad von Ak(x) mod ρ gleich η — k. Daraus folgt: Ein Polynom n-ten Grades hat mod ρ höchstens η inkongruente Wurzeln. Ist A{x) φ 0 und besitzt es wirklich η inkongruente Wurzeln modp, so zerfällt es in (48)
A(x) = (x — r j (x — r t ) . . . (x —r„) a„ mod p.
Anwendung: Für jeden Rest r φ 0 gilt eine Kongruenz rh = l(p), da r, r2,..., rm,... nicht alle einander inkongruent sind und aus rm = rn die Kongruenz rm~n = 1 (p) folgt. Das kleinste positive h dieser Eigenschaft heißt der Exponent oder die Ordnung von r mod p. (Entsprechend bei zusammengesetztem Modul.) Es ist dann (49)
rh = r2h = r™ = · · · = 1 ,
während 1, r , . . . , r i _ 1 einander inkongruent sind, weil sonst unter ihnen ein rm'n = 1 mit 0 < m — n 0 , s ^ 0 , als Lösungsanzahlen: a(m) = 2 r f ü r s = 0 , 1 ; a(m) = 2r+1 f ü r s = 2; α (m) = 2r+2 f ü r s > 2. Beispiele zu x2 = 1 mod m: m = 45, a; = ± l , ± 19(45), α(45) = 4 . m = 1 2 0 , χ = ± 1 , ± 1 9 (30) [zusammengefaßt], α (120) = 1 6 . Wir wollen jetzt die Reduktion der Moduln lei algebraischen Kongruenzen weiterführen und die Lösung von Α (χ) = 0 mod ρ", e > 1, auf die Lösung mod ρzurückführen. Jede Lösung r' von A{x) = 0 mod ist Lösung von A(x) = 0 mod Dabei können verschiedene Lösungen mod pe in eine mod ρ « - 1 zusammenfallen. Auf jeden Fall besteht bei r' = r mod die Kongruenz r' == r + ype~x
(52)
mod pe
mit einem y, das mod ρ bestimmt ist. Sei nun umgekehrt r eine Lösung von A{x) = 0 mod D a n n ist (53)
A(x)
= (x-r)Q(x)
+ A(r) mit
F ü r A{r) gilt noch A(r) = a p "
-1
e
p'-^Air).
mod p mit einem mod ρ
Reduktion der Moduln bei algebraischen Kongruenzen
55
bestimmten a. Ersetzen wir nun χ durch r' mod γ/, so wird aus (53) (54) A(r') = (/ — r) Q{r') + A(r) mod pe. Wir versuchen jetzt y mod ρ in r' = r + yp5-1 mod ρ" so zu bestimmen, daß A{r') = 0 mod pe wird. Zunächst ist Q(r') = Q(r) mod ρ, dar' = r mod ρ ist. Damit nimmt (54) die Form A(r') = yp6'1
Q(r) +
= (yQ(r) + α) ρe~1 mod pe
mit einem gewissen α mod ρ an. Jetzt müssen zwei Fälle unterschieden werden: Entweder ist Q(r) φ 0 mod ρ und es gibt genau ein y mod ρ, so daß yQ{r) + α = 0 mod ρ ist. Dann gibt es zu jeder Lösung r von A(x) = O mod p e _ 1 genau eine Lösung r' von A(x) = 0 mod pe. Der Zusammenhang von r' und r wird durch (52) gegeben. Oder es ist Q(r) = 0 mod p. Dann wird die Kongruenz yQ(r) + α — 0 mod ρ durch kein y mod ρ befriedigt, wenn αφ Ο (ρ) ist, oder durch alle y mod ρ, wenn α = 0(p) ist. In diesem zweiten Fall gibt es zu einer Lösung r von Α (χ) = O mod pe_1 keine Lösung oder ρ Lösungen von Α (χ) = 0 mod pe. Entscheidend f ü r das eindeutige Aufsteigen von einer Lösung r mod zu einer Lösung r' mod pe ist die Bedingung mod p. Man sagt in diesem Fall, r sei eine einfache Lösung von A(x) = O mod ρ, während man bei Q(r) = O mod ρ von einer mehrfachen Lösung spricht. Von den einzelnen Kongruenzwurzeln mod ρ zu denen mod pe in e — i Schritten aufsteigend, erhält man insgesamt: S a t z 3 8 : Sind rv . . . ,rk sämtliche Kongruenzwurzeln A(x) = 0 mod ρ und alle einfach, ist also
von
A(x) = (x — Tj) (χ — r 2 ) . . . (x — rt) Q(x) mod ρ mit Q(r) φ Ο (ρ) für alle r mod ρ, so gibt es auch genau Je Lösungen mod pe. Ist allgemein r,· eine einfache, r,· eine mehrfache Wurzel mod ρ, ist also Q(r,·) φ O, Q(r¡) = 0 mod ρ, so hat Α (χ) = O
Kongruenzen. Restklassen
56
mod ψ" genau eine Wurzel, die s r, mod ρ ist, dagegen Iceine Wurzel, die = r,· mod ρ ist, oder Scharen von je ρ Wurzeln, die demselben Rest mod pe~l kongruent sind. Beispiel (p = 3): 1. x 2 + 11 = O mod 3 e . Zwei einfache Wurzeln χ = ± 1, 4, 4, 3 1 , 3 1 , 2 7 4 . . . mod 3 , 9 , 2 7 , 8 1 , 2 4 3 , 7 2 9 , . . . . 2. χ2 + χ + 1 = 0(3«). Eine mehrfache Wurzel + 1 mod 3, schon keine Wurzel mod 9. 3. χ 3 —19 s 0(3«), Mehrfache Wurzel: χ s 1 mod 3; 1, 4, 7 mod 9; 7,16, 25 mod 2 7 ; . . . Die unterstrichenen Lösungen sind diejenigen, aus denen die Lösungen der höheren Potenz hervorgehen. 4. x(x — 1) (x — 4 ) = 0 (3e). Eine einfache Wurzel 0 mod 3«; eine mehrfache Wurzel χ = 1 mod 3; 1, 4, 7 mod 9; 1, 4,10,13, 19, 22 mod 27; 1, 4, 28, 31, 55, 58 mod 81; . . . . Wie die Beispiele 3, 4 zeigen, kann von zwei Lösungen mod ρ* -1 , die aus einer mehrfachen Wurzel mod ρ hervorgehen, sehr wohl die eine ohne die andere Lösung mod pe sein. § 16. Der Fermatsche Satz Wir kommen nun zu dem Satz der Kongruenzlehre, der für fast alle weiteren Ergebnisse grundlegend ist, dem Fermatschen Satz: Satz 39: Für jede Primzahl φ und jeden Rest χ mod ρ gilt die Kongruenz (55) = χ mod p. Daraus folgt sofort: Für jeden zu ρ teilerfremden Rest r gilt (56)
rP' 1 = 1 mod p.
Umgekehrt hat (56) die Kongruenz (55) zu Folge.
Dieser von Fermât (1601-1665) aufgestellte und bewiesene Satz wird oft der „kleine Fermât" genannt; dagegen wird als „großer Format" die von Fermât aufgestellte, immer noch unbewiesene Behauptung bezeichnet, daß xn + yn = zn für η > 2 in ganzen Zahlen x, y, ζ unlösbar sei. Für einzelne η ist der Beweis gelungen, oft mit großen
Der Fermatsche Satz
57
Schwierigkeiten; für η = 4 vgl. § 19. An Wichtigkeit ist der große Fermât dem kleinen Fermât weit unterlegen. Um den Fermatschen Satz zu beweisen, beachte man, daß allgemein (57) (x + y)P = xP + y? mod ρ für Zahlen, Variable und Polynome x, y gilt. Denn in der Binomialentwicklung von ( χ + y)P hat xp~' y' für i = 1, 2, . . . , ρ — 1 den Koeffizienten p\
_
i)
-
P(P
—
! ) · · · ( ? —
1-2
* + l )
.
. . . i
dieser ist = 0 mod ρ, da alle Faktoren im Nenner < ρ sind und deshalb das ρ im Zähler nicht durch Kürzen fortfallen kann. Für y — 1 gilt also bei beliebigem Rest χ die Kon£
(x
r u e n z
1)p =
+
+
χΡ
1 m o d
p.
Aus ihr folgt (x + 1)? = χ + 1 mod ρ unter der Voraussetzung χ? = χ mod ρ, die für χ = 0 zutrifft. Wir haben damit für (55) einen Beweis durch Induktion, deren Anwendung auf ein vollständiges Restsystem mod ρ beschränkt werden darf. Ein anderer Beweis liefert zugleich den allgemeineren Eulerschen Satz:
Satz 40:
Für
jeden
zum
Modul
m
teilerfremden
Rest
r
gilt
(58) rv(m) = 1 mod m. Dabei ist φ (m) wieder die Eulersche Funktion, welche die Anzahl der zu m teilerfremden Restklassen mod m angibt. Beweis: Sei rlt r 2 , . . . ,τφ ein primes Restsystem mod m, und r einer dieser Reste, dann ist (59)
r f j rr2
—
ττφ
=
r
1
r
- · • rv
2
mod m.
Denn mit r¡ durchläuft auch rr¡ ein primes Restsystem mod m, da r χ = r„ mod m, wegen (r, m) = 1 genau eine Lösung x = r¡(m), (r,·,TO)= 1 hat. Also ist nach (59) f
W
· r
und das liefert (58).
1
.
. . r
ç
ξ= r
1
.
. . τφ
mod to
Kongruenzen. Restklassen
58
Eine unmittelbare Folge von Satz 40 ist, daß die Ordnung h eines teilerfremden Restes r ein Teiler von ) = ι m o d m erfüllen, als kl. g. V. der Ordnungen von rx bis τφ ein Teiler von φ(μ). Es fragt sich, für welche m der kleinste Exponent xp(m) ein echter Teiler von (m) =
1 (m) für
dem hl. g. V.
der
alle f(q¡):
[ip(q1),...,y>(q,)]
Ist nämlich ν durch alle ψ (q() teilbar, so ist xv = 1 mod q¡ (i = 1 , . . . , s), also auch = 1 mod m für alle χ mit (χ, m) = 1, und umgekehrt. Jetzt schließt man sofort, daß %p(m) echter Teiler νοηφ(Μ) ist, sobald mehrere q¡ > 2 sind. Denn -ψ im) ist nach (60) wegen rp{q)\ cp{q) ein Teiler von [ 9 ? ( ( f r ) , . . . , ç>(?8)] und dies ein Teiler von \ Π φ (q,) = \ (m), weil
a a e1 c2..._c¡e i 2 · · · am + 10*" " 10* (10» - 1)
mit im Dezimalsystem geschriebenen Zähler dar, und es wird 10*(10n — 1) α eine ganze Zahl. Der Dezimalbruch (62) stellt einen echten Bruch dar, wenn nicht hinter dem Komma lauter Ziffern 9 stehen. — Umgekehrt ist jeder echte Bruch durch einen Dezimalg brach (62) darstellbar. Denn zunächst ist α = — mit ganzen s, t und s < t, (s, i) = 1. Ist nun t — 2ki bhm mit (m, 10) = 1 und „ , . . , s 2*—iißt—it,s l max IL·,fc2)= k, so ist α = — = - = ^.. t 1 21 *· 10*m 10*m mit (m, 1) = (m, 10) = 1, l < 10*»» und i φ 0 (10), wenn k > 0. Die Zahlen k, l, m einer solchen Darstellung sind durch α eindeutig bestimmt. Ist nun η die Ordnung von 10 mod m, so ist m I 10" — 1 und ll 10 -ec c* 4- α ι " 2 · · · a " · 1U *a - 1 m ~10»-1 ~ 1 10"-1 ' damit ist α in obiger Form darstellbar. Dabei fängt die Periode nicht etwa schon früher an; es ist also, falls es überhaupt ein c¡¡ gibt, c¡¡ Φ an. Denn sonst könnte im Nenner von α das k durch k — 1 ersetzt werden, entgegen l φ 0 (10) bei k > 0. Auch ist die Periodenlänge wirklich gleich n\ es liegt also keine mehrfache Wiederholung einer kürzeren Periode etwa der Länge h vor;
60
Kongruenzen. Restklassen
A l (io denn dann wäre bereits 10*(10Α — 1)α = ———
1) ganz, und
es folgte m | 10A — 1 wegen (m, l) = 1, während doch η die kleinste Zahl mit m | 1 0 " — 1 ist. Nach dem Fermatschen Satz ist η ein Teiler von 2 keinen Rest der Ordnung φ (m). Dagegen werden wir für ungerade Primpotenzmoduln die Existenz von Primitivwurzeln nachweisen und ihre Anzahl bestimmen. Satz 42: Es gibt * — l = 0(p). Für d\p — 1 ist F(d) = d. Da nämlich ZP-1 — 1 linear zerfällt und tí1 — 11 xp-1 — 1, zerfällt nach Satz 35 auch xd — 1 linear, hat also d Wurzeln mod p. Aus F(d) = Σ f(t) folgt ί/ί
Primitivwurzeln. RestMassengruppe nach
(29),
Σ μ(0 F
der
Möbiusschen
Umkehrforir.el,
61 / (β)
=
> und zwar für jedes d. Gilt aber d\p — 1, also
auch - y p — 1 für die Teiler t von d, so ist F ^ - j = ~
und
f(d) = Σμ(ή ~r, und nach (30) ist damit f(d) = cp(d). Ins(q) zu erfüllen oder ind χ = 0 mod gerade η Möglichkeiten.
- - - . Das gibt für ind χ
Satz 47: Bei q = 2 e , e ^ Β, η \ \ ψ (2 e ) uni η > 1 ist die Kongruenz xn = a mod 2 e genau dann lösbar, wenn φ (2") (73) α 2 n s 1 mod 2e unda^l mod 4 ist, und dann ist die Anzahl der Lösungen mod 2 e gleich 2 η. Da in derDarstellung a = (—l)°vl 0 mod 2e (mit = — 1) die Exponenten c mod 2 und c0 mod J? 3, a == 1(2), ist genau dann lösbar, wenn χ2 = a (8) lösbar ist, wenn also a = 1 (8) ist. Zunächst folgt aus der Lösbarkeit von χ2 = α (2 e ) die Kongruenz a = 1 ( 8 ) . Die Umkehrung beweisen wir durch Induktion. Sei xl =a{2e); dann wählen wir ein γ so, daß
Darstellung durch Quadratsummen
67
x\ + γχ0 2e + γ2 22e'2 = a mod 2 e + 1 jjj2 β wird. Das ist möglich, weil — 2 « — " + 7 x o = ® (2) lösbar (x0 + γ 2
=
und für e^ 3 auch 22e~2 == O mod 2 β + 1 ist. Daraus folgt die Behauptung. Die n-ten Potenzreste mod m bilden eine Gruppe. Denn mit a = xn und b = yn ist ab = (xy)n ein w-ter Potenzrest, und aus ( ζ * ) - 1 = (χ~ 1 ) n folgt, daß das Reziproke eines n-ten Potenzrestes wieder ein w-ter Potenzrest ist. Die Sätze 46 und 47 geben eine Antwort auf die Frage nach den Potenzresten bei festem Modul. Die Frage, für welche Moduln eine gegebene Zahl w-ter Potenzrest ist, wird im 3. Kap. für w = 2 beantwortet.
§ 19. Darstellung durch Quadratsummen Satz 49: Jede natürliche Zahl ist als Summe von vier Quadraten darstellbar. Dem Beweis dieses so einfach zu formulierenden Satzes schicken wir einen Hilfssatz voraus : Die Kongruenz (74)
χ2 + y2 =s — 1 mod ρ
ist für jedes ρ lösbar. Denn unter den Zahlen l 2 , 2 2 , . . . , ρ-1 {ρ — l) 2 befinden sich für ρ > 2 genau ^ > die mod ρ einander inkongruent sind. Aus a2 = b2 (p) folgt nämlich (α + b)(a — b) = 0 ( p ) , also α = i & (ρ), und es ist bei diesen α φ — α (ρ) für α φ 0 und p > 2. Damit gibt es Ρ— 1 —g— teilerfremde, einander inkongruente Reste, dio mod ρ ν — ein Quadrat sind, und — ^ -1 , die es nicht sind. Unter den Resten — χ2 — 1 , χ = 0 , 1 , . . . , p — 1 befinden sich daher Ρ+ 1 — „ - - einander mod ρ inkongruente, unter ihnen 0 oder ein V— 1 teilerfremdes y 2 mod ρ, da es nur teilerfremde Reste 2 gibt, die kein Quadrat mod ρ sind. Die Kongruenz (74) ist also lösbar. 5·
68
Kongruenzen. Restklassen
Es genügt, Satz 49 für Primzahlen zu beweisen. Denn das Produkt zweier Summen von vier Quadraten ist wieder als Summe von vier Quadraten darstellbar. Man bestätigt nämlich durch Ausrechnen (75) (a2 + l·2 + c°- + d2) (χ2 + y2 + 22 + w2) = = A2 + B2 + C2 + Z)2 . A = ax+ly + ez + dw; Β = ay — Ix — cw + dz; nllt G = az + lw — cx — dy\ D = aw — Iz + ey— ix. Zu jeder Primzahl ρ gibt es nach (74) ein Vielfaches mp = χ2 + y2 + l 2 + 0 2 . Setzt man dabei die Lösung von (74) mit \x\,\y\^L\p an, so ist m, p. Wenn m = 1 ist, sind wir fertig. Für die weitere Untersuchung des Falls m > 1 brauchen wir nur: Zu jedem ρ gibt es ein m^\p,so daß (76) pm = χ2 + y2 + z2 + w2 lösbar ist. Die Zahl m soll jetzt auf 1 herabgedrückt werden. Sei α =ξ x(m) der kleinste Absolutrest von χ mod m, entsprechend δ, c, d für y, ζ, w, also \a\,.. . Dann ist pm — χ2 + y2 + z2 + w2 = a2 + 52 + c2 + d2 = 0 mod m; a2 + &2 + c2 + d2 = mm'. Nach (75) gilt jetzt pm2 m' = ( χ 3 + y2 +z2 + w2) (a2 + l·2 + c2 + d2) = = Λ2 + B2 + C2 + D2. Setzt man für A,.., D die Ausdrücke aus (75) ein und beachtet α = χ,. . , d = w(m), so folgt A = · · = D == 0(m) und damit eine Darstellung von pm' als Summe von vier 2 2 2 2. , , ^ Λ ι . . . , .\d\ . Quadraten, lτu- r m , = α + 6 + c + á- folgt aus |α|, •< y jetzt m' 5Í m. Wenn m' < m ist, haben wir für ein kleineres Multiplum von ρ eine Darstellung. Die Gleichung m' = m gilt nun genau dann, wenn \a\,. . ,\d\ =
. Dann ist
2 α = ·· = 2ί2 = 2ίε = ·· = 2Μ> = 0 mod m.
Darstellung durch Quadrat9ummen
69
Aus der Darstellung von pm folgt jetzt 4 pm = vm2, also m|4p und, da (m, ρ) = 1 ist, schließlich m|4. Ist m' = m = 4, so sind alle Summanden in der Darstellung (76) für 4 ρ durch 4 teilbar, woraus eine Darstellung für ρ folgt. Ist m' — m, — 2, so folgt aus einer Darstellung für 2 ρ eine solche für 4 ρ = (1 + 1 + 0 + 0) 2 ρ mit durch 4 teilbaren Summanden, also wieder eine für p. Zu jedem pm, m > 1, das als Summe von Quadraten dargestellt werden kann, gibt es ein pm', m' < m, mit derselben Eigenschaft. Der Beweis ergibt, wenn eine Lösung von (74) bekannt ist, einen Darstellungsalgorithmus für p. Beispiel: ρ = 79. — 1 = 157 = 112 + 6 2 ; 112 + 6 2 + l 2 + 0 2 = 2 · 79 ; 2 = l 2 + O2 + l 2 + O2 ; 4 · 79 = 122 + 6 2 + 102 + 6 2 ; 79 = 6 2 + 5 2 + 3 2 + 3 2 . Die Zahl 79 braucht wie alle Zahlen der Form 8n + 7 wirklich vier Quadrate zu ihrer Darstellung. Denn bei x2 + y2 + z2 + w2 = 7 (8) müssen drei Quadrate ungerade sein und dann je = 1 (8), und das vierte muß = 4 (8), also Φ 0 sein. Ebenso sind für das Vierfache einer Zahl, die vier Quadrate zur Darstellung braucht, wieder vier Quadrate erforderlich. Wenn nämlich 4m durch drei Quadrate dargestellt werden kann, sind alle Summanden notwendig gerade, also auch durch 4 teilbar, und durch Wegheben von 4 entsteht eine Darstellung von m durch drei Quadrate. Also brauchen alle Zahlen der Gestalt 4'" (8 η + 7) vier Quadratsummanden. Alle übrigen kommen mit drei Quadratsummanden aus; aber das ist nicht so leicht zu zeigen. Satz 50: Eine Primzahl ρ ist genau dann in der Form ρ — χ2 -f y2 darstellbar, wenn z2 = — 1 mod ρ lösbar ist. Beweis (ohne Verwendung des Vorigen) : Sei e die kleinste Zahl mit e2 > p. Ist z2 = — 1 (p) lösbar, so ist eine Lösung nach Thue (Satz 29) als Bruch
mit 0 < x, y < e, also mit
x2, y2 ^ (e — l) 2 < ρ darstellbar. Dann ist x2 + y2 = 0(p), also χ2 + y2 = mp; wegen 0 < x2, y2 < ρ muß m — 1 sein. Umgekehrt folgt aus der Lösbarkeit von φ = χ2 + y2 die Lösbarkeit von z2 = — 1 (p).
70
Kongruenzen. Restklassen
Nach der Kongruenz (30) des Wilsonschen Satzes ist z2 = — 1 (p) für ρ == 1 (4) lösbar. Nach Satz 50 ist sie für ρ = 3 (4) nicht lösbar, da diese Primzahlen nicht als Summe von zwei Quadraten darstellbar sind. Daraus folgt Satz 51: Alle Primzahlen ρ der Form 4 m + 1 und ρ = 2 und nur diese Primzahlen sind als Summen von zwei Quadraten darstellbar: ρ = χ2 + y2. Wegen (α2 + b2) (ζ 2 + y2) = {ay - bx)2 + (ax + by)2 ist mit zwei Zahlen auch ihr Produkt als Summe von zwei Quadraten darstellbar. Aus Satz 51 folgt deswegen, daß alle Zahlen, die nur die Primteiler 2 und solche der Form 4 η + 1 besitzen, als Summe von zwei Quadraten darstellbar sind. Die Umkehrung trifft nicht zu: 9 = 3 2 + 0 und 3 φ 4 n + 1 ; dagegen ist 9 Φ χ2 + y2 für χ Φ 0, y Φ 0. Zur Klärung dieser Verhältnisse führen wir einen neuen Begriff ein. Wir nennen die Darstellung einer natürlichen Zahl m = x2 + y2 eigentlich, wenn (χ, y) = 1 ist, und sonst uneigentlich. Jetzt gilt: Satz 52: Die natürliche Zahl m mit der Primpotenzzerlegung m = 2e p{' · · · pe/ besitzt keine eigentliche Darstellung m = χ2 - f y-, wenn e ¡g: 2 oder ein p¡ = 3 (4) ist. Sie besitzt 2s-i verschiedene eigentliche Darstellungen, wenn e = 0, 1 ist und alle p¡ = 1 (4) sind. Sei m = χ2 + y2 eine eigentliche Darstellung. Dann ist mit (x, y) = 1 auch (χ, m) = (y, m) = 1, und wegen χ2 + y2 = 0 (ρi) ist Q = — 1 (Pi). Eine Zahl m mit einem Primteiler pi = 3 (4) besitzt also keine eigentliche Darstellung. Wenn e 2 ist, besitzt sie auch keine, da dann in m = χ2 + y2 die Zahlen χ, y gerade sind. Sei nun zunächst e = 0 und m = p[l... p'8 mit p¡ = 1 (4). Für p1 gibt es eine Darstellung p1 — x2 + y2 ; daß sie eigentlich ist, folgt aus (x, y)2\Pi. Wir konstruieren jetzt für s > 1 zu einer (notwendig eigentlichen) Darstellung von ti = p1 ... Pi, i < s zwei verschiedene (wieder notwendig eigentliche) Darstellungen von px... pi+1 = t¡pi+1. Es seien t = α2 + b2 und φ = ρ, + , = χ2 + y2. Nun ist allgemein
Darstellung durch Quadratsummen (77)
(α2 + b2){x2
71
+ y2) = (ay —6a;)2 + (ax + by)2 = (ax—by)2 + (ay + bx)2.
Für unsere t, ρ sind a, b, c, d =f= 0; sie seien so gewählt, daß α > δ > 0, a ; > î / > 0 ist. Dann ist (ax + hy)2 größer als alle andern Quadrate in (77), und daher sind die beiden Darstellungen für tp verschieden. Es gelten, wie man sofort nachrechnet, folgende Kongruenzen: (78)
ax+ly b , , χ , ^zTbx = T-mod = 7 m o d Ρα!/ + r~ bx = — mod l· t, == — y mod ν. r αχ — by a ' χ
Die Quotienten der beiden Lösungen von t · ρ = X2 + Γ 2 , Χ Χ nämlich ^ u n d ^1 r . sind modi, aber nicht mod ρ kongruent 1 2 (p > 2). Ausgehend von einer Darstellung = x2 + y2 gelangt man so zu 2 S _ 1 Darstellungen für Ρ — p1 ρ 2 ···ρ Β · Wir zeigen, daß diese untereinander verschieden sind. Der Quotient -j- mod Ρ der Darstellungszahlen aus Ρ = Α 2 + Β 2 ist Wurzel von z2 = — 1 (Ρ). Die 2S Wurzeln dieser Kongruenz erhält man durch simultane Lösung von z2 = — 1 (p¡), also in der Gestalt ζ = ^ j( (p¡), wo j¡ eine der Wurzeln von z2 = — 1 (p¡). Für die eine Darstellung von PiP2 ist dann nach (78) der Quotient der Darstellungszahlen = j2(p2), für die andern = — j2(p2). Mod pl sind die beiden Quotienten kongruent, etwa = + ji(Pi). Treten nun in den Darstellungen von — pv als Quotienten alle Kombinationen s h (Ρι), = ± j2 (p2), = ± j3 (p3) , . . . = ± j „ ipv) auf, so auch in den Darstellungen von p x . . . p v + 1 wegen (78) alle Kombinationen = (px) , = ± j 2 (p2) > · · · . = ± jV+i (pv+1). Die 2 S _ 1 gewonnenen Darstellungen von Ρ sind also verschieden, gehen auch nicht auseinander durch Vertauschen der beiden Darstellungszahlen hervor. Aus einer Darstellung von Ρ kann eine eigentliche Darstellung von m — Π pi* gewonnen werden. Sei v = a2+b2 2 eine eigentliche Darstellung, ρ \ υ und ρ — χ + y" ; die Zahlen
Kongruenzen. Restklassen zc b χ, y seien so gewählt, daß — = a•— (p) ist. Dann liefert die y zweite Quadratsumme in (77) eine uneigentliche Darstellung von vp, hingegen die erste eine eigentliche. Wäre nämlich für einen Primteiler p0 von ν ax + ly = 0 (p0), ay—hx =0 (p0), δ a so folgte x = —~y =j-y (Po). a l s o X2 + y2 = o (p 0 ). Es müßte dann p 0 — ρ sein. Aber α χ + hy = 0(p) ist wegen — == unmöglich. Für die so aus Ρ = Α 2 + Β 2 entstehende Darstellung m = Χ 2 + Y 2 ist Y : Χ = Β : A mod P . Aus verschiedenen Darstellungen von Ρ entstehen also auf diese Weise verschiedene Darstellungen von m. Eine eigentliche Darstellung m = X 2 + Y 2 führt nach Multiplikation mit 2 = l 2 + l 2 für m = 1(2) auf die eigentliche Darstellung 2m = (X — Yf + (X + Y)2. Es gibt f ü r m = 2 e pi1 . · · pe/ auch nicht mehr als 2 S _ 1 verschiedene eigentliche Darstellungen. Gilt nämlich f ü r die den beiden eigentlichen Darstellungen m = χ2 + y2 = u2 y ν + υ2 zugehörigen Wurzeln — u n d — von χ 2 = — 1 (m) die 72
Kongruenz — = — (m), so sind die Darstellungen gleich. Denn aus m2 = (uy — vx)2 + (ux + vy)2 und uy — vx = 0 (m) folgt uy — vx = 0, ux + vy = m und dann u = x, v = y. Da die Anzahl der Lösungen von x2 == — 1 (m) bei vorgeschriebener Lösung mod φ 1 gleich 2 S _ 1 ist, folgt die Behauptung. Die Lösung mod bestimmt die Reihenfolge der Summanden. Wir entnehmen unserm Satz 52 und seinem Beweis : Eigentliche Darstellungen besitzen alle und nur die Zahlen m, die Produkte von Primzahlen der Form 4 η + 1 sind, und ihre Doppelten, nur eigentliche Darstellungen die quadratfreien unter ihnen, und zwar mehrere, wenn sie mehrere ungerade Primfaktoren enthalten. Die Primzahlen der Form 4 w + 1 und ihre Doppelten sind dadurch gekennzeichnet, daß sie allein unter den natürlichen Zahlen
Darstellung durch Quadratsummen
73
genau eine eigentliche und keine uneigentliche Darstellung besitzen, eine Kennzeichnung, die zur Primzahlprüfung geeignet ist. Nach derselben Methode läßt sich beweisen: Es ist eine Primzahl ρ > 2 in der Form ρ = χ2 + dy2 für d = 2 , 3 , 7 darstellbar, wenn z2 = —d mod ρ lösbar ist, ferner für d = 5, 13, 37, wenn außerdem p = 1 mod 4 ist. Wieder sind diese ρ unter den ungeraden Zahlen durch eindeutige und zugleich eigentliche Darstellbarkeit ausgezeichnet. Man erhält für jedes d bei Lösbarkeit der Kongruenz z2 = —d mod ρ aus einer Lösung ζ =
mit O < x, y < e,
wo e wieder das Minimum für e 2 > ρ ist, eine Darstellung χ2 + dy2 = mp mit 1 m Sí d. F ü r die genannten Fälle lassen sich dann die m > 1 durch Kongruenzen entweder ausschließen oder auf m = 1 zurückführen. Wir wollen dies nur f ü r d = 3 und d = 37 ausführen. Ist z2 = — 3 ( p ) lösbar, so gibt es eine Darstellung χ2 + 3y 2 = mp mit m Sí 3. Ist m = 3, so folgt χ == 0(3) und damit eine Darstellung für p. Der Fall m = 2 ist ausgeschlossen, da χ2 + 3 y2 = 2 p nur für ρ = 2 lösbar ist. Für d = 37 wollen wir den Satz von Thue in der allgemeinen Form verwenden. Es seien e und f die kleinsten Zahlen mit e2 > 6p, f2 > ^ p. Dann folgt aus — 37 = (—J y mit χ < e, y < / die Ungleichung 0 < χ2 + 37y 2 < 6p + ~ ρ < 13p. Da ρ ein Teiler von x2 + 37 y2 ist, folgt χ2 + 3 7 y2 — mp mit 1 ^ m
12.
Man braucht nur (x, y) = 1 zu betrachten, da (x, y) > 1 auf kleineres m führt. Dann ist χ = y = 0(2) unmöglich, und es ist mp = 1 oder 2 mod 4. Wegen ρ = in + 1 ist daher m = 1 , 2 , 5 , 6, 9 oder 10. Auch x = y = 0(3) ist unmöglich, und es ist mp = 1 oder 2 mod 3; also ist m^ 6,9. Da nun χ2 = 0, ± 1(5), 37y 2 = 0, ± 2(5), aber nicht χ =y
74
Kongruenzen. Restklassen
= 0(5) ist, scheiden auch m — 5 , 1 0 aus, und es bleiben noch m — 1, 2. Aber für m = 2 ist χ = y = 1(2) und daher 2 ρ = χ2 + 37 y2 = 1 + 5 = 6 mod 8 und dann ρ = 3 mod 4. Die Kongruenzen ζ 2 = — 2 (ρ) für ρ == 5, 7 mod 8 und ζ 2 = — 3 (ρ) für ρ = 2(3) sind unlösbar, weil x 2 + 2 y 2 = b, 7(8) und χ 2 + d i f = 2(3) unlösbar sind. Aus einer Lösung von z2 = — 1 (p) die Darstellung p = x2 + y2 zu erhalten, ist auch hier möglich: ζ. B. 22 2 = — 1 (97) ; 22 2 + 1 = 97 · 5 ; (22 2 + l 2 ) (2 2 + l 2 ) = 45 2 + 20 2 ; 97 = 9 2 + 4 2 . Jedocli tritt praktisch eher die umgekehrte Aufgabe auf. Erwähnt sei noch die Existenz einer (75) und (77) einbegreifenden Multiplikation, die ein Produkt zweier Summen von acht Quadraten wieder als Summe von acht Quadraten darstellt. Eine solche Formel gibt es jedoch nur für 2, 4 und 8 Summanden.
Als Anwendung des Vorigen bringen wir einige Spezialfälle des Dirichletschen Satzes über die Primzahlen in einer arithmetischen Progression:
Satz 53: Es gibt je unendlich viele Primzahlen der Formen
4 m + 1, 4m — 1, 3 m + 1, 3m — 1.
Sei Ρ ' = 2 · 3 . . . q das Produkt der Primzahlen bis q und q 3. Dann haben Ρ + 1 und Ρ 2 + 1 nur Primteiler > q. Wegen Ρ + 1 = — 1 ( 4 ) hat Ρ + 1 einen Primteiler = 3(4), weil ein Produkt von Zahlen = 1(4) selbst = 1(4) ist. Dagegen hat Ρ 2 + 1 nach obigem nur Primteiler = 1(4). Also gibt es zwischen q und (q\)2 + 2 je eine Primzahl = ± 1 ( 4 ) . Das gilt für jedes q (hier schon für 2), und deshalb gibt es unendlich viele Primzahlen in jeder der Progressionen 4 m i 1. Auch Ρ — 1 und 3 Ρ 2 + 1 haben nur Primteiler > q, und zwar hat Ρ — 1 einen Primteiler = — 1 ( 3 ) und,3P 2 + 1 nur Primteiler = 1(3), woraus die Behauptung für die beiden Progressionen 3m Ì 1 folgt. D a S m ^ 1 = 0(2), wenn m = l (2) ist, sind die Primzahlen der Form 3 m ¿ 1 für m > 1 von der Form 6m ^ 1. Unabhängig vom Vorigen zeigen wir schließlich
Zurückführung der quadratischen Kongruenzen 2
2
75 2
Satz 54: Für eine eigentliche Darstellung x + y = z ist notwendig eine Darstellung (79)
χ = α2 — δ 2 , y = 2αδ, ζ = α 2 + δ 2 .
Ferner ist die Gleichung χ4· + í/ 4 = ζ2 lei xy-j= 0 unlösbar und damit die Fermatgleichung für den Exponenten 4. Beweis: Da (x, y) = 1 sein soll, kann man χ = 1(2) ansetzen; dann ist y = 0(2), da es bei ζ2 = 0(2) keine eigentliche Darstellung gibt. Jetzt ist x2 = (z — y) (z + y) mit (z + y, ζ — y) = (ζ — y, 2 y) = 1, da ζ ungerade und (ζ, y) = 1 ist. Also sind ζ + y und ζ — y einzeln Quadrate: ζ + y = c2, ζ — y = d1. Hier sind c und d ungerade, also in der Form c = a + b, d = α — δ darstellbar. Das ergibt nacheinander 2 = α2 + δ2, y = 2 ab, χ = ± (α2 — b2). Den zweiten Teil des Satzes erhalten wir durch zweimalige Anwendung des ersten Teiles. Soll x* + y* — z2 mit kleinstem ζ sein, so muß bei χ2 = A2 — B2,y2 = 2 AB,ζ = A2 + Β2 das Β gerade sein, und mit (x, y) = 1 ist auch (.á, B) = 1 und dann Α = α2, Β = 2l·2. Das ergibt χ2 + (2i 2 ) 2 = α 4 und damit 2&2 = 2 CD, a2 = C2 + D2. Wieder ist (C, D) = 1 und dann G = c2, D = d2. Also ist α2 = c 4 + d\ Nun ist 2 = α 4 + (2 δ 2 ) 2 > α 4 ^ α, da mit y > 0 auch δ > 0 ist, d. h. z wäre nicht die kleinste Zahl, deren Quadrat die Summe zweier Biquadrate ist.
III. Quadratische Reste § 20. Zuriickliihrung der quadratischen Kongruenzen In diesem Abschnitt werden wir die Frage nach den n-ten Potenzresten mod m für den Fall η = 2, für die quadratischen Reste mod m, weiter behandeln: Welches sind die quadratischen Reste mod m ? Für welche m ist eine gegebene Zahl quadratischer Rest? Hierfür haben wir zwei wichtige Kriterien, das schon behandelte Eulersche Kriterium (Satz
Zurückführung der quadratischen Kongruenzen 2
2
75 2
Satz 54: Für eine eigentliche Darstellung x + y = z ist notwendig eine Darstellung (79)
χ = α2 — δ 2 , y = 2αδ, ζ = α 2 + δ 2 .
Ferner ist die Gleichung χ4· + í/ 4 = ζ2 lei xy-j= 0 unlösbar und damit die Fermatgleichung für den Exponenten 4. Beweis: Da (x, y) = 1 sein soll, kann man χ = 1(2) ansetzen; dann ist y = 0(2), da es bei ζ2 = 0(2) keine eigentliche Darstellung gibt. Jetzt ist x2 = (z — y) (z + y) mit (z + y, ζ — y) = (ζ — y, 2 y) = 1, da ζ ungerade und (ζ, y) = 1 ist. Also sind ζ + y und ζ — y einzeln Quadrate: ζ + y = c2, ζ — y = d1. Hier sind c und d ungerade, also in der Form c = a + b, d = α — δ darstellbar. Das ergibt nacheinander 2 = α2 + δ2, y = 2 ab, χ = ± (α2 — b2). Den zweiten Teil des Satzes erhalten wir durch zweimalige Anwendung des ersten Teiles. Soll x* + y* — z2 mit kleinstem ζ sein, so muß bei χ2 = A2 — B2,y2 = 2 AB,ζ = A2 + Β2 das Β gerade sein, und mit (x, y) = 1 ist auch (.á, B) = 1 und dann Α = α2, Β = 2l·2. Das ergibt χ2 + (2i 2 ) 2 = α 4 und damit 2&2 = 2 CD, a2 = C2 + D2. Wieder ist (C, D) = 1 und dann G = c2, D = d2. Also ist α2 = c 4 + d\ Nun ist 2 = α 4 + (2 δ 2 ) 2 > α 4 ^ α, da mit y > 0 auch δ > 0 ist, d. h. z wäre nicht die kleinste Zahl, deren Quadrat die Summe zweier Biquadrate ist.
III. Quadratische Reste § 20. Zuriickliihrung der quadratischen Kongruenzen In diesem Abschnitt werden wir die Frage nach den n-ten Potenzresten mod m für den Fall η = 2, für die quadratischen Reste mod m, weiter behandeln: Welches sind die quadratischen Reste mod m ? Für welche m ist eine gegebene Zahl quadratischer Rest? Hierfür haben wir zwei wichtige Kriterien, das schon behandelte Eulersche Kriterium (Satz
Quadratische Reste
76
46) und das Gaußsche Lemma (Satz 59), das uns eine überraschend einfache Antwort geben wird: Ob die Zahl r für eine Primzahl ρ quadratischer Rest ist, hängt nur ab von der Restklasse mod ir, in der die Primzahl ρ liegt (Satz 63). Eine so einfache Einteilung kommt bei höheren Potenzresten nicht vor. Sie liefert ferner das Reziprozitätsgesetz der quadratischen Reste (Satz 66), das eine Aussage über das gegenseitige quadratische Restverhalten zweier Primzahlen macht. Wir werden wieder alle Fragen auf den Fall des Primzahlmoduls zurückführen. Zunächst führen wir die allgemeine quadratische Kongruenz (80) ax2 + bx + c = 0 mod m, a > 0, auf den Fall x 2 ~ r mod p , p ~ > 2, zurück. Die Kongruenz (80) ist gleichwertig mit ia2x2
+ 1 und dann 2 quadratischer Rest mod p. Also ist die Ordnung 2 S + 1 von ρ —1 2 mod ρ ein Teiler von —g— ; d. h. es ist ρ = 1 mod 2 S+2 . So kommen für 2 32 + 1 von vornherein nur Primteiler der Form 128M + 1 in Frage, also Ρ = 257, 641, 7 6 9 , . . . , wovon 257 als Teiler von 2 32 + 1 ausscheidet und 641 sich gleich als Teiler erweist. Ohne Verfeinerung des Verfahrens wächst die Zahl der Proben mit s allerdings sehr stark. Sind ρ = 4w + 3, η > 0, und q = 2p + 1 Primzahlen, so ist 2P — 1 keine Primzahl, sondern durch q teilbar. Denn dann ist q = —1.(8), also 2 quadratischer Rest mod q und 2P = 1(g). Wegen q < 2? — 1 bei ρ > 3 ist q echter Teiler von 2P — 1. Beispiele: ρ = 11, 23, 83, 251. Wir bringen nun eine Anwendung auf die Theorie der biquadratischen Reste. Hier gilt zunächst Satz 70: Die Zahl — 4 ist für alle Primzahlen ρ = 4w + 1 und nur für diese Primzahlen liquadratischer Rest. Beweis: Für ρ = 3(4) ist — 4 nicht-quadratischer, also auch nicht-biquadratischer Rest. Bei ρ = 1(4) ist die Zahl — 1 nach Satz 46 biquadratischer Rest für ρ = 1 (8) und Nichtrest für ρ = 5(8). Dieselbe biquadratische Restverteilung gilt aber für die Zahl 4; denn 4 ist als Quadrat von 2 da biquadratischer Rest, wo 2 quadratischer Rest ist. Also ist das Produkt —1 · 4 sicher für ein ρ = 8 η + 1 biquadratischer Rest. Aber auch für ρ = 8n -f 5 ist — 4 biquadratischer Rest. Denn dann ist ind (— 1) = 2(4) und, weil ind
96
Quadratische Reste
2 = 1(2), ist auch ind 4 = 2(4), also ind — 4 = 0(4). Die Zahl — 4 ist also genau dann hiquadr atischer Rest mod ρ, wenn sie quadratischer Rest inod ρ ist. Von Gauß s t a m m t Satz 71: Die Zahl 2 ist biquadratischer Rest für die Primzahlen der Form x2 + 64 y2 und unter den Primzahlen = 1 mod 4 nur für diese... Nach § 18 ist für ρ = 3 (4) eine Zahl genau dann biquadratischer Rest, wenn sie quadratischer Rest ist. Beweis nach Dirichlet: Wenn ρ = 1(4) gilt, ist ρ als Summe zweier Q u a d r a t e darstellbar: ρ = a 2 + c 2 u n d etwa c = 26. D a n n ist (a + c)2 = 2ac mod ρ,
(110)
somit bei c = ja, j2 = — l ( p ) (~p~C) ~(a
(111)
2
ρ- ι = (2j)
4
= {Zac)
a
2
und gleich
2
=
mod p .
ρ-1 Nun ist α
*
ρ- ι p-_¿
= 1 mod p. Denn es ist α
2
=
j mod ρ,
ist nach dem Reziprozitätsgesetz wegen ρ = 1 (4) ; das ist aber gleich 1, da ρ = a 2 + c 2 , also ρ = e2
(a) ist. D a m i t gilt (112)
(a+-)^(2,-)^~modp.
Ferner ist 2 p = (a + c)2 + (a — c)2, =
mod (α + c) u n d damit
also 2 ρ = (a — c)2
Daraus
un
Reziprozitätsgesetz folgt andererseits a + e\ ρ j
=
/ ρ \ \a + e)
=
/2p» \ \a+e)
=
/ _2 \a + c,
d aus dem
Klassen quadratischer Formen
97
und dann aus dem 2. Ergänzungssatz (o + c)« —1 (113) . = Hier ist {a + cf — 1 = ρ — 1 +2ac = mit ergeben (112), (113) tzl Έζΐ l(lzl + 2 4 j 4 = (—l) 2 4 oder wegen — 1 = f mod ρ ρ- ι (114) 2 4 s f " mod p .
v ab)
4
+ αδ) . Da'
mod ρ
Aus dieser für alle ρ = α2 + 4 b2 gültigen Kongruenz folgt unser Satz. Denn nach dem Eulerschen Kriterium ist 2 biff-1 quadratischer Rest mod ρ genau dann, wenn 2 4 ^ 1 mod ρ ist, d. h. hier, wenn ab = 0(4), also b = 0C4Ì ist.
IV. Quadratische Formen § 27. Klassen quadratischer Formen Wir beschäftigen uns jetzt mit den Darstellungen einer Zahl durch quadratische Formen (115)
F (χ, y) = αχ2 + bxy + cy2 = (a, b, c),
wie man sie abkürzend durch ihre ganz-rationalen Koeffizienten a, l·, c bezeichnet. Einzelne Fragen dieser Art sind uns schon begegnet. Wie früher werden wir die Darstellung einer Zahl h durch die Form (α, b, c) als eigentlich bezeichnen, wenn in k — ax2 + bxy + cy2 die Zahlen χ und y zueinander teilerfremd sind. Es wird genügen, die Zahlen zu betrachten, die durch eine gegebene Form eigentlich darstellbar sind, da die andern aus diesen durch Multiplikation mit den Quadratzahlen hervorgehen, denn aus k = F (x, y) folgt t2k = F (ix, ty). Ebenfalls reicht es, primitive Formen 7
S c h o l z - S e h o e n e b e r g , Zahlentheorie
Klassen quadratischer Formen
97
und dann aus dem 2. Ergänzungssatz (o + c)« —1 (113) . = Hier ist {a + cf — 1 = ρ — 1 +2ac = mit ergeben (112), (113) tzl Έζΐ l(lzl + 2 4 j 4 = (—l) 2 4 oder wegen — 1 = f mod ρ ρ- ι (114) 2 4 s f " mod p .
v ab)
4
+ αδ) . Da'
mod ρ
Aus dieser für alle ρ = α2 + 4 b2 gültigen Kongruenz folgt unser Satz. Denn nach dem Eulerschen Kriterium ist 2 biff-1 quadratischer Rest mod ρ genau dann, wenn 2 4 ^ 1 mod ρ ist, d. h. hier, wenn ab = 0(4), also b = 0C4Ì ist.
IV. Quadratische Formen § 27. Klassen quadratischer Formen Wir beschäftigen uns jetzt mit den Darstellungen einer Zahl durch quadratische Formen (115)
F (χ, y) = αχ2 + bxy + cy2 = (a, b, c),
wie man sie abkürzend durch ihre ganz-rationalen Koeffizienten a, l·, c bezeichnet. Einzelne Fragen dieser Art sind uns schon begegnet. Wie früher werden wir die Darstellung einer Zahl h durch die Form (α, b, c) als eigentlich bezeichnen, wenn in k — ax2 + bxy + cy2 die Zahlen χ und y zueinander teilerfremd sind. Es wird genügen, die Zahlen zu betrachten, die durch eine gegebene Form eigentlich darstellbar sind, da die andern aus diesen durch Multiplikation mit den Quadratzahlen hervorgehen, denn aus k = F (x, y) folgt t2k = F (ix, ty). Ebenfalls reicht es, primitive Formen 7
S c h o l z - S e h o e n e b e r g , Zahlentheorie
Quadratische Formen
98
zu betrachten, d. h. Formen mit teilerfremden a,b,c; denn die durch (ta, tb, tc) darstellbaren Zahlen sind einfach die i-fachen der durch (a, b, c) darstellbaren. Die Frage nach den Darstellungen einer Zahl k durch F (x, y) ist äquivalent mit dieser Frage für eine ganze Klasse von quadratischen Formen. Unterwirft man nämlich die x, y einer lineàren Substitution (116)
xx = χ + v1 y y1 = s1x + wty
mit der Determinante r1w1—s1v1 = ± 1,
und ganzen Koeffizienten — einer unimodularen Substitution — , so ergibt jedes ganzzahlige Paar x, y ein ganzzahliges Paar a^, yt und, eben wegen der Voraussetzung r1w1 ~ s i v i = i 1) auch umgekehrt. Die Transformation (116) ist durch das Schema (117) bestimmt. Unterwirft man nun die x, y in F (χ, y) = (a,b,c) der Substitution (116), so wird F
+(2ar1v1+b(r1w1+
ìli) = (ari + Ksi + csi) χ2 + s1v1)+2cs1w1)xy+(avl+bv1w1+cwl)
y2.
Die Transformation (116) der x, y bewirkt demnach die Transformation der Form (a, b, c) in die Form (118) F1 (x, y) = a ^ 2 + \xy
+ c^2
= (alt
Die - Transformation der Koeffizienten ist gegeben durch mqi '
a
!
=
Wl + < + & f l S l + c s i ; Cl = a v * + = 2ar1 v1 + 6(rj w1 + Sj t^) + 2cs1 wv
cw ;
i
Jede Darstellung von k durch (a, b, c) ergibt mit (116) eine Darstellung von k durch ,(av blt cx), eine eigentliche Darstellung wieder eine eigentliche, und umgekehrt. Die beiden Formen stellen also dieselben Zahlen dar, und zwar gleich oft, und sind zugleich primitiv. Den Zusammenhang zwischen F und Fx bringen wir zum Ausdruck durch (120)
F, = Í1©. oder (alt bv cx) = (a, b, e)®..
Klassen quadratischer Formen
99
Man nennt den Ausdruck b2—4 ac — D, der sich als höchst bedeutsam herausstellen wird, die Disbriminante der quadratischen Form (et, h, c) und berechnet aus (119) die Gleichung (121) Di = l'—ia^ = (δ2 —4ae) (r^ —s^)2 = b2 — 4 a c . Die quadratischen Formen F und F®¡ haben dieselbe Discriminante. Ist F transformierbar in F± und F1 in F2, gelten also die Gleichungen Fi (®> y) = F (ri ® + «ι 2/> ® + % y), © = / r i Vï \ ρ ρ®, 1 1 M ' ' ' (z> 2/) = (»"2 x + v2y,s2x + w2 y),
(122)
so folgt Fi (x,y)
Msy.'.-'i*. =
(r2x + v2y) + v1 (s2x + w2y) ;
^
st(r2x+ = F ((ν2
v2 y) + w1 (s2 χ+
+ v^^x
+ (r^+^w2)
(s x r 2 + WjS2) χ + (sxv2 +
w2y)) y; wxw^y).
Man definiert als Produkt zweier „Matrizen" © j und © 2 Π ν 241 ;
r2+lS2> = yftSi wV1j W*"2wMj = ^ r2 ft + + W i s 2 i S j „2 +
j
WlW
und hat dann (123) in der Form F2 = F(®i©.>. Zieht man (122) heran, so erhält man (125) F2 = (f®.)©. Da die'Determinante von © x © 2 gleich dem Produkt der Determinanten von und © 2 , also wieder gleich i 1 ist, haben wir die Transformierkeit von F in F2 gezeigt. Weitere Anwendung von © 3 auf F2 führt zu ((F®i)®i)®· ; das ist nach (125) einerseits gleich i^©»®·)®« und andererseits gleich j?®i(©« ®.). Es gilt also für unsere Transformationen das Assoziativgesetz. 7·
100
Quadratische Formen
Die Form F1 = f © i läßt sich nun wieder in die Form F zurücktransformieren. Setzen wir nämlich©] -1 = ^ i W l ' V A, \ ®D '1/ wo + bei positiver Determinante r1w1 — SjVj und — bei negativer zu setzen ist, so ist nach (124) das Produkt © Γ 1 © ! = ©1 © Γ 1 = (01) = ® u n < ^ damit nach (125) die aus F1 transformierte Form Ff''=
F® 1 ©rl = F® =
F.
Die Transformierbarkeit quadratischer Formen ist also reflexiv, transitiv und symmetrisch. Sie liefert demnach eine Klasseneinteilung der Formen : Zwei Formen F1 und F2 gehören dann und nur dann derselben Klasse an, wenn F2 = Ff und © dabei eine ganzzahlige Matrix der Determinante i 1 ist. Auch die Transformierbarkeit zweier quadratischen Formen ineinander mittels einer „eigentlich unimodularen" Substitution, d. h. einer, deren Determinante gleich + 1 ist, liefert eine Klasseneinteilung, die Einteilung in die Klassen äquivalenter oder eigentlich äquivalenter Formen. Man schreibt F1r\)F2, wenn Fx und F2 eigentlich äquivalent sind, und F 2 , wenn sie uneigentlich äquivalent sind, d. h. mittels einer Substitution der Determinante — 1 auseinander hervorgehen. Es gilt: Wenn
F2 und F2~
F3 ist, dann ist
wenn F1 ~ F2 und F2 ro F1 ist, dann ist
F1roF3; ~
Fs.
Obwohl es für die Darstellungsaufgabe nicht nötig wäre, zwei nur uneigentlich äquivalente Formen in verschiedene Klassen zu tun, so gibt doch die Klasseneinteilung nach eigentlicher Äquivalenz gerade für die Darstellung zusammengesetzter Zahlen eine bessere Übersicht.
Man erhält so Paare zueinander uneigentlich äquivalenter Klassen von äquivalenten Formen und einzelne ,,zweiseitige" Klassen, deren Formen einander zugleich eigentlich und uneigentlich äquivalent sind.
Klassen quadratischer Formen
101
Wir werden in § 30 und § 31 zeigen, daß es zu jeder Diskriminante D nur eine endliche Anzahl von Formenklassen gibt, die man kurz die Klassenzahl h (D) von D nennt. Eine bequeme Herleitung unserer Ergebnisse liefert die Matrizenrechnung. Unter 9t sei ein rechteckiges Schema, eine Matrix, von k Zeilen und ¡ Spalten ganz-rationaler Zahlen verstanden. Zwei Matrizen seien gleich, wenn in ihnen an gleicher Stelle dieselben Zahlen stehen. Das Produkt zweier Matrizen werde erklärt für den Fall, daß die Anzahl der Spalten in der ersten Matrix ebenso groß ist wie die Anzahl der Zeilen in der zweiten Matrix, 2J(A, i) ige. und zwar soll die Zahl, die in der Produktmatrix in der μ-ten Zeile in der v-ten Spalte steht, dadurch gebildet werden, daß man die Zahlen der μ-ten Zeile der ersten Matrix nacheinander mit den in derselben Reihenfolge genommenen Zahlen der v-ten Spalte der zweiten Matrix multipliziert und dann addiert. Man überzeugt sich leicht, daß die Multiplikation von mehr als zwei Matrizen, falls überhaupt möglich, auch assoziativ ist. Versteht man unter 21' die zu 21 „transponierte" Matrix, deren Zeilen die Spalten von 91 und deren Spalten die Zeilen von 21 sind, so ist (2Í S3)' = S3' 9Γ. Die durch (124) definierte Multiplikation zweireihiger quadratischer Matrizen ist ein Sonderfall unserer neuen Definition. Ist 36 die Matrix [ x , also X' = (x, y), so wird (116) zu 3Ξ, w !9n h \ = (SjX. Ordnen wir der Form F = (α, δ, c) die Matrix 21 = Ί zu, so wird (115) zu 2 F(x,y) = 3E'2IX. Die Determinante von 21 ist 4ae —δ 2 = —D. Die Transformationsgleichungen nehmen jetzt folgende Gestalt an: 2Ft(x, y) = 2F@i = Χ ' © ί 2 ί © ^ . Der transformierten Form ist danach die Matrix ©12t©! zugeordnet, welche dieselbe Determinante wie 2Í besitzt. Weiter ist 2F©>®. = SE'i©!©a)'SC(©i©2) * = r@ 2 ©i21 ©!©„£. Die Matrizen © der Determinante ± 1 bilden wie auch die Matrizen der Determinante + 1 eine Gruppe. Wir bemerken noch (©iSa)" 1 = S " 1 © f 1 und (S«)- 1 = (©- 1 )" = ©-«. Diese Gruppen sind nicht abelsch; ζ. B. wird
(-ÎJ)(:?H-ÏÎMÎÎ)(-ÎÎH-ÎÎ)·
Quadratische Formen
102
§ 28. Diskriminanten Die Bedeutung der Diskriminante D = δ2 — 4ac der quadratischen Form (a, δ, c) hat sich schon im vorigen Paragraphen gezeigt: Alle Formen derselben Klasse haben dieselbe Diskriminante. Sie geht noch viel weiter. Als notwendige Bedingung für die eigentliche Darstellbarkeit der Zahl m durch die primitive Form (a, δ, c) werden wir in Erweiterung des in Satz 58 genannten Falls 6 = 0 erhalten, daß die Diskriminante D einem Quadrat mod m kongruent ist. Ist dabei m zu Ό teilerfremd, also D quadratischer Rest für m, so ist umgekehrt m wenigstens durch irgendeine Form der Diskriminante D darstellbar, wenn D überhaupt als Diskriminante vorkommt. Wir teilen darum alle quadratischen Formen zuerst nach ihrer Diskriminante ein. Diskriminantenzahlen sind die positiven und negativen Zahlen D = 0 oder = 1 mod 4. Die Diskriminanten haben diese Eigenschaft, und umgekehrt braucht man zu solchem D nur b = D mod 2 zu wählen, und man hat mit δ2 — D — 4c in (1, l, c) eine Form der Diskriminante D. Bei D = 0(4) ist δ = 0 und bei D = 1 (4) ist δ = 1 möglich. Die Form ( l , 0 b e i D = 0(4) und die Form (l, 1, ^ ^ bei D = 1 (4) heißen die Hauptformen zur Diskriminante D. Wichtige Aufschlüsse gibt uns bei α Φ 0 die Gleichung (126)
4aF(x,
y) = (2ax + lyf
— Dy2.
Dann haben bei D > 0 die Werte 4a F (1, 0) = 4α 2 und 4 a F (— δ, 2a) = — 4a 2 D verschiedene Vorzeichen. F (χ,y) nimm also lei D > 0 positive und negative Werte an. Solche Formen nennt man indefinit. Im Falle a = 0 ist D = δ 2 eine Quadratzahl. Quadratische Diskriminanten betrachten wir gesondert. Ist D < 0, so steht auf der rechten Seite von (126) eine Summe von Quadraten, die nur für χ = y — 0 verschwindet und sonst positiv ist. F(x,y) hat also hei D < 0 außer für χ = y = 0 stets das Vorzeichen von a. Solche Formen nennt man définit. Für D < 0 werden wir nur die positiv definiten
Diskriminanten
103
Formen betrachten, also α und damit auch c positiv annehmen. Das reicht, weil (— a, — δ, — c) immer — k darstellt, wenn k durch (α, δ, c) dargestellt wird. Die Behandlung der indefiniten Formen ist wesentlich schwieriger als die der definiten Formen. Im definiten Fall folgt aus (126), daß k = F(x, y) nur endlich viele Lösungen besitzt, was für indefinite Formen nicht mehr zutrifft. Bei quadratischer Diskriminante D = q2 und α φ 0 wird (126) zu (127)
4 a F (χ, y) = (2α χ + (δ - q) y) (2α χ + (δ + q) y).
Wegen δ2 — 4αc = q2 ist zunächst i = }(2), und damit ist α F (χ, y) = {ax +
1
^
yj [αχ + - γ
1
y
eine Zerlegung von aF (x, y) in ganzzahlige Linearformen. Da δ— ο δ+ o . „. / ft — q\ überdies a —g g— ist, so folgt aus Ια, - - γ J = ί und a = ta' die Teilbarkeit a' -.
F(x,y)=(Tx
¡a
. Es ist also
ft — —qq \\ /a / a ft + ^ y ) ( - , x +
ft
6 ++ q \ J y)
eine Zerlegung von F (χ, y) in ganzzahlige Linearfaktoren. Wegen ixy + cy2 = (hx + cy) y folgt allgemein: Wenn die Diskriminante einer quadratischen Form ein Quadrat — auch Null — ist, zerfällt die Form in Linearfaktoren. Umgekehrt ist die Diskriminante von (kx + ly) (mx + ny) gleich (Jen — Im)2, also ein Quadrat. Bei quadratischen Diskriminanten entsteht eine lineare Darstellungsaufgabe. Wir schließen sie im folgenden von der Betrachtung aus. Von den übrigen sind am wichtigsten die Fundamentaldiskriminanten·, das sind die Diskriminanten, die keine echte Zerlegung D — dq2 besitzen, bei der d wieder Diskriminante ist. Für D = 1(4) und D = dq2 ist wegen q"- = 1 (4) auch 0 darstellt, dann gibt es eine zu F äquivalente Form (k, l, m) mit — k < l k. Ist die Form F einer Form (k, l, m) äquivalent, so ist k durch F darstellbar. Ist nämlich k = a x\ + b x1 y1 + c y{ mit (χλ, y¡) = 1, so gibt es ein Zahlenpaar v1; w1 mit x1w1 — y1 v1 = + 1.
( i/i i / SC V
\
bewirkt dann eine Transformation von (a, b, c) in eine äquivalente Form, deren erster Koeffizient nach (119) die Zahl k ist: Í1® = (k, V, m'). Die allgemeine Lösung von x1w — y1 ν = 1 ist ν = v1 + a^/, w = w1 + mit beliebigem t. w
Darstellbarkeit
105
Durch die Substitutionen (128) wird F nach (119) in die äquivalenten Formen F®W) = (k, V, m')W) = (k, V + 2kt, m") transformiert. Bezeichnet man zwei äquivalente Formen (a, b, c) und (α, b', c') als parallel, wenn V = b mod 2 α, so geht aus einer Darstellung vonk durchweine Schar paralleler, zu F äquivalenter Formen hervor. Genau eine Form dieser Schar genügt der Ungleichung — k a3 > · ; · eine Folge abnehmender Zahlen, die außerdem positiv sind. Die Kette der Fv bricht also mit einem Fn ab, eben dann, wenn a n f~ c»! d. h. wenn F„ reduziert ist, denn — «„ < δ η ( a - | 6 | ) | a ¡ y | + cy2^(a-\b\ + c) y2. Entsprechend ist für | y | > | χ \ ax2 + bxy + cy2 > (α — |δ| + c) x2. Daraus folgt für \ xy\>l (134) ax2 + bxy + cy2 > α — |δ| + c. Es sind also a, c, a — [ δ | + e die kleinsten durch (α, δ, c) darstellbaren Zahlen.
110
Quadratische Formen
Sei nun (a, i, c)r\j (α', V, c') und |δ|5Ϊ c, |δ'|ΐΞ a' íS c'. Da durch F und F' dieselben Zahlen in gleicher Häufigkeit dargestellt werden, ist a' = a, denn das ist nach (133) und (134) die kleinste positive durch F und F' darstellbare Zahl. Ist c > α, so ist c die nächstgrößere durch F, F' darstellbare Zahl. F = a hat in diesem Fall zwei Lösungen, also auch F' = a. Daraus folgt c' > a' = a und damit c' = c und weiter | b'\ — \ δ | Ist c = a und |δ|< a, so ist c < a — |δ| + e und c durch F, F' auf genau vier Arten darstellbar; es ist also wiedere' = c und \ b' \ = |6|. Und schließlich ist der Fall \ b\=a = e dadurch gekennzeichnet, daß a durch F auf genau sechs verschiedene Arten dargestellt werden kann. Das trifft auch für F' zu, so daß sich die beiden Formen höchstens im Vorzeichen des mittleren Koeffizienten unterscheiden. Jetzt ist noch zu untersuchen, wann (α, δ, c) ru (a, — b,c) ist. Für e = a ist (α, b, a) = (δ, — δ, α)β. Sei nun c > a. xv\ y W j ist, so besteht die Gleichung α = αχ2 + bxy + cy2, die bei c > a nur die
(
Lösungen χ = ^ 1, y = 0 hat, d. h. es ist © = i
^q ^ j .
Dann ist (α,—b,c) parallel zu (a, b, c),also a|6,wasbei|6| ^ α nur für | δ | = a möglich ist. Hier ist (a, a, c) = (α, — a, c) Φ Ο). Damit ist Satz 77 bewiesen. Die Frage nach der Darstellbarkeit von h durch F = (a, δ, c) ist jetzt so zu beantworten: Reduziert man F und die Formen (129) und führt die Reduktion einer dieser Formen auf die ausgezeichnete Form der Klasse von F , so ist k durch F darstellbar. Die Anzahl der Darstellungen wird, wie wir gleich zeigen werden, das Sechsfache, Vierfache oder Doppelte der Anzahl der zu F äquivalenten Formen (129), je nachdem Δ = 3, 4 oder > 4 ist. Das ist nach unseren Ausführungen über die automorphen Substitutionen bewiesen mit Satz 78: Die Anzahl der automorphen Substitutionen für eine definite quadratische Form F der Diskriminante D ist gleich 6, 4 oder 2, je nachdem D — — 3, — 4 oder < — 4 ist. Beweis: Jede Lösung von k = F(x, y) führt zu genau einer Substitution, die F in eine Form F' der Gestalt (129)
Reduktion der definiteli Formen
111
überführt und umgekehrt. Ist insbesondere F = (a, b, c) reduziert und wird k = a gesetzt, wird also nach den Lösungen von a = F gefragt, so ist F' = (a, V, e') wegen — a < V ^ α ^ e' auch reduziert. (a j S c' gilt, weil α die kleinste positive, durch F, F' darstellbare Zahl ist.) Dann folgt aus Satz 77 schon c' = c und, wenn c > a ist, wegen — a < b noch V = b. F ü r c > a ist demnach die Anzahl der automorphen Substitutionen für F gleich der Anzahl der Lösungen von a = F , also gleich 2. F ü r c = a und | 6 ] < a gibt es 4 Lösungen von a = F , nämlich ( ± 1 , 0 ) und ( 0 , ^ 1 ) mit den Substitutionen ± ( i ? ) L ' / η ι\ ' j QI , von denen die zweitei 1 = (a,b,a) in F' = (α,
und ± 1
— b, a) überführt, stitution ist. Dann D = — 4. Zu F = / Substitutionen I
also nur für b = 0 eine automorphe Subist bei primitivem F notwendig a = c — 1, χ2 + y2 gehören die vier automorphen 0 l\a J qI , α = 1, 2, 3, 4.
F ü r a = c = |δ| gibt es nur die F = a>2 + xy + y2 mit D = — sechs Lösungen ± (1, 0), ± ( 0 , 1 ) gehörigen Substitutionen sind
primitive reduzierte F o r m 3. Hier h a t F = 1 die und ^ (1, — 1). Die zu± ^q > i (l l)
i f
I Ì Ì . Zu F = χ2 + χ y -f- y2 gehören die sechs autoV— -LU/ /0—1\" morphen Substitutionen L - J , α = 1, 2, . . . , 6 . Versteht man unter einer reduzierten Form eine Form (α, l·, c) mit — a < δ gj a Si c, so gilt noch Satz 75, und (a, a, c) ~ (α, — α, c) in Satz 77 entfällt als Äquivalenzfall reduzierter Formen. Die Klassenzahl h (D) läßt sich durch Aufstellung aller ausgezeichneten Formen leicht bestimmen: Zuerst ordne man nach Β = 161. E s kommt nur B^A mod 2 mit 3 Β2 Δ in Frage und hier das Gleichheitszeichen nur für Zl = 3, da es nur die Form ( Β , Β, Β) zuläßt. Also reicht 5 = 1 für ungerades Δ ^ 2 7 ; Β = 1 , 3 für zi = 31 bis 75; Β = 1, 3, 5 für Zi = 79 bis 1 4 7 ; . . . Β = 0 für Δ = 4, 8 , 1 2 ; Β = 0, 2 für gerades
112
Quadratische Formen
Δ = 16 bis 48 usw. N u n ist Δ + Β2 = 4w = 4ac beliebig so zu zerlegen, d a ß (131) gilt. So erhält m a n alle ausgezeichneten F o r m e n (a, b, c) mit b = Β f ü r (132), δ = ± 2? sonst. Beispiele: D = — 3 D = — 4 Z) = — 2 3 D = — 39 Z> = — 1 5 6 J = — 1 6 3 (1,1,1)
(1,0,1)
(1,1,6) (1,1,10) (1,0,39) ( 2 , ± 1 , 3 ) ( 2 , ± 1 , 5 ) (3,0,13) l1·1»41) (3, 3, 4) (5, ± 2, 8) Ä= 1 Ä= 1 Ä= 3 Ä= 4 Ä= 4 Ä= 1 sind die Klassenzahlen dieser Diskriminanten. Die Abzählung der Klassen kann dabei ohne Aufstellung der reduzierten Formen durch Abzählung der zulässigen Teilungen η = ac erfolgen, nach Β summiert: h — ΣΗ(Β, η), Η die Anzahl der ausgezeichneten Formen (α, b, c) mit |6| = Bund ac = «, d.i. bei fundamentalem D < — 4 für Β = 0 die halbe Anzahl der Teiler von η und für Β > 0 der Überschuß an Teilern > Β über die < B. Beispiel: D = — 167. h = H(l, 42) + H(3, 44) + 5 ( 5 , 48) + H (7,54) = 7 + 2 + 2 + 0 = 11. D = —168. h = If (0, 42) + H(2, 43) + ff (4, 46) + H(6, 61) = 4 + 0 + 0 + 0 = 4. (Die Differenz aufeinanderfolgender η liegt zwischen den zugehörigen B.)
§ 81. Reduktion der indefiniten Formen "Wir wenden u n s jetzt der schwierigeren R e d u k t i o n der indefiniten F o r m e n F = (a, b, c) zu. Hier ist D (a, b, c) = b2 — 4 a c > 0, also D = 5 , 8 , 1 2 , 1 3 , 1 7 , 2 0 , 2 1 , . . . Man b e a c h t e , daß quadratische D, also auch a = 0 u n d c = 0 ausgeschlossen sind. Eine indefinite F o r m heißt reduziert, wenn f ü r ihre Koeffizienten die Ungleichungen (135) 0 < 6 u n d / - Min ( | 2 a | , | 2 e | ) ^ b D. Die Anzahl der reduzierten F o r m e n zur Diskriminante D ist endlich; denn mit 0 < b < / wird b2 (/ — l ) 2 < D, also ac < 0 u n d | 4 a e | < D.
Reduktion der indefiniten Formen
113
Die Form F heiße halbreduziert, wenn sie die schwächere Forderung (136) / —|2α|^δ — f. Ist nämlich Fk halbreduziert, aber noch bk fS — /, so ist b\ f > D = bl — 4 a k ck, also a c i k > 0 u n d daher D = b\ — | iakck \. Aus (136), also aus 12a„ \ ^f — bk und | 2ck \ = \ 2ak+1 \ ^ / — i ^ u 8
S c h o l z - S c h o en e b e r g , Zahlentheorie
Quadratische Formen
114
ergibt sich die Ungleichungsfolge H
(137)
und damit bk+1 > bk + /. Ist dann auch noch bk+1 — /, so kann man den Schluß wiederholen und erhält so nach endlich vielen Schritten ein bn > — /. Wir zeigen weiter: Jedes auf Fn folgende Glied ist reduziert. Ist nämlich f ~\2ak\^bk 0 . (Die Ungloichungsfolge / — | 2 ak+1 | bk+1 < / gilt, weil Fk+1 halbreduziert ist, so daß dann Fk+1 reduziert ist.) Wegen — f < bk < / ist < D = b\ — 4 ak ck, also ak ek < 0 und D = b\ + \ 4ak ck |. Hieraus folgt D
(138)
|2c*|
~ Η
/2 —Η
= / +
da I 2ak \ ^ f ~ b k ist. Wegen \2ck \ = \ 2ak+11 ^ / — bk+1 folgt aus (138) (139,) bk+1^f-\2ck\ > - b k . Bei (ak+1, (1392)
bk+1,
ck+J) = (ak, bk, ck)^'^enck)
gilt
bk+1 = — bk + 11 2ek \, und zwar mit t > 0,
wie aus (139j) folgt. Nun ist D = &| +1 + 14a K+1 ck+1 |, wie aus —/< —bk 0. Denn diese Ungleichung gilt nach (1392) sicher für bk < 12 ek | ; ist aber bk^i\2ck\, soist nach (139J) jetzt bk+, ^ f - \ 2 c k \ ^ f - b k > 0 . Sodann ist [ 2 c i + 1 | 2 g / — h k+1 . Denn dies gilt wegen \2ak\s^f — bk nach (139 3 ) sicher für t = 1 und auch für b k i ^ h + i , wegen c w = ) = 0 gilt es auch für bk+1 =/ — 1. Bleibt noch der Fall t i g 2, bk< bk+lf¡ f — 2\ dann ist unter Benutzung von (1392) \4:ck\^t\2ck\
=
bk+bk+1
I 2c t 11 2ck+11 = | 4ak+1 ck+11 = Ό— δ| +1 ·
Weiter ist b
k + 1
f ^ ( f - 2 ) f < ( f - l Y < D ,
also D — &|+1 > bk+1 (/ — bk+1) und damit schließlich I 2ct+1 I > / — W Da die Bedingungen / — | 2 ak | hk < / für alle k > 1 zutreffen, ergibt vollständige Induktion unsere Behauptung, und dann folgt schon Satz 80. Wir beweisen jetzt den zweiten Teil von Satz 79. Da die Anzahl der reduzierten Formen endlich ist, gibt es in der Kette ( F „ ) ein erstes Element, etwa Fm, für das F m = Fm+Jt ist mit π > 0. Die Kette ist also periodisch. Fm ist reduziert, weil es in der Kette immer wieder auftritt, und zwar ist es das erste reduzierte Element der Kette. Denn entweder ist m = 1, und die Periode beginnt mit F r , oder Fm_1 (m, 2) ist das letzte Glied, das nicht wieder auftritt. Dann ist Fm rechter Nachbar von Fm-X und wegen Fm = Fm+„ auch von Fm+„-v und in ( a m _ l 5 bm^ c m T l ) AJ {flm, bm,Cm) und ( - I I bm+ji-Iicm+ji-ι) ^ ( a m) imi cm) ist i m = — im-1 mod 12 c m _! I, bm = — im+n-i mod 12 cm+ „^ | ; ferner ist am = c m -i, am = Also ist Cm-1 = Cm+π-n Hier ist δ,^-, φ
-- bm+π-j mod I 2am \. da sonst Fm^ = Fm+nwäre.
Fm+n-i ist reduziert, also ist / — | 2 8*
|
bm+Jt-1
116
Quadratische Formen
Es kann nicht gleichzeitig / — | 2c m _j | rgj ò m _, < / sein, da = c m + j r - i und — φ O und teilbar durch 2a m =2c m _ 1 ist. F m _ 1 ist also nicht reduziert, und Satz 79 ist vollständig bewiesen. Man kann diesen Sachverhalt auch so ausdrücken: Die Folge Fv endigt in einer geschlossenen Kette. Die Perioden der linearen Anordnung entsprechen dann einem Umlauf in der geschlossenen Kette. Die Aufstellung der Perioden zeigen wir für D = 89. /=10. Wir gehen von der reduzierten Form (1, 9, — 2) aus und erhalten durch sukzessiven Übergang zur rechten Nachbarform (130), welche die Bedingung (136) erfüllt, die Kette (1, 9, — 2 ) r\j (—2, 7,5) rv» (5, 3, — 4 ) r o (—4, 5, 4) o j (4,3, — 5 ) r j (—5, 7, 2) ru (2, 9, — 1 ) n j · • • . Es folgen noch sieben Formen, deren äußere Koeffizienten aus diesen durch Umkehrung der Vorzeichen entstehen. Da nur b — 9, 7, 5, 3,1 sein kann und alle (135) genügenden Zerlegungen D — δ2 = |4ae| schon in der obigen Kette vorkommen, ist die Klassenzahi h = 1. Als weiteres Beispiel behandeln wir D = 148 mit den drei Perioden (1, 12, — 1) A j (— 1, 12, 1 ) , (4, 10, — 3 ) o j ( — 3 , 8, 7)ru(7, 6, — 4)r\j(— 4, 10, 3) r v ( 3 , 8, — 7) n j ( - 7 , 6, 4), (3, 10, _ 4 ) P J ( — 4 , 6, 7) r\j(7, 8, — 3 ) r u ( — 3 , 10, 4)ru(4, 6, — 7 ) n j ( — 7 , 8, 3 ) . Hier ist / = 13. Nachdem b = 12 erledigt ist, kommt 6 = 10 in Frage. Primitiv und reduziert sind die Formen ( ± 4, 10, ^p 3), 3, 10, 4), welche zur zweiten und dritten Periode führen. Die vier reduzierten Formen mit 6 = 8,6 sind schon erfaßt, solche mit b = 4,2 gibt es nicht. Die zweite Hälfte der zweiten und dritten Periode unterscheidet sich von ihrer ersten Hälfte durch das Vorzeichen der äußeren Koeffizienten. Die Formen der dritten Periode sind den Formen der zweiten entgegengesetzt, ihnen also uneigentlich äquivalent. Aus dem gleich zu beweisenden Satz folgt h = 3 für D = 148. Satz 81 folgt nun aus dem schärferen Satz von Mertens:
Reduktion der indefiniten Formen
117
Satz 82: Sind F und F' reduziert und einander äquivalent, F' = F®, so ist eine der Substitutionen i ©i1 das Produkt von aujeinanderfolgenden Ν achbar substiiutionen (g,·) = der von F oder F' ausgehenden Kette. ^ ^ Beweis: Sei F =F^ = (%, ilt Cj), F' = (α', V, c') und © =
±
ferner sei F2 = F^
= (a2, b2, c 2 ) der
Kettennachbar von F1 ; dann ist (140)
e =m =
und F' = F% . Wir werden zeigen, daß bei passender Wahl zwischen ^ © und φ © _ 1 die von ausgehenden Nachbarsubstitutionen SR = 9ί (ίχ), 9î(? 2 ), . . . in (140) rechts einen abbrechenden Divisionsalgorithmus erzeugen. Wir dürfen dabei alt a' > 0, also Cj, c' < 0 annehmen; denn die andern Vorzeichen Verteilungen kommen bei den Nachbarformen von F1 und F' vor, und ein Nachbaraustausch macht für Satz 82 nichts aus. Bei dieser Vorzeichenverteilung ist r s ν w Φ 0. Denn F' ist zu F wegen αχ, α' > 0 nicht benachbart, also ist © Φ i
(l
' Es ist auch F' zu F nicht parallel, da sonst
© = zt (o l )
w
äre, was für reduzierte Formen nun bei
< 7 = 0 möglich ist; aus demselben Grund ist © Φ φ
·
Damit sind alle © mit rsvw = 0 ausgeschlossen. Außerdem gilt r » > 0. Denn aus der Transformationsformel (119) folgt unter Verwendung von r w — s ν = 1 (141) α' ν w — c' r s = a1r ν — «,s«i, Wieder aus r w — s ν = 1 folgt bei r svw Φ 0 die Ungleichung (r w) (s ν) > 0. Daraus folgt wegen α ^ , a'c' < 0, daß a'vw und — c'rs dasselbe Vorzeichen haben und ebenso atrv und — c ^ w . Wegen (141) haben also auch a'vw und atrv dasselbe Vorzeichen, und wegen av a' > 0 ist dann (rv) (vw) > 0. Es ist also rw > 0 und wegen rw — sv = 1, sî)4= 0 auch sv > 0.
118
Quadratische Formen
Unter
den
± @±i = ± ζ ζ ) , ±
J) hat
dann
genau eine lauter positive Zahlen. Trifft dies für © zu, so behaupten wir, daß © oder — © das geforderte Produkt ist. In (140) sei zunächsts' = 0; dann ist % = ^ ^ f j f ^ j , und zwar gilt das obere Vorzeichen, weil © lauter positive Zahlen hat. Da F' = FZ zu F2 benachbart und als reduzierte Form der Kettennachbar F3 zu Ft ist, muß % = — S i f e ) s e i n - Dann ist © = — «R(52)ïïî(î2). Für s ' ^ 0 ist © = - ®(ϊι) W
mit
= (J y
und F' = Γ®'.
Hier hat F3 ein a3 > 0, kann also in unseren Überlegungen an die Stelle von F} gesetzt werden, wenn zugleich ©' an die Stelle von S tritt. Gilt nun, wie wir unten zeigen werden, (142) 0 0 und wegen vf > 0 und r V > 0 auch r' > 0. Dann gilt bei s' > 0 0 < r' < r, 0 < s' < s, 0 < v' < v, 0 < w' < w . Die Elemente von ©' sind also auch positiv, es folgt das Abbrechen des Algorithmus (140) und damit für © eine Darstellung © = ( _ l ) » {R(4l) · . - gft( i 2 e ). Jetzt ist noch (142) zu zeigen. Zunächst ist unmöglich; sonst wäre c' («j + b1 —|cx|) w2 0 nach (135) und (138). Ebenso ist s' r unmöglich; sonst wäre a' = c2r2 — b2rs' — l ^ l s ' 2 < (c2 — b2 — | c'rs', und diese Ungleichung ist mit s' < 0, w/ fS 0 nicht verträglich. Damit ist Satz 82 bewiesen. Das Vorzeichen in ^ @ ist wegen i1® = j^-© ohneEinfluß auf die Transformation vonF. Ist π wieder die Länge der primitiven Periode der von η F ausgehenden Kette und bildet man das Produkt J 7 9î(ï>) t=l = 31, so ist 2™ = F, also 3Í eine für F automorphe Substitution. Mit 3t ist auch ± 3t a bei beliebigen ganzen « eine automorphe Substitution, und das sind alle automorphen Substitutionen. Ist nämlich F® = F , so ist i S3 i 1 = Π (q¡) ein Produkt aufeinanderfolgender Nachbarsubstitutionen, wie Satz 82 für F' = F aussagt, und ein 9í(?¡) - Produkt führt erst dann wieder zu π
F, wenn es aus vollen Produkten ] J besteht: ± 93 ± a = 21" ί=1 oder ± 93 = 5ί± α . Die Potenzen 3t a ergeben lauter verschiedene Substitutionen. Es ist nämlich f ü r η Ϊ ϊ 1 m( q i ) · · . m n ) = ( sJ - 1 l n ) m i t sr ; Ζ Ι " - 1 f Ζ rssn \ n - l "η/ n —"n-lHn n-2 für η S; 2, wenn r 0 = 0, s 0 = 1, = — 1, Sj = gesetzt wird. Nun ist ft < 0; das folgt aus (119), da und F 2 reduziert sind und «χ > 0 ist. Entsprechend folgt ç 2 i + ] < 0, q2i > 0 . Damit ist r¡, s, < 0 für i s 1, 2 (4) und > 0 für i = 0, 3 (4), i > 0 und deswegen für η ^ 2 (143)
I r « I = I r n - i In I + I r»-« I I s» I = I s»-i g» I + I s „ - 2 1 . Die I rn I, | sn | bilden demnach eine monoton wachsende Folge für 31(3!) hat r 0 = 0. Daher sind die Produkte V Π 9ΐ(? tn, un+1 > Mn gültig für η 0, da ^ 2g 2 ist, und daraus wieder, daß S^ gleich der Matrix 21 aus Satz 83 ist, wenn diese so gewählt wird, daß die zu ihr gehörigen Lösungen t, u > 0 sind. Das ist möglich, weil t, — m zu 2l _ 1 gehört, wenn t, u zu 91 gehört. Also gilt: Satz 84: Die Lösungen ¿1er Pellschen Gleichung vermitteln durch (147) die eigentlich automorphen Substitutionen aller quadratischen Formen der Diskriminante D. Ihre Anzahl ist für D > 0 unendlich, und es gehen die positiven Lösungen aus ihrer kleinsten positiven durch (149) hervor. Ohne Beweis teilen wir mit: Die Pellsche Gleichung Ρ — Ώυ?= 4 ist für jedes D > 0, φ ga lösbar. Betrachten wir noch die zweiseitigen Formenklassen, deren Formen einander also zugleich eigentlich und uneigentlich äquivalent sind! Wir zeigen, daß jede solche Formenklasse eine zweiseitige Form enthält, d. h. eine Form, die zu ihrer entgegengesetzten Form parallel ist oder, was damit gleichwertig ist, die Gestalt ( k , k l , m ) besitzt. Sei nun (α, δ, creine Form
unserer zweiseitigen
Klasse
und © =
mit
r w — sv — — 1 eine uneigentlich automorphe Substitution yy ^Λ s—r) ' un(* es folgen die auch hinreichenden Bedingungen (150)
w = — r,
av = ir
+ es
(r2 + s
= 1).
Quadratische Formen
124
Wir haben jetzt eine unimodulare Substitution £ so zu bestimmen, daß (a, b, c)^ eine automorphe Substitution U =
j j besitzt. Wegen (α, b, e)® = (a, b, c) muß dann
S - ® ^ = U sein oder mit % = 1
o")
Es ist also
CDGhSÛ-i)·
zu lösen, was wegen r2 + s ν = 1 möglich ist. ^ . j ist dann zu einer unimodularen Substitution % zu ergänzen. Mit diesem £ ist die Zahl unten rechts in der Matrix in (151) ganz rechts notwendig gleich —1, da rw —sv = —1 ist, und es ist S r 1 © ï = U mit einem bestimmten U und damit (a, b, c)1 zweiseitig. Wegen (a, b, e) x = (k, kl, m) ist k2Ρ — 4 k m = D, also k\D: Die Formen einer zweiseitige^ Klasse stellen Diskriminantenteiler dar. Stellt umgekehrt (a, b, c) einen Diskriminantenteiler k dar, so ist (a,b, c)ru (k,b', c'), und wegen b'2 —4kc' = D gilt k\b'2. Ist D eine Fundamentaldiskriminante, so folgt aus k\b'2 bei k = u oder = 2u mit ungeradem u schon k\V. Zahlen k = 0(4) werden nicht dargestellt. Also Satz 85: Die Formen der zweiseitigen Klassen und bei einer Fundamentaldiskriminante auch nur diese stellen Diskriminantenteiler dar. Wir stellen noch die Frage: Wann ist ( a , b , c ( — a , —h, —c)? Dann ist statt (146) (153)
(rì\(2a δ \ / - 2 α v\ \vw)\b2cj \—b—2c)\ s -rj mit r w — ν s = — l z u lösen. Das führt auf das Gleichungssystem (154) r = \ (t — bu), s = au, υ = — cu, w = £ (t + bu) s — , mit ganzem u = — , t = w + r und
Automorphe Substitutionen. Pellsche Gleichung (155)
4 (rw—sv)
2
2
= t — Du
=
125
—4.
Umgekehrt führt eine Lösung t, u von (155) durch (154) zu — (τ ν \ ~ einer Lösung © = I — I von (a, b, c)® = (— α, — b, —c). Wegen (a, b, c)®a = (a, b, c) transformieren die 6 " bei geradem η die Form (α, b, c) in sich und bei ungeradem η in (— a, — b, — c). Die zugehörigen Werte tn, un erfüllen für gerades η die Gleichung (148) und für ungerades η die Gleichung (155). Wegen © — © _ 1 = tiS ist g n _ ©»-2 = g n - 1 (© _ (g-1) = ©»-17 f und es gelten die Rekursionsformeln (156)
hü ~ h 'iL-1 ^, - 2 Un =J>i Wn-l _+ un-'¿ ι 2,. wenn t0 = 2, ug = O gesetzt wird. Über von (155) ist noch nichts ausgesagt. tv ux die kleinste positive Lösung von (155), durch (156) alle positiven Lösungen von (148)
gültig für η ^ die Lösbarkeit Satz 86: Ist so erhält man und (155). Wir setzen (a,b,c) als reduziert voraus. Ist um 3ij die nach (154) zu
gehörige Matrix und 9Î = ^
so
ist
(α, b, c)S>3î = (—a, h, — c). Hier ist eine der Matrizen ± 1,3Î ein 9í( ?i )-Produkt, da ± S^ 31 = ± (- 1 ) und _ _ \si — »1 / | w 1 | > | r 1 | ist, und zwar dasjenige 9}(