248 16 1MB
German Pages 274 Year 2016
Daniel Alscher Theorien der reellen Zahlen und Interpretierbarkeit
Logos
Studien zur Logik, Sprachphilosophie und Metaphysik Herausgegeben von/Edited by Volker Halbach, Alexander Hieke, Hannes Leitgeb, Holger Sturm
Band/Volume 25
Daniel Alscher
Theorien der reellen Zahlen und Interpretierbarkeit
ISBN 978-3-11-045856-5 e-ISBN (PDF) 978-3-11-045919-7 e-ISBN (EPUB) 978-3-11-045861-9 ISSN 2198-2201 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2016 Walter de Gruyter GmbH, Berlin/Boston Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com
Vorwort Der vorliegenden Schrift liegt das Manuskript zugrunde, das ich als Doktorand am Lehrstuhl für Logik und Sprachphilosophie des Instituts für Philosophie der Humboldt-Universität zu Berlin erstellt habe. Es wurde am 8. Mai 2015 von der Philosophischen Fakultät I unter dem Dekanat von Prof. Michael Seadle als Dissertation angenommen. Mein besonderer Dank gilt meinem Doktorvater Herrn Prof. Dr. Karl-Georg Niebergall für die Betreuung und Begutachtung dieser Arbeit. Seine wertvollen Anregungen, engagierte Unterstützung und konstruktive Kritik haben wesentlich zum Entstehen und Fertigstellen der Dissertation beigetragen. Den Teilnehmern seines Kolloquiums bin ich dankbar für die vielen hilfreichen Diskussionen zentraler Bestandteile der Arbeit. Außerdem möchte ich mich bei Herrn Prof. Dr. Godehard Link und Herrn Prof. Dr. Dr. Christian Tapp für ihre Gutachten und ihre Rückmeldungen zu der Arbeit bedanken. Ich danke der Studienstiftung des deutschen Volkes für die finanzielle und ideelle Förderung sowie das damit verbundene Vertrauen in meine Arbeit. Meinen Geschwistern und meinen Freunden danke ich für den persönlichen Rückhalt, den sie mir während der Arbeit an der Dissertation gegeben haben. Der größte Dank gebührt meinen Eltern Dr. Arnold und Ursula Alscher, die mich stets ermutigt haben und mir mit Rat und Tat zur Seite standen.
Inhalt Einleitung | 1 1 1.1 1.2 1.3 1.4 1.4.1 1.4.2 1.4.3 1.5 1.6 1.7 1.7.1 1.7.2 1.7.3 1.8
Interpretierbarkeit | 15 Relative Interpretierbarkeit | 15 Interpretationen von Konstanten- und Funktionssymbolen | 16 Interpretierbarkeit mehrsortiger Theorien | 22 Mehrdimensionale Interpretierbarkeit | 26 Elimination der Mehrdimensionalität durch kartesische Produkte | 29 Elimination der Mehrdimensionalität durch eine Paarfunktion | 33 Modelltheoretische Charakterisierung | 38 Identitätsmodifizierende Interpretierbarkeit | 41 Mehrdimensionale, identitätsmodifizierende Interpretierbarkeit | 43 Interpretierbarkeit mit Parametern | 45 Elimination der Parameter durch Skolemfunktionen | 48 Elimination der Parameter durch Konstanten | 50 Elimination der Parameter durch mehrdimensionale Interpretationen | 54 Interpretierbarkeit von Theorien mit Modellen endlicher Mächtigkeit | 60
2 2.1 2.2 2.3
Die Theorie der reell abgeschlossenen Körper 𝑅𝐶𝐹 | 63 Die Theorie 𝑅𝐶𝐹 | 63 Alternative Axiomatisierungen von 𝑅𝐶𝐹 | 68 Definierbarkeit in 𝑅𝐶𝐹 | 72
3 3.1 3.2 3.3 3.4 3.5
Negative Resultate über Interpretierbarkeit in 𝑅𝐶𝐹 | 80 Theorien mit einer Paarfunktion | 80 Theorien atomarer Boole’scher Algebren | 83 Theorien mit diskreter Ordnung | 86 Arithmetische Theorien | 88 Verallgemeinerungen des Interpretierbarkeitsbegriffs | 89
4 4.1
Interpretierbarkeit zwischen Theorien von Körpern | 98 Endliche Körper | 98
VIII | Inhalt
4.2 4.3 4.4 4.5
Körper der rationalen Zahlen | 98 Unendliche Körper | 99 Körper der komplexen Zahlen | 101 Schiefkörper der Quaternionen | 105
5 5.1 5.1.1 5.1.2 5.2 5.3 5.3.1
Arithmetisierung der Geometrie | 107 Elementare Geometrien und ihre Arithmetisierungen | 107 Euklidische Geometrie | 108 Nicht-euklidische Geometrien | 115 Alternative Formalisierungen | 118 Konverse der Arithmetisierung | 119 Mehrdimensionale Interpretationen in 𝑃𝑛 | 122
6 6.1 6.2 6.3
Eine erststufige Theorie reeller und natürlicher Zahlen | 133 Die Theorie 𝑅𝐶𝐹𝑁 | 133 Folgen reeller Zahlen | 140 Beispiel: Satz von Bolzano-Weierstraß | 154
7 7.1 7.1.1 7.1.2 7.1.3 7.1.4 7.1.5 7.2 7.2.1 7.2.2 7.2.3
Zweitstufige Theorien der reellen Zahlen | 156 Genetische Konzeption | 156 Von natürlichen zu ganzen Zahlen | 157 Von ganzen zu rationalen Zahlen | 158 Von rationalen zu reellen Zahlen | 160 Interpretierbarkeit in Arithmetik | 161 Interpretierbarkeit von 𝑅𝐶𝐹 | 171 Axiomatische Konzeption | 172 Interpretierbarkeit von 𝑃𝐴 | 173 Konverse Interpretation in Arithmetik | 178 Dyadische Sprache | 187
Schluss | 192 Anhang | 225 A Interpretation der Axiome der hyperbolischen Geometrie | 225 B Interpretation der Axiome der elliptischen Geometrie | 232 C Beweis der Axiome von 𝑅𝐶𝐹 in der genetischen Konzeption | 242 Literatur | 259 Sachregister | 265
Einleitung Durch Vordringen zu immer tieferliegender Schichten von Axiomen [...] gewinnen wir auch in das Wesen des wissenschaftlichen Denkens selbst immer tiefere Einblicke und werden uns der Einheit unseres Wissens immer mehr bewußt. In dem Zeichen der axiomatischen Methode erscheint die Mathematik berufen zu einer führenden Rolle in der Wissenschaft überhaupt.¹
Axiomatisches Denken, für das sich David Hilbert in diesem Zitat einsetzt und von dem er jene epistemologischen und wissenschaftstheoretischen Einsichten erwartet, liegt der von ihm entwickelten Disziplin der Metamathematik zugrunde. In der Metamathematik sind mathematische Theorien, die durch Axiome in formalen Sprachen gegeben sind, selbst Gegenstand mathematischer Untersuchungen. Ihre Ergebnisse sind dann als bewiesene Sätze nicht nur Teil der Mathematik, sondern können auch als Erkenntnisse über Mathematik interpretiert werden und haben damit philosophische Relevanz. Die Gödelschen Unvollständigkeitssätze, konstruktive Widerspruchsfreiheitsbeweise arithmetischer Theorien oder die Entwicklung der formalen Mengenlehre sind prominente Beispiele für philosophisch instruktive Resultate der Metamathematik. Welche Theorien stehen im Mittelpunkt metamathematischer Untersuchungen? Die Peano-Arithmetik 𝑃𝐴 als bekannteste Theorie der natürlichen Zahlen und die Zermelo-Fraenkelsche Mengentheorie 𝑍𝐹 sind wichtige Kandidaten. Zum einen sind sie durch eine intendierte Deutung motiviert und werden dementsprechend als arithmetisch, bzw. mengentheoretisch bezeichnet. Zum anderen bilden sie den Ausgangspunkt, um verwandte Theorien über den gleichen Objektbereich zu untersuchen, z.B. Teiltheorien oder Erweiterungen, aber auch Alternativen in derselben oder anderen Sprachen. Die Zusammenhänge zwischen diesen Theorien zu untersuchen und sie dadurch zu vergleichen, ist ein wichtiger Bestandteil der Logik und bildet häufig die Grundlage philosophischer Reflexionen über Mathematik. In der vorliegenden Arbeit werden zu diesem Zweck intertheoretische Relationen metamathematisch bewiesen, dabei liegt der Fokus aber auf Theorien, deren intendierter Objektbereich die Menge der reellen Zahlen ist. Diese Theorien haben in der Metamathematik bisher eine widersprüchliche Position eingenommen: Einerseits sind sie seit Hilbert (1900) zentraler Bestandteil des Repertoires an Theorien, andererseits wurde sich mit ihnen nicht in ähnlicher Weise systematisch auseinandergesetzt, wie mit jenen der Arithmetik oder der Mengenlehre. Tatsächlich gibt es wichtige Resultate, die Theorien der reellen Zahlen betreffen 1 Hilbert (1918, S. 415).
2 | Einleitung
und sie sowohl in technischer als auch philosophischer Hinsicht auszeichnen und von den beiden anderen Fällen unterscheiden. Gerade diese Unterschiede sind der Anlass, ein Programm sui generis für Theorien der reellen Zahlen zu verfolgen. In der Einleitung soll dieses Programm anhand von drei Themen genauer charakterisiert werden: Zunächst werden die Besonderheiten der Metamathematik der reellen Zahlen aufgewiesen, die zugleich die Wahl der entsprechenden Theorien der reellen Zahlen begründen. Daraufhin werden die entscheidenden intertheoretischen Relationen vorgestellt, wobei die Anwendbarkeit auf jene Theorien berücksichtigt wird. Schließlich werden philosophische Hintergründe für das so bestimmte Programm erläutert, insbesondere aus der Philosophie der Mathematik. Der Begriff einer Theorie in der Logik als deduktiv abgeschlossene Satz- oder Formelmenge ist abhängig von der Sprache, in der der Abschluss betrachtet wird. Es gibt für jeden intendierten Objektbereich bestimmte Sprachen, mit denen wir vertraut sind, über ihn zu sprechen. In der Arithmetik wird zum Beispiel das nicht-logische Vokabular {0, 𝑆, +, ⋅} gewählt und Mengentheorie wird vorzugsweise nur mit der Relation ∈ formuliert. Für eine Theorie der reellen Zahlen fällt die Wahl des Vokabulars häufig auf dasjenige der Sprache angeordneter Körper {0, 1, +, ⋅, ≤}. Auf Tarski (1957) geht die Einsicht zurück, dass die vollständige (d.i. maximalkonsistente) Theorie in der entsprechenden prädikatenlogischen Sprache erster Stufe, die den angeordneten Körper der reellen Zahlen als Modell hat,² rekursiv axiomatisierbar und damit auch entscheidbar ist, vgl. Kapitel 2.1. Die Theorie wird gewöhnlich mit 𝑅𝐶𝐹 bezeichnet oder manchmal auch die Theorie der reellen Zahlen genannt. Dies ist ein wesentlicher Unterschied zur Arithmetik und zur Mengentheorie, in denen die entsprechenden vollständigen Theorien des jeweiligen Standardmodells nicht in dieser Weise axiomatisierbar sind. Andererseits hat schon Montague (1965b, S. 134ff.) darauf aufmerksam gemacht, dass in allen drei Feldern mit 𝑃𝐴, 𝑅𝐶𝐹 und 𝑍𝐹 drei erststufige, rekursiv axiomatisierbare Theorien gegeben sind, in denen in nahe liegender Weise ein Standardmodell definiert werden kann: Die jeweilige Axiomatisierung beinhaltet ein Schema, dessen Instanzen alle aus einem zweitstufigen Axiom (der Verallgemeinerung des Schemas in zweiter Stufe) folgen, das zusammen mit den übrigen
2 In der Modellsemantik einer Sprache werden passende Strukturen betrachtet, in denen die Sprache ausgewertet werden kann. So wie in der Arithmetik gerne das Standardmodell angegeben wird, dessen Trägermenge ℕ ist, gibt es einen angeordneten Körper der reellen Zahlen, dessen Trägermenge ℝ ist und dessen Interpretationen von 0, 1, +, ⋅ und ≤ dem gewöhnlichen Gebrauch der Rechenzeichen entsprechen.
Einleitung
| 3
Axiomen die kategorische Charakterisierung des Standardmodells liefert. Der intendierte Objektbereich ist für alle drei Theorien damit eindeutig bestimmt. In Bezug auf die reellen Zahlen ist mit 𝑅𝐶𝐹 sogar aufgrund der Vollständigkeit eine ausgezeichnete Axiomatisierung gegeben. Durch eine intendierte Lesart haben Theorien eine besondere Funktion in Bezug auf die Mathematik, die sie repräsentieren. Während beispielsweise Gruppentheorie von vornherein nur Aussagen aufstellt über Objekte, die als Gruppen erkannt worden sind, können Sätze einer Theorie mit einem Standardmodell, sofern es sich um eine allgemein akzeptierte und bekannte Struktur handelt, direkt als in dieser Struktur ausgewertete, mathematischen Wahrheiten gelesen werden. Nun ist die Arithmetik auf den reellen Zahlen in ähnlich hohem Maße akzeptiert und bekannt wie diejenige auf den natürlichen Zahlen, sodass sich auch der epistemische Status von 𝑅𝐶𝐹 in dem Sinne dem von 𝑃𝐴 ähnelt, als beide (in Bezug auf ihre jeweiligen Objekte) wahre Rechengesetze ausdrücken. Zudem ist durch die Entscheidbarkeit von 𝑅𝐶𝐹 in dem Fall der reellen Zahlen sogar die effektive Verfügbarkeit des entsprechenden mathematischen Wissens garantiert. Die Tatsache, dass Strukturen der reellen Zahlen eine zentrale Bedeutung für die Mathematik haben, ist offensichtlich. Der Erfolg der Analysis, sowohl innermathematisch als auch bei Anwendungen in anderen Wissenschaften, erklärt die Relevanz von Strukturen reeller Zahlen, von denen die Analysis im Wesentlichen handelt. Insbesondere der angeordnete Körper der reellen Zahlen wird zumeist für alle Bereiche der Analysis vorausgesetzt. Zwar gibt es viele metamathematische Forschungsgegenstände, auf die sich die Relevanz der reellen Zahlen überträgt, so beispielsweise auch in einem arithmetischen oder mengentheoretischen Rahmen, aber eine vollständige und entscheidbare Theorie, deren intendierte Interpretation genau in jener Struktur besteht, ist zunächst ein hervorragender Ausgangspunkt. Die vorteilhaften Eigenschaften von 𝑅𝐶𝐹 machen zugleich einen eigenen Ansatz in der metamathematischen Behandlung der Theorien der reellen Zahlen notwendig. Während von 𝑃𝐴 unentscheidbare Sätze in der Arithmetik Forschungen zu Erweiterungen von 𝑃𝐴 um diese Sätze nahelegen, ist 𝑅𝐶𝐹 vollständig, sodass es keine echte, konsistente Erweiterung in der Sprache von 𝑅𝐶𝐹 gibt. Die Unentscheidbarkeit der arithmetischen Theorien erlaubt die Hierarchisierung von Teiltheorien von 𝑃𝐴 gemäß ihrer Komplexität. In entscheidbaren Theorien wie 𝑅𝐶𝐹 entfällt auch dieses Forschungsmotiv. Auch das Mittel der Gödelisierung, also die Kodierung von Syntax in arithmetischer Sprache, das für die Unvollständigkeitssätze wesentlich ist, kann in 𝑅𝐶𝐹 nicht durchgeführt werden, da in ihr nicht einmal eine Paarfunktion zur Verfügung steht, vgl. Kapitel 3.1.
4 | Einleitung
Mengentheorie ist seit dem 20. Jahrhundert die präferierte Grundlagentheorie der Mathematik. Dies wird u.a. durch die Definierbarkeit mathematischer Begriffe innerhalb von 𝑍𝐹 begründet. Innerhalb arithmetischer Sprachen sind dieser Strategie schon syntaktisch Grenzen gesetzt. Die Vollständigkeit von 𝑅𝐶𝐹 hängt nun auch noch eng mit einer bestimmten Einschränkung der Definierbarkeit zusammen, vgl. Kapitel 2.3. Eine metamathematische Untersuchung von Theorien der reellen Zahlen muss deshalb notwendigerweise über 𝑅𝐶𝐹 hinausgehen. Eine Strategie dieser Arbeit besteht nun darin, Theorien der reellen Zahlen in verschiedenen Sprachen zu untersuchen. Zunächst ist die Wahl der Sprache der angeordneten Körper nicht zwingend, um eine vollständige, rekursiv axiomatisierbare Theorie der reellen Zahlen zu erhalten, zum Beispiel genügt das Vokabular {0, 1, +, ⋅}, vgl. Kapitel 2.2. Die Sprache der Körper stellt aber ein Mindestvokabular zur Verfügung, um reelle Zahlen charakterisieren zu können. Die Charakterisierung wäre zwar die zweitstufige, kategorische Axiomatisierung des Körpers des reellen Zahlen, die sich aber wieder naheliegend durch ein Axiomenschema auf die erststufige Sprache einschränken lässt. In der Sprache der Körper gibt es in dem Sinne eine erststufige, rekursiv axiomatisierbare Theorie mit einem Standardmodell, nämlich dem Körper der reellen Zahlen. Wird nur noch das Vokabular {0, +} betrachtet, ist die Theorie der additiven Gruppe der reellen Zahlen identisch mit der vollständigen Theorie der unendlichen, teilbaren, torsionsfreien, abelschen Gruppen, die auch von der Gruppe der rationalen Zahlen erfüllt wird. Die Wahl eines Standardmodells fällt damit in dem Fall nicht so leicht wie für 𝑅𝐶𝐹. Für die Ordnung der reellen Zahlen gibt es zwar eine Charakterisierung in zweiter Stufe, die gewöhnlich auf Separabilität, also einen zweitstufigen Existenzsatz zurückgreift, auf den kein erststufiges Schema zurückgeführt werden kann. Der erststufige Anteil dieser Theorie ist deshalb auch „nur“ 𝐷𝐿𝑂, der neben ⟨ℝ, 1.
1.4.1 Elimination der Mehrdimensionalität durch kartesische Produkte Um mehrdimensionale Interpretationen zu vermeiden, können sie durch eindimensionale Interpretationen in Erweiterungen der interpretierenden Theorie ersetzt werden. Eine Möglichkeit besteht in der Hinzunahme eines kartesischen Produkts der Trägermenge. Wir gehen davon aus, dass es eine 𝑛-dimensionale Interpretation einer Theorie 𝑆 in eine Theorie 𝑇 gibt. Übersichtshalber wählen wir eine zweisortige Sprache 𝐿[𝑇𝑛 ], indem wir zu 𝐿[𝑇] neben den bisherigen Variablen 𝑥, 𝑦, 𝑧, 𝑣0 , 𝑣1 , ... neue Variablen
𝑥, 𝑦, 𝑧, 𝑣0 , 𝑣1 , ... einer zweiten Sorte hinzufügen.²⁵ Außerdem sei 𝛱 ein (𝑛 + 1)-stelliges Prädikatsymbol in 𝐿[𝑇𝑛 ], das in der ersten Stelle, präfix, von einer Variablen der zweiten Sorte und in den letzten 𝑛 Stellen, suffix, von Termen der ersten Sorte besetzt wird.
25 Vgl. Kapitel 1.3.
30 | 1 Interpretierbarkeit 𝑛 Die Theorie 𝑇𝑛 enthalte 𝑇 bezüglich der ersten Sorte und zusätzlich Axiom 𝐴𝑥𝛱 ≐ 𝑛
∀𝑣1 ...∀𝑣𝑛 ∃𝑥 𝑥𝛱𝑣1 ...𝑣𝑛 ∧∀𝑣1 ...∀𝑣2𝑛 ∀𝑥 (𝑥𝛱𝑣1 ...𝑣𝑛 ∧𝑥𝛱𝑣𝑛+1 ...𝑣2𝑛 → ⋀ 𝑣𝑖 = 𝑣𝑛+𝑖 ) ∧ 𝑖=1
∀𝑥∃𝑣1 ...∃𝑣𝑛 𝑥𝛱𝑣1 ...𝑣𝑛 ∧ ∀𝑥∀𝑦∀𝑣1 ...∀𝑣𝑛 (𝑥𝛱𝑣1 ...𝑣𝑛 ∧ 𝑦𝛱𝑣1 ...𝑣𝑛 → 𝑥 = 𝑦). Damit stellt 𝛱 eine Bijektion zwischen der Objektmenge der zweiten Sorte mit der Menge aller 𝑛-Tupeln von Objekten der ersten Sorte her. Nun ist folgender Satz allgemein beweisbar. Satz 1.4.8. 𝑆 ⪯𝑛 𝑇 ⇒ 𝑆 ⪯ 𝑇𝑛 Beweis. Das Vokabular von 𝐿[𝑆] enthalte nur die Relationssymbole 𝑃1 , ..., 𝑃𝑚 mit respektiven Stelligkeiten 𝑘1 , ..., 𝑘𝑚 . Nach Definition 1.4.1 gibt es eine mehrdimensionale Interpretation 𝐼 von 𝑆 nach 𝑇 mit Formeln 𝛿 (𝑥1 , ..., 𝑥𝑛 ) und 𝜑𝑃 𝑖 (𝑥1,1 , ..., 𝑥𝑘𝑖 ,𝑛 ) aus 𝐿[𝑇]. Sei nun
𝛿(𝑥) ≐ ∃𝑥1 ...∃𝑥𝑛 (𝑥𝛱𝑥1 ...𝑥𝑛 ∧ 𝛿(𝑥1 , ..., 𝑥𝑛 )), 𝑘𝑖
𝜑𝑃𝑖 (𝑥1 , ..., 𝑥𝑘𝑖 ) ≐ ∃𝑥1,1 ...∃𝑥𝑘𝑖 ,𝑛 (⋀ 𝑥𝑗 𝛱𝑥𝑗,1 ...𝑥𝑗,𝑛 ∧ 𝜑𝑃 𝑖 (𝑥1,1 , ..., 𝑥𝑘𝑖 ,𝑛 )). 𝑗=1
Die Abbildung 𝐼 von 𝐿[𝑆] nach 𝐿[𝑇𝑛 ] sei gemäß Definition 1.1.1 induktiv definiert, wobei die Variablen von 𝐿[𝑆] in Variablen der zweiten Sorte von 𝐿[𝑇𝑛 ] übersetzt werden. Wir beweisen nun folgenden Hilfssatz induktiv über den Formelaufbau von 𝜓.²⁶ Für alle Formeln 𝜓(𝑥1 , ..., 𝑥𝑚 ) aus 𝐿[𝑆] gilt 𝑚
𝑇𝑛 ⊢ ⋀ 𝑥𝑖 𝛱𝑥𝑖,1 ...𝑥𝑖,𝑛 → (𝐼 (𝜓)(𝑥1,1 , ..., 𝑥𝑚,𝑛 ) ↔ 𝐼(𝜓)(𝑥1 , ..., 𝑥𝑚 )). 𝑖=1
Da 𝐼 (𝜓) ∈ 𝐿[𝑇] ⊆ 𝐿[𝑇𝑛 ], ist der Satz wohlgeformt. Wir argumentieren innerhalb von 𝑇𝑛 . Für den Induktionsanfang sei 𝜓 atomar. Im Falle einer Gleichung 𝑥 = 𝑦 ist folgender Satz zu beweisen 𝑛
𝑥𝛱𝑥1 ...𝑥𝑛 ∧ 𝑦𝛱𝑦1 ...𝑦𝑛 → (⋀ 𝑥𝑖 = 𝑦𝑖 ↔ 𝑥 = 𝑦). 𝑖=1
26 Vgl. Lemma 1.4.4.
1.4 Mehrdimensionale Interpretierbarkeit | 31
𝑛 Dies ist aber eine prädikatenlogische Konsequenz aus dem Axiom 𝐴𝑥𝛱 . 𝑘
𝑖 Im Falle 𝜓 ≐ 𝑃𝑖 𝑥1 ...𝑥𝑘𝑖 ist zu zeigen ⋀𝑗=1 𝑥𝑗 𝛱𝑥𝑗,1 ...𝑥𝑗,𝑛 →
𝑘𝑖
(𝜑𝑃 𝑖 (𝑥1,1 , ..., 𝑥𝑘𝑖 ,𝑛 ) ↔ ∃𝑥1,1 ...∃𝑥𝑘𝑖 ,𝑛 (⋀ 𝑥𝑗 𝛱𝑥𝑗,1 ...𝑥𝑗,𝑛 ∧ 𝜑𝑃 𝑖 (𝑥1,1 , ..., 𝑥𝑘𝑖 ,𝑛 ))). 𝑗=1
Die Richtung von links nach rechts ist nur eine Existenzabschwächung zusammen mit dem Antezedens des Konditionals. Für die Richtung von rechts nach links folgt 𝑘𝑖 aus dem Existenzsatz für neue 𝑐𝑗,𝑖 , dass ⋀𝑗=1 𝑥𝑗 𝛱𝑐𝑗,1 ...𝑐𝑗,𝑛 ∧ 𝜑𝑃 𝑖 (𝑐1,1 , ..., 𝑐𝑘𝑖 ,𝑛 ). Mit 𝑛 dem Axiom 𝐴𝑥𝛱 folgt daraus zusammen mit dem Antezedens des Konditionals 𝑥𝑗,𝑖 = 𝑐𝑗,𝑖 und mit dem Leibniz-Prinzip dann 𝜑𝑃 𝑖 (𝑥1,1 , ..., 𝑥𝑘𝑖 ,𝑛 ). Die Induktionsschritte bezüglich der Junktoren ergibt sich aus den Bedingungen iii) der Definitionen 1.1.1 und 1.4.1 und Aussagenlogik. Den Fall der Quantifikation betrachten wir für eine Formel ∀𝑥𝜒, wobei 𝜒 oBdA keine anderen freien Variablen als 𝑥 enthalte. Dann ist die Induktionsvoraussetzung 𝑥𝛱𝑥1 ...𝑥𝑛 →
(𝐼 (𝜒) ↔ 𝐼(𝜒)).
Gelte zunächst ∀𝑥1 ...∀𝑥𝑛 (𝛿 (𝑥1 ...𝑥𝑛 ) → 𝐼 (𝜒)). Sei ein 𝑥 beliebig mit 𝛿(𝑥), also folgt aus der Existenzquantifikation für neue 𝑐𝑖 , dass 𝑥𝛱𝑐1 ...𝑐𝑛 ∧ 𝛿 (𝑐1 , ..., 𝑐𝑛 ). Dann folgt das Resultat 𝐼 (𝜒(𝑐/𝑥)) der simultanen Substitution der 𝑥𝑖 durch 𝑐𝑖 . Mit der Generalisierung der Induktionsvoraussetzung erhält man dann 𝐼(𝜒). Gelte schließlich ∀𝑥(𝛿(𝑥) → 𝐼(𝜒)). Seien 𝑥1 , ...𝑥𝑛 beliebig mit 𝛿 (𝑥1 , ..., 𝑥𝑛 ). 𝑛 Nach dem Axiom 𝐴𝑥𝛱 gibt es dann ein 𝑥 mit 𝑥𝛱𝑥1 ...𝑥𝑛 . Also gilt 𝛿(𝑥). Mit der Voraussetzung gilt dann 𝐼(𝜒) und mit der Induktionsvoraussetzung auch 𝐼 (𝜒). Wenn 𝜓 ein Satz aus 𝑆 ist , dann ist nach v) von Definition 1.4.1 auch 𝑇 ⊢ 𝐼 (𝜓). Da 𝑇 ⊆ 𝑇𝑛 , ist auch 𝑇𝑛 ⊢ 𝐼 (𝜓). Nun folgt mit dem bewiesenen Hilfssatz 𝑇𝑛 ⊢ 𝐼 (𝜓) ↔ 𝐼(𝜓) und damit auch 𝑇𝑛 ⊢ 𝐼(𝜓). Damit ist gezeigt, dass 𝐼 eine Interpretation von 𝑆 nach 𝑇𝑛 ist. Satz 1.4.9. 𝑇𝑛 ⪯𝑛 𝑇. Beweis. Eigentlich weisen wir die mehrdimensionale Variante der sortalen Interpretierbarkeit aus Definition 1.3.1 nach. Dabei wird ein doppelter Variablenshift vorgenommen, einer für die Sortenreduktion und einer für die Mehrdimensionalität. Den der Sortenreduktion ersparen wir uns hier und nutzen stattdessen gestrichelte Variablen. Dafür sei 𝐼 : 𝐿[𝑇𝑛 ] → 𝐿[𝑇] induktiv über den Formelaufbau definiert durch die Klauseln: i) Für alle atomaren Formeln 𝜑 aus 𝐿[𝑇]: 𝐼(𝜑) ≐ 𝜑. 𝑛 ii) Für alle 𝑖, 𝑗 ≥ 0: 𝐼(𝑣𝑖 = 𝑣𝑗 ) ≐ ⋀𝑘=1 𝑣𝑖⋅𝑛+𝑘 = 𝑣𝑗⋅𝑛+𝑘 . 𝑛
iii) Für alle 𝑖1 , ..., 𝑖𝑛 , , 𝑗 ≥ 0: 𝐼(𝑣𝑗 𝛱𝑣𝑖1 ...𝑣𝑖𝑛 ) ≐ ⋀𝑘=1 𝑣𝑗⋅𝑛+𝑘 = 𝑣𝑖𝑘 .
32 | 1 Interpretierbarkeit iv) Für alle Formeln 𝜓, 𝜒 in 𝐿[𝑇𝑛 ]: 𝐼(¬𝜓) ≐ ¬𝐼(𝜓); 𝐼(𝜓 → 𝜒) ≐ 𝐼(𝜓) → 𝐼(𝜒). v) Für alle Formeln 𝜓 in 𝐿[𝑇𝑛 ] und alle 𝑖: 𝐼(∀𝑣𝑖 𝜓) ≐ ∀𝑣𝑖 𝐼(𝜓). vi) Für alle Formeln 𝜓 in 𝐿[𝑇𝑛 ] und alle 𝑖: 𝐼(∀𝑣𝑖 𝜓) ≐ ∀𝑣𝑖+1 ...∀𝑣𝑖+𝑛 𝐼(𝜓). Insbesondere gilt damit für alle Sätze 𝜓 ∈ 𝐿[𝑇], dass 𝐼(𝜓) ≐ 𝜓. Um zu zeigen, dass für alle Sätze 𝜓 ∈ 𝑇𝑛 gilt 𝑇 ⊢ 𝐼(𝜓), reicht es deshalb zu zeigen, dass 𝑇 ⊢ 𝑛 𝑛 𝐼(𝐴𝑥𝛱 ). Doch 𝐼(𝐴𝑥𝛱 )≐ 𝑛
∀𝑣1 ...∀𝑣𝑛 ∃𝑥1 ...∃𝑥𝑛 ⋀ 𝑥𝑘 = 𝑣𝑘 ∧
𝑘=1 𝑛 𝑛 ∀𝑣1 ...∀𝑣2𝑛 ∀𝑥1 ...∀𝑥𝑛 (⋀ 𝑥𝑘 = 𝑣𝑘 ∧ ⋀ 𝑥𝑘 𝑘=1 𝑘=1 𝑛 ∀𝑥1 ...∀𝑥𝑛 ∃𝑣1 ...∃𝑣𝑛 ⋀ 𝑥𝑘 = 𝑣𝑘 ∧ 𝑘=1 𝑛 ∀𝑥1 ...∀𝑥𝑛 ∀𝑦1 ...∀𝑦𝑛 ∀𝑣1 ...∀𝑣𝑛 (⋀ 𝑥𝑘 = 𝑣𝑘 𝑘=1
𝑛
= 𝑣𝑛+𝑘 → ⋀ 𝑣𝑘 = 𝑣𝑛+𝑘 ) ∧ 𝑘=1
𝑛
𝑛
𝑘=1
𝑘=1
∧ ⋀ 𝑦𝑘 = 𝑣𝑘 → ⋀ 𝑥𝑘 = 𝑦𝑘 ).
ist sogar eine prädikaten- und identitätslogische Wahrheit. Korollar 1.4.10. 𝑆 ⪯𝑛 𝑇 ⇔ 𝑆 ⪯ 𝑇𝑛 Satz 1.4.11. Wenn 𝑇 vollständig und rekursiv axiomatisierbar ist, dann ist 𝑇𝑛 auch vollständig und entscheidbar. Beweis. Wir beweisen zunächst mittels Induktion über den Formelaufbau folgenden Satz. (∗) Für jede Formel 𝜑(𝑥1 , ..., 𝑥𝑘 , 𝑣1 , ..., 𝑣𝑙 ) aus 𝐿[𝑇𝑛 ] gibt es eine Formel
𝜓(𝑥1,1 , ..., 𝑥1,𝑛 , ..., 𝑥𝑘,1 , ..., 𝑥𝑘,𝑛 , 𝑣1 , ..., 𝑣𝑙 ) aus 𝐿[𝑇] mit neuen Variablen 𝑥1,1 , ..., 𝑥𝑘,𝑛 , sodass 𝑘
𝑇𝑛 ⊢ ⋀ 𝑥𝑖 𝛱𝑥𝑖,1 ...𝑥𝑖,𝑛 → (𝜑 ↔ 𝜓). 𝑖=1
Sei 𝜑 eine atomare Formel. Im Falle einer atomaren Formel der ersten Sorte handelt es sich auch um eine Formel aus 𝐿[𝑇] und somit kann 𝜓 ≐ 𝜑 gewählt werden. Im Falle einer Gleichung der zweiten Sorte hat 𝜑 also die Form 𝑥 = 𝑦. Dann folgt 𝑛 mit dem Axiom 𝐴𝑥𝛱 , dass 𝑛
𝑇𝑛 ⊢ 𝑥𝛱𝑥1 ...𝑥𝑛 ∧ 𝑦𝛱𝑦1 ...𝑦𝑛 → (𝑥 = 𝑦 ↔ ⋀ 𝑥𝑖 = 𝑦𝑖 ). 𝑖=1
1.4 Mehrdimensionale Interpretierbarkeit |
33
𝑛
Also kann 𝜓 ≐ ⋀𝑖=1 𝑥𝑖 = 𝑦𝑖 gewählt werden. Als letzten Fall einer atomaren Formel kann 𝜑 die Form 𝑥𝛱𝑡1 ...𝑡𝑛 haben, wobei 𝑡1 , ..., 𝑡𝑛 Terme mit Varia𝑛 blen der ersten Sorte sind. Wieder aufgrund des Axioms 𝐴𝑥𝛱 gilt dann, dass 𝑛 𝑛 𝑇 ⊢ 𝑥𝛱𝑥1 ...𝑥𝑛 → (𝑥𝛱𝑡1 ...𝑡𝑛 ↔ ⋀𝑖=1 𝑡𝑖 = 𝑥𝑖 ), also kann 𝜓 ≐ ⋀𝑛𝑖=1 𝑡𝑖 = 𝑥𝑖 gewählt werden. Für die Induktionsschritte der Negation und der Disjunktion reichen aussagenlogische Axiome. Für den Induktionsschritt der Quantifikation sei zunächst 𝜑 ≐ ∀𝑣𝜑 , wobei 𝜑 auch mehr freie Variablen als 𝑣 enthalten kann und mit denen die Induktionsvoraussetzung bezüglich eines 𝜓 aus 𝐿[𝑇] erfüllt. Dann kann aufgrund des Allabschlusses der Induktionsvoraussetzung und des Axioms der Quantorendistribution auch 𝜓 ≐ ∀𝑣𝜓 gewählt werden. Als letztes sei 𝜑 ≐ ∀𝑥𝜑 , wobei 𝜑 auch mehr freie Variablen als 𝑥 enthalten kann und mit denen die Induktionsvoraussetzung bezüglich eines 𝜓 aus 𝐿[𝑇] erfüllt, unter dessen freie Variablen 𝑥1 , ..., 𝑥𝑛 auftauchen. Unter Benutzung des Allabschlusses der Induktionsvorraussetzung und folgender Folgerung aus dem 𝑛 Axiom 𝐴𝑥𝛱 ist der Induktionsschritt mit 𝜓 ≐ ∀𝑥1 , ...𝑥𝑛 𝜓 zu beweisen:
𝑇𝑛 ⊢ ∀𝑥∃𝑥1 ...𝑥𝑛 𝑥𝛱𝑥1 ...𝑥𝑛 ∧ ∀𝑥1 ...𝑥𝑛 ∃𝑥 𝑥𝛱𝑥1 ...𝑥𝑛 . Wenn 𝜓 ein Satz aus 𝐿[𝑇] ist, so ist er auch aus 𝐿[𝑇𝑛 ] und aus 𝑇 ⊢ 𝜓 folgt dann 𝑇𝑛 ⊢ 𝜓. Sei 𝜑 ein Satz aus 𝐿[𝑇𝑛 ]. Dann gibt es mit (∗) einen Satz 𝜓 aus 𝐿[𝑇], sodass 𝑇𝑛 ⊢ 𝜑 ↔ 𝜓 und da die vollständige Theorie 𝑇 𝜓 oder ¬𝜓 beweist, so auch 𝑇𝑛 , also beweist 𝑇𝑛 𝜑 oder ¬𝜑 und ist somit vollständig. Nun sind rekursiv axiomatisierbare, vollständige Theorien entscheidbar und da die Axiome von 𝑇𝑛 die rekursive Axiomenmenge von 𝑇 nur um endlich viele Axiome erweitert, so folgt auch die Entscheidbarkeit von 𝑇𝑛 .
1.4.2 Elimination der Mehrdimensionalität durch eine Paarfunktion Statt der Einführung eines dimensionsabhängigen kartesischen Produkts, kann auch eine Paarfunktion zu 𝑇 hinzugefügt werden, sofern 𝑇 noch keine hat (sonst kann die Mehrdimensionalität eh vermieden werden, vgl. Satz 1.4.3). Ein dreistelliges Prädikat wird hinzugefügt und gemäß Definition 1.4.2 axiomatisiert werden. Dann können Interpretationen beliebiger Dimensionalität durch eindimensionale Interpretationen in diese Erweiterung ersetzt werden. Tatsächlich kann dabei allerdings eine wesentlich stärkere Theorie entstehen, so verliert eine Theorie sogar ihre Vollständigkeit und Entscheidbarkeit durch die Hinzunahme der Paarfunktion.
34 | 1 Interpretierbarkeit Sei 𝐿[𝑇𝑂𝑃 ] die Sprache 𝐿[𝑇] erweitert um ein dreistelliges Prädikatsymbol 𝑂𝑃 und darin die Theorie 𝑇𝑂𝑃 , welche der deduktiven Abschluss der Axiome von 𝑇 und folgendem Axiom sei:
∀𝑥∀𝑦∃!𝑧𝑂𝑃(𝑥, 𝑦, 𝑧)∧ ∀𝑣∀𝑤∀𝑥∀𝑦∀𝑧(𝑂𝑃(𝑥, 𝑦, 𝑧) ∧ 𝑂𝑃(𝑣, 𝑤, 𝑧) → 𝑥 = 𝑣 ∧ 𝑦 = 𝑤). Dann gilt für alle 𝑛 ≥ 2: Satz 1.4.12. 𝑇𝑛 ⪯𝑠 𝑇𝑂𝑃 Beweis. Wir suchen eine Interpretation 𝐼 von 𝑇𝑛 nach 𝑇𝑂𝑃 : Da 𝐿[𝑇𝑛 ] zweisortig ist, nehmen wir neue Variablen 𝑤0 , 𝑤1 ... zu 𝐿[𝑇𝑂𝑃 ] für die Übersetzung der Variablen der zweiten Sorte hinzu.²⁷ Der 𝐿[𝑇]-Teil von 𝐿[𝑇𝑛 ] kann dann durch 𝐼 einfach identisch (ohne Relativierung) nach 𝐿[𝑇𝑂𝑃 ] abgebildet werden. Für den Rest sei die (𝑛 + 1)-stellige Formel 𝑛
∃𝑣1 ...∃𝑣𝑛 (𝑣1 = 𝑥1 ∧ ⋀ 𝑂𝑃(𝑣𝑖−1 , 𝑥𝑖 , 𝑣𝑖 ) ∧ 𝑣𝑛 = 𝑥0 ) 𝑖=2
abgekürzt durch 𝑂𝑃𝑛 (𝑥0 , 𝑥1 , ..., 𝑥𝑛 ) (wobei ⊢ 𝑂𝑃2 (𝑧, 𝑥, 𝑦) ↔ 𝑂𝑃(𝑥, 𝑦, 𝑧)). Dann kann induktiv über den Formelaufbau 𝐼 fortgesetzt werden, sodass folgende Bedingungen erfüllt werden:
𝐼(𝑥𝑗 𝛱𝑥1 ...𝑥𝑛 ) ≐ 𝑂𝑃𝑛 (𝑤𝑗 , 𝑥1 , ..., 𝑥𝑛 ) und 𝐼(∀𝑥𝑗 𝜑) ≐ ∀𝑤𝑗 (∃𝑥1 ...∃𝑥𝑛 𝑂𝑃𝑛 (𝑤𝑗 , 𝑥1 , ..., 𝑥𝑛 ) → 𝐼(𝜑)). Da 𝑇𝑛 ⊇ 𝑇 ⊆ 𝑇𝑂𝑃 , ist nur noch zu zeigen, dass 𝑇𝑂𝑃 die Übersetzung des Axioms 𝑛 𝐴𝑥𝛱 beweist. Es ist zu beachten, dass allein aufgrund prädikatenlogischer Um𝑛 formungen schon gilt ⊢ 𝐼(𝐴𝑥𝛱 )↔
∀𝑥1 ...∀𝑥𝑛 ∃𝑤 𝑂𝑃𝑛 (𝑤, 𝑥1 ...𝑥𝑛 )
(1) 𝑛
∧ ∀𝑥1 ...∀𝑥𝑛 ∀𝑦1 ...∀𝑦𝑛 ∀𝑤 (𝑂𝑃𝑛 (𝑤, 𝑥1 ...𝑥𝑛 ) ∧ 𝑂𝑃𝑛 (𝑤, 𝑦1 ...𝑦𝑛 ) → ⋀ 𝑥𝑖 = 𝑦𝑖 ) 𝑖=1
(2)
𝑛
𝑛
∧ ∀𝑤∀𝑤 ∀𝑥1 ...∀𝑥𝑛 (𝑂𝑃 (𝑤, 𝑥1 ...𝑥𝑛 ) ∧ 𝑂𝑃 (𝑤 , 𝑥1 ...𝑥𝑛 ) → 𝑤 = 𝑤 ).
(3)
27 Also wird 𝑥𝑖 auf 𝑤𝑖 abgebildet. Eigentlich müsste man eine Variablenabbildung definieren, die z.B. Variablen der ersten Sorte auf Variablen mit geraden Indizes und Variablen der zweiten Sorte auf Variablen mit ungeraden Indizes abbildet, vgl. Kapitel 1.3. Darauf wird hier aus Gründen der Übersichtlichkeit verzichtet.
1.4 Mehrdimensionale Interpretierbarkeit |
35
Wir beweisen nun jedes dieser Konjunktionsglieder einzeln informell innerhalb der Theorie 𝑇𝑂𝑃 . Zu (1): Aus dem Axiom bezüglich 𝑂𝑃 folgt zunächst ∀𝑥∀𝑦∃𝑧𝑂𝑃(𝑥, 𝑦, 𝑧). Für 𝑛 = 2 wäre das schon äquivalent zu (1), außerdem folgt für jedes 2 < 𝑗 ≤ 𝑛
∀𝑥1 ...∀𝑥𝑗 (∃𝑤 𝑂𝑃𝑗−1 (𝑤 , 𝑥1 ..., 𝑥𝑗−1 ) → ∃𝑤𝑂𝑃𝑗 (𝑤, 𝑥1 , ..., 𝑥𝑗 )), 𝑗−1
denn gegeben (𝑣1 = 𝑥1 ∧ ⋀𝑖=2 𝑂𝑃(𝑣𝑖−1 , 𝑥𝑖 , 𝑣𝑖 ) ∧ 𝑣𝑗−1 = 𝑤 ) kann dann jeweils mit ∃𝑣𝑗 𝑂𝑃(𝑣𝑗−1 , 𝑥𝑗 , 𝑣𝑗 ) ein ”Glied” hinzugefügt werden. Aus der Aussage für 𝑛 = 2 und all diesen Konditionalen folgt (1). 𝑛 Zu (2): Sei gemäß des Antezedens einerseits 𝑣1 = 𝑥1 ∧ ⋀𝑖=2 𝑂𝑃(𝑣𝑖−1 , 𝑥𝑖 , 𝑣𝑖 ) ∧ 𝑛 , 𝑦𝑖 , 𝑣𝑖 ) ∧ 𝑣𝑛 = 𝑤 gegeben. 𝑣𝑛 = 𝑤 und andererseits 𝑣1 = 𝑦1 ∧ ⋀𝑖=2 𝑂𝑃(𝑣𝑖−1 Da (mit Leibniz-Prinzip) sowohl 𝑂𝑃(𝑣𝑛−1 , 𝑥𝑛 , 𝑤) als auch 𝑂𝑃(𝑣𝑛−1 , 𝑦𝑛 , 𝑤), folgt mit dem Axiom bezüglich 𝑂𝑃 𝑥𝑛 = 𝑦𝑛 und 𝑣𝑛−1 = 𝑣𝑛−1 . Iteriert erhält man so nacheinander für alle 𝑗 = 𝑛 − 1, ..., 2 zunächst 𝑣𝑗 = 𝑣𝑗 , daraus 𝑂𝑃(𝑣𝑗−1 , 𝑥𝑗 , 𝑣𝑗 )
und 𝑂𝑃(𝑣𝑗−1 , 𝑦𝑗 , 𝑣𝑗 ) und damit 𝑥𝑗 = 𝑦𝑗 und 𝑣𝑗−1 = 𝑣𝑗−1 . Als letztes ist dann
𝑥1 = 𝑣1 = 𝑣1 = 𝑦1 und zusammen genommen ⋀𝑛𝑖=1 𝑥𝑖 = 𝑦𝑖 . 𝑛 Zu (3): Sei gemäß des Antezedens einerseits 𝑣1 = 𝑥1 ∧ ⋀𝑖=2 𝑂𝑃(𝑣𝑖−1 , 𝑥𝑖 , 𝑣𝑖 ) ∧ 𝑛 𝑣𝑛 = 𝑤 und andererseits 𝑣1 = 𝑥1 ∧ ⋀𝑖=2 𝑂𝑃(𝑣𝑖−1 , 𝑥𝑖 , 𝑣𝑖 ) ∧ 𝑣𝑛 = 𝑤 gegeben. Zunächst ist 𝑣1 = 𝑥1 = 𝑣1 . Doch dann folgt für alle 𝑗 = 2, ..., 𝑛 nacheinander 𝑣𝑗−1 = 𝑣𝑗−1 , damit 𝑂𝑃(𝑣𝑗−1 , 𝑥𝑗 , 𝑣𝑗 ) und 𝑂𝑃(𝑣𝑗−1 , 𝑥𝑗 , 𝑣𝑗 ), sodass mit der Eindeutigkeitsaussage des Axioms bezüglich 𝑂𝑃 dann 𝑣𝑗 = 𝑣𝑗 . Für 𝑗 = 𝑛 ist das dann 𝑤 = 𝑣𝑛 = 𝑣𝑛 = 𝑤 .
Satz 1.4.13. Wenn 𝑇 nur unendliche Modelle besitzt, dann ist 𝑇𝑂𝑃 unvollständig und unentscheidbar. Beweis. ∀𝑧∃𝑥𝑦 𝑂𝑃(𝑥, 𝑦, 𝑧), was die Surjektivität der Paarfunktion ausdrückt, wird von 𝑇𝑂𝑃 nicht entschieden, denn es gibt ein Modell von 𝑇𝑂𝑃 , das ihn erfüllt, und ein Modell, das seine Negation erfüllt. Betrachte dafür als Interpretation von 𝑇 in beiden Fällen ein Modell N, dessen Trägermenge die Menge der natürlichen Zahlen ℕ ist.²⁸ Nach Sätzen der Mengenlehre gilt: ℕ ≃ ℕ2 ≃ ℕ\{0}, d.h. es gibt sowohl eine Bijektion von ℕ2 in ℕ als auch in die Menge der Zahlen größer 0. Wird für die Konstruktion der beiden Modelle von 𝑇𝑂𝑃 zusätzlich zu N als Interpretation von 𝑂𝑃 je eine der Bijektionen gewählt, ist die Interpretation von 𝑂𝑃 im ersten Fall surjektiv und im zweiten Fall nicht. Also ist 𝑇𝑂𝑃 nicht vollständig.
28 N existiert, da 𝑇 nur unendliche Modelle besitzt, vgl. ein Korollar des Löwenheim-SkolemTheorems, Boolos et al. (2007, Theorem 12.18.(a)).
36 | 1 Interpretierbarkeit Für den Beweis der Unentscheidbarkeit von 𝑇𝑂𝑃 benötigen wir folgendes Lemma, das von Ferrante und Rackoff (1979, S. 165-167) stammt: Dafür sei 𝜓(𝑥, 𝑦) die Formel ∃𝑢∃𝑣(𝑂𝑃(𝑥, 𝑦, 𝑢) ∧ 𝑂𝑃(𝑢, 𝑣, 𝑣)). Par abus de langage sei für eine Paarfunktion 𝜎 auf ℕ,
𝛹(𝜎) = {(𝑛, 𝑚) ∈ ℕ2 | ⟨ℕ, 𝜎⟩, 𝛽(𝑥 : 𝑛)(𝑦 : 𝑚) 𝜓(𝑥, 𝑦)}.²⁹ Lemma 1.4.14. Sei 𝑅0 ⊆ {2 ⋅ 𝑛 | 𝑛 ∈ ℕ} × {2 ⋅ 𝑛 | 𝑛 ∈ ℕ}. Dann gibt es auf ℕ eine Paarfunktion 𝜎0 , sodass 𝛹(𝜎0 ) = 𝑅0 .
𝐿[𝑆] sei die Sprache mit nur einem zweistelligen Relationssymbol 𝑅 (ohne Identität) und die Theorie 𝑆 der deduktive Abschluss in 𝐿[𝑆] von {∀𝑥∃𝑦(𝑅(𝑥, 𝑦) ∨ 𝑅(𝑦, 𝑥))}. Nach dem Church-Herbrand-Theorem ist 𝑆 unentscheidbar, vgl. Boolos et al. (2007, Theorem 21.4).³⁰ Nun kann eine treue Interpretation 𝐼 von 𝑆 in 𝑇𝑂𝑃 definiert werden: Dafür sei die Relativierung 𝛿(𝑥) ≐ ∃𝑦(𝜓(𝑥, 𝑦) ∨ 𝜓(𝑦, 𝑥)) und 𝐼(𝑅(𝑥, 𝑦)) ≐ 𝜓(𝑥, 𝑦), sodass induktiv 𝐼 : 𝐿[𝑆] → 𝐿[𝑇𝑂𝑃 ] gemäß der Definition 1.1.1 konstruiert wird, wobei i) weggelassen wird, da 𝐿[𝑆] keine Gleichungen enthält. Es bleibt zu zeigen, dass für alle Formeln 𝜑 ∈ 𝐿[𝑆] gilt 𝑆 ⊢ 𝜑 ⇔ 𝑇𝑂𝑃 ⊢ 𝐼(𝜑). (⇒)Da Interpretationen, wie sie gemäß Definition 1.1.1 konstruiert sind, Beweisbarkeitsbeziehungen zwischen Formeln erhalten, reicht es für das eine Axiom von 𝑆 zu zeigen, dass 𝑇𝑂𝑃 ⊢ 𝐼(∀𝑥∃𝑦(𝑅(𝑥, 𝑦) ∨ 𝑅(𝑦, 𝑥))). Doch
𝐼(∀𝑥∃𝑦(𝑅(𝑥, 𝑦) ∨ 𝑅(𝑦, 𝑥))) ≐ ∀𝑥(𝛿(𝑥) → ∃𝑦(𝛿(𝑦) ∧ (𝜓(𝑥, 𝑦) ∨ 𝜓(𝑦, 𝑥)))) ist in Anbetracht der Wahl von 𝛿(𝑥) schon eine logische Wahrheit. (⇐)Mit dem Vollständigkeitssatz folgt aus 𝑇𝑂𝑃 ⊢ 𝐼(𝜑), dass für alle 𝐾 𝑇 und alle Paarfunktionen 𝜎 auf 𝑑𝑜𝑚(𝐾) (also ⟨𝐾, 𝜎⟩ 𝑇𝑂𝑃 ) gilt ⟨𝐾, 𝜎⟩ 𝐼(𝜑). Daraus folgt mit Lemma 1.4.16, dass die induzierte 𝐿[𝑆]-Struktur ⟨𝐾, 𝜎⟩|𝐼 = ⟨𝛿𝐾,𝜎 , 𝜓𝐾,𝜎 ⟩ die Formel 𝜑 erfüllt.
29 Für eine Paarfunktion 𝜎 gelte, dass sie das Axiom bzgl. 𝑂𝑃 in 𝑇𝑂𝑃 erfüllt, wenn 𝑂𝑃(𝑥, 𝑦, 𝑧) als 𝜎(𝑥, 𝑦) = 𝑧 interpretiert wird. Außerdem sei ⟨ℕ, 𝜎⟩ eine Struktur der prädikatenlogischen Sprache der Signatur {𝑂𝑃}, wobei 𝑂𝑃 auch wieder so interpretiert wird. 𝛽 sei eine Belegungsfunktion für diese Struktur. 30 Tatsächlich wird dort bewiesen, dass die logic of a dyadic predicate, d.i. die Menge der logischen Wahrheiten in 𝐿[𝑆], unentscheidbar ist, doch deren Modell 𝑀∗ , dessen Konstruktion für den Beweis entscheidend ist und im Lemma 21.13 beschrieben wird, erfüllt auch 𝑆. Also wird ebenso die Unentscheidbarkeit von 𝑆 bewiesen.
1.4 Mehrdimensionale Interpretierbarkeit |
37
Ebenso aufgrund des Vollständigkeitssatzes reicht es zu zeigen, dass für alle Modelle ⟨𝛺, 𝑅𝛺 ⟩ 𝑆 gilt ⟨𝛺, 𝑅𝛺 ⟩ 𝜑. Nach dem Löwenheim-SkolemTheorem³¹ gibt es ein zu ⟨𝛺, 𝑅𝛺 ⟩ elementar äquivalentes, abzählbares Modell, sodass oBdA 𝛺 = {2 ⋅ 𝑛 | 𝑛 ∈ ℕ} gewählt werden kann und 𝑅𝛺 ist dann eine zweistellige Relation auf den geraden Zahlen. Mit dem vorangehenden Lemma gibt es dann eine Paarfunktion 𝜎0 auf ℕ, sodass 𝑅𝛺 = 𝛹(𝜎0 ). Wieder mit dem Löwenheim-Skolem-Theorem kann auch ein abzählbares Modell 𝐾0 𝑇 mit 𝑑𝑜𝑚(𝐾0 ) = ℕ gewählt werden. Dann ist ⟨𝐾0 , 𝜎0 ⟩ 𝑇𝑂𝑃 und, da das einzige nicht-logische Zeichen in 𝜓 nur die Paarfunktion betrifft,
𝜓𝐾0 ,𝜎0 = 𝛹(𝜎0 ) = 𝑅𝛺 . Daraus folgt auch, dass 𝛿𝐾0 ,𝜎0 = 𝛺, da ⟨𝛺, 𝑅𝛺 ⟩ ∀𝑥∃𝑦(𝑅(𝑥, 𝑦) ∨ 𝑅(𝑦, 𝑥)). Es gilt nun aber nach Voraussetzung insbesondere in der Sprache 𝐿[𝑆] ⟨𝛿𝐾0 ,𝜎0 , 𝜓𝐾0 ,𝜎0 ⟩ 𝜑, also gilt auch ⟨𝛺, 𝑅𝛺 ⟩ 𝜑. Ein Entscheidungsverfahren für 𝑇𝑂𝑃 würde mittels der treuen Interpretation auch eines für 𝑆 liefern (vgl. Shoenfield (1967, S. 134)). Damit ist gezeigt, dass 𝑇𝑂𝑃 unentscheidbar ist. Beweis des Lemmas: Sei (𝑎1 , 𝑏1 ), (𝑎2 , 𝑏2 ), ... die Aufzählung aller Paare natürlicher Zahlen, sodass (𝑥, 𝑦) = (𝑎𝑖 , 𝑏𝑖 ) ⇔ 𝑖 = 21 (𝑥 + 𝑦)(𝑥 + 𝑦 + 1) + 𝑦 + 1. Dann kann ausgerechnet werden, dass (∗) 𝑏𝑖 ≠ 2𝑖. Nun kann 𝜎0 (𝑎𝑖 , 𝑏𝑖 ) induktiv über 𝑖 definiert werden. Für 0 < 𝑖 < 𝑛 sei 𝜎0 (𝑎𝑖 , 𝑏𝑖 ) definiert. Dann sei 𝜎0 (𝑎𝑛 , 𝑏𝑛 ) gemäß der folgenden Fälle definiert: I. (𝑎𝑛 , 𝑏𝑛 ) ∈ 𝑅0 . Dann sei 𝜎0 (𝑎𝑛 , 𝑏𝑛 ) = 2𝑛. II. Es gibt ein 𝑖 ∈ ℕ mit (𝑎𝑛 , 𝑏𝑛 ) = (2𝑖, 2𝑖 + 1) und (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝑅0 . Dann sei 𝜎0 (𝑎𝑛 , 𝑏𝑛 ) = 𝑏𝑛 . III. Ansonsten sei 𝜎0 (𝑎𝑛 , 𝑏𝑛 ) die kleinste Zahl 𝑚, für die gilt (a) Für alle 𝑖 ∈ ℕ mit (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝑅0 ist 𝑚 ≠ 2𝑖 und 𝑚 ≠ 2𝑖 + 1, (b) Für alle 𝑖 < 𝑛 gilt 𝑚 ≠ 𝜎0 (𝑎𝑖 , 𝑏𝑖 ), (c) 𝑚 ≠ 𝑏𝑛 . Zur Wohldefiniertheit von 𝜎0 : Fall I) und II) treten nicht zusammen auf, da 𝑅0 eine Relation auf geraden Zahlen ist. Im Fall III) ist 𝜎0 wohldefiniert, denn die Voraussetzungen (b) und (c) schließen nur endlich viele Werte aus und (a) lässt unendlich viele Werte zu (selbst wenn 𝑅0 maximal ist, d.h. alle Paare gerader Zahlen enthält, ist nur eines von vier der möglichen 𝑖 der Aufzählung betroffen und da-
31 Verallgemeinert im Sinne von Boolos et al. (2007, Theorem 12.18.(b)).
38 | 1 Interpretierbarkeit
mit höchstens eins von zwei möglichen Werten ausgeschlossen). Außerdem ist ℕ wohlgeordnet und somit gibt es eine kleinste Zahl mit den Eigenschaften (a)-(c). Da in allen Fällen ein Wert für 𝜎0 eindeutig zugeordnet wird, ist die Funktionalität von 𝜎0 sicher gestellt. Zur Injektivität von 𝜎0 : Sei 𝜎0 (𝑎𝑘 , 𝑏𝑘 ) = 𝜎0 (𝑎𝑗 , 𝑏𝑗 ) = 𝑙. Wenn 𝑙 = 2𝑖 für ein 𝑖 mit (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝑅0 , dann muss sowohl der 𝑘-te als auch der 𝑗-te Induktionsschritt über Fall I) definiert worden sein (denn im Fall II) ist der Wert ungerade und Fall IIIa) schließt diese Voraussetzung aus), also 𝑖 = 𝑗 = 𝑘. Wenn 𝑙 = 2𝑖 + 1 für ein 𝑖 mit (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝑅0 , dann muss sowohl der 𝑘-te als auch der 𝑗-te Induktionsschritt über Fall II) definiert worden sein (denn im Fall I) ist der Wert gerade und Fall IIIa) schließt auch diese Voraussetzung aus), also 𝑏𝑗 = 𝑏𝑘 = 2𝑖 + 1, 𝑎𝑗 = 𝑎𝑘 = 2𝑖. Ansonsten ist für alle 𝑖 ∈ ℕ mit (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝑅0 weder 𝑙 = 2𝑖 noch 𝑙 = 2𝑖 + 1. Dann muss sowohl der 𝑘-te als auch der 𝑗-te Induktionsschritt über Fall III) definiert worden sein, aber Voraussetzung b) erlaubt weder 𝑘 < 𝑗 noch 𝑗 < 𝑘, also ist 𝑗 = 𝑘. Damit ist gezeigt, dass 𝜎0 injektiv ist. Bleibt zu zeigen, dass 𝛹(𝜎0 ) = 𝑅0 . Sei (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝑅0 . Dann ist nach Fall I) 𝜎0 (𝑎𝑖 , 𝑏𝑖 ) = 2𝑖. Doch andererseits erfüllt das Paar (2𝑖, 2𝑖 + 1) auch die Voraussetzung von Fall II), also ist 𝜎0 (2𝑖, 2𝑖 + 1) = 2𝑖 + 1. Damit gilt
⟨ℕ, 𝜎0 ⟩, 𝛽(𝑥 : 𝑎𝑖 )(𝑦 : 𝑏𝑖 ) ∃𝑢∃𝑣(𝑂𝑃(𝑥, 𝑦, 𝑢) ∧ 𝑂𝑃(𝑢, 𝑣, 𝑣)), d.h. (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝛹(𝜎0 ). Für die andere Richtung sei nun (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝛹(𝜎0 ). Also gibt es 𝑐, 𝑑 ∈ ℕ, sodass 𝜎0 (𝑎𝑖 , 𝑏𝑖 ) = 𝑐 und 𝜎0 (𝑐, 𝑑) = 𝑑. Sei 𝑗 > 0, sodass (𝑎𝑗 , 𝑏𝑗 ) = (𝑐, 𝑑). Da 𝑏𝑗 ≠ 2𝑗 (vgl. (∗)), aber 𝜎0 (𝑎𝑗 , 𝑏𝑗 ) = 𝑏𝑗 , kann der 𝑗-te Induktionsschritt nicht über Fall I) definiert worden sein. Voraussetzung (c) schließt aber auch den Fall III) für den 𝑗ten Induktionsschritt aus. Also ist er über Fall II) definiert worden, d.h. es gibt ein 𝑘 ∈ ℕ mit (𝑎𝑗 , 𝑏𝑗 ) = (2𝑘, 2𝑘 + 1) und (𝑎𝑘 , 𝑏𝑘 ) ∈ 𝑅0 . Dann ist also 𝜎0 (𝑎𝑖 , 𝑏𝑖 ) = 2𝑘 und der 𝑖-te Induktionsschritt kann weder über Fall II) (da der Wert gerade ist) noch über Fall III) (Voraussetzung (a) schließt diesen Wert aus) definiert worden sein. Nach Fall I) gilt dann 𝑖 = 𝑘 und (𝑎𝑖 , 𝑏𝑖 ) ∈ 𝑅0 .
1.4.3 Modelltheoretische Charakterisierung Es soll nun eine modelltheoretische Charakterisierung der Interpretierbarkeit angegeben werden, welche für mehrdimensionale und insbesondere auch für die normale relative Interpretierbarkeit gültig ist. Definition 1.4.15. Sei 𝐼 : 𝐿[𝑆] → 𝐿[𝑇] eine Übersetzung, welche die Klauseln i)-iv) von Definition 1.4.1 bezüglich der Formeln 𝛿, 𝜑𝑃1 , ..., 𝜑𝑃𝑘 erfüllt, und M eine
1.4 Mehrdimensionale Interpretierbarkeit |
39
𝐿[𝑇]-Struktur. Dann bezeichne M|𝐼 die 𝐿[𝑆]-Struktur ⟨𝛿M , 𝜑𝑃M1 , ..., 𝜑𝑃M𝑘 ⟩.³² In der Situation dieser Definition gilt nun folgendes Lemma. Lemma 1.4.16. Für alle Sätze 𝜓 ∈ 𝐿[𝑆] gilt: M 𝐼(𝜓) ⇔ M|𝐼 𝜓. Beweis. 𝑑 ist durch die 𝑑-dimensionale Interpretation 𝐼 fixiert. Für eine M|𝐼 Belegung 𝛽 sei 𝛽∗ die M-Belegung, welche mit Hilfe von ”Division mit Rest” (euklidischer Algorithmus) eindeutig durch
𝛽∗ [𝑣𝑚⋅𝑑+𝑟 ] = 𝜋𝑟 (𝛽[𝑣𝑚 ]) definiert ist, wobei 𝑟 < 𝑑 ist und 𝜋𝑟 : 𝑑𝑜𝑚(M)𝑑 → 𝑑𝑜𝑚(M) die 𝑟-te kanonische Projektion bezeichnet, d.h. 𝜋𝑟 (⟨𝑎0 , ...., 𝑎𝑑−1 ⟩) = 𝑎𝑟 . Wenn 𝑑 = 1, dann sei 𝛽∗ = 𝛽. Damit beweisen wir mittels Induktion über den Formelaufbau von 𝜓 ∈ 𝐿[𝑆] für alle M|𝐼 -Belegungen 𝛽
M, 𝛽∗ 𝐼(𝜓) ⇔ M|𝐼 , 𝛽 𝜓. Sei 𝜓 zunächst atomar. Wenn 𝜓 die Gleichung 𝑣𝑖 = 𝑣𝑗 ist, gilt 𝑑−1
M, 𝛽∗ 𝐼(𝑣𝑖 = 𝑣𝑗 ) ⇔ M, 𝛽∗ ⋀ 𝑣𝑖⋅𝑑+𝑙 = 𝑣𝑗⋅𝑑+𝑙 𝑙=0
⇔ für alle 𝑙 = 0, ..., 𝑑 − 1 𝛽∗ (𝑣𝑖⋅𝑑+𝑙 ) = 𝛽∗ (𝑣𝑗⋅𝑑+𝑙 ) ⇔ für alle 𝑙 = 0, ..., 𝑑 − 1 𝜋𝑙 (𝛽(𝑣𝑖 )) = 𝜋𝑙 (𝛽(𝑣𝑗 )) ⇔ 𝛽(𝑣𝑖 ) = 𝛽(𝑣𝑗 ) ⇔ M|𝐼 , 𝛽 𝑣𝑖 = 𝑣𝑗 . Andernfalls ist für ein 1 ≤ 𝑖 ≤ 𝑘 𝜓 ≐ 𝑃𝑖 (𝑣0 , ..., 𝑣𝑛𝑖 ). Dann gilt
M, 𝛽∗ 𝐼(𝑃𝑖 (𝑣0 , ..., 𝑣𝑛𝑖 )) ⇔ M, 𝛽∗ 𝜑𝑃𝑖 (𝑣0 , ..., 𝑣𝑑−1 , ..., 𝑣𝑛𝑖 ⋅𝑑 , ..., 𝑣𝑛𝑖 ⋅𝑑+𝑑−1 ) ⇔ ⟨𝛽∗ (𝑣0 ), ..., 𝛽∗ (𝑣𝑑−1 ), ..., 𝛽∗ (𝑣𝑛𝑖 ⋅𝑑 ), ..., 𝛽∗ (𝑣𝑛𝑖 ⋅𝑑+𝑑−1 )⟩ ∈ 𝜑𝑃M𝑖 ⇔ ⟨𝜋0 (𝛽(𝑣0 )), ..., 𝜋𝑑−1 (𝛽(𝑣0 )), ..., 𝜋0 (𝛽(𝑣𝑛𝑖 )), ..., 𝜋𝑑−1 (𝛽(𝑣𝑛𝑖 ))⟩ ∈ 𝜑𝑃M𝑖 32 Für eine 𝐿-Struktur S und eine 𝐿-Formel 𝜒(𝑥1 , ..., 𝑥𝑛 ) ist
𝜒S = {⟨𝑎1 , ..., 𝑎𝑛 ⟩ ∈ 𝑑𝑜𝑚(S)𝑛 | S, 𝛽(𝑥1 : 𝑎1 )...(𝑥𝑛 : 𝑎𝑛 ) 𝜒(𝑥1 , ..., 𝑥𝑛 )}.
40 | 1 Interpretierbarkeit
⇔ ⟨𝛽(𝑣0 ), ..., 𝛽(𝑣𝑛𝑖 )⟩ ∈ 𝜑𝑃M𝑖 ⇔ M|𝐼 , 𝛽 𝑃𝑖 (𝑣0 , ..., 𝑣𝑛𝑖 ). Die Induktionsschritte für die Junktoren folgen aus iii) von Definition 1.4.1, Regeln der Semantik und der jeweiligen Induktionsvoraussetzung. Als letztes ist der Induktionsschritt für die Quantoren zu zeigen. Gelte als Induktionsvoraussetzung für alle M|𝐼 -Belegungen 𝛽, dass M, 𝛽∗ 𝐼(𝜓 ) ⇔ M|𝐼 , 𝛽 𝜓 . Für die Variante der Belegungen gilt für alle ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩ ∈ 𝛿M
𝛽(𝑣𝑗 : ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩)∗ [𝑣𝑚⋅𝑑+𝑟 ] = 𝜋𝑟 (𝛽(𝑣𝑗 : ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩)[𝑣𝑚 ]) 𝑎, = { 𝑟∗ 𝛽 [𝑣𝑚⋅𝑑+𝑟 ],
wenn 𝑚 = 𝑗 wenn 𝑚 ≠ 𝑗
∗
= 𝛽 (𝑣𝑗⋅𝑑 : 𝑎0 )...(𝑣𝑗⋅𝑑+𝑑−1 : 𝑎𝑑−1 )[𝑣𝑚⋅𝑑+𝑟 ] Damit gilt für 𝜓 ≐ ∀𝑣𝑗 𝜓
M, 𝛽∗ 𝐼(∀𝑣𝑗 𝜓 ) ⇔ M, 𝛽∗ ∀𝑣𝑗⋅𝑑 ...∀𝑣𝑗⋅𝑑+𝑑−1 (𝛿(𝑣𝑗⋅𝑑 , ..., 𝑣𝑗⋅𝑑+𝑑−1 ) → 𝐼(𝜓 )) ⇔ für alle 𝑎0 , ..., 𝑎𝑑−1 ∈ 𝑑𝑜𝑚(M) M, 𝛽∗ (𝑣𝑗⋅𝑑 : 𝑎0 )...(𝑣𝑗⋅𝑑+𝑑−1 : 𝑎𝑑−1 ) 𝛿(𝑣𝑗⋅𝑑 , ..., 𝑣𝑗⋅𝑑+𝑑−1 ) → 𝐼(𝜓 ) ⇔ für alle ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩ ∈ 𝛿M M, 𝛽∗ (𝑣𝑗⋅𝑑 : 𝑎0 )...(𝑣𝑗⋅𝑑+𝑑−1 : 𝑎𝑑−1 ) 𝐼(𝜓 ) ⇔ für alle ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩ ∈ 𝛿M M, 𝛽(𝑣𝑗 : ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩)∗ 𝐼(𝜓 ) ⇔ für alle ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩ ∈ 𝑑𝑜𝑚(M|𝐼 ) M|𝐼 , 𝛽(𝑣𝑗 : ⟨𝑎0 , ..., 𝑎𝑑−1 ⟩) 𝜓 ⇔ M|𝐼 , 𝛽 ∀𝑣𝑗 𝜓 . Somit ist die Induktion abgeschlossen und das Lemma bewiesen. Die Interpretierbarkeit von einer Theorie 𝑆 in eine Theorie 𝑇 via 𝐼 bedeutet also modelltheoretisch, dass für alle Modelle M von 𝑇 die in 𝐿[𝑇] definierbare 𝐿[𝑆]Struktur M|𝐼 ⊆ M Modell von 𝑆 ist.³³
33 Denn für Klausel v) von Definition 1.4.1 gilt mit vorangehendem Lemma: ∀𝜑 ∈ 𝑆 𝑇 ⊢ 𝐼(𝜑) ⇔ ∀M 𝑇 M|𝐼 𝑆. Vgl. Montague (1965a) für eine ähnliche Charakterisierung allerdings eingeschränkt auf eindimensionale Interpretationen und endlich axiomatisierbare Theorien.
1.5 Identitätsmodifizierende Interpretierbarkeit |
41
1.5 Identitätsmodifizierende Interpretierbarkeit Definition 1.5.1. Sei 𝜑= (𝑥, 𝑦) eine zweistellige Formel aus 𝐿[𝑇]. Gilt dann für eine Funktion 𝐼 : 𝐿[𝑆] → 𝐿[𝑇] die Definition 1.1.1 außer statt i) i)’ für alle 𝑛, 𝑚: 𝐼(𝑣𝑛 = 𝑣𝑚 ) ≐ 𝜑= (𝑣𝑛 , 𝑣𝑚 ), dann nennen wir 𝐼 eine identitätsmodifizierende relative Interpretation und schreiben, wenn es eine solche gibt, 𝑆 ⪯= 𝑇. Bemerkung 1.5.2. Da 𝑆 die identitätslogischen Axiome enthält, folgt aus 𝑆 ⪯= 𝑇 sowohl 𝑇 ⊢ ∀𝑥(𝛿(𝑥) → 𝜑= (𝑥, 𝑥)) als auch für alle Formeln 𝜓(𝑧) ∈ 𝐿[𝑆], in denen 𝑧 frei für 𝑥 und 𝑦 ist,
𝑇 ⊢ ∀𝑥∀𝑦(𝛿(𝑥) ∧ 𝛿(𝑦) ∧ 𝜑= (𝑥, 𝑦) → (𝐼(𝜓(𝑥)) ↔ 𝐼(𝜓(𝑦)))). Daraus kann in 𝑇 hergeleitet werden, dass 𝜑= auf 𝛿 eine Äquivalenzrelation ist (d.h. reflexiv, symmetrisch und transitiv). Nun kann gezeigt werden, dass wenn 𝑇 eine definierbare Wohlordnung des Objektbereiches erlaubt (eine fundierte Halbordnung würde auch reichen), eine identitätsmodifizierende Interpretation in eine normale überführt werden kann. Definition 1.5.3. Eine Theorie 𝑇 hat eine Wohlordnung, wenn es eine zweistellige Formel 𝑥𝑅𝑦 in 𝐿[𝑇] gibt, sodass 𝑇 beweist
∀𝑥∀𝑦∀𝑧(𝑥𝑅𝑦∧𝑦𝑅𝑧 → 𝑥𝑅𝑧)∧∀𝑥∀𝑦(𝑥𝑅𝑦∧𝑦𝑅𝑥 → 𝑥 = 𝑦)∧∀𝑥∀𝑦(𝑥𝑅𝑦∨𝑦𝑅𝑥) und für alle Formeln 𝜑(𝑥) in 𝐿[𝑇] mit mindestens einer freien Variable 𝑥
𝑇 ⊢ ∃𝑥𝜑(𝑥) → ∃𝑥(𝜑(𝑥) ∧ ∀𝑦(𝜑(𝑦) → 𝑥𝑅𝑦)). Satz 1.5.4. Wenn 𝑇 eine Wohlordnung hat, dann gilt: 𝑆 ⪯= 𝑇 ⇔ 𝑆 ⪯ 𝑇. Beweis. (⇐): trivial für 𝜑= (𝑥, 𝑦) ≐ (𝑥 = 𝑦). (⇒): Gelte 𝑆 ⪯= 𝑇 unter Rückgriff auf 𝐼, 𝜑= , 𝜑𝑃 und 𝛿. Seien nun 𝜑𝑃 ≐ 𝜑𝑃 , aber 𝛿 (𝑥) ≐ 𝛿(𝑥) ∧ ∀𝑦(𝜑= (𝑥, 𝑦) ∧ 𝛿(𝑦) → 𝑥𝑅𝑦). Mit diesen Formeln kann nun über den Formelaufbau induktiv eine Funktion 𝐼 : 𝐿[𝑆] → 𝐿[𝑇] definiert werden, welche die Bedingungen i)-iv) von Definition 1.1.1 genügt (denn diese sind die Induktionsbedingungen). Nun ist noch Bedingung v) für 𝐼 nachzuweisen. Dafür zeigen wir erst folgendes Lemma.
42 | 1 Interpretierbarkeit
Lemma 1.5.5. Sei 𝜓 eine Formel aus 𝐿[𝑆] mit freien Variablen 𝑣1 , ..., 𝑣𝑛 . Dann beweist 𝑇 für alle 𝑣1 , ..., 𝑣𝑛 𝑛
⋀ 𝛿 (𝑣𝑖 ) → (𝐼 (𝜓) ↔ 𝐼(𝜓)). 𝑖=1
Beweis des Lemmas. Induktion über den Formelaufbau von 𝜓 ∈ 𝐿[𝑆], wir beweisen informell innerhalb der Theorie 𝑇: Als atomare (offene!) Formel kann 𝜓 nur eine Variablengleichung 𝑣𝑖 = 𝑣𝑗 oder für ein 𝑛-stelliges Prädikatsymbol 𝑃
die Formel 𝑃𝑣1 ...𝑣𝑛 sein. Da 𝐼(𝑃𝑣1 ...𝑣𝑛 ) ≐ 𝐼 (𝑃𝑣1 ...𝑣𝑛 ), ist der zweite Fall trivial. Im ersten Fall ist zu zeigen, dass, wenn 𝛿(𝑣𝑖 ) ∧ ∀𝑤𝑖 (𝛿(𝑤𝑖 ) ∧ 𝜑= (𝑤𝑖 , 𝑣𝑖 ) → 𝑣𝑖 𝑅𝑤𝑖 ) ∧ 𝛿(𝑣𝑗 ) ∧ ∀𝑤𝑖 (𝛿(𝑤𝑖 ) ∧ 𝜑= (𝑤𝑖 , 𝑣𝑗 ) → 𝑣𝑗 𝑅𝑤𝑖 ), dann gilt auch
𝑣𝑖 = 𝑣𝑗 ↔ 𝜑= (𝑣𝑖 , 𝑣𝑗 ). Die Richtung von links nach rechts folgt ohne die Wohlordnung schon aus der Reflexivität von 𝜑= (s. Bemerkung 1.5.2). Die Rückrichtung folgt aus der Antisymmetrie der Wohlordnung, denn aus 𝜑= (𝑣𝑖 , 𝑣𝑗 ) folgt mit dem Antezedens und der Symmetrie von 𝜑= (s. Bemerkung 1.5.2) sowohl 𝑣𝑖 𝑅𝑣𝑗 als auch 𝑣𝑗 𝑅𝑣𝑖 , also 𝑣𝑖 = 𝑣𝑗 . Für die Induktionsschritte werden nun die Klauseln iii) und iv) der Definitionen von 𝐼, bzw. 𝐼 angewandt. Für Negationen und Konditionale folgt das Resultat unmittelbar (Aussagenlogik des Bikonditionals). Als letztes ist die Aussage für die Formel ∀𝑣𝜓(𝑣) zu zeigen, wobei in 𝜓 die Variablen 𝑣1 , ...𝑣𝑛 frei vorkommen mögen. Die Induktionsvoraussetzung besagt dann, dass 𝑛
⋀ 𝛿 (𝑣𝑖 ) ∧ ∀𝑣(𝛿(𝑣) ∧ ∀𝑤(𝜑= (𝑣, 𝑤) ∧ 𝛿(𝑤) → 𝑣𝑅𝑤) → (𝐼 (𝜓(𝑣)) ↔ 𝐼(𝜓(𝑣)))). 𝑖=1
𝑛
Dann ist zu zeigen, dass ⋀𝑖=1 𝛿 (𝑣𝑖 ) →
[∀𝑣(𝛿(𝑣) ∧ ∀𝑤(𝜑= (𝑣, 𝑤) ∧ 𝛿(𝑤) → 𝑣𝑅𝑤) → 𝐼 (𝜓(𝑣))) ↔ ∀𝑣(𝛿(𝑣) → 𝐼(𝜓(𝑣)))] Die Richtung von rechts nach links folgt direkt aus der Induktionsvoraussetzung. Für die andere Richtung sei 𝑣0 mit 𝛿(𝑣0 ) fixiert, außerdem gilt aufgrund der Reflexivität von 𝜑= auch 𝜑= (𝑣0 , 𝑣0 ). Nach Definition 1.5.3 („least number principle“) gibt es dann ein 𝑥0 mit
𝛿(𝑥0 ) ∧ 𝜑= (𝑥0 , 𝑣0 ) ∧ ∀𝑦(𝛿(𝑦) ∧ 𝜑= (𝑦, 𝑣0 ) → 𝑥0 𝑅𝑦). Augrund von Transitivität und Symmetrie von 𝜑= (s. Bemerkung 1.5.2) gilt dann auch
𝛿(𝑥0 ) ∧ ∀𝑦(𝛿(𝑦) ∧ 𝜑= (𝑥0 , 𝑦) → 𝑥0 𝑅𝑦). Mit den Voraussetzungen erhalten wir damit 𝐼 (𝜓(𝑥0 )) und 𝐼(𝜓(𝑥0 )). Da nun 𝛿(𝑣0 ) ∧ 𝛿(𝑥0 ) ∧ 𝜑= (𝑥0 , 𝑣0 ) gilt nach dem Leibnizprinzip aus Bemerkung 1.5.2 für die Formel 𝜓 ∈ 𝐿[𝑆] auch 𝐼(𝜓(𝑣0 )).
1.6 Mehrdimensionale, identitätsmodifizierende Interpretierbarkeit |
43
Ist nun 𝜓 ∈ 𝑆 ein Satz, folgt aus dem Lemma 𝑇 ⊢ 𝐼 (𝜓) ↔ 𝐼(𝜓). Wegen Bedingung v) von Definition 1.1.1 gilt aber 𝑇 ⊢ 𝐼(𝜓), also auch 𝑇 ⊢ 𝐼 (𝜓). Bemerkung 1.5.6. Die Robinson-Arithmetik 𝑄 mit Induktionsschema für quantorenfreie Formeln beweist die Linearität ihrer Ordnung (siehe Hajek und Pudlák (1998, Theorem 1.10 (7),(8),(9))). Das „least number principle“, das für die Wohlordnung dann noch fehlt, folgt aus dem Induktionsschema, wobei eine Einschränkung des Induktionsschemas auf eine Fomelklasse genau die analoge Einschränkung des „least number principle“ nach sich zieht (siehe Hajek und Pudlák (1998, Theorem 1.22)). Also hat 𝑃𝐴 eine Wohlordnung. Das Konzept der Identitätsmodifikation erlaubt Interpretation in Theorien ohne Identität. Wer Reduktionen auch als Reduzierung des Vokabulars ansehen will, mag deshalb den Begriff identitätsmodifizierender Interpretierbarkeit dem der normalen Interpretierbarkeit vorziehen. Das folgende Beispiel der Elimination der Identität in der Mengentheorie soll dies verdeutlichen. Beispiel 1.5.7. Da 𝑍𝐹 in der prädikatenlogischen Sprache 𝐿 erster Stufe mit Identität, dessen Signatur nur das zweistellige Relationssymbol ∈ enthält, das Extensionalitätsaxiom
∀𝑥∀𝑦(𝑥 = 𝑦 ↔ ∀𝑧(𝑧 ∈ 𝑥 ↔ 𝑧 ∈ 𝑦)) enthält, ist es möglich das Identitätssymbol zu eliminieren. Sei 𝜑∗ die Formel, die aus der Formel 𝜑 entsteht, imdem jede Gleichung durch die rechte Seite des Bikonditionals im Extensionalitätsaxiom ersetzt wird. Dann gilt für alle 𝜑 ∈ 𝐿 𝑍𝐹 ⊢ 𝜑 ↔ 𝜑∗ . Sei nun 𝐿∗ die prädikatenlogische Sprache erster Stufe ohne Identität, dessen Signatur nur ∈ enthält, und 𝑍𝐹∗ = {𝜑∗ |𝜑 ∈ 𝑍𝐹}. Dann ist 𝑍𝐹∗ tatsächlich eine 𝐿∗ -Theorie und 𝑍𝐹 ⪯= 𝑍𝐹∗ .
1.6 Mehrdimensionale, identitätsmodifizierende Interpretierbarkeit Übersichtshalber schreiben wir in diesem Abschnitt für alle 𝑛 ≥ 0 das Variablen𝑑-Tupel ⟨𝑣𝑛⋅𝑑 , ..., 𝑣𝑛⋅𝑑+𝑑−1 ⟩ als 𝑣𝑛 , sodass beispielsweise für eine 𝑑-stellige Formel 𝜑 die Abkürzung 𝜑(𝑣𝑛 ) für 𝜑(𝑣𝑛⋅𝑑 , ..., 𝑣𝑛⋅𝑑+𝑑−1 ) steht. Außerdem stehe für 𝑛, 𝑚 ≥ 0 𝑣𝑛 = 𝑣𝑚 für ⋀𝑑−1 𝑖=0 𝑣𝑛⋅𝑑+𝑖 = 𝑣𝑚⋅𝑑+𝑖 und für ein Quantor Q ∈ {∀, ∃} stehe Q𝑣𝑛 für Q𝑣𝑛⋅𝑑 ...Q𝑣𝑛⋅𝑑+𝑑−1 . Definition 1.6.1. Sei 𝑑 ≥ 1. Ist 𝑃 ein 𝑛-stelliges Prädikatsymbol des Vokabulars von 𝐿[𝑆], dann sei 𝜑𝑃 eine 𝑛 ⋅ 𝑑-stellige Formel in 𝐿[𝑇], 𝜑= (𝑥, 𝑦) eine 2 ⋅ 𝑑-stellige
44 | 1 Interpretierbarkeit
Formel in 𝐿[𝑇] und 𝛿 eine Formel in 𝐿[𝑇] mit genau 𝑑 freien Variablen. Dann ist 𝐼 : 𝐿[𝑆] → 𝐿[𝑇] eine 𝑑-dimensionale, identitätsmodifizierende, relative Interpretation von 𝑆 in 𝑇, wenn sie folgende Bedingungen erfüllt: i) für alle 𝑛, 𝑚: 𝐼(𝑣𝑛 = 𝑣𝑚 ) ≐ 𝜑= (𝑣𝑛 , 𝑣𝑚 ), ii) für alle 𝑛-stelligen Prädikatsymbole 𝑃 von 𝐿[𝑆]: 𝐼(𝑃𝑣𝑖1 ...𝑣𝑖𝑛 ) = 𝜑𝑃 (𝑣𝑖1 ...𝑣𝑖𝑛 ), iii) für alle Formeln 𝜓, 𝜒 in 𝐿[𝑆]: 𝐼(¬𝜓) ≐ ¬𝐼(𝜓) und 𝐼(𝜓 → 𝜒) ≐ 𝐼(𝜓) → 𝐼(𝜒), iv) für alle Formeln 𝜓 in 𝐿[𝑆] und alle 𝑛: 𝐼(∀𝑣𝑛 𝜓) ≐ ∀𝑣𝑛 (𝛿(𝑣𝑛 ) → 𝐼(𝜓)), v) für alle Sätze 𝜓 in 𝐿[𝑆]: Wenn 𝜓 ∈ 𝑆, dann 𝑇 ⊢ 𝐼(𝜓).
𝑆 ist 𝑑-dimensional relativ, identitätsmodifizierend interpretierbar in 𝑇, geschrieben 𝑆 ⪯𝑑= 𝑇, wenn es eine 𝑑-dimensionale, identitätsmodifizierende, relative Interpretation von 𝑆 in 𝑇 gibt. Definition 1.6.2. (Vgl. Marcja und Toffalori (2003, S. 125)) 𝑇 hat uniforme Elimination der Imaginären, wenn für jede in 𝑇 definierbare Äquivalenzrelation ∼ es eine in 𝑇 definierbare Funktion 𝑓 gibt, welche jedem Element einer Äquivalenzklasse einen Repräsentanten zuordnet, d.h. 𝑇 ⊢ ∀𝑦(𝑓(𝑦) ∼ 𝑦 ∧ ∀𝑥(𝑥 ∼ 𝑦 ↔ 𝑓(𝑥) = 𝑓(𝑦))). Bemerkung 1.6.3. 𝑃𝐴 und 𝑅𝐶𝐹 haben die uniforme Elimination der Imaginären, vgl. Hodges (1993, S. 162) und Korollar 2.3.7. Satz 1.6.4. Wenn 𝑇 die uniforme Elimination der Imaginären hat, dann 𝑆 ⪯𝑑= 𝑇 ⇔ 𝑆 ⪯𝑑 𝑇. Beweis. (⇐) ist trivial mit 𝜑= (𝑣𝑛 , 𝑣𝑚 ) ≐ 𝑣𝑛 = 𝑣𝑚 . (⇒): Wie schon in Bemerkung 1.5.2 festgestellt, verhält sich 𝜑= wie eine Äquivalenzrelation auf 𝛿𝑑 . Damit gibt es eine in 𝑇 definierbare Repräsentantenfunktion 𝑓 : 𝛿𝑑 → 𝛿𝑑 für 𝜑= . Gelte 𝑆 ⪯= 𝑇 unter Rückgriff auf 𝐼, 𝜑= , 𝜑𝑃 und 𝛿. Seien nun 𝜑𝑃 ≐ 𝜑𝑃 , aber 𝛿 (𝑣) ≐ (𝛿(𝑣) ∧ 𝑣 = 𝑓(𝑣)). Mit diesen Formeln kann nun über den Formelaufbau induktiv eine Funktion 𝐼 : 𝐿[𝑆] → 𝐿[𝑇] definiert werden, welche die Bedingungen i)-iv) von Definition 1.1.1 genügt. Nun ist noch Bedingung v) für 𝐼 nachzuweisen. Dafür ist zu zeigen: Für eine Formel 𝜓 aus 𝐿[𝑆] mit freien Variablen 𝑣1 , ..., 𝑣𝑛 beweist 𝑇 𝑛
⋀ 𝛿 (𝑣𝑖 ) → (𝐼(𝜓) ↔ 𝐼 (𝜓)). 𝑖=1
Der Induktionsbeweis für diese Aussage entspricht dem für das Lemma 1.5.5, nur die Schritte für die Variablengleichung und die Allquantifikation müssen angepasst werden; es wird innerhalb 𝑇 argumentiert. Sei also zunächst 𝜓 ≐ (𝑣𝑖 = 𝑣𝑗 ).
1.7 Interpretierbarkeit mit Parametern |
45
Dann ist zu zeigen, dass
∀𝑣𝑖 ∀𝑣𝑗 (𝛿(𝑣𝑖 ) ∧ 𝑣𝑖 = 𝑓(𝑣𝑖 ) ∧ 𝛿(𝑣𝑗 ) ∧ 𝑣𝑗 = 𝑓(𝑣𝑗 ) → (𝜑= (𝑣𝑖 , 𝑣𝑗 ) ↔ 𝑣𝑖 = 𝑣𝑗 )). Aus 𝑣𝑖 = 𝑣𝑗 folgt 𝜑= (𝑣𝑖 , 𝑣𝑗 ) aufgrund der Reflexivität der Äquivalenzrelation 𝜑= . Außerdem folgt ”innerhalb 𝛿” aus 𝜑= (𝑣𝑖 , 𝑣𝑗 ) und der Eigenschaft der Repräsentantenfunktion (Definition 1.6.2), dass 𝑓(𝑣𝑖 ) = 𝑓(𝑣𝑗 ) und mit dem Antezedens gilt dann 𝑣𝑖 = 𝑓(𝑣𝑖 ) = 𝑓(𝑣𝑗 ) = 𝑣𝑗 . Schließlich sei 𝜓 ≐ ∀𝑣𝑛 𝜓 (𝑣𝑛 ). OBdA ignorieren wir mögliche andere freie Variablen in 𝜓 als 𝑣𝑛 . Dann ist unter der Induktionsvoraussetzung ∀𝑣𝑛 (𝛿(𝑣𝑛 ) → (𝐼(𝜓 (𝑣𝑛 )) ↔ 𝐼 (𝜓 (𝑣𝑛 )))) zu zeigen,
∀𝑣𝑛 (𝛿(𝑣𝑛 ) → 𝐼(𝜓 (𝑣𝑛 ))) ↔ ∀𝑣𝑛 (𝛿(𝑣𝑛 ) ∧ 𝑣𝑛 = 𝑓(𝑣𝑛 ) → 𝐼 (𝜓 (𝑣𝑛 ))) Die Richtung von links nach rechts folgt direkt aus der Induktionsvoraussetzung. Für die Richtung von rechts nach links sei ein 𝑣𝑛 mit 𝛿(𝑣𝑛 ) fixiert. Nun betrachte 𝑓(𝑣𝑛 ). Da 𝑓 auf 𝛿𝑑 abbildet, ist ebenso 𝛿(𝑓(𝑣𝑛 )). Außerdem ist 𝑓(𝑣𝑛 ) = 𝑓(𝑓(𝑣𝑛 )), denn im Allgemeinen gilt nach Definition 1.6.2 𝑓(𝑥) ∼ 𝑥 und 𝑓(𝑥) ∼ 𝑥 → 𝑓(𝑓(𝑥)) = 𝑓(𝑥). Also gilt mit dem rechten Bikonditionalglied spezialisiert 𝑣
𝑛 .³⁴ Mit der Induktionsvoraussetzung gilt dann auf 𝑓(𝑣𝑛 ) auch 𝐼 (𝜓 (𝑣𝑛 ))𝑓(𝑣 ) 𝑛
𝑣
𝑛 𝐼(𝜓 (𝑣𝑛 ))𝑓(𝑣 . Nun ist aber 𝜑= (𝑓(𝑣𝑛 ), 𝑣𝑛 ) und nach dem Leibnizprinzip (siehe 𝑛) Bemerkung 1.5.2) gilt dann auch 𝐼(𝜓 (𝑣𝑛 )).
Ist nun 𝜓 ∈ 𝑆 ein Satz, folgt aus dem Lemma 𝑇 ⊢ 𝐼(𝜓) ↔ 𝐼 (𝜓). Wegen Bedingung v) von Definition 1.6.1 gilt aber 𝑇 ⊢ 𝐼(𝜓), also auch 𝑇 ⊢ 𝐼 (𝜓).
1.7 Interpretierbarkeit mit Parametern Eine Übersetzung mit Parametern ist ähnlich definiert wie die relative Interpretation in Definition 1.1.1 außer dass in den Formeln 𝜑𝑃 , bzw. 𝛿 mehr freie Variablen vorkommen dürfen als die Stelligkeit von 𝑃, bzw. 1. Definition 1.7.1. Sei 𝑝 ≥ 0 (die Anzahl der benötigten Parameter). Ist 𝑃 ein 𝑛stelliges Prädikatsymbol des Vokabulars von 𝐿[𝑆], dann sei 𝜑𝑃 eine Formel in 𝐿[𝑇] mit 𝑛 + 𝑝 freien Variablen und 𝛿 eine Formel aus 𝐿[𝑇] mit 𝑝 + 1 freien Variablen. Dann ist 𝐼 : 𝐿[𝑆] → 𝐿[𝑇] eine Übersetzung mit Parametern von 𝐿[𝑆] nach 𝐿[𝑇], wenn sie folgende Bedingungen erfüllt: 34 Mit 𝜑𝑥 ist das Resultat der simultanen Substitution des Variablentupels 𝑥 durch das Termtu𝑡
pel 𝑡 in 𝜑 gemeint.
46 | 1 Interpretierbarkeit
i) für alle 𝑛, 𝑚: 𝐼(𝑣𝑛 = 𝑣𝑚 ) ≐ (𝑣𝑛+𝑝 = 𝑣𝑚+𝑝 ), ii) für alle 𝑛-stelligen Prädikatsymbole 𝑃 von 𝐿[𝑆]: 𝐼(𝑃𝑣𝑖1 ...𝑣𝑖𝑛 ) ≐ 𝜑𝑃 (𝑣𝑖1 +𝑝 , ..., 𝑣𝑖𝑛 +𝑝 , 𝑣0 , ..., 𝑣𝑝−1 ), iii) für alle Formeln 𝜓, 𝜒 in 𝐿[𝑆]: 𝐼(¬𝜓) ≐ ¬𝐼(𝜓) und 𝐼(𝜓 → 𝜒) ≐ 𝐼(𝜓) → 𝐼(𝜒), iv) für alle Formeln 𝜓 in 𝐿[𝑆] und alle 𝑛: 𝐼(∀𝑣𝑛 𝜓) ≐ ∀𝑣𝑛+𝑝 (𝛿(𝑣𝑛+𝑝 , 𝑣0 , ..., 𝑣𝑝−1 ) → 𝐼(𝜓)). Eine Übersetzung mit Parametern 𝐼 : 𝐿[𝑆] → 𝐿[𝑇] ist eine relative Interpretation mit Parametern von 𝑆 in 𝑇, wenn es außerdem eine Formel 𝜋 ∈ 𝐿[𝑇] mit 𝑝 freien Variablen gibt, sodass 𝑇 ⊢ ∃𝑣0 ...∃𝑣𝑝−1 𝜋(𝑣0 , ..., 𝑣𝑝−1 ) und für alle Sätze 𝜓 ∈ 𝑆 gilt
𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑝−1 (𝜋(𝑣0 , ..., 𝑣𝑝−1 ) → 𝐼(𝜓)). 𝑆 ist relativ interpretierbar mit Parametern in 𝑇, wenn es eine relative Interpretation mit Parametern von 𝑆 in 𝑇 gibt, geschrieben 𝑆 ⪯𝑝 𝑇 oder um die Abhängigkeit von 𝜋 zu kennzeichnen 𝑆 ⪯𝜋𝑝 𝑇. Die relative Interpretation mit Parametern in Sprachen mit Konstanten- und Funktionssymbolen ist analog zu Definition 1.2.1: 𝑆 ⪯𝑝 𝑇 ⇔ 𝑆∗ ⪯𝑝 𝑇. Als eine Art Transitivität dieser Relation gilt: Wenn 𝑅 ⪯𝜋𝑝11 𝑆 und 𝑆 ⪯𝜋𝑝22 𝑇, 𝜋 ∧𝜋
dann ist 𝑅 ⪯𝑝11 +𝑝22 𝑇.
Bemerkung 1.7.2. Diese Definition ist von Szczerba (1980) inspiriert und findet sich ähnlich auch bei Hajek und Pudlák (1998, III. 1.4.). Eine alternative Definition der parametrisierten Interpretation findet sich bei Mycielski et al. (1990, §1): Dort gibt es keine Bedingung an die Parameter in Form von 𝜋 und als zusätzliche Klausel an die Übersetzung wird nur 𝑇 ⊢ ∃𝑣0 ...∃𝑣𝑝−1 𝐼(𝜓) gefordert . Unter diesem Begriff einer Interpretation* wird jedoch Herleitbarkeit nicht übertragen, d.h. es gibt eine solche Interpretation* 𝐼 mit Parametern von 𝑆 in 𝑇 und Sätze 𝜓0 , ..., 𝜓𝑛 und 𝜑 aus 𝐿[𝑆], sodass gilt {𝜓0 , ..., 𝜓𝑛 } ⊢ 𝜑, aber {𝐼(𝜓0 ), ..., 𝐼(𝜓𝑛 )} ⊬ 𝐼(𝜑).³⁵ Damit fehlt diesem Interpretierbarkeitsbegriff eine wesentliche und wünschenswerte Eigenschaft. Das folgende Beispiel zeigt, dass die Parameter nicht immer eliminiert werden können.
35 Sei 𝜓0 ≐ ∀𝑣(𝑃0 𝑣 → ¬𝑃1 𝑣), 𝜓1 ≐ ∀𝑣(𝑃1 𝑣 → ¬𝑃2 𝑣)), 𝜓2 ≐ ∀𝑣(𝑃2 𝑣 → ¬𝑃0 𝑣) und die Prädikation 𝑃𝑖 𝑣 wird für 𝑖 = 0, 1, 2 durch eine unrelativierte Interpretation* 𝐼 mit 3 Parametern zu 𝑣 = 𝑣𝑖 übersetzt, dann ist der Satz 𝐼(𝜓𝑖 ) jeweils logisch äquivalent mit ∃𝑣0 , 𝑣1 (𝑣0 ≠ 𝑣1 ), aber 𝐼(𝜓0 ∧ 𝜓1 ∧ 𝜓2 ) logisch äquivalent mit ∃𝑣0 , 𝑣1 , 𝑣2 (𝑣0 ≠ 𝑣1 ∧ 𝑣1 ≠ 𝑣2 ∧ 𝑣2 ≠ 𝑣0 ).
1.7 Interpretierbarkeit mit Parametern |
47
Beispiel 1.7.3. (vgl. Szczerba (1980) oder Kapitel 5.3) Sei 𝐹 die Theorie der Körper in der Sprache {0, 1, +, ⋅} und 𝐺 die Theorie einer affinen Geometrie, in der eine Parallelenrelation 𝑤𝑥||𝑦𝑧 definiert werden kann (für „die Gerade durch 𝑤 und 𝑥 ist parallel zur Gerade durch 𝑦 und 𝑧“). Dann gilt 𝐹 ⪯2 𝐺 aufgrund von folgender Interpretation:
𝜋(𝑣0 , 𝑣1 ) ≐ 𝑣0 ≠ 𝑣1 , 𝛿(𝑣𝑖 ) ≐ 𝑣0 𝑣1 ||𝑣0 𝑣𝑖+2 , 𝐼(𝑅0 ) ≐ (𝑣𝑖+2 = 𝑣0 ), 𝐼(𝑅1 ) ≐ (𝑣𝑖+2 = 𝑣1 ), 𝐼(𝑅+ (𝑣𝑖1 𝑣𝑖2 𝑣𝑖3 )) ≐ ∃𝑣𝑗 ∃𝑣𝑘 (¬𝑣0 𝑣1 ||𝑣0 𝑣𝑗 ∧ 𝑣0 𝑣1 ||𝑣𝑘 𝑣𝑗 ∧ 𝑣0 𝑣𝑗 ||𝑣𝑖1 +2 𝑣𝑘 ∧ 𝑣𝑗 𝑣𝑖2 +2 ||𝑣𝑘 𝑣𝑖3 +2 ), 𝐼(𝑅⋅ (𝑣𝑖1 𝑣𝑖2 𝑣𝑖3 )) ≐ ∃𝑣𝑗 ∃𝑣𝑘 (¬𝑣0 𝑣1 ||𝑣0 𝑣𝑗 ∧ 𝑣0 𝑣𝑗 ||𝑣𝑗 𝑣𝑘 ∧ 𝑣1 𝑣𝑗 ||𝑣𝑖1 +2 𝑣𝑘 ∧ 𝑣𝑗 𝑣𝑖2 +2 ||𝑣𝑘 𝑣𝑖3 +2 ). Aber es gilt 𝐹 𝐺. Dies folgt aus dem modelltheoretischen Satz, dass definierbare Mengen von Automorphismen fixiert werden. Die (normale) Interpretation der Konstantensymbole (z.B. der 0) erfordert die eindeutige Definierbarkeit eines Objektes in 𝐺. Doch affine Räume können unter Automorphismen beliebig affin transformiert werden, sodass es einen Automorphismus gibt, der jenes Objekt nicht fixiert. Es können Interpretationen mit Parametern in bestimmte Theorien konstruiert werden, welche in gewissem Sinn degeneriert sind (da sie jeden Satz einer Theorie auf eine logische Wahrheit abbilden). Zwar sprechen diese Beispiele nicht unbedingt gegen parametrisierte Interpretierbarkeit (da in diesen Fällen auch normale relative Interpretierbarkeit zutreffen kann, vgl. Satz 1.7.7), aber gegebenenfalls gegen Interpretationen mit Parametern als Reduktionen. Beispiel 1.7.4. Sei 𝑆 endlich axiomatisierbar in einer Sprache 𝐿[𝑆] mit endlichem Vokabular {𝑃1 , ..., 𝑃𝑚 }. Für 1 ≤ 𝑖 ≤ 𝑚 sei 𝑃𝑖 𝑘𝑖 -stellig. Nun definieren wir gemäß der Definition 1.7.1 eine Übersetzung 𝐼 von 𝐿[𝑆] in die Sprache der Mengentheorie 𝐿[𝑍𝐹] (mit Tupelschreibweise) mit 𝑚 + 1 Parametern. Dafür seien für 1 ≤ 𝑖 ≤ 𝑚
𝜑𝑃𝑖 (𝑣1+𝑚 , ..., 𝑣𝑘𝑖 +𝑚 , 𝑣0 , ..., 𝑣𝑚 ) ≐ ⟨𝑣1+𝑚 , ..., 𝑣𝑘𝑖 +𝑚 ⟩ ∈ 𝑣𝑖 und 𝛿(𝑣𝑛+𝑚+1 , 𝑣0 , ..., 𝑣𝑚 ) ≐ 𝑣𝑛+𝑚+1 ∈ 𝑣0 . Sei 𝑆 axiomatisierbar durch den Satz 𝜒 ∈ 𝐿[𝑆]. Dann ist 𝐼(𝜒) eine Formel mit 𝑚 + 1 freien Variablen in 𝐿[𝑍𝐹]. Nun sei 𝜋(𝑣0 , ..., 𝑣𝑚 ) ≐ 𝐼(𝜒) und 𝑇 der deduktive Abschluss von {∃𝑣0 ...∃𝑣𝑚 𝜋(𝑣0 , ..., 𝑣𝑚 )}. Damit gilt 𝑆 ⪯𝑚+1 𝑇.
48 | 1 Interpretierbarkeit
Denn dafür ist nach Definition 1.7.1 nur noch zu überprüfen, dass für alle Sätze
𝜓 in 𝑆 gilt 𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑚 (𝜋(𝑣0 , ..., 𝑣𝑚 ) → 𝐼(𝜓)), also 𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑚 (𝐼(𝜒) → 𝐼(𝜓)). Doch 𝜒 axiomatisiert 𝑆, daher 𝜒 ⊢ 𝜓, mit Deduktionstheorem, also ⊢ 𝜒 → 𝜓. Übersetzungen definiert wie 𝐼 bilden Tautologien auf Tautologien ab,³⁶ deshalb ist auch ⊢ 𝐼(𝜒 → 𝜓), bzw. ⊢ 𝐼(𝜒) → 𝐼(𝜓) und ebenso die Generalisierung ∀𝑣0 ...∀𝑣𝑚 (𝐼(𝜒) → 𝐼(𝜓)) eine logische Wahrheit. 1.7.1 Elimination der Parameter durch Skolemfunktionen Ein Äquivalenzzusammenhang zwischen Interpretierbarkeit mit Parametern und normaler Interpretierbarkeit besteht, wenn Hilberts 𝜖-Operator ähnliche Selektoren (Skolemfunktionen) in 𝑇 vorhanden sind. Definition 1.7.5. Eine Theorie 𝑇 hat definierbare Skolemfunktionen, wenn für alle Formeln 𝜑 in 𝐿[𝑇] mit mindestens einer freien Variablen 𝑥 eine 𝐿[𝑇]-Formel 𝜓 mit den gleichen freien Variablen existiert, sodass
𝑇 ⊢ (𝜓 → 𝜑) ∧ (∃𝑥𝜑 → ∃!𝑥𝜓) 𝜓 heißt dann die Skolemfunktion von 𝜑. Bemerkung 1.7.6. Eine Theorie, die eine Wohlordnung hat, vgl. Definition 1.5.3, hat auch definierbare Skolemfunktionen. Dafür ist nur 𝜓(𝑥) ≐ 𝜑(𝑥)∧∀𝑦(𝜑(𝑦) → 𝑥𝑅𝑦) zu wählen. Außerdem hat 𝑅𝐶𝐹 definierbare Skolemfunktionen, vgl. Satz 2.3.4. Satz 1.7.7. Wenn 𝑇 definierbare Skolemfunktionen hat, dann gilt: Wenn 𝑆 ⪯𝑝 𝑇, dann 𝑆 ⪯ 𝑇. 𝑝
Beweis. Sei 𝐼𝑝 eine relative Interpretation mit 𝑝 Parametern von 𝑆 in 𝑇 und 𝜑𝑃 , 𝜋𝑝 und 𝛿𝑝 die entsprechenden Formeln aus Definition 1.7.1. Wir zeigen, dass es dann auch eine relative Interpretation 𝐼𝑝−1 mit 𝑝− 1 Parametern von 𝑆 in 𝑇 gibt. Daraus folgt dann die Behauptung induktiv. Sei 𝜓 die Skolemfunktion zu ∃𝑣0 ....∃𝑣𝑝−2 𝜋𝑝 in der Variablen 𝑣𝑝−1 (falls 𝑣𝑝−1 in 𝜋𝑝 nicht frei vorkommt, sei 𝜓 die Skolemfunktion zu 𝑣𝑝−1 = 𝑣𝑝−1 ). Aufgrund der Interpretierbarkeit mit Parametern gilt 𝑇 ⊢ ∃𝑣𝑝−1 ∃𝑣0 ...∃𝑣𝑝−2 𝜋𝑝 . Also gilt mit
36 Dies ist ein Hilfssatz über Übersetzungen, der mit einer Induktion über die Beweislänge bewiesen wird, vgl. Hajek und Pudlák (1998, S. 149)
1.7 Interpretierbarkeit mit Parametern |
49
der Definition 1.7.5
(∗) 𝑇 ⊢ ∀𝑣𝑝−1 (𝜓 → ∃𝑣0 ....∃𝑣𝑝−2 𝜋𝑝 ) ∧ ∃!𝑣𝑝−1 𝜓. Nun können wir eine relative Interpretation 𝐼𝑝−1 mit 𝑝 − 1 Parametern von 𝑆 in 𝑇 mit Hilfe von 𝐼𝑝 definieren. Dafür sei für ein 𝑛-stelliges Prädikatsymbol 𝑃 die Formeln 𝑝−1
𝑝
𝜑𝑃 (𝑣𝑖1 , ..., 𝑣𝑖𝑛 , 𝑣0 , ...𝑣𝑝−2 ) ≐ ∀𝑣𝑝−1 (𝜓(𝑣𝑝−1 ) → 𝜑𝑃 (𝑣𝑖1 , ..., 𝑣𝑖𝑛 , 𝑣0 , 𝑣1 , ..., 𝑣𝑝−1 )), 𝛿𝑝−1 (𝑣, 𝑣0 , ..., 𝑣𝑝−2 ) ≐ ∀𝑣𝑝−1 (𝜓(𝑣𝑝−1 ) → 𝛿𝑝 (𝑣, 𝑣0 , 𝑣1 , ..., 𝑣𝑝−1 )) 𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ) ≐ ∃𝑣𝑝−1 (𝜓(𝑣𝑝−1 ) ∧ 𝜋𝑝 (𝑣0 , ..., 𝑣𝑝−1 )). Dann kann 𝐼𝑝−1 entsprechend den Klauseln i)-iv) von Definition 1.7.1 induktiv über den Formelaufbau definiert werden. Aus (∗) folgt prädikatenlogisch
𝑇 ⊢ ∃𝑣0 ...∃𝑣𝑝−2 𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ). Nun ist noch zu zeigen, dass für alle Sätze 𝜒 ∈ 𝑆 gilt
𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑝−2 (𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ) → 𝐼𝑝−1 (𝜒)). Lemma 1.7.8. Sei 𝜒(𝑣0 , ..., 𝑣𝑛−1 ) eine Formel aus 𝐿[𝑆]. Dann beweist 𝑇 die Generalisierung von
𝜓(𝑣𝑝−1 ) ∧ 𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ) → (𝐼𝑝 (𝜒(𝑣0 , ..., 𝑣𝑛−1 )) ↔ 𝐼𝑝−1 (𝜒(𝑣1 , ..., 𝑣𝑛 ))).³⁷ Beweis des Lemmas. Wir beweisen das Lemma für alle Formeln 𝜒 ∈ 𝐿[𝑆] induktiv über den Formelaufbau und argumentieren informell innerhalb der Theorie 𝑇. Mit 𝜒 ≐ (𝑣𝑖 = 𝑣𝑗 ) ist 𝜓(𝑣𝑝−1 ) ∧ 𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ) → (𝑣𝑖+𝑝 = 𝑣𝑗+𝑝 ↔ 𝑣𝑖+𝑝 = 𝑣𝑗+𝑝 ) logisch wahr. Ist 𝜒 ≐ 𝑃𝑣0 ...𝑣𝑛−1 , dann folgt wegen ∃!𝑣𝑝−1 𝜓(𝑣𝑝−1 ) auch für beliebige
𝑣0 , ..., 𝑣𝑝−1 mit 𝜓(𝑣𝑝−1 ) und 𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ), dass 𝑝
𝜑𝑃 (𝑣𝑝 , ..., 𝑣𝑛+𝑝−1 , 𝑣0 , ..., 𝑣𝑝−2 , 𝑣𝑝−1 ) ↔ 𝑝
∀𝑣𝑝−1 (𝜓(𝑣𝑝−1 ) →𝜑𝑃 (𝑣𝑝 , ..., 𝑣𝑛+𝑝−1 , 𝑣0 , ..., 𝑣𝑝−2 , 𝑣𝑝−1 )). Für die Negation und das Konditional folgt die Behauptung des Lemmas unmittelbar aus der Induktionsvoraussetzung und Klausel iii) der Definition 1.7.1. Sei als
37 Da 𝐼𝑝 und 𝐼𝑝−1 unterschiedliche Variablenshifts vornehmen, muss bei der Formulierung des Lemmas eine eigene Indexkorrektur (Erhöhung um eins) bei 𝐼𝑝−1 vorgenommen werden.
50 | 1 Interpretierbarkeit letztes 𝜒 ≐ ∀𝑣𝑛 𝜒 (𝑣𝑛 ), wobei 𝜒 auch mehr freie Variablen enthalten mag, und nach Induktionsvoraussetzung gilt
∀𝑣𝑛+𝑝 ∀𝑣0 ...∀𝑣𝑝−1 [𝜓(𝑣𝑝−1 ) ∧ 𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ) → (𝐼𝑝 (𝜒 (𝑣𝑛 )) ↔ 𝐼𝑝−1 (𝜒 (𝑣𝑛+1 )))]. Sei nun 𝑣0 , ..., 𝑣𝑝−1 mit 𝜓(𝑣𝑝−1 )∧𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ) beliebig. Nehmen wir zuerst an, dass
∀𝑣𝑛+𝑝 (𝛿𝑝 (𝑣𝑛+𝑝 , 𝑣0 , ..., 𝑣𝑝−1 ) → 𝐼𝑝 (𝜒 (𝑣𝑛 ))) und für ein 𝑣𝑛+𝑝−1 mit ∀𝑣𝑝−1 (𝜓(𝑣𝑝−1 ) → 𝛿𝑝 (𝑣𝑛+𝑝−1 , 𝑣0 , ..., 𝑣𝑝−2 , 𝑣𝑝−1 )) zeigen wir,
dass 𝐼𝑝−1 (𝜒 (𝑣𝑛 )). Also gilt 𝛿𝑝 (𝑣𝑛+𝑝−1 , 𝑣0 , ..., 𝑣𝑝−2 , 𝑣𝑝−1 ) und auch 𝐼𝑝 (𝜒 (𝑣𝑛−1 )). Aus der Induktionsvoraussetzung folgt dann das gewünschte 𝐼𝑝−1 (𝜒 (𝑣𝑛 )). Nun nehmen wir an, dass
∀𝑣𝑛+𝑝−1 (∀𝑣𝑝−1 (𝜓(𝑣𝑝−1 ) → 𝛿𝑝 (𝑣𝑛+𝑝−1 , 𝑣0 , ..., 𝑣𝑝−2 , 𝑣𝑝−1 )) → 𝐼𝑝−1 (𝜒 (𝑣𝑛 ))) und zeigen für ein 𝑣𝑛+𝑝 mit 𝛿𝑝 (𝑣𝑛+𝑝 , 𝑣0 , ..., 𝑣𝑝−1 ), dass 𝐼𝑝 (𝜒 (𝑣𝑛 )). Da nun aber ∃!𝑣𝑝−1 𝜓(𝑣𝑝−1 ), gilt der Antecedens der Voraussetzung mit 𝑣𝑛+𝑝 statt 𝑣𝑛+𝑝−1 und es
gilt 𝐼𝑝−1 (𝜒 (𝑣𝑛+1 )). Aus der Induktionsvoraussetzung folgt dann das gewünschte 𝐼𝑝 (𝜒 (𝑣𝑛 )). Nun beweisen wir innerhalb der Theorie 𝑇: Erfüllen Parameter 𝑣0 , ..., 𝑣𝑝−2 die Be-
dingung 𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ), dann gibt es auch einen Parameter 𝑣𝑝−1 , der sowohl 𝜓(𝑣𝑝−1 ) als auch 𝜋𝑝 (𝑣0 , ..., 𝑣𝑝−1 ) erfüllt. Dann gilt aber aufgrund Interpretierbarkeit mit 𝑝 Parametern 𝐼𝑝 (𝜒) und aufgrund des Lemmas 𝐼𝑝 (𝜒) ↔ 𝐼𝑝−1 (𝜒). Also gilt auch 𝐼𝑝−1 (𝜒). Damit wurde gezeigt: 𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑝−2 (𝜋𝑝−1 (𝑣0 , ..., 𝑣𝑝−2 ) → 𝐼𝑝−1 (𝜒)). Bemerkung 1.7.9. Sei 𝑆 ⪯𝜋𝑝 𝑇. Wenn außerdem 𝑝−1
𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑝−1 ∀𝑣0 ...∀𝑣𝑝−1 (𝜋(𝑣0 , ..., 𝑣𝑝−1 ) ∧ 𝜋(𝑣1 , ..., 𝑣𝑝−1 ) → ⋀ 𝑣𝑖 = 𝑣𝑖 ), 𝑖=0
dann ist schon 𝑆 ⪯ 𝑇. Dafür kann im Beweis von Satz 1.7.7 𝜓 ≐ 𝜋 gewählt werden. Vgl. Hajek und Pudlák (1998, III.1.5.(3)).
1.7.2 Elimination der Parameter durch Konstanten Ein Zusammenhang zwischen normaler Interpretierbarkeit und Interpretierbarkeit mit Parametern kann gezeigt werden, wenn Konstantenerweiterungen berücksichtigt werden:
1.7 Interpretierbarkeit mit Parametern | 51
Definition 1.7.10. Gelte 𝑇 ⊢ ∃𝑣0 ...∃𝑣𝑝−1 𝜋(𝑣0 , ..., 𝑣𝑝−1 ). Dann sei 𝑇𝜋 der deduktive Abschluss von 𝑇 ∪ {𝜋(𝑐0 , ..., 𝑐𝑝−1 )} in der Sprache 𝐿[𝑇𝜋 ], deren Vokabular das von 𝐿[𝑇] um die 𝑝 Konstantensymbole 𝑐0 , ..., 𝑐𝑝−1 erweitert. Satz 1.7.11. Gelte 𝑇 ⊢ ∃𝑣0 ...∃𝑣𝑝−1 𝜋(𝑣0 , ..., 𝑣𝑝−1 ). Es ist genau dann 𝑆 ⪯𝜋𝑝 𝑇, wenn 𝑆 ⪯ 𝑇𝜋 . Beweis. Sei 𝑒 : 𝐴𝑡𝑇𝑒𝑟𝑚𝑒𝐿[𝑇𝜋 ] → 𝐴𝑡𝑇𝑒𝑟𝑚𝑒𝐿[𝑇] definiert durch
𝑣 , { { { 𝑖+𝑝 𝑒(𝑥) ≐ {𝑣𝑖 , { { 𝑥, {
wenn 𝑥 ≐ 𝑣𝑖 für ein 𝑖 ≥ 0, wenn 𝑥 ≐ 𝑐𝑖 für ein 0 ≤ 𝑖 < 𝑝, sonst.
Ebenso sei 𝑑 : 𝐴𝑡𝑇𝑒𝑟𝑚𝑒𝐿[𝑇] → 𝐴𝑡𝑇𝑒𝑟𝑚𝑒𝐿[𝑇𝜋 ] definiert durch
𝑣 , { { { 𝑖−𝑝 𝑑(𝑥) ≐ {𝑐𝑖 , { { 𝑥, {
wenn 𝑥 ≐ 𝑣𝑖 für ein 𝑖 ≥ 𝑝, wenn 𝑥 ≐ 𝑣𝑖 für ein 0 ≤ 𝑖 < 𝑝, sonst.
Beide Termübersetzungen können nun durch den induktiven Term- und Formelaufbau zu Abbildungen 𝐸 : 𝐿[𝑇𝜋 ] → 𝐿[𝑇], bzw. 𝐷 : 𝐿[𝑇] → 𝐿[𝑇𝜋 ] fortgesetzt werden: – Für 𝑛-stellige Funktionssymbole 𝑓 und 𝑛 𝐿[𝑇𝜋 ]-, bzw. 𝐿[𝑇]-Terme 𝑡1 , ..., 𝑡𝑛 ist 𝑒(𝑓(𝑡1 , ..., 𝑡𝑛 )) ≐ 𝑓(𝑒(𝑡1 ), ..., 𝑒(𝑡𝑛 )), bzw. 𝑑(𝑓(𝑡1 , ..., 𝑡𝑛 )) ≐ 𝑓(𝑑(𝑡1 ), ..., 𝑑(𝑡𝑛 )). – Für atomare Formeln mit 𝐿[𝑇𝜋 ]-, bzw. 𝐿[𝑇]-Termen 𝑡1 , ..., 𝑡𝑛 ist ebenso schon 𝐸(𝑡1 = 𝑡2 ) ≐ 𝑒(𝑡1 ) = 𝑒(𝑡2 ), bzw. 𝐷(𝑡1 = 𝑡2 ) ≐ 𝑑(𝑡1 ) = 𝑑(𝑡2 ) und 𝐸(𝑃𝑡1 ...𝑡𝑛 ) ≐ 𝑃𝑒(𝑡1 )...𝑒(𝑡𝑛 ), bzw. 𝐷(𝑃𝑡1 ...𝑡𝑛 ) ≐ 𝑃𝑑(𝑡1 )...𝑑(𝑡𝑛 ). – Für 𝐿[𝑇𝜋 ]-, bzw. 𝐿[𝑇]-Formeln 𝜑, 𝜓 gilt: 𝐸(¬𝜑) ≐ ¬𝐸(𝜑), bzw. 𝐷(¬𝜑) ≐ ¬𝐷(𝜑) und 𝐸(𝜑 → 𝜓) ≐ 𝐸(𝜑) → 𝐸(𝜓), bzw. 𝐷(𝜑 → 𝜓) ≐ 𝐷(𝜑) → 𝐷(𝜓). – Für 𝐿[𝑇𝜋 ]-Formeln 𝜑 und alle 𝑛 ≥ 0 gilt 𝐸(∀𝑣𝑛 𝜑) ≐ ∀𝑒(𝑣𝑛 )𝐸(𝜑). Für 𝐿[𝑇]Formeln 𝜑 gilt, wenn 𝑛 ≥ 𝑝 ist, dann ist 𝐷(∀𝑣𝑛 𝜑) ≐ ∀𝑑(𝑣𝑛 )𝐷(𝜑), und wenn 𝑛 < 𝑝 und 𝑙 der maximale Index aller in 𝐷(𝜑) vorkommenden Variablen ist, dann ist 𝐷(∀𝑣𝑛 𝜑) ≐ ∀𝑣𝑙+1 𝐷(𝜑(𝑣𝑙+𝑝+1 /𝑣𝑛 )). Sei 𝑆𝑡𝑥 𝜑 die eigentliche Substitution von 𝑥 durch 𝑡 in 𝜑, welche Variablenkollisionen durch gebundene Umbenennungen in 𝜑 vermeidet. Damit kann induktiv über den Formelaufbau bewiesen werden, dass für alle 𝐿[𝑇𝜋 ]-, bzw. 𝐿[𝑇]-Formeln 𝜑 mit freien Variablen 𝑣𝑖1 , ..., 𝑣𝑖𝑛 gilt 𝑣
𝑣
𝑣
𝑣
𝑣
𝑖1 𝑖1 𝑝−1 𝑖𝑛 𝑖𝑛 (∗) ⊢ 𝑆𝑐𝑣00 ...𝑆𝑐𝑝−1 𝐸(𝜑) ↔ 𝑆𝑒(𝑣 ...𝑆𝑒(𝑣 𝜑, bzw. ⊢ 𝐷(𝜑) ↔ 𝑆𝑑(𝑣 ...𝑆𝑑(𝑣 𝜑. 𝑖 ) 𝑖 ) 𝑖 ) 𝑖 ) 1
𝑛
1
𝑛
52 | 1 Interpretierbarkeit
–
Für 𝐿[𝑇𝜋 ]-, bzw. 𝐿[𝑇]-Terme 𝑡 mit Variablen 𝑣𝑖1 , ..., 𝑣𝑖𝑛 gilt offensichtlich
𝑒(𝑡)(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ) ≐ 𝑡(𝑒(𝑣𝑖1 )/𝑣𝑖1 )...(𝑒(𝑣𝑖𝑛 )/𝑣𝑖𝑛 ), –
bzw. 𝑑(𝑡) ≐ 𝑡(𝑑(𝑣𝑖1 )/𝑣𝑖1 )...(𝑑(𝑣𝑖𝑛 )/𝑣𝑖𝑛 ). Für atomare Formeln mit 𝐿[𝑇𝜋 ]-, bzw. 𝐿[𝑇]-Termen 𝑡1 , ..., 𝑡𝑛 und freien Variablen 𝑣𝑖1 , ..., 𝑣𝑖𝑛 gilt:
𝐸(𝑡1 = 𝑡2 )(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ) ≐ (𝑒(𝑡1 )(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ) = 𝑒(𝑡2 )(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 )) ≐ (𝑡1 (𝑒(𝑣𝑖1 )/𝑣𝑖1 )...(𝑒(𝑣𝑖𝑛 )/𝑣𝑖𝑛 ) = 𝑡2 (𝑒(𝑣𝑖1 )/𝑣𝑖1 )...(𝑒(𝑣𝑖𝑛 )/𝑣𝑖𝑛 )) ≐ (𝑡1 = 𝑡2 )(𝑒(𝑣𝑖1 )/𝑣𝑖1 )...(𝑒(𝑣𝑖𝑛 )/𝑣𝑖𝑛 ), bzw. 𝐷(𝑡1 = 𝑡2 ) ≐ (𝑑(𝑡1 ) = 𝑑(𝑡2 )) ≐ (𝑡1 = 𝑡2 )(𝑑(𝑣𝑖1 )/𝑣𝑖1 )...(𝑑(𝑣𝑖𝑛 )/𝑣𝑖𝑛 ) und
𝐸(𝑃𝑡1 ...𝑡𝑛 )(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ) ≐(𝑃𝑒(𝑡1 )...𝑒(𝑡𝑛 ))(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ) ≐ (𝑃𝑡1 ...𝑡𝑛 )(𝑒(𝑣𝑖1 )/𝑣𝑖1 )...(𝑒(𝑣𝑖𝑛 )/𝑣𝑖𝑛 ),
–
–
bzw. 𝐷(𝑃𝑡1 ...𝑡𝑛 ) ≐ 𝑃𝑑(𝑡1 )...𝑑(𝑡𝑛 ) ≐ (𝑃𝑡1 ...𝑡𝑛 )(𝑑(𝑣𝑖1 )/𝑣𝑖1 )...(𝑑(𝑣𝑖𝑛 )/𝑣𝑖𝑛 ). Also steht am Induktionsanfang auf beiden Seiten des Bikonditionals die identische Formel. Für den Induktionsschritt der Junktoren folgt das Bikonditional unmittelbar aus der Induktionsvoraussetzung, der Konstruktion von 𝐸, bzw. 𝐷 und der Aussagenlogik. Für den Induktionsschritt der Quantoren gelte (∗) als Induktionsvoraussetzung. Daraus folgt mit Generalisierung und Verteilung des Quantors 𝑣
𝑣
𝑣
𝑖1 𝑝−1 𝑖𝑛 ⊢ ∀𝑒(𝑣𝑖𝑛 )𝑆𝑐𝑣00 ...𝑆𝑐𝑝−1 𝐸(𝜑) ↔ ∀𝑒(𝑣𝑖𝑛 )𝑆𝑒(𝑣 ...𝑆𝑒(𝑣 𝜑, 𝑖 ) 𝑖 ) 1
𝑛
Da nun die Substitutionsfunktion modulo logischer Äquivalenz mit dem Quantor kommutiert³⁸ ist das linke Glied des Bikonditionals logisch äquiva𝑣𝑝−1 lent zur Formel 𝑆𝑐𝑣00 ...𝑆𝑐𝑝−1 ∀𝑒(𝑣𝑖𝑛 )𝐸(𝜑) und das rechte zu 𝑣
𝑣
𝑣
𝑖𝑛−1 𝑖1 𝑖𝑛 𝑆𝑒(𝑣 ...𝑆𝑒(𝑣 ) ∀𝑒(𝑣𝑖𝑛 )𝑆𝑒(𝑣𝑖 ) 𝜑. 𝑖 ) 𝑖 1
𝑛
𝑛−1
Nun ist zum einen ∀𝑒(𝑣𝑖𝑛 )𝐸(𝜑) ≐ 𝐸(∀𝑣𝑖𝑛 𝜑), zum anderen gilt das Prinzip der gebundenen Umbennung, ⊢ ∀𝑦(𝑆𝑦𝑥 𝜒) ↔ ∀𝑥𝜒, also folgt 𝑣
𝑣
𝑣
𝑖𝑛−1 𝑖1 𝑝−1 ⊢ 𝑆𝑐𝑣00 ...𝑆𝑐𝑝−1 𝐸(∀𝑣𝑖𝑛 𝜑) ↔ 𝑆𝑒(𝑣 ...𝑆𝑒(𝑣 ) ∀𝑣𝑖𝑛 𝜑. 𝑖 ) 𝑖 1
𝑛−1
38 Wenn 𝑦 ∉ 𝑉𝑎𝑟(𝑡), dann ist ⊢ ∀𝑦𝑆𝑡𝑥 𝜒 ↔ 𝑆𝑡𝑥 ∀𝑦𝜒. Die Voraussetzung wird hier erfüllt, da 𝑒(𝑣𝑖𝑛 ) ≐ 𝑣𝑖𝑛 +𝑝 nicht in 𝑐𝑗 für 𝑗 = 0, ..., 𝑝 − 1 oder in 𝑒(𝑣𝑗 ) für 𝑗 = 𝑖1 , ..., 𝑖𝑛−1 vorkommt.
1.7 Interpretierbarkeit mit Parametern | 53
𝑣𝑝−1
Analog folgt das entsprechende Resultat für die Funktion 𝐷 (ohne 𝑆𝑐𝑣00 ...𝑆𝑐𝑝−1 ), wenn 𝑖𝑛 ≥ 𝑝 ist, denn dann kann in (∗) über 𝑑(𝑣𝑖𝑛 ) generalisiert werden. Wenn 𝑖𝑛 < 𝑝 und 𝑙 der maximale Index aller in 𝐷(𝜑) vorkommenden Variablen ist, benutzen wir die Induktionsvoraussetzung (∗) bezüglich der For𝑣𝑖1 𝑣𝑙+𝑝+1 𝑣𝑖𝑛 𝑣𝑖𝑛 𝑣𝑖𝑛 𝜑) ↔ 𝑆𝑑(𝑣 𝜑 statt 𝜑, also ⊢ 𝐷(𝑆𝑣𝑙+𝑝+1 mel 𝑆𝑣𝑙+𝑝+1 ) ...𝑆𝑑(𝑣 ) 𝑆𝑣𝑙+𝑝+1 𝜑. Nun ist 𝑣
𝑣
𝑙+𝑝+1
𝑖1
𝑣
𝑙+𝑝+1 𝑖𝑛 𝑖𝑛 ∘ 𝑆𝑣𝑙+𝑝+1 = 𝑆𝑣𝑙+1 . Dann kann wieder analog zu oben über 𝑣𝑙+1 gene𝑆𝑑(𝑣 𝑙+𝑝+1 )
ralisiert werden und mit Quantorendistribution und Kommutation der Substitutionsfunktion mit dem Quantor (da 𝑣𝑙+1 von allen 𝑑(𝑣𝑖1 ), ...., 𝑑(𝑣𝑖𝑛−1 ) verschieden ist), gilt 𝑣
𝑣
𝑣
𝑣
𝑖𝑛−1 𝑖1 𝑖𝑛 𝑖𝑛 ⊢ ∀𝑣𝑙+1 𝐷(𝑆𝑣𝑙+𝑝+1 𝜑) ↔ 𝑆𝑑(𝑣 ...𝑆𝑑(𝑣 ) ∀𝑣𝑙+1 𝑆𝑣𝑙+1 𝜑. 𝑖 ) 𝑖 1
𝑛−1
𝑣𝑖
𝑛 Da nach Konstruktion von 𝐷 gilt 𝐷(∀𝑣𝑖𝑛 𝜑) ≐ ∀𝑣𝑙+1 𝐷(𝑆𝑣𝑙+𝑝+1 𝜑) und mit gebun-
𝑣𝑖
𝑛 dener Umbenennung ⊢ ∀𝑣𝑙+1 𝑆𝑣𝑙+1 𝜑 ↔ ∀𝑣𝑖𝑛 𝜑, folgt
𝑣
𝑣
𝑖𝑛−1 𝑖1 ⊢ 𝐷(∀𝑣𝑖𝑛 𝜑) ↔ 𝑆𝑑(𝑣 ...𝑆𝑑(𝑣 ) ∀𝑣𝑖𝑛 𝜑. 𝑖 ) 𝑖 1
𝑛−1
Damit ist (∗) gezeigt und es können die beiden Richtungen des Satzes bewiesen werden.
(⇒): Sei 𝐼 die Interpretation mit Parametern von 𝑆 nach 𝑇. Dann ist 𝐷 ∘ 𝐼 eine Abbildung von 𝐿[𝑆] nach 𝐿[𝑇𝜋 ], für die gemäß den Bedingungen i)-iv) von Definition 1.1.1 gilt: i) für alle 𝑛, 𝑚: 𝐷 ∘ 𝐼(𝑣𝑛 = 𝑣𝑚 ) ≐ 𝐷(𝑣𝑛+𝑝 = 𝑣𝑚+𝑝 ) ≐ 𝑣𝑛 = 𝑣𝑚 , ii) für alle 𝑛-stelligen Relationssymbole 𝑃 von 𝐿[𝑆]: 𝐷 ∘ 𝐼(𝑃𝑣𝑖1 ...𝑣𝑖𝑛 ) ≐ 𝐷(𝜑𝑃 (𝑣𝑖1 +𝑝 , ..., 𝑣𝑖𝑛 +𝑝 , 𝑣0 , ..., 𝑣𝑝−1 )) ≐ 𝐷(𝜑𝑃 )(𝑣𝑖1 ...𝑣𝑖𝑛 , 𝑐0 , ..., 𝑐𝑝−1 ), iii) für alle Formeln 𝜓 und 𝜒 in 𝐿[𝑆]: 𝐷(𝐼(¬𝜓)) ≐ ¬𝐷(𝐼(𝜓)) und 𝐷(𝐼(𝜓 → 𝜒)) ≐ 𝐷(𝐼(𝜓)) → 𝐷(𝐼(𝜒)), iv) für alle Formeln 𝜓 in 𝐿[𝑆] und alle 𝑛: 𝐷(𝐼(∀𝑣𝑛 𝜓)) ≐
𝐷(∀𝑣𝑛+𝑝 (𝛿(𝑣𝑛+𝑝 , 𝑣0 , ..., 𝑣𝑝−1 ) → 𝐼(𝜓))) ≐ ∀𝑣𝑛 (𝐷(𝛿)(𝑣𝑛 , 𝑐0 , ..., 𝑐𝑝−1 ) → 𝐷(𝐼(𝜓))).
Für 𝑆 ⪯ 𝑇𝜋 ist dann noch v) zu zeigen: Sei 𝜓 ein Satz aus 𝑆, dann ist nach Definition 1.7.1
𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑝−1 (𝜋(𝑣0 , ..., 𝑣𝑝−1 ) → 𝐼(𝜓)), also auch 𝑇𝜋 ⊢ ∀𝑣0 ...∀𝑣𝑝−1 (𝜋(𝑣0 , ..., 𝑣𝑝−1 ) → 𝐼(𝜓)) und 𝑇𝜋 ⊢ 𝜋(𝑐0 , ..., 𝑐𝑝−1 ) → 𝐼(𝜓)(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ) Da 𝑇𝜋 ⊢ 𝜋(𝑐0 , ..., 𝑐𝑝−1 ), gilt 𝑇𝜋 ⊢ 𝐼(𝜓)(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ) Mit (∗), wobei die 𝐿[𝑇]-Formel 𝐼(𝜓) genau 𝑣0 , ..., 𝑣𝑝−1 als freie Variablen besitzt und ihre Substitu-
54 | 1 Interpretierbarkeit
tion durch die Konstanten 𝑑(𝑣0 ), ..., 𝑑(𝑣𝑝−1 ) eine eigentliche Substitution ist, gilt dann auch 𝑇𝜋 ⊢ 𝐷(𝐼(𝜓)).
(⇐): Sei 𝐼 die Interpretation von 𝑆 nach 𝑇𝜋 . Dann ist 𝐸 ∘ 𝐼 eine Abbildung von 𝐿[𝑆] nach 𝐿[𝑇], für die gemäß den Bedingungen i)-iv) von Definition 1.7.1 gilt: i) für alle 𝑛, 𝑚: 𝐸 ∘ 𝐼(𝑣𝑛 = 𝑣𝑚 ) ≐ 𝐸(𝑣𝑛 = 𝑣𝑚 ) ≐ (𝑣𝑛+𝑝 = 𝑣𝑚+𝑝 ), ii) für alle 𝑛-stelligen Prädikatsymbole 𝑃 von 𝐿[𝑆]: 𝐸 ∘ 𝐼(𝑃𝑣𝑖1 ...𝑣𝑖𝑛 ) ≐ 𝐸(𝜑𝑃 (𝑣𝑖1 , ..., 𝑣𝑖𝑛 , 𝑐0 , ..., 𝑐𝑝−1 )) ≐ 𝐸(𝜑𝑃 )(𝑣𝑖1 +𝑝 , ..., 𝑣𝑖𝑛 +𝑝 , 𝑣0 , ..., 𝑣𝑝−1 ), iii) für alle Formeln 𝜓 und 𝜒 in 𝐿[𝑆]: 𝐸(𝐼(¬𝜓)) ≐ ¬𝐸(𝐼(𝜓)) und 𝐸(𝐼(𝜓 → 𝜒)) ≐ 𝐸(𝐼(𝜓)) → 𝐸(𝐼(𝜒)), iv) für alle Formeln 𝜓 in 𝐿[𝑆] und alle 𝑛: 𝐸(𝐼(∀𝑣𝑛 𝜓)) ≐ 𝐸(∀𝑣𝑛 (𝛿(𝑣𝑛 , 𝑐0 , ..., 𝑐𝑝−1 ) → 𝐼(𝜓))) ≐ ∀𝑣𝑛+𝑝 (𝐸(𝛿)(𝑣𝑛+𝑝 , 𝑣0 , ..., 𝑣𝑝−1 ) → 𝐸(𝐼(𝜓))). Nun gilt 𝑇 ⊢ ∃𝑣0 ...∃𝑣𝑝−1 𝜋(𝑣0 , ..., 𝑣𝑝−1 ). Bleibt die Herleitbarkeitsübertragung zu zeigen: Sei 𝜓 ein Satz aus 𝑆, dann ist nach Definition 1.1.1 v) auch 𝑇𝜋 ⊢ 𝐼(𝜓). Bei dieser Formel handelt es sich um einen Satz aus 𝐿[𝑇𝜋 ], sodass mit (∗) folgt 𝑇𝜋 ⊢ 𝐸(𝐼(𝜓))(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ). Mit dem Deduktionstheorem gilt dann
𝑇 ⊢ 𝜋(𝑐0 , ..., 𝑐𝑝−1 ) → 𝐸(𝐼(𝜓))(𝑐0 /𝑣0 )...(𝑐𝑝−1 /𝑣𝑝−1 ). Mit Konstantenersetzung³⁹ folgt dann für neue Variablen 𝑣0 , ..., 𝑣𝑝−1 , dass /𝑣𝑝−1 ). ) → 𝐸(𝐼(𝜓))(𝑣0 /𝑣0 )...(𝑣𝑝−1 𝑇 ⊢ 𝜋(𝑣0 , ..., 𝑣𝑝−1
Dann gilt mit Generalisierung und gebundener Umbenennung (denn 𝑣0 , ..., 𝑣𝑝−1
sind frei für 𝑣0 , ..., 𝑣𝑝−1 in 𝜋 und 𝐸(𝐼(𝜓))) auch 𝑇 ⊢ ∀𝑣0 ...∀𝑣𝑝−1 (𝜋(𝑣0 , ..., 𝑣𝑝−1 ) →
𝐸(𝐼(𝜓))).
1.7.3 Elimination der Parameter durch mehrdimensionale Interpretationen Mit Hilfe von Satz 1.7.11 sind die Parameter einer Interpretation unter bestimmten Umständen zugunsten einer mehrdimensionalen, identitätsmodifizierenden Interpretation eliminierbar, vgl. Szczerba (1980, 2.5.). Definition 1.7.12. Das (nicht-logische) Vokabular einer Sprache 𝐿 enthalte nur die Relationssymbole 𝑃1 , ..., 𝑃𝑚 . Für 1 ≤ 𝑖 ≤ 𝑚 sei 𝑃𝑖 𝑘𝑖 -stellig. Seien 𝜋(𝑥1 , ..., 𝑥𝑝 )
39 Vgl. Lemma 12.12. von Link (2009).
1.7 Interpretierbarkeit mit Parametern | 55
eine 𝐿-Formel mit 𝑝 freien Variablen und 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ) eine 𝐿-Formel mit 2𝑝 + 2 freien Variablen. Dann sei der 𝐿-Satz
𝐴𝑢𝑡𝐿𝜋 (𝜓) ≐ ∀𝑥1 ...∀𝑥𝑝 ∀𝑦1 ...∀𝑦𝑝 ∀𝑧1 ...∀𝑧𝑝 (𝜋(𝑥1 , ..., 𝑥𝑝 ) ∧ 𝜋(𝑦1 , ..., 𝑦𝑝 ) ∧ 𝜋(𝑧1 , ..., 𝑧𝑝 ) → (𝑥1 , ..., 𝑥𝑝 , 𝑦1 , ..., 𝑦𝑝 , 𝑧1 , ..., 𝑧𝑝 )), wobei ≐
∀𝑥0 ∃!𝑦0 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ) ∧
(1)
𝑘𝑖
𝑚
⋀ ∀𝑥1 ...𝑥𝑘𝑖 ∀𝑦1 ...𝑦𝑘𝑖 [⋀ 𝜓(𝑥𝑗 , 𝑥1 ..., 𝑥𝑝 , 𝑦𝑗 , 𝑦1 ..., 𝑦𝑝 ) → 𝑖=1
𝑗=1
1
𝑘𝑖
(𝑃𝑖 𝑥 ...𝑥 ↔ 𝑃𝑖 𝑦1 ...𝑦𝑘𝑖 )] ∧
(2)
𝑝
⋀ 𝜓(𝑥𝑖 , 𝑥1 , ..., 𝑥𝑝 , 𝑦𝑖 , 𝑦1 , ..., 𝑦𝑝 ) ∧ ∀𝑥0 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑥0 , ..., 𝑥𝑝 ) ∧
(3)
∀𝑥0 ∀𝑦0 (𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ) → 𝜓(𝑦0 , ..., 𝑦𝑝 , 𝑥0 , ..., 𝑥𝑝 )) ∧
(4)
𝑖=1
∀𝑥0 ∀𝑦0 ∀𝑧0 [𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ) ∧ 𝜓(𝑦0 , ..., 𝑦𝑝 , 𝑧0 , ..., 𝑧𝑝 ) → 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑧0 , ..., 𝑧𝑝 )].
(5)
In Worten besagt 𝐴𝑢𝑡𝐿𝜋 (𝜓) grob, dass 𝜓 eine von 2𝑝 𝜋-Parametern abhängige Funktion (𝑥0 → 𝑦0 ) definiert (1), die einen 𝐿-Automorphismus etabliert (2), welcher die Parameter untereinander auf sich abbildet und bei zwei identischen Parameter-𝑝-Tupeln konstant ist (3) und schließlich als Relation zwischen 𝑝 + 1Tupeln symmetrisch (4) und transitiv (5) ist. 𝜋 Satz 1.7.13. Gelte 𝑇 ⊢ ∃𝑥1 ...∃𝑥𝑝 𝜋(𝑥1 , ..., 𝑥𝑝 ). Wenn 𝑇 ⊢ 𝐴𝑢𝑡𝐿[𝑇] (𝜓) für eine 𝐿[𝑇]-
Formel 𝜓, dann 𝑇𝜋 ⪯𝑝+1 𝑇. =
𝜋 Beweis. Beachte, da 𝑇 ⊆ 𝑇𝜋 , ist auch 𝑇𝜋 ⊢ 𝐴𝑢𝑡𝐿[𝑇] (𝜓). Wir definieren induktiv eine 𝑝+1-dimensionale, identitätsmodifizierende Interpretation 𝐼 : 𝐿[𝑇𝜋 ]∗ → 𝐿[𝑇]⁴⁰ gemäß Definition 1.6.1 (übersichtshalber wird anstatt eines Indexshiftes jeder Variable 𝑥 (ohne unteren Index) durch 𝐼 die 𝑝 + 1
40 𝐿[𝑇𝜋 ]∗ wird gemäß der Behandlung von Konstantensymbolen aus Kapitel 1.2 gewählt.
56 | 1 Interpretierbarkeit
Variablen 𝑥0 , ..., 𝑥𝑝 zugeordnet):
𝛿(𝑥0 , ..., 𝑥𝑝 ) ≐ 𝜋(𝑥1 , ..., 𝑥𝑝 ) ∧ 𝑥0 = 𝑥0 , 𝐼(𝑥 = 𝑦) ≐ 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ), 1
𝑘
1
𝑘
für 1 ≤ 𝑖 ≤ 𝑚 : 𝐼(𝑃𝑖 𝑥 ...𝑥 𝑖 ) ≐ ∀𝑦1 ...∀𝑦𝑝 ∀𝑧 ...∀𝑧 𝑖 (𝜋(𝑦1 , ..., 𝑦𝑝 ) ∧ 𝑘𝑖
𝑗
𝑗
⋀ 𝜓(𝑧𝑗 , 𝑦1 , ..., 𝑦𝑝 , 𝑥0 , 𝑥1 , ..., 𝑥𝑝𝑗 ) → 𝑃𝑖 𝑧1 ...𝑧𝑘𝑖 ) 𝑗=1
𝑝
und für 1 ≤ 𝑖 ≤ 𝑝 : 𝐼(𝑅𝑐𝑖 (𝑥)) ≐ (𝑥0 = 𝑥𝑖 ) ∧ ⋀ 𝑥𝑗 = 𝑥𝑗 . 𝑗=1
Um zu zeigen, dass 𝐼 eine Interpretation von [𝑇𝜋 ]∗ nach 𝑇 ist, reicht der Nachweis von Klausel v) von Definition 1.6.1. Zunächst wollen wir überprüfen, dass die Interpretationen der entsprechenden Existenz- und Eindeutigkeitseigenschaften von 𝑅𝑐𝑖 gelten, welche als Axiome in [𝑇𝜋 ]∗ hinzugefügt wurden: Doch wegen
⊢ 𝐼(∃!𝑥 𝑅𝑐𝑖 (𝑥)) ↔∃𝑥0 ...∃𝑥𝑝 (𝜋(𝑥1 , ..., 𝑥𝑝 ) ∧ 𝑥0 = 𝑥𝑖 ∧ ∀𝑦0 ...∀𝑦𝑝 (𝜋(𝑦1 , ..., 𝑦𝑝 ) ∧ 𝑦0 = 𝑦𝑖 → 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ))) gilt die Existenzeigenschaft aufgrund von 𝑇 ⊢ ∃𝑥1 ...∃𝑥𝑝 𝜋(𝑥1 , ..., 𝑥𝑝 ) und die Ein𝜋 deutigkeit aufgrund der großen Konjunktion von (3) von 𝐴𝑢𝑡𝐿[𝑇] (𝜓). 𝜋 ∗ 𝜋 ∗ Es bleibt zu zeigen, dass für alle 𝐿[𝑇 ] -Sätze 𝜒 ∈ [𝑇 ] gilt 𝑇 ⊢ 𝐼(𝜒). Dafür beweisen wir folgenden Hilfssatz: Für alle 𝐿[𝑇𝜋 ]∗ -Formeln 𝜑(𝑥1 , ..., 𝑥𝑛 ) mit freien Variablen 𝑥1 , ..., 𝑥𝑛 beweist [𝑇𝜋 ]∗ die Generalisierung von 𝑝
𝑛
𝑗
𝑗
𝑗
(∗) ∃𝑣1 ...∃𝑣𝑝 [⋀ 𝑅𝑐𝑖 (𝑣𝑖 ) ∧ ⋀(𝜋(𝑥1 , ..., 𝑥𝑝𝑗 ) ∧ 𝜓(𝑥𝑗 , 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 ..., 𝑥𝑝𝑗 ))] 𝑖=1
1
𝑗=1
𝑛
→ (𝜑(𝑥 , ..., 𝑥 ) ↔ 𝐼(𝜑(𝑥1 , ..., 𝑥𝑛 ))) Wir beweisen induktiv über den Formelaufbau von 𝜑 innerhalb der Theorie 𝑝 [𝑇𝜋 ]∗ . Da 𝑇𝜋 ⊢ 𝜋(𝑐1 , ..., 𝑐𝑝 ) gilt dann in [𝑇𝜋 ]∗ der Satz ∃𝑣1 ...∃𝑣𝑝 [⋀𝑖=1 𝑅𝑐𝑖 (𝑣𝑖 ) ∧ 𝜋(𝑣1 , ..., 𝑣𝑝 )], überdies gilt sogar die Eindeutigkeit dieser 𝑣1 , ..., 𝑣𝑝 . Als Induktionsanfang sind die Fälle atomarer Formeln zu untersuchen, in der hier untersuchten Formulierung von 𝐿[𝑇𝜋 ]∗ sind das Variablengleichungen, 𝑃𝑖 - oder 𝑅𝑐𝑖 -Prädikationen:
1.7 Interpretierbarkeit mit Parametern | 57
Sei 𝜑(𝑥, 𝑦) ≐ (𝑥 = 𝑦). Zu zeigen ist, 𝑝
∃𝑣1 ...∃𝑣𝑝 [⋀ 𝑅𝑐𝑖 (𝑣𝑖 ) ∧ 𝜋(𝑥1 , ..., 𝑥𝑝 ) ∧ 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 , ..., 𝑥𝑝 ) 𝑖=1
∧ 𝜋(𝑦1 , ...𝑦𝑝 ) ∧ 𝜓(𝑦, 𝑣1 , ..., 𝑣𝑝 , 𝑦0 , 𝑦1 , ..., 𝑦𝑝 )] → (𝑥 = 𝑦 ↔ 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 )). Gelte der Antezedens, also mit den durch die 𝑅𝑐𝑖 eindeutig bestimmten 𝑣𝑖 , gelte 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 ..., 𝑥𝑝 )∧𝜓(𝑦, 𝑣1 , ..., 𝑣𝑝 , 𝑦0 , 𝑦1 ..., 𝑦𝑝 ). Nun gilt 𝜋(𝑣1 , ..., 𝑣𝑝 ). Mit Symmetrie (4) gilt auch 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑥, 𝑣1 ..., 𝑣𝑝 ) und 𝜓(𝑦0 , ..., 𝑦𝑝 , 𝑦, 𝑣1 , ..., 𝑣𝑝 ). Aus 𝑥 = 𝑦 folgt nun mit dem Leibniz-Prinzip 𝜓(𝑦, 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 ..., 𝑥𝑝 ) und mit Transitivität (5) und Symmetrie (4) 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ). Für die Rückrichtung folgt aus 𝜓(𝑥0 , ..., 𝑥𝑝 , 𝑦0 , ..., 𝑦𝑝 ) mit Transitivität (5) wieder sowohl 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑦0 , ..., 𝑦𝑝 ) als auch 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑦, 𝑣1 ..., 𝑣𝑝 ), doch aus dem letzten Konjunktionsglied von (3) folgt 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑥, 𝑣1 , ..., 𝑣𝑝 ) und mit (1), der Eindeutigkeit von 𝜓, dann 𝑥 = 𝑦. Sei 𝜑(𝑥1 , ..., 𝑥𝑘𝑖 ) ≐ 𝑃𝑖 𝑥1 ...𝑥𝑘𝑖 für ein 1 ≤ 𝑖 ≤ 𝑚. Zu zeigen ist, 𝑝
𝑘𝑖
𝑖=1
𝑗=1
𝑗
𝑗
𝑗
∃𝑣1 ...∃𝑣𝑝 [⋀𝑅𝑐𝑖 (𝑣𝑖 ) ∧ ⋀(𝜋(𝑥1 , ..., 𝑥𝑝𝑗 ) ∧ 𝜓(𝑥𝑗 , 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 ..., 𝑥𝑝𝑗 ))] → 𝑘𝑖
𝑗
(𝑃𝑖 𝑥1 ...𝑥𝑘𝑖 ↔∀𝑦1 ...∀𝑧1 ...∀𝑧𝑘𝑖 (𝜋(𝑦1 , ..., 𝑦𝑝 ) ∧ ⋀ 𝜓(𝑧𝑗 , 𝑦1 , ..., 𝑦𝑝 , 𝑥0 , ..., 𝑥𝑝𝑗 )) 𝑗=1
1
𝑘𝑖
→ 𝑃𝑖 𝑧 ...𝑧 )). Gelte der Antezedens mit den durch die 𝑅𝑐𝑖 eindeutig bestimmten 𝑣𝑖 . Insbesondere 𝑘
𝑗
𝑗
𝑖 also ⋀𝑗=1 (𝜋(𝑥1 , ..., 𝑥𝑝𝑗 ) ∧ 𝜓(𝑥𝑗 , 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , ..., 𝑥𝑝𝑗 )). Außerdem gilt 𝜋(𝑣1 , ..., 𝑣𝑝 ).
Gelte zunächst 𝑃𝑖 𝑥1 ...𝑥𝑘𝑖 . Seien 𝑦1 , ..., 𝑦𝑝 , 𝑧1 , ..., 𝑧𝑘𝑖 beliebig mit 𝜋(𝑦1 , ..., 𝑦𝑝 ) 𝑗
und 𝜓(𝑧𝑗 , 𝑦1 , ..., 𝑦𝑝 , 𝑥0 , ..., 𝑥𝑝𝑗 ) für 𝑗 ≤ 𝑘𝑖 . Dann gilt mit Transitivität (5) und Sym𝜋 metrie (4) von 𝜓, dass 𝜓(𝑧𝑗 , 𝑦1 , ..., 𝑦𝑝 , 𝑥𝑗 , 𝑣1 , ..., 𝑣𝑝 ) für 𝑗 ≤ 𝑘𝑖 . Mit (2) von 𝐴𝑢𝑡𝐿[𝑇]
folgt dann 𝑃𝑧1 ...𝑧𝑘𝑖 ↔ 𝑃𝑥1 ...𝑥𝑘𝑖 , also mit der Voraussetzung schließlich 𝑃𝑧1 ...𝑧𝑘𝑖 . Für die Rückrichtung gelte nun 1
𝑘𝑖
𝑘𝑖
𝑗
∀𝑦1 ...∀𝑦𝑝 ∀𝑧 ...∀𝑧 (𝜋(𝑦1 , ..., 𝑦𝑝 ) ∧ ⋀ 𝜓(𝑧𝑗 , 𝑦1 , ..., 𝑦𝑝 , 𝑥0 , ..., 𝑥𝑝𝑗 ) → 𝑗=1
1
𝑘𝑖
𝑃𝑖 𝑧 ...𝑧 ). 𝑘
𝑗
𝑗
𝑖 Daraus folgt 𝜋(𝑣1 , ..., 𝑣𝑝 ) ∧ ⋀𝑗=1 𝜓(𝑥𝑗 , 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 , ..., 𝑥𝑝𝑗 ) → 𝑃𝑖 𝑥1 ...𝑥𝑘𝑖 . Doch
der Antezedens dieses Konditionals gilt schon, also folgt 𝑃𝑖 𝑥1 ...𝑥𝑘𝑖 .
58 | 1 Interpretierbarkeit
Sei 𝜑(𝑥) ≐ 𝑅𝑐𝑖 (𝑥) für ein 1 ≤ 𝑖 ≤ 𝑝. Zu zeigen ist, 𝑝
∃𝑣1 ...𝑣𝑝 [⋀ 𝑅𝑐𝑗 (𝑣𝑗 ) ∧ 𝜋(𝑥1 , ...𝑥𝑝 ) ∧ 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , ..., 𝑥𝑝 )] → 𝑗=1
(𝑅𝑐𝑖 (𝑥) ↔ 𝑥0 = 𝑥𝑖 ). Gelte 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , ..., 𝑥𝑝 ) ∧ 𝜋(𝑥1 , ...𝑥𝑝 ) mit den durch die 𝑅𝑐𝑗 eindeutig bestimmten 𝑣𝑗 , also auch 𝑅𝑐𝑖 (𝑣𝑖 ) und 𝜋(𝑣1 , ..., 𝑣𝑝 ). Aus 𝑅𝑐𝑖 (𝑥) folgt wegen der Eindeutigkeit von 𝑅𝑐𝑖 , dass 𝑥 = 𝑣𝑖 , also mit dem Leibniz-Prinzip 𝜓(𝑣𝑖 , 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 , ..., 𝑥𝑝 ), doch aus der großen Konjunktion von (3) folgt schon 𝜓(𝑣𝑖 , 𝑣1 , ..., 𝑣𝑝 , 𝑥𝑖 , 𝑥1 , ..., 𝑥𝑝 ) und mit (1), der Eindeutigkeit von 𝜓, dann 𝑥0 = 𝑥𝑖 . Für die Rückrichtung folgt aus 𝑥0 = 𝑥𝑖 zunächst 𝜓(𝑥, 𝑣1 , ..., 𝑣𝑝 , 𝑥𝑖 , 𝑥1 ..., 𝑥𝑝 ), doch aus der großen Konjunktion von (3) folgt 𝜓(𝑣𝑖 , 𝑣1 , ..., 𝑣𝑝 , 𝑥𝑖 , 𝑥1 , ..., 𝑥𝑝 ). Aus (4) folgt 𝜓(𝑥𝑖 , 𝑥1 ..., 𝑥𝑝 , 𝑥, 𝑣1 , ..., 𝑣𝑝 ) und 𝜓(𝑥𝑖 , 𝑥1 , ..., 𝑥𝑝 , 𝑣𝑖 , 𝑣1 , ..., 𝑣𝑝 ), mit der Eindeutigkeit von 𝜓 (1) folgt dann 𝑥 = 𝑣𝑖 und schließlich mit der Voraussetzung 𝑅𝑐𝑖 (𝑥). Die Induktionsschritte bezüglich Junktoren folgen schon aussagenlogisch aus der jeweiligen Induktionsvoraussetzung und Klausel iii) von Definition 1.6.1. Bleibt der Induktionsschritt der Allquantifikation: Sei 𝜑 ≐ ∀𝑥𝑛 𝜑 (𝑥𝑛 ). 𝜏 sei folgende Formel 𝑛−1
𝑗
𝑗
𝑗
⋀(𝜋(𝑥1 , ...𝑥𝑝𝑗 ) ∧ 𝜓(𝑥𝑗 , 𝑣1 , ..., 𝑣𝑝 , 𝑥0 , 𝑥1 ..., 𝑥𝑝𝑗 )). 𝑗=1
Die Induktionsvoraussetzung ist dann die Generalisierung von 𝑝
∃𝑣1 ...∃𝑣𝑝 ( ⋀ 𝑅𝑐𝑖 (𝑣𝑖 ) ∧ 𝜏 ∧ 𝜋(𝑥1𝑛 , ..., 𝑥𝑝𝑛 ) ∧ 𝜓(𝑥𝑛 , 𝑣1 , ..., 𝑣𝑝 , 𝑥0𝑛 , ..., 𝑥𝑝𝑛 )) 𝑖=1
→ (𝜑 (𝑥𝑛 ) ↔ 𝐼(𝜑 )(𝑥0𝑛 , ..., 𝑥𝑝𝑛 )). Zu zeigen ist, dass 𝑝
∃𝑣1 ...∃𝑣𝑝 (⋀ 𝑅𝑐𝑖 (𝑣𝑖 ) ∧ 𝜏)
𝑛
𝑛
→ (∀𝑥 𝜑 (𝑥 )
𝑖=1 𝑛 𝑛 ↔∀𝑥0 ...∀𝑥𝑝 (𝜋(𝑥1𝑛 , ..., 𝑥𝑝𝑛 )
→ 𝐼(𝜑 )(𝑥0𝑛 , ..., 𝑥𝑝𝑛 ))).
Gelte 𝜏(𝑣1 /𝑣1 )...(𝑣𝑝 /𝑣𝑝 ) mit durch die 𝑅𝑐𝑖 eindeutig bestimmten, aber neuen Variablen 𝑣𝑖 , also insbesondere 𝜋(𝑣1 , ..., 𝑣𝑝 ).
1.7 Interpretierbarkeit mit Parametern | 59
Gelte zunächst ∀𝑥𝑛 𝜑 (𝑥𝑛 ). Für beliebige 𝑥0𝑛 , ..., 𝑥𝑝𝑛 mit 𝜋(𝑥1𝑛 , ..., 𝑥𝑝𝑛 ) gilt dann
𝜋 mit (1) und (4) von 𝐴𝑢𝑡𝐿[𝑇] , dass ein 𝑥𝑛 existiert mit 𝜓(𝑥𝑛 , 𝑣1 ..., 𝑣𝑝 , 𝑥0𝑛 , ...𝑥𝑝𝑛 ). Nun
können die 𝑣1 , ..., 𝑣𝑝 existenzabquantifiziert werden, sodass der Antezedens der
Induktionsvoraussetzung erfüllt ist. Die Voraussetzung kann auf 𝜑 (𝑥𝑛 ) spezialisiert werden und mit dem Konsequens der Induktionsvoraussetzung erhält man dann 𝐼(𝜑 )(𝑥0𝑛 , ..., 𝑥𝑝𝑛 ). Für die Rückrichtung gelte ∀𝑥0𝑛 ...∀𝑥𝑝𝑛 (𝜋(𝑥1𝑛 , ..., 𝑥𝑝𝑛 ) → 𝐼(𝜑 )(𝑥0𝑛 , ..., 𝑥𝑝𝑛 )). Sei
𝑥𝑛 beliebig. Da 𝜋(𝑣1 , ..., 𝑣𝑝 ), folgt aus der Voraussetzung 𝐼(𝜑 )(𝑥𝑛 , 𝑣1 , ..., 𝑣𝑝 ). Mit der letzten Konjunktion von (3) folgt 𝜓(𝑥𝑛 , 𝑣1 , ..., 𝑣𝑝 , 𝑥𝑛 , 𝑣1 , ..., 𝑣𝑝 ). Nun können die 𝑣1 , ..., 𝑣𝑝 teilweise existenzabquantifiziert werden, sodass gilt 𝑝
∃𝑣1 ...∃𝑣𝑝 (⋀ 𝑅𝑐𝑖 (𝑣𝑖 ) ∧ 𝜏 ∧ 𝜋(𝑣1 , ..., 𝑣𝑝 ) ∧ 𝜓(𝑥𝑛 , 𝑣1 , ..., 𝑣𝑝 , 𝑥𝑛 , 𝑣1 , ..., 𝑣𝑝 )) 𝑖=1
Werden in der Induktionsvoraussetzung die freien Variablen 𝑥0𝑛 durch 𝑥𝑛 und 𝑥1𝑛 , ..., 𝑥𝑝𝑛 durch die neuen 𝑣1 , ..., 𝑣𝑝 (respektive) ersetzt, folgt dann 𝜑 (𝑥𝑛 ) ↔
𝐼(𝜑 )(𝑥𝑛 , 𝑣1 , ..., 𝑣𝑝 ), also 𝜑 (𝑥𝑛 ).
Damit ist (∗) bewiesen und wir schließen, dass für jeden Satz 𝜒 aus 𝐿[𝑇𝜋 ]∗ gilt
[𝑇𝜋 ]∗ ⊢ 𝜒 ↔ 𝐼(𝜒). Wenn also 𝜒 ∈ [𝑇𝜋 ]∗ , dann [𝑇𝜋 ]∗ ⊢ 𝐼(𝜒). Nun ist 𝐼(𝜒) in der relationalen Sprache 𝐿[𝑇] formuliert. Wegen Satz 1.2.2 ist [𝑇𝜋 ]∗ ⪯ 𝑇𝜋 , wobei die Relationssymbole bei dieser unrelativierten Interpretation nicht verändert werden. Also ist auch 𝑇𝜋 ⊢ 𝐼(𝜒). Mit dem Deduktionstheorem ist dann 𝑇 ⊢ 𝜋(𝑐1 , ..., 𝑐𝑝 ) → 𝐼(𝜒). Nun sind 𝜋(𝑥1 , ..., 𝑥𝑝 ), 𝐼(𝜒) ∈ 𝐿[𝑇], d.h. in 𝐼(𝜒) kommen die 𝑐1 , ..., 𝑐𝑝 nicht vor. Ersetzen wir nun in dem 𝑇-Beweis von 𝜋(𝑐1 , ..., 𝑐𝑝 ) → 𝐼(𝜒) für jedes 1 ≤ 𝑖 ≤ 𝑝 jedes Vorkommnis von 𝑐𝑖 durch eine neue Variable 𝑦𝑖 ,⁴¹ so erhalten wir einen 𝑇-Beweis für 𝜋(𝑦1 , ..., 𝑦𝑝 ) → 𝐼(𝜒). Mit Generalisierung ist dann 𝑇 ⊢ ∀𝑦1 ...∀𝑦𝑝 (𝜋(𝑦1 , ..., 𝑦𝑝 ) → 𝐼(𝜒)) oder prädikatenlogisch äquivalent, da 𝑦1 , ..., 𝑦𝑝 in 𝐼(𝜒) nicht vorkommen, 𝑇 ⊢ ∃𝑦1 ...∃𝑦𝑝 𝜋(𝑦1 , ..., 𝑦𝑝 ) → 𝐼(𝜒). Daraus folgt aber mit der Voraussetzung 𝑇 ⊢ ∃𝑥1 ...∃𝑥𝑝 𝜋(𝑥1 , ..., 𝑥𝑝 ), auch 𝑇 ⊢ 𝐼(𝜒), also ist 𝐼 die gewünschte Interpretation. Mit den Sätzen 1.7.11 und 1.7.13 und Transitivität der Interpretierbarkeitsrelationen folgt
41 Vgl. Lemma 12.12. von Link (2009).
60 | 1 Interpretierbarkeit 𝜋 Korollar 1.7.14. Wenn 𝑇 ⊢ 𝐴𝑢𝑡𝐿[𝑇] (𝜓) für eine 𝐿[𝑇]-Formel 𝜓, dann 𝑆 ⪯𝜋𝑝 𝑇 ⇒
𝑆 ⪯𝑝+1 𝑇. =
Beispiel 1.7.15. Dieses Korollar kann auf das Beispiel 1.7.3 angewandt werden: 𝑣 =𝑣̸ 1
𝐹 ⪯20
𝐺.
In der Theorie 𝐺 einer ebenen affinen Geometrie sind Automorphismen definierbar, welche die Abbildung zweier verschiedener Punkte auf zwei andere verschiedene Punkte zu einer affinen Transformation der gesamten Ebene fortsetzt. Damit ist dann auch 𝐹 ⪯3= 𝐺 (ausführlich in Kapitel 5.3).
1.8 Interpretierbarkeit von Theorien mit Modellen endlicher Mächtigkeit Es wird gezeigt, dass Theorien, die ausreichend viele Objekte mit geschlossenen Termen benennen können, jede Theorie relativ interpretieren, deren Modelle alle dieselbe endliche Mächtigkeit haben. Satz 1.8.1. 𝑆 und 𝑇 seien prädikatenlogische (konsistente) Theorien erster Stufe mit Identität. Das Vokabular der Sprache von 𝑆 sei endlich und für 1 < 𝑛 < 𝜔 beweise 𝑆 die Existenz von genau 𝑛 Objekten. In der Sprache von 𝑇 gebe es 𝑛 geschlossene Terme 𝑡1 , ..., 𝑡𝑛 , sodass für alle 1 ≤ 𝑗 < 𝑖 ≤ 𝑛 gilt 𝑇 ⊢ 𝑡𝑖 ≠ 𝑡𝑗 . Dann gilt 𝑆 ⪯ 𝑇. Beweis. Wir nehmen an, dass das Vokabular von 𝐿[𝑆] die Relationssymbole 𝑃1 , ..., 𝑃𝑚 ausschließlich enthalte. Für 1 ≤ 𝑖 ≤ 𝑚 sei 𝑃𝑖 𝑘𝑖 -stellig. Dass 𝑆 die Existenz von genau 𝑛 Objekten beweist, schreibt sich formal als 𝑛−1
𝑆 ⊢ ∃𝑣0 ...∃𝑣𝑛−1 ( ⋀ 𝑣𝑖 ≠ 𝑣𝑗 ∧ ∀𝑣𝑛 ⋁ 𝑣𝑛 = 𝑣𝑖 ) 0≤𝑖 0. Wegen der Stetigkeit des Polynoms gibt es ein 𝑤 > 0, sodass für alle 𝑥 mit |𝑥 − 𝑧| < 𝑤 gilt |𝑥0 + 𝑥1 ⋅ 𝑥 + ... + 𝑥𝑛 ⋅ 𝑥𝑛 − 𝑦| < 𝑦. Doch dann gilt auch für alle 𝑥 mit |𝑥 − 𝑧| < 𝑤, dass 𝑥0 + 𝑥1 ⋅ 𝑥 + ... + 𝑥𝑛 ⋅ 𝑥𝑛 > 0. Dann wäre 𝑧 − 𝑤 eine obere Schranke für 𝜑, denn aus 𝑥 > 𝑧 − 𝑤 folgt, dass entweder 𝑥 > 𝑧, also ¬𝜑(𝑥), oder 𝑧 − 𝑤 < 𝑥 < 𝑧, also |𝑥 − 𝑧| < 𝑤, woraus auch ¬𝜑(𝑥) folgt. Allerdings ist 𝑧 − 𝑤 < 𝑧 und 𝑧 war schon die kleinste obere Schranke, sodass die Annahme zu einem Widerspruch führt. Angenommen 𝑦 < 0. Also ist 𝑧 < 𝑣. Wegen der Stetigkeit des Polynoms gibt es ein 𝑤 > 0, sodass für alle 𝑥 mit |𝑥−𝑧| < 𝑤 gilt |𝑥0 +𝑥1 ⋅𝑥+...+𝑥𝑛 ⋅𝑥𝑛 −𝑦| < −𝑦.
70 | 2 Die Theorie der reell abgeschlossenen Körper 𝑅𝐶𝐹 Doch dann gilt auch für alle 𝑥 mit |𝑥 − 𝑧| < 𝑤 , dass 𝑥0 + 𝑥1 ⋅ 𝑥 + ... + 𝑥𝑛 ⋅ 𝑥𝑛 < 0.
Sei 𝑡 = 𝑚𝑖𝑛{(𝑧 + 𝑤2 ), 𝑣}. Also ist insbesondere, da |𝑡 − 𝑧| < 𝑤 , auch 𝑥0 + 𝑥1 ⋅ 𝑡 + ... + 𝑥𝑛 ⋅ 𝑡𝑛 < 0, doch damit wäre 𝜑(𝑡) und 𝑧 < 𝑡, obwohl 𝑧 obere Schranke von 𝜑 ist, sodass die Annahme zu einem Widerspruch führt. Damit ist gezeigt, dass 𝑦 = 0, also ist 𝑢 < 𝑧 < 𝑣 ∧ 𝑥0 + ... + 𝑥𝑛 ⋅ 𝑧𝑛 = 0.
Die Axiomatisierung mit der Supremumsexistenz erlaubt beispielsweise den naheliegenden Beweis über die Existenz von Infima definierbarer, nicht-leerer, nach unten beschränkter Mengen. Diese Eigenschaft kann auch als Grundlage einer alternativen Axiomatisierung dienen. Lemma 2.2.4. Sei 𝜑(𝑥) ∈ 𝐿[𝑅𝐶𝐹]. Dann gilt
𝑅𝐶𝐹 ⊢∃𝑥𝜑(𝑥) ∧ ∃𝑦∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑦) → ∃𝑧(∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑧) ∧ ∀𝑦(∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑦) → 𝑧 ≥ 𝑦)) Beweis. Aufgrund von 𝐴𝑥𝑉𝑆 und ∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) ∈ 𝐿[𝑅𝐶𝐹] gilt
𝑅𝐶𝐹 ⊢ ∃𝑥∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) ∧ ∃𝑦∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑦) →∃𝑧(∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑧) ∧ ∀𝑦(∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑦) → 𝑧 ≤ 𝑦)) Doch da 𝑅𝐶𝐹 ⊢ ∀𝑥∃!𝑥 𝑥 + 𝑥 = 0, gilt auch 𝑅𝐶𝐹 ⊢ ∃𝑥𝜑(𝑥) → ∃𝑥∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )). Außerdem 𝑅𝐶𝐹 ⊢ ∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑦) → ∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 + 𝑦 ≤ 0), also folgt in 𝑅𝐶𝐹 aus ∃𝑥𝜑(𝑥) ∧ ∃𝑦∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑦) zunächst ∃𝑥∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) ∧ ∃𝑦∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑦) und daraus dann
∃𝑧(∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑧) ∧ ∀𝑦(∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑦) → 𝑧 ≤ 𝑦)) Doch nun gilt ebenso
𝑅𝐶𝐹 ⊢ ∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑧) → ∀𝑥(𝜑(𝑥) → 𝑥 + 𝑧 ≥ 0) und 𝑅𝐶𝐹 ⊢ ∀𝑦(∀𝑥(∃𝑥 (𝑥 + 𝑥 = 0 ∧ 𝜑(𝑥 )) → 𝑥 ≤ 𝑦) → 𝑧 ≤ 𝑦) → ∀𝑦(∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑦) → 0 ≥ 𝑦 + 𝑧), sodass mit 𝑅𝐶𝐹 ⊢ ∃𝑧 𝑧 + 𝑧 = 0 das Gewünschte
𝑅𝐶𝐹 ⊢∃𝑥𝜑(𝑥) ∧ ∃𝑦∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑦) → ∃𝑧 (∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑧 ) ∧ ∀𝑦(∀𝑥(𝜑(𝑥) → 𝑥 ≥ 𝑦) → 𝑧 ≥ 𝑦)) folgt.
2.2 Alternative Axiomatisierungen von 𝑅𝐶𝐹
| 71
Bemerkung 2.2.5. Die Wahl der Sprache mit einem Ordnungssymbol ist zwar nicht notwendig, aber praktischer. Sei 𝑅𝐶𝐹𝐾 die Theorie in der Sprache mit Vokabular {0, 1, +, ⋅} von
𝐴𝑥𝐾 ∪ 𝐴𝑥𝑅𝐶 ∪ {∀𝑥0 ...∀𝑥𝑛 (𝑥0 ⋅𝑥0 +...+𝑥𝑛 ⋅𝑥𝑛 = 0 → 𝑥0 = 0∧...∧𝑥𝑛 = 0) | 𝑛 ∈ ℕ}. Dies sind die Axiome für reell abgeschlossene Körper ohne Ordnungsrelation. Dann ist 𝑅𝐶𝐹 ⪯ 𝑅𝐶𝐹𝐾 über eine (unrelativierte) Interpretation 𝐼, für die
𝐼(𝑥 ≤ 𝑦) ≐ ∃𝑧(𝑥 + 𝑧 ⋅ 𝑧 = 𝑦) und die außer Ungleichungen alles auf sich selbst abbildet. Insbesondere ist die Übersetzung der Axiome von 𝐴𝑥𝑂 in reell abgeschlossenen Körpern gewährleistet, vgl. Lam (2005, Kapitel 8): – ∀𝑥∀𝑦∀𝑧(𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑧 → 𝑥 ≤ 𝑧): Wenn es 𝑧1 , 𝑧2 gibt mit 𝑥 + 𝑧12 = 𝑦 und – –
– –
𝑦 + 𝑧22 = 𝑧, dann gibt es auch 𝑧3 = √𝑧12 + 𝑧22 ,⁴⁶ sodass 𝑥 + 𝑧32 = 𝑧. ∀𝑥∀𝑦(𝑥 ≤ 𝑦 ∨ 𝑦 ≤ 𝑥): Wegen 𝐴𝑥𝑅𝐶 folgt, dass es ein 𝑧 geben muss, sodass entweder 𝑧2 = 𝑥 − 𝑦 oder 𝑧2 = 𝑦 − 𝑥. ∀𝑥∀𝑦(𝑥 ≤ 𝑦 ∧ 𝑦 ≤ 𝑥 → 𝑥 = 𝑦): Wenn 𝑥 + 𝑧12 = 𝑦 und 𝑦 + 𝑧22 = 𝑥, dann ist 𝑧12 + 𝑧22 = 0 und wegen des zusätzlichen Axioms in 𝑅𝐶𝐹𝐾 folgt, 𝑧1 = 0, sodass 𝑥 = 𝑦. ∀𝑥∀𝑦∀𝑧(𝑥 ≤ 𝑦 → 𝑥 + 𝑧 ≤ 𝑦 + 𝑧): Wenn 𝑥 + 𝑧12 = 𝑦, dann ist auch 𝑥 + 𝑧 + 𝑧12 = 𝑦 + 𝑧. ∀𝑥∀𝑦(0 ≤ 𝑥 ∧ 0 ≤ 𝑦 → 0 ≤ 𝑥 ⋅ 𝑦): Wenn 𝑥 = 𝑧12 und 𝑦 = 𝑧22 , dann gibt es auch ein 𝑧4 = 𝑧1 ⋅ 𝑧2 , sodass 𝑧42 = 𝑥 ⋅ 𝑦.
Korollar 2.2.6. 𝑅𝐶𝐹𝐾 ist vollständig und entscheidbar. Beweis. Da 𝑅𝐶𝐹 vollständig ist, 𝑅𝐶𝐹 ⪯ 𝑅𝐶𝐹𝐾 und 𝐿[𝑅𝐶𝐹𝐾 ] ⊆ 𝐿[𝑅𝐶𝐹] folgt, dass jede Formel in 𝐿[𝑅𝐶𝐹𝐾 ] von 𝑅𝐶𝐹 entschieden wird und durch die Interpretation die gleiche Formel dann auch von 𝑅𝐶𝐹𝐾 , vgl. Satz 2.1.2 und Bemerkung 2.2.5. Korollar 2.2.7. 𝑅𝐶𝐹𝐾 ⊂ 𝑅𝐶𝐹 Beweis. Es gilt 𝐿[𝑅𝐶𝐹𝐾 ] ⊂ 𝐿[𝑅𝐶𝐹]. Nun ist die Struktur ⟨ℝ, 0ℝ , 1ℝ , +ℝ , ⋅ℝ , ≤ℝ ⟩ ein Modell von 𝑅𝐶𝐹 und das Redukt ⟨ℝ, 0ℝ , 1ℝ , +ℝ , ⋅ℝ ⟩ ein Modell von 𝑅𝐶𝐹𝐾 . 46 Reell abgeschlossene Körper sind aufgrund des ersten Axioms von 𝐴𝑥𝑅𝐶 euklidisch und damit insbesondere pythagoreisch, d.h. jede endliche Summe von Quadraten ist wieder ein Quadrat. Damit ist die Existenz dieser Wurzel gewährleistet.
72 | 2 Die Theorie der reell abgeschlossenen Körper 𝑅𝐶𝐹
Dann folgt mit Vollständigkeit von 𝑅𝐶𝐹 für jeden Satz 𝜑 ∈ 𝐿[𝑅𝐶𝐹𝐾 ]: 𝑅𝐶𝐹𝐾 ⊢ 𝜑
⇒ ⟨ℝ, 0ℝ , 1ℝ , +ℝ , ⋅ℝ ⟩ 𝜑 ⇒ ⟨ℝ, 0ℝ , 1ℝ , +ℝ , ⋅ℝ , ≤ℝ ⟩ 𝜑 ⇒ 𝑅𝐶𝐹 ⊢ 𝜑.
2.3 Definierbarkeit in 𝑅𝐶𝐹 Definition 2.3.1. Eine Menge oder Relation 𝑋 ist definierbar in einer 𝐿-Struktur M, wenn es eine Formel 𝜑 ∈ 𝐿 gibt, sodass 𝜑M = 𝑋.⁴⁷ 𝑋 ist definierbar in einer Theorie 𝑇, wenn es ein Modell M 𝑇 gibt, sodass 𝑋 in M definierbar ist. Eine Funktion (oder Konstante) 𝑓 ist definierbar in M, bzw. 𝑇, wenn 𝑔𝑟𝑎𝑝ℎ(𝑓) in M, bzw. 𝑇, definierbar ist. Eine Struktur ist in M definierbar, wenn ihre einzelnen Komponenten es sind. Das grundlegende Theorem über in 𝑅𝐶𝐹 definierbare Mengen wurde von Tarski (1957, Fußnote 13) bewiesen und wird in der Modelltheorie als o-Minimalität⁴⁸ von 𝑅𝐶𝐹 bezeichnet: Satz 2.3.2. Eine in 𝑅𝐶𝐹 definierbare Menge hat die Form einer endlichen Vereinigung von Intervallen, welche offen, geschlossen, halboffen, beschränkt oder unbeschränkt sein können und deren Intervallgrenzen algebraisch sind. Beweisidee. Literale in 𝐿[𝑅𝐶𝐹] haben die Form polynomialer Gleichungen und Ungleichungen mit ganzzahligen Koeffizienten. Aufgrund des Lemmas 2.1.1 gibt es für alle Formeln 𝜑 eine quantorenfreie Formel 𝜓 in 𝐿[𝑅𝐶𝐹], deren freie Variablen auch in 𝜑 vorkommen, sodass 𝑅𝐶𝐹 ⊢ 𝜑 ↔ 𝜓. Mit Hilfe äquivalenter Umformungen in eine disjunktive Normalform kann 𝜓 als Disjunktion von Konjunktionen polynomialer Gleichungen und Ungleichungen gewählt werden. Polynomiale (nicht-triviale) Gleichungen definieren Punktmengen, Ungleichungen definieren offene Intervalle, Negationen bilden Komplemente, Konjunktionen bilden Durchschnitte und Disjunktionen bilden Vereinigungen. Da endliche Vereinigungen von Intervallen unter Komplement-, Durchschnitts- und Vereinigungsoperationen wieder endliche Vereinigungen von Intervallen bilden, folgt, dass die
47 Für eine 𝐿-Struktur S und eine 𝐿-Formel 𝜒(𝑥1 , ..., 𝑥𝑛 ) ist
𝜒S = {⟨𝑎1 , ..., 𝑎𝑛 ⟩ ∈ 𝑑𝑜𝑚(S)𝑛 | S, 𝛽(𝑥1 : 𝑎1 )...(𝑥𝑛 : 𝑎𝑛 ) 𝜒(𝑥1 , ..., 𝑥𝑛 )}.
48 Beispiele für andere o-minimale Theorien sind die Theorie der dichten linearen Ordnungen
𝐷𝐿𝑂, die Theorie der diskreten unendlichen Ordnungen, 𝑇ℎ(ℚ, 0, +, 𝑏 → ∃𝑤(𝑤 < 𝑧 ∧ ¬𝜑(𝑤))) ∧ 𝑥 + 1 = 𝑏)] ∨ [∃𝑎(∀𝑦(𝑦 ≤ 𝑎 → ¬𝜑(𝑦)) ∧ {[∀𝑦(𝑦 > 𝑎 → 𝜑(𝑦)) ∧ 𝑥 = 𝑎 + 1] ∨ [∃𝑏(∀𝑦(𝑎 < 𝑦 < 𝑏 → 𝜑(𝑦)) ∧ ∀𝑧(𝑧 > 𝑏 → ∃𝑦 < 𝑧 ¬𝜑(𝑦)) ∧ 𝑥 + 𝑥 = 𝑎 + 𝑏)]})] 49 Wenn 𝜑 die leere Menge definiert (also 𝑅𝐶𝐹 ⊢ ¬∃𝑥𝜑), sei ihre Skolemfunktion 𝑥 ≠ 𝑥.
74 | 2 Die Theorie der reell abgeschlossenen Körper 𝑅𝐶𝐹
Zunächst folgt unmittelbar in 𝑅𝐶𝐹 aus jedem Disjunktionsglied von 𝜓(𝑥) jeweils 𝜑(𝑥), also gilt 𝑅𝐶𝐹 ⊢ 𝜓(𝑥) → 𝜑(𝑥). Nach der prädikatenlogischen Regel der Substitution äquivalenter Teilformeln folgt aus der Konstruktion von 𝜓(𝑥) ebenso direkt der Zusatz: 𝑅𝐶𝐹 ⊢ ∀𝑥(𝜑(𝑥) ↔ 𝜑 (𝑥)) → ∀𝑥(𝜓(𝑥) ↔ 𝜓 (𝑥)). Als letztes ist nun zu zeigen, dass unter der Annahme 𝑅𝐶𝐹 ⊢ ∃𝑥𝜑(𝑥) gilt 𝑅𝐶𝐹 ⊢ ∃!𝑥𝜓(𝑥). Die durch 𝜑 definierte Menge sei also nicht leer. Nach Satz 2.3.2 ist sie eine endliche Vereinigung von Intervallen. Darunter gibt es dann ein eindeutiges Intervall, dessen Elemente kleiner sind als alle Elemente der anderen Intervalle. Für dieses Intervall betrachten wir folgende auf Satz 2.3.2 beruhende Fallunterscheidung: Wenn das Intervall nach unten geschlossen und beschränkt ist, gilt
𝑅𝐶𝐹 ⊢ ∃!𝑥(∀𝑦(𝜑(𝑦) → 𝑥 ≤ 𝑦) ∧ 𝜑(𝑥)). Dann gilt in 𝑅𝐶𝐹 jeweils die Negation der letzten vier Disjunktionsglieder von 𝜓(𝑥), jedoch das erste Disjunktionsglied, also 𝑅𝐶𝐹 ⊢ ∃!𝑥𝜓(𝑥). Andernfalls ist das Intervall nach unten offen.⁵⁰ Wenn es nach unten unbeschränkt ist, kann es erstens nach oben auch unbeschränkt oder zweitens nach oben beschränkt sein: Im ersten Fall deckt das Intervall die gesamte Domain ab, dann wird in 𝑅𝐶𝐹 nur das zweite Disjunktionsglied und damit ∃!𝑥𝜓(𝑥) gültig sein. Im zweiten Fall gibt es dann also genau eine (offene oder geschlossene) obere Intervallgrenze, sodass nur das dritte Disjunktionsglied und auch wieder ∃!𝑥𝜓(𝑥) in 𝑅𝐶𝐹 gilt. Bleibt der Fall, dass das Intervall nach unten offen und beschränkt ist, d.h. es gibt eine eindeutige untere Intervallgrenze. Auch dann kann es nach oben entweder unbeschränkt oder beschränkt sein. Im ersten Fall gilt in 𝑅𝐶𝐹 dann nur das vierte Diskunktionsglied und somit ∃!𝑥𝜓(𝑥). Im zweiten Fall gibt es auch eine eindeutige obere Intervallgrenze, sodass nur das letzte Disjunktionsglied entscheidet und es ein eindeutiges arithmetische Mittel der beiden Grenzen gibt, also
𝑅𝐶𝐹 ⊢ ∃!𝑥𝜓(𝑥). Korollar 2.3.5. Für jede in 𝑅𝐶𝐹 definierbare Äquivalenzrelation ∼ gibt es eine in 𝑅𝐶𝐹 definierbare Funktion 𝑓, welche jedem Element einer Äquivalenzklasse einen Repräsentanten zuordnet: 𝑅𝐶𝐹 ⊢ ∀𝑦(𝑓(𝑦) ∼ 𝑦 ∧ ∀𝑥(𝑥 ∼ 𝑦 ↔ 𝑓(𝑥) = 𝑓(𝑦))). Beweis. Sei 𝜓(𝑥, 𝑦) die Skolemfunktion der Formel 𝑥 ∼ 𝑦. Da 𝑅𝐶𝐹 ⊢ 𝑦 ∼ 𝑦, gilt auch 𝑅𝐶𝐹 ⊢ ∃𝑥 𝑥 ∼ 𝑦 und 𝑅𝐶𝐹 ⊢ ∀𝑦∃!𝑥 𝜓(𝑥, 𝑦). Also können wir definieren 𝑓(𝑦) = 𝑥 :↔ 𝜓(𝑥, 𝑦). Da 𝑅𝐶𝐹 ⊢ 𝜓(𝑥, 𝑦) → 𝑥 ∼ 𝑦, gilt 𝑅𝐶𝐹 ⊢ 𝑓(𝑦) ∼ 𝑦.
50 Unbeschränkte Intervalle sind sowohl offen als auch geschlossen.
2.3 Definierbarkeit in 𝑅𝐶𝐹
| 75
Daraus und aufgrund der Transitivität der Äquivalenzrelation folgt, 𝑅𝐶𝐹 ⊢ 𝑓(𝑥) = 𝑓(𝑦) → 𝑥 ∼ 𝑦. Ebenso wegen der Transitivität gilt 𝑅𝐶𝐹 ⊢ 𝑥 ∼ 𝑦 → ∀𝑧(𝑧 ∼ 𝑥 ↔ 𝑧 ∼ 𝑦). Wegen des Zusatzes von Satz 2.3.4, gilt
𝑅𝐶𝐹 ⊢ ∀𝑧(𝑧 ∼ 𝑥 ↔ 𝑧 ∼ 𝑦) → ∀𝑧(𝜓(𝑧, 𝑥) ↔ 𝜓(𝑧, 𝑦)). Also gilt mit der Funktionalität von 𝜓 auch 𝑅𝐶𝐹 ⊢ 𝑥 ∼ 𝑦 → 𝑓(𝑥) = 𝑓(𝑦). Das Verfahren aus dem Beweis von Satz 2.3.4 ist auch anwendbar, um aus jeder nichtleeren, 𝑅𝐶𝐹-definierbaren Menge von 𝑛-Tupeln ein eindeutiges 𝑛-Tupel auszuwählen. Daraus folgt auch eine Verallgemeinerung von Korollar 2.3.5 auf Äquivalenzrelationen zwischen 𝑛-Tupeln, vgl. van den Dries (1984, (4.1)). Diese Eigenschaft von 𝑅𝐶𝐹 wird in der Modelltheorie auch uniforme Elimination der Imaginären genannt, vgl. Hodges (1993, 4.4). Satz 2.3.6. Für alle Formeln 𝜑(𝑥1 , ..., 𝑥𝑛 ) ∈ 𝐿[𝑅𝐶𝐹] gibt es ein 𝜓(𝑥1 , ..., 𝑥𝑛 ) ∈
𝐿[𝑅𝐶𝐹], sodass
𝑅𝐶𝐹 ⊢ (𝜓(𝑥1 , ...𝑥𝑛 ) → 𝜑(𝑥1 , ...𝑥𝑛 )) ∧ (∃𝑥1 ...∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) → 𝑛
∃𝑥1 ...∃𝑥𝑛 (𝜓(𝑥1 , ...𝑥𝑛 ) ∧ ∀𝑦1 ...∀𝑦𝑛 (𝜓(𝑦1 , ..., 𝑦𝑛 ) → ⋀ 𝑥𝑖 = 𝑦𝑖 ))) 𝑖=1
Zusätzlich gilt für zwei solcher Formeln 𝜓(𝑥1 , ..., 𝑥𝑛 ), bzw. 𝜓 (𝑥1 , ..., 𝑥𝑛 ) von zwei Formeln 𝜑(𝑥1 , ..., 𝑥𝑛 ), bzw. 𝜑 (𝑥1 , ..., 𝑥𝑛 ), dass
𝑅𝐶𝐹 ⊢∀𝑥1 ...∀𝑥𝑛 (𝜑(𝑥1 , ..., 𝑥𝑛 ) ↔ 𝜑 (𝑥1 , ..., 𝑥𝑛 )) → ∀𝑥1 ...∀𝑥𝑛 (𝜓(𝑥1 , ..., 𝑥𝑛 ) ↔ 𝜓 (𝑥1 , ..., 𝑥𝑛 )). Beweis. Wir beweisen induktiv über 𝑛: Wenn 𝑛 = 1, dann ist die Aussage identisch zu Satz 2.3.4. Sei die Aussage für alle Formel mit 𝑛−1 freien Variablen bewiesen, nun zeigen wir die Aussage für die Formel 𝜑(𝑥1 , ..., 𝑥𝑛 ) ∈ 𝐿[𝑅𝐶𝐹] mit 𝑛 freien Variablen. Mit der Induktionsvoraussetzung bezüglich der Formel ∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) erhalten wir eine Formel 𝜓∗ (𝑥1 , ..., 𝑥𝑛−1 ) ∈ 𝐿[𝑅𝐶𝐹] mit
𝑅𝐶𝐹 ⊢ (𝜓∗ (𝑥1 , ...𝑥𝑛−1 ) → ∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 )) ∧
(1) ∗
(∃𝑥1 ...∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) →∃𝑥1 ...∃𝑥𝑛−1 (𝜓 (𝑥1 , ..., 𝑥𝑛−1 ) ∧ 𝑛−1
(2)
∀𝑦1 ...∀𝑦𝑛−1 (𝜓∗ (𝑦1 , ..., 𝑦𝑛−1 ) → ⋀ 𝑥𝑖 = 𝑦𝑖 ))). (3) 𝑖=1
Nun wenden wir Satz 2.3.4 auf die einstellige Formel
∀𝑥1 ...∀𝑥𝑛−1 (𝜓∗ (𝑥1 , ..., 𝑥𝑛−1 ) → 𝜑(𝑥1 , ..., 𝑥𝑛 )) ∈ 𝐿[𝑅𝐶𝐹]
76 | 2 Die Theorie der reell abgeschlossenen Körper 𝑅𝐶𝐹
an. Damit gibt es eine Formel 𝜒(𝑥𝑛 ) ∈ 𝐿[𝑅𝐶𝐹] mit
𝑅𝐶𝐹 ⊢∀𝑥𝑛 (𝜒(𝑥𝑛 ) → ∀𝑥1 ...∀𝑥𝑛−1 (𝜓∗ (𝑥1 , ..., 𝑥𝑛−1 ) → 𝜑(𝑥1 , ..., 𝑥𝑛 ))) ∧ ∗
(∃𝑥𝑛 ∀𝑥1 ...∀𝑥𝑛−1 (𝜓 (𝑥1 , ..., 𝑥𝑛−1 ) → 𝜑(𝑥1 , ..., 𝑥𝑛 )) → ∃!𝑥𝑛 𝜒(𝑥𝑛 )).
(4) (5)
Nun sei das Gesuchte 𝜓(𝑥1 , ..., 𝑥𝑛 ) ≐ 𝜓∗ (𝑥1 , ..., 𝑥𝑛−1 )∧𝜒(𝑥𝑛 ) ∈ 𝐿[𝑅𝐶𝐹]. Zunächst folgt schon aus (4)
𝑅𝐶𝐹 ⊢ 𝜓∗ (𝑥1 , ..., 𝑥𝑛−1 ) ∧ 𝜒(𝑥𝑛 ) → 𝜑(𝑥1 , ..., 𝑥𝑛 ). Aus (2) folgt
𝑅𝐶𝐹 ⊢ ∃𝑥1 ...∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) → ∃𝑥1 ...∃𝑥𝑛−1 𝜓∗ (𝑥1 , ...𝑥𝑛−1 ). Aus (1) folgt
𝑅𝐶𝐹 ⊢ ∀𝑥1 ...∀𝑥𝑛−1 (𝜓∗ (𝑥1 , ...𝑥𝑛−1 ) → ∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 )) und mit (3) und Leibniz-Prinzip gilt dann
𝑅𝐶𝐹 ⊢ ∃𝑥1 ...∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) → ∃𝑥𝑛 ∀𝑥1 ...∀𝑥𝑛−1 (𝜓∗ (𝑥1 , ...𝑥𝑛−1 ) → 𝜑(𝑥1 , ...𝑥𝑛 )). Also gilt mit Kettenschluss und (5)
𝑅𝐶𝐹 ⊢ ∃𝑥1 ...∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) → ∃!𝑥𝑛 𝜒(𝑥𝑛 ). Zusammen genommen dann also
𝑅𝐶𝐹 ⊢ ∃𝑥1 ...∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) → ∃𝑥1 ...∃𝑥𝑛 (𝜓∗ (𝑥1 , ..., 𝑥𝑛−1 ) ∧ 𝜒(𝑥𝑛 )), und schließlich mit (3) und der Eindeutigkeitssaussage bezüglich 𝜒 auch
𝑅𝐶𝐹 ⊢ ∃𝑥1 ...∃𝑥𝑛 𝜑(𝑥1 , ...𝑥𝑛 ) →∃𝑥1 ...∃𝑥𝑛 (𝜓∗ (𝑥1 , ..., 𝑥𝑛−1 ) ∧ 𝜒(𝑥𝑛 ) 𝑛
∧∀𝑦1 ...∀𝑦𝑛 (𝜓∗ (𝑦1 , ..., 𝑦𝑛−1 ) ∧ 𝜒(𝑦𝑛 ) → ⋀ 𝑥𝑖 = 𝑦𝑖 )). 𝑖=1
∗
Seien nun für eine Formel 𝜑 (𝑥1 , ..., 𝑥𝑛 ) ∈ 𝐿[𝑅𝐶𝐹] analog Formeln 𝜓 und 𝜒 ∗ konstruiert und sei 𝜓 = 𝜓 ∧ 𝜒 . Dann folgt prädikatenlogisch
𝑅𝐶𝐹 ⊢ ∀𝑥1 ...∀𝑥𝑛 (𝜑 ↔ 𝜑 ) → ∀𝑥1 ...∀𝑥𝑛−1 (∃𝑥𝑛 𝜑 ↔ ∃𝑥𝑛 𝜑 ) und mit dem Zusatz der Induktionsvoraussetzung und Kettenschluss ∗
𝑅𝐶𝐹 ⊢ ∀𝑥1 ...∀𝑥𝑛 (𝜑 ↔ 𝜑 ) → ∀𝑥1 ...∀𝑥𝑛−1 (𝜓∗ ↔ 𝜓 ).
2.3 Definierbarkeit in 𝑅𝐶𝐹
| 77
Außerdem folgt daraus 𝑅𝐶𝐹 ⊢ ∗
∀𝑥1 ...∀𝑥𝑛 (𝜑 ↔ 𝜑 ) → ∀𝑥𝑛 (∀𝑥1 ...∀𝑥𝑛−1 (𝜓∗ → 𝜑) ↔ ∀𝑥1 ...∀𝑥𝑛−1 ( 𝜓 → 𝜑 )), sodass mit der zusätzlichen Eigenschaft von 𝜒 in Satz 2.3.4 folgt
𝑅𝐶𝐹 ⊢ ∀𝑥1 ...∀𝑥𝑛 (𝜑 ↔ 𝜑 ) → ∀𝑥𝑛 (𝜒 ↔ 𝜒 ). Zusammen genommen folgt damit ∗
𝑅𝐶𝐹 ⊢ ∀𝑥1 ...∀𝑥𝑛 (𝜑 ↔ 𝜑 ) → ∀𝑥1 ...∀𝑥𝑛 (𝜓∗ ∧ 𝜒 ↔ 𝜓 ∧ 𝜒 ). Damit erfüllt die Formel 𝜓 alle gewünschten Eigenschaften. Korollar 2.3.7. Für jede in 𝑅𝐶𝐹 definierbare Äquivalenzrelation ∼ zwischen zwei 𝑛-Tupeln gibt es eine in 𝑅𝐶𝐹 definierbare Funktion 𝑓, die jedem Element einer Äquivalenzklasse einen Repräsentanten zuordnet: 𝑅𝐶𝐹 ⊢ ∀𝑦1 ...∀𝑦𝑛 (𝑓(𝑦1 , ..., 𝑦𝑛 ) ∼ (𝑦1 , ..., 𝑦𝑛 ) ∧ ∀𝑥1 ...∀𝑥𝑛 ((𝑥1 , ..., 𝑥𝑛 ) ∼ (𝑦1 , ...𝑦𝑛 ) ↔ 𝑓(𝑥1 , ..., 𝑥𝑛 ) = 𝑓(𝑦1 , ..., 𝑦𝑛 ))). Beweis. Analog zum Beweis von Korollar 2.3.5. Eine andere Folge aus der o-Minimalität betrifft die Definierbarkeit von Funktionen in 𝑅𝐶𝐹. van den Dries (1998, Kapitel 3) bewies folgende zwei Theoreme allgemein für o-minimale Theorien, das monotonicity theorem und das cell decomposition theorem.⁵¹ Die Beweise sind umfangreich, aber in der Literatur gut ausgeführt, deswegen werden die Ergebnisse hier zunächst nur zitiert. Satz 2.3.8. Sei 𝑓 eine in 𝑅𝐶𝐹 definierbare, einstellige Funktion. Dann gibt es eine Partition des Definitionsbereiches von 𝑓 in endlich viele Punkte und endlich viele offene Intervalle, auf denen 𝑓 jeweils konstant oder streng monoton und stetig ist. Definition 2.3.9. Sei 𝑛 > 0 eine natürliche Zahl. 𝑛-Zellen werden induktiv wie folgt definiert: i) 1-Zellen sind in 𝑅𝐶𝐹 definierbare Mengen (vgl. Satz 2.3.2). ii) 𝑛 + 1-Zellen haben die Form (a) {⟨𝑎, 𝑓(𝑎)⟩ | 𝑎 ∈ 𝑌}, wobei 𝑌 eine 𝑛-Zelle und 𝑓 eine in 𝑅𝐶𝐹 definierbare, stetige Funktion auf 𝑌 ist, oder (b) {⟨𝑎, 𝑏⟩ | 𝑎 ∈ 𝑌 ∧ 𝑓(𝑎) < 𝑏 < 𝑔(𝑎)}, wobei 𝑌 eine 𝑛-Zelle und 𝑓 und 𝑔 in 𝑅𝐶𝐹 definierbare, stetige Funktionen mit 𝑓 < 𝑔 auf 𝑌 sind (𝑓 = −∞ oder 𝑔 = +∞ sei dabei möglich).
51 Vgl. auch Knight et al. (1986).
78 | 2 Die Theorie der reell abgeschlossenen Körper 𝑅𝐶𝐹
Satz 2.3.10. Sei 𝑛 > 0 eine natürliche Zahl. i) Jede in 𝑅𝐶𝐹 definierbare Menge von Folgen der Länge 𝑛 hat die Form einer (disjunkten) Vereinigung von endlich vielen 𝑛-Zellen. ii) Sei 𝑓 eine in 𝑅𝐶𝐹 definierbare, 𝑛-stellige Funktion. Dann gibt es eine Partition des Definitionsbereiches von 𝑓 in endlich viele 𝑛-Zellen, auf denen 𝑓 jeweils stetig ist. Wir beweisen hier ein einfacheres Korrolar des monotonicity theorem, um ein Korollar bezüglich der Mächtigkeit von Äquivalenzklassen nachweisen zu können. Satz 2.3.11. Sei 𝑓 eine in 𝑅𝐶𝐹 definierbare, einstellige Funktion. Dann gibt es eine Partition des Definitionsbereiches von 𝑓 in endlich viele Punkte und endlich viele offene Intervalle, auf denen 𝑓 jeweils konstant oder injektiv ist. Beweis. Der Definitionsbereich ist eine in 𝑅𝐶𝐹 definierbare Menge, also nach Satz 2.3.2 eine endliche Vereinigung von Punktmengen (von Grenzen der geschlossenen Intervalle) und offenen (ggf. unbeschränkten) Intervallen. OBdA nehmen wir an, dass der Definitionsbereich von 𝑓 ein offenes Intervall 𝐼 ist. Also ist 𝐼 unendlich. Zunächst zeigen wir mit einem modelltheoretischen Argument, dass es dann ein offenes Teilintervall 𝐽 ⊆ 𝐼 gibt, auf dem 𝑓 konstant oder injektiv ist. Sei 𝑎 ∈ 𝑑𝑜𝑚(M), für ein M 𝑅𝐶𝐹. Angenommen die M-definierbare Menge {𝑥 ∈ 𝐼 | 𝑓(𝑥) = 𝑎} ist unendlich, dann muss sie aufgrund der o-Minimalität mindestens ein offenes Intervall 𝐽 enthalten. Auf diesem ist 𝑓 dann also konstant. Nehmen wir nun an, dass für alle 𝑎 ∈ M {𝑥 ∈ 𝐼 | 𝑓(𝑥) = 𝑎} endlich ist. Dann ist {𝑦 ∈ 𝑑𝑜𝑚(M) | ∃𝑥𝑓(𝑥) = 𝑦} unendlich und enthält als M-definierbare Menge ein offenes Intervall 𝐽 . Sei nun die Funktion 𝑔 : 𝐽 → 𝐼 definiert durch
𝑔(𝑥) = 𝑦 :↔ 𝑓(𝑦) = 𝑥 ∧ ∀𝑧(𝑓(𝑧) = 𝑥 → 𝑦 ≤ 𝑧). 𝑔 bildet also jeden Funktionswert von 𝑓 in 𝐽 auf sein kleinstes Argument in 𝐼 ab, damit ist 𝑔 injektiv und 𝑓 ∘ 𝑔 = 𝑖𝑑𝐽 . Dann muss {𝑦 ∈ 𝐼 | ∃𝑥𝑔(𝑥) = 𝑦} unendlich sein und auch ein offenes Intervall 𝐽 enthalten. Auf diesem ist 𝑓 also injektiv. Aufgrund der Vollständigkeit von 𝑅𝐶𝐹 gilt dann für die Formel 𝜓𝑓 (𝑥, 𝑦) ≐ 𝑥 < 𝑦 ∧ [∃𝑧∀𝑤(𝑥 < 𝑤 < 𝑦 → 𝑓(𝑤) = 𝑧) ∨ ∀𝑧∀𝑤(𝑥 < 𝑧 < 𝑤 < 𝑦 ∧ 𝑓(𝑤) = 𝑓(𝑧) → 𝑧 = 𝑤)], dass 𝑅𝐶𝐹 ⊢ ∃𝑥∃𝑦𝜓𝑓 (𝑥, 𝑦) (wobei 𝐽 = {𝑧 ∈ 𝐼 | 𝑥 < 𝑧 < 𝑦}). Die Menge {𝑧 ∈ 𝐼 | 𝑅𝐶𝐹 ⊢ ¬∃𝑥∃𝑦(𝑥 < 𝑧 < 𝑦 ∧ 𝜓𝑓 (𝑥, 𝑦))} muss endlich sein, da sie 𝑅𝐶𝐹-definierbar, somit endliche Vereinigung von Punkt-
2.3 Definierbarkeit in 𝑅𝐶𝐹
| 79
mengen und offenen Intervallen ist (vgl. Satz 2.3.2), aber aufgrund des Ergebnisses des vorigen Absatzes kein offenes Intervall enthalten kann. Also gilt 𝑅𝐶𝐹 ⊢ ∃𝑥1 ...∃𝑥𝑛 ⋀𝑛−1 𝑖=1 𝜓𝑓 (𝑥𝑖 , 𝑥𝑖+1 ).⁵² Bemerkung 2.3.12. Daraus folgt, dass die Sinus- und Kosinusfunktionen als auch die charakteristische Funktion der natürlichen Zahlen in 𝑅𝐶𝐹 nicht definierbar sind. Korollar 2.3.13. Jede in 𝑅𝐶𝐹 definierbare Äquivalenzrelation besitzt nur endlich viele unendliche Äquivalenzklassen, d.h. es gibt nicht unendlich viele unendliche Äquivalenzklassen. Beweis. Nach Korollar 2.3.5 gibt es eine Funktion 𝑓, welche allen Elementen einer Äquivalenzklasse einen Repräsentanten zuordnet. Mit Satz 2.3.11 gibt es dann eine Partition des Definitionsbereiches von 𝑓 in endlich viele Punkte und offene Intervalle, auf denen 𝑓 entweder konstant oder injektiv ist. Ist 𝑓 auf einem der offenen Intervall konstant, dann ist dieses Intervall in einer unendlichen Äquivalenzklasse enthalten. Ist 𝑓 auf einem der offenen Intervalle injektiv, dann gehört jedes Element dieses Intervalls zu einer anderen Äquivalenzklasse. Also ist die Anzahl der unendlichen Äquivalenzklassen kleinergleich der endlichen Anzahl derjenigen offenen Intervallen der Partition, auf denen 𝑓 konstant ist.
52 Falls 𝑓 auf einem unbeschränkten Intervall definiert ist, beweist 𝑅𝐶𝐹 außerdem, dass 𝑓 auf den entsprechenden, übrig bleibenden unbeschränkten Teilintervallen konstant oder injektiv ist.
3 Negative Resultate über Interpretierbarkeit in
𝑅𝐶𝐹 Während es auf der Hand liegt, bestimmte stetige Objektbereiche (wie geometrische Räume oder komplexe Zahlen) auf reelle Zahlen zurückführen zu wollen, erwartet man von diskreter Mathematik eher, dass ihre Reduzierung auf eine Theorie der reellen Zahlen nicht zu bewerkstelligen ist. Diese Erwartung soll hier bestätigt werden. Dementsprechend werden negative Resultate über die Interpretierbarkeit in 𝑅𝐶𝐹 gezeigt. Die zu behandelnden Beispiele diskreter Mathematik sind Arithmetik, diskrete Ordnungen, Paarfunktionen und atomare Boole’sche Algebren. Schließlich sollen auch Varianten des Interpretierbarkeitsbegriffs berücksichtigt werden.
3.1 Theorien mit einer Paarfunktion Definition 3.1.1. Eine Theorie 𝑇 hat eine Paarfunktion, wenn es eine dreistellige Formel 𝛱(𝑥, 𝑦, 𝑧) in 𝐿[𝑇] gibt, sodass 𝑇 beweist
∀𝑥∀𝑦∃!𝑧𝛱(𝑥, 𝑦, 𝑧) ∧ ∀𝑣∀𝑤∀𝑥∀𝑦∀𝑧(𝛱(𝑥, 𝑦, 𝑧) ∧ 𝛱(𝑣, 𝑤, 𝑧) → 𝑥 = 𝑣 ∧ 𝑦 = 𝑤). Beispiel 3.1.2. Die Robinson-Arithmetik 𝑄 mit Induktionsschema für quantorenfreie Formeln hat eine Paarfunktion,⁵³ also insbesondere auch die PeanoArithmetik. Die Zermelo-Fraenkel-Mengentheorie 𝑍𝐹 hat ebenfalls eine Paarfunktion gemäß der klassischen Definition eines geordneten Paares: < 𝑥, 𝑦 >= {{𝑥}, {𝑥, 𝑦}}. Satz 3.1.3. Theorien, die eine Paarfunktion haben und die Existenz mindestens zweier Objekte beweisen, sind nicht relativ interpretierbar in 𝑅𝐶𝐹. Beweis. Die Theorie 𝑇 habe eine Paarfunktion und es gelte 𝑇 ⊢ ∃𝑥0 ∃𝑥1 𝑥0 ≠ 𝑥1 . Dann ist induktiv für 0 < 𝑛 < 𝜔 beweisbar, dass 𝑇 ⊢ ∃𝑥0 ...∃𝑥𝑛 ⋀0≤𝑖 𝑥⋅𝑥) → ∃𝑧(𝑁𝑧∧𝑧⋅𝑧 > 𝑥⋅𝑥∧∀𝑦 (𝑁𝑦 ∧𝑦 < 𝑧 → 𝑦 ⋅𝑦 ≤ 𝑥⋅𝑥) Wenn 𝑥 ⋅ 𝑥 ≤ 1, dann ist 𝑁(1 + 1) und (1 + 1) ⋅ (1 + 1) > 1 ≥ 𝑥 ⋅ 𝑥. Wenn 𝑥 ⋅ 𝑥 > 1, dann gibt es mit Lemma 6.2.1 ein 𝑧 mit 𝑁𝑧, sodass 𝑧 ⋅ 𝑧 ≥ 𝑧 > 𝑥 ⋅ 𝑥. Zusammengenommen gilt also der Antezedens ∃𝑧(𝑁𝑧 ∧ 𝑧 ⋅ 𝑧 > 𝑥 ⋅ 𝑥). Dann gibt es ein 𝑧 mit 𝑁𝑧, 𝑧⋅𝑧 > 𝑥⋅𝑥 und ∀𝑦 (𝑁𝑦 ∧𝑦 < 𝑧 → 𝑦 ⋅𝑦 ≤ 𝑥⋅𝑥). Da in reell abgeschlossenen Körpern Quadrate positiv sind, gilt 0 ≤ 𝑥 ⋅ 𝑥 < 𝑧 ⋅ 𝑧, also auch 0 < 𝑧. Dann gibt es ein 𝑦 mit 𝑁𝑦 und 𝑦 + 1 = 𝑧. Da 𝑦 < 𝑧, gilt auch 𝑦 ⋅ 𝑦 ≤ 𝑥 ⋅ 𝑥. Und für ein 𝑦 mit 𝑁𝑦 und 𝑦 ⋅ 𝑦 ≤ 𝑥 ⋅ 𝑥, würde aus 𝑦 > 𝑦 folgen, dass 𝑦 ≥ 𝑧 und damit 𝑦 ⋅ 𝑦 ≥ 𝑧 ⋅ 𝑧 > 𝑥 ⋅ 𝑥, also muss 𝑦 ≤ 𝑦 sein. Damit ist 𝜓𝑔 (𝑥, 𝑦) gezeigt. Außerdem ist dieses 𝑦 eindeutig: Sei 𝑦0 mit 𝜓𝑔 (𝑥, 𝑦0 ). Dann wäre 𝑁𝑦0 und
𝑦0 ⋅ 𝑦0 ≤ 𝑥 ⋅ 𝑥, woraus 𝑦0 ≤ 𝑦 folgt. Aber es wäre auch ∀𝑦 (𝑁𝑦 ∧ 𝑦 ⋅ 𝑦 ≤ 𝑥 ⋅ 𝑥 → 𝑦 ≤ 𝑦0 ), woraus 𝑦 ≤ 𝑦0 folgt. Also ist 𝑦0 = 𝑦. Außerdem wird eine Funktion benötigt, welche die 𝑥-te Dezimalstelle 𝑧 einer reellen Zahl 𝑦 bestimmt. Sei
𝜓𝑑𝑖𝑔 (𝑥, 𝑦, 𝑧) ≐ ∃𝑥0 ∃𝑥1 ∃𝑦 (𝑦 ≤ 0 ∧ 𝑦 ⋅ 𝑦 = 𝑦 ⋅ 𝑦 ∧ 𝑒𝑥𝑝(𝑥, 𝑥0 ) ∧ 𝜓𝑔 (𝑦 ⋅ 𝑥0 , 𝑥1 ) ∧ 𝜓𝑔 (((𝑦 ⋅ 𝑥0 + 𝑥1 ) ⋅ 10), 𝑧)). Lemma 6.2.3. 𝑅𝐶𝐹𝑁 ⊢ ∀𝑥∀𝑦(𝑁𝑥 → ∃𝑧(𝑁𝑧 ∧ 𝜓𝑑𝑖𝑔 (𝑥, 𝑦, 𝑧) ∧ ∀𝑧 (𝜓𝑑𝑖𝑔 (𝑥, 𝑦, 𝑧 )
→ 𝑧 = 𝑧 )))
Beweis. Wir argumentieren innerhalb eines Modells der Theorie 𝑅𝐶𝐹𝑁 mit den üblichen Rechenzeichen. Seien 𝑥 und 𝑦 mit 𝑁𝑥 gegeben. Wenn 𝑦 > 0, dann sei 𝑦 sein additiv Inverses, sonst sei, 𝑦 = 𝑦. Damit gilt 𝑦 ≤ 0 und 𝑦 ⋅ 𝑦 = 𝑦 ⋅ 𝑦. Aufgrund der Interpretation der Exponentialfunktion in 𝑅𝐶𝐹𝑁 gibt es ein 𝑥0 mit 𝑒𝑥𝑝(𝑥, 𝑥0 ). Aufgrund von Lemma 6.2.2 gibt es ein 𝑥1 mit 𝑁𝑥1 und 𝜓𝑔 (𝑦 ⋅ 𝑥0 , 𝑥1 ) und ein 𝑧 mit 𝑁𝑧 und 𝜓𝑔 (((𝑦 ⋅ 𝑥0 + 𝑥1 ) ⋅ 10), 𝑧). Dann gilt auch 𝜓𝑑𝑖𝑔 (𝑥, 𝑦, 𝑧).
142 | 6 Eine erststufige Theorie reeller und natürlicher Zahlen Sei nun ein 𝑧 gegeben mit 𝜓𝑑𝑖𝑔 (𝑥, 𝑦, 𝑧 ), d.h. es gibt 𝑥0 , 𝑥1 , 𝑦 mit
𝑦 ≤ 0 ∧ 𝑦 ⋅ 𝑦 = 𝑦 ⋅ 𝑦 ∧ 𝑒𝑥𝑝(𝑥, 𝑥0 ) ∧ 𝜓𝑔 (𝑦 ⋅ 𝑥0 , 𝑥1 ) ∧ 𝜓𝑔 (((𝑦 ⋅ 𝑥0 + 𝑥1 ) ⋅ 10), 𝑧 ). In reell abgeschlossenen Körpern hat die Gleichung 𝑦2 = 𝑦2 die zwei Lösungen 𝑦 = 𝑦 oder 𝑦 = −𝑦. Da 𝑦 ≤ 0, muss also 𝑦 = 𝑦 sein. Ebenso ist die Exponentialfunktion eindeutig, sodass 𝑥0 = 𝑥0 sein muss. Mit Lemma 6.2.2 folgt dann, dass 𝑥1 = 𝑥1 und 𝑧 = 𝑧 ist. Einer Folge natürlicher Zahlen wird wie folgt eine reelle Zahl zugeordnet: das erste Folgenglied bestimmt das Vorzeichen, das zweite den ganzzahligen Anteil (die natürliche Zahl vor dem Komma) und die folgenden Glieder die jeweilige Dezimalstelle. Dafür definiere die Formel
𝜓𝑑𝑒𝑐 (𝑥, 𝑦, 𝑧) ≐ [𝑥 = 0 ∧ ((0 ≤ 𝑦 ∧ 𝑧 = 1) ∨ (𝑦 < 0 ∧ 𝑧 = 0))] ∨ [𝑥 = 1 ∧ 𝜓𝑔 (𝑦, 𝑧)] ∨ ∃𝑢[𝑁𝑢 ∧ 𝑥 = 𝑢 + 1 + 1 ∧ 𝜓𝑑𝑖𝑔 (𝑢, 𝑦, 𝑧)] Lemma 6.2.4. 𝑅𝐶𝐹𝑁 ⊢ ∀𝑥∀𝑥 (∀𝑤(𝑁𝑤 → ∃𝑟(𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑟)∧𝜓𝑑𝑒𝑐 (𝑤, 𝑥 , 𝑟))) →
𝑥 = 𝑥 )
Beweis. Wir argumentieren innerhalb eines Modells der Theorie 𝑅𝐶𝐹𝑁 mit den üblichen Rechenzeichen (insbesondere sei 𝑒𝑥𝑝(𝑛, 𝑥) ⇔ 10𝑛 = 𝑥). Generell gilt: Für eine reelle Zahl 𝑧 und eine natürliche Zahl 𝑛 gilt 𝜓𝑔 (𝑧, 𝑛) genau dann, wenn auch 𝜓𝑔 (−𝑧, 𝑛). Wir nehmen nun an, dass es für alle 𝑤 mit 𝑁𝑤 ein 𝑟𝑤 gibt, sodass
𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑟𝑤 )∧𝜓𝑑𝑒𝑐 (𝑤, 𝑥 , 𝑟𝑤 ). Daraus folgt zunächst, dass 𝑥 ≥ 0 ⇔ 𝑥 ≥ 0, denn es gilt 𝜓𝑑𝑒𝑐 (0, 𝑥, 𝑟0 ) ∧ 𝜓𝑑𝑒𝑐 (0, 𝑥 , 𝑟0 ), d.h. entweder ist 𝑟0 = 1, dann sind 𝑥 ≥ 0 und 𝑥 ≥ 0, oder 𝑟0 = 0, dann sind 𝑥 < 0 und 𝑥 < 0. Außerdem gilt (∗) ∀𝑤(𝑁𝑤 → ∃𝑟(𝜓𝑔 (10𝑤 ⋅ 𝑥, 𝑟) ∧ 𝜓𝑔 (10𝑤 ⋅ 𝑥 , 𝑟))
Beweis von (∗): Wir führen eine Induktion über 𝑤, welche durch Lemma 6.1.2 gewährleistet ist. Der Induktionsanfang für 𝑤 = 0 folgt direkt aus den Voraussetzungen: 𝜓𝑔 (𝑥, 𝑟1 ) ∧ 𝜓𝑔 (𝑥 , 𝑟1 ). Sei nun die Aussage für 𝑤 mit 𝑁𝑤 bewiesen, also
gibt es ein 𝑟 mit 𝜓𝑔 (10𝑤 ⋅ 𝑥, 𝑟) und 𝜓𝑔 (10𝑤 ⋅ 𝑥 , 𝑟). Dann kann gezeigt werden,
dass auch 𝜓𝑔 (10𝑤+1 ⋅ 𝑥, 10 ⋅ 𝑟 + 𝑟𝑤+2 ): Zunächst gilt wie in Satz 6.1.4 gezeigt, 𝑁(10 ⋅ 𝑟 + 𝑟𝑤+2 ). Außerdem gilt 𝜓𝑑𝑒𝑐 (𝑤 + 2, 𝑥, 𝑟𝑤+2 ), also 𝜓𝑑𝑖𝑔 (𝑤, 𝑥, 𝑟𝑤+2 ). Sei
𝑦 = −|𝑥| ≤ 0, also ist dann auch 𝜓𝑔 (𝑦 ⋅ 10𝑤 , 𝑟). Daraus folgt mit Lemma 6.2.2 und 𝜓𝑑𝑖𝑔 (𝑤, 𝑥, 𝑟𝑤+2 ), dass 𝜓𝑔 ((𝑦 ⋅ 10𝑤 + 𝑟) ⋅ 10, 𝑟𝑤+2 ). Daraus folgt zu2 nächst 𝑟𝑤+2 ≤ ((𝑦 ⋅ 10𝑤 + 𝑟) ⋅ 10)2 , also auch 𝑟𝑤+2 ≤ (|𝑥| ⋅ 10𝑤 − 𝑟) ⋅ 10 und 10 ⋅ 𝑟 + 𝑟𝑤+2 ≤ 10𝑤+1 |𝑥|. Außerdem ist für jedes 𝑦 mit 𝑁𝑦 und 𝑦 > 10 ⋅ 𝑟 + 𝑟𝑤+2 dann auch 𝑦 − 10 ⋅ 𝑟 > 𝑟𝑤+2 ≥ 0 und 𝑁(𝑦 − 10 ⋅ 𝑟). Mit Kontraposition folgt
6.2 Folgen reeller Zahlen |
143
dann aus 𝜓𝑔 ((𝑦 ⋅ 10𝑤 + 𝑟) ⋅ 10, 𝑟𝑤+2 ), dass 𝑦 − 10 ⋅ 𝑟 > (|𝑥| ⋅ 10𝑤 − 𝑟) ⋅ 10, also
gilt 𝑦2 > (10𝑤+1 𝑥)2 . Also gilt 𝜓𝑔 (10𝑤+1 ⋅ 𝑥, 10 ⋅ 𝑟 + 𝑟𝑤+2 ). Doch ganz analog wird
𝜓𝑔 (10𝑤+1 ⋅ 𝑥 , 10 ⋅ 𝑟 + 𝑟𝑤+2 ) gezeigt, womit der Induktionsschluss bewiesen wurde.
Nun sei angenommen, dass 𝑥 ≠ 𝑥 , also sei oBdA 𝑦 := 𝑥 − 𝑥 > 0. Wir zeigen, dass sowohl 𝑦 ≥ 1 als auch 𝑦 < 1 zu einem Widerspruch führt. Sei 𝑦 ≥ 1 und 𝑥 ≥ 0. Dann ist auch 𝑥 ≥ 0. Außerdem folgt dann aus 𝜓𝑑𝑒𝑐 (1, 𝑥 , 𝑟1 ), 𝜓𝑔 (𝑥 , 𝑟1 ) und damit 𝑁𝑟1 und 𝑟1 ≤ 𝑥 . Schließlich ist auch
𝜓𝑑𝑒𝑐 (1, 𝑥, 𝑟1 ), 𝜓𝑔 (𝑥, 𝑟1 ) und damit ∀𝑦 (𝑁𝑦 ∧ 𝑦 ≤ 𝑥 → 𝑦 ≤ 𝑟1 ). Dann wäre aber 𝜓𝑔 (𝑥, 𝑟1 + 1) , denn es gilt 𝑁(𝑟1 + 1), 𝑟1 + 1 ≤ 𝑥 + 1 ≤ 𝑥 + 𝑦 = 𝑥 und für ein 𝑦 mit 𝑁𝑦 und 𝑦 ≤ 𝑥 ist 𝑦 ≤ 𝑟1 ≤ 𝑟1 + 1. Doch mit Lemma 6.2.2 folgte dann aus 𝜓𝑔 (𝑥, 𝑟1 ) und 𝜓𝑔 (𝑥, 𝑟1 + 1) der Widerspruch 𝑟1 + 1 = 𝑟1 . Sei nun 𝑦 ≥ 1 und 𝑥 < 0. Dann ist auch 𝑥 < 0. Außerdem folgt wieder 𝜓𝑔 (𝑥, 𝑟1 ) und damit 𝑁(𝑟1 ) und 𝑟12 ≤ 𝑥2 , bzw. 𝑟1 ≤ −𝑥. Schließlich ist auch 𝜓𝑔 (𝑥 , 𝑟1 ) und damit ∀𝑦 (𝑁𝑦 ∧ 𝑦 ≤ −𝑥 → 𝑦 ≤ 𝑟1 ). Dann wäre aber 𝜓𝑔 (𝑥 , 𝑟1 + 1) , denn es gilt 𝑁(𝑟1 + 1), 𝑟1 + 1 ≤ −𝑥 + 1 ≤ −𝑥 + 𝑦 = −𝑥 , bzw. (𝑟1 + 1)2 ≤ 𝑥2 und für ein 𝑦 mit 𝑁𝑦 und 𝑦2 ≤ 𝑥2 ist 𝑦 ≤ −𝑥 , also 𝑦 ≤ 𝑟1 ≤ 𝑟1 + 1. Doch mit Lemma 6.2.2 folgte dann aus 𝜓𝑔 (𝑥 , 𝑟1 ) und 𝜓𝑔 (𝑥 , 𝑟1 + 1) der Widerspruch 𝑟1 + 1 = 𝑟1 . Sei nun 𝑦 < 1. Wegen Lemma 6.2.1 und dem least number principle, gibt es ein kleinstes 𝑛 mit 𝑁𝑛 , sodass 1 ≤ 𝑛 ⋅ 𝑦, insbesondere ist 𝑛 > 1. Da 𝑃𝐴 ⪯ 𝑅𝐶𝐹𝑁,
folgt aus 10𝑛 +1 ≥ 𝑛 und dem least number principle, dass es auch ein kleinstes 𝑤 mit 𝑁𝑤 gibt, sodass 10𝑤 +1 ≥ 𝑛 . Damit gilt
1 ≤ 10𝑤 +1 ⋅ 𝑦 < 10.
Denn wäre 10𝑤 +1 ⋅ 𝑦 ≥ 10, also 1 ≤ 10𝑤 ⋅ 𝑦, wegen der Minimalität von 𝑛 ,
dann 𝑛 ≤ 10𝑤 , aber wegen der Minimalität von 𝑤 ist 10𝑤 < 𝑛 . Dann gilt 𝜓𝑑𝑒𝑐 (𝑤 + 2, 𝑥, 𝑟𝑤 +2 ) und 𝜓𝑑𝑒𝑐 (𝑤 + 2, 𝑥 , 𝑟𝑤 +2 ), also auch 𝜓𝑑𝑖𝑔 (𝑤 , 𝑥, 𝑟𝑤 +2 ) und
𝜓𝑑𝑖𝑔 (𝑤 , 𝑥 , 𝑟𝑤 +2 ). Sei nun erst 𝑥 ≥ 0 und 𝑥 ≥ 0. Damit folgt zunächst, dass es 𝑥1 und 𝑥1 gibt, sodass 𝜓𝑔 (𝑥 ⋅ 10𝑤 , 𝑥1 ) und 𝜓𝑔 (𝑥 ⋅ 10𝑤 , 𝑥1 ). Aus (∗) folgt mit Lemma 6.2.2, dass es ein 𝑟 gibt, sodass 𝑥1 = 𝑟 = 𝑥1 . Aus den Voraussetzungen ergibt sich dann des Weiteren
𝜓𝑔 ((𝑥 ⋅ 10𝑤 − 𝑥1 ) ⋅ 10, 𝑟𝑤 +2 ) und 𝜓𝑔 ((𝑥 ⋅ 10𝑤 − 𝑥1 ) ⋅ 10, 𝑟𝑤 +2 ).
Insbesondere ist 𝑥 ⋅ 10𝑤 − 𝑥1 ≥ 0 und 𝑥 ⋅ 10𝑤 − 𝑥1 ≥ 0.
144 | 6 Eine erststufige Theorie reeller und natürlicher Zahlen
Nun kann gezeigt werden, dass 𝜓𝑔 ((𝑥⋅10𝑤 −𝑥1 )⋅10, 𝑟𝑤 +2 +1), was zusammen mit Lemma 6.2.2 zu einem Widerspruch führt. Zunächst ist 𝑁(𝑟𝑤 +2 + 1). Dann ist
𝑟𝑤 +2 + 1 ≤ (𝑥 ⋅ 10𝑤 − 𝑥1 ) ⋅ 10 + 1 ≤ (𝑥 ⋅ 10𝑤 − 𝑥1 ) ⋅ 10 + 10𝑤 +1 ⋅ 𝑦
≤ ((𝑥 + 𝑦) ⋅ 10𝑤 − 𝑥1 ) ⋅ 10 = (𝑥 ⋅ 10𝑤 − 𝑥1 ) ⋅ 10
Wegen 𝜓𝑔 ((𝑥 ⋅ 10𝑤 − 𝑥1 ) ⋅ 10, 𝑟𝑤 +2 ) gilt außerdem für ein 𝑦 mit 𝑁𝑦 und
𝑦 ≤ (𝑥 ⋅ 10𝑤 − 𝑥1 ) ⋅ 10, dass auch 𝑦 ≤ 𝑟𝑤 +2 ≤ 𝑟𝑤 +2 +1. Damit ist der Widerspruch in diesem Fall gezeigt. Wenn nun 𝑥 < 0 und 𝑥 < 0, dann wird der Beweis analog geführt mit −𝑥 statt 𝑥 und −𝑥 statt 𝑥, vgl. den Beweis für den Fall 𝑦 ≥ 1. Die Nachkommastellen einer Dezimalzahl zwischen 0 und 1 können nun als Werte der charakteristischen Funktion einer Menge natürlicher Zahlen dienen, z.B. ist eine natürliche Zahl 𝑦 in der durch die reelle Zahl 𝑥 repräsentierten Menge enthalten, wenn 𝜓𝑑𝑖𝑔 (𝑦, 𝑥, 1), und nicht enthalten, wenn 𝜓𝑑𝑖𝑔 (𝑦, 𝑥, 0).
𝜓𝑠𝑒𝑡 (𝑥) ≐ 0 ≤ 𝑥 < 1 ∧ ∀𝑦(𝑁𝑦 → 𝜓𝑑𝑖𝑔 (𝑦, 𝑥, 0) ∨ 𝜓𝑑𝑖𝑔 (𝑦, 𝑥, 1)) Eine Folge natürlicher Zahlen ist eine Funktion aus und in die Menge der natürlichen Zahlen. Dann kann eine Folge natürlicher Zahlen auch als die Menge der geordneten Paare repräsentiert werden, an deren erster Stelle der Folgenindex und an zweiter Stelle der entsprechende, eindeutige Folgenwert steht. Für unsere Zwecke sind sogar Folgen von Folgen notwendig, sodass der Folgenindex selbst das geordnete Paar zweier natürlicher Zahlen ist. Mit Hilfe der Kodierung von Mengen definieren wir damit
𝜓𝑠 (𝑥) ≐ 𝜓𝑠𝑒𝑡 (𝑥) ∧ ∀𝑢(𝑁𝑢 ∧ 𝜓𝑑𝑖𝑔 (𝑢, 𝑥, 1) → ∃𝑣∃𝑤∃𝑠∃𝑡(𝑁𝑡 ∧ 𝑁𝑠 ∧ 𝑁𝑣 ∧ 𝑁𝑤 ∧ 𝑜𝑝(𝑣, 𝑤, 𝑡) ∧ 𝑜𝑝(𝑡, 𝑠, 𝑢) ∧ ∀𝑠 ∀𝑢 (𝑁𝑠 ∧ 𝑁𝑢 ∧ 𝑜𝑝(𝑡, 𝑠 , 𝑢 ) ∧ 𝜓𝑑𝑖𝑔 (𝑢 , 𝑥, 1) → 𝑠 = 𝑠))). Eine reelle Zahl repräsentiert dann eine Folge reeller Zahlen, wenn sie die Folge jener Folgen natürlicher Zahlen kodiert, die jeweils den Gliedern der Folge reeller Zahlen zugeordnet werden. Anders ausgedrückt: Das 𝑣-te Glied einer durch 𝑧 repräsentierten Folge reeller Zahlen ist genau dann 𝑥, wenn die die 𝑣-te, in 𝑧 kodierte Folge natürlicher Zahlen 𝑥 zugeordnet werden kann.
𝜂(𝑣, 𝑧, 𝑥) ≐ 𝜓𝑠 (𝑧) ∧ ∀𝑤(𝑁𝑤 →∃𝑢∃𝑡∃𝑠(𝑁𝑢 ∧ 𝑁𝑡 ∧ 𝑁𝑠 ∧ 𝑜𝑝(𝑣, 𝑤, 𝑡) ∧ 𝑜𝑝(𝑡, 𝑠, 𝑢) ∧ 𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑠) ∧ 𝜓𝑑𝑖𝑔 (𝑢, 𝑧, 1)))
6.2 Folgen reeller Zahlen |
145
Für jede in 𝑅𝐶𝐹𝑁 definierbare Folge, sei sie endlich oder unendlich, kann dann gezeigt werden, dass es eine reelle Zahl gibt, welche die Folge repräsentiert. Im Allgemeinen sind alle endlichen Folgen definierbar. Satz 6.2.5. Für beliebige Formeln 𝜑(𝑣, 𝑥) ∈ 𝐿[𝑅𝐶𝐹𝑁], in denen mindestens zwei freie Variablen 𝑣, 𝑥 vorkommen und für die gilt
𝑅𝐶𝐹𝑁 ⊢∀𝑣∀𝑥(𝑁𝑣 ∧ 𝜑(𝑣, 𝑥) → ∀𝑣 (𝑣 ≤ 𝑣 → ∃𝑥 𝜑(𝑣 𝑥 ))) ∧ ∀𝑣∀𝑥∀𝑥 (𝑁𝑣 ∧ 𝜑(𝑣, 𝑥) ∧ 𝜑(𝑣, 𝑥 ) → 𝑥 = 𝑥 ), ist 𝑅𝐶𝐹𝑁 ⊢ ∃𝑧∀𝑣(𝑁𝑣 → ∀𝑥(𝜂(𝑣, 𝑧, 𝑥) ↔ 𝜑(𝑣, 𝑥))). Zusatz: Wenn die durch 𝜑 definierte Folge nicht leer ist, beweist 𝑅𝐶𝐹𝑁 auch die Eindeutigkeit des Objekts 𝑧 mit ∀𝑣(𝑁𝑣 → ∀𝑥(𝜂(𝑣, 𝑧, 𝑥) ↔ 𝜑(𝑣, 𝑥))). Beweis. Wir argumentieren innerhalb eines Modells der Theorie 𝑇 und benutzen die üblichen, in 𝑇 definierbaren Rechenzeichen (wie Numerale, Funktionen für Inverse, Maxima und Minima endlicher Mengen, natürliche Potenzen (𝑒𝑥𝑝(𝑛, 𝑥) ⇔ 10𝑛 = 𝑥), endliche Summen natürlicher Zahlen, ...). Es gelte ∀𝑣∀𝑥(𝑁𝑣 ∧ 𝜑(𝑣, 𝑥) → ∀𝑣 (𝑣 ≤ 𝑣 → ∃𝑥 𝜑(𝑣 , 𝑥 ))) und ∀𝑣∀𝑥∀𝑥 (𝑁𝑣 ∧ 𝜑(𝑣, 𝑥) ∧ 𝜑(𝑣, 𝑥 ) → 𝑥 = 𝑥 ). Seien die restlichen freien Variablen in 𝜑(𝑣, 𝑥) durch feste Parameter belegt. Sei nun
𝜑𝑉 (𝑣) ≐ 𝑁𝑣 ∧ ∃𝑥𝜑(𝑣, 𝑥) Wenn ¬∃𝑣𝜑𝑉 (𝑣), dann sei 𝑧 = 1, denn dann ist ¬𝜓𝑠𝑒𝑡 (𝑧) und ¬𝜓𝑠 (𝑧) und somit für alle 𝑣 mit 𝑁𝑣 und für alle 𝑥 sowohl 𝜂(𝑣, 𝑧, 𝑥) ↔⊥ und 𝜑(𝑣, 𝑥) ↔⊥. Es gelte also für den weiteren Beweis ∃𝑣𝜑𝑊 (𝑣). Es folgt aus den Voraussetzungen 𝜑𝑉 (0), wenn 𝜑(𝑣), dann auch für alle 𝑣 ≤ 𝑣 𝜑𝑉 (𝑣 ) und
∀𝑣(𝜑𝑉 (𝑣) → ∃!𝑥𝜑(𝑣, 𝑥)) Sei also für alle 𝑣, die 𝜑𝑉 erfüllen, das durch 𝜑(𝑣, ⋅) definierte Objekt mit 𝑥𝑣 gekennzeichnet. Sei im Folgenden 𝑣 mit 𝜑𝑉 (𝑣) beliebig. Mit Lemma 6.2.3 wissen wir, dass es für alle 𝑢 mit 𝑁𝑢 Nachkommastellen 𝑧𝑢𝑣 gibt mit 𝑁𝑧𝑢𝑣 , 𝜓𝑑𝑖𝑔 (𝑢, 𝑥𝑣 , 𝑧𝑢𝑣 ). Dann definiere für alle 𝑤 mit 𝑁𝑤 und 𝑤 > 1 (sodass 𝑣 𝑁(𝑤 − 2)) die Folgenglieder 𝑠𝑤𝑣 = 𝑧𝑤−2 . Außerdem folgt aus Lemma 6.2.2, dass es ein 𝑠1𝑣 gibt mit 𝑁𝑠1𝑣 , 𝜓𝑔 (𝑥𝑣 , 𝑠1𝑣 ). Schließlich sei 1, wenn 0 ≤ 𝑥𝑣 , 𝑣
𝑠0 = { 0,
wenn 𝑥𝑣 < 0,
146 | 6 Eine erststufige Theorie reeller und natürlicher Zahlen 𝑣 𝑣 Daraus folgt für alle 𝑤 mit 𝑁𝑤, dass 𝑁𝑠𝑤 und 𝜓𝑑𝑒𝑐 (𝑤, 𝑥𝑣 , 𝑠𝑤 ).
Da 𝑜𝑝 eine Paarfunktion auf 𝑁 ist, gibt es nun für alle 𝑣 mit 𝜑𝑉 (𝑣) (also ins𝑣 𝑣 𝑣 besondere 𝑁𝑣) und für alle 𝑤 mit 𝑁𝑤 ein 𝑡𝑤 mit 𝑁𝑡𝑤 und 𝑜𝑝(𝑣, 𝑤, 𝑡𝑤 ). Ebenso 𝑣 𝑣 𝑣 𝑣 gibt es dann 𝑢𝑤 mit 𝑁𝑢𝑤 und 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤𝑣 ). Wir suchen nun eine Formel 𝜒(𝑦) ∈ 𝐿[𝑅𝐶𝐹𝑁], für die gilt
𝜒(𝑦) ⇔ ∃𝑛(𝑁𝑛 ∧
∑
∑
𝑣
10−(𝑢𝑤 +1) = 𝑦)
𝜑𝑉 (𝑣)∧𝑣≤𝑛 𝑁𝑤∧𝑤≤𝑛
Da 𝑃𝐴 ⪯ 𝑅𝐶𝐹𝑁 ist es möglich in 𝑅𝐶𝐹𝑁 endliche Folgen natürlicher Zahlen zu kodieren, vgl. Boolos (1993, S. 37 ff.). Also gibt es eine Formel 𝐹𝑖𝑛𝑆𝑒𝑞(𝑠) ∈ 𝐿[𝑅𝐶𝐹𝑁], die ausdrückt, dass 𝑠 eine endliche Folge natürlicher Zahlen ist. Außerdem gibt es definierbare Funktionen 𝑙(𝑠) und (𝑠)𝑖 , deren Funktionswerte die Länge der Folge 𝑠 und das 𝑖-te Folgenglied von 𝑠 darstellen. Um die Formel 𝜒 zu definieren, müssen nun zwei Probleme gelöst werden: Zum einen muss die unendliche Reihe konstruiert werden als Supremum der Menge der endlichen Partialsummen, deren Definierbarkeit nachgewiesen werden muss. Zum anderen muss die Reihe reeller Zahlen als Produkt einer Reihe natürlicher Zahlen mit einem reellen Faktor ausgedrückt werden. Wegen der Voraussetzung sind die 𝑥𝑣 für alle 𝑣 mit 𝜑𝑉 (𝑣) durch 𝜑(𝑣, 𝑥) defi𝑣 𝑣 nierbar. Wegen Lemma 6.2.4 sind die 𝑠𝑤 eindeutig durch 𝜓𝑑𝑒𝑐 (𝑤, 𝑥𝑣 , 𝑠𝑤 ) bestimmt. 𝑣 Schließlich sind mit den Eigenschaften der Paarfunktion 𝑜𝑝 auch die 𝑡𝑤 , bzw. 𝑣 𝑣 𝑣 𝑣 𝑣 𝑣 𝑢𝑤 durch 𝑜𝑝(𝑣, 𝑤, 𝑡𝑤 ), bzw. 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤 ) definiert. Also sei 𝑢𝑤 definiert durch
𝜓0 (𝑢, 𝑤, 𝑣) ≐
𝑁𝑢 ∧ ∃𝑠∃𝑡∃𝑥(𝑁𝑠 ∧ 𝑁𝑡 ∧ 𝜑(𝑣, 𝑥) ∧ 𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑠) ∧ 𝑜𝑝(𝑣, 𝑤, 𝑡) ∧ 𝑜𝑝(𝑡, 𝑠, 𝑢)). Insbesondere ist 𝑁𝑤 ∧ 𝜑𝑉 (𝑣) → ∃!𝑢𝜓0 (𝑢, 𝑤, 𝑣) beweisbar. Da nur Folgen natürlicher Zahlen gebildet werden können, muss dafür gesorgt werden, dass die Glieder obiger Reihe natürliche Zahlen sind. Dafür sei das Maximum einer endlichen Menge
𝑢(𝑛) ≐ 𝑚𝑎𝑥{𝑢𝑤𝑣 | 𝑁𝑤 ∧ 𝜑𝑉 (𝑣) ∧ 𝑣 ≤ 𝑛 ∧ 𝑤 ≤ 𝑛} definiert durch die 𝐿[𝑅𝐶𝐹𝑁]-Formel 𝜓𝑚𝑎𝑥 (𝑢, 𝑛) ≐
∃𝑥∃𝑣∃𝑠∃𝑡∃𝑤(𝑁𝑤 ∧ 𝜑𝑉 (𝑣) ∧ 𝑤 ≤ 𝑛 ∧ 𝑣 ≤ 𝑛 ∧ 𝜓0 (𝑢, 𝑤, 𝑣)) ∧∀𝑢 ∀𝑥∀𝑣∀𝑠∀𝑡∀𝑤(𝑁𝑤 ∧ 𝜑𝑉 (𝑣) ∧ 𝑤 ≤ 𝑛 ∧ 𝑣 ≤ 𝑛 ∧ 𝜓0 (𝑢 , 𝑤, 𝑣) → 𝑢 ≥ 𝑢 ). Es gilt ∀𝑛(𝑁𝑛 → ∃!𝑢(𝜓𝑚𝑎𝑥 (𝑢, 𝑛)). Außerdem ist damit für alle 𝑤, 𝑣 mit 𝑁𝑤, (𝑛)
𝜑𝑉 (𝑣), 𝑣 ≤ 𝑛, 𝑤 ≤ 𝑛 sowohl 𝑁(𝑢(𝑛) − 𝑢𝑤𝑣 ), weil 𝑢(𝑛) ≥ 𝑢𝑤𝑣 als auch 𝑁(10𝑢 wegen der Eigenschaften von 𝑒𝑥𝑝.
−𝑢𝑤
)
6.2 Folgen reeller Zahlen |
147
Nun können wir mit 𝑒𝑥𝑝(𝑛, 𝑥) die Potenz 10𝑛 = 𝑥 (ungleich 0) ausdrücken und multiplikative Inverse von Elementen ungleich 0 in Körpern bilden, also ist die Zahl 𝑢1(𝑛) +1 definiert durch 10
𝜓𝑐𝑜 (𝑟, 𝑛) ≐ ∃𝑥∃𝑢(𝑥 ⋅ 𝑟 = 1 ∧ 𝜓𝑚𝑎𝑥 (𝑢, 𝑛) ∧ 𝑒𝑥𝑝(𝑢 + 1, 𝑥)). Damit gilt ∀𝑛(𝑁𝑛 → ∃!𝑟 𝜓𝑐𝑜 (𝑟, 𝑛)). Außerdem gilt wegen den Eigenschaften von Körpern und 𝑒𝑥𝑝
∑ 𝜑𝑉 (𝑣), 𝑁𝑤, 𝑣,𝑤≤𝑛
𝑣
10−(𝑢𝑤 +1) ≐
1 (𝑛) 10𝑢 +1
⋅
∑
(𝑛)
10𝑢
𝑣 −𝑢𝑤
.
𝜑𝑉 (𝑣), 𝑁𝑤, 𝑣,𝑤≤𝑛
Damit können wir nun die endliche Reihe durch endliche Folgen natürlicher Zah(𝑛) 𝑣 len bilden: Zunächst definieren wir die Summe ∑𝑁𝑤, 𝑤≤𝑛 10𝑢 −𝑢𝑤 durch
𝜓𝑣𝑠𝑢𝑚 (𝑦, 𝑣, 𝑛) ≐ ∃𝑠∃𝑢 [𝐹𝑖𝑛𝑆𝑒𝑞(𝑠) ∧ 𝑙(𝑠) = 𝑛 + 1 ∧ (𝑠)𝑛 = 𝑦 ∧ 𝜓𝑚𝑎𝑥 (𝑢 , 𝑛) ∧ ∃𝑢(𝜓0 (𝑢, 0, 𝑣) ∧ 𝑒𝑥𝑝(𝑢 − 𝑢, (𝑠)0 )) ∧ ∀𝑤(𝑁𝑤 ∧ 𝑤 < 𝑛 → ∃𝑢∃𝑧(𝜓0 (𝑢, 𝑤 + 1, 𝑣) ∧ 𝑒𝑥𝑝(𝑢 − 𝑢, 𝑧) ∧ (𝑠)𝑤+1 = (𝑠)𝑤 + 𝑧))]. Damit kann 𝜑𝑉 (𝑣) ∧ 𝑁𝑛 → ∃!𝑦 𝜓𝑣𝑠𝑢𝑚 (𝑦, 𝑣, 𝑛) mit Hilfe einer Induktion über 𝑛, der Eigenschaften von 𝐹𝑖𝑛𝑆𝑒𝑞 und der bisherigen Resultate gezeigt werden. Da die Folge (𝑥𝑣 ) endlich oder unendlich sein kann, muss für die Länge der nächste Summe folgendes definiert werden
𝜓𝑓𝑖𝑛 (𝑣, 𝑛) ≐ [𝜑𝑉 (𝑣) ∧ 𝑣 ≤ 𝑛 ∧ ∀𝑣 (𝜑𝑉 (𝑣 ) → 𝑣 ≤ 𝑣)] ∨ [𝜑𝑉 (𝑛 + 1) ∧ 𝑣 = 𝑛]. Es gibt also für alle natürlichen 𝑛 genau ein 𝑣 das 𝜓𝑓𝑖𝑛 erfüllt: Entweder das Maximum von 𝜑𝑉 , sofern es existiert und kleinergleich 𝑛 ist, oder sonst 𝑛. 𝑣 Nun kann die gesamte Summe ∑𝜑𝑉 (𝑣), 𝑁𝑤, 𝑣,𝑤≤𝑛 10−(𝑢𝑤 +1) mit Hilfe des ausgeklammerten Koeffizienten definiert werden:
𝜓𝑠𝑢𝑚 (𝑦, 𝑛) ≐ ∃𝑠∃𝑦 [𝐹𝑖𝑛𝑆𝑒𝑞(𝑠) ∧ 𝜓𝑓𝑖𝑛 (𝑙(𝑠) − 1, 𝑛) ∧ (𝑠)𝑙(𝑠)−1 = 𝑦 ∧ ∃𝑟(𝜓𝑐𝑜 (𝑟, 𝑛) ∧ 𝑦 = 𝑟 ⋅ 𝑦 ) ∧ 𝜓𝑣𝑠𝑢𝑚 ((𝑠)0 , 0, 𝑛) ∧ ∀𝑣 (𝑁𝑣 ∧ 𝑣 < 𝑙(𝑠) − 1 → ∃𝑧(𝜓𝑣𝑠𝑢𝑚 (𝑧, 𝑣 + 1, 𝑛) ∧ (𝑠)𝑣+1 = (𝑠)𝑣 + 𝑧))]. Damit kann 𝑁𝑛 → ∃!𝑦 𝜓𝑠𝑢𝑚 (𝑦, 𝑛) mit Hilfe einer Induktion über 𝑛, der Eigenschaften von 𝐹𝑖𝑛𝑆𝑒𝑞 und der bisherigen Resultate gezeigt werden. Schließlich haben wir mit 𝜒(𝑦) ≐ ∃𝑛(𝑁𝑛 ∧ 𝜓𝑠𝑢𝑚 (𝑦, 𝑛)) die gesuchte Formel gefunden. 0
Nun gilt ∃𝑦𝜒(𝑦), da z.B. für 𝑦 = 10−(𝑢0 +1) gilt 𝜓𝑠𝑢𝑚 (𝑦, 0). Außerdem ist 𝜒
148 | 6 Eine erststufige Theorie reeller und natürlicher Zahlen
nach oben beschränkt: Wegen der Eigenschaften der Paarfunktion folgt für al 𝑣 le 𝑣, 𝑣 , 𝑤, 𝑤 mit 𝑁𝑤, 𝜑𝑉 (𝑣), 𝑁𝑤 , 𝜑𝑉 (𝑣 ) aus 𝑢𝑤 = 𝑢𝑤𝑣 , dass 𝑡𝑤𝑣 = 𝑡𝑤𝑣 , also auch 𝑣 = 𝑣 und 𝑤 = 𝑤 . In diesem Sinne sind die 𝑢𝑤𝑣 paarweise verschieden. Also gilt für alle 𝑛 mit 𝑁𝑛
∑
∑
10
𝑣 −(𝑢𝑤 +1)
𝑢(𝑛)
⏟⏟⏟⏟−(𝑖+1) ⏟⏟⏟⏟⏟⏟⏟ . ≤ ∑ ⏟⏟ 10
𝜑𝑉 (𝑣)∧𝑣≤𝑛 𝑁𝑤∧𝑤≤𝑛
>0
𝑖=0 𝑚
Andererseits gilt für alle 𝑚 mit 𝑁𝑚 ∑𝑖=1 10−𝑖 < 91 . Also ist ∀𝑦(𝜒(𝑦) → 𝑦 ≤ 19 ). Aufgrund von 𝐴𝑥𝑉𝑁 existiert dann das Supremum 𝑧 von 𝜒, d.h. ∀𝑦(𝜒(𝑦) → 𝑦 ≤ 𝑧) ∧ ∀𝑧 (∀𝑦(𝜒(𝑦) → 𝑦 ≤ 𝑧 ) → 𝑧 ≤ 𝑧 )) oder mit Summen ausgedrückt
∀𝑛∀𝑦(𝑁(𝑛) ∧ 𝜓𝑠𝑢𝑚 (𝑦, 𝑛) → 𝑦 ≤ 𝑧) ∧ ∀𝑧 (∀𝑛∀𝑦(𝑁(𝑛) ∧ 𝜓𝑠𝑢𝑚 (𝑦, 𝑛) → 𝑦 ≤ 𝑧 ) → 𝑧 ≤ 𝑧 ). 0
Insbesondere gilt 0 < 10−(𝑢0 +1) ≤ 𝑧 und 𝑧 ≤ Eigenschaft für beliebige 𝑢 mit 𝑁𝑢:
(∗) 𝑥0 = 10𝑢 und 𝑥1 =
1 9
< 1. Außerdem gilt folgende 𝑣
∑ 𝑣 10−𝑢 ⋅ 𝑥1 .
Doch mit der vorherigen Ungleichung gilt 𝑣 1 ∑ 10𝑢−𝑢𝑤 −1 − 𝑥1 > 𝑥1 − 𝑥1 , ≥ 9 𝑁𝑤∧𝜑 (𝑣)∧𝑣,𝑤≤𝑛 𝑉
wobei die Differenz ganzzahlig sein muss, also ist 0 ≥ 𝑥1 − 𝑥1 und 𝑥1 ≥ 𝑥1 . Damit ist (∗) gezeigt. 𝑣 Wir zeigen nun, dass für alle 𝑤, 𝑣 mit 𝑁𝑤 und 𝜑𝑉 (𝑣) gilt 𝜓𝑑𝑖𝑔 (𝑢𝑤 , 𝑧, 1). Zur Erinnerung die Definition
𝜓𝑑𝑖𝑔 (𝑥, 𝑦, 𝑧) ≐ ∃𝑥0 ∃𝑥1 ∃𝑦 (𝑦 ≤ 0 ∧ 𝑦 ⋅ 𝑦 = 𝑦 ⋅ 𝑦 ∧ 𝑒𝑥𝑝(𝑥, 𝑥0 ) ∧ 𝜓𝑔 (𝑦 ⋅ 𝑥0 , 𝑥1 ) ∧ 𝜓𝑔 (((𝑦 ⋅ 𝑥0 + 𝑥1 ) ⋅ 10), 𝑧)). Sei 𝑦 = −𝑧, sodass 𝑦 ≤ 0 und 𝑦 ⋅ 𝑦 = 𝑧 ⋅ 𝑧. Seien 𝑤 , 𝑣 mit 𝑁𝑤 und 𝜑𝑉 (𝑣 )
𝑣 𝑢 gegeben, sodass es ein 𝑢 = 𝑢𝑤 gibt. Dann folgt mit (∗) für 𝑥0 = 10 und
𝑥1 =
∑
𝑣
10𝑢−𝑢𝑤 −1 ,
𝑣 0 und 𝜓𝑑𝑖𝑔 (𝑢, 𝑧, 𝑘). Es existieren also 𝑥0 = 10𝑢 und 𝑥1 , sodass weiterhin auch für 𝑦 = −𝑧 gilt 𝜓𝑔 (𝑦 ⋅ 𝑥0 , 𝑥1 ) und 𝜓𝑔 (((𝑦 ⋅ 𝑥0 + 𝑥1 ) ⋅ 10), 𝑘). Insbesondere gilt auch 𝜓𝑔 (𝑧 ⋅ 𝑥0 , 𝑥1 ). Aus (∗) und der Eindeutigkeitseigenschaft von Lemma 6.2.2 kann auf
𝑥1 =
∑ 𝑣 𝑢 genau ein 𝑖 ≥ 1 gibt mit 𝑁𝑖 und 𝑢𝑤𝑣 = 𝑢 + 𝑖, gibt es ein 𝑚 mit 𝑁𝑚 und
∑ 𝑁𝑤∧𝜑𝑉 (𝑣)∧ 𝑣 𝑣,𝑤≤𝑛 ∧ 𝑢𝑤 >𝑢
𝑣
𝑚
10−(𝑢𝑤 +1) ≤ ∑ 10−(𝑢+𝑖+1) < 10−(𝑢+1) ⋅ 𝑖=1
1 𝑘 −(𝑢+1) ≤ 10 . 9 9
𝑣 Da es unendlich viele, paarweise verschiedene 𝑢𝑤 gibt, existieren 𝑤, 𝑣 mit 𝑁𝑤, 𝜑𝑉 (𝑣) und 𝑢𝑤𝑣 ≥ 𝑢 und mit dem least number principle gibt es auch 𝑤, 𝑣 mit 𝑁𝑤 und 𝜑𝑉 (𝑣), sodass
𝑚𝑖𝑛{𝑢𝑤𝑣 | 𝑁𝑤 ∧ 𝜑𝑉 (𝑣) ∧ 𝑢𝑤𝑣 ≥ 𝑢} = 𝑢𝑤𝑣 .
6.2 Folgen reeller Zahlen |
151
𝑣 𝑣 Insbesondere ist 𝑢 ≤ 𝑢𝑤 . Angenommen 𝑢 < 𝑢𝑤 , dann wäre für alle 𝑤, 𝑣 mit 𝑁𝑤 𝑣 𝑣 und 𝜑𝑉 (𝑣) auch 𝑢𝑤 ≥ 𝑢 ⇔ 𝑢𝑤 > 𝑢. Für alle 𝑛 mit 𝑁𝑛 würde damit gelten 𝑣
10−(𝑢𝑤 +1) ≤
∑ 𝑁𝑤∧𝜑𝑉 (𝑣)∧𝑣,𝑤≤𝑛
∑
𝑣
10−(𝑢𝑤 +1) +
𝑁𝑤∧𝜑𝑉 (𝑣)∧ 𝑣 𝑢𝑤 𝑢
𝑣 𝑘 10−(𝑢𝑤 +1) + 10−(𝑢+1) . 9 (𝑣)∧
∑
𝑁𝑤∧𝜑𝑉 𝑣 𝑢𝑤 0. Aus (∗∗) folgt dann, dass 𝑣 es 𝑤, 𝑣 gibt mit 𝑁𝑤, 𝜑𝑉 (𝑣) und 𝑦∗ = 𝑢𝑤 . Doch wir haben auch schon gezeigt, 𝑣 ∗ dass 𝜓𝑑𝑖𝑔 (𝑢𝑤 , 𝑧, 1), bzw. 𝜓𝑑𝑖𝑔 (𝑦 , 𝑧, 1). Also muss 𝜓𝑠𝑒𝑡 (𝑧) gelten. Um 𝜓𝑠 (𝑧) zu zeigen, nehmen wir für ein beliebiges 𝑢 mit 𝑁𝑢 an, dass 𝜓𝑑𝑖𝑔 (𝑢, 𝑧, 1). Aus (∗∗) folgt dann, dass es 𝑤, 𝑣 gibt mit 𝑁(𝑤), 𝜑𝑉 (𝑣) und 𝑢 = 𝑢𝑤𝑣 . 𝑣 𝑣 𝑣 𝑣 𝑣 𝑣 Dann gibt es auch 𝑡𝑤 und 𝑠𝑤 mit 𝑁𝑡𝑤 , 𝑁𝑠𝑤 und 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤𝑣 ) sowie 𝑜𝑝(𝑣, 𝑤, 𝑡𝑤𝑣 ). 𝑣 𝑣 Seien 𝑠 , 𝑢 mit 𝑁𝑠 , 𝑁𝑢 , 𝑜𝑝(𝑡𝑤 , 𝑠 , 𝑢 ) und 𝜓𝑑𝑖𝑔 (𝑢 , 𝑧, 1), zu zeigen ist 𝑠 = 𝑠𝑤 .
𝑣 𝑣 Aus (∗∗) folgt, dass es 𝑤 , 𝑣 gibt mit 𝑢 = 𝑢𝑤 . Dann ist aber auch 𝑜𝑝(𝑣 , 𝑤 , 𝑡𝑤 )
𝑣 𝑣 𝑣 𝑣 𝑣 und 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤 ) und mit der Eigenschaft der Paarfunktion folgt 𝑡𝑤 = 𝑡𝑤 und
𝑠 = 𝑠𝑤𝑣 . Aus ersterem folgt aber ebenso mit der Eigenschaft der Paarfunktion 𝑤 = 𝑤 und 𝑣 = 𝑣, also gilt 𝑠 = 𝑠𝑤𝑣 = 𝑠𝑤𝑣 . Damit ist der Nachweis von 𝜓𝑠 (𝑧) abgeschlossen. Außerdem folgt nun für alle 𝑣 mit 𝜑𝑉 (𝑣), dass 𝜂(𝑣, 𝑧, 𝑥𝑣 ) gilt, denn es gilt 𝜓𝑠 (𝑧) 𝑣 𝑣 𝑣 und für alle 𝑤 mit 𝑁𝑤 gibt es 𝑢𝑤 , 𝑡𝑤 , 𝑠𝑤 mit
𝑁𝑢𝑤𝑣 ∧ 𝑁𝑡𝑤𝑣 ∧ 𝑁𝑠𝑤𝑣 ∧ 𝑜𝑝(𝑣, 𝑤, 𝑡𝑤𝑣 ) ∧ 𝑜𝑝(𝑡𝑤𝑣 , 𝑠𝑤𝑣 , 𝑢𝑤𝑣 ) ∧ 𝜓𝑑𝑒𝑐 (𝑤, 𝑥𝑣 , 𝑠𝑤𝑣 ) ∧ 𝜓𝑑𝑖𝑔 (𝑢𝑤𝑣 , 𝑧, 1). Sei nun 𝑣 mit 𝑁𝑣 beliebig. Es bleibt zu zeigen, dass ∀𝑥(𝜂(𝑣, 𝑧, 𝑥) ↔ 𝜑(𝑣, 𝑥)). Wenn für ein 𝑥 gilt 𝜑(𝑣, 𝑥), dann gilt auch 𝜑𝑉 (𝑣) und 𝑥 = 𝑥𝑣 , sodass 𝜂(𝑣, 𝑧, 𝑥) schon gezeigt ist.
152 | 6 Eine erststufige Theorie reeller und natürlicher Zahlen
Für die Rückrichtung sei ein 𝑥 mit 𝜂(𝑣, 𝑧, 𝑥) gegeben, d.h. für alle 𝑤 mit 𝑁𝑤 gibt es 𝑢 , 𝑡 und 𝑠 mit
𝑁𝑢 ∧ 𝑁𝑡 ∧ 𝑁𝑠 ∧ 𝑜𝑝(𝑣, 𝑤, 𝑡 ) ∧ 𝑜𝑝(𝑡 , 𝑠 , 𝑢 ) ∧ 𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑠 ) ∧ 𝜓𝑑𝑖𝑔 (𝑢 , 𝑧, 1). 𝑣 Doch da 𝜓𝑠 (𝑧) ⇒ ∀𝑠 ∀𝑢 (𝑁𝑠 ∧ 𝑁𝑢 ∧ 𝑜𝑝(𝑡𝑤 , 𝑠 , 𝑢 ) ∧ 𝜓𝑑𝑖𝑔 (𝑢 , 𝑧, 1) → 𝑠 = 𝑠𝑤𝑣 )
𝑣 und wegen der Eindeutigkeit der Paarfunktion aus 𝑜𝑝(𝑣, 𝑤, 𝑡 ) folgt 𝑡 = 𝑡𝑤 , gilt 𝑣 𝑣 ∀𝑤(𝑁𝑤 → 𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑠𝑤 )). Es gilt aber auch ∀𝑤(𝑁𝑤 → 𝜓𝑑𝑒𝑐 (𝑤, 𝑥𝑣 , 𝑠𝑤 )). Zusammengenommen folgt ∀𝑤(𝑁𝑤 → ∃𝑟(𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑟) ∧ 𝜓𝑑𝑒𝑐 (𝑤, 𝑥𝑣 , 𝑟))) und mit Lemma 6.2.4 folgt dann 𝑥 = 𝑥𝑣 . Also gilt 𝜑(𝑥, 𝑣).
Beweis des Zusatzes: Gelte für ein 𝑧 auch ∀𝑣(𝑁𝑣 → ∀𝑥(𝜂(𝑣, 𝑧 , 𝑥) ↔ 𝜑(𝑣, 𝑥))) und es gebe ein 𝑥0 mit 𝜑(0, 𝑥0 ). Dann gilt auch 𝜂(0, 𝑧 , 𝑥0 ) und somit auch 𝜓𝑠𝑒𝑞 (𝑧 )
𝑣 𝑣 𝑣 und es gibt für alle 𝑣, 𝑤 mit 𝑁𝑤 und 𝜑𝑉 (𝑣) auch 𝑠𝑤 , 𝑡𝑤 , 𝑢𝑤 mit 𝑁(𝑠𝑤𝑣 ), 𝑁(𝑡𝑤𝑣 ), 𝑣 𝑣 𝑣 𝑣 𝑣 𝑁(𝑢𝑤 ), 𝑜𝑝(𝑣, 𝑤, 𝑡𝑤 ), 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤 ) und 𝜓𝑑𝑒𝑐 (𝑤, 𝑥𝑣 , 𝑠𝑤𝑣 ) sowie 𝜓𝑑𝑖𝑔 (𝑢𝑤𝑣 , 𝑧 , 1).
𝑣 Aus der Funktionalität von 𝑜𝑝 folgt 𝑡𝑤 = 𝑡𝑤𝑣 . Sei 𝑣 mit 𝜑𝑉 (𝑣) beliebig. Speziali𝑣 siert auf 𝑤 = 0, folgt aus 𝜓𝑑𝑒𝑐 (0, 𝑥𝑣 , 𝑠0 ), (0 ≤ 𝑥𝑣 ∧𝑠0𝑣 = 1)∨(𝑥𝑣 < 0∧𝑠0𝑣 = 0) und daraus 𝑠0𝑣 = 𝑠0𝑣 . Spezialisiert auf 𝑤 = 1 folgt aus 𝜓𝑑𝑒𝑐 (1, 𝑥𝑣 , 𝑠1𝑣 ), dass 𝜓𝑔 (𝑥𝑣 , 𝑠1𝑣 )
und mit der Eindeutigkeitseigenschaft von Lemma 6.2.2 auch 𝑠1𝑣 = 𝑠1𝑣 . Schließlich 𝑣 gilt für alle 𝑤 > 1, dass aus 𝜓𝑑𝑖𝑔 (𝑤, 𝑥𝑣 , 𝑠𝑤 ) und der Eindeutigkeitseigenschaft von
𝑣 Lemma 6.2.3 𝑠𝑤 = 𝑠𝑤𝑣 folgt. Mit der Eigenschaft der Paarfunktion 𝑜𝑝 folgt dann für alle 𝑤, 𝑣 mit 𝑁𝑤 und 𝜑𝑉 (𝑣), dass 𝑢𝑤𝑣 = 𝑢𝑤𝑣 , d.h. es gilt sowohl 𝜓𝑑𝑖𝑔 (𝑢𝑤𝑣 , 𝑧, 1) als auch 𝜓𝑑𝑖𝑔 (𝑢𝑤𝑣 , 𝑧 , 1). An-
dererseits folgt aus 𝜓𝑠𝑒𝑞 (𝑧 ), dass zunächst 𝜓𝑠𝑒𝑡 (𝑧 ) und daraus, dass 0 ≤ 𝑧 < 1
und für alle 𝑦 mit 𝑁𝑦 gilt 𝜓𝑑𝑖𝑔 (𝑦, 𝑧 , 0) oder 𝜓𝑑𝑖𝑔 (𝑦, 𝑧 , 1). Desweiteren folgt, dass es für jedes 𝑢 mit 𝑁𝑢 und 𝜓𝑑𝑖𝑔 (𝑢, 𝑧, 1) ein 𝑤, 𝑣 mit 𝑁𝑤, 𝑁𝑣 und ein eindeutiges
𝑠 geben muss mit 𝑁𝑠 und 𝑜𝑝(𝑡𝑤𝑣 , 𝑠 , 𝑢). Aus der Eindeutigkeit des 𝑠 folgt aber, 𝑣 𝑣 𝑣 𝑣 da auch gilt 𝑁𝑠𝑤 , 𝑁𝑢𝑤 , 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤𝑣 ) und 𝜓𝑑𝑖𝑔 (𝑢𝑤𝑣 , 𝑧 , 1), dass 𝑠 = 𝑠𝑤𝑣 und dann 𝑣 auch 𝑢 = 𝑢𝑤 . Daraus folgt für 𝑧 - wie schon für 𝑧 -, dass 𝜓𝑔 (𝑧 , 0) und für alle 𝑚 mit 𝑁𝑚 𝑣 gilt genau dann 𝜓𝑑𝑖𝑔 (𝑚, 𝑧 , 𝑘), wenn 𝑘 = 1 und 𝑚 = 𝑢𝑤 für 𝑤, 𝑣 mit 𝑁𝑤 und 𝜑𝑉 (𝑣). Sonst ist 𝑘 = 0. Sei 𝑟0 = 1, 𝑟1 = 0 und für 𝑚 > 1 sei 1, 0,
𝑟𝑚 = {
𝑣 wenn es 𝑤, 𝑣 gibt mit 𝑁𝑤, 𝜑𝑉 (𝑣), 𝑚 = 𝑢𝑤 + 2,
sonst .
Damit gilt für alle 𝑚 mit 𝑁𝑚, dass 𝜓𝑑𝑒𝑐 (𝑚, 𝑧, 𝑟𝑚 ) ∧ 𝜓𝑑𝑒𝑐 (𝑚, 𝑧 , 𝑟𝑚 ). Mit Lemma 6.2.4 folgt dann 𝑧 = 𝑧 .
6.2 Folgen reeller Zahlen |
153
Bemerkung 6.2.6. Da Folgen letztlich abzählbare Mengen darstellen, kann mit Hilfe des vorangehenden Satzes (durch eine Modifikation der Formel 𝜂) auch die Interpretation bestimmter zweitstufiger Arithmetik in 𝑅𝐶𝐹𝑁 bewerkstelligt werden, z.B. von 𝐴𝐶𝐴 0 . Wichtig bei solchen Überlegungen ist die Wahl eines eigenen Interpretationsbegriffs, der zweitstufige in erststufige Sprache übersetzt, vgl. Kapitel 1.3. Ein Spezialfall der Kodierung endlicher Folgen ist das geordnete Paar. Insofern folgt aus dem vorangehenden Satz, dass 𝑅𝐶𝐹 erweitert um eine Paarfunktion 𝑂𝑃 (wie üblich axiomatisiert als injektive, totale, zweistellige Funktion) interpretierbar ist in 𝑅𝐶𝐹𝑁. Korollar 6.2.7. 𝑅𝐶𝐹𝑂𝑃 ⪯ 𝑅𝐶𝐹𝑁 Beweis. Sei 𝜑(𝑣, 𝑥) ≐ (𝑣 = 0 ∧ 𝑥 = 𝑥1 ) ∨ (𝑣 = 1 ∧ 𝑥 = 𝑥2 ) und interpretiere 𝑂𝑃(𝑥1 , 𝑥2 , 𝑧) als 𝜂(0, 𝑧, 𝑥1 ) ∧ 𝜂(1, 𝑧, 𝑥2 ). Dann können mit Satz 6.2.5 für das hier gewählte 𝜑 die Eigenschaft der Paarfunktion für 𝑂𝑃 nachgewiesen werden:
𝑅𝐶𝐹𝑁 ⊢ ∃𝑧∀𝑣(𝑁𝑣 → ∀𝑥(𝜂(𝑣, 𝑧, 𝑥) ↔ (𝑣 = 0 ∧ 𝑥 = 𝑥1 ) ∨ (𝑣 = 1 ∧ 𝑥 = 𝑥2 ))). Daraus folgt Existenz und Injektivität von 𝑂𝑃: 𝑅𝐶𝐹𝑁 beweist
∃𝑧(𝜂(0, 𝑧, 𝑥1 ) ∧ 𝜂(1, 𝑧, 𝑥2 ) ∧ ∀𝑦((𝜂(0, 𝑧, 𝑦) → 𝑦 = 𝑥1 ) ∧ (𝜂(1, 𝑧, 𝑦) → 𝑦 = 𝑥2 ))). Die Eindeutigkeit von OP folgt aus dem Zusatz von Satz 6.2.5:
𝑅𝐶𝐹𝑁 ⊢ 𝜂(0, 𝑧, 𝑥1 ) ∧ 𝜂(1, 𝑧, 𝑥2 ) ∧ 𝜂(0, 𝑧 , 𝑥1 ) ∧ 𝜂(1, 𝑧 , 𝑥2 ) → 𝑧 = 𝑧 . Damit werden alle Axiome von 𝑅𝐶𝐹𝑂𝑃 bewiesen. Lemma 6.2.8. 𝑅𝐶𝐹𝑁 ⊢ ∀𝑥∀𝑥 ∀𝑣∀𝑧(𝑁𝑣 ∧ 𝜂(𝑣, 𝑧, 𝑥) ∧ 𝜂(𝑣, 𝑧, 𝑥 ) → 𝑥 = 𝑥 ) Beweis. Wir argumentieren, wie üblich informal in einem beliebigen Modell von 𝑅𝐶𝐹𝑁. Seien 𝑥, 𝑥 , 𝑣, und 𝑧 mit 𝑁𝑣, 𝜂(𝑣, 𝑧, 𝑥) und 𝜂(𝑣, 𝑧, 𝑥 ) gegeben. Es gilt al so 𝜓𝑠 (𝑧) und für alle 𝑤 mit 𝑁𝑤 gibt es 𝑠𝑤 , 𝑡𝑤 , 𝑢𝑤 , 𝑠𝑤 , 𝑡𝑤 , 𝑢𝑤 mit 𝑁𝑢𝑤 , 𝑁𝑡𝑤 , 𝑁𝑠𝑤 , 𝑜𝑝(𝑣, 𝑤, 𝑡𝑤 ), 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤 ), 𝜓𝑑𝑒𝑐 (𝑤, 𝑥, 𝑠𝑤 ) und 𝜓𝑑𝑖𝑔 (𝑢𝑤 , 𝑧, 1) sowie 𝑁𝑢𝑤 , 𝑁𝑡𝑤 ,
𝑁𝑠𝑤 , 𝑜𝑝(𝑣, 𝑤, 𝑡𝑤 ) und 𝑜𝑝(𝑡𝑤 , 𝑠𝑤 , 𝑢𝑤 ), 𝜓𝑑𝑒𝑐 (𝑤, 𝑥 , 𝑠𝑤 ) und 𝜓𝑑𝑖𝑔 (𝑢𝑤 , 𝑧, 1). Aus der Eindeutigkeit der Paarfunktion 𝑜𝑝 folgt 𝑡𝑤 = 𝑡𝑤 . Aus der Eindeutigkeitseigen schaft von 𝜓𝑠 (𝑧) folgt, dass 𝑠𝑤 = 𝑠𝑤 . Und mit Lemma 6.2.4 folgt dann 𝑥 = 𝑥 .
154 | 6 Eine erststufige Theorie reeller und natürlicher Zahlen
6.3 Beispiel: Satz von Bolzano-Weierstraß Als Beispiel, welche Sätze mit Hilfe der Kodierung von Folgen beweisbar sind, wollen wir als nächstes eine Formalisierung des Satzes von Bolzano-Weierstraß für reell abgeschlossene Körper innerhalb der erststufigen Theorie 𝑅𝐶𝐹𝑁 beweisen. Satz 6.3.1. 𝑅𝐶𝐹𝑁 beweist, dass alle beschränkten, unendlichen Folgen einen Häufungspunkt besitzen. Formal:⁷⁸
𝑅𝐶𝐹𝑁 ⊢ ∀𝑧[∃𝑠∀𝑣(𝑁𝑣 → ∃𝑥(|𝑥| ≤ 𝑠 ∧ 𝜂(𝑣, 𝑧, 𝑥)) → ∃𝑦∀𝑢∀𝑤(𝑢 > 0 ∧ 𝑁𝑤) → ∃𝑣∃𝑥(𝑁𝑣 ∧ 𝑣 > 𝑤 ∧ 𝜂(𝑣, 𝑧, 𝑥) ∧ |𝑥 − 𝑦| < 𝑢))]. Beweis. Wir argumentieren innerhalb eines Modells von 𝑅𝐶𝐹𝑁. Es gelte für ein beliebiges 𝑧∗ ∃𝑠∀𝑣(𝑁𝑣 → ∃𝑥(|𝑥| ≤ |𝑠| ∧ 𝜂(𝑣, 𝑧∗ , 𝑥)), insbesondere folgt daraus, dass es für alle 𝑣 mit 𝑁𝑣 ein 𝑥 gibt mit 𝜂(𝑣, 𝑧∗ , 𝑥). Mit Lemma 6.2.8 wissen wir, dass dieses 𝑥 eindeutig ist, sodass wir für alle 𝑣 mit 𝑁𝑣 ein 𝑥𝑣 durch 𝜂(𝑣, 𝑧∗ , 𝑥𝑣 ) definieren können. Dann gibt es ein 𝑠, sodass für alle 𝑣 mit 𝑁𝑣 gilt |𝑥𝑣 | ≤ 𝑠. Wir werden zeigen, dass die Folge (𝑥𝑣 ) einen Limes superior besitzt, der die gesuchten Eigenschaften erfüllt. Betrachte die Formel 𝜙0 (𝑛, 𝑥) ≐ ∃𝑘(𝑘 ≥ 𝑛 ∧ 𝑁𝑘 ∧ 𝜂(𝑘, 𝑧∗ , 𝑥)). Nun gilt für das fixierte 𝑧∗ und für alle 𝑛 mit 𝑁𝑛, dass 𝜂(𝑛, 𝑧∗ , 𝑥𝑛 ), also auch ∃𝑥𝜙0 (𝑛, 𝑥). Des Weiteren ist für alle 𝑥 mit 𝜙0 (𝑛, 𝑥) für ein 𝑘 mit 𝑁𝑘 𝑥 = 𝑥𝑘 . Außerdem gibt es ein 𝑠, sodass für alle 𝑘 mit 𝑁𝑘 gilt |𝑥𝑘 | ≤ 𝑠, also auch 𝑥𝑘 ≤ 𝑠. Damit gilt ∀𝑛∃𝑠∀𝑥(𝑁𝑛∧ 𝜙0 (𝑛, 𝑥) → 𝑥 ≤ 𝑠), d.h. 𝜙0 (𝑛, 𝑥) ist nach oben beschränkt. Aufgrund der Vollständigkeitsaxiome 𝐴𝑥𝑉𝑁 gibt es dann für alle 𝑛 mit 𝑁𝑛 ein 𝑧𝑛 mit
∀𝑥(𝜙0 (𝑛, 𝑥) → 𝑥 ≤ 𝑧𝑛 ) ∧ ∀𝑦(∀𝑥(𝜙0 (𝑛, 𝑥) → 𝑥 ≤ 𝑦) → 𝑧𝑛 ≤ 𝑦). Betrachte nun die Formel
𝜙1 (𝑧) ≐ ∃𝑛(𝑁𝑛∧∀𝑥(𝜙0 (𝑛, 𝑥) → 𝑥 ≤ 𝑧)∧∀𝑦(∀𝑥(𝜙0 (𝑛, 𝑥) → 𝑥 ≤ 𝑦) → 𝑧 ≤ 𝑦)). Dann ist also für alle 𝑛 mit 𝑁𝑛 auch 𝜙1 (𝑧𝑛 ) und ∃𝑧𝜙1 (𝑧). Da für alle 𝑘 mit 𝑁𝑘 gilt |𝑥𝑘 | ≤ 𝑠, bzw. auch 𝑥𝑘 ≥ −𝑠, folgt, dass 𝜙1 nach unten durch −𝑠 beschränkt ist: Sei 𝑧 mit 𝜙1 (𝑧) gegeben, dann gibt es ein 𝑛 mit 𝑁𝑛 und für alle 𝑥 mit 𝜙0 (𝑛, 𝑥) ist 𝑥 ≤ 𝑧, also insbesondere −𝑠 ≤ 𝑥𝑛 ≤ 𝑧.
78 In einer definitorischen Erweiterung um Betragsfunktion und additiv Inverser.
6.3 Beispiel: Satz von Bolzano-Weierstraß |
155
Mit der Existenz von Infima nicht-leerer, nach unten beschränkter Mengen (Lemma 2.2.4 übertragen auf 𝑅𝐶𝐹𝑁) gibt es dann einen Limes superior 𝑦∗ mit
(∗) ∀𝑧(𝜙1 (𝑧) → 𝑧 ≥ 𝑦∗ ) ∧ ∀𝑦(∀𝑧(𝜙1 (𝑧) → 𝑧 ≥ 𝑦) → 𝑦∗ ≥ 𝑦). Wir zeigen ∀𝑢∀𝑤(𝑢 > 0 ∧ 𝑁𝑤 → ∃𝑣∃𝑥(𝑁𝑣 ∧ 𝑣 > 𝑤 ∧ 𝜂(𝑣, 𝑧∗ , 𝑥) ∧ |𝑥 − 𝑦∗ | < 𝑢)). Seien dafür 𝑢 und 𝑤 mit 𝑁𝑤 und 𝑢 > 0 gegeben. Da 𝑦∗ < 𝑦∗ + 𝑢, folgt aus der Kontraposition des zweiten Konjunktionsglieds von (∗), dass es ein 𝑧 gibt mit 𝜙1 (𝑧 ) und 𝑧 < 𝑦∗ + 𝑢. Dann gibt es ein 𝑛 mit 𝑁𝑛 und ∀𝑥(𝜙0 (𝑛 , 𝑥) → 𝑥 ≤ 𝑧 ). Sei 𝑚 = 𝑚𝑎𝑥{𝑛 , 𝑤} + 1. Andererseits folgt aus 𝑦∗ − 𝑢 < 𝑦∗ und der Kontraposition des ersten Konjunktionsglieds von (∗) ¬𝜙1 (𝑦∗ − 𝑢). Dann gilt für alle 𝑛 mit 𝑁𝑛, dass
∀𝑦(∀𝑥(𝜙0 (𝑛, 𝑥) → 𝑥 ≤ 𝑦) → 𝑦∗ − 𝑢 ≤ 𝑦) → ∃𝑥(𝜙0 (𝑛, 𝑥) ∧ 𝑥 > 𝑦∗ − 𝑢). Außerdem folgt für 𝑛 mit 𝑁𝑛, dass 𝜙1 (𝑧𝑛 ) und mit dem ersten Konjunktionsglieds von (∗) auch 𝑧𝑛 ≥ 𝑦∗ . Damit gilt für alle 𝑦 mit ∀𝑥(𝜙0 (𝑛, 𝑥) → 𝑥 ≤ 𝑦) wegen der Supremumseigenschaft von 𝑧𝑛 , dass 𝑦∗ − 𝑢 ≤ 𝑦∗ ≤ 𝑧𝑛 ≤ 𝑦. Also gilt der Antezedens des obigen Konditionals für alle 𝑛 mit 𝑁𝑛 und dann folgt ∀𝑛(𝑁𝑛 → ∃𝑥(𝜙0 (𝑛, 𝑥) ∧ 𝑥 > 𝑦∗ − 𝑢). Spezialisiert auf 𝑚 gibt es ein 𝑥 mit 𝑥 > 𝑦∗ − 𝑢 und 𝜙0 (𝑚, 𝑥), d.h. es gibt ein 𝑣 mit 𝑣 ≥ 𝑚 ∧ 𝑁𝑣 ∧ 𝜂(𝑣, 𝑧∗ , 𝑥). Da 𝑚 > 𝑤 folgt auch 𝑣 > 𝑤 und da 𝑚 ≥ 𝑛 folgt 𝑣 ≥ 𝑛 . Aus letzterem folgt dann auch 𝜙0 (𝑛 , 𝑥). Mit den Resultaten des vorigen Absatzes ergibt sich 𝑥 ≤ 𝑧 < 𝑦∗ +𝑢, also zusammengenommen, 𝑥−𝑦∗ < 𝑢 und −(𝑥−𝑦∗ ) < 𝑢, sodass gilt |𝑥−𝑦∗ | < 𝑢.
7 Zweitstufige Theorien der reellen Zahlen In zeitgenössischen Einführungen in die Analysis werden die reellen Zahlen häufig axiomatisch eingeführt. Dabei werden bestimmte Sätze angegeben, welche die reellen Zahlen charakterisieren sollen (in diesem Sinne werden die Sätze auch Axiome oder Gesetze genannt), vgl. Hildebrandt (2006), Königsberger (2004), Blatter (1991), Walter (2009), Barner und Flohr (2000), Forster (2004). Dabei wird häufig nur erwähnt, dass diese Axiome die reellen Zahlen bis auf Isomorphie eindeutig charakterisieren oder, dass die reellen Zahlen als gegeben vorausgesetzt werden. In Büchern zu Grundlagen der Mathematik oder historischen Büchern werden dagegen die reellen Zahlen aus anderen Zahlen (letztendlich aus natürlichen Zahlen) „konstruiert“, vgl. Simpson (1999) oder Landau (1930). Hilbert (1900) bezeichnet diese unterschiedlichen Herangehensweisen als die genetische und die axiomatische Methode. Hier sollen für beide Konzeptionen metamathematische Formalisierungen im Rahmen der Prädikatenlogik zweiter Stufe angegeben werden. Auf der Grundlage der genetischen Konzeption ist ein Konsistenznachweis über 𝑃𝐴 möglich und mit der axiomatischen Konzeption können verschiedene formale Theorien der reellen Zahlen angegeben werden, die sich in wichtigen metamathematischen Eigenschaften unterscheiden.
7.1 Genetische Konzeption Die Grundidee dieser Konzeption besteht darin, Zahlbereiche schrittweise zu erweitern, um gewisse Operationen ausführen zu können. Die Grundlage bilden die als gegeben vorausgesetzten natürlichen Zahlen. Um die Substraktion uneingeschränkt ausführen zu können, werden ganze Zahlen konstruiert, um die Division weiter anwenden zu können, werden rationale Zahlen konstruiert. Um einen im Sinne der Anordnung vollständigen Zahlbereich zu erhalten, werden schließlich reelle Zahlen konstruiert. Die Konstruktionsschritte bestehen dabei in der Definition einer Äquivalenzrelation und der Übertragung der Operationen und Prädikate auf die Äquivalenzklassen dieser Äquivalenzrelation. Bei den Äquivalenzrelationen, die für die Zahlbereichserweiterungen betrachtet werden, handelt es sich um Äquivalenzrelationen zwischen geordneten Paaren oder noch komplexeren Objekten wie Mengen oder Funktionen. Der metamathematische Rahmen muss also ausdrucksstark genug sein, diese mengentheoretischen Objekte zu bilden, z.B. Prädikatenlogik höherer Stufe. Dabei wären dann aber schon ganze Zahlen Mengen von Paaren natürlicher Zahlen, rationale Zahlen Mengen von Paaren von Mengen von Paaren natürlicher Zahlen und die
7.1 Genetische Konzeption |
157
mengentheoretische Stufe der reellen Zahlen schließlich eher unüberschaubar. Deswegen sollen hier mehrsortige Sprachen angewandt werden und möglichst wenig mengentheoretische Objekte eingeführt werden. Da die ersten beiden Schritte noch nichts mit den reellen Zahlen zu tun haben, behandeln wir diese Abschnitte etwas oberflächlich und geben nur Hinweise für die nötigen Beweise, es handelt sich zudem um die kanonische Konstruktion der Zahlbereiche, wie sie in der Literatur auch ausgeführt wird.
7.1.1 Von natürlichen zu ganzen Zahlen Sei 𝐿 1 die Sprache von 𝑃𝐴 (mit Vokabular {0, 1, +, ⋅,