159 97 5MB
Spanish Pages [507] Year 2016
UN ACERCAMIENTO A LOS FUNDAMENTOS DEL CÁLCULO El infinito y los números reales Javier Fernández García
Un acercamiento a los fundamentos del cálculo: el infinito y los números reales
Programa Universitario del Libro de Texto
FACULTAD DE CIENCIAS COORDINACIÓN DE DIFUSIÓN CULTURAL Dirección General de Publicaciones y Fomento Editorial
Un acercamiento a los fundamentos del cálculo: el infinito y los números reales Javier Fernández García
Universidad Nacional Autónoma de México México 2016
Esta obra contó con el apoyo del proyecto PAPIME: PE-106416
Primera edición, 20 de julio de 2016 © D.R. 2016. Universidad Nacional Autónoma de México Ciudad Universitaria, 04510, Ciudad de México. Facultad de Ciencias [email protected]; www.tienda.fciencias.unam.mx Dirección General de Publicaciones y Fomento Editorial www.libros.unam.mx ISBN: 978-607-02-5228-0 (colección) ISBN: 978-607-02-8200-3 Esta edición y sus características son propiedad de la Universidad Nacional Autónoma de México. Prohibida la reproducción total o parcial por cualquier medio, sin autorización escrita del titular de los derechos patrimoniales. Impreso y hecho en México
Contenido Prólogo
I
XI
El infinito
XIX
Capítulo 1. Trabajando con el infinito: aciertos y errores 1.1. La serie geométrica . . . . . . . . . . . . . . . . . . . . . . 1.1.1. Razonamientos geométricos de casos particulares . 1.1.2. El caso general . . . . . . . . . . . . . . . . . . . . 1.1.3. La serie geométrica como serie de funciones . . . . 1.1.4. Euler . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.5. Su importancia para el análisis de otras series . . . 1.2. La serie armónica . . . . . . . . . . . . . . . . . . . . . . . 1.2.1. Las primeras pruebas . . . . . . . . . . . . . . . . 1.2.2. Algunas propiedades . . . . . . . . . . . . . . . . . 1.2.3. La serie armónica y la hipérbola y = x1 . . . . . . . 1.2.4. La constante de Euler . . . . . . . . . . . . . . . . 1.2.5. La armónica alternante . . . . . . . . . . . . . . . 1.2.6. Las series p . . . . . . . . . . . . . . . . . . . . . . 1.2.7. La trompeta de Torricelli . . . . . . . . . . . . . . 1.3. Algunas otras series . . . . . . . . . . . . . . . . . . . . . 1.4. Donde no parecía estar. . . pero estaba el infinito . . . . . 1.4.1. El área bajo la gráfica de una función. . . y la integral 1.4.2. La tangente a la gráfica de una función. . . y la derivada . . . . . . . . . . . . . . . . . . . . . . . . 1.5. La importancia de formalizar las pruebas . . . . . . . . . 1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 2 2 6 11 14 19 20 20 22 29 31 33 38 41 43 49 50 63 72 74
Capítulo 2. Conjuntos infinitos 85 2.1. Aparentes contradicciones lógicas en la comparación entre conjuntos infinitos . . . . . . . . . . . . . . . . . . . . . . 85 vii
contenido
viii
2.2. 2.3. 2.4. 2.5. 2.6. 2.7.
Los hoteles de Hilbert . . . . . . . . . . . . . . . . . . . Primeras definiciones y propiedades . . . . . . . . . . . . Más conjuntos numerables . . . . . . . . . . . . . . . . . Un primer acercamiento a los racionales . . . . . . . . . Numerar, una forma de ordenar . . . . . . . . . . . . . . Un primer acercamiento a los irracionales . . . . . . . . 2.7.1. Pruebas no constructivas: tres ejemplos elegantes 2.8. Inconmensurabilidad, pitagóricos y Eudoxo . . . . . . . 2.9. Un primer acercamiento a los reales . . . . . . . . . . . 2.9.1. Las expansiones decimales . . . . . . . . . . . . . 2.9.2. Los intervalos y la recta . . . . . . . . . . . . . . 2.9.3. La cardinalidad de los reales . . . . . . . . . . . 2.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . .
Capítulo 3. Tres preguntas importantes 3.1. El infinito más pequeño, el axioma de la elección y el principio del buen orden . . . . . . . . . . . . . . . . . . 3.2. Infinitos más grandes que el continuo . . . . . . . . . . . 3.2.1. Operaciones entre números cardinales . . . . . . 3.2.2. Cardinalidad del conjunto potencia . . . . . . . . 3.3. Las paradojas en la definición de conjunto . . . . . . . 3.4. Otros resultados . . . . . . . . . . . . . . . . . . . . . . 3.4.1. Para facilitar la comparación entre cardinalidades: el teorema de Cantor-Bernstein-Schröder . . . . 3.4.2. Dimensión y cardinalidad . . . . . . . . . . . . . 3.4.3. Dimensión infinita y aritmética cardinal . . . . . 3.4.4. Números algebraicos y trascendentes: un primer acercamiento . . . . . . . . . . . . . . 3.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . Capítulo 4. La hipótesis del continuo y los números ordinales 4.1. Hilbert: París, 1900 . . . . . . . . . . . . . . . . . . . . . 4.2. Los números ordinales . . . . . . . . . . . . . . . . . . . 4.2.1. El origen de los números ordinales . . . . . . . . 4.2.2. Los tres principios de Cantor para generar nuevos números . . . . . . . . . . . . . . . . . . . . . . . 4.2.3. Tipos de orden y números ordinales . . . . . . . 4.2.4. Suma y producto de números ordinales . . . . . .
. . . . . . . . . . . . .
90 97 101 103 108 111 118 119 125 127 130 133 139 143
. . . . . .
144 151 151 156 160 165
. 166 . 175 . 179 . 184 . 189 195 . 195 . 203 . 204 . 210 . 218 . 221
contenido
ix
4.2.5. Conjuntos numerables: una sola cardinalidad, una infinidad de tipos de orden . . . . . . . . . . . . 4.2.6. Límite, exponenciación e inducción transfinita . . 4.2.7. El desenlace: la escalera de ordinales arriba al siguiente infinito cardinal . . . . . . . . . . . . . . 4.2.8. Algunos agregados y comentarios finales sobre los números ordinales . . . . . . . . . . . . . . . . . 4.3. Tres breves comentarios finales sobre la HC . . . . . . . 4.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . .
II
. 225 . 229 . 235 . 240 . 250 . 252
Los reales
255
Capítulo 5. Los reales, lo cuántico y el continuo 257 5.1. Lo cuántico en la física y el continuo en la matemática . . 257 5.2. Los reales en el cálculo . . . . . . . . . . . . . . . . . . . . 265 Capítulo 6. Las expansiones decimales como modelo del continuo 273 6.1. Algo más sobre conjuntos y lógica . . . . . . . . . . . . . 274 6.2. Más sobre las expansiones decimales . . . . . . . . . . . . 292 6.3. Otras bases . . . . . . . . . . . . . . . . . . . . . . . . . . 301 6.3.1. Números enteros positivos . . . . . . . . . . . . . . 302 6.3.2. Cambios de base . . . . . . . . . . . . . . . . . . . 305 6.3.3. Las expansiones base b como modelo de la recta . 307 6.3.4. Operando en otras bases . . . . . . . . . . . . . . . 311 6.4. Desventaja del modelo . . . . . . . . . . . . . . . . . . . . 316 6.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 Capítulo 7. El modelo axiomático 7.1. Las operaciones y el orden en la recta . . . . . . . . 7.2. Deducción geométrica de las propiedades básicas . . 7.3. Propiedades que se desprenden de las básicas . . . . 7.4. La importancia del teorema de Pappus . . . . . . . . 7.5. La propiedad arquimedeana y la divisibilidad infinita 7.6. Principios de completez . . . . . . . . . . . . . . . . 7.6.1. Cortaduras de Dedekind . . . . . . . . . . . . 7.6.2. Encajes de intervalos . . . . . . . . . . . . . . 7.6.3. Supremo . . . . . . . . . . . . . . . . . . . . . 7.6.4. Sucesiones de Cauchy . . . . . . . . . . . . . 7.6.5. Sucesiones crecientes y acotadas . . . . . . . 7.6.6. Conjuntos infinitos y acotados . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
327 328 332 342 348 355 361 362 365 367 373 375 377
contenido
x
7.7. Los naturales, los enteros y los racionales 7.8. Reflexiones finales . . . . . . . . . . . . . 7.9. El diablo está en los detalles . . . . . . . . 7.10. Ejercicios . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
379 384 388 392
Capítulo 8. Expansiones factoriales 397 8.1. Los números reales del intervalo [0, 1) . . . . . . . . . . . 397 8.2. Las colas infinitas de 90 s y (ℵ0 )! . . . . . . . . . . . . . . . 398 8.3. Todos los racionales tienen expansión factorial finita . . . 402 8.4. La expansión factorial de los números reales en general . . 403 8.5. Algunos números especiales . . . . . . . . . . . . . . . . . 406 8.5.1. El número e . . . . . . . . . . . . . . . . . . . . . . 406 8.5.2. e−1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 407 8.5.3. senh (1) y cosh (1) . . . . . . . . . . . . . . . . . . 407 8.5.4. sen (1) . . . . . . . . . . . . . . . . . . . . . . . . . 408 8.5.5. cos (1) . . . . . . . . . . . . . . . . . . . . . . . . . 409 8.5.6. ei . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409 8.6. Criterios de divisibilidad en base factorial . . . . . . . . . 410 8.7. Algunas formas generales de números trascendentes . . . . 410 8.7.1. Las expansiones (ΦM .XN , a, a, a, a, a, . . . )b! , a ∈ N 413 8.7.2. Las expansiones (ΦM .XN , k, k + 1, k + 2, k + 3, k + 4, . . . )b! , 0 < k < N + 1 . . . . . . . . . . . . . . . 416 8.7.3. ae, con a ∈ Q r N. Los casos a = 21 , a = 13 . . . . . 418 8.7.4. Las expansiones periódicas de período 2 . . . . . . 420 8.8. Conjuntos de Cantor factoriales . . . . . . . . . . . . . . . 423 8.9. Otras bases para representar a los números reales . . . . . 430 8.10. Anexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 Apéndice A. Definiciones preliminares A.1. Conjuntos . . . . . . . . . . . . . . . . . . . A.2. Algunos casos particulares de uso frecuente A.3. Cuestiones básicas de lógica . . . . . . . . . A.4. Funciones . . . . . . . . . . . . . . . . . . . A.5. Sucesiones y series . . . . . . . . . . . . . . A.6. Ejercicios . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
441 441 444 446 449 453 455
Notas
459
Bibliografía
465
Índice analítico
478
Prólogo El 30 de octubre de 1794, la Convención Nacional (Revolución Francesa) emitió un decreto creando la École Normale para preparar un nuevo tipo de profesores. Cada distrito de Francia debía mandar a París una pequeña cantidad de sus ciudadanos más talentosos a escuchar las conferencias de los expertos en sus respectivas áreas. Laplace, tras haber evitado diplomáticamente ser considerado ciudadano talentoso, fue designado como experto y dio la conferencia inaugural en matemáticas a 700 estudiantes avanzados el 20 de enero de 1795. Su enfoque fue revolucionario, se propuso mostrar los descubrimientos más importantes, sus principios, las circunstancias que les dieron origen, la ruta más directa a seguir para llegar a ellos y los procedimientos para obtener nuevos descubrimientos. Las diez pláticas dadas por Laplace fueron muy avanzadas para su auditorio, a pesar de no haber utilizado ecuaciones en las primeras de ellas y de haber explicado los conceptos abstractos en el lenguaje de su audiencia. Más tarde, sus conferencias fueron publicadas y sirvieron de base para establecer el estándar en matemáticas en el segundo y tercer nivel de la educación pública en Francia...1 o Una cita como la anterior llama a la reflexión sobre el papel de las universidades en la educación de un país y sobre la labor de los profesores en y desde ellas. La amplitud de miras de Laplace muestra una concepción de la educación que se plantea el reto de llevar los contenidos más allá de lo básico, de lo elemental; que rechaza evadir la discusión de los conceptos difíciles y los problemas profundos; que integra la enseñanza de las xi
xii
PRÓLOGO
aplicaciones al estudio teórico en un todo único, no reduciéndolas al aprendizaje de algunas técnicas y algoritmos particulares; y que concibe la historia como una fuente esencial del conocimiento. Si esto es válido para la educación en el segundo y tercer nivel de un país, ni qué decir sobre la importancia que tiene para las facultades de ciencias a nivel universitario. Por otro lado, la cita confirma que hay momentos en la historia que tienen un brillo excepcional, que nacen de los grandes cambios sociales y que brindan luz durante muchos años, aun si en la práctica los proyectos que emanaron de ellos no se hubieran podido realizar a plenitud. o Sobre los considerandos de este libro Cuando comencé a impartir los cursos de cálculo en la Facultad de Ciencias de la unam, hace ya muchos años, me pareció que en buena medida la dificultad para la comprensión de algunos de los conceptos más relevantes y de la forma general en que funciona el cálculo, tenía su origen en el desconocimiento del infinito matemático y los números reales. Las cosas mejoraron significativamente al poner en práctica dos cambios: El primero, introducir al comienzo de los cursos una reflexión acerca de la naturaleza de los procesos y los conjuntos infinitos, de manera que los estudiantes fueran descubriendo, por un lado, la presencia del infinito en la solución de muy diversos problemas; y por el otro, que el infinito tiene sus propias reglas, las más de las cuales resultan no poco sorprendentes, lo que por cierto tiene un efecto bastante motivador. El segundo, abordar una discusión sobre los números reales que permitiera comprender cómo son, qué resuelven, cómo lo hacen y de qué otras formas podríamos hacerlo. Lo anterior acompañado de un panorama general de la evolución histórica de las controversias sobre estos temas, los cuales, enlazados al desarrollo de la teoría de conjuntos y a la lógica, configuran una de las problemáticas más polémicas y difíciles de solucionar a lo largo de su historia. En el camino se discute sobre las reglas generales de la lógica y los procedimientos de demostración en matemáticas; se trabaja con funciones, sucesiones, series y límites, con los conceptos de continuidad, de derivada y de integral, lo que posteriormente se formaliza —incluyendo
PRÓLOGO
xiii
varios de los teoremas más importantes del cálculo—, y empieza a ser trabajado en medio de este proceso. Todo, al nivel de un primer acercamiento. Se desprende de lo anterior que la ausencia de una discusión sobre el infinito, y la reducción de la enseñanza de los números reales a la exposición del listado de los axiomas de campo ordenado completo, y la demostración de algunas propiedades algebraicas a partir de ellos, me parece que dificultan el avance en otros temas y limitan la visión —y solidez— de la formación matemática de los alumnos. o A quiénes va dirigido, a quiénes pienso que les puede ser útil. El libro, aunque pretende llenar de contenido esa etapa inicial de los cursos de cálculo descrita, la trasciende con mucho. Se ha intentado abordar, con un nivel razonable de profundidad y de amplitud, las dudas que han ido surgiendo con el paso de los años en una u otra generación sobre diversos problemas relacionados con los fundamentos del cálculo, y en cuya respuesta resulta necesario extenderse a otras áreas de la matemática y ofrecer un panorama sobre su origen y evolución, lo cual difícilmente es posible hacer una y otra vez en el salón de clase, considerando la necesidad de avanzar en el conjunto de los temas que conforman el programa de las materias. Si logramos con él aclarar un tanto esas dudas y contribuir mínimamente a cultivar el gusto de los estudiantes por la historia, la investigación y la lectura de los textos clásicos sobre estos temas, nos daremos por bien servidos. Independientemente de que se comparta o no la visión expuesta sobre la necesidad de abordar con mayor profundidad el estudio del infinito y los números reales en los cursos de cálculo, creo que el trabajo puede servir para reforzar otros enfoques sobre la materia, que por fortuna coexisten en el medio matemático. Lo anterior también puede ser de utilidad en otras materias; en los cursos de análisis, por ejemplo, puede ayudar a establecer con relativa rapidez una base de ideas y resultados, útil al comienzo de algunos temas. En los de álgebra, el capítulo 7 puede servir para el estudio de los modelos axiomáticos en general, y de la estructura de campo en particular; y el capítulo 4 para el estudio de los tipos de orden y los números ordinales. En temas de geometría, la discusión sobre el teorema de Pappus, y la deducción de los axiomas de campo ordenado a partir de él, puede resultar de interés. En los de teoría de conjuntos, puede contribuir a esbozar la problemática en un nivel intuitivo inicial, a partir del cual profundizar en cada aspecto. En
xiv
PRÓLOGO
el caso de los cursos de historia de las matemáticas, se podría incluir en el estudio de la segunda mitad del siglo xix y las primeras décadas del xx (además de las polémicas entre los griegos sobre la continuidad). En los de teoría de los números, el capítulo 8 puede servir como material de discusión sobre las posibilidades que ofrece cambiar la forma de representar a los números reales. Y, cosa que quizás resulte curiosa, por lo menos los capítulos 1 y 2 (habiendo cubierto el apéndice), podrían servir de base para un posible curso de temas selectos de matemáticas dirigido a los estudiantes del último año del bachillerato, más interesados en ellas. Con excepción tal vez de una parte del capítulo 4 y algunas reflexiones del 7, el libro fue escrito con la idea de que los estudiantes de los cuatro primeros semestres de las facultades de ciencias (del área de física y matemáticas) puedan seguir el hilo de los razonamientos, los conceptos, los resultados, el sentido general de las demostraciones y, por supuesto, la historia de todos los temas que incluye. Es a ellos fundamentalmente a quienes está dirigido este trabajo. He procurado dejar de lado las demostraciones formales de no pocos resultados, cuando había la duda de si podrían ser seguidas con relativa soltura por ellos, o cuando las he considerado innecesarias porque desvían la atención de lo principal en un momento determinado. Creo que también puede ser de interés para los estudiantes de los semestres avanzados. Me parece importante también que los profesores de cálculo de distintas áreas —no solo de las facultades de ciencias— y niveles —no solo el universitario— penetren en la discusión de estos grandes temas, que constituyen una parte sustancial de las bases del cálculo. En ese sentido, el libro también va dirigido a ellos. o Esbozo general de los capítulos Capítulo 1: La idea es, antes que nada, trabajar con los procesos infinitos. Mostrar algunos de los aciertos y los tropiezos ocurridos en este terreno durante las primeras épocas del cálculo, y casos representativos. Se estudian detenidamente dos series fundamentales: la geométrica y la armónica, diferentes maneras de verlas y de utilizarlas. Ejemplos de cómo el cálculo introduce al infinito para resolver problemas donde no parecía estar presente: la derivada, la integral, el teorema fundamental. Capítulo 2: Los conjuntos infinitos: una historia que inicia con los debates entre los griegos sobre la continuidad del espacio, la materia y el tiempo; resurge a finales de la Edad Media y comienzos del Renacimien-
PRÓLOGO
xv
to, y alcanza su punto culminante a finales del siglo xix. Comparación entre conjuntos infinitos y las extrañas reglas que parecen cumplirse. Los numerables, sus propiedades. La idea de conjunto bien ordenado. Raíz de 2, diversas pruebas de su irracionalidad. El problema de la inconmensurabilidad entre los griegos, la solución final lograda por Eudoxo. Un primer acercamiento a los reales. El gran descubrimiento de Cantor: los reales son más que los naturales, hay distintos infinitos; dos demostraciones de ello (después se verá una tercera). Capítulo 3: Tres grandes problemas que surgen del resultado obtenido por Cantor: ¿existe un infinito menor que el de los naturales?, ¿existe uno mayor que el de los reales?, ¿existe uno intermedio entre ellos? La prueba de que el infinito más chico es el de los naturales es sencilla, pero utiliza una propiedad que daría lugar a grandes discusiones: el axioma de elección. Su relación con el principio del buen orden, la prueba de Zermelo, la réplica de Borel. El concepto de conjunto está en el centro del debate... paradojas famosas que llevan a su definición axiomática... el auge del enfoque axiomático, los cuestionamientos. La prueba de Cantor de que hacia arriba los infinitos no tienen tope. Los números cardinales y su aritmética. La demostración —para su propia sorpresa— de que, sin embargo, el espacio de dos dimensiones tiene la misma cantidad de puntos que el continuo. La necesidad de precisar la diferencia entre el concepto de dimensión y el de cardinalidad de un conjunto. Los esfuerzos por facilitar la comparación de cardinalidades: el teorema de Cantor-Bernstein-Schröder. Capítulo 4: La conjetura de Cantor ante la tercera pregunta, la hipótesis del continuo. El primero de los grandes problemas planteados por Hilbert en el congreso de 1900 en París. El descubrimiento de Gödel en 1938 y el de Cohen en 1963 y sus reflexiones a posteriori. El intento de Cantor de llegar al continuo desde los conjuntos numerables: los números ordinales, dos grandes caminos para lograrlo y el paraíso de nuevos números que surgen a partir de ello. En qué quedan las cosas después de todo el vendaval de ideas lanzadas por Cantor y el enorme debate que desencadenó. Capítulo 5: Discusión de dos preguntas: a) Los descubrimientos de la mecánica cuántica, ¿ponen en entredicho una matemática que se basa en el continuo (es decir, el cálculo)?, ¿plantean que más bien se requiere el paso de la estafeta a una matemática discreta?; b) ¿Por qué son necesarios los reales, si con los racionales podemos aproximarnos a un valor cualquiera tanto como queramos?
xvi
PRÓLOGO
Capítulos 6 y 7: Dos formas cualitativamente distintas de modelar el continuo, de representar a los números reales: una en la que se construyen “números” concretos para representar cada punto de la recta, y otra en la que se trata de caracterizarla a través de sus propiedades, sin recurrir a representación concreta alguna de sus elementos. Ventajas y desventajas de cada modelo. Capítulo 6: El primer modelo: las expansiones decimales (introduciendo previamente las cuestiones prácticas indispensables de la teoría de conjuntos). El trabajo en otras bases. Propiedades esenciales de los números reales que se pueden demostrar gracias a este modelo, su debilidad al momento de operar con sus elementos. Capítulo 7: El modelo axiomático del continuo. ¿De dónde surgen los axiomas de los reales? Los axiomas no son dogmas. La base geométrica de los axiomas de los reales: el teorema de Pappus, su importancia. Un puente entre la geometría y el álgebra. La propiedad esencial del continuo. Varias formas alternativas de evitar que un campo ordenado deje “hoyos” y la relación entre ellas. Las caracterizaciones de los números reales desarrolladas por Bolzano, Dedekind, Cantor, Meray, Heine, Weierstrass y Thomae. Conclusiones finales y problemas espinosos de lo visto en los dos últimos capítulos. Capítulo 8: Una forma alternativa de representar los números reales, con la cual todos los racionales tienen una expansión finita. La irracionalidad queda entonces garantizada tan solo con que el número tenga una expansión infinita en esa base. El caso del número e, la demostración más simple de que se trata de un número irracional. Representación de otros números. Obtención de diversas series y prueba de la trascendencia de ciertas familias de números. Simplificación notable de los criterios de divisibilidad. Conjuntos de Cantor “gordos” en la nueva base. Posibilidad de nuevos resultados. Apéndice: El objetivo es plantear en forma resumida, sin mayor discusión, las definiciones de los conceptos básicos que se necesita conocer para no atorarse en todo lo que se discute en el libro. Solo en el caso de algunas cuestiones esenciales de lógica proposicional nos detenemos un poco. o 1. Quiero expresar mi gratitud a Miguel Daniel Garrido Reyes, brillante exalumno y hoy ayudante de los cursos de cálculo, por su increíble actitud solidaria a lo largo de la elaboración de este libro. Se encargó de lleno de la digitalización de las imágenes (305 gráficos distin-
PRÓLOGO
xvii
tos, agrupados en 137 figuras), captando bien la idea a reflejar en ellas (a pesar de los borradores que le entregaba hechos a mano) y aceptando siempre con completo agrado las observaciones que le hacía, además de resolver él mismo problemas no resueltos, tanto matemáticos como técnicos. Esto, además de su permanente disposición a discutir las ideas que iban surgiendo, enriqueciendo el resultado final. Todo realizado en forma voluntaria, sin recibir apoyo económico alguno de la universidad. 2. Agradezco sinceramente la detallada revisión y las sugerencias hechas por los dos árbitros anónimos nombrados por el Departamento de Matemáticas de la Facultad de Ciencias para evaluar la publicación del libro. 3. Agradezco asimismo las observaciones y los múltiples comentarios constructivos que me hicieron los profesores Rafael Martínez y Javier Páez, Vinicio Gómez, Sandra Palau, Ceci Neve, Hugo Rincón, Miguel Ángel Ocampo, Leticia Contreras, Santiago López de Medrano, Oscar Palmas, Guillermo Gómez, Guillermo Gachuz, Francisco Giovanni y David Theurel; y la digitalización de la imagen del conjunto de Cantor factorial de Eduardo Ken Hiranaka. Y agradezco por múltiples razones el apoyo de Maricarmen Fernández, sin cuya labor difícilmente hubiera tomado cuerpo este trabajo. Mención aparte requiere la ayuda de Carisa para sacar adelante este proyecto de principio a fin, no solo por la cuidadosa transcripción de la extensa bibliografía que hubo que rescatar de las notas que fui escribiendo a lo largo de la elaboración del libro, sino también por el apoyo en lo que fuera necesario y a la hora en que fuera necesario hasta que lo dimos por terminado. Y aquí en un rinconcito, porque esto es personal, quiero decir que dedico este libro: A la memoria de mis padres, Guillermo y Maruja, quienes a pesar de las cicatrices de la guerra civil, de Bram, de Argelés y del exilio, supieron colmar a sus hijos de valores y sentimientos que los hace inolvidables, entrañables. A Carisa y a Javi, ese pequeño feliz que ha sido lo mejor que me pudo suceder. A mi familia y a todos mis compañeros y amigos.
Parte I
El infinito
EL INFINITO
xxi
La geometría superior* utiliza frecuentemente magnitudes infinitamente grandes e infinitamente pequeñas; sin embargo los antiguos eruditos han evitado el infinito cuidadosamente y algunos famosos analistas de nuestro tiempo reconocen que la expresión magnitud infinita es contradictoria. La Academia desea pues que se aclare cómo han surgido tantos teoremas correctos a partir de hipótesis contradictorias, y que se indique algún concepto básico, seguro y claro que pueda reemplazar al infinito sin hacer los cálculos demasiado difíciles o demasiado largos.2 (*Se refiere a las matemáticas: en el siglo xviii, matemáticas y geometría eran términos usados a menudo como sinónimos). Certamen de la Academia de Berlín en relación al infinito, 1784. ...El infinito no existe de hecho, como un sólido infinito, una magnitud aprehendida por los sentidos... El infinito existe potencialmente, el infinito es movimiento...3 ...es imposible que algo continuo esté hecho de indivisibles, como por ejemplo, que una línea esté hecha de puntos, si damos por supuesto que la línea es un continuo y el punto es un indivisible Tampoco un punto puede suceder a un punto, o un “ahora” a un “ahora”, de tal manera que lo que resulte de ello sea una longitud o un tiempo; pues dos cosas están en sucesión si no hay entre ellas ninguna otra cosa del mismo género, pero entre dos puntos hay siempre una línea y entre dos ahoras hay siempre un tiempo.4 Aristóteles, s. iv a. n. e. ...igual que un número infinito no es ningún número, tampoco un número irracional es un número verdadero porque se oculta, por así decirlo, en una niebla de infinitud.5 Michael Stifel, 1544. ...toda extensión finita particular, que puede ser posiblemente el objeto de nuestro pensamiento, es una idea que existe
xxii
UN ACERCAMIENTO A LOS FUNDAMENTOS DEL CÁLCULO
solo en la mente, y consecuentemente cada parte de ella debe ser percibida. Si entonces yo no percibo innumerables partes en cualquier extensión finita que considero, ciertamente es que no están contenidas en ella... decir que una cantidad o extensión finita consiste en un número infinito de partes, es una contradicción tan manifiesta, que cualquiera a primera vista confesaría que lo es.6 George Berkeley, 1710. Entonces, del hecho de que toda cantidad puede ser incrementada hacia el infinito, parece seguirse que no existe una cantidad infinita. Una cantidad incrementada continuamente con incrementos no se hace infinita a menos que ya haya sido incrementada sin límite. Sin embargo, aquello que debe ser incrementado sin límite no puede ser concebido como si ya se hubiese hecho infinito. No obstante [. . . ] existen casos reales, al menos pueden ser concebidos, en los que un número infinito existe actualmente. Así, si hay cosas que son infinitamente divisibles, como muchos filósofos han sostenido que es el caso, el número de partes de las que esta cosa está constituida es realmente infinito. Pues si se sostuviera que el número es finito, entonces la cosa no sería infinitamente divisible en realidad.7 Leonhard Euler, 1755. He aquí el razonamiento de Fontenelle: Una cantidad susceptible de ser aumentada sin fin, uno puede suponer que es realmente aumentada sin fin... si no, siempre permanecería finita... puede suponerse que es actualmente infinita.8 Jean LeRond D’Alembert, 1756. Pero en lo que concierne a su prueba... objeto sobre todo el uso de una magnitud infinita como si fuera algo completado, lo cual nunca es permitido en las matemáticas. El infinito es solo une façon de parler, cuando estamos propiamente hablando de límites a los que se aproximan tanto como queramos ciertas relaciones conforme a otras se les permite incrementar sin límite...9 Carl Friedrich Gauss, 1831.
EL INFINITO
xxiii
Se afirma que: “Un conjunto infinito no puede existir en ninguna parte, por la sencilla razón de que no es posible abarcar nunca con el pensamiento, como un todo unitario, un conjunto de esa índole”. Esto es algo que hay que señalar claramente como un error provocado por la equivocada opinión de que para poder pensar un todo con objetos a, b, c, d, . . . es necesaria la formación previa de representaciones mentales individuales de cada uno de esos objetos. Pero esto es falso. Puedo pensar, por ejemplo, el conjunto, el agregado, o si se quiere, el todo de los habitantes de Praga o de Beijing sin necesidad de tener una representación particular de cada uno de ellos. En realidad, es precisamente esto lo que estoy haciendo en este momento al hablar de ese conjunto y hacer afirmaciones sobre él...10 Bernard Bolzano, 1851. No existe el infinito actual, y cuando hablamos de una colección infinita, entendemos una colección a la cual podemos agregarle nuevos elementos incesantemente...11 Henri Poincaré, 1913. Si se quiere dar cuenta cabal del origen del prejuicio ampliamente extendido contra el infinito actual, del horror infiniti en la matemática, entonces se debe tener ante todo muy en cuenta la contraposición que hay entre infinitos potenciales y actuales. Mientras que el infinito potencial no significa otra cosa que una magnitud variable indeterminada, que permanece siempre finita, y que toma valores que o bien se mantienen menores que toda magnitud finita por pequeña que sea, o bien se hacen mayores que todo límite finito por grande que sea; el infinito actual designa a un quantum constante, fijo en sí, que es mayor que toda magnitud finita de la misma especie. Así por ejemplo una magnitud variable x, que puede tomar uno tras otro los diferentes valores numéricos enteros 1, 2, 3, ..., n, ... representa un infinito potencial, en cambio el conjunto de todos los números enteros finitos (n), totalmente determinado conceptualmente por medio de una ley, ofrece el ejemplo más sencillo de un quantum infinito actual.
xxiv
UN ACERCAMIENTO A LOS FUNDAMENTOS DEL CÁLCULO
[. . . ] Está fuera de toda duda, en efecto, que no puede prescindirse de las magnitudes variables en el sentido del infinito potencial, a partir de ello puede demostrarse también la necesidad de los infinitos actuales de la siguiente manera: Para que una magnitud variable sea útil en una consideración matemática, su “dominio” de variabilidad debe ser conocido en rigor previamente mediante una definición; pero este “dominio” no puede él mismo ser a su vez algo variable, ya que faltaría toda base firme para tal consideración; así que este “dominio” es un conjunto de valores infinito actual determinado.12 Georg Cantor, 1886. Casi todas las ideas matemáticas presentan una gran dificultad: la dificultad del infinito.13 Bertrand Russell, 1903. El infinito siempre ha agitado las emociones de la humanidad más profundamente que cualquier otra cuestión; el infinito ha estimulado y fertilizado la razón como pocas otras ideas lo han hecho; pero también el infinito, más que cualquier otra noción, necesita ser aclarado.14 David Hilbert, 1925. ¿Es realmente necesario hablar del infinito? Pensemos en las cosas que quizás guarden un lugar dentro de nuestra imaginación como las verdaderamente grandes. Cuenta la leyenda15 que el rey Shirham de la India quiso recompensar a su gran visir Sissa Ben Dahir por haber inventado un juego tan maravilloso como el ajedrez, ofreciéndole que pidiera lo que quisiera. “Dame un grano de trigo para colocarlo en el primer cuadro del tablero —propuso el visir—; dos en el segundo; el doble en el tercero; y así sucesivamente hasta completar los 64 cuadros”. ¿Cuántos granos de trigo pidió el visir? 1 + 2 + 22 + 23 + 24 + · · · + 263 = 18 446 744 073 709 551 615.
EL INFINITO
xxv
Si consideramos que 1 grano de trigo promedio mide ≈ 7.28 mm3 (casi 2 mm · 2 mm · 2 mm), entonces 1m3 ≈ 137.4 millones de granos de trigo. De modo que pedía ≈ 134, 256.000, 000 de m3 de trigo. Si suponemos que 1m3 de trigo ≈ 800 kgs, esto significa que pedía del orden de 107, 404, 623, 000 toneladas de trigo. En el año 2011-2012, la producción mundial de trigo fue de 650 millones de toneladas (naturalmente que en el siglo vi era bastante menos). Así que, en resumen, Sissa Ben pidió el equivalente de 165 años de producción mundial de trigo, a producción actual. La velocidad de la luz: 300,000 kilómetros por segundo (3 · 106 ). La distancia de la Tierra al Sol: 150 millones de kilómetros (1.5 · 108 ). La antigüedad de la Tierra: 4,600 millones de años (4.6 · 109 ). El número de oscilaciones por segundo de la luz ordinaria y visible: 6 · 1014 . El número de granos de arena en todas las playas del planeta: quizás 1030 . El número de electrones, protones y neutrones de todo el universo observable: 1080 . . . .16 O cosas que posiblemente pensamos como “de las más pequeñas” que podríamos imaginarnos: ¿Cuánto mide un arco de un segundo? (recordar que 1◦ = 60 min, 1 min = 60 seg): 1 ≈ .000000771 = 7.71 · 10−7 de la circunferencia. 360 · 60 · 60 ¿Y la longitud de onda, por ejemplo, de la luz verde? 5.5·10−7 metros. ¿Cuál es el radio de un átomo de hidrógeno? 2.5 · 10−4 metros. ¿Cuál es la carga de un electrón? ≈ −1.6 · 10−19 coulombs. La idea del infinito aparece tanto al pensar en cantidades muy grandes como al hacerlo en cantidades muy pequeñas. Aristóteles decía que El infinito por adición es en cierto modo el mismo que el infinito por división, pues en una magnitud finita el infinito por adición se produce en un proceso inverso al otro.17 En las magnitudes solo hay un infinito potencial por división, y en los números solo lo hay por adición.18 ¿Pero por qué se da el brinco de lo muy grande y lo muy pequeño a lo infinito, si aun las cosas más numerosas y las más pequeñas que podríamos imaginar son en realidad finitas? Iremos obteniendo diversas respuestas a esta pregunta conforme vayamos avanzando. Por lo pronto,
xxvi
UN ACERCAMIENTO A LOS FUNDAMENTOS DEL CÁLCULO
observemos que si los números naturales no fueran un conjunto infinito, no podríamos contar con ellos colecciones finitas tan grandes como quisiéramos. Ni podríamos medir distancias tan pequeñas como fuera necesario, pues nuevamente para esto se requiere que los denominadores de los quebrados con los cuales las aproximemos puedan hacerse tan grandes como se quiera. Lo último está relacionado con otro hecho: si necesitáramos acercarnos a un punto P de la recta tanto como se quiera con una colección de puntos diferentes de él, requeriríamos que dicha colección fuese infinita; pues siendo finita, aunque fuera inmensamente grande en cantidad, podríamos tomar el punto de la colección más próximo a P , medir su distancia a él y tendríamos entonces que esa distancia no habría sido remontada por los puntos de la colección. Hablar de acercarnos tanto como queramos implica hablar del infinito, de colecciones infinitas. Si tenemos en cuenta que todo esto está íntimamente vinculado a la idea de límite, y que este representa poco más o menos la columna vertebral del cálculo, podremos entender la importancia que tienen los conjuntos infinitos. Las citas con las que abrimos esta parte nos dan idea de lo enormemente difícil que ha sido para el hombre, para la ciencia, aprehender bien el concepto de infinito, y de las posiciones tan encontradas que se han generado desde siempre en torno a él. Podemos ubicar el origen del cálculo en el siglo xvii. Durante sus primeros dos siglos se produjo una cantidad de resultados sorprendente, pero las pruebas de validez de estos resultados tenían puntos débiles cada vez más evidentes. Los errores se fueron presentando una y otra vez. Se llegó a un punto en que resultó indispensable concentrar una parte de las fuerzas en rehacer todo sobre una base más firme y estable. Es el periodo que se llamó aritmetización del análisis, en el siglo xix. Con frecuencia, los errores tenían que ver precisamente con el manejo de procesos infinitos y de los números reales. En el capítulo 1 se plantea una serie de ejemplos que permitirán percibir estas dificultades, en el proceso mismo en que nos vamos familiarizando con el manejo del infinito, para posteriormente ir analizando cómo se fueron resolviendo las cosas.
Capítulo 1
Trabajando con el infinito: aciertos y errores Ejemplo 1.1. Obtener la suma infinita S = 1 − 1 + 1 − 1 + 1 − 1 + ··· Solución Alternativa 1: S = (1 − 1) + (1 − 1) + (1 − 1) + · · · = 0 + 0 + 0 + · · · = 0. Alternativa 2: S = 1 − (1 − 1) − (1 − 1) − (1 − 1) + · · · = 1 + 0 + 0 + · · · = 1. Alternativa 3: 1 S = 1 − (1 − 1 + 1 − 1 + 1 − 1 + · · · ) = 1 − S =⇒ 2S = 1 =⇒ S = . 2 ¿Cuál es la correcta? Veremos más adelante que ninguna. Esta fue una de las series que mayor discusión provocó entre algunos de los matemáticos de los siglos xvii y xviii. Leibniz, Jacques y Jean Bernoulli, Daniel Bernoulli, y Lagrange consideraban que la suma era 21 , pero por razones diferentes a la señalada antes. Euler tenía otra opinión. 1
2
1.1. 1.1.1.
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
La serie geométrica Razonamientos geométricos de casos particulares
¿Es posible que la suma de una infinidad de cantidades pequeñitas, pero todas ellas mayores que cero, nos resulte un valor finito? Ejemplo 1.2. Obtener la suma infinita S=
1 1 1 + 2 + 3 + ··· 1 2 2 2
(1.1)
Solución Pensemos en S como una suma de magnitudes de segmentos, que colocamos uno a continuación de otro, partiendo del cero en la recta. Al tomar el primer sumando, que vale 21 , nos encontramos a media unidad de distancia del 1. La mitad de esa distancia es 14 , que es el valor del siguiente sumando; al agregarlo, quedamos a otro cuarto de distancia del 1. En general, al cabo de haber sumado n sumandos, nos encontramos a una distancia igual a 21n del 1: siempre a la izquierda del 1, pero a través de seguir agregando segmentos podemos ir pegándonos tanto como queramos a él, y por lo misFigura 1.1 mo, sin detenernos nunca antes de él (ver figura 1.1). El valor de la suma infinita es 1. Quizás pase por nuestra cabeza el siguiente razonamiento: “pero la suma nunca llega al 1... se pega tanto como quieras al 1, pero nunca es 1...”. La suma finita, por muy grande que sea el número n de sumandos que tomemos, efectivamente nunca es 1. El punto aquí es qué entendemos por suma infinita. Aristóteles no aceptaba que se pudiera considerar la suma de una infinidad de números como algo concluido, sino solo como algo que potencialmente los incluye a todos. Por lo tanto, en nuestro
LA SERIE GEOMÉTRICA
3
caso, la suma valdría potencialmente 1. Es la discusión entre el infinito potencial y el infinito actual (esta última palabra corresponde a la traducción literal al español de la formulación hecha por él, y aunque no se deja de pensar que no recoge bien la idea, acabamos utilizándola tal cual, pues su uso se ha extendido a toda la literatura sobre el tema). La definición de límite formula en el fondo las cosas de manera que sea compatible con esta idea, así es que no hay problema. Aunque a final de cuentas uno no deja de pensar: ¿y qué problema hay en considerar la infinidad de magnitudes como algo que está ahí realmente, en acto, que sumamos en su totalidad y que al hacerlo obtenemos exactamente el valor 1? Este era, en el fondo, el planteamiento de Bolzano. o Hay otra forma de visualizar geométricamente el resultado que hemos obtenido, que consiste en imaginar los sumandos como áreas. Pensemos en el cuadrado unitario. Lo partimos verticalmente a la mitad, de manera que a la izquierda nos queda un rectángulo con área 1 2 , el valor del primer sumando. Luego, partimos el rectángulo del lado derecho horizontalmente a la mitad, e identificamos al de abajo con el segundo sumando (tiene área 14 ). A continuación, partimos verticalmente el cuadradito de arriba a la derecha a la mitad, identificando el rectángulo de la izquierda de los dos recién obtenidos con el tercer sumando (tiene área 18 ). Cortamos horizontalmente a la mitad el de la derecha, e identificamos al de abajo con el cuarto sumando. Y así sucesivamente (ver figura 1.2). ¿Qué se observa? Que conforme avanzamos en la suma nunca sobrepasamos el cuadrado unitario, y lo vamos “llenando” tanto como queramos. La suma infinita, que geométricamente correspondería a sumar las áreas de todas las figuras obtenibles con el procedimiento seguido, es igual a 1.
Figura 1.2
4
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
¿Qué pasaría si comenzamos partiendo verticalmente el cuadrado unitario de manera que a la izquierda nos quede un rectángulo de área 2 vamos haciendo los cortes de forma que guardemos la pro3 , y siempre
porción 32 , 13 , identificando la parte mayor de cada corte con los sumandos de una nueva suma infinita? (ver figura 1.3). La suma volvería a ser 1, y entonces tendríamos que
2 2 1 1 1 2 S = 1 + 2 + 3 + ··· = 2 1 + 2 + 3 + ··· 3 3 3 3 3 3 ∴
= 1.
1 1 1 1 + + + ··· = . 31 32 33 2
Figura 1.3
Si partiéramos siempre en la proporción
3 1 4, 4
, llegaríamos a que
1 3 3 1 1 3 S = 1 + 2 + 3 + ··· = 3 1 + 2 + 3 + ··· 4 4 4 4 4 4
= 1.
1 1 1 1 + + + ··· = . 41 42 43 3 En general, dado un valor natural fijo m cualquiera (ver figura 1.4), tendremos que ∴
S=
1 1 1 m−1 m−1 m−1 + + +· · · = (m−1) + 2 + 3 + ··· 1 2 3 1 m m m m m m ∴
1 1 1 1 + 2 + 3 + ··· = . 1 m m m (m − 1)
Podríamos entonces reformular el resultado que obtuvimos, así: ∞ X 1
k=1
mk
=
1 . (m − 1)
= 1.
LA SERIE GEOMÉTRICA
5
Figura 1.4
Preparando algo que veremos más adelante, observemos que, como 1 = mk
1 m
k
1 1 m = 1 , (m − 1) ) (1 − m
y
nuestro resultado también habría podido expresarse así: ∞ X 1 k
k=1
O bien, que si r =
1 m,
m
=
1 m
(1 −
1 . m)
entonces ∞ X
k=1
rk =
r . (1 − r)
(1.2)
6
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Si quisiéramos sumar desde el valor correspondiente a k = 0, tendríamos: ∞ X
rk = r0 +
k=0
∞ X
k=1
rk = 1 +
1 r = . (1 − r) (1 − r)
(1.3)
No olvidemos que las dos últimas fórmulas (en realidad son esencial1 , mente la misma) fueron obtenidas tan solo para el caso en que r = m [1] con m un número natural.
1.1.2.
El caso general
Quitemos ahora la restricción señalada. Sea r ∈ R. Si llamamos Sn =
n X
k=0
rk = 1 + r + r2 + r3 + · · · + rn ,
como queremos obtener la suma infinita, lo que nos interesa es ver qué sucede con Sn cuando n −→ ∞. Si r = 1, es inmediato que la suma diverge a ∞, y si r > 1, con mayor razón. Los valores de r que harían factible que la suma fuera un número finito, serían en tal caso los valores entre 0 y 1 (hablando de los positivos). Si multiplicamos Sn por (1 − r), obtenemos que Sn (1−r) = (1+r+r2 +r3 +· · ·+rn )−(r+r2 +r3 +· · ·+rn+1 ) = 1−rn+1 . Si r 6= 1, podemos dividir ambos lados entre (1−r) y la suma se simplifica notablemente: 1 − rn+1 Sn = . 1−r
Debemos analizar entonces qué ocurre en la expresión anterior si hacemos crecer n tanto como queramos. El único término que cambia al variar n (o sea, que depende de n) es rn+1 . Es este número el que define las cosas. Y por supuesto, esto a su vez depende de cuánto vale r. Veamos qué sucede para algunos valores particulares de r (incluyendo los mayores que 1, tan solo para confirmar el razonamiento): [1]
Tener presente que lo que hicimos no constituye aún una prueba formal del resultado enunciado, sino razonamientos intuitivos, visualmente evidentes, que sugieren fuertemente su validez (y que de hecho dan la pauta para un camino a seguir en la prueba formal).
7
LA SERIE GEOMÉTRICA
r
r2
r3
0 0 0 0.5 0.25 0.125 0.9 0.81 0.729 0.99 0.9801 0.9702 1 1 1 1.1 1.1506 1.2657 2 4 8
r4
r5
0 0.0625 0.6561 0.9605 1 1.3923 16
0 0.0312 0.5904 0.9509 1 1.5315 32
r10
r100
0 0 0.0009 7.88 · 10−31 0.3486 0.0000265 0.9043 0.3660 1 1 2.5937 13780.6 1024 1.26 · 1030
r1000 0 9.33 · 10−302 1.74 · 10−46 0.000043 1 2.47 · 1041 1.07 · 10301
¿Qué sugieren estos números? Que cuando r está en el intervalo (0, 1), los valores de rn se van pegando tanto como queramos a cero conforme aumentamos y aumentamos n. Lo notable es que esto sucede sin importar si r está muy pegadita al 1 (en ese caso hay que aumentar mucho más n para hacer que bajen los valores de rn , pero bajan). Esto en condiciones en que al pasar al valor r = 1, rn no se mueve del 1. Por otra parte, cuando r > 1, los valores de rn se hacen tan grandes como se desee al aumentar n. Nuevamente, lo notable es que esto no solo sucede para valores grandes de r, lo cual sería esperable, sino para valores tan cercanos como se quiera al 1 (aunque haya que aumentar mucho la n para conseguirlo). ¿Qué pasaría si −1 < r < 0? Que los valores de rn irían oscilando entre valores positivos y negativos, pero igual pegándose tanto como queramos al 0. Si r < −1, tendríamos valores que oscilan entre positivos y negativos, pero haciéndose indefinidamente grandes. Si r = 0 la suma es evidentemente 0. El caso r = −1 se comenta un poco más adelante. Todo indicaría pues, que si −1 < r < 1, cuando n → ∞, rn → 0, y ∴ Sn →
1 . 1−r
La prueba formal de estas conclusiones no es complicada, pero requiere del manejo del concepto de límite. En resumen, tenemos entonces que: ∞ X
k=0
rk = 1 + r + r2 + r3 + · · · =
1 , 1−r
∀ r ∈ (−1, 1),
(1.4)
r , 1−r
∀ r ∈ (−1, 1).
(1.5)
y si tomamos la suma desde k = 1, ∞ X
k=1
rk = r + r2 + r3 + · · · =
8
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Podemos observar que (1.4) y (1.5) coinciden con (1.3) y (1.2). La diferencia es que ahora las hemos obtenido para todo número real entre 1 −1 y 1, no solo para los números de la forma r = m . Es decir, que el resultado establecido por las dos últimas es mucho más general. La serie anterior es conocida como serie geométrica, debido a que la razón entre cualesquiera dos de sus términos sucesivos es constank+1 te: r rk = r, y es esta característica la que define a las progresiones geométricas. o ¿Hay forma de visualizar geométricamente también este caso general? Sí. Ubiquémonos en el plano, colocando la unidad a partir del origen, tanto avanzando sobre el eje X como haciéndolo sobre el eje Y . Bauticemos los puntos como O (el origen), A (el que está una unidad a la derecha sobre el eje X) y C (el que está una unidad hacia arriba sobre el eje Y ).
Figura 1.5
Levantemos ahora un segmento vertical de longitud r < 1 a partir del punto A, y llamemos B a su punta. Hemos generado entonces un trapezoide OABC (ver figura 1.5). Observemos de entrada que la prolongación del segmento CB necesariamente interseca el eje X en un punto P , pues AB < OC. Tomemos ahora un punto A0 a una distancia r > 0 a la derecha de A, y levantemos sobre A0 un segmento vertical que cruce la línea OP en un punto B 0 . ¿Cuánto mide A0 B 0 ? (ver figura 1.6). Como los trapezoides OABC y AA0 B 0 B tienen sus cuatro ángulos iguales y dos lados adyacentes proporcionales, son semejantes, de modo 0B0 0 A0 B 0 r 0 0 2 que AAB = AA OA . Es decir, r = 1, ∴ A B = r . 00 Tomamos entonces un nuevo punto A , ahora a una distancia r2 de 0 A , y repetimos el razonamiento. Es fácil verificar que el nuevo segmento
LA SERIE GEOMÉTRICA
9
Figura 1.6
vertical A00 B 00 medirá r3 . Y así sucesivamente. Como los valores de rk se hacen tan pequeños como queramos, tendrán su lugar uno tras otro todos ellos debajo de la línea CP y sobre el segmento OP (ver figura 1.7), de modo que OP = 1 + r + r2 + r3 + . . . .
Figura 1.7
Así que si pensamos en el gran triángulo COP , uno de sus lados es la suma que buscamos. Para saber cuánto vale esta suma nos serviría encontrar otro semejante a él, cuyo lado equivalente sea un valor conocido. Pero esto resulta fácil, pues si trazamos un segmento horizontal a partir del punto B y llamamos D a su intersección con el eje Y , el triángulo CDB resulta semejante al COP . El lado CD del primer triángulo mide 1 − r. Entonces OP OC 1 + r + r2 + r3 + . . . 1 = , es decir = , DB DC 1 1−r que es lo que establece la fórmula (1.4).
10
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Hicimos el análisis geométrico para el caso en que 0 < r < 1,[2] pero ya habíamos comentado que el resultado también se cumple para −1 < r < 0 (cuando r = 0 es evidente). Si r = − 21 por ejemplo, 1−
1 1 1 2 1 + 2 − 3 ± ··· = = . 1 2 2 2 3 1 − (− 2 )
o El resultado (1.4) se pudo haber obtenido también de otra forma. Si simplemente dividimos 1 entre 1−r, como se suelen dividir dos polinomios (análogamente si lo hacemos con r y 1 − r), llegamos directamente a él (ver figura 1.8).
Figura 1.8
Sin embargo, aquí hay un detalle. Lo anterior lo podemos hacer para toda r 6= 1, no hay nada a primera vista que sugiera alguna restricción mayor; entonces, aplicamos el resultado por ejemplo a r = 2, y llegamos al absurdo que 1 + 2 + 22 + 23 + 24 + · · · =
1 = −1. (1 − 2)
Esto es algo que hizo el propio Euler, y en su reflexión sobre qué estaba pasando identificó el origen del problema y precisó en qué había que [2]
La misma figura 1.7 sugiere qué sucede cuando r ≥ 1: si r = 1, la línea que parte del punto C y va tocando los vértices de los paralelogramos con lados verticales de altura r, r2 , r3 , . . . , no “baja” hacia el eje X sino que se eleva, de manera que la suma de los lados correspondientes 1 + r + r2 + r3 + . . . tiende a infinito, pero la línea se interseca con el eje en X = −1. En el caso en que r = 1, la línea mencionada queda paralela al eje X, de forma que no hay intersección con él y la suma resulta igualmente infinita.
11
LA SERIE GEOMÉTRICA
fijarse para determinar los valores para los que la división sí correspondía a la suma infinita resultante y aquellos para los que esto no era así. La clave estaba en el análisis del residuo, como veremos un poco más adelante (ver sección §1.1.4).
1.1.3.
La serie geométrica como serie de funciones
Hay otro tipo de análisis que podemos hacer. Si en la expresión (1.4) cambiamos el nombre a la variable r por el de x (esto en realidad no es necesario para lo que vamos a plantear, pero quizás nos resulta más fácil pensar en funciones de esta manera), cada sumando puede ser visto como 1 una función diferente f0 (x) = 1, fk (x) = xk ∀ k ≥ 1, y f (x) = , 1−x de modo que (1.4) se convierte en f (x) = f0 (x) + f1 (x) + f2 (x) + f3 (x) + . . . , quedando definidas todas las funciones en el intervalo (−1, 1). ¿Cómo es la gráfica de cada una de las funciones que aparecen? (ver figuras 1.9 y 1.10).
(a)
(b)
Figura 1.9
¿Qué significa sumar las funciones f0 , f1 , f2 , f3 , . . . ? Significa tomar uno a uno los valores de x en (−1, 1), y sumar las alturas de cada una de las funciones evaluadas en esa x. Tomemos por ejemplo el valor x = 12 ; la suma ya sabemos que nos resulta igual a 2, ¿y cuánto vale f ( 12 )?,
12
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
justamente 2. Si tomamos x = − 21 , la suma vale f (− 12 ) = 23 . Esto sucede así para todos los valores de x ∈ (−1, 1). Es decir que la altura de la gráfica de f en cada x nos indica precisamente el valor de la serie correspondiente (ver figura 1.11).
(a)
(b)
(c)
(d)
(e)
(f)
(g)
Figura 1.10
La figura 1.12 ilustra cómo van resultando globalmente (en todo el (−1, 1)) las funciones f0 +f1 , f0 +f1 +f2 , f0 +f1 +f2 +f3 , . . . Obsérvense dos cosas:
LA SERIE GEOMÉTRICA
13
Figura 1.11
a) Conforme más funciones sumamos, vamos obteniendo una función 1 más y más parecida a f (x) = 1−x . f (x) es llamada función límite de la sucesión de sumas parciales (de funciones) Sn (x) = f0 (x) + f1 (x) + f2 (x) + · · · + fn (x). b) Imaginen que agregásemos el punto x = −1 al dominio de todas las funciones, ¿qué iría resultando con las sumas parciales en x = −1? Se obtendría la sucesión de valores 1, 0, 1, 0, 1, 0, . . . No tendría sentido hablar de que a la larga hay una tendencia a aproximarse a un número específico (no hay límite).[3] Sin embargo, cuando estamos muy cerca del -1, sí hay una tendencia de las sumas hacia valores próximos a 12 , que es precisamente lo que vale f (x) en x = −1 (ver figura 1.12). o El argumento de Leibniz (con el que estuvieron de acuerdo los hermanos Jacques y Jean Bernoulli, su sobrino Daniel y Lagrange mismo)19 a favor de que 1 (1.6) 1 − 1 + 1 − 1 + 1 − 1 + ··· = , 2 era que las sumas parciales oscilaban entre los valores 0 y 1, y ambos eran igualmente probables, de modo que había que tomar la media aritmética entre los dos, pues este era también el valor más probable para la suma. [3]
Esta es la razón por la que ninguna de las tres respuestas planteadas al comienzo del capítulo es correcta. Volveremos sobre ello al ver el análisis de Euler en la siguiente sección.
14
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
(a)
(b)
(c)
(d)
(e)
(f)
Figura 1.12
Pero ¿qué pensaba Euler sobre el problema?
1.1.4.
Euler
En 1755 Euler publicó su obra Institutiones Calculi Differentialis, cuyos primeros nueve capítulos fueron traducidos del latín al inglés por John D. Blanton y publicados en un volumen en el año 2000 por la editorial Springer. El capítulo 3 de este libro lleva por título Sobre el infinito y lo infinitamente pequeño.20 En él, Euler expone sus ideas —en discusión con otras opiniones— sobre el infinito potencial, el infinito actual, lo infinitamente grande, lo infinitamente pequeño, el principio de divisibilidad infinita, los diversos órdenes del infinito y sobre resultados contradictorios que surgen en el manejo de las series infinitas.
LA SERIE GEOMÉTRICA
15
Se trata de un trabajo que nos ofrece una muestra inmejorable de las enormes dificultades que debieron ser remontadas para comprender el infinito matemático. El que a matemáticos que gozaron del don de la genialidad les fuera tan difícil encontrar explicaciones coherentes sobre el infinito, pone de manifiesto lo complejo del problema y las limitaciones de una época más caracterizada por el éxito en la obtención de nuevos resultados que por la fundamentación sobre los mismos. No es la intención abordar la discusión de todos los puntos antes mencionados, por lo que solo se analiza el caso de las series, y aun ahí, tan solo algunas de sus reflexiones sobre el tema, lo cual es un buen botón de muestra de lo dicho anteriormente. Empezaremos citando sus palabras: Frecuentemente se presentan términos infinitos en una serie. Así, en la serie armónica, cuyo término general es x1 , el término correspondiente al índice x = 0 es el término infinito 1 . La serie completa es como sigue: 0 1 1 1 1 1 1 1 1 ...,− ,− ,− ,− ,+ ,+ ,+ ,+ ,... 4 3 2 1 0 1 2 3 Avanzando de derecha a izquierda los términos incrementan su valor, de manera que 10 es infinitamente grande. Una vez que lo hemos atravesado, los términos se hacen decrecientes y negativos. Entonces, una cantidad infinitamente grande puede ser pensada como una especie de límite, que al ser atravesado los números positivos se hacen negativos y viceversa. Frecuentemente, en una serie un término infinito constituye un límite que separa los términos reales de los complejos, como ocurre con la siguiente serie, cuyo término general es √1 : x 1 1 1 1 1 1 1 . . . , +√ , +√ , +√ , + , +√ , +√ , +√ , . . . −3 −2 −1 0 1 2 3 Aunque no puede haber duda de que cuando un mismo número finito es sumado una infinidad de veces la suma debe
16
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
ser infinita, sin embargo, la serie infinita general que se origina de la fracción 1 = 1 + x + x2 + x3 + x4 + x5 + . . . 1−x parece plantear serias dificultades. Si sustituimos en el lugar de x los números 1, 2, 3, 4, . . . , obtenemos las siguientes series con sus sumas: A. 1 + 1 + 1 + 1 + 1 + · · · =
1 1−1
B. 1 + 2 + 4 + 8 + 16 + · · · =
= ∞,
1 1−2
C. 1 + 3 + 9 + 27 + 81 + · · · =
= −1,
1 1−3
D. 1 + 4 + 16 + 64 + 256 + · · · =
= − 21 ,
1 1−4
= − 31 ,
y así sucesivamente. Como cada término de la serie B, excepto el primero, es mayor que el correspondiente de la serie A, la suma de la serie B debe ser mucho más que la suma de la serie A. No obstante, este cálculo muestra que la serie A tiene una suma infinita, mientras la serie B tiene una suma negativa, que es menor que cero, y esto es incomprensible. Menos aun podemos reconciliar con las ideas ordinarias los resultados de esta y las siguientes series C, D, y las sucesivas, que tienen sumas negativas siendo todos los términos positivos. Pero en el momento de definir cuándo sí era válido el resultado obtenido y cuándo no, se imponía el ingenio. La forma en que Euler resuelve el problema abierto en la última parte de la cita anterior, después de pasar por terrenos escabrosos en la discusión del asunto, llega a una 1 idea clave: el problema está en que a la hora de hacer la división 1−x , conforme más se avanza en ella, los residuos que se van obteniendo son cada vez mayores —en lugar de decrecer— si el valor de x es mayor que 1. Y ante esta situación, las sumas parciales no se aproximan a un valor determinado. Veamos su explicación: Para que esto pueda ser clarificado, examinemos el desarrollo 1 de la fracción 1−x en sus primeros términos. Tenemos que
17
LA SERIE GEOMÉTRICA
1 1−x 1 1−x 1 1−x 1 1−x
x , 1−x x2 =1+x+ , 1−x =1+
= 1 + x + x2 +
x3 , 1−x
= 1 + x + x2 + x3 +
x4 , 1−x
y así sucesivamente. Si alguien desea decir que la serie finita 1 1 + x + x2 + x3 tiene una suma igual a 1−x , entonces él está 4
x ; si él dijera que la suma de en un error por la cantidad 1−x 1 2 3 1000 la serie 1 + x + x + x + · · · + x es 1−x , entonces su error
es igual a grande.
x1001 1−x .
Si x fuera mayor que 1, este error es muy
De aquí vemos que aquel que dijera que cuando esta misma serie es continuada al infinito, es decir, 1 + x + x2 + x3 + · · · + x∞ , ∞
1 x , y si x > y que la suma es 1−x , entonces su error sería (1−x) 1, entonces el error es de hecho infinito. Al mismo tiempo, sin embargo, este mismo argumento demuestra por qué la serie 1 + x + x2 + x3 + x4 + . . . , continuada al infinito, tiene 1 una verdadera suma de 1−x , siempre que x sea una fracción menor que 1.
La misma respuesta es válida para la suma de una serie divergente en la que los signos se alternan entre + y −, que ordinariamente está dada por la misma fórmula, pero con el signo de x cambiado a negativo. Como tenemos 1 = 1 − x + x2 − x3 + x4 − x5 + . . . , 1+x si nosotros no expresáramos el residuo final, tendríamos A. 1 − 1 + 1 − 1 + 1 − 1 + · · · = 21 ,
B. 1 − 2 + 4 − 8 + 16 − 32 + · · · = 13 ,
18
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
C. 1 − 3 + 9 − 27 + 81 − 243 + · · · = 14 .
Es claro que la suma de la serie B no puede ser igual a 31 , pues conforme más términos sumamos, más se aleja el resultado de 13 . Pero la suma de cualquier serie debiera ser un límite al cual las sumas parciales tendrían que aproximarse, conforme son agregados más términos. Nótese la última formulación (subrayada por nosotros): ahí está la clave de lo que sería la solución final del problema, una vez que se pudo precisar el concepto de límite. Euler cierra su explicación de la siguiente manera: De esto concluimos que series de este tipo que son llamadas divergentes, no tienen sumas determinadas, pues las sumas parciales no se aproximan a ningún límite que pudiera ser la suma de la serie infinita. Esta es ciertamente una conclusión verdadera, dado que hemos demostrado que es erróneo despreciar el residuo final. Yo digo que la dificultad está en el nombre suma. Si, como es comúnmente el caso, tomamos la suma de una serie como el agregado de todos sus términos, tomados actualmente juntos, entonces no hay duda de que solo las series infinitas que convergen acercándose continuamente a algún valor fijo conforme más términos actualmente agregamos, pueden tener sumas. Sin embargo, las series divergentes, cuyos términos no decrecen, tanto si sus signos + o − alternan como si no, realmente no tienen sumas fijas, suponiendo que usáramos la palabra suma para el agregado de todos sus términos. Considérense aquellos casos que hemos recordado, con 1 sumas erróneas, por ejemplo la expresión finita 1−x para la 2 3 serie infinita 1 + x + x + x + . . . La verdad del asunto es esta, no que la expresión es la suma de la serie, sino que la serie se deriva de la expresión. En esta situación el nombre suma debe ser completamente omitido. ¿Qué concluimos de la opinión final de Euler sobre las series en 1755, respecto a cuál es el valor de la suma 1 − 1 + 1 − 1 + 1 − 1 + . . . ? Digamos que lo siguiente:
LA SERIE GEOMÉTRICA
19
a) Se trata de un caso particular de la serie 1−x+x2 −x3 +x4 −x5 +. . . (cuando x = 1). 1 b) Esa serie es producida por la división 1+x . c) Si en la división evaluamos x = 1 obtenemos el valor 12 . d) Eso podría hacer pensar que el valor de la suma 1 − 1 + 1 − 1 + 1 − 1 + · · · = 21 . 1 e) Pero al hacer la división 1+x , cuando x = 1 el residuo no se va haciendo despreciable por más que avancemos en ella. f) Por lo mismo, las sumas parciales de 1 − 1 + 1 − 1 + 1 − 1 + . . . no se van pegando a ningún valor. g) Entonces no se puede hablar de la suma de esa serie. Esto en medio de un mar de formulaciones confusas sobre lo infinitamente grande y lo infinitamente pequeño. Sorprendente, ¿no les parece?
1.1.5.
Su importancia para el análisis de otras series
La serie geométrica es la madre de muchas otras. Veamos algunos ejemplos: Tal y como acabamos de ver en la cita de Euler, si sustituimos (−r) en lugar de r en (1.4), obtenemos 1 = 1 + (−r) + (−r)2 + (−r)3 + (−r)4 + . . . si − 1 < (−r) < 1, 1 − (−r) ∴
1 = 1 − r + r2 − r3 + r4 + . . . si − 1 < r < 1. 1+r
(1.7)
Regresando a (1.4), si ahora colocamos en ella r2 en lugar de r, teniendo en cuenta que −1 < r < 1 ⇐⇒ r2 < 1, llegamos a que 1 = 1 + r2 + r4 + r6 . . . 1 − r2
si − 1 < r < 1.
r = r + r3 + r5 + r7 . . . 1 − r2
si − 1 < r < 1.
(1.8)
Para obtener la serie correspondiente a los exponentes impares, tan solo multiplicamos a ambos lados de la anterior por r: (1.9)
Si en lugar de haber sustituido r2 por r en (1.4) lo hubiésemos hecho en (1.7) y luego multiplicado por r, habríamos obtenido las dos siguientes: 1 = 1 − r2 + r4 − r6 . . . si − 1 < r < 1, (1.10) 1 + r2
20
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
r = r − r3 + r5 − r7 . . . 1 + r2
si − 1 < r < 1.
(1.11)
o La convergencia de la serie geométrica resulta frecuentemente una referencia para establecer nuevos criterios de convergencia generales. Veamos un par de ejemplos: ¿Qué sucede si los términos ak de una serie cumplen la condición de que para todos los valores “grandes” de k, la razón entre un término y ak+1 su anterior se pegase mucho a un valor L? Es decir, si ≈ L a partir ak de una cierta K (lo cual se formaliza trabajando con el límite). Esta es justamente la condición que define a la serie geométrica, de modo que P ello querría decir que la cola de la serie ak se comporta casi como una geométrica de razón L, y por lo tanto convergerá si −1 < L < 1 y divergirá si L < −1 o L > 1. El caso L = ±1 es un valor frontera, y aunque la geométrica en sí diverge ahí, como estamos hablando de una serie que es casi como ella pero no es ella, en el casi puede estar la diferencia entre que la serie converja o diverja: hay series para las que ocurre lo uno y series para las que ocurre lo otro, de modo que cuando L = ±1 este criterio no nos da una respuesta. Una razón similar subyace en la validez de otro conocido criterio de convergencia de series, en que se toma la raíz k-ésima de ak : si esta se parece mucho a un valor L para todos los valores grandes de k, esto significa que ak ≈ Lk a partir de una cierta K. Es decir, que una serie así también sería casi como una geométrica, y las conclusiones son las mismas que en el caso anterior.
1.2.
La serie armónica
Hemos visto ya un buen número de sumas infinitas cuyo valor resulta finito. Esto nos lleva a plantearnos la siguiente pregunta: siempre que sumemos una cantidad infinita de magnitudes que se hagan tan pequeñas como queramos, ¿el resultado será un valor finito?
1.2.1.
Las primeras pruebas
Quizás el más socorrido ejemplo de una sucesión convergente a cero es n o 1 n
. De que se hacen muy pequeñitos sus términos no debe quedarnos duda, pero ¿qué pasa si los sumamos todos? Veamos algunos valores de sumas parciales:
LA SERIE ARMÓNICA
21
Si sumamos los primeros 5 términos, la suma es ≈ 2.28. Los primeros 11, ≈ 3.02. Cuando ya llevamos sumados 83 términos, apenas hemos rebasado al 5. Si sumamos 12,367 términos logramos rebasar el 10, y si sumamos 272,400,600 términos rebasamos el 20. ¿Será posible rebasar el 100? Sí, si tenemos la paciencia de sumar 15 092 688 622 113 788 323 693 563 264 538 101 449 859 497 términos.21 Es tan, tan lento el crecimiento de las sumas parciales, que uno está tentado a pensar que con los términos que le faltan, pequeñisisisísimos, difícilmente llegará muy lejos la suma, y su convergencia a un valor ya no muy distante es cosa segura. Pues no. Resulta que en el año 1350, Nicole Oresme, que llegó a ser obispo de la ciudad de Lisieux, en Francia, probó que ∞ X 1
k=1
k
= ∞,
y su demostración es a la fecha la más comunmente utilizada en los textos de matemáticas. Su idea fue la siguiente: 1 1 + + 2 |3 {z 1 1 >1 + + + 2 |4 {z 1+
=1 +
=1 +
1 1 1 + + + 4} |5 6 {z 1 1 1 + + + 4} |8 8 {z
1 1 1 1 1 1 + + + ··· + + ··· + + +... 7 8} |9 32} {z 16} |17 {z 1 1 1 1 1 1 + +... + + + ··· + + ··· + 8 8} |16 16} |32 32} {z {z
1 1 1 1 1 + + + +... + 2 |{z} 2 2 2 2 |{z} |{z} |{z}
1 (1 + 1 + 1 + 1 + 1 + . . . ) 2
=∞. O sea que dividió todos los sumandos a partir del tercero en grupos de 2, 4, 8, 16, . . . términos, acotándolos por debajo en cada grupo por el más pequeño del mismo, de modo que al sumarlos nos resulta siempre 21 . Y como se puede formar una infinidad de grupos así, la suma se puede hacer tan grande como queramos, pues la suma de una constante positiva (en nuestro caso 12 ) una infinidad de veces resulta siempre infinito. o Tiempo después (algo así como 329 años), en 1689, Jacques Bernoulli hizo una demostración en la que también acotó por debajo la serie
22
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
deseada por otra que claramente se fuera a infinito, pero distinta a la propuesta por Oresme. Lo hizo así: 1 1 1 + + ··· + 2 > n+1 n+2 n 1 1 1 1 1 2 + + · · · + = (n − n) =1− n2 n 2 n2 n2 n ∴
1 1 1 1 + + + · · · + 2 > 1. n n+1 n+2 n
? Observen lo anterior. Nos muestra que al sumar los términos del 2◦ al llevamos en la cuenta una cantidad mayor que 1. Si luego sumamos del 5◦ al 25◦ , llevamos otro 1. Después del 26◦ al 676◦ , y acumulamos otro 1. Entre el 677◦ y el (6772 )◦ , otro 1, y así sucesivamente. Dado que se pueden formar una infinidad de grupos de términos siguiendo este procedimiento, y cada uno de ellos tiene una suma mayor que 1, la suma de todos es infinita. Bernoulli mismo comentó que esto mostraba que una serie cuyo “último término” se anula, podía resultar infinita, contra lo que él opinaba anteriormente.22 4◦ ,
o La serie de la que hemos venido hablando se conoce como serie armónica (estrictamente hablando, es una de las posibles series armónicas), porque los inversos multiplicativos de sus términos forman una progresión aritmética (ver §A.5). Se trata, junto con la geométrica, de las dos series quizás más utilizadas como referencia para criterios de convergencia y divergencia,[4] y para otros asuntos. Estudiaremos algunas de sus propiedades.
1.2.2.
Algunas propiedades
o Lo que vimos al principio, que crece en forma extraordinariamente lenta, implica que si señaláramos en la recta los valores que van asumiendo sus sumas parciales paso a paso, estos estarían muy pegaditos entre sí, y cada vez más conforme avanza hacia el infinito 12 + 31 + · · · + N1 (solo para hacernos una idea, en el intervalo [20, 100] la distancia promedio entre dos valores sucesivos de las sumas parciales es del orden de 10−41 . . . y [4]
En realidad, las que son muy utilizadas para el análisis de la convergenciadivergencia junto con la geométrica son las conocidas como series p, de las cuales la armónica es un caso particular (cuando p=1), las cuales se analizan más adelante.
23
LA SERIE ARMÓNICA
más adelante mucho menor, cada vez menor). Siempre son valores racionales (la suma de quebrados nos resulta siempre un quebrado). ¿Cuántas veces imaginamos que estos valores coincidirán con un entero, entre la infinidad de ellos que hay entre el 2 y el ∞? Sorprendentemente, ninguna, se los van saltando todos. La prueba de esta propiedad se enreda un poco y tan solo diremos que la idea consiste en argumentar que al tomar el mínimo común múltiplo de {2, 3, . . . , N }, y expresar la suma de las fracciones con ese denominador común, el numerador correspondiente por fuerza resulta impar, siendo par el denominador, y entonces el cociente (es decir, la suma parcial) nunca resulta entero. P
1 o ¿Qué imaginamos que ocurre si de la serie ∞ k=1 k sacamos todos los sumandos en cuyo denominador aparece, por ejemplo, al menos un 9?23 Hagámonos una idea de qué tantos son, en proporción a los demás. Separemos los sumandos en un primer grupo con todos aquellos cuyo denominador es de un dígito, un segundo grupo con todos los sumandos cuyo denominador es de dos dígitos, otro con los de tres, etcétera: ∞ X 1
k=1
k
=
1 1 1 + + + ··· + 1 2 9
1 1 1 + + ··· + + 10 11 99 1 1 1 + + + ··· + 100 101 999 1 1 1 + + ··· + + ··· 1000 1001 9999
¿Cuántos sumandos con un dígito no tienen ningún 9?, 8. ¿Cuántos de dos dígitos tampoco tienen ningún 9? Por cada uno de los 8 de un dígito que se quedaron, hay 9 posibilidades de introducir en el segundo lugar (de izquierda a derecha) un dígito distinto de 9. Por tanto hay 8 · 9 números de dos dígitos con ningún 9. ¿Cuántos de los de tres dígitos? Por cada uno de los de dos cifras que no tenían ningún 9, hay a su vez 9 dígitos posibles de introducir en el tercer lugar (de izquierda a derecha); es decir, 8 · 92 . Este mismo razonamiento se repite con cada aumento de un dígito. De modo que podemos decir que entre los números con k dígitos, hay 8 · 9(k−1) de ellos que se quedan. Esto es así: ∀ k ∈ N. Ahora veamos: ¿es posible dar una cota de cuánto suman las 8 fracciones con un dígito que se quedan?
24
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
1 1 1 1 1 1 + + ··· + < + + ··· + = 8 · 1 2 8 1 1 1 ¿Y una cota de los de dos cifras que se quedan?
1 . 1
1 1 1 1 1 1 1 1 1 + + ··· + + + + ··· + + ··· + + + ··· + 10 11 18 20 21 28 80 81 88 1 9 1 . =8· < (8 · 9) 10 10 Otra para los de tres cifras que se quedan: 1 1 1 1 1 1 + + ··· + + + + ··· + 100 101 108 110 111 118 1 1 1 + + ··· + + ··· + 800 801 888 2 1 9 < (8 · 92 ) . =8· 100 10 En general, tendremos que una cota para los 8 · 9k−1 términos de k (k−1) 9 cifras que se quedan es 8 · . 10 Entonces, la suma de todos los términos, con cualquier número de cifras, que se quedan, estaría acotada por ∞ X
k=1
8·
9 10
k−1
=8·
∞ X 9 k
k=0
10
,
9 que se trata de una serie geométrica con razón r = , de modo que la 10 cota finalmente sería 8·
1 10 9 = 8 · 10 − 9 = 8 · 10 = 80. 1 − 10
¿Qué obtuvimos finalmente? Que la serie armónica, quitándole todos los sumandos con al menos un 9 en ellos, resulta finita. En realidad, la cota se puede mejorar bastante. De hecho, se puede demostrar que esta suma es igual a 22.92067 (aproximación con 5 cifras decimales válidas).24 ¿Será que el número 9 es especial, o lo anterior ocurrirá si sacamos todos los términos que tienen en su denominador cualquiera otro de los dígitos? La respuesta es la segunda. La siguiente tabla indica el valor obtenido para cada uno de los 10 dígitos:25
LA SERIE ARMÓNICA
Dígito sustraído
25
Suma infinita
1 2 3 4 5 6 7 8 9 0
16.17696 19.25735 20.56987 21.32746 21.83460 22.20559 22.49347 22.72636 22.92067 23.10344
Observen que los valores de las sumas aumentan conforme vamos incrementando a partir del 1 el valor del dígito extraído, quedando el 0 al final. Además, el tamaño del aumento al pasar de uno a otro dígito es cada vez menor (al pasar por ejemplo del 1 al 2, el incremento de la suma es de 3.39804, mientras que al pasar del 9 al 0 el incremento es de 0.18277). ¿Por qué sucede lo uno y lo otro? Reflexionen... o En abril de 1954 apareció, en la revista Pi Mu Epsilon Journal, un ingenioso problema que se basaba en el uso de la serie armónica, que fue incluido años después por Martin Gardner en una popular columna de divulgación de las matemáticas en la revista Scientific American que llevaba por nombre Mathematical Games. El problema planteaba lo siguiente: Supongamos que se cuenta con una cantidad inagotable de ladrillos iguales, con masa uniformemente distribuida, ¿podemos colocar los ladrillos uno sobre otro, sobresaliendo siempre cada uno una distancia positiva sobre el anterior, de manera que abarquemos con ellos cualquier distancia, por grande que esta sea, sin que se caigan? (ver figura 1.13).
Figura 1.13
26
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Imaginemos que vamos colocando los ladrillos de arriba hacia abajo, de izquierda a derecha, con el origen de nuestro sistema de coordenadas en el borde izquierdo del primer ladrillo de acuerdo con nuestra gráfica. La idea central consiste en colocar el borde de cada nuevo ladrillo en el punto en que se encuentra el centro de masas del conjunto de ladrillos colocados previamente, arriba de él. ¿Por qué hacer esto?, porque así garantizamos que al agregar cada nuevo ladrillo no se caen los anteriores, partiendo de que siempre el último descansaría en el piso, y como la masa de los ladrillos la supusimos uniformemente distribuida, podemos considerar que el centro de masa de cada ladrillo se encuentra a la mitad del mismo (al calcular los centros de masas partiremos de que se trata de masas concentradas en un punto). Para simplificar las cosas, supondremos que la longitud de todos los ladrillos es 1. Recordemos aquí (es fácil e intuitivo de probar a partir de la ley de la palanca de Arquímedes) que el centro de masas de un sistema formado por k masas puntuales m1 , m2 , . . . mk ubicadas respectivamente a distancias x1 , x2 , . . . xk del origen de un cierto sistema de referencia (ver figura 1.14), está dado por CMk =
m1 x1 + m2 x2 + · · · + mk xk . m1 + m2 + · · · + mk
Si todas las masas son iguales entre sí, digamos con un valor m, la fórmula anterior se simplifica: CMk =
m(x1 + x2 + · · · + xk ) mx1 + mx2 + · · · + mxk = , m + m + ··· + m mk ∴
CMk =
x1 + x2 + · · · + xk . k
Figura 1.14
(1.12)
27
LA SERIE ARMÓNICA
Comencemos por bautizar las variables que utilizaremos para resolver el problema. Llamaremos xk =Distancia al origen del centro de masa del k-ésimo ladrillo. CMk =Distancia al origen del centro de masas del conjunto de los primeros k ladrillos. dn =Distancia total desplegada por un sistema de n ladrillos. Es inmediato que x1 = 21 , CM1 = 21 , dn = CMn . Observemos también que, como el centro de masa de cada ladrillo se encuentra a su mitad, y el borde del (k + 1)-ésimo ladrillo lo colocamos justo en donde está el centro de masas de los k anteriores, entonces 1 xk+1 = CMk + , ∀ k ∈ N. (1.13) 2 Obtendremos una relación que simplifica en extremo las cosas: Por (1.12), tenemos que CMk = y si k ≥ 2 =
1 (x1 + x2 + · · · + xk ) , k
x1 + x2 + · · · + xk−1 1 (k − 1) k k−1
+ xk .
Sustituyendo (1.12) y (1.13) evaluadas en (k − 1), nos lleva a que
1 1 (k − 1)CMk−1 + CMk−1 + = k 2
1 1 = k CMk−1 + , k 2
1 , ∀ k ≥ 2. (1.14) 2k Entonces, recordando que CM1 = 12 , podemos aplicar (1.14) recursivamente y vamos obteniendo el resultado final: ∴ CMk = CMk−1 +
1 CM2 = + 2 1 CM3 = + 2 .. .
1 , 4 1 1 + , 4 6
1 1 1 CMn = + + · · · + . 2 4 2n
(1.15)
28
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Así las cosas, ladrillo, se aleja una distancia el borde del n−ésimo 1 1 1 dn = CMn = 2 1 + 2 + · · · + n de nuestro punto inicial. Pero la anterior es la serie armónica, y como ya vimos, diverge a ∞ (lo cual no se ve alterado por el factor 12 ). ¿Qué nos dice esto?, que agregando suficientes ladrillos siguiendo esta regla, podemos llegar tan lejos como queramos sin que se caiga ninguno. Este problema fue popularizado después, sustituyendo en el planteamiento “ladrillos” por cartas de la baraja. Hacerlo así tiene la ventaja de que lo pueden experimentar ustedes mismos: háganlo, y con un poquito de paciencia lograrán por lo menos que la carta de hasta arriba quede “volando” por fuera del borde de una mesa. Con las 52 cartas, en teoría, llegarían a una distancia equivalente a poco más de 2 14 la longitud de una carta. En la práctica es muy difícil colocar muchas cartas como debe ser, porque muy rápidamente se hacen muy pequeñas las distancias que deben guardar los bordes entre sí (ver figura 1.15).
Figura 1.15
29
LA SERIE ARMÓNICA
1.2.3.
La serie armónica y la hipérbola y =
1 x
La sucesión { n1 } está estrechamente relacionada con la hipérbola y = x1 , lo cual es natural, pues si f (x) = x1 la evaluamos en cualquier n ∈ N, obtenemos precisamente los términos de la sucesión (ver figura 1.16).
Figura 1.16
Esta relación ofrece una alternativa sencilla para pensar en las sumas parciales de la serie armónica en términos de áreas: para cada natural n, tomamos el rectángulo en el plano que tiene como base el intervalo [n, n + 1] y como altura el valor de la función en n; es decir, n1 (ver figura 1.17).
Figura 1.17
Las áreas de los rectángulos así obtenidos son precisamente 1 · 1, 1 · P y podríamos interpretar la suma parcial nk=1 k1 como la suma de dichas áreas, desde la primera hasta la n-ésima, y la serie armónica como la suma de las áreas de la infinidad de rectángulos así construidos. Si comparamos estas áreas con el área por debajo de la curva, la diferencia entre ambas (diremos en lo sucesivo, para hacer menos pesado el lenguaje, la diferencia de áreas entre la armónica y la función) es visible para los primeros valores de n, pero conforme la n crece, como la curva se hace asintótica al eje X, se va haciendo casi horizontal, 1 1 2 , 1· 3 , . . . ,
30
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
y entonces el rectángulo circunscrito con altura n1 apenas queda por encima del valor de la función en el punto n + 1, de modo que sus áreas son casi iguales y su diferencia es imperceptible (ver figura 1.18c).
(a)
(b)
(c)
(d)
Figura 1.18
¿Converge la suma infinita de esas “áreas diferencia” (figura 1.18b)? Las figuras 1.18c y 1.18d nos dan la clave: el área a la que nos referimos es menor que la diferencia de áreas entre los rectángulos circunscritos y los inscritos. Para calcular el área de cada rectángulo circunscrito evaluamos la función en el extremo izquierdo de cada subintervalo; para obtener la del inscrito, la evaluamos en el extremo derecho (esto es así
31
LA SERIE ARMÓNICA
porque la función f (x) = x1 es decreciente). Entonces, el área a la que nos referimos sobre el intervalo [1, n] va a ser menor que
1 1 − 1 2
+
1 1 − 2 3
+
1 1 − 3 4
+ ··· +
1 1 − n n+1
=1−
1 . n+1
Al tender n → ∞ esta cota tiende a 1, de modo que la diferencia de
áreas entre la serie
n P
k=1
1 k
y la función f (x) = x1 es un valor menor que 1.
Esto que hemos hecho se puede interpretar geométricamente también así: imaginemos que cada rectangulito-diferencia entre circunscritos e inscritos es desplazado horizontalmente hacia la izquierda hasta topar con el eje Y : la suma de todas esas áreas es el área del cuadrado unitario (ver figura 1.19).
Figura 1.19
Tenemos entonces que entre la función x1 y sus rectángulos circunscritos se extiende una región infinita con área finita menor que 1. Para ser un poco más precisos, diremos que esa área mide aproximadamente 0.5772156 . . . Se trata de una de las constantes más enigmáticas de las matemáticas (ni siquiera actualmente se sabe si es racional o irracional), introducida en ellas por Euler (como tantas otras cosas), razón por la cual es conocida como la constante de Euler y representada en forma clásica con la letra gamma minúscula del alfabeto griego (γ).
1.2.4.
La constante de Euler
Imaginemos ahora que en cada natural n vamos colocando un segmento vertical que tiene por altura el área acumulada por todos los rectángulos previos a esa n (ver figura 1.20a). En n = 1 no hemos acumulado área, entonces nuestro segmento vertical tiene altura 0. En n = 2 acabamos de pasar el primer rectángulo que tiene área 1, y entonces el segmento tiene altura 1. En n = 3 el área acumulada es 1 + 21 = 32 . En n = 4 el segmento mide 1+ 12 + 31 = 1 65 . A cada paso agregamos, a la altura acumulada en el
32
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
paso anterior, el siguiente término de la serie. En el punto n + 1 la altura P es precisamente la suma parcial nk=1 k1 . ¿Qué sucede con estas alturas conforme la n avanza hacia el infinito?, que crece tanto como queramos, pues la armónica diverge al ∞. Y ¿cómo nos imaginamos el ascenso de las puntas de los extremos verticales que fuimos dibujando sobre cada natural en el eje X?, ¿muy empinado hacia arriba?, pues no, porque la armónica avanza en forma extraordinariamente lenta; de hecho, si uniéramos los extremos de los segmentos que hemos ido construyendo, generaríamos una línea poligonal casi horizontal, imperceptiblemente empinada hacia arriba conforme avanzamos (ver figura 1.20b).
(a)
(b)
Figura 1.20
¿Y qué ocurre si hacemos lo mismo con la curva? (ver figura 1.21a). Es decir, en cada natural levantamos ahora un segmento que mide el área acumulada por debajo de la curva desde x = 1 hasta ese natural. En este caso, aunque sabemos que igual vale 0 en x = 1, dado que no hemos acumulado nada de área aun, no sabríamos bien cuánto mide cada segmento en los demás naturales (desde luego, siempre menos que la armónica), porque no sabemos cómo medir exactamente esa área. Pero ¿qué pasa a la larga?, que nos irán resultando valores que crecen de forma muy similar a los de la armónica, manteniéndose por debajo de ella a una distancia casi igual a γ (ver figura 1.21b).
LA SERIE ARMÓNICA
33
(a)
(b)
Figura 1.21
1.2.5.
La armónica alternante
Dada una serie la forma
P∞
k=1 ak ∞ X
con términos no negativos (ak ≥ 0), la serie de
(−1)k ak
o
∞ X
(−1)k+1 ak
k=1
k=1
es llamada serie alternante de la original. ¿Qué esperaríamos que sucediese con la serie alternante de la armónica? ∞ X (−1)k+1
k=1
k
=1−
1 1 1 1 1 + − + − + ... 2 3 4 5 6
¿Converge o diverge? En la medida en que la armónica “apenas alcanza a diverger”, es natural pensar que si en lugar de sumar todos los términos de corrido, a cada término impar le vamos restando su sucesor y sumamos luego las diferencias obtenidas, va a resultar convergente. ¿Será? Y si es así, ¿a qué valor converge en tal caso? No haremos una prueba formal, la cual es bastante simple contando con la integral, sino que plantearemos una discusión geométrica que sugiere cuál es el resultado. Utilizando la interpretación que vimos sobre la armónica, podemos pensar en lo siguiente: ahora de lo que se trata es de restar al área
34
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
de cada uno de los rectángulos circunscritos que tienen por base los intervalos de la forma [n, n + 1] con n impar, el área del que está a su derecha. Pero el circunscrito que está a su derecha es idéntico al inscrito ubicado debajo de él mismo. Es decir, que con la armónica alternante lo que vamos haciendo es sumar las diferencias entre las áreas de los rectángulos circunscritos y los inscritos ubicadas en los intervalos con extremo izquierdo impar (figuras 1.22a y 1.22b).
(a)
(b)
Figura 1.22
Estas diferencias se pueden interpretar como el área de las franjitas que aparecen en la figura anterior. Imaginemos entonces que a todas ellas las desplazamos horizontalmente hacia la izquierda hasta topar con el eje Y (ver figura 1.23). Al hacerlo, quedan contenidas dentro del cuadrado unitario, cuya área es 1, de modo que todo hace pensar que efectivamente la serie armónica alternante resulta ser un valor finito (< 1); es decir, converge.[5] Veremos a continuación a qué valor exactamente.
[5]
La convergencia de cualquier sucesión creciente que no sobrepasa un valor fijo (en nuestro caso las sumas parciales de las áreas mencionadas que no rebasan el 1) es algo intuitivamente claro, cuya demostración formal presupone sin embargo una importante propiedad de los números reales. Esto se analiza con detalle en el capítulo 7, más específicamente en la sección §7.6.5.
35
LA SERIE ARMÓNICA
Figura 1.23 ∞ X
(−1)k+1
k=1
∞ X 1 1 1 = − k k=1 2k − 1 2k
=
=
∞ X
1 (2k − 1)2k k=1
1 1 1 1 1 + + + + + ... 1 · 2 3 · 4 5 · 6 7 · 8 9 · 10
(1.16) (1.17)
Pensemos otra vez en la gráfica de la función f (x) = x1 , pero ahora restringida al intervalo [1, 2]. Construiremos una familia de rectángulos por debajo de ella, colocándolos sin traslaparse, siguiendo el orden y procedimiento que se describe a continuación. Es recomendable que ustedes mismos hagan una gráfica y los vayan localizando y haciendo las cuentas (ver figura 1.24). Nótese, antes que nada, que si tomamos un punto pq en el intervalo [1, 2], f
p q
=
1 p q
= pq , y que el área de R = [a, b] × [c, d] está dada por
A(R) = (b − a)(d − c). Sean entonces:
1 R1 = [1, 2] × 0, , 2
A(R1 ) = 1 ·
1 1 = . 2 1·2
A(R2 ) =
1 1 1 · = . 2 6 3·4
A(R3 ) =
1 1 2 · = . 4 15 5·6
3 1 2 R2 = 1, × , , 2 2 3
R3 = 1,
5 2 4 × , , 4 3 5
3 7 1 1 1 4 1 R4 = , × , , A(R4 ) = · = . 2 4 2 7 4 14 7·8 4 8 9 × , , R5 = 1, 8 5 9
A(R5 ) =
1 1 4 · = . 8 45 9 · 10
36
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
5 11 2 8 1 1 2 R6 = , = . × , , A(R6 ) = · 4 8 3 11 8 33 11 · 12 3 13 1 4 4 8 1 R7 = , × , , A(R7 ) = · = . 2 8 7 13 8 91 13 · 14 R8 =
1 1 8 1 1 7 15 , = . × , , A(R8 ) = · 4 8 2 15 8 30 15 · 16
Figura 1.24
Los siguientes 23 rectángulos los construiríamos en los 23 espacios que quedan entre los ya construidos y la curva, de mayor a menor, de izquierda a derecha, con bases de longitud 214 . Nos sobrarían entonces 24 espacios en los cuales inscribiríamos otros tantos rectangulitos con base 215 , y así sucesivamente. Con cada nueva “tanda” de rectangulitos que construimos nos vamos pegando más y más a la curva, tanto como queramos. De este modo es esperable que la unión infinita de todos los rectángulos así generados nos cubra toda la región que cae por debajo de la curva en el intervalo [1, 2]; y siendo ajenos, que la suma infinita de sus
37
LA SERIE ARMÓNICA
áreas coincida con el área de tal región (ver figura 1.25). Pero por otro lado, si observamos los valores de las áreas que fuimos obteniendo, estos coinciden uno a uno con los sumandos de la serie armónica alternante (ver (1.17)), incluso en el mismo orden en que aparecen (se puede probar que esto sucede en general), de manera que es esperable que
Figura 1.25
∞ X
(−1)k
k=1
1 1 = área bajo la gráfica de la función sobre [1, 2]. (1.18) k x
o ¿Qué pasaría si reacomodáramos los términos de la siguiente manera? 1−
1 1 1 1 1 1 1 1 1 1 1 − + − − + − − + − − + ... 2 4 3 6 8 5 10 12 7 14 16
Este reacomodo lo podríamos expresar como ∞ X
k=1
1 1 1 . − − 2k − 1 4k − 2 4k
Pero
1 1 1 − = , 2k − 1 4k − 2 4k − 2 entonces tendríamos que lo anterior es igual a ∞ X
k=1
1 1 − 4k − 2 4k
=
∞ 1 1X , 2 k=1 (2k − 1)2k
38
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
que por (1.16) es igual a la mitad del valor de la misma armónica alternante. Es decir, que si sumamos en otro orden los términos, obtenemos un valor distinto de la misma serie que fue convergente. Esta aparente paradoja no solo no lo es, sino que Riemann demostró algo aun más sorprendente en 1854, que sin embargo, una vez que se formalizan los conceptos (el de límite en particular), es muy fácil de demostrar: que dada cualquier serie condicionalmente convergente (así se llaman las series a las que les sucede que al tomar los valores absolutos de sus términos divergen, pero sin tomarlos convergen, tal como ocurre con la armónica alternante), siempre se pueden rearreglar sus términos convenientemente para hacerla converger al valor que se desee, e incluso hacerla diverger a ±∞. La posibilidad de reagrupar como queramos los términos de una suma sin que se altere el resultado (la conmutatividad y la asociatividad) son propiedades válidas para las sumas finitas, pero no siempre para las sumas infinitas. Cuando aparece el infinito en escena las cosas cambian, las reglas cambian. En el caso específico de los rearreglos mencionados, Dirichlet probó en 1837, que cuando la serie de valores absolutos converge, entonces son válidos los rearreglos que sea y el resultado no se altera nunca. Esa es, por ejemplo, una regla que impone el infinito a las sumas de números.
1.2.6.
Las series p
¿Y qué hay de lo que decíamos al principio sobre la utilidad de la serie armónica como punto de referencia para la divergencia o convergencia de otras series? Cuando veamos las propiedades de los números reales, veremos que si 0 < x < 1 =⇒ 0 < xp < x ∀ p > 1, y 0 < x < xp ∀ 0 < p < 1. Los números de la forma x = n1 a partir de n = 2 cumplen con ser siempre menores que la unidad, y por lo tanto tendremos que 1 1 < , si p > 1, n ≥ 2, p n n y 1 1 ≥ , si 0 < p ≤ 1, n ≥ 1. p n n Cuando una serie diverge al infinito, es natural pensar que cualquier otra cuyos términos sean mayores que los suyos, también habrá de diverger al infinito. De modo que en el segundo caso de los mencionados, P 1 la serie ∞ k=1 np se irá a ∞.
39
LA SERIE ARMÓNICA
Sin embargo, si una serie diverge al infinito y tenemos otra con términos menores que los suyos, no es claro si diverge o converge, de modo que P 1 en el primer caso de los señalados no sabemos qué ocurre con ∞ k=1 np . Resolvamos esto: 1+
1 1 1 1 1 1 1 1 + p + p + p + p + p + p + ··· + p +... p 5 {z 6 7 } |8 |2 {z 3 } |4 {z 15 }
Si acotamos por el más grande de los sumandos en cada grupo 1,
(1.19)
0 < p ≤ 1.
(1.20)
Quizás al seguir todo el desarrollo anterior, al ver np pensaban implícitamente que p era un entero. Sin embargo, lo anterior es igualmente válido si p es cualquier número real. Claro que para aceptar esto primero tendríamos que aclararnos qué significa, por ejemplo, elevar el número
40
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES √
5 a la raíz de dos: 5 2 . Porque es claro qué significa elevar un número m x a un exponente racional x n , por lo menos intuitivamente: se trata de encontrar el número que multiplicado por sí mismo n veces resulte x, y luego ese número multiplicarlo por sí mismo m veces; podrá ser difícil y laborioso de encontrar (por lo general lo más que podemos hacer es obtener aproximaciones a él), pero es comprensible qué es. Pero ¿qué es, conceptualmente hablando, x elevado a un número irracional? La idea consiste en tomar sucesiones de números racionales que se acerquen tanto como queramos al irracional (del exponente), calcular el valor de x elevada a esos exponentes racionales y observar la tendencia de los valores resultantes. Por supuesto estamos hablando de límite. En su momento se verá, y para entonces recuerden que la propiedad de las series p (así se les conoce) que ya vimos, se cumple en general para p real. Así las cosas, observen que (1.19) significa, por ejemplo, que ∞ X
k=1
es finita, no obstante que
1 n1.0000000000000000001
(1.21)
∞ X 1
k=1
n
es infinita. Es decir, (1.19) y (1.20) plantean que la armónica es una especie de frontera entre la divergencia y la convergencia de las series de la forma P∞ 1 k=1 np . Es pertinente aclarar, sin embargo, que esto no significa que cualquier serie cuyos términos estén por debajo de los de la armónica converge. Esta propiedad se refiere tan solo a las series de la forma discutida. De hecho, se pueden proponer múltiples series que van por debajo de la armónica y también divergen (y por lo tanto caen por arriba de todas las del tipo (1.21), por mucho que peguemos el exponente a 1). Es el caso de las series del tipo ∞ X
1 , ∀ 0 ≤ p ≤ 1. n(log(n))p n=2
(1.22)
Es decir, la armónica diverge muy lentamente, pero no es la que diverge más lentamente. Y es que en realidad no existe una serie de la que se pueda decir que es la que diverge más lentamente de todas, ni tampoco la que diverge más rápidamente de todas: para cualquier
41
LA SERIE ARMÓNICA
rapidez de divergencia siempre hay una que diverge más lentamente que ella, y otra que lo hace más rápidamente. Y algo análogo ocurre para la convergencia. Esto está relacionado con la investigación sobre la rapidez de crecimiento de las funciones desarrollada por Paul Du Bois-Reymond y otros más a partir de 1870.
1.2.7.
La trompeta de Torricelli
En 1643, el físico y matemático italiano Evangelista Torricelli mostró algo que sorprendió a propios y extraños. Giró la hipérbola y = x1 alrededor del eje X, a partir del valor x = 1, y procedió a calcular el volumen del sólido contenido en el interior de la superficie T generada por este giro de la curva (ver figura 1.26). Utilicemos lo que hemos hecho para ver —y probar— lo que descubrió Torricelli. Cuando hablemos del volumen de T , nos estaremos refiriendo al sólido contenido en su interior.
Figura 1.26: La trompeta de Torricelli.
Si tomamos los rectángulos cirscunscritos a la curva x1 construidos con base en cada intervalo [k, k + 1] y los giramos junto con la curva, generaremos con ello una infinidad de cilindros circunscritos a T , cuya suma de volúmenes excede su volumen (ver figura 1.27a). ¿Cuál es el volumen del k-ésimo cilindro Ck ? (ver figura 1.27b). Su altura es 1 y su radio es k1 , ∴ V (Ck ) = π V (T )
1, que, como vimos en (1.19), converge. De modo que un sólido con longitud infinita resultaba que tenía volumen finito. Y ahora podemos agregar algo más. El corte de la trompeta
42
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
(a) Cilindros generados por los rectángulos circunscritos.
(b) k-ésimo cilindro.
Figura 1.27
que queda estampado en el plano XY es precisamente la región que corre por debajo de la gráfica de x1 , duplicada, pues contiene también su reflejo hacia abajo del eje X (ver figura 1.28a). De modo que el área de la región H contenida entre ellas es infinita. La superficie de T la podemos imaginar como la región plana H estirada (o inflada) hacia arriba y hacia abajo del plano XY , de modo que el área de T es mayor que la de H, y por lo tanto infinita (ver figura 1.28b).
(a) Corte de T . (b) Área (H) 1? Dividamos el nuevo intervalo en el mismo número n de subintervalos que el anterior, y llamemos x00 = a, x01 , x02 , . . . x0k−1 , x0k , . . . x0n = ab a los puntos de división correspondientes (ver figura 1.36). En este caso, (x0k − x0k−1 ) = ab−a n ∀ k = 1, 2, . . . , n. ab−a 0 Además, xk = a + k n . Entonces S 0n =
n X 1
k=1
x0k
(x0k − x0k−1 ) =
n X 1 ab − a
k=1
x0k
n
.
(1.36)
58
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Figura 1.36
Pero observemos lo siguiente (ver figura 1.37): x0k = a + k
b−1 ab − a =a 1+k n n
= a · xk ,
∀ k = 1, 2, . . . n.
(1.37)
Figura 1.37
Si sustituimos en (1.36) y comparamos con (1.35) tenemos que S 0n =
n X 1 ab − a
k=1
axk
n
=
n aX 1 b−1 = S n. a k=1 xk n
(1.38)
¿Qué pasó?, que la aproximación al área bajo la gráfica de x1 en el intervalo [1, b] vale lo mismo que la correspondiente aproximación en el intervalo [a, ab]. Lo interesante es que esto sucede para toda n ∈ N; es decir, no importa qué tan próximos estemos a la curva con los rectángulos inscritos. Esto implica que el área por debajo de la gráfica de la función 1 x es idéntica sobre un intervalo [1, b] que sobre un intervalo [a, ab]. Pero vayamos más lejos. Si tomamos el área sobre todo el intervalo [1, ab], esta la podemos dividir en dos partes: desde 1 hasta a, y desde a
DONDE NO PARECÍA ESTAR. . . PERO ESTABA EL INFINITO
59
hasta ab. Pero la segunda es, por lo que acabamos de ver, igual al área desde 1 hasta b. Entonces llegamos a una conclusión que es relevante: La función
1 x
tiene la propiedad de que el área bajo su gráfica, desde 1 hasta ab, es idéntica al área desde 1 hasta a más el área desde 1 hasta b,
que en el lenguaje de las integrales significa que Z
1
ab
1 dx = x
Z
a
1
1 dx + x
Z
b
1
1 dx x
(1.39)
Ahora bien. Imaginen que pensamos en la función área acumulada bajo la gráfica de x1 a partir de x = 1 (de hecho ya hablamos de ello en la sección §1.2). ¿A qué nos referimos? No es lo mismo calcular el área desde 1 hasta 2, que desde 1 hasta 3. A mayor valor del extremo derecho del intervalo, mayor el área. De hecho, para cada x > 1 (en realidad, el análisis se extiende luego a los valores 0 < x < 1, pero ya no lo haremos aquí), el valor del área desde 1 hasta x es distinta: por eso decimos que con el área acumulada generamos una nueva función. Supongamos que le damos el nombre de L a esa nueva función. Si hablamos en términos de integral, estamos definiendo L(x) =
Z
1
x
1 dt. t
(Escribimos 1t dt, en lugar de x1 dx, porque con x estamos ahora indicando el tope de variación de la variable, y resultaría una descripción ambigua —carente de sentido si se es estricto— decir que “x varía desde 1 hasta x”; esto se arregla simplemente llamando de otra manera a la variable dentro de la integral, que aquí representamos con la letra t). ¿Qué nos dice entonces (1.39)?, que L(ab) = L(a) + L(b).
(1.40)
En 1544, el monje luterano alemán Michael Stifel (que años antes había hecho la profecía de que el mundo se acabaría el 18 de octubre de 1533, y los campesinos de su aldea (Holzdorf), confiando en su pastor, vendieron todas sus pertenencias... y llegó el fatídico día, en que no se terminó el mundo, pero Stifel fue llevado a la cárcel de Wittenberg...),27
60
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
publicó un trabajo que llevó el nombre de Arithmetica integra, en el cual aparece una tabla como la siguiente:28 ...
-3
-2
-1
0
1
2
3
4
5
6
7
8
...
...
1 8
1 4
1 2
1
2
4
8
16
32
64
128
256
...
Supongan que ustedes quieren multiplicar 8 · 32, buscan el 8 y el 32 en el renglón de abajo, miran cuáles son los valores correspondientes a cada uno de ellos en el renglón de arriba (3 y 5), y suman esos valores: 3+5=8. Buscan en el renglón superior el 8, y entonces observan el valor correspondiente a él en el renglón de abajo: 256. Han obtenido: 8 · 32 = 256. Es decir, que por medio de esta tabla podemos multiplicar dos números a través de realizar una suma: transforma la operación de multiplicar en la operación de sumar, mucho más sencilla. El detalle es que lo anterior es válido siempre y cuando los números que queramos multiplicar aparezcan en el renglón inferior de la tabla. Si quisiéramos multiplicar, por ejemplo, 49 · 217, la tabla no nos sirve. Para poder multiplicar dos números cualesquiera (dentro de un cierto rango), necesitaríamos una tabla en la que en el renglón inferior fueran apareciendo uno tras otro todos los naturales, con el valor asociado a cada uno de ellos en el renglón de arriba que permita aplicarles a todos el procedimiento ideado por Stifel para los de su tabla. ¿Cuál es la relación entre los números del renglón de arriba y los de abajo? Los de abajo son las potencias en base 2 de los de arriba. O dicho al revés: los de arriba son los exponentes a los que hay que elevar el 2 (la base) para obtener los de abajo. Se trata de lo que fue bautizado con el nombre de logaritmos (base 2 en este caso). El reto entonces sería, si quisiéramos contar con una tabla que simplificara de esta manera la obtención de multiplicaciones —y divisiones— (suficientemente engorrosas cuando se trata de números muy grandes), saber a qué número tendríamos que elevar el 2 para que resulte 3, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 17, 18, . . . , y todos los demás números que faltan. Es la idea básica de lo que se llama una tabla de logaritmos base 2. Trasládense al siglo xvi. Están ustedes registrando cantidad de datos como resultado de las observaciones de las posiciones de los planetas y las estrellas (desde observatorios construidos para ese fin, pero a puro ojo, pues el primer telescopio que se tiene registrado en la historia data
DONDE NO PARECÍA ESTAR. . . PERO ESTABA EL INFINITO
61
del año 1609 —Tycho Brahe murió en 1601—). Necesitan hacer, una y otra vez, interminables cuentas. ¡Qué alivio sería contar con un dispositivo que simplificara semejante trabajo! Si se contara con una tabla de logaritmos —que no tendría que ser en base 2 como esa pequeña muestra que apareció en el trabajo de Stifel, podría ser en cualquier base—, sería una ayuda enorme. El problema es que la obtención del exponente al que tienen que elevar la base que escojan para obtener un número natural, es en sí mismo un enorme trabajo, pues lo tienen que hacer por aproximaciones “a pie”; y eso, para cada número. Sí, pero ese trabajo hay que hacerlo solo una vez. El problema es quién se autopropone para semejante faena. Y se autopropuso un barón escocés que vivió de 1550 a 1617, John Napier, precisamente con el objetivo de facilitar los cálculos astronómicos. Le tomó 20 años de vida elaborar su tabla de logaritmos. Cuenta la historia,29 que en una ocasión uno de sus siervos le estaba robando. Para descubrirlo, hizo pasar a toda la servidumbre por un cuarto oscuro en donde debían acariciar uno tras otro un gallo psíquico que él tenía y que le revelaría quién había sido el ladrón. Previamente, Napier había untado con hollín las plumas del gallo. El ladrón fue el único que salió con las manos limpias. La base que escogió Napier para sus logaritmos tiene una cierta relación con lo que después resultaría ser el número e, aunque en realidad su construcción se guiaba por una idea distinta a la de obtener los exponentes a los que habría que elevar la base para obtener cada número (esto se desarrolló hasta el siglo xviii). Hacia 1594 había alcanzado ciertos avances, los cuales los envió a Tycho Brahe para su aprobación.30 Su tabla de logaritmos fue finalmente publicada en 1614. En 1619, habiendo ya muerto Napier, fue publicado otro trabajo suyo en el que describe la técnica que siguió para calcular sus logaritmos. ¿Cuál es la propiedad clave de los logaritmos, la que permite la simplificación de las multiplicaciones (y después, con base en esto mismo, de las divisiones)? Que el logaritmo del producto de dos números es igual a la suma de los logaritmos; es decir, lo que señala (1.40). ¿Qué fue lo que obtuvimos entonces? Que el área debajo de la función x1 se comporta como una función logaritmo. Esto es algo de lo que se dieron cuenta el belga Grégoire de Saint Vincent (en 1647), su discípulo también belga Alfonso Antonio de Sarasa (en 1649) y el mismo Newton (en 1665), aunque este último por un camino distinto que los anteriores.31
62
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
¿Hay otras funciones que cumplan esa misma propiedad? Las de la forma xc , con c una constante positiva; o sea, esencialmente iguales a ella. Escoger una c u otra, en el fondo corresponde a tomar una base diferente para el logaritmo. El caso más sencillo, más natural, es tomar c = 1. Hasta tiempo después se descubrió que eso equivalía a tomar al número e como la base del logaritmo. De modo que log(x) =
Z
x
1
1 dt. t
(1.41)
¿Y qué relación hay entonces entre la gráfica de la función 1t y log(x)? Tomemos una misma x en el dominio en ambas gráficas. El área acumulada bajo la primera desde 1 hasta x, como número real, coincide con lo que levanta la segunda en x (ver figura 1.38).
Figura 1.38: La relación entre la gráfica de
1 t
y la del log(x).
Si recordamos los comentarios que hicimos en la sección §1.2 de la relación entre la serie armónica y el área por debajo de la función x1 , sabemos ahora que la función área acumulada de la que hablábamos allá es precisamente la función logaritmo: que tiende a ∞ cuando x → ∞, pero muy lentamente; y que se mantiene todo el tiempo a una distancia de la armónica que a la larga es igual a la constante de Euler γ (ver gráficas 1.21a y 1.21b). Y por otra parte, el resultado (1.18), quedaría ahora formulado así: ∞ X
k=1
k1
(−1)
k
=
Z
1
2
1 dx = log(2). x
(1.42)
DONDE NO PARECÍA ESTAR. . . PERO ESTABA EL INFINITO
1.4.2.
63
La tangente a la gráfica de una función. . . y la derivada
Sea f : (a, b) → R, x0 ∈ (a, b). Nuestro asunto ahora es encontrar la recta tangente a la gráfica de f en (x0 , f (x0 )). Como sabemos que pasa por (x0 , f (x0 )), el problema se reduce a calcular su pendiente. Para ello necesitamos conocer dos puntos que pertenezcan a la recta (o su ángulo de inclinación). Aquí solo tenemos uno, pero contamos con otra cosa: el valor de la función en todos los puntos de su dominio. La cuestión es entonces descubrir cómo utilizar esta información para obtener la pendiente. Si tomáramos (x0 , f (x0 )), e incrementáramos el valor de la variable en una magnitud “pequeña” ∆x, el punto (x, f (x))= (x0 + ∆x, f (x0 + ∆x)) estaría cerca de (x0 , f (x0 )). La recta que los une no es la recta tangente, sino una recta secante (ver figura 1.39). Su pendiente, cuyo valor es diferente para cada x, sería msec (x) =
f (x0 + ∆x) − f (x0 ) . ∆x
(a)
(1.43)
(b)
(c)
Figura 1.39
64
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Si a (x0 , f (x0 )) lo dejamos fijo, y vamos haciendo más pequeño el valor de ∆x, el punto (x, f (x)) se mueve hacia él, la secante se pega más a la tangente, y su pendiente se acerca más al valor buscado. Pero tomar solo un número finito de aproximaciones equivale a detenernos en un punto, que aunque esté muy próximo a (x0 , f (x0 )), la pendiente correspondiente aún no sería la que buscamos. Si decidimos saltar directamente hasta (x0 , f (x0 )) para “acabar de una vez”, perdemos toda la información, pues al sustituir ∆x = 0 en (1.43), nos queda 00 , que no significa nada, es lo que se llama una indeterminación: el que se desespera pierde. Nuestra opción es mantenernos todo el tiempo en movimiento hacia (x0 , f (x0 )), y analizar la tendencia de la msec (x) correspondiente; es decir, tomar el límite de esta expresión cuando x → x0 . La pendiente de la tangente se obtiene a través de introducir un proceso infinito de aproximaciones con las secantes, pues sus pendientes sí las podemos calcular directamente con la información que tenemos de la función (figura 1.40). Otra vez el infinito, otra vez el límite.
Figura 1.40
? ¿Cuál es la lógica del cociente que aparece en (1.43)? En el denominador se encuentra el incremento de la variable, y en el numerador el incremento de la función que corresponde al incremento de la variable considerado. El cociente mide entonces la razón de cambio entre los valores de la función y los de la variable. Si el cociente es grande significa que la función aumenta mucho sus valores con relación a los de la variable (la recta secante a su gráfica está muy empinada); si el cociente
DONDE NO PARECÍA ESTAR. . . PERO ESTABA EL INFINITO
65
es muy chico significa que la función casi no crece comparada con la variable (la recta secante a su gráfica es muy horizontal). Si la función fuese la distancia que recorre una partícula, y la variable el tiempo que tarda en hacerlo, estaríamos calculando valores próximos a la velocidad de desplazamiento en torno a un momento determinado. Y al tomar el límite estamos definiendo la velocidad de la partícula en ese instante (la pendiente de la tangente a la gráfica, ya no de sus secantes). Pero ¿qué es entonces la velocidad instantánea, si por velocidad entendemos distancia recorrida entre tiempo transcurrido, y en un instante no transcurre tiempo ni se recorre distancia alguna? Decir que la velocidad instantánea es, digamos, de v metros sobre segundo, significa decir que si durante una unidad de tiempo (en nuestro caso, un segundo) la partícula se mantiene desplazándose a la misma velocidad que en ese instante (entendida como el límite mencionado), avanzará v metros. O si se quiere, que si a partir de ese instante se mantiene todo el tiempo moviéndose a esa misma velocidad y recorrerá v metros por cada segundo que transcurra. o El límite de (1.43) cuando ∆x → 0 es lo que se define como la derivada de la función f en el punto x0 : Def.
f 0 (x0 ) =
f (x0 + ∆x) − f (x0 ) . ∆x→0 ∆x l´ım
(1.44)
Si llamamos x = x0 + ∆x, tenemos que ∆x → 0 ⇐⇒ x → x0 . Y entonces (1.44) puede también formularse así f 0 (x0 ) = l´ım
x→x0
f (x) − f (x0 ) . x − x0
(1.45)
Así que (1.44) y (1.45) son dos formas de decir exactamente lo mismo. A veces es más práctico hacerlo de una manera, a veces de la otra. Lo que hicimos para pasar de una a otra es lo que se llama un cambio de variable. o Observen entonces que la derivada conduce siempre a un límite de los que posiblemente en el bachillerato conocieron como “indeterminados”, refiriéndose con ello a aquellos límites en donde la sustitución directa en la función (en nuestro caso no en la f , sino en la msec (x)) del valor al cual estamos haciendo tender la variable (∆x = 0 si usamos (1.44), o x = x0 si usamos (1.45)), produce una indeterminación ( 00 ). De modo que los tales límites indeterminados no sólo no son “la excepción”,
66
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
o ejemplos “patológicos” del concepto de límite, sino la razón misma de su existencia. o Hay casos en que la solución de la indeterminación es fácil, pues un pequeño truco algebraico permite igualar la función msec (x) con otra en la que la simple sustitución del valor al que hacemos tender la variable sí es posible para obtener el límite (gracias a que esa otra es continua). Pero en la mayoría de los casos esto no ocurre. Veremos primero un ejemplo en que sí, y luego otro en que las cosas resultan más complicadas (y a la vez, más interesantes). Ejemplo 1.4. Obtener la pendiente de la recta tangente a la gráfica de la función f (x) = x2 en el punto x0 = 2. Solución. Si lo hacemos utilizando (1.45), tendremos que f 0 (2)=l´ımx→2 x−2 , donde si evaluamos x = 2 se obtiene una indeterminación, como ya mencionamos antes. Sin embargo como x2 −4
x2 − 4 (x − 2)(x + 2) = = x + 2, (1.46) x−2 x−2 y con la función de la derecha ya es fácil ver que cuando x → 2 la función tiende a 4, entonces resulta f 0 (2) = 4. ¿Qué significa geométricamente esto que hemos obtenido? Que si tomamos la recta tangente a la parábola x2 en el punto de su gráfica (2, 4), su pendiente será 4 (ver figura 1.41).
Figura 1.41
Sobre (1.46), haremos dos comentarios: Primero, llamar la atención sobre lo siguiente: ¿Qué significa la igualdad entre la función del principio y la del final? Antes que nada, obser2 −4 , pero sí al de x + 2. vemos que x = 2 no pertenece al dominio de xx−2
DONDE NO PARECÍA ESTAR. . . PERO ESTABA EL INFINITO
67
Salvo por eso, lo obtenido nos dice que en todos los demás números 2 −4 reales, las dos funciones son idénticas entre sí. O sea que xx−2 acabó siendo, digamos, una forma rebuscada de referirnos a la sencilla función x + 2, solo que quitándole un punto de su dominio (x = 2) (ver figura 1.42).
(a) Gráfica de msec (x) =
x2 − 4 . x−2
(b) Gráfica de x + 2.
Figura 1.42
o El segundo comentario es que probablemente pase por nuestra cabeza la pregunta: ¿Por qué en el caso de funciones como la que resultó al final en (1.46), es decir x + 2, para obtener su límite lo único que hay que hacer es sustituir x = x0 en la función y ya? Porque así está fácil esto de calcular el límite... Es decir, ¿cuándo y por qué sucede que l´ımx→x0 f (x) = f (x0 )? Este asunto tiene que ver con la continuidad. La idea intuitiva de una función continua en un punto es simple: se trata de una función definida en ese punto y cuya gráfica no se rompe al pasar por él. La idea de límite es que al acercarnos al punto con elementos del dominio distintos de él, independientemente de cómo lo hagamos, los valores de la función siempre tienden (se acercan tanto como se quiera) a un mismo valor, que es precisamente el límite en cuestión. Si la gráfica no se rompe y está definida en el punto, al acercarnos a él la función tiende precisamente a su propio valor en él. Es decir, que cuando lo que tenemos que hacer es calcular el límite de una función continua, solo hay que evaluar la función en el punto. El detalle es que para aplicar el criterio anterior, formalmente hablando, primero hay que garantizar la continuidad de la función, lo cual
68
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
se hace precisamente verificando que el límite sea igual al valor de la función en el punto. Claro que una vez que ha sido demostrado que grandes familias de funciones (como las lineales, los polinomios y muchas otras de las que iremos hablando conforme vayamos avanzando) son continuas en todo su dominio; en lo sucesivo su límite lo obtendremos simplemente evaluándolas en el punto que interese. Esto muestra el enorme valor de demostrar resultados generales: se simplifican infinidad de cuestiones particulares. o La derivada de una función en un punto es un número real, como hemos visto en el ejemplo anterior. Pero calculada en todo número real nos genera una nueva función, cuyo valor en cada punto coincide con la pendiente de la recta tangente a la gráfica de la función original en dicho punto. Veámoslo con el mismo ejemplo considerado antes. Ejemplo 1.5. Obtener la función derivada de f (x) = x2 sobre todos los números reales. Solución. Lo haremos ahora utilizando (1.44). Tomamos una x ∈ R arbitraria, lo que quiere decir que lo que digamos para ella vale para cualquiera. No podemos aplicar razonamientos que dependan de que su valor sea uno pero no otro. Entonces: (x2 + 2x∆x + (∆x)2 ) − x2 (x + ∆x)2 − x2 = l´ım ∆x→0 ∆x→0 ∆x ∆x = l´ım (2x + ∆x) = 2x.
f 0 (x) = l´ım
∆x→0
Nótese que aquí x no era la variable que se mueve en el límite (es decir, x fue tomada arbitraria, pero está fija), sino ∆x. ¿Y qué significa geométricamente que la derivada de la función x2 sea la función 2x? Se trata de dos gráficas. Tomamos un mismo punto x en el dominio de ambas. Lo que levanta la gráfica de la segunda en él, como número real, es lo que mide la pendiente de la tangente a la primera en el punto correspondiente (ver figura 1.43). El resultado del ejemplo 1.4 se desprende de este tan solo evaluando f 0 en el punto deseado: f 0 (2) = 2(2) = 4. Hacia el Teorema Fundamental del Cálculo o Ahora veremos otro ejemplo en el que encontrar la función derivada no resulta tan simple como en el anterior, y que nos dará pie para comentar uno de los resultados más relevantes del cálculo.
DONDE NO PARECÍA ESTAR. . . PERO ESTABA EL INFINITO
69
Figura 1.43: La relación entre la gráfica de x2 y 2x.
Ejemplo 1.6. Obtener la función derivada de f (x) = log(x), partiendo de la definición dada en (1.41), ∀ x ≥ 1. Solución. Necesitamos ver qué ocurre cuando ∆x → 0 con log(x + ∆x) − log(x) = ∆x
Z
x+∆x
1
1 dt − t ∆x
Z
1
x
1 dt t
.
(1.47)
El numerador de la expresión anterior corresponde a tomar el área bajo la gráfica de 1t desde 1 hasta x + ∆x, y restarle el área desde 1 hasta x, que equivale a tomar el área desde x hasta x + ∆x; es decir, R x+∆x 1 x t dt (ver figura 1.44).
Figura 1.44
70
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Pensemos entonces en dicha área. Si ∆x es muy pequeña, el área del rectángulo circunscrito a la gráfica de 1t sobre el intervalito [x, x + ∆x] se parece mucho (y cada vez más conforme hacemos ∆x más pequeña) al área bajo la gráfica en ese mismo intervalo (ver figura 1.45). Pero el rectángulo tiene por área ∆x · x1 .
Figura 1.45
Entonces, tenemos que Z
1
x+∆x
1 dt − t ∆x
Z
x
1
1 dt t
=
Z
x+∆x
x
∆x
1 dt t
≈
∆x · x1 1 = . ∆x x
(1.48)
¿Qué pasó?, que teníamos una función (f (t) = 1t ), la integramos (calculamos el área acumulada bajo su gráfica desde 1 hasta cualquier valor real x ≥ 1) y luego la derivamos (calculamos la pendiente de su tangente en cualquier punto); ¡y regresamos a la función original! Es decir que integrar y derivar (al menos en ese orden) resultan operaciones inversas por lo menos para esa función. o Aprovechando que ya obtuvimos la función derivada de x2 , integremos ahora esta función en un intervalo [0, x] general, a ver si haciendo las cosas en este otro orden se regresa también a la función original. Ejemplo 1.7. Obtener
Rx 0
2t dt.
DONDE NO PARECÍA ESTAR. . . PERO ESTABA EL INFINITO
71
Solución. Nuestra referencia es calcular el área por debajo de la función en el intervalo señalado. No olvidar que aunque la x fue tomada arbitrariamente, en todo el análisis que sigue permanece fija. Dividimos [0, x] en n partes iguales, de tamaño nx cada una. Llamemos x0 = 0, x1 = 1 · nx , x2 = 2 · nx , . . . , xk = k · nx , . . . , xn = n · nx = x, a los puntos de división de los subintervalos. Nos aproximaremos al área con los rectángulos circunscritos (el análisis con los inscritos es similar). Como la función es creciente, alcanza su máximo valor en cada subintervalo en su extremo derecho; es decir, en el punto xk = k( nx ) ⇒ que el área del k-ésimo rectángulo circunscrito está dada por nx · f (xk ) = nx · 2 · xk = nx · 2 · k( nx ). Entonces, por (1.24), x2 Sn = 2 n2
!
n X
x2 k=2 n2 k=1
!
n(n + 1) 2
2
=x
1 . 1+ n
(1.49)
Si hacemos el desarrollo correspondiente para las sumas inferiores, llegaremos a que 1 . (1.50) S n = x2 1 − n Con ambas expresiones nos aproximamos tanto como queramos a x2 , haciendo las n’s suficientemente grandes, de modo que Z
x
2t dt = x2 .
0
o Hagamos un recuento de lo ocurrido con los últimos ejemplos: 1 ) Si la función x1 la integramos y luego la derivamos, regresamos a la función original. 2 ) Si la función x2 la derivamos y luego la integramos, regresamos a la función original. ¿Qué habría pasado si hubiésemos derivado la primera función primero y luego integrado?, ¿y si la segunda primero la hubiéramos integrado y luego derivado?, que en ambos casos también habríamos regresado a la función original (ejercicio 12). Esta doble propiedad, que establece que en el orden que sea, derivar e integrar resultan ser procesos inversos, constituye uno de los resultados más importantes del cálculo, y recibe el nombre de Teorema Fundamental del Cálculo. Se cumple no solo para los dos ejemplos vistos, sino para una amplísima gama de funciones (que satisfacen ciertas hipótesis).
72
1.5.
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
La importancia de formalizar las pruebas
¿Cómo podemos medir la longitud de una curva? Veamos un caso sencillo. Ejemplo 1.8. Calcular la longitud de la gráfica de la función f (x) = x definida en [0, 1]. Solución. Aunque en este caso se puede obtener el resultado de manera muy simple, pues se trata de un segmento de recta, seguiremos un procedimiento que pudiera servir de base para ejemplos más complicados, análogo al que utilizamos para calcular el área bajo una curva (llamaremos curva a la gráfica de la función, aunque esté “derecha”; es decir, que sea recta). Dividimos [0, 1] en n subintervalos iguales, de tamaño n1 . Sean x0 = 0, x1 = 1 · n1 , x2 = 2 · n1 , . . . xk = k · n1 , . . . , xn = n · n1 = 1 los extremos de los intervalos. Obtendremos los rectángulos inscritos, pero en lugar de calcular su área, mediremos la longitud de la poligonal que forman sus segmentos superiores pegándose a la curva. Si la n es muy grande, la poligonal la podemos meter en una franjita alrededor de la gráfica de la función, tan delgada como se desee, de manera que es esperable que al estar tan pegada a ella sus longitudes se vayan pareciendo cada vez más (ver figura 1.46).
Figura 1.46
Dada cualquier n, la poligonal consta de n segmentos horizontales y n segmentos verticales. Su longitud total es la suma de las longitudes de unos y de otros. Pero ¿cuánto suman los segmentos horizontales? Observen que el valor de cada uno es n1 , y como son n, la suma vale
LA IMPORTANCIA DE FORMALIZAR LAS PRUEBAS
73
n· n1 = 1; es decir, la suma de las longitudes de los segmentos horizontales siempre vale 1, en realidad no depende de n. Y si nos fijamos en los verticales, sucede lo mismo (ver figura 1.47). O sea, que la poligonal mide 2, sea tan fina como sea la división que tomemos, nos peguemos tanto como queramos a la curva con ella.
Figura 1.47
¿Y cuál es la longitud de la gráfica de f (x) = x?, se trata de la hipotenusa del triángulo √ rectángulo√ con ambos catetos igual a 1, así es que su longitud es 12 + 12 = 2. Es decir que no es verdad que pegando tanto como queramos la poligonal a la curva, la longitud de una se acerca a la longitud de la otra. A veces la intuición engaña. o ¿Cuál es la moraleja que intentamos sacar de todo esto? Que el análisis geométrico y los razonamientos intuitivos son de un gran valor para comprender los conceptos, resultados y procedimientos matemáticos, y que constituyen una invaluable fuente de ideas nuevas. Pero no bastan, se requiere precisar bien los conceptos, las condiciones específicas bajo las cuales son válidos los resultados y las pruebas formales correspondientes. Quizás sea pertinente citar aquí un comentario de B. Russell: [. . . ] dedicarse a probar proposiciones evidentes por sí mismas puede parecer, al no iniciado, una ocupación algo frívola
74
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
[. . . ] Pero . . . desde que la gente ha empezado a tratar de probar proposiciones obvias, se han encontrado con que muchas de ellas eran falsas. La evidencia por sí misma es a menudo un mero espejismo que nos ha de extraviar si la tomamos como guía [. . . ] Uno de los méritos de la prueba es que infunde una cierta duda de lo probado; y cuando lo que es obvio puede probarse en algunos casos y no en otros, se hace posible suponer que en estos era falso [. . . ].32 Sin olvidar algo que queda recogido en otro comentario, este de H. Poincaré: [. . . ] la ciencia de demostración no es toda la ciencia [. . . ] la lógica y la intuición tiene cada una su necesario rol. Ambas son indispensables [. . . ].33
1.6.
Ejercicios
1. ¿A qué valor converge la suma de las áreas de los triángulos oscuros de la figura 1.48, si el área del triángulo inicial es 1?
Figura 1.48
2. ¿A qué valor converge la suma de las áreas oscuras de los polígonos inscritos en cada una de las siguientes figuras, si el área de la figura inicial en cada caso es 1? (ver figuras 1.49) ¿Se les ocurre una fórmula en general válida para un polígono regular de n lados? ¿Cuál es el límite del valor que obtuvieron cuando n → ∞? ¿Qué interpretación geométrica darían a ello?
75
EJERCICIOS
(a)
(b)
(c)
(d)
Figura 1.49
3. Hay una prueba muy sencilla de la suma (1.1), con la que iniciamos la discusión de las series geométricas: 1 1 1 1 + + + + ... 2 4 8 16 1 1 1 1 1 1 1 + + + + ... = 1 + + + + ··· = S + 1 =⇒ 2S = 2 2 4 8 16 2 4 8 ∴ S = 1. S=
Si aplicamos razonamientos similares en el siguiente ejemplo, llegamos a una conclusión absurda: Sea
S = 1 + 2 + 4 + 8 + 16 + . . .
=⇒ 2S = 2 (1 + 2 + 4 + 8 + 16 + . . . ) = 2 + 4 + 8 + 16 + · · · = S − 1 =⇒ S = −1
∴ −1 = 1 + 2 + 4 + 8 + 16 + . . .
¿Por qué en el primer caso sí es válido el procedimiento aplicado y en el segundo no lo es?
76
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Hint: Relean las conclusiones de la sección §1.1.4, y analicen entonces qué ocurre con la sucesión de sumas parciales de ambos ejemplos. 4. Así como podemos sumar infinidad de números (las series), también podemos multiplicar infinidad de números, solo que en este caso la definición de convergencia tiene un matiz en relación al cero. La idea es la siguiente (sin meternos a explicar el porqué de este pequeño enredo en la definición): Sea {ak } una sucesión. Con base en ella formamos otra, que llamaremos sucesión de productos parciales {Pn }, donde N ot.
Pn = a1 · a2 · · · an =
n Y
ak .
k=1
Analizamos entonces si a partir de una cierta N fija, el producto N ot.
aN +1 · aN +2 · · · an =
n Y
ak
k=N +1
tiende a un valor P distinto de cero conforme la n se va haciendo tan grande como queramos. Si esto es así, decimos que el producto infinito converge, y su valor está dado por el valor a1 · a2 · · · aN · P . Si no, entonces decimos que el producto infinito diverge. Así las cosas, si una infinidad de los factores son cero, o sin ser cero ninguno de ellos resulta que los productos parciales de orden n tienden a cero, tendremos que el producto infinito diverge a cero. Solo se acepta la convergencia a cero cuando un número finito de términos es cero y la cola del producto converge a un valor real distinto de cero. En caso de que ningún término sea cero y la cola del producto converja a un real distinto de cero, tendremos la convergencia del producto infinito a un valor distinto de cero. Por el momento hagan abstracción de las dudas que puede ocasionarles entender el por qué de este bericueto en la definición, y traten de concentrarse en la definición misma para resolver los siguientes ejercicios: Prueben que: a)
1 1− 2
1 1 1− ··· 1 − 3 1000
=
1 1000
77
EJERCICIOS
b)
1 1+ 1
1 1 1+ ··· 1 + 2 1000
= 1001
Obtengan: c)
∞ Y
k=2
1 1− k
d)
∞ Y
1 1+ k
k=1
e)
∞ Y
k=2
1 1− 2 k
Prueben que el producto infinito 1
1
1
1
f ) 3 3 · 9 9 · 27 27 · · · (3n ) 3n · · · converge y obtengan su valor. Hint: Tomen el producto parcial de orden n, expresen todo en base 3, y piensen en un desarrollo similar al utilizado en la segunda serie de Nicole Oresme que se discutió en la página 43. 5. También se pueden calcular potencias infinitas. Suponiendo que la solución existe, resuelvan las siguientes ecuaciones: ·· x·
x a)xx
b)
=2
·· x·
x xx
= n, n ∈ N, n > 1.
6. Sea n cualquier número natural, prueben que:
1+ 1+
1 2
+ 1+
1 1 + 2 3
+ ··· + 1 +
1 1 + ··· + 2 n−1
1 1 1 . + + ··· + =n 2 3 n 7. (El conjunto de Cantor). Supongan que tienen el intervalo [0, 1], lo parten en tres subintervalos de la misma longitud y sacan el abierto que está en el centro de los tres. Luego, a los dos intervalos cerrados que quedaron a los lados, los parten a su vez en tres de la misma longitud y les sacan el abierto del centro de cada uno de ellos. Ahora les quedan cuatro subintervalos cerrados, cada uno de ellos lo parten en tres y sacan el abierto del centro en cada caso, y así sucesivamente. Si siguen este proceso hasta el infinito, ¿cuánto miden en total todos los intervalos que sacaron?, ¿al final se quedó vacío el intervalo [0, 1] inicial? (ver figura 1.50).
78
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
Figura 1.50
8. En este ejercicio veremos que la propiedad (1.39) es la propiedad estrella de los logaritmos; con base en ella se pueden probar fácilmente muchas otras, de las que seguramente tendran recuerdos de la secundaria y el bachillerato. Utilizando entonces (1.39), demuestren que: a) log(xn ) = n log(x), ∀ n ∈ N.
b) log xy = log(x) − log(y). Hint: Como log(1) = 0 (¿por qué?), expresen 1 = yy y obtengan a partir de ahí log y1 , y luego log xy . c) log x−n = −n log(x), ∀ n ∈ N. Hint: 1 = 1
1 n log(x), ∀ n ∈ N. Hint: x = =m n log(x), ∀ n ∈ N, m ∈ Z.
d) log x n = m
e) log x n
1
xn xn . 1
1
xn · xn · · · xn .
9. En defensa de la filosofía de Parménides, que sostenía que la realidad es única, indivisible e inmutable, más allá de las pasajeras ilusiones de los sentidos, Zenón de Elea planteó cuatro argumentos en relación con el movimiento, comúnmente conocidos como las paradojas de Zenón. B. Russell protestó contra la trivialización de sus planteamientos: [. . . ] Habiendo inventado cuatro argumentos, todos inmensamente sutiles y profundos, la grosería de los filósofos subsecuentes lo han señalado meramente como un malabarista ingenioso, y a sus argumentos de ser todos sofismas [. . . ]34 Con el paso del tiempo se ha desarrollado una polémica sobre el sentido preciso (y la forma misma) de los argumentos de Zenón, habida cuenta de que estos se conocen a través de Aristóteles, que los citaba
EJERCICIOS
79
pero para refutarlos. Para un primer acercamiento a esta discusión se puede leer la segunda parte de la lección VI del trabajo de Bertrand Russell, Our Knowledge of the External World.35 Aquí plantearemos como ejercicio la discusión de los dos primeros, en su sentido usual (incisos a) y b)), y luego otro ejemplo más: a) ¿Cómo puede un corredor llegar del punto A al punto B? Primero debe recorrer la mitad de la distancia, luego la mitad de la mitad que le falta, luego la mitad de la mitad de la mitad que le falta, de modo que nunca llega. (Esto mismo, pero planteado “de reversa”, conduce a que el corredor nunca parte de donde está, pues antes de llegar a su objetivo debe llegar a la mitad de la distancia que lo separa de él, pero antes de llegar a esa mitad debe llegar a su mitad, y así ad infinitum). Pongamos un ejemplo para ilustrar la lógica del planteamiento.36 Supongamos que colocamos una moneda en la orilla de una mesa. Todo lo que digamos sobre la moneda se referirá a un punto de ella (digamos, su centro). El objetivo es trasladar la moneda a la otra orilla siguiendo los pasos que describiremos a continuación: primero la movemos a la mitad de la mesa, tardando un segundo en hacerlo; luego la movemos a una posición ubicada a la cuarta parte de su destino, tardando también un segundo en este movimiento, luego a un octavo de la orilla final, tardando un segundo en ello, luego a un dieciseisavo, tardando de nuevo un segundo en hacerlo, y así sucesivamente. ¿La moneda llega al otro extremo? ¿El corredor de Zenón llega a la meta? b) Aquiles y la tortuga. Tomando la imagen del personaje más veloz de la mitología griega, y el animal más lento en el imaginario colectivo, Zenón plantea lo siguiente: supongamos que Aquiles le da cierta distancia de ventaja a una tortuga para emprender una carrera entre ambos. Cuando Aquiles llega al punto de donde salió la tortuga, esta ya ha recorrido una distancia, y al llegar Aquiles a ese nuevo lugar la tortuga ya ha recorrido nuevamente otra distancia, y así una y otra vez. Aquiles se irá acercando más y más a la tortuga, pero nunca la alcanza. Establezcamos valores imaginarios para discutir la solución a este problema. Supongan que Aquiles le da una ventaja de 100 metros a la tortuga, y que corre siete veces más rápido que ella, ¿en qué momento la alcanzará?
80
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
c) Piensen en las dos manecillas de un reloj a las 12 del día. Una vez que se ha adelantado la manecilla de los minutos, nunca volverá a alcanzar a la de las horas. Pues al cabo de una hora, la manecilla de los minutos se encuentra en el 12, que es donde se encontraba una hora atrás también la de las horas, solo que ahora esta se encuentra en el 1; y cuando la de los minutos llega al 1, la de las horas ya se adelantó otro poco; avanza hacia allí la de los minutos y la de las horas avanzó otro poco más, y así indefinidamente. ¿Qué les parecería imaginar que el contorno del reloj es una gran pista circular de carreras, y que bautizan la manecilla de los minutos con el nombre de Aquiles y a la de las horas como la tortuga?, ¿en qué momentos exactamente se vuelven a cruzar las dos manecillas antes de que den las 12 de la noche? d) En caso de que no lo hubieran hecho así, resuelvan ahora el inciso anterior introduciendo una serie geométrica adecuada, cuya suma nos dé el tiempo que tarda la manecilla de los minutos en alcanzar a la de las horas una y otra vez. 10. En este problema desarrollaremos un camino para obtener una aproximación al valor de la longitud de la circunferencia (y con ello del valor de π, ¿verdad?). Veamos: a) Supongan que han calculado el valor Pn del perímetro de un polígono regular de n lados inscrito en la circunferencia unitaria. Llamen Sn a la longitud de cada uno de esos lados (es decir, Pn = nSn ): demuestren, primero, que si construyen con base en el polígono anterior, el que tiene 2n lados, la longitud de cada uno q de estos nuevos lados estaría dada por S2n =
2−
p
4 − Sn2 .
Figura 1.51
Hint: Obtengan en la figura el valor de DB en términos de DE. Para ello expresen el valor del área del triángulo 4ABD de dos
81
EJERCICIOS
maneras alternativas: tomando como base el lado AB (su altura sería DC), y tomando como base el lado AD (su altura sería DB). Justifiquen por qué. Igualen ambos valores y trabajen un poco algebraicamente. b) Obtengan el valor de S4 “a pie”, y a partir de ello deduzcan, utilizando (i), los valores de S8, S16 , S32 , . . . S2n . c) Justifiquen, a partir de lo anterior, que conforme hacemos n cada vez más grande, la expresión
2
v u u t n |
2−
s
2+
r
2+ {z
n veces
q
2 + ... +
√
2 }
se aproxima tanto como queramos al valor de π “por debajo”. d) Obtengan por esta vía cinco valores cercanos a π (tomando 2, 3, 4, 5 y 6 raíces en la expresión anterior). e) De pasada observen que con todo lo anterior, “casi sin sentirlo”, probaron que los lados de los polígonos con 2n lados, con 5 · 2n lados y con 3 · 2n lados se pueden encontrar completamente tan solo aplicando las operaciones de suma, resta, multiplicación, división y extracción de raíces cuadradas, todas ellas operaciones susceptibles de ser realizadas con tan solo regla y compás. f) Hagan un desarrollo similar para polígonos regulares circunscritos de 2n lados, obteniendo el valor correspondiente Qn de su perímetro. g) Utilicen P16 y Q16 para dar una cota inferior y otra superior para el valor de π. 11. El cálculo del área del círculo es un viejo problema en la historia de las matemáticas. El matemático y astrónomo griego Eudoxo de Cnido (405-355 a. C.) desarrolló el que se conoce como “método de exhaución”, que retomaría después Euclides en el libro xii de sus Elementos. Se trata de un procedimiento de aproximación infinita que permite, entre otras muchas cosas, la solución de problemas como la obtención del área de una región acotada por una curva, utilizando polígonos con área conocida (en el ejercicio anterior utilizamos una
82
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
idea parecida para el cálculo del perímetro del círculo). Este procedimiento tiene la virtud de que se puede generalizar a infinidad de regiones acotadas por curvas muy diversas (de hecho, es la base de lo que hicimos en la sección §1.4 en donde hablamos del área bajo una curva y la integral). Sin embargo, para ciertas regiones (como es el caso del círculo), hay caminos notablemente más simples para obtener su área. Veremos solo dos de ellos (ambos presuponen que ya se conoce el valor del perímetro del círculo). a) El primero se debe a Nicolás de Cusa (1401-1464), cardenal, filósofo y teólogo alemán. Dividió el círculo en porciones delgaditas, como rebanadas de pastel, y luego las colocó “en hilera”, como se indica en la figura 1.52:37 si las porciones son en efecto muy
Figura 1.52
estrechas, cada una de ellas sería casi triangular, con una altura próxima al radio del círculo. ¿Cuánto valdría entonces el área de todas estas porciones? Hagan el cálculo. b) El segundo se basa en una idea más general desarrollada por el matemático italiano Bonaventura Cavalieri (1598-1647), idea que se conoce como Principio de Cavalieri: si dos figuras planas tienen la misma altura, y las secciones paralelas a sus bases, a una misma distancia de estas, tienen longitudes iguales, entonces las dos figuras tienen la misma área. (Algo similar ocurre si dos sólidos tienen la misma altura, y las secciones paralelas a sus bases a una misma distancia de ellas tienen la misma área: sus volúmenes resultan ser iguales).
EJERCICIOS
83
Figura 1.53
Esta idea ofrece una alternativa original para calcular áreas y volúmenes, que resulta visualmente muy atractiva. Veamos aquí una posible “extensión” de ella para el caso del círculo. Supongan que cortan el radio r en segmentos pequeñitos y trazan circunferencias con los valores r1 , r2 , . . . , rn de los radios menores correspondientes (ver figura 1.54).
Figura 1.54
Si “desdoblamos” las circunferencias de radio ri , nos quedan segmentos de recta de longitud 2πri. Tomen en el eje X del plano el intervalo [0, r] con su correspondiente partición r1 , r2 , . . . , rn , y levanten verticalmente sobre cada uno de estos valores el segmento de recta que correspondería a la respectiva circunferencia “desdoblada”. ¿Qué “curva” nos describen los extremos superiores de estos segmentos?, ¿qué figura nos queda “atravesada” verticalmente por dichas secciones?, ¿cuál es entonces el área del círculo? 12. Prueben que si primero integran y luego derivan la función f (x) = x2 definida en todo R, regresan a ella misma; y que si derivan y luego integran la función f (x) = x1 definida en todo (1, ∞), también regresan a ella misma, más una constante, ¿qué significa esa constante?
84
TRABAJANDO CON EL INFINITO: ACIERTOS Y ERRORES
13. Intenten desarrollar una demostración geométrica propia para la obtención de la suma de la serie geométrica en el caso −1 < r < 0, similar a la discutida en el texto en torno a la figura (1.7). 14. Construyan un ejemplo análogo al de la trompeta de Torricelli, de un conjunto cuyo perímetro puedan probar que resulta infinito, pero su área resulte finita. 15. Sobre las debilidades de la intuición . . . 38 Supongan que tienden una cuerda sobre la superficie de la Tierra a la altura del Ecuador, ¿cuánto piensan aproximadamente, que tendríamos que alargar la cuerda si quisiéramos que le diera toda la vuelta a la Tierra, pero a 1 metro de altura sobre su superficie? Va como opción múltiple la respuesta: a) 6 metros
b) 6 km
c) 600 km
d) 60,000 km
Respondan primero de acuerdo con su intuición, luego traten de probar su respuesta, y al final respondan sobre la diferencia entre hacer lo mismo alrededor del Sol y de un balón de futbol.
Capítulo 2
Conjuntos infinitos Hay dos sentidos en los que podemos pensar en el infinito: como un “valor” al cual tienden los valores reales de una variable (o de una función, una sucesión o una serie), y como el número de elementos de un conjunto (o de términos de una sucesión, o de sumandos de una serie). Cuando hablamos del infinito en el primer sentido, nos referimos a que podemos rebasar cualquier valor real dado de antemano con valores reales de la variable, o de la función, o de la serie. No hablamos de una magnitud infinita como tal, las magnitudes o distancias infinitamente grandes o infinitamente pequeñas no existen en el cálculo usual. Lo que sí existe son los conjuntos infinitos. El infinito actual surge al hablar de cardinalidad, no de distancias.
2.1.
Las aparentes contradicciones lógicas en la comparación entre conjuntos infinitos
Los esfuerzos por comprender la naturaleza del espacio y el tiempo han acompañado a la ciencia y la filosofía desde sus orígenes. La polémica entre los griegos sobre este tema fue suficientemente álgida e incluyó a varias de sus figuras más prominentes. Uno de los puntos a discusión era si la materia era infinitamente divisible o no. Anaxágoras (500-428 a. n. e.), por ejemplo, era partidario de la primera opinión.39 Para él: “No hay la menor entre las cosas pequeñas, siempre hay algo más pequeño. Lo que existe no deja de exitir como resultado de dividirlo, independientemente de qué tanto continuemos dividiéndolo”. En cambio, Leucipo (460-370 a. n. e.) y Demócrito 85
86
CONJUNTOS INFINITOS
(460-370 a. n. e.), creadores de la escuela conocida como “atomista” (que derivó de los pitagóricos), sostenían que existen pequeñas partículas cuya dureza las hace indivisibles (átomos, cuyo significado en griego es precisamente indivisible). Zenón (490-430 a. n. e.) atizó la discusión con sus famosas paradojas, que mostraban las consecuencias de utilizar en forma descuidada la premisa de la divisibilidad infinita del espacio (ver ejercicio 9 en la sección §1.6). Aristóteles (384-322 a. n. e.) sostenía que el espacio (y el tiempo) formaba un continuo que debía ser concebido como algo “divisible en divisibles que son siempre divisibles”, rechazando que la recta estuviera compuesta por puntos (o el tiempo por instantes). Si bien aceptaba que había puntos en ella, nunca podría llegarse a uno por un proceso de división de la misma, ni estos podrían generarla, pues de ser así tendrían que colocarse uno a continuación de otro, ya sea dejando un espacio entre ellos (y entonces ya no habría continuidad), o entrelazándose entre sí a través de “extremidades externas” (outer extremities) (que no podían tener los puntos, pues si así fuera dejarían de ser indivisibles) o bien tendrían que estar completamente superpuestos uno con otro (en cuyo caso no podrían abarcar más espacio que el de un solo punto).40 Cuando la Edad Media se acercaba a su fin, la Iglesia católica, dominante en Europa, estableció cuál debía ser la forma de entender este problema: en 1415, el Concilio de Constanza decretó que las cosas eran como había dicho Aristóteles casi 1,750 años antes, y que incurriría en herejía quien considerase que una línea estaba compuesta por indivisibles (puntos).41 Sin embargo, poco a poco se iba extendiendo la práctica de generar sólidos a partir de planos, planos a partir de rectas, rectas a partir de puntos, práctica inspirada en la tradición de Arquímedes, quizás el más original de los científicos griegos (con Eudoxo y Apolonio). A final de cuentas, eso era generar continuos de diversas dimensiones a partir de los indivisibles que corresponden a cada una de ellas (los indivisibles en la recta son los puntos, en el plano son las rectas y en el espacio son los planos). El problema era que surgían dudas (utilizadas en la polémica por los defensores de la visión aristotélica) que no se sabía bien cómo responder: si se parte de que el continuo de una circunferencia está compuesto por puntos, imagina dos circunferencias concéntricas, y traza radios desde el centro hasta cada punto de la circunferencia exterior, de manera que atraviesen también a la interior. A cada punto de una le puedes asociar
APARENTES CONTRADICCIONES LÓGICAS . . .
87
uno y solo uno de la otra a través del radio correspondiente. Pero entonces eso querría decir que las dos tienen la misma cantidad de puntos, lo cual no era posible, porque una es más grande que la otra (ver figura 2.1a).
(b)
(a)
Figura 2.1
O toma un cuadrado con su diagonal, y atraviesa cada punto de uno de sus lados con una línea ortogonal a él, que prolongada hasta la diagonal, asocia un punto de ella (y solo uno) a cada punto del lado (y viceversa), así es que tienen la misma cantidad de puntos el lado y la diagonal; pero la diagonal es más larga que el lado, de modo que la visión de la recta compuesta por puntos conduce a una paradoja (ver figura 2.1b). En el fondo, el problema partía de aceptar, de no cuestionar algo que desde los griegos era considerado casi de sentido común, que era que el todo siempre es más grande que cualquiera de sus partes (la quinta de las Nociones comunes de los elementos de Euclides). Galileo, por supuesto, se incorporó a la discusión de la visión aristotélica, con el debido cuidado dado el acoso que sufría por parte de la Inquisición. Vale la pena citar, así sea brevemente, tres aspectos de su argumentación: [. . . ] Una de las primeras objeciones que se suelen adelantar contra aquellos que componen las magnitudes continuas de partes indivisibles suele ser la de que un indivisible añadido a otro indivisible no produce otra cosa divisible [. . . ] En esta y en otras objeciones parecidas se puede dar satisfacción a los que las ponen diciéndoles que no solo dos indivisibles, sino ni siquiera diez, cien o mil podrían componer jamás una magnitud divisible y extensa, sino que se necesitarían infinitos.
88
CONJUNTOS INFINITOS
Esto tiene una gran relevancia, no solo porque de pasada discute con la idea inicial de los pitagóricos de que el número de puntos en un segmento acotado era finito, sino porque la idea de Aristóteles partía en el fondo de imaginar que para generar la recta los puntos debían unirse uno a continuación del otro, por parejas; y así, efectivamente, no era posible hacerlo. Esta idea no se corresponde con una propiedad de la recta que se comenta más adelante (la densidad), que consiste en que entre dos puntos cualesquiera de ella hay siempre una infinidad de otros más, de forma que no se puede hablar de un punto de la recta y “el que le sigue”. Y el argumento de Galileo abre la mente en esa dirección. Más adelante en el mismo texto, por medio de Simplicio (personaje ficticio que utiliza en sus escritos para poner a discusión las objeciones más simples —y comunes— a los descubrimientos y razonamientos por los que se iba abriendo paso la ciencia), Galileo plantea la siguiente objeción (a la cual responde él mismo, a través de Salviati, personaje que utiliza para expresar sus propios puntos de vista): Simplicio: Aquí surge inmediatamente una duda que me parece insoluble; y es que, estando nosotros seguros de que pueden darse líneas, una de las cuales es mayor que la otra, teniendo ambas infinitos puntos, hay que confesar que existe, en magnitudes de la misma especie, una cosa más grande que el infinito, puesto que la infinitud de los puntos de la línea mayor excederá a la infinitud de los puntos de la menor. Ahora bien, que se dé un infinito más grande que el infinito, me parece algo totalmente absurdo. Salviati: Este tipo de dificultades proviene de los razonamientos que nosotros hacemos con nuestro entendimiento finito al tratar con los infinitos, otorgándoles los mismos atributos que damos a las cosas finitas y limitadas, lo cual pienso que es improcedente [. . . ]. Esta observación de Galileo será palpable en la sección §2.2, pues señala la dificultad que se presenta una y otra vez cuando para resolver un problema nuevo que involucra al infinito, se intenta aplicar el procedimiento que había funcionado bien para el caso finito y se arriba a un callejón sin salida. Finalmente, comparando la cantidad de números de la forma n2 : 1, 4, 9, 16, 25, . . . (números cuadrados), con el total de los naturales, Galileo
APARENTES CONTRADICCIONES LÓGICAS . . .
89
pone a discutir a sus personajes para sacar algunas conclusiones (en este diálogo interviene también el tercero de ellos, Sagredo, “el hombre imparcial, instruido y agudo (que) sin ser especialista en la materia, tiene como misión plantear dudas inteligentes -que dan ocasión al más pleno desarrollo del pensamiento de Galileo”. Obsérvese en esta cita la claridad con que plantea la forma de comparar la cardinalidad (es decir, el número de elementos) de dos conjuntos infinitos: Salviati: [. . . ] si yo digo que todos los números, incluyendo cuadrados y no cuadrados, son más que los cuadrados solos, enunciaré una proposición verdadera, ¿no es así? Simplicio: Evidentemente. Salviati: Si continúo preguntando cuántos son los números cuadrados, se puede responder con certeza que son tantos cuantas raíces tengan, teniendo presente que todo cuadrado tiene su raíz y toda raíz su cuadrado; no hay, por otro lado, cuadrado que tenga más de una raíz ni raíz que tenga más de un cuadrado. Simplicio: Así es. Salviati: Pero si pregunto cuántas raíces hay, no se puede negar que haya tantas como números, ya que no hay ningún número que no sea raíz de algún cuadrado. Estando así las cosas, habrá que decir que hay tantos números cuadrados como números, ya que son tantos como sus raíces, y raíces son todos los números. Sin embargo, decíamos al principio, que todos los números son muchos más que todos los cuadrados, puesto que la mayoría de ellos no son cuadrados. Sagredo: En este caso, ¿qué es lo que se deduce? Salviati: Yo no veo otra cosa que haya que decir si no es que infinitos son todos los números, infinitos los cuadrados, infinitos sus raíces; la multitud de los cuadrados no es menor que la de todos los números, ni esta mayor que aquella; y finalmente, los atributos de mayor, menor e igual, no se aplican a los infinitos, sino solo a las cantidades finitas[. . . ].42 Debieron pasar 236 años para que Georg Cantor, para su propia sorpresa, pudiera demostrar que la afirmación contenida en los dos últimos
90
CONJUNTOS INFINITOS
renglones no era verdadera. Pero habría sido imposible descubrir eso sin el desarrollo previo de todo el cálculo y, en particular, sin la comprensión a fondo de los números reales.
2.2.
Los hoteles de Hilbert
Se dice que Hilbert, para hacer más comprensibles algunas de las propiedades del infinito en sus clases,43 solía plantear problemas del estilo de los que se plantean a continuación, todos ellos basados en la idea imaginaria de un hotel con una infinidad de cuartos numerados y otros tantos huéspedes: Ejemplo 2.1. Si un hotel de tales características estuviese lleno con una persona en cada cuarto, y llegara un nuevo huésped, ¿habría forma de reacomodarlos a todos, de suerte que pudiera asignársele un cuarto al recién llegado? Hay dos reglas básicas a respetar en este y en los subsiguientes ejemplos: Regla 1. Cada huésped puede ser cambiado de cuarto a lo más una vez. Regla 2. Con los reacomodos, no puede quedar más de un huésped en un cuarto, ni algún cuarto vacío.
(a)
(b)
Figura 2.2
Solución. Si el hotel fuera finito, la respuesta sería no. Pero la infinitud de los cuartos modifica las cosas. ¿Podría, por ejemplo, pedírsele al nuevo huésped que simplemente “se vaya al que sigue del último cuarto”? Pues no, porque no hay un último cuarto. En cambio, puede darse la instrucción de que cada huésped se traslade al cuarto siguiente, y el nuevo huésped que ingrese al primer cuarto, que habría quedado vacío. Que con ese reacomodo ningún cuarto queda con más de un huésped es claro, pero ¿no se quedaría fuera el huésped del último cuarto? No, de nuevo, porque no hay tal último cuarto. Esta idea surge en realidad de que cuando se habla de una infinidad de cuartos nos imaginamos algo del
LOS HOTELES DE HILBERT
91
estilo de la figura 2.2a, pero así no es el asunto. La infinidad de cuartos numerados se expresa más bien en un esquema como el de la figura 2.2b. De modo que, como para todo número natural n, el número n + 1 es también un natural, todo huésped queda entonces dentro de un cuarto, nadie queda fuera del hotel (ver figura 2.3).
Figura 2.3: Un nuevo huésped.
Ejemplo 2.2. Supongamos que llegan 1000 nuevos huéspedes: ¿Caben? Solución. ¿Podría ser la solución que se repita 1000 veces el procedimiento del ejemplo anterior? No, porque se estaría violando la Regla 1, pero en cambio se puede dar la instrucción al huésped del cuarto n de que se pase al n + 1000, sea cual sea la n ∈ N. Numerar del 1 al 1000 a los recién llegados, y darles la instrucción de que el k-ésimo ingrese al cuarto k, ∀ k = 1, 2, . . . 1000 (ver figura 2.4). Ejemplo 2.3. Supongamos ahora que llega una infinidad de nuevos huéspedes, cada uno con un lugar numerado conforme a los números naturales. ¿Caben? Solución. ¿Podríamos proponer aplicar una infinidad de veces el movimiento del primer ejemplo? No, pues otra vez estaríamos violando la Regla 1. Mejor, en tal caso, adecuar el procedimiento seguido en el
92
CONJUNTOS INFINITOS
segundo ejemplo: si cuando eran 1000 solicitantes la solución era que cada huésped se trasladara 1000 lugares, ¡podríamos aquí pedirle a todos los huéspedes que lo hicieran una infinidad de lugares y ya está!, solo que tendríamos que hacernos una pregunta: ¿dónde quedaría reacomodado el huésped que estaba en el cuarto n?, en el n + ∞. Pequeño detalle: ese no es un número natural, no existe ningún cuarto “numerado” de esa manera. Decirle a un huésped que se vaya al cuarto n + ∞ es tanto como decirle que se vaya a volar.
Figura 2.4: 1000 nuevos huéspedes.
Estamos frente a algo que nos recuerda lo que decía Galileo: si para el caso infinito calcamos el procedimiento que funcionaba bien para el caso finito (de solicitantes, en este ejemplo), muy probablemente toparemos con pared. Necesitamos pensar de otra manera el problema. Una alternativa es la siguiente: ¿qué pasa si a quien está ubicado en el cuarto n del hotel le pedimos que se pase al cuarto 2n? Como todo número tiene su doble, ningún huésped se quedaría sin cuarto, y como el doble de números distintos nos da siempre como resultado números distintos a su vez, en ningún cuarto quedaría alojado más de un huésped. ¿Y cómo queda el hotel al aplicarse este reacomodo?, con los cuartos pares llenos y los impares vacíos. De modo que entonces acomodamos a quien tiene el lugar k entre los recién llegados en el cuarto 2k − 1,
LOS HOTELES DE HILBERT
93
así para toda k ∈ N, y todos quedan felizmente ubicados en un único cuarto, quedando el hotel con todos sus cuartos ocupados, un huésped por cuarto (ver figura 2.5).
Figura 2.5: Una infinidad de nuevos huéspedes.
Ejemplo 2.4. Y si llegan después 1968 filas infinitas de nuevos huéspedes, con lugares numerados fila por fila de acuerdo con los naturales, ¿cabrían? Solución. La idea sería reacomodar a los huéspedes que estaban inicialmente en el hotel, de manera que entre cada uno queden 1968 lugares libres. La regla de reacomodo para ellos podría ser la siguiente: que el que está en el cuarto n se pase al cuarto 1969n. ¿Cómo queda el hotel con este reacomodo?, 1968 lugares libres y uno ocupado, otros 1968 lugares libres y otro ocupado, y así sucesivamente. Entonces, a quien está en el lugar k de la primera fila lo ubicamos en el cuarto 1969k − 1. (Tomen lápiz y papel, y hagan cuentas y dibujos para entender bien el mecanismo). A quien está en el lugar k de la segunda fila, que ingrese al cuarto 1969k − 2. En general, a quien esté en el lugar k de la fila m, ∀ k ∈ N y m = 1, 2, . . . 1968, que ingrese al cuarto 1969k − m (ver figura 2.6).
94
CONJUNTOS INFINITOS
Figura 2.6: 1968 filas infinitas de nuevos huéspedes.
Y después de este, llegamos al caso más sorprendente: Ejemplo 2.5. ¿Qué pasa si llegaran ahora una infinidad de filas numeradas como los naturales, cada una con una infinidad de nuevos huéspedes, igualmente numerados dentro de cada fila como los números naturales? ¿Cabrían? Solución. ¿Qué hicimos cuando era un número finito de filas con infinidad de huéspedes cada una? Saltear los lugares en los cuales ubicar a los huéspedes iniciales, dejando entre cada uno de ellos tantos lugares vacíos como número de nuevas filas llegaron. ¿Podríamos copiar el procedimiento para la nueva situación, en que el número de filas es infinito? Pues no, porque querría decir ubicar al primero de los viejos huéspedes digamos en el cuarto a, dejar una infinidad de lugares vacíos y colocar “a continuación” al siguiente huésped inicial; pero eso querría decir que estaríamos mandando apenas al segundo huésped al cuarto a + ∞, o sea, a ningún lado. De nuevo, la calca del caso finito no tiene posibilidades. Como hemos visto, decir que la respuesta a la pregunta hecha en el ejemplo es afirmativa, presupone exhibir una forma de reacomodar a los huéspedes, viejos y nuevos, de manera que queden todos ubicados de a uno por cuarto y el hotel quede lleno. Digamos que en este caso los huéspedes del hotel se encuentran en la fila 1 y los demás en las filas 2, 3, . . . Es decir, hablaremos de la fila m, con m = 1, 2, . . . , quedando incluidos como la primera fila los huéspedes originales. El problema es entonces ver en qué cuarto quedaría ubicado quien se encuentra en la fila
LOS HOTELES DE HILBERT
95
m, lugar n, con m, n ∈ N. Podemos representar lo anterior con la pareja ordenada (m, n) (ver figura 2.7). Bastaría con ilustrar gráficamente una forma de enumerar a todas las entradas de un arreglo con infinidad de filas, cada una a su vez con infinidad de lugares:
Figura 2.7
Si nos propusiésemos numerar, por ejemplo, primero toda la primera fila, y “al terminar” empezar con la segunda fila, el resultado real es que nunca pasaríamos a la segunda fila, de forma que así no funcionarían las cosas. El resultado es el mismo si emprendemos la numeración de toda la primera columna, con la intención de “al terminar” pasar a la segunda. El procedimiento debe ser diferente. Una opción es la siguiente: que vayamos numerando más bien diagonalmente. De acuerdo a nuestro esquema, comenzando en la esquina superior izquierda, y recorriendo las diagonales de izquierda a derecha, de abajo hacia arriba (digamos, en dirección suroeste→noreste), regresando al terminar cada diagonal al siguiente lugar hacia abajo en la primer columna para recorrer una nueva diagonal (que van resultando cada vez más largas, pero siempre finitas) (ver figura 2.8).
96
CONJUNTOS INFINITOS
Figura 2.8
En la primer diagonal solo cae el (1,1); en la segunda diagonal caen el (1,2) y el (2,1); en la tercer diagonal caen, en orden, el (1,3), (2,2) y (3,1). Nótese que la suma de las coordenadas de las parejas de una misma diagonal suman siempre una cantidad constante e igual al número de diagonal que se trate, más 1. Es decir, en la p-ésima diagonal caen en total p parejas, que en orden serían las (1, p), (2, p − 1), (3, p − 2), . . . (k + 1, p − k), . . . (p, 1). ¿Qué podemos decir del huésped ubicado en el lugar (m, n) de nuestro diagrama? Pertenece a la diagonal número m + n − 1, y su lugar dentro de ella es el m-ésimo. ¿Cuántos lugares suman todos los anterio, res al inicio de esa diagonal? 1+2+3+· · ·+(m+n−2) = (m+n−2)(m+n−1) 2 de acuerdo con (1.24). Entonces, ¿qué lugar le correponde al huésped del cuarto (m, n)?, el (m+n−2)(m+n−1) + m. 2 Que no quedan dos o más huéspedes en un mismo cuarto, y que todos los cuartos quedan ocupados, se desprende de la forma en que vamos recorriendo las diagonales: sin saltarnos nunca ninguna pareja y sin saltarnos tampoco ningún natural cuando los asignamos a cada pareja. Estrictamente hablando, habría que probar que la fórmula obtenida, de-
PRIMERAS DEFINICIONES Y PROPIEDADES
97
finida como una función: N×N → N, es inyectiva y sobreyectiva. Es decir, en mostrar que para toda k ∈ N, la ecuación (m+n−2)(m+n−1) +m = k 2 tiene una única solución (m, n), con m, n ∈ N. Se trata de lo que se conoce como una ecuación diofantina (ecuaciones con soluciones enteras).
2.3.
Primeras definiciones y propiedades
Sin darnos cuenta, al resolver los problemas de los hoteles hemos demostrado propiedades que resultan sumamente útiles en el estudio de las reglas del juego para el manejo de los conjuntos infinitos. Le pondremos nombre a algunas cosas y enunciaremos los resultados probados, en los términos formales que corresponden. En primer lugar, analicemos la regla para establecer cuándo dos conjuntos infinitos tienen la misma cardinalidad. ¿Cómo podemos comparar el tamaño de dos conjuntos? Una forma es contar los elementos de uno, los del otro y ver cuál de los dos números que resultan es más grande. El problema es que esto sirve cuando los conjuntos son finitos, pero no cuando son infinitos, pues nunca terminamos de contar sus elementos. Por lo demás, cuando los conjuntos son finitos, pero muy grandes, resulta muy engorroso hacer las cosas de esa manera. Supongamos por ejemplo que entramos a un cine con mucha gente y queremos saber si hay lugar; es decir, si el número de asientos es mayor que el número de personas. ¿Qué hacemos?, ¿contamos lo uno y lo otro?, ¿o miramos a ver si hay algún asiento vacío?, ¿qué es en el fondo hacer lo segundo?, es “aparear” los asientos con las personas y ver si sobra algún asiento (o alguna persona). Esa es otra manera de comparar el tamaño de dos conjuntos, y esa forma tiene la virtud de que sirve tanto para el caso en que los conjuntos son finitos como para el caso en que son infinitos. Se trata precisamente del razonamiento seguido por Galileo cuando comparaba el número de cuadrados con el número de naturales. De aquí en adelante esa será la regla que seguiremos: Definición 1. Decimos que dos conjuntos A y B tienen la misma cardinalidad (Notación: |A| = |B|) ⇔ Existe una forma de aparear (= formar parejas de) los elementos de A y los de B para la cual no sobre ningún elemento en A ni en B, en el entendido de que elementos diferentes de uno de los conjuntos no pueden aparearse con un mismo elemento del otro; es decir, si existe una función biyectiva f : A ↔ B.
98
CONJUNTOS INFINITOS
Cuando dos conjuntos A y B tienen la misma cardinalidad se dice que son equivalentes, y lo denotamos con el símbolo A ∼ B. Nótese que dice “existe”, no dice “para toda”. Si existe una forma de aparear los elementos de dos conjuntos en la cual no sobren elementos de ninguno, ¿para todas las demás deberá ocurrir lo mismo? En el caso de los conjuntos finitos, sí; pero en el de los infinitos, no. Tomemos por ejemplo los números naturales (N) y los números pares (P). Exhibiremos tres apareamientos entre ambos conjuntos a través de los esquemas correspondientes: N:
1
2 l 2
3
1 l 2
2 l 4
2
1 l 4
P:
N: P:
N: P:
4 l 4
5
6 l 6
7
3 l 6
4 l 8
6
2 l 8
8 l 8
5 l 10
6 l 12
7 l 14
8 l 16
10
3 l 12
14
4 l 16
...
2n − 1
...
...
n l 2n
...
... ...
2n l 2n
4n − 2
n l 4n
... ...
... ...
... ...
En el primer apareamiento sobran números en N (todos los impares); en el segundo no sobra ningún elemento en ninguno de los conjuntos; en el tercero sobra una infinidad de elementos en los pares (¡en el conjunto que parecería el menor de los dos, pues está propiamente contenido en N!). ¿Qué podemos decir entonces de la cardinalidad de ambos conjuntos? Que es igual, pues se cumple la definición 1, gracias al segundo de los apareamientos. De lo anterior salen varias conclusiones respecto a los conjuntos infinitos: o El hecho de que un conjunto A esté contenido propiamente en otro conjunto B, es decir que sea solo una parte de él, no implica que el segundo tenga mayor cardinalidad que el primero. A diferencia de los conjuntos finitos, para los conjuntos infinitos no aplica aquello de que “siempre el todo es mayor que cualquiera de sus partes”. Por eso no representaba ninguna paradoja el que dadas dos circunferencias, una con
PRIMERAS DEFINICIONES Y PROPIEDADES
99
radio mayor que la otra, ambas tuvieran el mismo número de puntos; o que la diagonal de un cuadrado tenga el mismo número de puntos que cualquiera de sus lados, teniendo mayor longitud que él. Este fue durante mucho tiempo el meollo de la dificultad para aceptar al infinito, a los conjuntos infinitos. Pero Bolzano, a contrapelo de la tendencia general, planteó que no solo no se trataba de un defecto de los conjuntos infinitos, sino que era precisamente su propiedad distintiva. Esta idea dio pie para que Dedekind, años después, definiera el concepto de conjunto infinito en términos de esa propiedad. Hasta aquí hemos venido hablando de los conjuntos infinitos, pero nunca hemos definido qué se entiende formalmente por conjunto infinito. Implícitamente asumíamos una definición: que un conjunto es infinito si no es finito. Y esto es válido, siempre que primero definamos qué significa que un conjunto sea finito, lo cual podemos hacer bien: un conjunto es finito si es posible aparearlo (1 a 1) sin que le sobre ningún elemento con los primeros n números naturales, para alguna n ∈ N (es decir, si existe una función biyectiva entre él y el conjunto {1, 2, . . . , n} para alguna n ∈ N). Ese es un camino. El otro es definir primero un conjunto infinito como aquel que se puede poner en correspondencia biunívoca con un subconjunto propio de sí mismo, y a partir de eso definir un conjunto finito como el que no es infinito. Es posible demostrar que ambas alternativas son equivalentes. o De los tres apareamientos vistos entre los naturales y los pares, se desprende entonces que el hecho de que exista un apareamiento entre los elementos de dos conjuntos, A y B, con el cual no sobren elementos en uno ni en otro, no impide que pueda haber otros apareamientos en donde le sobren a uno o al otro. Entonces, si dados dos conjuntos, A y B, encontramos un apareamiento con el que le sobran elementos a A por ejemplo, eso no nos dice que |A| > |B|, pues puede existir otro apareamiento con el que no le sobren elementos a ninguno de los dos. o En el ejemplo de los pares y los naturales, y en los ejemplos de los hoteles, hemos trabajado todo el tiempo con conjuntos que tienen la misma cardinalidad de los naturales. Esos conjuntos reciben un nombre especial: Definición 2. Decimos que un conjunto A es numerable si y solo si |A| = |N|. Es decir, existe una forma de aparear (1 a 1) sus elementos
100
CONJUNTOS INFINITOS
con los números naturales con la cual no sobre ninguno a ninguno de los dos. o Ahora reflexionemos sobre lo que en el fondo demostramos con los problemas de los hoteles de Hilbert. Los dos primeros ejemplos son un caso particular de un resultado más general cuya prueba quedó prácticamente desarrollada en ellos: si a un conjunto numerable (los huéspedes del hotel) le agregamos un conjunto finito (los 1 o 1000 nuevos huéspedes) vuelve a resultarnos un conjunto numerable (pues todos quedaron debidamente acomodados en el hotel, que tiene tantos cuartos como naturales). El tercer ejemplo nos muestra que la unión de dos conjuntos numerables (los huéspedes iniciales del hotel y la fila infinita de los que llegan), nos vuelve a resultar un conjunto numerable (pues pudieron acomodarse en el hotel unos y otros). El cuarto ejemplo es un caso particular también de uno más general, cuya prueba es similar a la realizada: si unimos una familia finita de conjuntos numerables (las filas de huéspedes, incluyendo la de los que estaban de antemano en el hotel), nos vuelve a resultar un conjunto numerable (cupieron bien todos en el hotel). Finalmente, en el quinto ejemplo, lo que hicimos de hecho fue probar que si unimos una familia numerable de conjuntos numerables, nos vuelve a resultar un conjunto numerable. De modo que casi sin sentirlo, con algo que parecía casi un juego, hemos probado varios teoremas generales que van perfilando la forma de operar con ciertos conjuntos infinitos. Procedamos a enunciarlos explícitamente: Teorema 2.6. La unión de un conjunto numerable y un conjunto finito resulta un conjunto numerable. Teorema 2.7. La unión de dos conjuntos numerables resulta un conjunto numerable. Teorema 2.8. La unión de una familia finita de conjuntos numerables resulta un conjunto numerable. Con símbolos: si A1 , A2 , . . . An son todos S conjuntos numerables, entonces nk=1 Ak es un conjunto numerable.
Teorema 2.9. La unión de una familia numerable de conjuntos numerables resulta un conjunto numerable. Con símbolos: si A1 , A2 , . . . son todos conjuntos numerables, entonces
∞ S
k=1
Ak es un conjunto numerable.
101
MÁS CONJUNTOS NUMERABLES
Como dijimos, las demostraciones están esencialmente dadas en las soluciones de los ejemplos de los hoteles. Hay un detalle que cambia, y que es que en el caso de los hoteles todos los conjuntos que uníamos eran ajenos (pues las personas en una u otra fila, o en el hotel mismo, son todas personas diferentes), pero al hablar de conjuntos en general no es necesariamente así. Sin embargo, esto no representa un problema, pues a la hora de enumerar los elementos de los conjuntos que unimos, si alguno se repite, simplemente nos lo saltamos; y si no repitiéndose ninguno no rebasábamos la cardinalidad de los naturales, menos aun quitando los que se repiten. Por otro lado, como al menos uno de los conjuntos es de por sí numerable, al unirle otros no nos puede quedar más pequeño. Es decir: lo que resulta de las uniones consideradas no es menor ni mayor que los naturales.
2.4.
Más conjuntos numerables
Ejemplo 2.10. ¿Qué hay más: naturales o múltiplos de 10? Argumenten su respuesta. Solución. Se podría pensar en responder que igual, porque los dos son infinitos. Sin embargo, ese argumento no es válido (independientemente de si fuera acertada o no la respuesta). Nuestro criterio para argumentar en estos casos debe apegarse a la definición que dimos de qué significa que dos conjuntos tengan la misma cardinalidad (o a su negación, en caso de que no la tuvieran; de ello hablaremos más adelante). Aquí debemos separarnos de los dos últimos renglones de la última cita de Galileo. Entonces, si sospechamos que los múltiplos de 10 y los naturales son todos la misma cantidad, lo que debemos hacer es exhibir una correspondencia biunívoca entre unos y otros. Si llamamos D al conjunto de los múltiplos de diez, el esquema siguiente ilustra bien la solución: N: D:
1 l 10
2 l 20
3 l 30
4 l 40
5 l 50
6 l 60
7 l 70
8 l 80
... ...
n l 10n
... ...
¿Cuál es la regla de apareamiento? La que se ilustra en la columna general: f : N → D, f (n) = 10n. Ejemplo 2.11. ¿Qué hay más, números naturales o números enteros?
102
CONJUNTOS INFINITOS
Solución. Podemos numerar los enteros siguiendo la regla que ilustra la figura 2.9.
Figura 2.9
O bien, podemos aplicar los teoremas discutidos. Los enteros son el resultado de la unión de tres conjuntos: los naturales (numerable por antonomasia), los enteros negativos (obviamente equivalentes a los naturales) y el conjunto que solo contiene el cero (finito). Así es que Z es la unión de dos conjuntos numerables y uno finito, ∴ es numerable. Ejemplo 2.12. ¿Qué hay más, naturales o puntos en el plano con ambas coordenadas enteras? Es decir, ¿quién tiene mayor cardinalidad, N o Z × Z?
Solución. La regla de numeración ilustrada en la figura 2.10 responde la pregunta.
Figura 2.10
Por otro lado, si aplicamos los teoremas que hemos visto:
103
UN PRIMER ACERCAMIENTO A LOS RACIONALES
Podemos ver a Z × Z como la unión “por renglones” de los puntos del plano con coordenadas enteras; es decir, como la unión de conjuntos de la forma {(z, k) : z ∈ Z}, con k fija recorriendo todos los enteros. ¿Cuántos elementos tiene cada renglón?, tantos como elementos tiene Z, que ya vimos que es numerable. ¿Y cuántos renglones son?; tantos también como elementos tiene Z. Es decir que Z × Z es la unión de una familia numerable de conjuntos numerables, ∴ es numerable. Ejemplo 2.13. ¿Es numerable el conjunto S de los números entre 0 y 1 con expansión decimal finita? S = {0.a1 a2 . . . aN : ai = 0, 1, . . . 9
∀ i = 1, 2, . . . N, N ∈ N}.
Solución. Observemos el orden que sugiere el siguiente listado: 0.1, 0.101, 0.201, .. .
0.2, ... 0.102, . . . 0.202, . . .
0.9, 0.11, . . . 0.109, 0.111, . . . 0.209, 0.211, . . . .. .
0.19, 0.21, . . . 0.119, 0.121, . . . 0.219, 0.221, . . .
... ... ...
0.99, 0.199, 0.299, .. .
0.901, 0.902, . . . 0.1001, ...
0.909, 0.911, . . .
0.919, 0.921, . . .
...
0.999,
¿Cuál es la idea? Tenemos dos elementos de S, digamos x = 0.a1 a2 . . . aM y y = 0.b1 b2 . . . bN , cuidando que aM 6= 0, bN 6= 0. (Es decir, empezamos por quitar a ambos números los ceros que pudieran tener de balde al final de su expansión decimal finita). a) Si M < N =⇒ x < y. Análogamente, si M > N =⇒ x > y. b) Y si N = M , las ordenamos en su orden natural. De modo que S es numerable.
2.5.
Un primer acercamiento a los racionales
o ¿Cómo se distribuyen los números racionales en la recta? Tomemos dos números racionales diferentes, digamos pq , m n , p, m ∈ Z, q, n ∈ N tales que p m < . q n (Siempre que hablemos de dos racionales está implícito que son diferentes entre sí).
104
CONJUNTOS INFINITOS
El punto medio ξ entre los dos, está dado por (ver ejercicio 8b en 2.10) p m mq + np n + q ξ= = . 2 2nq Como el producto y la suma de enteros es entero, y el producto de naturales es natural,[1] tenemos que el numerador es entero y el denominador es natural. Es decir, ξ ∈ Q, por lo tanto Teorema 2.14. El punto medio entre dos racionales siempre es racional. De aquí se desprenden varias conclusiones relevantes: Corolario 2.15. Entre dos racionales cualesquiera, por cercanos que se encuentren entre sí, siempre hay otro. Corolario 2.16. Dado un racional cualquiera, no se puede hablar de “el siguiente” ni de “el anterior” a él de acuerdo a su magnitud. La razón es inmediata: si un racional fuera “el siguiente” de otro, entre ellos dos ya no habría ninguno más, lo cual niega lo recién probado. Lo mismo aplica para “el anterior”. Si esto es así, entonces entre dos racionales, a y b, digamos a < b, existe no solo uno, sino toda una infinidad de racionales diferentes, pues si solo hubiese una cantidad finita, podríamos escoger el mayor de ellos,[2] y entonces entre él y b no habría ningún otro racional, lo cual contradice lo demostrado. Así es que hemos probado también que: [1]
Que de la suma y el producto de naturales resulta siempre un natural es algo que corresponde a nuestra ancestral utilización de estos números, y que mucho después de que surgieron, cuando se consideró necesario precisar en una definición las características básicas de este conjunto, quedó como una consecuencia de la definición adoptada. [2] Aquí estamos utilizando el hecho de que todo conjunto finito (en donde esté definida una relación de orden) tiene un elemento mayor y uno menor. Esto, que es intuitivamente claro, es algo que en realidad se demuestra. La prueba es sencilla, pero para hacerla debe utilizarse el Principio de Inducción y otras propiedades básicas del orden entre los números naturales (ver Beaumont, R. y Pierce, R., 1963, p. 130). No nos detendremos en ello. Por otro lado, observemos que si un conjunto es infinito, puede o no tener tanto máximo como mínimo. Consideren por ejemplo los conjuntos A = { n1 : n ∈ N}, B = {3− n1 : n ∈ N}, C = A∪B. El conjunto A tiene máximo, pero no mínimo; el conjunto B tiene mínimo, pero no máximo; y el conjunto C no tiene máximo ni mínimo.
UN PRIMER ACERCAMIENTO A LOS RACIONALES
105
Teorema 2.17. Entre dos racionales cualesquiera siempre hay una infinidad de racionales. ¿Cómo están distribuidos entonces los racionales en la recta? Imaginemos a los enteros “que son racionales” localizados en ella y tomemos cualesquiera dos sucesivos, digamos n y n + 1. El punto medio entre ellos es racional, y nos genera 2 intervalos de longitud 21 con extremos racionales. Tomamos el punto medio de cada uno de estos intervalos y obtenemos 22 nuevos intervalos de longitud 212 con extremos racionales. Otra vez tomamos puntos medios y obtenemos 23 intervalos de longitud 1 con extremos racionales, y así sucesivamente. El intervalo [n, n + 1] 23 considerado inicialmente se puede partir entonces en 2k intervalos de longitud 21k , todos ellos con extremos racionales, colocados uno a continuación de otro, lo cual podemos hacer para toda k ∈ N, y como 21k se puede hacer tan pequeño como queramos, resulta entonces que cualquier pedacito del intervalo [n, n + 1] tiene tantos racionales como se desee. Dado que esto sucede para toda n ∈ Z, tenemos que cualquier pedacito de la recta incluye entre sus puntos a una infinidad de racionales; es decir, que la recta está “tapizada” de racionales.[3] [3]
El concepto formal que recoge esta idea es el de densidad de un conjunto en otro: dados dos conjuntos A ⊂ B, decimos que A es denso en B si entre cualesquiera dos elementos de B siempre existe al menos un elemento de A. Lo que hemos argumentado más arriba es que el teorema 2.14, aunado al hecho de que los racionales incluyen a los enteros (que son un conjunto que se extiende tanto como se quiera en ambas direcciones en la recta), garantiza que los racionales son densos en la recta. Observemos que no podríamos haber obtenido esta propiedad del teorema 2.17, 1 } pues si dada n ∈ Z tomamos los conjuntos An = {x ∈ (Q∩[n, n+1]) : 0 ≤ x−n < 10 1 y Bn = {x ∈ (Q ∩ [n, n + 1]) : 0 ≤ n + 1 − x < 10 }, entonces An ∪ Bn es un conjunto sumergido en el intervalo [n, n + 1] que cumple que entre cualesquiera dos elementos suyos tiene una infinidad de elementos más, y sin embargo no cumple que entre cualesquiera dos elementos del intervalo [n, n + 1] siempre van a existir elementos de 1 1 , (n + 1) − 10 ] ⊂ [n, n + 1] y notar An ∪ Bn (basta con tomar el subintervalo [n + 10 que en él no hay ningún elemento de An ∪ Bn ). Entonces, si tomamos X=
∞ [
n=−∞
(An ∪ Bn ),
(2.1)
tenemos que X se extiende a lo largo de toda la recta (incluye a todos los enteros) y entre cualesquiera dos elementos de X existe siempre una infinidad de elementos de X mismo. Sin embargo, no es denso en la recta, pues esta tiene una infinidad de intervalos de longitud 45 distribuidos también a todo lo largo de sí misma, en donde no hay ningún elemento de X. Así es que el hecho de que los racionales cumplan el teorema 2.17 no garantiza que sean densos en la recta, mientras que el que cumplan
106
CONJUNTOS INFINITOS
Y ¿cómo lucen los naturales en comparación dentro de la recta?, avanzando a grandes pasos, uno después de otro, dejando grandes espacios entre ellos. Ejemplo 2.18. ¿Qué hay más, números racionales o números naturales? Solución. Aquí parece desproporcionada la comparación, y no tanto porque, como sabemos, Q ⊃ Z ⊃ N, pues también sabemos que entre los conjuntos infinitos tales contenciones no impiden la igualdad de cardinalidades, sino porque realmente parece extraordinariamente más abundante la cantidad de racionales que la de naturales. Sin embargo, encontrar una forma adecuada de presentar ordenadamente a todos los racionales nos hará pensar en esquemas ya conocidos. Empezando con los positivos, podemos enlistarlos por renglones, colocando en el primer renglón, en orden creciente del numerador, a los que tienen denominador 1, en el siguiente, a los que tienen el denominador 2, y así sucesivamente. Después reflejar todo hacia el lado izquierdo, para enlistar a los negativos, y por ahí en medio al cero. La siguiente imagen ilustra cómo quedarían acomodados. Antes que nada, observemos que aunque ahí están todos los racionales, muchos están repetidos (a la hora de simplificar su expresión resultan ser el mismo valor). Pero eso no representa mayor problema, pues al irlos numerando nos saltamos aquellos cuyo valor ya haya sido considerado previamente. Esta imagen nos recuerda el ejemplo 2.5 (ver figura 2.8). Tenemos varias opciones. Una, aplicar a la parte derecha del diagrama (es decir, a los racionales positivos) el mismo proceso de numeración por diagonales el teorema 2.14 sí lo hace. Aunque parezca una sutileza la diferencia entre los teoremas 2.14 y 2.17, esto no es así: el primero es más fuerte que el segundo. Otra forma de decir lo anterior es la siguiente: los conjuntos que cumplen que dados cualesquiera dos elementos suyos siempre tienen al menos otro que está entre ellos, se dice que son densos en sí mismos. El corolario 2.15 establece que los racionales son densos en sí mismos. Lo que hemos visto antes es que aunque un conjunto A se extienda a lo largo de otro conjunto B (a lo que nos referimos con esto es a que ∀ b ∈ B ∃ a, a0 ∈ A tales que a ≤ b ≤ a0 ), el hecho de que A sea denso en sí mismo no garantiza que A es denso en B. Mientras que si lo que cumple A -además de extenderse sobre todo B en el sentido dicho antes- es que dados cualesquiera dos elementos a, a0 ∈ A, a < a0 y dada cualquier magnitud r > 0, por pequeña que esta sea, siempre existen a1 , a2 , . . . , an ∈ A con a = a0 < a1 < a2 < · · · < an = a0 y (ak+1 − ak ) < r ∀ k = 1, 2, . . . , n, entonces sí queda garantizado que A es denso en B.
107
UN PRIMER ACERCAMIENTO A LOS RACIONALES
suroeste→noreste (SO→NE) que seguimos en aquel ejemplo, de modo que los racionales positivos serían numerables; caso idéntico el de los racionales negativos, y entonces su unión (junto con el cero) resultaría numerable.
...
−
4 1
−
3 1
−
2 1
−
1 1
...
−
4 2
−
3 2
−
2 2
−
...
−
4 3
−
3 3
−
2 3
−
...
−
4 4 .. .
−
3 4 .. .
−
2 4 .. .
−
1 1
2 1
3 1
4 1
...
1 2
1 2
2 2
3 2
4 2
...
1 3
1 3
2 3
3 3
4 3
...
1 4 .. .
1 4 .. .
2 4 .. .
3 4 .. .
4 4 .. .
0
...
Otra es ir alternando entre los positivos y los negativos cada vez que terminemos una diagonal, que podrían ser SO→NE en los positivos y SE→NO en los negativos. Una tercera es ver a los racionales por renglones (como hicimos antes con Z×Z): el primer renglón, de todos los que tienen denominador 1 (son tantos como los enteros, y por tanto es numerable); el segundo renglón, de todos los que tienen denominador 2 (numerable también por la misma razón); el tercer renglón, los de denominador 3, y así sucesivamente. ¿Cuántos renglones son?, tantos como números naturales. De modo que Q es igual a la unión de una familia numerable de conjuntos numerables, entonces es numerable. Hemos visto entonces distintos caminos que demuestran que: Teorema 2.19. El conjunto Q de los números racionales es un conjunto numerable. Antes de continuar mencionaremos tres detalles que utilizaremos en lo sucesivo. o Dos números enteros, m y n, se dice que son primos relativos si no tienen ningún divisor común (salvo el 1, claro). Esto es equivalente a
108
CONJUNTOS INFINITOS
decir que el máximo común divisor de ambos números es 1. La notación para indicar esto es (m, n) = 1. o Si (m, n) = 1, donde m ∈ Z, n ∈ N, todos los racionales de la forma con k ∈ N, que son una infinidad, tienen exactamente el mismo valor m (son el mismo número racional) que m n . Diremos entonces que n está expresado en su forma irreducible. km kn
o Dado cualquier racional, si expresamos su numerador y su denominador en términos de sus correspondientes factores primos (cosa que siempre podemos hacer gracias al Teorema Fundamental de la Aritmética), y simplificamos los factores comunes de ambos, obtenemos la : m ∈ forma irreducible del racional inicial. De modo que Q = { m n Z, n ∈ N, (m, n) = 1}. Es decir, para trabajar con los racionales basta con hacerlo con las expresiones irreducibles de los mismos, todos están representados ahí.
2.6.
Numerar, una forma de ordenar
Numerar los racionales (y de hecho, cualquier conjunto numerable) significa decir “primero este, después este, luego este . . . ” Es como si estableciéramos un orden distinto al usual entre ellos. ¿Cuál es el orden usual entre los racionales?, es ese al que se refieren implícitamente el teorema 2.17 y el corolario 2.16; es decir, el de su magnitud, el que determina cuál de dos racionales está a la izquierda m0 del otro en su ubicación en la recta. m n < n0 en el sentido usual ⇔ m m0 n−mn0 m0 > 0 ⇔ m0 n − mn0 > 0 ⇔ mn0 < m0 n. n0 − n > 0 ⇔ nn0 ¿Cuál es el orden que estaríamos estableciendo entre ellos al numerarlos con el procedimiento de las diagonales SO → NE? Si pensamos en los racionales irreducibles m n como parejas (m, n), y aplicamos la regla a la que llegamos en la solución del ejemplo 2.5, obtenemos lo siguiente: Supongamos primero que solo tenemos que ordenar los racionales positivos: como los que caen en una misma diagonal (digamos, la p-ésima) son aquellos con la suma de su numerador y su denominador constante (igual a p + 1), tenemos en primer lugar que si a = m n 0 cae en una diagonal menor que b = m n0 , entonces a ≺ b (usaremos esa notación para distinguir este nuevo orden del usual); es decir, si m0 m + n < m 0 + n0 ⇒ m n ≺ n0 . ¿Y qué pasa si caen en la misma diago-
NUMERAR, UNA FORMA DE ORDENAR
109
nal?, ahí la numeración respeta el orden de los numeradores, o sea que m0 0 si m + n = m0 + n0 , entonces m n ≺ n0 cuando m < m . En las dos reglas anteriores se resume cómo funciona este orden. Nos faltaría solo determinar cómo incluir a los racionales negativos y al cero, lo cual podría hacerlo estableciendo que el 0 sea el primer racional en ser numerado, y de ahí en adelante ir introduciendo cada racional negativo inmediatamente antes de su positivo correspondiente. Así las cosas, los racionales quedarían ordenados de la siguiente manera: 0 1 1 1 1 2 2 1 1 3 3 1 1 2 2 3 3 4 4 ,− , ,− , ,− , ,− , ,− , ,− , ,− , ,− , ,− , , 1 1 1 2 2 1 1 3 3 1 1 4 4 3 3 2 2 1 1 1 1 5 5 1 1 2 2 3 3 4 4 5 5 6 6 − , ,− , ,− , ,− , ,− , ,− , ,− , ,− , ,... 5 5 1 1 6 6 5 5 4 4 3 3 2 2 1 1 Siguiendo este nuevo orden, pasamos por todos los racionales una sola vez (eso nos permite decir que la relación de orden ≺ que recién introdujimos cumple que dados en su forma irreducible a, b ∈ Q, a 6= b, siempre ocurre que a ≺ b, o bien b ≺ a). Por otro lado, si un racional es numerado antes que otro (es decir, es ≺ que él), y este a su vez antes que otro, podemos decir que el primero fue numerado antes que el tercero. Las propiedades anteriores (llamadas respectivamente tricotomía y transitividad) también las cumple el orden usual de Q. Ellas definen básicamente lo que se entiende por un conjunto ordenado. Definición 3. Decimos que un conjunto X es ordenado (o simplemente ordenado, o linealmente ordenado) si se puede definir una relación ≺ entre sus elementos tal que: 1) ∀ x, y ∈ X una “y solo una” de las tres siguientes cosas ocurre: x ≺ y, y ≺ x o x = y. 2) Si x ≺ y y y ≺ z entonces x ≺ z. Un conjunto X con sus elementos ordenados a través de la relación de orden ≺ lo denotamos con el símbolo X≺ . Pedir la condición 1 ) es equivalente a pedir que se cumplan las dos condiciones siguientes: 1 ’) Si x 6= y =⇒ x ≺ y o y ≺ x. (1”) x ⊀ x. o Q es un conjunto ordenado, tanto con el orden usual como con el nuevo orden ≺ definido. Sin embargo, hay una propiedad que vimos que no cumple Q con el orden usual y que es inmediato que sí la cumple con
110
CONJUNTOS INFINITOS
el orden ≺: dado cualquier elemento de Q, siempre existe el siguiente. Y otra más: con el orden usual, si tomamos por ejemplo {x ∈ Q : x > 1}, este subconjunto de Q (y muchos otros) no tiene un primer elemento, mientras que con el orden ≺ sí lo tiene: es el − 21 , lo cual ocurre con cualquier subconjunto no vacío de Q. Hay entonces dos propiedades que cumple ≺ pero no cumple 1. √ Demostración. Supongamos que N p es racional, es decir que existen m, n ∈ N, (m, n) = 1 tales que √
N
p=
mN m =⇒ p = N =⇒ mN = p · nN . n n
Pero entonces el número de primos del lado izquierdo de la última igualdad es un múltiplo de N , y del lado derecho es uno más que un múltiplo de N , lo cual es una contradicción siendo N > 1 (aN + 1 no es múltiplo de N , si N > 1).
(a) Espiral de Teodoro.47
Figura 2.14
(b) Extensión de la√Espiral de Teodoro hasta 54.48
118
CONJUNTOS INFINITOS
√ √ √ √ √ De modo que 3, 5, 3 7, 6 29, 10 101, . . . son todos números irracionales. En los ejercicios veremos que utilizando argumentos similares a los que hemos utilizado se puede probar la irracionalidad de más números.
2.7.1.
Pruebas no constructivas: tres ejemplos elegantes
En el ejercicio 10 se plantea una alternativa para probar la irracionalidad de determinado tipo de números. En esta sección veremos tres resultados particulares que no son propiamente criterios de irracionalidad en general, pero señalan otro tipo de procedimiento para resolver las cosas. En abril de 1973 los matemáticos J. P. Jones y S. Toporowski publicaron un artículo en la revista norteamericana American Mathematical Monthly,49 al que dieron por nombre Irrational Numbers, en el que ponen en práctica de forma elegante lo que se conoce como pruebas no-constructivas para demostrar algunos resultados. Veamos éstos y las pruebas en cuestión. Teorema 2.27. Un número irracional elevado a una potencia irracional puede ser racional. √
√
√ 2
√ 2 Demostración. Como = ( 2) = 2, tenemos lo siguiente: si 2 √ √2 ( 2) fuese racional ya habríamos terminado; si no, el anterior sería nuestro ejemplo.
2
Teorema 2.28. Un número irracional elevado a una potencia irracional puede ser irracional. Demostración. Partamos ahora de la identidad √ √2+1 √ √2 √ = ( 2) 2. ( 2) √ √2 √ √2+1 Si ( 2) es irracional ya acabamos, si no, entonces ( 2) es el número que buscamos, pues el producto de un irracional por un racional distinto de cero siempre resulta un irracional. Teorema 2.29. Un número racional elevado a una potencia irracional puede ser irracional.
INCONMENSURABILIDAD, PITAGÓRICOS Y EUDOXO
Demostración. Como 2
√
2
√ 2 4
1
= 22 =
√
119 √
2, tenemos lo siguiente: si 2
es irracional, ya acabamos; si es racional, 2 buscamos.
√
2
2
√
2 4
sería el número que
Nótese que a final de cuentas no hay un número concreto propuesto √ √2 fue que cumpla lo que se pide, y al terminar no sabríamos si ( 2) racional o irracional. √ √2 o En realidad se sabe que ( 2) es un número irracional. Se trata de un ejemplo particular del 7◦ de los 23 problemas planteados por Hilbert a los matemáticos del mundo en el Congreso de 1900 (ver pág. 195), que decía lo siguiente: Demostrar que αβ es un número irracional trascendente cuando α es algebraico y distinto de 0 y 1, y β es irracional y algebraico.[6] En 1929 el matemático soviético A. O. Gelfond lo demostró para el caso en que β es√ un irracional cuadrático (lo cual ya resuelve el caso √ 2 específico de 2 ), y en 1934 lo demostró en general. Es importante subrayar que la demostración anterior no requiere de estos resultados, que desde luego son mucho más potentes, pero que es mucho más difícil de probar; requiere simplemente de la aplicación, ingeniosa y elegante, del principio del tercero excluido (y de que se nos ocurran los ejemplos adecuados).
2.8.
Inconmensurabilidad, pitagóricos y Eudoxo
Se dice que dos magnitudes, a, b (> 0), son conmensurables entre sí, si existe cierta magnitud u∗ (> 0) que cabe un número exacto de veces tanto en a como en b. O sea, si existen m, n ∈ N tales que a = mu∗ , b = nu∗ , de modo que, en el lenguaje de las proporciones, a : b :: m : n; es decir,
a m = . b n
Las magnitudes conmensurables entre sí son aquellas cuya razón corresponde a un racional. [6] El significado de los conceptos de número algebraico y número trascendente se analiza en la sección §3.4.4.
120
CONJUNTOS INFINITOS
Los pitagóricos pensaban que todas las magnitudes eran conmensurables entre sí. El origen de la idea parece encontrarse en su convicción de que el espacio estaba compuesto por puntos (indivisibles) y cualquier magnitud finita contenía tan solo un número finito de ellos. Esto, en correspondencia con su teoría de que toda la materia estaba compuesta por átomos —partículas indivisibles— y cualquier objeto solo podía contener un número finito de los mismos, de modo que era posible representar cada objeto con el número de átomos que contenía: los números son la esencia de todas las cosas.50 Y sobre esa base desarrollaron sus primeras pruebas geométricas. Veamos un ejemplo (por supuesto, utilizando la notación actual). Proposición 1. Dados dos triángulos con la misma altura, la razón entre sus áreas es la misma que la razón entre sus bases. Se trata de la Proposición 1 del Libro VI de Los Elementos de Euclides, pero allí se demuestra de manera diferente (se trata más adelante), pues no presupone que las bases sean conmensurables entre sí. En la demostración se utiliza otra propiedad discutida previamente (que también se demuestra en Los Elementos (Libro I, Proposición 38)), que dice que si dos triángulos tienen la misma altura y la misma base, sus áreas son iguales. Demostración. (∼ 1. Suponiendo conmensurabilidad) Tomemos dos triángulos, ABC y DEF , con la misma altura. Si suponemos la conmensurabilidad entre las bases, sabemos que existe u∗ tal que BC = n · u∗ , EF = m · u∗ , n, m ∈ N.
Dividimos entonces BC y EF en n y m partes iguales, respectivamente (ver figura 2.15). Esto genera n subtriángulos ABi−1 Bi del ABC, y m subtriángulos DEj−1 Ej del DEF , unos y otros con bases de igual longitud u∗ = Bi−1 Bi = Ej−1 Ej y la misma altura considerada inicialmente, ∴ Área(ABi−1 Bi ) = Área(DEj−1 Ej ) = ∆, y entonces Área(ABC) = n · ∆,
Área(DEF ) = m · ∆,
de modo que Área(DEF ) EF m = . = n BC Área(ABC)
INCONMENSURABILIDAD, PITAGÓRICOS Y EUDOXO
121
Figura 2.15
El descubrimiento de los inconmensurables planteaba entonces un serio problema: las demostraciones hechas suponiendo la conmensurabilidad general de las magnitudes —como la anterior—, había que volverlas a hacer; y eso, después de entender bien cómo comparar a las magnitudes inconmensurables, cosa que no resultaba nada fácil. Pero no solo eso, la filosofía pitagórica misma estaba en un aprieto: el número se suponía que era la esencia de todas las cosas, y sin embargo no había dos números que pudieran representar ni siquiera la razón entre la diagonal y el lado de un cuadrado cualquiera. Hay diversas apreciaciones sobre la dimensión del golpe sufrido por los pitagóricos por el descubrimiento de los inconmensurables. Unos historiadores consideran que el hecho causó una verdadera crisis entre ellos. Es conocida la versión de que los pitagóricos decidieron mantener en estricto secreto el descubrimiento, que sería revelado tan solo a unos cuantos miembros de la dirección de su secta (no olvidar que, a la vez que una escuela de matemáticas, formaban una secta religiosa), y que fue el propio descubridor (Hipaso de Metaponto) quien se encargó de hacer público su hallazgo, lo cual le valió la condena de sus correligionarios. Se dice desde que en vida le fue erigida una tumba con su nombre, para manifestar que para sus compañeros estaba muerto, hasta que fue ahogado en el mar como castigo. Otros historiadores piensan que si bien se vieron obligados a repensar todas las cosas, es exagerado decir que se trató de una profunda crisis en su seno (objetan la validez histórica de los registros más antiguos con los que se cuenta sobre este hecho, dado que fueron escritos 700 años después de ocurrido (Pappus de Alejandría (290-350) y Jámblico
122
CONJUNTOS INFINITOS
de Apamea (331-363)). Incluso hay polémica sobre la fecha exacta del descubrimiento, aunque parece haber consenso en que tuvo que ser entre el año 500 y el año 430 a. n. e.51 Lo cierto es que fue un descubrimiento que tuvo una enorme relevancia en el desarrollo de toda la matemática posterior. Es significativa la evaluación de B. Russell52 al respecto: El problema surgido con el descubrimiento de los inconmensurables probó al paso del tiempo ser uno de los más severos y a la vez de más largo alcance que ha enfrentado el intelecto humano en su esfuerzo por comprender el mundo. Todo parece indicar que la imposibilidad de representar con números cualquier magnitud fue determinante en el desarrollo de la matemática griega de la época clásica, habiendo permanecido inmersa fundamentalmente en el terreno de la geometría. La creación de números para representar cualquier punto de la recta requería de una aritmética más avanzada que tardaría más de 2,300 años en madurar (aunque ya desde alrededor del año 1,000 de nuestra era los árabes dieron un paso decisivo en esa dirección). Recordemos que las construcciones con regla y compás, características de la geometría de la época, se hacían considerando una regla sin medidas marcadas en ella (sin números). Las magnitudes se comparaban, no se medían. En Los Elementos, por ejemplo, por número se entendía a los enteros positivos del 2 en adelante. Las fracciones pq no eran consideradas como números en sí, sino como relaciones entre números. Eso trajo consigo el lenguaje de las proporciones: lo que hoy consideramos una igualdad entre dos representaciones numéricas de una misma magnitud, como 12 y 42 , era entendido como una proporción entre dos razones: 1 es a 2 como 2 es a 4. Proporciones entre magnitudes conmensurables. Pero las proporciones eran formuladas incluso entre magnitudes inconmensurables (áreas, volúmenes, longitudes), independientemente de que estas no fueran representadas por razones entre números, de tal manera que las demostraciones debían ser válidas también en ese caso. o Quien vino a resolver este problema, varias décadas después, fue Eudoxo de Cnido (406-355 a. n. e.), uno de los matemáticos griegos más brillantes de la época clásica (anterior a la llamada época dorada, que tardó otro siglo en florecer, con Arquímedes a la cabeza). A partir de los trabajos de Teodoro y Teeteto, Eudoxo (amigo de Platón) resolvió
INCONMENSURABILIDAD, PITAGÓRICOS Y EUDOXO
123
varios problemas que marcarían la historia del cálculo y el análisis hasta nuestros días. Tres de particular importancia fueron: 1 ) El método de exhaución (mencionado de pasada en la lista de ejercicios del capítulo 1), que prefiguraría lo que luego sería la integral (y en el fondo, el concepto mismo de límite). 2 ) La propiedad arquimedeana (ver sección §7.5), de la que el mismo Arquímedes dio el crédito a Eudoxo, y cuya inclusión en los considerandos teóricos resulta esencial para la teoría de convergencia, a la vez que su exclusión representa el punto de partida de lo que se conoce como el análisis no estándar. 3 ) Una teoría de proporciones válida tanto para magnitudes conmensurables como inconmensurables (a diferencia de la teoría de proporciones de los pitagóricos), que sería la clave para una de las soluciones que finalmente tuvo la representación numérica de los puntos de la recta; es decir, la construcción de los números reales (nos referimos a la solución propuesta por R. Dedekind en la segunda mitad del siglo xix). ¿Qué hizo Eudoxo para comparar dos razones de magnitudes geométricas, fueran conmensurables o inconmensurables entre sí? Sean a, b dos magnitudes del mismo tipo (longitudes, áreas, volúmenes); sean c, d también dos magnitudes del mismo tipo, aunque no necesariamente del de a y b. Con los conceptos y la herramienta actual, diríamos que la idea consiste en decir que a c = ⇐⇒ b d 1 ) Todos los racionales a la derecha de ab están a la derecha de dc . 2 ) Todos los racionales a la izquierda de ab están a la izquierda de dc . 3 ) Si un racional es igual a ab , entonces es igual a dc . Pero lo anterior presupone que ya se sabía comparar razones cona m c mensurables con otras eventualmente inconmensurables ( m n > b , n > d, etc.), cuando en realidad eso era parte de lo que se quería definir. Esto se evita planteando las cosas de la siguiente manera: Definición 5. a : b = c : d ⇐⇒ Dadas cualesquiera m, n ∈ N : 1) Si mb > na =⇒ md > nc.
2) Si mb < na =⇒ md < nc. 3) Si mb = na =⇒ md = nc. Cuando se trata de magnitudes conmensurables, la tercera condición es suficiente; cuando no, las otras dos en mancuerna resuelven la situación.
124
CONJUNTOS INFINITOS
a c < ? b d Cuando existe un racional que es mayor que el izquierdo y menor que el derecho. O dicho de otra manera: ¿Y cuándo diremos que
Definición 6. a : b < c : d ⇐⇒ ∃ m, n ∈ N tales que na < mb y md < nc. Esto, como se dijo, en el fondo corresponde a identificar cada irracional en términos de los racionales que se encuentran a su derecha y a su izquierda. Es lo que hizo R. Dedekind en 1872 para definir los números irracionales (basándose en los racionales). Euclides retomó la solución dada por Eudoxo en el Libro V de Los Elementos (de hecho, las definiciones discutidas corresponden a la definición 5 y 7 de ese volumen), y abre el Libro VI con una demostración de la misma propiedad que vimos, pero realizada a través de las nuevas definiciones. Con ello lograba extender su validez al caso en que las magnitudes consideradas fueran inconmensurables. Seguiremos la idea de aquella demostración, con cambios en las figuras, notaciones y otros detalles. Demostración. (∼ 2. Sin suponer conmensurabilidad) La demostración utiliza algo que Euclides probó antes (Libro I, Proposición 38), que ya mencionamos: si dos triángulos con la misma altura tienen la misma base, sus áreas son iguales. Pero en esa prueba queda claro que si teniendo la misma altura, la base de uno es menor (mayor) que la del otro, la misma relación guardarán entre sí las áreas. En lo que haremos a continuación llamaremos (∗) a esta propiedad. Sean ABC y DEF dos triángulos de igual altura, con bases BC y EF que ubicaremos en una misma línea horizontal. Sean m, n ∈ N. De acuerdo con la definición 5, lo que tendríamos que demostrar es: 1) Si m · EF > n · BC =⇒ m · Área(DEF ) > n · Área(ABC). 2) Si m · EF < n · BC =⇒ m · Área(DEF ) < n · Área(ABC). 3) Si m · EF = n · BC =⇒ m · Área(DEF ) = n · Área(ABC). Coloquemos el segmento BC a continuación de sí mismo hasta obtener n segmentos contiguos de longitud total n · BC; bauticemos a los extremos de estos segmentos como B0 = B, B1 = C, B2 , . . . Bn y unamos cada uno de estos puntos con A. De esta manera, hemos generado n triángulos que en conjunto forman un nuevo triángulo ABBn cuya área es n veces el área del triángulo ABC inicial.
UN PRIMER ACERCAMIENTO A LOS REALES
125
Hacemos lo mismo m veces con el segmento EF (ver figura 2.16), y obtenemos que
Figura 2.16
EEm = m · EF, BBn = n · BC
(2.3)
Área(DEEm ) = m · Área(DEF ), Área(ABBn ) = n · Área(ABC) (2.4) Demostración de (1): (2.3)
Si m · EF > n · BC =⇒ (∗)
EEm > BBn =⇒ (2.4)
Área(DEEm ) > Área(ABBn ) =⇒ m · Área(DEF ) > n · Área(ABC).
La demostración de los incisos 2) y 3) es análoga.
2.9.
Un primer acercamiento a los reales
Imaginen que deben explicarle a alguien que no ha aprendido a hacerlo cómo medir distancias rectas utilizando una regla de un metro de largo, con decímetros, centímetros y milímetros marcados en ella. ¿Qué le
126
CONJUNTOS INFINITOS
dirían? Probablemente algo como lo siguiente (hagan ustedes su propia redacción): Supón que debes medir la distancia desde un punto O hasta un punto P . Piensa que trazas una recta desde O hasta P . Como empezarás a medir desde O, ese es tu 0. Coloca el metro (tu unidad de medida) a continuación de sí mismo a partir de O tantas veces como sea necesario hasta alcanzar el punto P ; si no cabe un número exacto de veces, recién lo rebases, te regresas a la vez inmediata anterior. Anota cuántas unidades cupieron completas. ¿Qué número pudo ser el que anotaste?, o un natural, o cero (si la distancia total hubiese sido menor que un metro). Llámale A a ese número. Si llegaste exactamente al punto, ya acabaste; si no, toma la primera división de tu unidad de medida, los decímetros (la décima parte de tu unidad). Ahora anota cuántas veces cabe completa esa subunidad sin rebasar al punto P . ¿Qué número pudo ser el que recién anotaste?, uno entre 0 y 9. ¿Pudo ser 0?, sí, si ocurrió que no cupiera ni un decímetro completo. ¿Por qué no puede ser 10 o más?, porque si así fuera eso querría decir que habría cabido al menos una unidad completa más (un metro más) en el primer paso del procedimiento (y estamos suponiendo que las instrucciones se siguen al pie de la letra). Llámale entonces a1 al número de veces que cupo tu primera subunidad completa. Si en el paso anterior ya llegaste a P exactamente, tu distancia fue A metros, a1 decímetros. O A.a1 metros, donde A ∈ N ∪ {0} y a1 ∈ {0, 1, 2, . . . , 9}. Si aún no llegas, toma la siguiente subunidad de tu regla, los centímetros, que caben 10 veces cada uno en la subunidad anterior (los decímetros), y anota cuántos de ellos caben completos antes de P . ¿Cuál pudo ser este valor?, otra vez cualquier entero entre 0 y 9, pues cada centímetro cabe 10 veces en un decímetro, que es la subunidad anterior. Luego haces lo propio con los milímetros. Tu resultado, aproximado con un margen de error de menos de un milímetro, sería que OP ≈ A m + a1 dm + a2 cm + a3 mm = A.a1 a2 a3 m, donde A ∈ N ∪ {0} y a1 , a2 , a3 ∈ {0, 1, 2, . . . , 9}. Por lo general una aproximación de milímetros a una distancia del orden de metros puede ser bastante buena. Pero si lo que nos interesa ahora es representar cada punto de la recta con un número distinto, lo anterior aún no resuelve el problema. Tendríamos que seguir adelante con diezmilésimos de la unidad original, y cienmilésimos, y millonésimos, y puede suceder que se requiera un proceso infinito para represen-
UN PRIMER ACERCAMIENTO A LOS REALES
127
tar unívocamente al punto, como ocurre por ejemplo con el 31 , que como sabemos, a cada nueva división en diez de la subunidad en turno necesitamos tomar tres ejemplares y volver a dividir para acercarnos más, en un proceso que nunca termina.
2.9.1.
Las expansiones decimales
¿Cómo podríamos formular en general lo que acabamos de decir? Sea P un punto en la recta, por ahora a la derecha del origen O. Tomemos una unidad u = u0 cualquiera, y dividámosla una y otra vez en subunidades u1 , u2 , . . . uk , . . . , tales que cada nueva subunidad quepa diez veces en la anterior.[7] Es decir, uk = 10 uk+1 ∀ k = 0, 1, 2, . . . Entonces OP =Au + a1 u1 + a2 u2 + · · · + ak uk + . . . ,
(2.5)
OP =A.a1 a2 . . . ak . . .
(2.6)
o bien
donde A ∈ N ∪ {0}, ak ∈ {0, 1, 2, . . . 9} ∀ k ∈ N. Si el punto P hubiese estado a la izquierda del origen, todo lo anterior sería igual, solo que afectado globalmente por un signo negativo. Esto nos permite asociar un número de nuevo tipo a cada punto P en la recta, que sería lo que se conoce como una expansión decimal infinita: P → ± (A.a1 a2 . . . ),
(2.7)
donde A ∈ N ∪ {0}, ak ∈ {0, 1, 2, . . . 9} ∀ k ∈ N.
El algoritmo de construcción que seguimos (las instrucciones descritas) nos permite decir que a puntos distintos de la recta le asociamos expansiones infinitas diferentes, pero ¿es válido lo inverso?; es decir, ¿sucede que a expansiones decimales diferentes les corresponden a su vez distintos puntos? Para responder esto debemos precisar primero cómo sería el algoritmo inverso, que nos permitiría identificar a qué punto de la recta asociarle a una expansión dada. Parece más o menos inmediato, si la [7]
En realidad la división no tiene por qué ser en diez partes; si lo hacemos siempre en dos, por ejemplo, obtenemos la representación binaria del punto, teniendo para ello que expresar también en base dos el número entero de veces que cabe la unidad antes del punto. Más adelante nos detendremos en esto (ver pág.154 y sección §6.3).
128
CONJUNTOS INFINITOS
expansión tiene signo más, nos movemos hacia la derecha; si tiene signo menos, hacia la izquierda. Tomamos las unidades enteras de nuestro número y avanzamos esa distancia en la dirección correspondiente. Después hacemos lo propio con el número de décimas partes de la unidad, las centésimas, y así sucesivamente. Si todo marcha bien nos iremos acercando paulatinamente a un único punto de la recta, y es ese el punto que asociamos a nuestra expansión decimal dada. Si solo trabajáramos con las expansiones finitas no habría ambigüedad posible. El problema es cuando se combinan estas con las expansiones infinitas. Pensemos por ejemplo en el 1. Siguiendo el procedimiento anterior, le correspondería el punto ubicado exactamente a una unidad a la derecha del origen. Llamemos U a ese punto en la recta. Ahora consideremos la expansión 0.999 . . . De acuerdo con el procedimiento descrito, para saber qué punto en la recta le corresponde, deberemos avanzar 9 décimos a la derecha, luego 9 centésimos, 9 milésimos, y siempre 9 subunidades (el máximo posible de cada nueva división), sea cual sea la subunidad considerada. ¿Qué punto le correspondería?, ¿podría ser uno ubicado a la derecha de U ?, no, porque en ese caso nuestra expansión no habría podido tener un 0 en la parte entera. ¿Podría ser uno a la izquierda de U ?, ¿qué tan a la izquierda?, porque si está a la izquierda implica que es diferente de él, en este caso menor. Pero eso querría decir que hay una distancia positiva entre él y U . Sin embargo, con la expansión 0.999 . . . , a cada paso que damos vamos quedando a la décima parte de lo que nos faltaba en el paso anterior para llegar al 1, y eso se puede hacer tan pequeño como queramos. Sucede algo similar a cuando analizamos la serie geométrica 12 + 212 + 213 + . . . (ver ejemplo 1.2, pág. 2), en que a cada paso avanzábamos la mitad de la distancia que nos separaba del 1 en el paso previo, solo que ahora en cada paso 9 avanzamos 10 partes de lo que nos faltaba en el paso anterior. Y es que aquí en realidad estamos trabajando con otra serie geométrica, que es ∞ X 9
k=1
10k
=9·
∞ X 1
k=1
10k
(1.5)
= 9
1 10
1−
1 10
!
=9
1 10 9 10
!
=9
1 9
= 1.
Esto que sucede con el punto ubicado a una unidad a la derecha del origen, ocurre en realidad con cualquier punto P de la recta que corresponda a una expansión finita, pues si a A.a1 a2 . . . aN −1 aN le
UN PRIMER ACERCAMIENTO A LOS REALES
129
asociamos el punto P , siendo aN el último dígito distinto de cero, a la expansión infinita A.a1 a2 . . . aN −1 (aN − 1)999 · · · le corresponderá el mismo punto P. Las expresiones anteriores quizás resulten más claras si separamos con comas los dígitos de cada posición: Si aN > 0 : A.a1 , a2 , . . . aN −1 , aN −→ P
⇐⇒ A.a1 , a2 , . . . aN −1 , (aN − 1), 9, 9, · · · −→ P.
(2.8)
En otras palabras, las colas infinitas de 9’s y los números con expansión decimal finita se duplican; corresponden, por parejas, a un mismo punto de la recta. Es decir, la relación (2.7) no es biunívoca, para serlo debemos retirar de las expansiones las finitas, o bien las colas infinitas de 9’s (es decir, las que constan solo de 9’s a partir de algún momento). De lo que acabamos de discutir se desprende adicionalmente la siguiente conclusión: Las expansiones decimales finitas tienen la misma cardinalidad (2.9) que las colas infinitas de 9’s. ¿Cómo podemos representar con símbolos a las colas infinitas de 9’s? Intenten describirlo ustedes mismos. Deberán llegar a una formulación equivalente a la siguiente: Si llamamos T = {colas infinitas de 9’s} T = {±(A.a1 a2 . . . ) : ∃ N ∈ N tal que ak = 9 ∀ k > N }. Entonces, si denotamos con R a la recta, tendremos, ahora sí, que R ←→ {±(A.a1 a2 . . . ) : A ∈ N ∪ {0}, ak ∈ {0, 1, 2, . . . 9} ∀ k ∈ N} \ T . (2.10)
Los números reales (universalmente denotados con la letra R) son precisamente los números que se introducen para representar los puntos de la recta. De modo que tenemos ya una primera definición de ellos, que será de suma utilidad. Definición 7. R = {±(A.a1 a2 . . . ) : A ∈ N ∪ {0}, ak ∈ {0, 1, 2, . . . 9} ∀ k ∈ N} \ T .
130
CONJUNTOS INFINITOS
Sobre lo que implícitamente se fue considerando hasta llegar a este punto —y las discusiones correspondientes a las implicaciones de ello— hablaremos en los capítulos 6 y 7. Por ahora el objetivo es tener un primer acercamiento a los números reales que nos permita simplemente trabajar con su cardinalidad.
2.9.2.
Los intervalos y la recta
Visto que hablar de los reales y hablar de la recta en el fondo será lo mismo, empezaremos por comparar cardinalidades de ciertos conjuntos inmersos en la recta: los intervalos. Ejemplo 2.30. ¿Qué hay más, puntos en el [0, 1] o en el [0, 2]? Solución. Lo comentado en la página 87 sobre circunferencias de radio distinto y lado-diagonal de un cuadrado, nos plantea que la respuesta es que uno y otro intervalo tienen la misma cardinalidad. Para probarlo tenemos que exhibir una forma de aparear los puntos de uno y otro intervalo. La idea en realidad es muy simple: geométricamente lo que hacemos es colocar un intervalo debajo de otro y trazar una recta que una sus extremos izquierdos y otra que una sus extremos derechos; dada la diferencia de longitudes de ambos intervalos, estas rectas no podrán ser paralelas, sino que se intersecarán en un punto P . Ese es el punto clave: cualquier recta que tracemos desde ahí a un punto arbitrario de uno de los dos intervalos, prolongada hasta el otro lo interseca en un único punto. Y puntos distintos generan rectas con pendientes diferentes que no tienen más punto en común que P . Esa correspondencia es biunívoca (ver figura 2.17).
Figura 2.17
UN PRIMER ACERCAMIENTO A LOS REALES
131
Si queremos una biyección explícita, esta podría ser f : [0, 1] → [0, 2], f (x) = 2x (en la sección §A.4 vimos que cualquier recta no horizontal —ni vertical, obviamente— es una función biyectiva). De hecho, la gráfica de la función nos ofrece otra manera de aparear los elementos de dos conjuntos (dominio e imagen) (ver figura 2.18).
Figura 2.18
De modo que ambos intervalos tienen exactamente la misma cantidad de puntos. La cardinalidad y la longitud son dos conceptos diferentes. Nótese que nuestro argumento no fue que tenían la misma cardinalidad “porque ambos son infinitos”. Nuestro único criterio por ahora para comparar la cardinalidad de dos conjuntos es la definición 1 (pág. 97), y es el que utilizamos. Una demostración prácticamente idéntica nos permite probar que: Proposición 2. Dados cualesquiera dos intervalos [a, b] y [c, d], estos tienen la misma cardinalidad. (El resultado y los argumentos dados a continuación son igualmente válidos si ambos intervalos fuesen abiertos). Recordemos que la definición de un intervalo [a, b] cualquiera presupone que a < b. Demostración. Tenemos las mismas dos alternativas vistas en el ejemplo anterior. La función biyección en este caso sería f : [a, b] → [c, d], f (x) = d−c b−a (x − a) + c, que es simplemente la ecuación de la recta que pasa por (a, c) y (b, d). Como a < b se trata de una recta no vertical, y como c < d, con pendiente distinta de cero. Entonces es una función biyectiva (ver figura 2.19).
132
(a) Distinta longitud.
CONJUNTOS INFINITOS
(b) Igual longitud.
(c) Otra alternativa: A través de la gráfica de la recta que une los puntos (a, c) y (b, d).
Figura 2.19
Así las cosas, tenemos que, por ejemplo, el intervalo [0, 0.000000000001] y el intervalo [0, 1000000000000] tienen exactamente la misma cantidad de puntos. Pero ¿sucederá lo mismo si uno de los dos no solo es “muy grande”, sino de longitud infinita? Ejemplo 2.31. ¿Qué hay más: puntos en el (0, 1) o en el (−∞, ∞)? Solución. La respuesta es que los dos conjuntos tienen otra vez exactamente la misma cantidad de puntos. Exhibiremos dos alternativas geométricas posibles para establecer el apareamiento. La segunda de ellas requiere más herramienta para ser formalizada, pero la idea es bastante transparente. Representamos al intervalo (−∞, ∞) como el eje X, y ubicamos al intervalo (0, 1) en el eje Y . Trazamos dos segmentos de recta, L y L0 , el primero del punto (0, 21 ) al punto ( 21 , 1), el segundo del punto (0, 0) al punto (− 12 , 12 ) (ver figura 2.20). Nuestro objetivo es asociar a cada punto del eje X un único punto del (0, 1) en el eje Y . La regla de apareamiento es la siguiente: 1 ) Dado cualquier punto P de (0, ∞), trazamos el segmento de recta que une a P con el punto A(0, 1). Es fácil probar que este segmento se interseca con L en un punto P 0 (basta operar con las ecuaciones de las rectas correspondientes). La proyección de P 0 sobre el eje Y (es decir la segunda componente de la pareja ordenada que describe a P 0 ), nos resulta un punto P 00 en el intervalo ( 12 , 1), que es el que apareamos con P . Para puntos diferentes en (0, ∞), la recta que los une con el punto A (fijo) tiene diferentes pendientes, y por lo tanto su intersección con
UN PRIMER ACERCAMIENTO A LOS REALES
133
L (fija) ocurre en puntos distintos, que siendo L creciente, al proyectarlos sobre el eje Y nos da como resultado puntos a su vez distintos; es decir, si P1 6= P2 =⇒ P10 6= P20 =⇒ P100 6= P200 . O sea que la función de apareamiento que construimos del (0, ∞) al (0, 1) resulta inyectiva. El proceso es válido también de regreso, de manera que se establece una correspondencia biunívoca entre el intervalo (0, ∞) en el eje X y el intervalo ( 12 , 1) en el eje Y .
Figura 2.20
2 ) El procedimiento para el intervalo (−∞, 0) es completamente análogo, solo que uniendo sus puntos ahora con el punto B(0, 12 ) e intersecando los segmentos con L0 . 3 ) Finalmente, el 0 ∈ (−∞, ∞) lo apareamos con el 21 del eje Y , y con eso terminamos. Una segunda posibilidad es formar las parejas tomando los puntos de la gráfica de una función continua e inyectiva (creciente, por ejemplo), que mapee todo el eje X en el intervalo (0, 1) del eje Y . Una curva creciente y asintótica a la recta y = 1 cuando x → ∞, y al eje X cuando x → −∞, resuelve las cosas. La figura 2.21 es un ejemplo de ello. Un análisis prácticamente idéntico nos lleva a que, en general, ∀ a, b ∈ R,
2.9.3.
|(a, b)| = |R|.
(2.11)
La cardinalidad de los reales
Ahora nos haremos una pregunta que se hizo Cantor, cuya respuesta vino a revolucionar toda la matemática:
134
CONJUNTOS INFINITOS
Figura 2.21
¿Qué hay más, puntos en la recta o números racionales? Ya sabemos que el número de racionales es idéntico al número de naturales, que la recta la representamos con los números reales, y que preguntarnos si un conjunto tiene la cardinalidad de los naturales equivale a preguntarnos si es numerable. De modo que la pregunta podría plantearse así: ¿Es numerable el conjunto de los números reales? Como la cardinalidad de toda la recta es idéntica a la del intervalo (0, 1), la pregunta se reduce a lo siguiente: ¿Es numerable el conjunto de los números reales en el (0, 1)? Empecemos por ver quiénes serían los reales del (0, 1). De acuerdo con la definición 7, serían los números de la forma 0.a1 a2 . . . : ak = 0, 1, . . . 9 ∀ k ∈ N,
(2.12)
que no sean todos iguales a cero (pues el 0 ∈ / (0, 1)), ni todos iguales a 9 a partir de algún momento (pues hay que retirar las colas infinitas de 9’s). o Supongamos que los reales del (0, 1) forman un conjunto numerable. Eso significa que hay una forma de aparearlos con los naturales, con la cual no sobra ni un elemento en ninguno de los dos conjuntos.
UN PRIMER ACERCAMIENTO A LOS REALES
135
Llamemos α1 = 0.a1 a2 a3 a4 . . . al elemento que asociemos al 1 ∈ N.
α2 = 0.b1 b2 b3 b4 . . . al elemento que asociemos al 2 ∈ N.
α3 = 0.c1 c2 c3 c4 . . . al elemento que asociemos al 3 ∈ N.
α4 = 0.d1 d2 d3 d4 . . . al elemento que asociemos al 4 ∈ N. .. .. . .
Nótese que la descripción de los números que hacemos corresponder a cada natural, permite que haya sido cualquiera de los reales del (0, 1) el que ocupe uno u otro lugar en el apareamiento. No hemos particularizado la regla de correspondencia, pero de existir una sería necesariamente como esta. ¿Qué pasaría si pudiéramos exhibir un real del (0, 1) que no está en la lista? Eso querría decir que a cualquier apareamiento le faltarían reales por incluir; es decir, que los reales no pueden ser numerados, no hay correspondencia biunívoca alguna capaz de incluirlos a todos. Pues bien, sea β = 0.x1 x2 x3 x4 . . . cualquier elemento del (0, 1) que cumpla la siguiente regla: x1 6= a1 , x2 6= b2 , x3 6= c3 , x4 6= d4 , . . .
(2.13)
La primera condición garantiza que β 6= α1 , la segunda que β 6= α2 , la tercera que β 6= α3 , la cuarta que β 6= α4 , . . . ; es decir, que β es distinto de todos los de la lista. Si se quisiera, se podría especificar qué valor asignarle a cada xi . Por ejemplo, si llamamos aii a la i-ésima cifra decimal de αi , podríamos dar la regla, válida ∀ i ∈ N : xi =
(
aii + 1, si aii = 0, 1, . . . 7 aii − 1, si aii = 8, 9.
(2.14)
Para nuestra demostración, con haber exhibido un número real que no está en la lista es suficiente. Aun así, nos haremos una pregunta más: ¿Cuántos números como β pueden ser construidos apegándose a la regla (2.13)? Como contamos con diez dígitos distintos, al pedir que x1 6= a1 tenemos nueve opciones para escoger x1 ; por cada una de ellas hay otras nueve para x2 , y a su vez, por cada una de estas hay nueve posibilidades para x3 , y así sucesivamente. ¿Cuántos números del (0, 1) hay entonces
136
CONJUNTOS INFINITOS
como β, que no están en la lista? 9 · 9 · 9 · 9 · · · Con un detalle: que como β es un real del (0, 1), no puede tener una cola infinita de 9’s, y entonces cada vez habría que garantizar que el número que escojamos no sea 9; es decir, que cada vez contaríamos con ocho opciones, no con nueve (en realidad depende de las cifras de los números de la lista). Pero ni siquiera esos casi 9 · 9 · 9 · 9 · · · son todos los que no están. También faltan aquellos que, aunque tienen su primer dígito igual al del primer número listado, su segundo dígito es diferente al segundo del primer número, su tercero diferente del tercero del segundo dígito. . . Los recorridos pueden bajar por las diagonales desfasados un lugar, o dos, o tres, etc. Lo que queremos subrayar es que es verdaderamente gigantesca la cantidad de números que no caben en un listado que pretenda numerarlos, como sea que se intente hacerlo, contrastados con los que sí entraron en ella, por más que estos sean una infinidad. La demostración que hicimos a través de (2.13) o (2.14) se conoce como prueba diagonal de Cantor (en razón de que el elemento que es diferente a todos se construye siguiendo la diagonal del listado).[8] Esta demostración se ha tomado como modelo para otras pruebas, tanto en el terreno de la matemática como en el de la lógica. Es el caso de un teorema de Gödel del que hablaremos más adelante (ver pág. 199). o Hay otra forma de ver el resultado anterior. Si los reales del (0, 1) (o del [0, 1], como se quiera) tuviesen la misma cardinalidad que los naturales, sus elementos podrían ser numerados: α1 , α2 , α3 , α4 , . . . αk , . . . , y entonces podríamos construir los siguientes intervalos:
I1 = α1 −
1 1 1 , α1 + 3 , α1 ∈ I1 , `(I1 ) = 2 . 23 2 2
1 1 1 I2 = α2 − 4 , α2 + 4 , α2 ∈ I2 , `(I2 ) = 3 . 2 2 2 .. .. . .
[8]
Aunque se debe señalar que la idea de utilizar este método de demostración parece haber surgido del matemático alemán Paul du Bois-Reymond, que en 1875 (16 años antes que Cantor) lo empleó para probar que dada cualquier sucesión de funciones divergentes monótonamente a infinito, cada una más lenta que la anterior, siempre es posible construir otra que diverja más despacio que todas las de la sucesión. Su prueba aparece en la pág. 365 de Über Asymptotische Werte, Infinitäre Approximationen und Infinitäre Auflösungen von Gleichungen, Mathematische Annalen, 8 (1875), 363414.53
137
UN PRIMER ACERCAMIENTO A LOS REALES
Ik = αk −
1 2k+2
, αk +
1 2k+2
, αk ∈ Ik , `(Ik ) =
.. .
1 . 2k+1
.. .
Es decir, cada real de (0, 1) lo podríamos cubrir con un intervalo como esos, entonces el (0, 1) completo quedaría cubierto por la familia de todos ellos, cuya suma de longitudes es igual a ∞ ∞ X X 1 1 1 1 1 1 1 (1.5) 1 = 1− = . + + · · · + + · · · = = − 2 3 k k k 2 2 2 2 2 2 2 2 k=2 k=1
Pero si con esos intervalos cubrimos todo el (0, 1), la suma de sus longitudes debería ser mayor que 1, y en cambio resultó igual a 12 . Tenemos una contradicción. ¿Cuál es el origen de la contradicción?, la suposición de que el (0, 1) es numerable, pues si es numerable podemos taparlo con una familia de intervalos cuya suma de longitudes es 21 (o 14 , si las longitudes de los intervalos hubieran sido `(I1 ) = 213 , `(I2 ) = 214 , `(I3 ) = 214 , . . . o 18 si las longitudes hubieran empezado a disminuir desde 214 . . . ; de hecho, siendo numerable el conjunto se puede cubrir por una familia numerable de intervalos con suma de longitudes tan pequeña como se quiera). Esto es lo que lleva a la contradicción, pues si cubrimos el (0, 1) con intervalos, necesariamente la suma de sus longitudes deberá ser mayor o igual que 1, que es la longitud del (0, 1) (ver figura 2.22).
Figura 2.22
o Detengámonos a analizar qué ocurrió: que probamos de dos maneras diferentes que los números reales forman un conjunto infinito mayor
138
CONJUNTOS INFINITOS
que el de los números naturales. Independientemente de cómo apareemos sus elementos, siempre nos sobran infinidades de infinidades de reales. Tenemos entonces que hay unos infinitos más grandes que otros. En eso se equivocó Galileo (aunque en lo principal que le interesaba establecer, que era que no tenía por qué verse como contradictorio que un conjunto infinito pudiera ponerse en correspondencia biunívoca con una parte de sí mismo, tenía toda la razón —ver pág. 87—). Este descubrimiento de Cantor abrió un verdadero cofre de ideas a cual más audaz y desafiante al “sentido común” de no pocos matemáticos de su tiempo. Rompió esquemas al por mayor. Algunos, como Kronecker (un matemático con mucho peso en el stablishment alemán de aquella época) llegaron a acusarlo de “renegado”, “científico charlatán” y “corruptor de la juventud”54 por insistir en sus ideas y llevarlas cada vez más lejos, como veremos más adelante. Treinta y cuatro años después de este primer descubrimiento, en una carta a la matemática británica Grace Chisholm Young, Cantor escribió:55 Mi teoría se mantiene tan firme como una roca; cada flecha dirigida contra ella, regresará rápidamente a su arquero. o Las demostraciones anteriores de que los reales no son numerables, se deben, respectivamente, a Georg Cantor (1891) y Axel Harnack (1885). Fue Cantor quien descubrió y probó por primera vez el resultado en 1873-4, pero con una demostración diferente que veremos en el teorema 7.14 (pág. 367). Si hubiera que describir casi en una frase la idea básica de cada una de las tres pruebas, diríamos lo siguiente: La de 1873-4 prueba que todo conjunto numerable deja hoyos sin rellenar en la recta, mientras que los reales no. La de 1885 muestra que si un conjunto es numerable, esencialmente no ocupa espacio: se puede cubrir con una familia numerable de intervalos con suma de longitudes tan pequeña como se quiera (cuando esto le pasa a un conjunto se dice que tiene medida cero). Por su parte, los reales de un intervalo [a, b] ocupan un espacio de longitud fija b − a > 0. La de 1891 muestra que no hay regla posible que permita incluir a todos los reales en una lista.
EJERCICIOS
2.10.
139
Ejercicios
1. Obtengan una expresión algebraica para la biyección ilustrada con un diagrama en el ejemplo 2.11. 2. Construyan una familia numerable de subconjuntos numerables de N ajenos dos a dos, cuya unión resulte N. 3. Supongan que quieren ordenar los racionales en el [0,1] recorriendo todos los irreducibles que tienen un mismo denominador en orden creciente, y esto para cada valor natural del denominador, también considerados en orden creciente. Definan con precisión esta relación de orden. ¿Es un buen orden? 4. Demuestren que Q × Q es un conjunto numerable, exhibiendo una biyección entre N y Q×Q. (Basta con que muestren con un diagrama cómo se van numerando los elementos). 5. a) La recta, como sabemos, tiene una cantidad infinita no numerable (con cardinalidad c) de puntos. ¿Cuántos intervalos abiertos ajenos caben en la recta? Por ejemplo, si tomamos todos los intervalos de la forma (n, n + 1) con n ∈ Z, nos cabrá una infinidad numerable de intervalos en ella. Supongan que los pueden ir construyendo tan pequeñitos como quieran, ¿puede llegar a ser necesaria una cantidad de intervalos que tenga la cardinalidad c?, ¿o siempre resulta numerable (o finita)? Hint: Utilicen el hecho de que cualquier intervalo en la recta tiene al menos un racional. b) ¿Cuántos círculos ajenos caben en el plano? Hint: Utilicen el hecho de que Q × Q es numerable, y den por demostrada la propiedad de que cualquier círculo en el plano tiene al menos un elemento de Q × Q (en realidad, una infinidad). 6. Supongan que un conjunto X de números reales cumple la propiedad de que cada uno de sus elementos puede ser encerrado en un intervalo abierto, aunque sea muy pequeñito, en donde no hay ningún otro elemento de X más que él. Demuestren que entonces X debe ser finito o numerable. (Los puntos de un conjunto que cumplen la propiedad mencionada son llamados puntos aislados del conjunto. En este ejercicio estarán probando que si un conjunto solo tiene puntos aislados,
140
CONJUNTOS INFINITOS
no puede tener la cardinalidad del continuo; o lo que es lo mismo, que todo conjunto con la cardinalidad del continuo tiene al menos un elemento en torno al cual se acumula una infinidad de elementos del conjunto, es decir, que no es punto aislado suyo). 7. Prueben que el plano R2 no es la unión de una familia numerable de líneas rectas. Hint: Tomen una familia arbitraria de líneas que sea numerable y argumenten que por lo menos hay una línea vertical no incluida en la familia. A partir de ahí muestren la existencia de un punto de R2 que no pertenece a la familia de rectas considerada. 8. Demuestren que: a) Si a, b ∈ Q =⇒ a ± b, a · b, ab ∈ Q (lo último, si b 6= 0). b) Si a, b ∈ Q =⇒
a+b 2
equidista de a y b (es decir, es el punto medio).
9. Demuestren que si la diagonal y el lado de un pentágono regular cualquiera fueran conmensurables entre sí, se podría construir una familia infinita de pentágonos inscritos cada uno en el anterior, cuyos lados formaran una sucesión decreciente de números enteros positivos. En otras palabras, obtengan una demostración de la inconmensurabilidad entre la diagonal y el lado de un pentágono regular, similar a la cuarta √ y quinta de las desarrolladas para mostrar la irracionalidad de 2. 10. Hay un criterio para probar la irracionalidad de un número que resulta de gran utilidad en muchos casos, se trata de un teorema que dice lo siguiente: Si x = pq es un número racional expresado en su froma irreducible, que es solución de una ecuación de la forma an xn + an−1 xn−1 + · · · + a1 x + a0 = 0, con ak ∈ Z ∀ k = 0, 1, . . . n, (2.15)
entonces q|an y p|a0 . De aquí se desprende como corolario que si un racional es solución de una ecuación como (2.15), en el que an = 1, entonces ese racional tuvo que ser un entero que divide a a0 . En otras palabras, que en ese caso las soluciones solo pueden ser enteros (que dividan a a0 ) o irracionales.
141
EJERCICIOS
Supongan que quieren probar que guiente:
√
2 es irracional. Hacemos lo si-
i) Obtenemos una ecuación del tipo de (2.15), de la cual solución: √ Como x = 2 =⇒ x2 = 2 =⇒ x2 − 2 = 0.
√
2 sea
Ahí tenemos la ecuación. Resultó con el coeficiente an = 1, entonces: ii) Vemos cuáles son los divisores enteros de a0 = −2. Estos son -2, 2, -1 y 1. iii) Checamos si alguno de ellos es solución. Como (±2)2 − 2 = 4 − 2 = 2 6= 0 y (±1)2 − 2 = 1 − 2 = −1 6= 0, ninguno de ellos es solución. Por lo tanto, la ecuación no tiene ninguna solución racional, de √ modo √ que todas son irracionales. Como 2 es solución, entonces 2 es irracional. Una demostración completamente análoga nos permite obtener fácilmente un resultado mucho más general: √ n a es irracional ∀ a ∈ N tal que a 6= k n ∀ k ∈ N. a) Pues bien, el ejercicio consiste en que demuestren el teorema mencionado. Pueden utilizar la propiedad de divisibilidad entre números enteros, que dice lo siguiente: Si a, b, c ∈ N, a|bc y a, b no tienen ningún factor común =⇒ a|c, y la que es una generalización de la anterior: Si a, b, c ∈ N, a|bn c y a, b no tienen ningún factor común =⇒ a|c. Una vez demostrado el teorema, utilícenlo para demostrar que √ √ b) 2 + 3 3 es irracional.56 11. a) Definan un orden en R2 . Hint: Piensen la forma en que se ordenan las palabras en un diccionario (supongan que todas las palabras constan de dos letras).
142
CONJUNTOS INFINITOS
b) Extiendan el orden propuesto a Rn . 12. Definan la siguiente relación de orden en los naturales: x ≺ y si x es impar y y es par. En caso de que ambos sean pares o impares, x ≺ y si x < y. a) Enlisten en orden creciente cómo quedarían ordenados los naturales con esta relación. b) ¿Es un buen orden? c) Tomen dos elementos a < b en N con su orden usual y vean dónde quedaron ubicados con el reordenamiento que se definió. ¿Siempre queda a a la izquierda de b? 13. Sea x ∈ R. Definamos
[x] = Máximo entero menor o igual que x.
{x} = x − [x] = Parte fraccionaria de x.
Sea ≺ la relación de orden definida por x ≺ y si {x} < {y}
o si {x} = {y} y [x] < [y].
(2.16) (2.17) (2.18)
a) Definan la relación anterior en X = {Números reales con dos cifras decimales}
i) Enlisten los elementos de X en la forma en que son ordenados por ≺ . ii) ¿Cuál es el siguiente y el anterior de 1.27?, ¿Cuál es mayor, 1.2 o 0.3? iii) ¿Cumple las condiciones para ser un buen orden sobre X? b) Ahora definan esa misma relación de orden sobre Q. i) ¿Es un orden lineal? ii) Dada cualquier x ∈ Q, ¿existen siempre el siguiente y el anterior? iii) ¿Es un buen orden en Q? c) Propongan un orden en R con el que exista un primer elemento y se cumpla que, dado cualquier número real, siempre exista su sucesor y su antecesor (excepto para el primero). 14. Demuestren que las dos definiciones de conjunto infinito mencionadas en la pág. 99 son equivalentes.
Capítulo 3
Tres preguntas importantes Tenemos entonces que al menos hay dos tamaños de infinito: el de los naturales, que Cantor representó con la primera letra del alfabeto hebreo (alef) y un subíndice cero: ℵ0 ; y el del continuo (así se le conoce, en referencia a la recta), que denotó con la letra gótica c. No olvidar lo que mencionamos al principio del capítulo anterior: no se trata de que haya distancias infinitas que pueden tener distintos tamaños. Se trata de que hay conjuntos con tantos elementos como los naturales, y otros con tantos elementos como puntos tiene la recta. Esto, claro, además de los finitos. Entonces aquí podrían surgir tres preguntas de manera natural: 1) ¿Existe un infinito menor que ℵ0 ? 2) ¿Existe un infinito mayor que c? 3) ¿Existe un infinito entre ℵ0 y c, es decir mayor que ℵ0 pero menor que c? La respuesta a la primera pregunta es que no: se puede probar que el infinito más chico de todos es el de los naturales. En la demostración se utiliza, casi sin darnos cuenta, una propiedad de los conjuntos que discutiremos al finalizar la prueba correspondiente. Veremos que tiene implicaciones bastante mayores que las que aparenta. La respuesta a la segunda pregunta es sí; de hecho, Cantor probó que dado cualquier conjunto siempre hay otro que tiene una cardinalidad más grande. De modo que no solo existe un infinito mayor que el de los reales, sino que no hay tope en el agrandamiento de los infinitos: dado uno, siempre es posible construir otro mayor. 143
144
TRES PREGUNTAS IMPORTANTES
En cuanto a la tercera pregunta, Cantor pensó todo el tiempo que la respuesta era no, pero pasó muchos años de su vida sin poder demostrarlo (murió sin conseguirlo). Esa cuestión —conocida como la hipótesis del continuo— se convirtió en uno de los grandes problemas no resueltos de la matemática, y dio lugar a resultados muy trascendentes y muy polémicos en el terreno de la lógica. En el capítulo 4 abordaremos ese punto, aunque para ello será necesario abrir un paréntesis sobre la definición de conjunto en sí, lo cual haremos en la sección §3.3.
3.1.
El infinito más pequeño, el Axioma de Elección y el Principio del Buen Orden
¿Cómo quedaría garantizado que el infinito más chico es el de los números naturales?, si probáramos que cualquier conjunto infinito contiene al menos tantos elementos como los naturales; es decir, que tiene como subconjunto a alguno con la cardinalidad de los naturales. Teorema 3.1. (Cantor, 1895)57 Todo conjunto infinito tiene un subconjunto numerable. Demostración. Sea X un conjunto infinito. Escojamos x1 ∈ X. Entonces X \ {x1 } sigue siendo infinito, y podemos escoger x2 en él; como X \ {x1 , x2 } es también infinito, podemos escoger x3 en él, y así sucesivamente. Entonces, siguiendo este procedimiento obtenemos un conjunto {x1 , x2 , x3 , . . . } obviamente numerable, que está contenido en X. Obsérvese que en la demostración consideramos una infinidad de subconjuntos de X y de cada uno de ellos, al ser no vacíos (pues de hecho eran infinitos todos) asumimos que siempre era posible escoger un elemento —el que fuera—, y con esos elementos fuimos generando el subconjunto numerable que buscábamos. Parece un procedimiento inobjetable. Comparemos eso que hicimos con lo que haremos a continuación. Ejemplo 3.2. Sea {(an , bn )} una sucesión de intervalos abiertos en R, S con an , bn ∈ Q ∀n ∈ N. Sea X = ∞ n=1 (an , bn ). Demostrar que X contiene una sucesión de números racionales. Solución. Como el punto medio de dos números resulta siempre otro número mayor que el menor, y menor que el mayor de ellos, tenemos que
EL INFINITO MÁS PEQUEÑO . . .
145
n ∈ (an , bn ) ⊆ X ∀n ∈ N; por lo tanto, xn ∈ X ∀n ∈ N. Como xn = an +b 2 además el punto medio de dos racionales resulta siempre un racional (ver discusión previa al teorema 2.14), tenemos que xn ∈ Q ∀n ∈ N, entonces {xn } es una sucesión de racionales contenida en X.
En este ejemplo también teníamos una infinidad de conjuntos (los intervalos (an , bn ) ⊆ X) y escogimos un elemento de cada uno de ellos para formar otro conjunto (el de los términos de la sucesión). Pero hubo una diferencia respecto de cómo lo hicimos en la demostración del teorema: aquí propusimos en concreto qué elemento tomar de cada uno de la infinidad de conjuntos en cuestión (el punto medio). Allá dijimos: tómese cualquier elemento de cada uno de esta infinidad de conjuntos (estando garantizado que no eran vacíos), sin determinar una regla de elección específica de tales elementos.
A primera vista ambos procedimientos son válidos; después de todo, ¿qué necesidad hay de precisar cuál elemento tomar, si lo que nos interesa es garantizar simplemente que siempre exista un elemento, sin importar si es uno u otro? Si está garantizado que todos los conjuntos son no vacíos, no tiene nada de extraño suponer que podemos tomar un elemento cualquiera de todos y cada uno de ellos. o En 1904 el matemático alemán Ernst Zermelo (1871-1953) probó que en todo conjunto era posible definir una relación de orden con la cual el conjunto pudiera ser bien-ordenado (ver página 109). La demostración causó un verdadero revuelo entre los matemáticos de muchos países. Las reacciones abarcaron desde el rechazo hasta la aceptación, pasando por una amplia franja de escepticismo, entre otras cosas porque Cantor, que había manifestado desde 1883 que creía (primero como ley del pensamiento, luego como algo susceptible de ser demostrado) que todos los conjuntos podían ser bien-ordenados, no solo no había podido demostrarlo en general, sino que ni siquiera había logrado definir un buen-orden en los números reales. Y no fue el único, sino que muchos matemáticos lo habían intentado sin éxito y había serias dudas de que fuera posible hacerlo. En medio de la polémica, David Hilbert, como editor de la revista Mathematische Annalen, encargó al matemático francés Émile Borel (1871-1956) que hiciera un artículo comentando la prueba de Zermelo. Borel observó en dicho artículo que en realidad lo que había probado Zermelo fue lo siguiente:
146
TRES PREGUNTAS IMPORTANTES
Si fuese verdadero que A) Al tomar una colección de subconjuntos no vacíos de un conjunto dado, siempre es posible escoger (elegir) un elemento de cada uno de ellos y formar un nuevo conjunto con los elementos escogidos, entonces sería verdadero que B) Todo conjunto puede ser bien-ordenado. Y que de hecho, de la segunda propiedad se podía desprender a su vez la primera (pues si un conjunto Ω es bien-ordenado cualquier subconjunto suyo también lo es, y entonces, dada cualquier colección de subconjuntos de Ω no vacíos, tomamos el primer elemento de cada uno de los subconjuntos y con ellos formamos el nuevo conjunto). Si llamamos a la propiedad A) Principio de Elección, y a la B) Principio del Buen Orden (PBO), entonces, decía Borel, lo que Zermelo había probado era la equivalencia entre estos dos principios. O si se quiere, había demostrado que el Principio del Buen Orden se cumplía siempre y cuando se cumpliera el Principio de Elección. El problema era entonces si el Principio de Elección debía ser considerado como algo que no requería demostración, ya fuera como una especie de principio lógico inobjetable o como una propiedad “natural” a ser supuesta en la definición misma del concepto de conjunto (axioma). En el artículo de 1904, Zermelo optó por lo primero: Este principio lógico ciertamente no puede ser reducido a otro aun más simple, y es aplicado sin vacilación en las deducciones matemáticas en todas partes.58 Casi cuatro años después, en una nueva versión de su demostración le daría el carácter de axioma de la teoría de conjuntos (ver pág. 164), de ahí que se le conozca como Axioma de Elección (AE) —Axiom of Choice (AC) en inglés—. El caso es que, de una forma u otra, siempre partió de su validez. Pero esto no era aceptado por todos los matemáticos. Si una colección consta de un único conjunto, el AE se reduce a la afirmación de que si el conjunto es no vacío, este tiene al menos un elemento, lo cual es evidente (pues se trata meramente de dos formas de decir lo mismo). De ahí es inmediato el paso a las familias finitas de
EL INFINITO MÁS PEQUEÑO . . .
147
conjuntos. De modo que el axioma como tal no es necesario cuando se trata de una colección finita de conjuntos, pues enuncia una propiedad que se puede demostrar. Pero cuando la colección es infinita la cosa cambia, particularmente si es no numerable. Al abrirse la discusión se fue tomando conciencia de que las demostraciones de importantes resultados que se venían utilizando desde tiempo atrás, en el fondo se habían basado en el AE sin darse cuenta de ello. En algunos casos se podía elaborar una nueva demostración sin utilizar el AE, de modo que no había mayor problema. Pero en otros, si no se asumía el AE no se lograba demostrar el resultado o incluso se llegaba a que dejaba de ser válido. Es lo que ocurrió, por ejemplo, con un teorema que se estudia en los cursos de cálculo, publicado por Eduard Heine (1821-1881) —colega de Cantor— en 1872. Lo que plantea el teorema es que si una función es continua en el sentido de la definición de continuidad a través de sucesiones, entonces lo es también en el sentido de la definición de continuidad a través de vecindades (ε − δ). La implicación al revés de este resultado vale siempre, independientemente de que se cumpla o no el AE. Pero en el sentido que lo enunciamos, durante muchos años no se pudo probar sin utilizar el AE (por lo menos la versión del AE para familias numerables de conjuntos, que se conoce como Axioma de Elección Numerable, o simplemente Axioma Numerable (AN)). Hasta que en 1982 se demostró que la equivalencia entre las dos definiciones de continuidad comentadas (sucesiones y vecindades) es no solo condición necesaria sino suficiente para que se cumpla el AN, de modo que si no se cumple una deja de cumplirse la otra.59 Otro conocido teorema que dejaría de ser válido si no se se supone verdadera por lo menos la versión numerable del AE (el AN), es el que dice que si un número real es punto de acumulación de un conjunto, entonces existe una sucesión de elementos del conjunto que converge a él. Otro es el que vimos al principio de esta subsección (que garantiza que el infinito más pequeño es ℵ0 ).[1] En ese caso cada elemento era escogido una vez que había sido escogido el anterior (en función de él). Se trata de una nueva versión particular del AE que se conoce como Principio de Elecciones Dependientes (PED). [1] La demostración del propio Cantor de este resultado utiliza el AE sin reparar en ello (ver Cantor, G., 1895 (1955), p. 105).
148
TRES PREGUNTAS IMPORTANTES
También esta el teorema 2.9, que establece que la unión numerable de conjuntos numerables resulta siempre un conjunto numerable.[2] Lo mismo que un importante resultado del análisis y el álgebra lineal, que plantea que todo espacio vectorial tiene una base. Y podríamos seguir. . . o Debemos enfatizar en qué consiste la diferencia, con frecuencia difícil de percibir, entre la utilización y la no utilización del AE: en la demostración del teorema 3.1 lo utilizamos, pues la elección del elemento en cada conjunto se basaba simplemente en que no era vacío, sin precisar una regla específica, suponiendo que esto se podía hacer una infinidad de veces. En contraste, en el ejemplo que vimos a continuación del teorema, el AE no fue utilizado, pues se dio una regla general para elegir el elemento que interesaba, aplicable a toda n ∈ N. Hay un conocido ejemplo propuesto por B. Russell para comprender la diferencia entre lo uno y lo otro. Si tenemos una infinidad de pares de zapatos, para escoger uno de cada par no hace falta el AE, pues podemos dar una regla que en cada momento determine la elección; por ejemplo, decir que se escoja siempre el izquierdo. En cambio, si tenemos una infinidad de pares de calcetines, para garantizar que siempre podemos elegir uno de cada par necesitamos el AE, pues no hay una regla que nos dirija en cada paso al calcetín que elegiríamos. No deja de resultar extraña toda esta discusión, y parece exagerado plantearla: si la existencia de al menos un elemento de dónde escoger en cada conjunto está garantizada, ¿cuál es el problema de decir: escoge el que sea cada vez y punto? ¡Lo que resulta raro no es decir eso, sino que se cuestione eso! ¿A qué viene tanto zapateado, estando el suelo tan parejo? ¡Parece casi una cuestión de sentido común! Sorpresas que da la vida. En 1924 dos matemáticos polacos, Stephan Banach (1892-1945) y Alfred Tarski (1901-1983), lograron demostrar un resultado sorprendente que reforzó las dudas de no pocos matemáticos de diversas latitudes respecto del Axioma de Elección. Se trata de la “Paradoja” de Banach-Tarski. Dice lo siguiente: Dados dos conjuntos acotados A, B ∈ R3 , cada uno con interior no vacío, se puede hacer una partición de A en un número finito de piezas y [2]
En la demostración de este teorema —que en nuestro caso la basamos en la solución del ejemplo 2.5— permanece más oculta la utilización del AE, pero es inevitable: se trata de una infinidad de conjuntos para cada uno de los cuales existen muchos posibles apareamientos con los naturales, y es con base en el Axioma Numerable que asociamos a cada conjunto uno solo de esos apareamientos.
EL INFINITO MÁS PEQUEÑO . . .
149
rearreglarlas a través de movimientos rígidos para formar B. Esto dicho en términos coloquiales, se podría formular de la siguiente (conocida) manera: Es posible cortar un chícharo en un número finito de partes que pueden ser reacomodadas para formar una esfera del tamaño del sol. Otra versión de la “paradoja” plantea que una esfera unitaria puede partirse en varias piezas, de manera que tan solo con movimientos rígidos (traslaciones y rotaciones) las piezas pueden rearmarse y formar dos esferas unitarias completas. Las piezas en cuestión, en todos los casos, por supuesto que no son cuerpos sólidos, sino conjuntos intrincados de puntos, cuya existencia no se exhibe sino que se afirma recurriendo al Axioma de Elección. Algún tiempo después Stephan Banach demostró que el resultado no es válido ni en R ni en R2 . Debemos mencionar que el nombre de “paradoja” no obedece a algún tipo de contradicción en su construcción (de hecho, por eso le pusimos comillas). En realidad, se trata de teoremas probados formalmente. Lo paradójico está en la enorme contradicción que esto tiene con el mundo físico. o Resultan notables las consecuencias que puede tener una suposición aparentemente tan inofensiva como el AE. ¿Qué hacer ante ello?, ¿desecharlo por los riesgos? Complicado decidir esto, pues una buena cantidad de resultados importantes de diversas áreas de la matemática, como topología, cálculo, análisis y álgebra en menor medida, entre otras, lo presuponen; aunque en algunas otras, como la teoría de la medida, la inclusión del axioma complica las cosas, pues obliga a aceptar la existencia de conjuntos de números reales que no son Lebesgue medibles.60 Para el matemático polaco W. Sierpinski, “respecto al axioma de elección, debiera tomarse en cuenta en cualquier caso que: 1◦ un gran número de casos particulares de este axioma son verdaderos (pues han sido probados independientemente de él); 2◦ del axioma de elección se ha extraído un gran número de conclusiones de las cuales ninguna ha conducido a una contradicción hasta ahora; 3◦ el axioma de elección simplifica considerablemente varias partes de la teoría de conjuntos y el cálculo y es indispensable para probar muchos teoremas importantes de esas teorías”.61 La opinión de B. Russell era distinta: “Numerosos matemáticos, como Zermelo mismo, aseguran que este axioma es tan obvio como los
150
TRES PREGUNTAS IMPORTANTES
otros axiomas y que puede ser aceptado sin vacilación. Otros dicen que no hay razón para creer que el axioma es verdadero. Peano, habiendo probado la independencia del axioma, dedica a la consideración de su veracidad solo el siguiente comentario: «¿Debemos creer ahora que la proposición es verdadera o es falsa? Nuestra actitud es neutral». Es posible que más adelante alguien encuentre la reductio ad absurdum que demuestre que el axioma es falso. Pero por el momento lo considero tan solo dudoso. Puede ser verdadero pero carece de obviedad, y las conclusiones que se extraen de él son pasmosas. En estas circunstancias yo creo que estaría bien abstenerse de usarlo, salvo aquellas premisas que sugieren la posibilidad de toparse con un absurdo y resolviendo entonces en lo negativo la cuestión de la veracidad del axioma”.62 Por su parte, A. Fraenkel tenía un punto de vista enteramente opuesto, pues consideraba que —según señala Sierpinski— “el axioma de elección ha sido introducido de la misma manera que los otros axiomas de las matemáticas, que se han obtenido por el análisis de procesos de razonamiento bien conocidos. En esa línea la matemática griega condujo al axioma de las paralelas, que ha sido aceptado aunque no había, y como sabemos hoy, no podía haber ninguna pueba de él. Y aun ahora, cuando sabemos que el axioma de las paralelas pudo ser rechazado, nadie piensa en hacerlo o en abandonar el desarrollo de la geometría euclidiana, basada en ese axioma. Análogamente, no sería justificable rechazar aquellas ramas de las matemáticas que están basadas en el axioma de elección a menos que queramos restringir radicalmente la teoría de conjuntos eliminando varias partes muy importantes de ella.”63 De acuerdo con Hilbert, —señala también Sierpinski— “el axioma de elección se basa en en un principio lógico general, necesario e indispensable para los fundamentos mismos de la deducción matemática.”64 o Que se trata de un problema realmente complejo lo ilustra la pléyade de matemáticos de primer nivel que, tan solo en el curso de los dos primeros años posteriores a la publicación del artículo de Zermelo, se incorporaron a la polémica sobre la validez o no del AE: Felix Bernstein, Schoenflies, Hamel, Hessenberg y Hausdorff en Alemania; Baire, Borel, Hadamard, Lebesgue, Richard y Poincaré en Francia; Hobson, Hardy, Jourdain y Russell en Inglaterra; Julius König en Hungría; Peano en Italia y Brouwer en los Países Bajos.65
INFINITOS MÁS GRANDES QUE EL CONTINUO
151
Quizás lo más prudente sea, como sugiere R. Penrose, recomendar cautela, y que los especialistas sigan llevando el registro de qué resultados dependen del AE y cuáles son independientes de él. Eso, por lo pronto.[3]
3.2.
Infinitos más grandes que el continuo
Pasaremos ahora a discutir la segunda pregunta hecha al comienzo del capítulo, en el sentido de si puede existir un infinito mayor que el del continuo. No olvidemos que estamos hablando de infinitos que cuantifican el número de elementos de un conjunto —su cardinalidad—, no que miden distancias. Por ahora conocemos dos (ℵ0 y c), y los hemos comparado entre sí. En el fondo, los vamos tratando como números, aunque no reales. Cantor los llamó números cardinales (incluyendo a los enteros positivos, para tener en cuenta también la cardinalidad de los conjuntos finitos), e introdujo algunas operaciones básicas entre ellos que permitieron ir creando una aritmética ad hoc con los resultados que se iban obteniendo al operar con los conjuntos mismos.
3.2.1.
Operaciones entre números cardinales
¿Cuál sería la forma natural de definir, por ejemplo, la suma entre dos números cardinales, que corresponden al número de elementos de dos conjuntos determinados? Si los conjuntos son ajenos, la respuesta sería “como el total de elementos de la unión de los dos”. Definición 8. Si a, b son dos números cardinales cualesquiera, definimos a + b = |{A ∪ B}|, donde A, B son conjuntos tales que a = |A|, b = |B|, A ∩ B = ∅. Aunque si al menos uno de los conjuntos es infinito, a final de cuentas no es relevante que sean ajenos (ver (3.17) en general, y comentario posterior al teorema 2.9, respecto al caso de los numerables). Para pensar en el producto de números cardinales, partamos de dos conjuntos finitos, A y B, con cardinalidades m y n respectivamente: m·n es el número de elementos de una tabla con m renglones y n columnas, [3]
Para adentrase en la discusión del Axioma de Elección, resulta particularmente recomendable el libro de Gregory H. Moore Zermelo’s Axiom of Choice: It’s Origin, Development and Influence, del que acaba de salir una nueva edición (Dover, 2013).
152
TRES PREGUNTAS IMPORTANTES
que es igual al número de parejas que se pueden formar con un elemento de A en la primera componente y un elemento de B en la segunda. Es decir, el número de elementos del producto cartesiano A × B. Como esta operación se puede definir entre cualesquiera dos conjuntos en general, eso da pie para generalizar el concepto: Definición 9. Dados dos números cardinales, a y b, se define a · b = |A × B|, donde A, B son dos conjuntos tales que a = |A|, b = |B|. Ahora establecemos la siguiente definición: Definición 10. Dado un número cardinal a y dada k ∈ N, k ≥ 2, ak = a · ak−1 . Lo último equivale a decir que ak = |A × A × · · · × A|, donde naturalmente el producto cartesiano es tomado para k copias del conjunto A. o Los teoremas 2.6, 2.7, 2.8 y 2.9 se pueden expresar en términos de estas operaciones entre los números cardinales que hasta ese momento conocíamos, que eran los enteros positivos (k ∈ N) y ℵ0 . Las formulaciones correspondientes serían: ℵ0 + k = ℵ0
(3.1)
k · ℵ0 = ℵ 0
(3.3)
ℵ0 + ℵ0 = 2ℵ0 = ℵ0
(3.2)
ℵ0 · ℵ0 = ℵ20 = ℵ0
(3.4)
Esta última propiedad se puede generalizar. Supongan que quieren numerar {(a1 , a2 , . . . ak ) : a1 , a2 , . . . ak ∈ N}, para cualquier k ∈ N. Lo hecho para numerar Z2 (ejemplo 2.12) nos sugiere el camino. Esto, expresado como una operación con ℵ0 , nos diría que ℵ0 k = ℵ0 . Estos resultados surgieron de nuestra discusión sobre los hoteles de Hilbert, en los que, si recordamos, parecía que sin importar lo que le hiciéramos “al infinito” (en realidad hablábamos entonces de ℵ0 ), siempre
INFINITOS MÁS GRANDES QUE EL CONTINUO
153
volvía a quedar igual, toda colección podía ser acomodada en el hotel maravilloso. Ahora sabemos que no, que hay colecciones que no cabrían en los hoteles de Hilbert (los números reales, por ejemplo). o Pero ¿qué tipo de operación es capaz de producir ese salto en el tamaño del infinito, de ℵ0 a c? En todas las operaciones que hemos enlistado, siempre volvemos a quedar en ℵ0 . ¿Cuáles faltarían?, por lo menos dos: exponenciar con base k (k ∈ N, k > 1) y exponente ℵ0 ; y exponenciar con base y exponente ℵ0 . Veamos si con la primera de ellas, k ℵ0 , logramos dar el brinco de ℵ0 a c. Más adelante hablaremos de la segunda (ejemplo 3.17, pág. 182). El problema es entonces imaginar un conjunto cuyo cálculo de cardinalidad nos conduzca a esa operación (la definición misma de la operación la plantearemos sobre esa base). De hecho, ya conocemos uno. ¿Cómo representamos a los números reales del intervalo (0, 1)? Si recordamos (2.12), (0, 1) = {0.a1 a2 . . . : ak = 0, 1, . . . 9 ∀ k ∈ N} \ (T ∪ {0}), lo cual es equivalente a plantear que {0.a1 a2 . . . : ak = 0, 1, . . . 9 ∀ k ∈ N} = (0, 1) ∪ (T ∪ {0}),
(3.5)
donde T = {Colas infinitas de 9’s}. Fijémonos primero en las expansiones mismas, tal y como aparecen en el lado izquierdo de la última igualdad (es decir, incluyendo las colas de 9’s y el cero). ¿Cuántos posibles valores puede tomar a1 ?, 10. Por cada uno de ellos tenemos 10 posibilidades para a2 . Es decir, si solo fuesen de dos cifras las expansiones, tendríamos 10 · 10 expansiones diferentes; y a su vez, por cada una de ellas, a3 podría tomar 10 valores distintos, de manera que tenemos 103 expansiones de tres cifras decimales, y así sucesiva e indefinidamente. ¿Cuántos dígitos tiene la expansión infinita?, ℵ0 . Tenemos entonces que | {0.a1 a2 . . . : ak = 0, 1, . . . 9 ∀ k ∈ N} | = 10ℵ0 .
(3.6)
(En correspondencia con esta idea se define lo que se entiende por k ℵ0 , lo cual se comenta un poco más adelante). Ahora bien, recordaremos de (2.9) que las colas infinitas de 9’s tienen la misma cardinalidad que las expansiones decimales finitas, y que estas
154
TRES PREGUNTAS IMPORTANTES
forman un conjunto numerable (ejemplo 2.13); por lo tanto las colas infinitas de 9’s —y su unión con el 0— forman un conjunto numerable. Veremos más adelante (corolario 3.18, pág. 182) que si a un conjunto con la cardinalidad de los reales (como el (0, 1)) le agregamos un conjunto numerable (como las colas infinitas de 9’s de las que hemos hablado, junto con el cero), nos vuelve a resultar siempre un conjunto con la cardinalidad de los reales. De modo que, de (3.5) y (3.6), tenemos que c = 10ℵ0 . o En la sección §6.3 trabajaremos más en detalle con la representación de los números reales en bases distintas de 10. Adelantaremos por el momento cuatro comentarios: a) Cuando la base es 2, los coeficientes solo pueden tomar los valores 0 y 1. b) Así como en la expansión decimal un 1 en el k-ésimo lugar a la izquierda del punto vale 1 · 10k−1 , en la expansión binaria vale 1 · 2k−1 . c) Y así como en la expansión decimal un 1 en el k-ésimo lugar a la derecha del punto vale 1 · 10−k , en la expansión binaria vale 1 · 2−k . d) El equivalente al 0.999 . . . en base 10, es el 0.111 . . . en base 2. En general, las colas de 9’s en base 10 juegan el mismo papel que las colas de 1’s en base 2. De acuerdo con esto, los puntos del (0, 1) expresados en base dos, son todos aquellos de la forma 0.a1 a2 a3 . . .
con
ai = 0, 1 ∀ i ∈ N
(3.7)
y que no tienen todos los coeficientes iguales a cero (pues 0 ∈ / (0, 1)), ni son todos iguales a 1 a partir de alguno. ¿Cuántas expansiones binarias existen? Aquí tenemos dos posibles valores para a1 ; por cada uno de ellos hay a su vez dos posibles valores para a2 , de modo que con dos cifras tenemos 2 · 2 expansiones binarias diferentes; con tres, 2 · 2 · 2; con N , 2N , y así indefinidamente. El número global de expansiones binarias diferentes lo representamos por 2ℵ0 . En cuanto a las colas infinitas de 1’s, por cada una de ellas hay una expansión binaria finita, y estas forman un conjunto numerable (se puede probar siguiendo un procedimiento prácticamente idéntico al que seguimos en el ejemplo 2.13). Otra vez adelantando un resultado que comentamos que veremos más adelante (corolario 3.18, pág. 182), la
INFINITOS MÁS GRANDES QUE EL CONTINUO
155
unión de un conjunto de cardinalidad c con otro numerable, nos resulta nuevamente de cardinalidad c. Así es que, finalmente 2ℵ0 = c.
(3.8)
Esto nos sugiere que si quisiéramos probar que k ℵ0 = c
∀k ∈ N,
podríamos tomar una k arbitraria, expresar los números reales del (0, 1) en base k y repetir los argumentos vistos para k = 10 y k = 2. o La operación k ℵ0 se define en correspondencia con el razonamiento que acabamos de seguir en dos ocasiones. Podríamos decir: es la cardinalidad del conjunto de todas las sucesiones (a1 , a2 , a3 , . . . ) que en cada término tienen k posibles opciones. Ahora bien: cada sucesión como la anterior es una función f : N −→ {1, 2, . . . k}, entonces k ℵ0 es el número de funciones diferentes f : N −→ {1, 2, . . . k} que podemos definir. La ventaja que tiene verlo de esta manera es que nos permite generalizar la operación ab para cualesquiera dos números cardinales, a y b, pues el concepto de función es posible llevarlo a conjuntos de la cardinalidad que sea. ¿Cómo se define entonces ab ? Definición 11. Sean a, b números cardinales. Definimos ab = |{f : B −→ A}|, donde A, B son conjuntos tales que a = |A|, b = |B|. o Volviendo a nuestra discusión inicial, tenemos entonces que k ℵ0 produce un brinco en la cardinalidad. ¿Qué haríamos si quisiéramos analizar si existen conjuntos con una cardinalidad mayor que c? Si las propiedades vistas hasta ahora se extendieran también a c, la operación que prometería lograr un brinco a un infinito mayor que c sería k c . El gran problema sería generar un conjunto que al hacer el cálculo de su cardinalidad nos condujera a la operación k c para alguna k ∈ N (no confundir con ck , que es más fácil de resolver, pero que no consigue un salto en la cardinalidad, como se verá más adelante). Pensémoslo en general: dado un conjunto X, ¿existe algún procedimiento que nos permita generar un nuevo conjunto X∗ en términos de X para el cual |X∗ | = k |X| , para alguna k ∈ N, k ≥ 2?
156
TRES PREGUNTAS IMPORTANTES
Porque si esto es así nos daríamos a la tarea de obtener la cardinalidad de tal conjunto X∗ , a ver si rebasa la cardinalidad de X (por ejemplo, tratando de aplicarle un razonamiento como el de la diagonal de Cantor (du Bois Reymond)).
3.2.2.
Cardinalidad del conjunto potencia
Hay algo que da la clave para la respuesta a lo que estamos planteando, lo cual veremos a través de un ejemplo. Aquí deben recordar que el conjunto potencia de un conjunto X se definió como aquel cuyos elementos son todos los subconjuntos de X. Ejemplo 3.3. Sea X = {3, 5, 7}. Obtener el conjunto potencia de X y su cardinalidad. Solución. P(X) = {∅, {3}, {5}, {7}, {3, 5}, {3, 7}, {5, 7}, {3, 5, 7}}, y |P(X)| = 8 = 23 = 2|X| . o ¿Es válido en general que |P(X)| = 2|X| ? Para analizar esto partamos de nuestro ejemplo anterior haciendo lo siguiente: ordenamos primero el conjunto X. Digamos que = {a1 , a2 , a3 } donde a1 = 3, a2 = 5, a3 = 7. Cada subconjunto A de X lo podemos identificar con una terna (porque X tiene tres elementos), colocando un 1 en el lugar de los elementos de X que contuvo A, y un 0 en el lugar de los elementos que no incluyó A. Precisando: A ←→ (x1 , x2 , x3 ), donde xi = 1 si ai ∈ A, y xi = 0 si ai ∈ / A, ∀ i = 1, 2, 3. Así las cosas, ∅ ←→(0, 0, 0)
{3} ←→(1, 0, 0)
{5} ←→(0, 1, 0)
{7} ←→(0, 0, 1)
{3, 5} ←→(1, 1, 0)
{3, 7} ←→(1, 0, 1)
{5, 7} ←→(0, 1, 1)
{3, 5, 7} ←→(1, 1, 1), y como a todo subconjunto de X podemos asociarle una —única— terna así, y a cada terna así le correspondería un —único— subconjunto de
INFINITOS MÁS GRANDES QUE EL CONTINUO
157
X, el número de subconjuntos de X es idéntico al número total de ternas con 0’s y 1’s, que es efectivamente 23 . La ventaja del razonamiento anterior es que lo podemos extender a cualquier conjunto finito y, más que eso, a cualquier conjunto numerable. Si X = {a1 , a2 , a3 , . . . }, dado A ⊆ X, podemos asociar A ←→ (x1 , x2 , x3 , . . . ) siguiendo para cada i ∈ N la regla xi =
(
1, si ai ∈ A 0, si ai ∈ / A.
(3.9)
Entonces, el número de subconjuntos de X es igual al número de sucesiones (x1 , x2 , x3 , . . . ) donde cada componente puede tomar dos valores (0 y 1). Pero esto es precisamente 2ℵ0 , de modo que, efectivamente, cuando X es numerable, |P(X)| = 2|X| . Si observamos con atención lo que acabamos de hacer, podemos obtener una generalización aún mayor. Supongamos que X es un conjunto de la cardinalidad que se quiera. Sea A ⊆ X. Lo que hicimos antes fue poner en correspondencia a A con una sucesión (que es una función, solo que numerable) definida sobre X, que asociaba un 1 a los elementos de X que estaban en A y un 0 a los que no. Entonces podemos hacer lo mismo, sin restringir las cosas a un conjunto numerable. Es decir, definamos la función χA : X −→ {0, 1}, con la regla χA (x) =
(
1, si x ∈ A 0, si x ∈ / A;
(3.10)
esta forma tenemos que A ←→ χA . (De hecho, al colocar A como subíndice de la función χ ya queda indicada esta relación). Entonces, el número total de subconjuntos de X no es otro que el número total de funciones χ : X −→ {0, 1} que podemos generar. Si recordamos la definición 11 —y la discusión que le precedió—, tenemos que eso es precisamente 2|X| . Hemos demostrado el siguiente: Teorema 3.4. Sea X un conjunto con cualquier cardinalidad. Entonces |P(X)| = 2|X| ,
158
TRES PREGUNTAS IMPORTANTES
de modo que dado un conjunto X, ya conocemos un conjunto X∗ definido en función de él, cuya cardinalidad es un número de la forma k |X| , para alguna k ∈ N : el conjunto X∗ = P(X). Si todo marcha bien, para encontrar un infinito mayor que c debemos probar que el conjunto potencia de los números reales tiene una cardinalidad mayor que los reales mismos. Este resultado lo probó Cantor en una versión más general aun. Antes de entrar a ello veremos un ejemplo que facilitará las cosas. Ejemplo 3.5. Sea X = {3, 5, 7}. Sean f, g, h : X −→ P(X) tres funciones definidas de la siguiente manera cada una: f : f (3) = {3}, f (5) = {5, 7}, g : g(3) = {5}, g(5) = {3, 7}, h : h(3) = {5, 7}, h(5) = {3, 5},
f (7) = {3, 5, 7}. g(7) = {3}. h(7) = {5}.
Obtener los conjuntos (a) (b) (c)
Ωf = {x ∈ X : x ∈ / f (x)}.
Ωg = {x ∈ X : x ∈ / g(x)}.
Ωh = {x ∈ X : x ∈ / h(x)}.
Solución. Observemos, en primer lugar, que se trata de funciones que asocian conjuntos a números, de ahí que se hable de cosas tales como x∈ / f (x). En segundo lugar, observemos que los conjuntos Ωf , Ωg y Ωh son todos subconjuntos de X, y por lo tanto elementos de P(X) (ver figura 3.1). Dicho esto, procedamos a obtener los tres conjuntos: a) Como 3 ∈ {3} = f (3), entonces Ωf = ∅.
5 ∈ {5, 7} = f (5)
b) Como 3 ∈ / {5} = g(3), entonces Ωg = {3, 5, 7}. c) Como 3 ∈ / {5, 7} = h(3), entonces Ωh = {3, 7}.
y
5 ∈ / {3, 7} = g(5) 5 ∈ {3, 5} = h(5)
7 ∈ {3, 5, 7} = f (5), y y
7 ∈ / {3} = g(7), 7∈ / {5} = h(7),
Esto que hemos visto para un ejemplo particular pensémoslo ahora en general para cualquier conjunto X, finito o no, y cualquier función f : X −→ P(X) y su conjunto Ωf = {x ∈ X : x ∈ / f (x)} correspondiente. Por definición, Ωf es ajeno a cualquier conjunto f (x), así es que el
INFINITOS MÁS GRANDES QUE EL CONTINUO
(a) f : X −→ P(X)
(b) g : X −→ P(X)
159
(c) h : X −→ P(X)
Figura 3.1
conjunto Ωf no pertenece a la imagen de f , pero sí al contradominio, pues es un subconjunto de X, y los elementos del contradominio son todos los subconjuntos de X. ¿Qué nos dice lo anterior? Que no hay manera de establecer una biyección entre X y P(X), pues dada cualquier función f : X −→ P(X), siempre sobran elementos en P(X). En otras palabras: todo conjunto tiene más subconjuntos que elementos, la cardinalidad del conjunto potencia siempre rebasa la cardinalidad del conjunto original. Hemos demostrado entonces el siguiente teorema: Teorema 3.6. (Cantor, 1891) Sea X un conjunto con cualquier cardinalidad. Entonces |P(X)| > |X|. De modo que sí hay un conjunto con cardinalidad mayor que la de los reales. ¿Cuál sería un ejemplo? El conjunto de todos los subconjuntos de los números reales, que por lo que hemos visto, es del mismo tamaño que, por ejemplo, el conjunto de las funciones f : (0, 1) −→ {0, 1}. Es decir, si a cada punto de (0, 1) le asociamos un 0 o bien un 1, y esto lo hacemos de todas las formas posibles, hemos construido un conjunto que tiene una cardinalidad mayor que el continuo, se trata de un conjunto con cardinalidad 2c . Sin embargo, el último teorema nos dice mucho más que eso, porque no solo se aplica a los números reales, nos dice que dado un conjunto con cualquier cardinalidad, siempre hay otro con cardinalidad mayor. No
160
TRES PREGUNTAS IMPORTANTES
hay un infinito mayor que todos, dado uno, siempre hay otro más grande que él. Hacia arriba los infinitos no tienen tope. Esto a su vez nos lleva a una generalización de la conjetura de Cantor respecto de la inexistencia de un infinito entre los numerables y el continuo: ¿Es el infinito del conjunto potencia de un conjunto X el siguiente al infinito del conjunto X en general? (hablamos de sus cardinalidades); la suposición de que sí se conoce como Hipótesis Generalizada del Continuo (HGC).
3.3.
Las paradojas en la definición de conjunto
El último resultado planteaba un problema: si dado cualquier conjunto siempre hay otro mayor, no tiene sentido hablar de el conjunto de todos los conjuntos, pues si existiera no podría haber otro mayor que él. Pero si se piensa un conjunto como una colección de objetos que cumplen una cierta propiedad,[4] como era común concebirlo entre todos los autores sobre el tema,66 “ser conjunto” es una propiedad, y entonces se tendría que poder hablar del conjunto de todos los conjuntos. En cartas a Hilbert (1897) y Dedekind (1899) —conocidas hasta 1932— Cantor planteaba un problema relacionado con lo anterior (¿cuál sería la cardinalidad del conjunto de todos los números cardinales transfinitos, si no existía un número cardinal mayor que todos?). En 1897, el matemático italiano Cesare Burali Forti (1861-1931) publicó un resultado relacionado con los números ordinales de Cantor que dio lugar al planteamiento de una paradoja similar. Pero el cuestionamiento mayor surgió en 1902, con la publicación por Bertrand Russell de una nueva paradoja, que desde entonces es conocida como la paradoja de Russell. Veamos en qué consiste: Hemos visto que los elementos de un conjunto pueden ser a su vez conjuntos (el conjunto potencia es un ejemplo de ello). [4]
Esta era la idea del matemático, lógico y filósofo alemán Gottlob Frege (1848-1925), uno de los creadores de la teoría de conjuntos: bastaba un único axioma para construir todo lo demás (aunado a los axiomas de la lógica). Su axioma básicamente decía que: dada una propiedad P , podemos formar un conjunto con todas aquellas cosas que satisfacen la propiedad P . Esto era conocido como el principio de abstracción ilimitada, y a partir de él se podía garantizar la existencia del conjunto vacío, el conjunto potencia, el conjunto que incluye como elementos a dos conjuntos formados previamente, el conjunto que contiene como elementos propios a todos los elementos de otros conjuntos, etc.
LAS PARADOJAS EN LA DEFINICIÓN DE CONJUNTO
161
Por lo general, un conjunto no es elemento de sí mismo. Si, por ejemplo, A = {{5}}, {5} ∈ {{5}}, pero {{5}} ∈ / {{5}}. Si hacemos B = {{{5}}}, entonces ocurre que A = {{5}} ∈ B = {{{5}}}, pero ahora no ocurriría que B ∈ B, pues {{{5}}} ∈ / {{{5}}}. En realidad es difícil encontrar una colección que se contenga a sí misma como elemento, pero las hay. Si pensamos por ejemplo en el conjunto de las cucharas de té,67 es claro que ese conjunto no es en sí una cuchara de té, de modo que no se contiene a sí mismo como elemento, ¿pero qué ocurre si pensáramos en el conjunto de todas las cosas que no son cucharas de té?, en él entra todo lo imaginable, excepto las cucharas de té; él no es una cuchara de té, entonces sí es elemento de sí mismo. O supongamos que definimos A = {Conjuntos que pueden ser definidos con menos de 20 palabras}. Para definir A requerimos de 10 palabras, entonces A ∈ A. Si llamamos ordinarios a los conjuntos que no se contienen a sí mismos como elementos, y excepcionales a aquellos que sí se contienen a sí mismos como elementos, la propiedad que define a unos es la negación de la propiedad que define a los otros, de manera que un conjunto solo tiene una opción posible: es ordinario o es excepcional. Si es lo uno, no puede ser lo otro, y viceversa. Pues bien, el problema surge cuando pensamos en el conjunto R = {Conjuntos ordinarios}. ¿Es R un conjunto ordinario? Si lo fuera, sería elemento del conjunto de los conjuntos ordinarios, pero ese es él mismo, entonces resultaría ser excepcional, y si creemos que es excepcional tendría que pertenecer a sí mismo, pero en R están todos los ordinarios y solo ellos, de modo que habría sido ordinario. Llegamos a una situación en la que R ∈ R ⇐⇒ R ∈ / R, lo cual es claramente una contradicción. Imaginen un experto en arte que separa en dos clases todas las obras creadas hasta la actualidad: por un lado aquellas en las que el pintor se incluyó a sí mismo en la pintura, por el otro lado todas en las que no aparece el pintor como parte de la obra. Un buen día decide organizar una exposición en la que se exhiban todas las pinturas en que el pintor no aparece en ellas, y manda hacer una pintura que recoja la imagen
162
TRES PREGUNTAS IMPORTANTES
de la exposición, si esa pintura va a ser expuesta junto con las demás, ¿debe incluir a su propio pintor?68 Desde la antigüedad se han formulado paradojas que recuerdan este tipo de contradicciones. Una muy conocida es la de Eubulides, que decía que “Epiménides, el cretense, dijo alguna vez: todos los cretenses mienten”. El dilema era: ¿mentía o decía la verdad? Si mentía, era falso que mentía y entonces decía la verdad; si decía la verdad, mentía. Si se formara un conjunto con todos los que mienten en Creta, ¿debería o no incluir a Epiménides? O aquella en la que A. Tarsky informa de un libro de 100 páginas, con una sola afirmación en cada página. Lo que se lee en él es: Pág. 1: La afirmación de la página 2 es verdadera. Pág. 2: La afirmación de la página 3 es verdadera. . . . Pág. 99: La afirmación de la página 100 es verdadera. Pág. 100: La afirmación de la página 1 es falsa. ¿Qué páginas entrarían en el conjunto de las que tienen escrita una afirmación verdadera? o La paradoja de Russell mostraba que había algo que estaba funcionando mal en el concepto mismo de conjunto. La noción intuitiva de conjunto, llevada demasiado lejos, conducía a contradicciones lógicas. Los ejemplos de conjuntos que inducían a paradojas eran siempre colecciones definidas a partir de criterios demasiado amplios, como al hablar del conjunto que los contiene a todos, o a casi todos (la inmensa mayoría constituida por los ordinarios). Años después (1905), el matemático húngaro Julius König (1849-1913), diría: Que la palabra “conjunto” está siendo indiscriminadamente utilizada para nociones completamente diferentes y que esta es la fuente de las aparentes paradojas de esta joven rama de la ciencia, que, más aún, la teoría de conjuntos no puede seguir prescindiendo de bases axiomáticas lo mismo que cualquier otra ciencia exacta, y que esas bases, igual que en las otras disciplinas, están sujetas a cierta arbitrariedad, aun si aquí son más profundas, yo no quiero presentar nada de esto como algo nuevo.69 Cantor mismo, desde tiempo antes de que empezaran a surgir las paradojas, había expresado reservas respecto de pretender abarcar en una entidad única, completa y bien definida, colecciones demasiado amplias.70 Pero lo cierto es que no hubo un reparo sobre la situación, sino
LAS PARADOJAS EN LA DEFINICIÓN DE CONJUNTO
163
hasta después de la paulatina y ascendente sacudida que significó la paradoja de Russell. La solución consistió básicamente en cambiar el esquema del que se partía en la construcción de conjuntos, según el cual Si P es una propiedad entonces Todos los objetos que cumplen P forman un conjunto (Principio de abstracción ilimitada), que resultaba demasiado ambicioso, por otro más modesto: Si P es una propiedad y X es cualquier conjunto entonces Los elementos de X que cumplen P, pueden formar un conjunto (Principio de abstracción limitada o de separación). Pero ¿cómo fue definido entonces el concepto mismo de conjunto? La cita de Julius König señalada lo menciona. Se pensó que el terreno más firme para evitar nuevas paradojas era establecer algunas propiedades básicas de validez incuestionable y a partir de ahí deducir lógicamente todas las demás. A la manera de Los elementos de Euclides, en donde tras establecer 13 definiciones, se enuncian cinco postulados y cinco nociones comunes (formas distintas de lo que hoy conocemos como axiomas), y se procede a probar 465 proposiciones apegándose a lo que a su vez eran consideradas reglas básicas (axiomas) de la lógica formal. Trataremos de dar un panorama general sobre los axiomas escogidos para la teoría de conjuntos, sin entrar en detalle a mostrar cómo se va elaborando en forma escalonada toda la teoría a partir de ellos (formación de conjuntos iniciales, derivación de otros con base en las operaciones definidas entre ellos, propiedades, etc). Aprovecharemos nuestro estudio más a fondo de los números reales en el capítulo 7, para discutir ahí más detenidamente qué es, cómo se elabora y cómo funciona un modelo axiomático, cómo se escogen las propiedades básicas, cómo es que de ellas se van desprendiendo las demás, etc. Aunque debemos decir que lo que se conoce como modelo axiomático de los números reales es en cierta forma cualitativamente distinto al modelo axiomático de la teoría de conjuntos; en aquel caso el énfasis está puesto más bien en caracterizar cómo operan los números reales, y en este, en establecer reglas claras respecto a qué colecciones son reconocidas como conjuntos y cuáles no.
164
TRES PREGUNTAS IMPORTANTES
En 1908 Zermelo —de quien hablamos en la sección anterior en relación con el axioma de elección— publicó una lista de siete axiomas (y varias definiciones).71 Más tarde, Poincaré publicó un escrito en el que exponía en lenguaje sencillo cuál era el contenido de dichos axiomas. Dada la claridad de la exposición de Poincaré, salvo por pequeñas modificaciones, lo citaremos casi textualmente a continuación72 (agregaremos al final de cada axioma el nombre que Zermelo les dio en su propio artículo): 1) Dos conjuntos que tienen los mismos elementos son iguales (axioma de extensionalidad). 2) Existe un conjunto que no tiene ningún elemento. Este es el conjunto vacío; si existe un objeto a, entonces existe el conjunto {a} del cual este objeto es el único elemento; si existen dos objetos, a y b, existe un conjunto {a, b} del cual esos dos objetos son los únicos elementos (axioma de conjuntos elementales). 3) El conjunto de todos los elementos de un conjunto M que satisfacen una condición x forman un subconjunto de M (el cambio de esquema que ya comentamos) (axioma de separación). 4) A cada conjunto T le corresponde otro conjunto P(T ) formado por todos los subconjuntos de T (axioma del conjunto potencia). 5) Consideremos un conjunto T cuyos elementos son en sí mismos conjuntos; existe un conjunto ST , cuyos elementos son los elementos de los elementos de T . Si por ejemplo, T tiene tres elementos A, B, C, que en sí mismos son conjuntos; si A tiene dos elementos a y a’, B tiene dos elementos b y b’, C tiene dos elementos c y c’, ST tendrá seis elementos a, b, c, a’,b’,c’ (axioma de la unión). 6) Si hay un conjunto T cuyos elementos son a la vez conjuntos, es posible escoger un elemento en cada uno de sus conjuntos elementales, y entonces el conjunto de los elementos así escogidos forman un subconjunto de ST (axioma de elección). 7) Existe al menos un conjunto infinito (axioma de infinito). Poincaré aclara que el axioma 7 no es formulado así por Zermelo, sino dando un rodeo un tanto artificial para evitar el uso de la palabra infinito en los axiomas, los cuales consideraba como algo previo a la distinción entre finito e infinito, pero que a final de cuentas de lo que se trata es de garantizar la existencia de un conjunto infinito. Posteriormente, a partir de algunas objeciones presentadas a esta lista de axiomas, Zermelo agregó otros dos, conocidos como axioma de reemplazo (o sustitución) y axioma de fundación. El primero, a sugeren-
OTROS RESULTADOS
165
cia de otros dos matemáticos, el alemán Abraham Fraenkel (1891-1965) y el noruego Albert Skolem (1887-1963), plantea que las imágenes de una relación funcional aplicada a los elementos de un conjunto siempre forman un conjunto (lo cual permite sustituir cada elemento de un conjunto por otro conjunto, y obtener con ello un nuevo conjunto). El segundo, que tiene como consecuencia casi inmediata que ningún conjunto es elemento de sí mismo, y más importante aun, que permite construir los números naturales a partir del simple conjunto vacío, y a partir de tomar el conjunto potencia de los mismos construir los números reales. . . y todo lo demás. Este sistema de axiomas es conocido como el sistema Zermelo-Fraenkel, y aunque no fue el único propuesto para edificar sobre esa base toda la teoría de conjuntos (otro bastante conocido es el de Von NeumannBernays-Gödel), es el más utilizado.73 Vimos que Zermelo incluyó en su lista de axiomas básicos al axioma de elección, que había sido motivo de una de las mayores controversias en la historia de la matemática. Al presentar esta parte, decíamos que los axiomas tienen el carácter de “un conjunto mínimo de propiedades básicas de validez incuestionable” a partir de las cuales se procede a demostrar todas las demás. Pero el problema estaba precisamente en eso: que su validez distaba mucho de ser considerada “incuestionable”; muy por el contrario, la salida propuesta dio lugar a nuevas polémicas (entre otros, por parte del propio Poincaré) combinadas con otros temas, como el que se plantea en la próxima sección. Agregaremos solamente que Fraenkel demostró que el axioma 6, es decir el AE, era independiente de los demás. A partir de ello se suele hacer una distinción en los axiomas de Zermelo-Fraenkel: sin el AE son denotados como Axiomas ZF, con el AE son denotados como ZFE (en realidad, ZFC por sus siglas en inglés, la C correspondiente a Choice).
3.4.
Otros resultados
Terminaremos el capítulo con tres importantes resultados generales y un esbozo de la aritmética entre los números cardinales (sin entrar en este caso a las pruebas formales). En el camino veremos algunos ejemplos más. Los resultados se refieren a:
166
TRES PREGUNTAS IMPORTANTES
o Un criterio que facilita enormemente la comparación entre las cardinalidades de dos conjuntos, pues evita exhibir una biyección explícita entre ellos. Se trata de una idea que le propuso Cantor a su estudiante de doctorado Felix Bernstein (1878-1956), quien finalmente demostró su validez.74 En paralelo, otro matemático alemán, Ernst Schröder (1841-1902), publicó su propia demostración. Las dos publicaciones aparecieron en el año 1898 (al parecer R. Dedekind ya lo había demostrado también, pero no lo publicó). De ahí que lleve el nombre de teorema de Cantor-Bernstein-Schröder. o La comparación entre las cardinalidades de conjuntos de distinta dimensión. En particular, se revisará el caso de un intervalo en la recta y un cuadrado en el plano. Se ha hecho famosa la exclamación de Cantor “lo veo, pero no lo creo”, en una carta a R. Dedekind fechada el 29 de junio de 1877 comunicándole el descubrimiento de que ambos tienen la misma cardinalidad. Acompañaremos la demostración con una explicación de H. Poincaré sobre el concepto de dimensión, la cual permite fijar ideas para distinguirlo bien del concepto de cardinalidad. parte de los números irracionales que conocemos √ importante √ √ o√Una √ ( 3, 5+ 3 7, 6 29− 10 101, etc.) son raíces de polinomios con coeficientes enteros. Los números con esta propiedad se conocen como números algebraicos, los cuales incluyen, además de los irracionales del tipo de los mencionados, a los racionales e incluso a una parte de los complejos. Pues bien, Cantor probó que ni aun todos ellos juntos rebasan la cardinalidad de los naturales. Veremos esta demostración y comentaremos algunas consecuencias de ella más adelante.
3.4.1.
Para facilitar la comparación entre cardinalidades: el teorema de Cantor-Bernstein-Schröder
Hemos visto que con los conjuntos infinitos no ocurre que si un conjunto está contenido propiamente en otro, o si lo podemos poner en correspondencia biunívoca con un subconjunto propio de él, entonces tenga necesariamente que ser menor que él. Pero lo que desde luego ocurre es que no puede ser mayor, a lo más puede ser igual. Eso nos lleva a establecer la definición siguiente:
OTROS RESULTADOS
167
Definición 12. Sean X, Y dos conjuntos con cardinalidades α y β. Decimos que α ≤ β si existe una función inyectiva f : X −→ Y. Nótese que el que f sea inyectiva no la obliga a ser también sobreyectiva. En caso de serlo sería biyectiva y lo que podríamos afirmar es más fuerte: que α = β. En general, la imagen de una función es un subconjunto del contradominio; es decir, Im(f ) ⊆ Y, y por supuesto, toda función es sobreyectiva sobre su imagen. Es decir, que si f : X → Y es inyectiva, entonces f : X ←→ Im(f ) es biyectiva. Así es que f : X −→ Y es inyectiva ⇐⇒ f : X ←→ Y0 para algún Y0 ⊆ Y. Naturalmente, Y0 = Im(f ).[5] En otras palabras, tenemos que: Teorema 3.8. |X| ≤ |Y| ⇐⇒ ∃ f : X ←→ Y0 , para algún Y0 ⊆ Y.
(3.11)
¿Qué se ocurre como un resultado natural? Pues que si tenemos dos conjuntos X, Y tales que |X| ≤ |Y| y |Y| ≤ |X|, entonces |X| = |Y|. Esto desde luego es válido cuando los conjuntos son finitos, pero ya sabemos que cuando aparece el infinito en escena hay que llevársela con calma. ¿Es válido? Sí, ese es precisamente el contenido del siguiente teorema. [5] Podría plantearse una discusión análoga a la desarrollada aquí a partir de pedir la inyectividad de una función que va de X a Y, pidiendo en su lugar la sobreyectividad de alguna otra función que vaya “de regreso”:
Teorema 3.7. |X| ≤ |Y| ⇐⇒ existe una función sobreyectiva g : Y −→ X. Demostración. ⇐) Sea f : X −→ Y tal que a cada elemento x ∈ X le asocia cualquiera (uno solo) de los elementos y ∈ Y que la función g mandó a x. De manera que f : X ←→ Y0 ⊆ Y, quedando formado Y0 por los elementos y ∈ Y que escogimos para definir f . Solo que en este caso, al construir el conjunto Y0 , si resultara infinito, estaríamos presuponiendo el axioma de elección. Para una función particular es posible que el conjunto Y0 se pueda obtener especificando qué elemento y ∈ Y escogemos dentro de los que la función g mandó a x para cada x, en cuyo caso no se estaría utilizando el axioma de elección (como por ejemplo, si g(y) = y 2 y para cada √ x ∈ R+ ∪ {0} escogemos la y ≥ 0 tal que x = y 2 ; es decir, escogemos y = + x). ⇒) Partiendo de la definición 12, |X| ≤ |Y| =⇒ existe f : X → Y inyectiva. En ese caso podemos definir g : Y → X de manera que g(y) = f −1 (y) si y ∈ Im(f ) ⊆ Y, y g(y) = x1 ∀y ∈ Y \ Im(f ), donde x1 es cualquier elemento específico de X. Evidentemente esta función g es sobreyectiva, y para construirla no fue necesario utilizar el axioma de elección. Así es que la equivalencia es válida en general solo si se supone el axioma de elección. (La implicación en una dirección es válida siempre).
168
TRES PREGUNTAS IMPORTANTES
Teorema 3.9. Teorema de Cantor-Bernstein-Schröder (1898). [6] Si existen dos funciones inyectivas f : X −→ Y y g : Y −→ X, entonces existe una función biyectiva h : X ←→ Y. O bien: Sean X, Y dos conjuntos con cardinalidades α, β respectivamente. Si existen dos funciones inyectivas f : X −→ Y y g : Y −→ X (es decir, si α ≤ β y β ≤ α) entonces α = β. Demostración. La idea por supuesto es construir h a partir de f y g (ver figura 3.2).
(a)
(b)
Figura 3.2
Sea y1 ∈ Y. Tomando las imágenes inversas de y1 bajo g y bajo f alternadamente una y otra vez, construiremos una sucesión y1 , x1 , y2 , x2 , . . . : Sea x1 = f −1 (y1 ), ¿existe? Si existe, sería única, dada la inyectividad de f. Sea y2 = g −1 (x1 ), ¿existe? Si existe, sería única, dada la inyectividad de g. Y seguimos: x2 = f −1 (y2 ), y3 = g −1 (x2 ), x3 = f −1 (y3 ), y4 = g −1 (x3 ), ... f −1
g −1
f −1
g −1
f −1
g −1
y1 −→ x1 −→ y2 −→ x2 −→ y3 −→ x3 −→ . . . [6]
En 2013 fue publicado el libro Proofs of the Cantor-Bernstein Theorem, A Mathematical Excursion (ver en la bibliografía Hinkis, A., 2013), que abarca 100 años de discusión sobre este teorema (de 1870 a 1970, 429 págs.) e incluye pruebas, observaciones y reflexiones de Cantor, Schoenflies, Dedekind, Borel, Schröder, Bernstein, Zermelo, Russell, Jourdain, Harward, Poincaré, Peano, J. Köning, Korselt, Sierpinski, Banach, Kuratowski, Brouwer, Whittaker, Tarski, Knaster, Sikorski, Reichbach... Esto nos da una idea de la importancia del resultado. La prueba que aquí presentamos se basa en la que aparece en Hamilton, A.G., 1982.
169
OTROS RESULTADOS
Hay tres posibles desenlaces del proceso anterior: a) Que lleguemos a una xn ∈ X y nos detengamos ahí, porque @ yn+1 ∈ Y tal que g −1 (xn ) = yn+1 (es decir, xn ∈ X \ Im(g)), terminando entonces el proceso en X (ver figura 3.3a).
(a)
(b)
(c)
(d)
Figura 3.3
b) Que lleguemos a una yn ∈ Y y nos detengamos ahí, porque @ xn ∈ X tal que f −1 (yn ) = xn (es decir, yn ∈ Y \ Im(f )), terminando entonces el proceso en Y (ver figura 3.3b). c) Que el proceso continúe indefinidamente. Observemos que esto puede significar que regresamos en algún momento a y1 y se repita una y otra vez (indefinidamente) un ciclo (finito) (figura 3.3c). O puede significar que se generen dos sucesiones xn y yn con infinidad de términos diferentes (figura 3.3d). Este proceso lo podemos desarrollar para toda y ∈ Y, y en cada caso solo es posible uno de los desenlaces señalados. Sean entonces:
170
TRES PREGUNTAS IMPORTANTES
YX = {y ∈ Y : el proceso comienza en y y termina en el conjunto X}. YY = {y ∈ Y : el proceso comienza en y y termina en el conjunto Y}. Y∞ = {y ∈ Y : el proceso comienza en y y continúa indefinidamente}. De acuerdo con lo dicho, estos tres conjuntos forman una partición del conjunto Y (ver figura 3.4b). Si en lugar de iniciar el proceso con un elemento de Y lo hacemos con un elemento x1 ∈ X, aplicando ahora primero g −1 y luego f −1 alternadamente, obtendríamos un desarrollo completamente análogo y podríamos generar los siguientes tres conjuntos, que a su vez formarían una partición del conjunto X (ver figura 3.4a): XX = {x ∈ X : el proceso comienza en x y termina en el conjunto X}. XY = {x ∈ X : el proceso comienza en x y termina en el conjunto Y}. X∞ = {x ∈ X : el proceso comienza en x y continúa indefinidamente}.
(b)
(a)
Figura 3.4
¿Qué pasa si probamos que existe una biyección de XX en YX , otra de XY en YY y otra más de X∞ en Y∞ ? (ver figura 3.5). Que con la función h definida sobre X que coincide con las biyecciones en XX , XY y X∞ , obtenemos una biyección global de X en Y. Por un lado, dados x1 , x2 ∈ X, si sus imágenes fueran la misma, al estar esta necesariamente en uno —y solo uno— de los tres subconjuntos de la partición de Y, los dos elementos de X tendrían que haber estado a su vez en el mismo subconjunto correspondiente de la partición de X, y como ahí la función
171
OTROS RESULTADOS
está garantizando que es localmente biyectiva, al tener la misma imagen x1 y x2 , tendrían que haber sido iguales entre sí. Es decir, nuestra función h habría sido inyectiva sobre todo X. Por otro lado, si tomamos cualquier y ∈ Y, esta tendría que caer en alguno —y solo en uno— de los tres subconjuntos de la partición de Y, y por la biyectividad de las tres funciones que definen a h, tendría que existir un elemento x en el correspondiente subconjunto de la partición de X, que al aplicarle la biyección local —que coincide con h— sea igual a y, de modo que h sería sobreyectiva.
(a)
(b)
(c)
(d)
Figura 3.5
Pues bien, procedamos entonces a demostrar la existencia de las tres funciones biyectivas mencionadas al principio del párrafo anterior. Probaremos que: a) La restricción de f a XX [7] es una biyección de XX en YX . [7]
Para recordar la definición de restricción de f o función restringida ver pág. 450.
172
TRES PREGUNTAS IMPORTANTES
b) La restricción de g −1 a XY es una biyección de XY en YY . c) La restricción de f a X∞ es una biyección de X∞ en Y∞ . Veamos: a) f de por sí es inyectiva. Lo que tenemos que garantizar en realidad es que: i) ∀ x ∈ XX =⇒ f (x) ∈ YX . ii) ∀ y ∈ YX ∃ x ∈ XX tal que y = f (x). i) Sea x ∈ XX =⇒ El proceso iniciado en x termina en X. Apliquemos entonces el proceso a partir de f (x) = y ∈ YX . El primer paso consiste en aplicarle f −1 , lo cual nos regresa a x, y a partir de ahí todo es igual, así es que el proceso empezado en y = f (x) también termina en X. Es decir, que f (x) ∈ YX . ii) Sea ahora y ∈ YX . Eso significa que el proceso iniciado en y termina en X. De modo que al menos tendría que existir x ∈ X tal que x = g −1 (y), ya que de no ser así habría terminado en Y (pues nunca habría salido de ahí). Y si aplicamos el proceso a partir de esa x, este resulta idéntico al que había comenzado en y. Es decir, que termina en X. Así que x ∈ X. b) La prueba de este inciso es análoga a la del inciso anterior. c) Debemos probar dos cosas otra vez: i) ∀ x ∈ X∞ =⇒ f (x) ∈ Y∞ . ii) ∀ y ∈ Y∞ ∃ x ∈ X∞ tal que y = f (x). i) Sea x ∈ X∞ ⊆ X =⇒ y = f (x) ∈ Y. Iniciemos el proceso en y = f (x). En el primer paso regresamos a x, y a partir de ahí tendría que continuar indefinidamente, de manera que el proceso iniciado en y tampoco termina nunca, y entonces f (x) ∈ Y∞ . ii) Sea y ∈ Y∞ . Como el proceso iniciado en y continúa indefinidamente, debe existir x = g −1 (y) ∈ X, y a partir de ahí también debe ser indefinido, pues si terminara habría terminado al empezar en y. Así es que x ∈ X∞ . Podemos concluir entonces que la función h : X −→ Y definida a continuación, es una biyección de X en Y: h(x) =
f (x),
g −1 (x),
f (x),
si x ∈ XX si x ∈ XY si x ∈ X∞ .
OTROS RESULTADOS
173
Corolario 3.10. Si A ⊆ B ⊆ C y |A| = |C| =⇒ |A| = |B| = |C|. Demostración. La función f : A → B que manda cada elemento de A a sí mismo −es decir, f (x) = x− es obviamente inyectiva. Por hipótesis |A| = |C|, entonces existe una función biyectiva g : C → A. Como B ⊆ C, podemos restringir a B el dominio de g con su misma regla de correspondencia, y aunque ya no llene todo A, seguirá siendo inyectiva; entonces existe g : B → A inyectiva. Aplicando el Teorema CBS tenemos que |A| = |B|, y dado que |A| = |C| por hipótesis, las tres cardinalidades son iguales entre sí. Corolario 3.11. Si X ⊆ R y existe un intervalo abierto (a, b) ⊆ X, entonces X tiene la cardinalidad del continuo. Demostración. Recordemos que |(a, b)| = |R| (ver (2.11), pág. 133). Entonces el corolario anterior garantiza la conclusión. Tal y como lo mencionamos al principio, el teorema de CantorBernstein-Schröder (CBS) es quizás la herramienta práctica más utilizada cuando se quiere comparar la cardinalidad de dos conjuntos. Al margen de que lo usaremos en varias ocasiones en las subsecuentes secciones y capítulos, veremos aquí un ejemplo concreto y un par de teoremas en los que se muestra su utilidad (la prueba del segundo quedará como ejercicio). Ejemplo 3.12. Probar que el intervalo abierto (0, 1) tiene la misma cardinalidad que el intervalo cerrado [0, 1]. Solución 1. Primero probaremos el resultado recurriendo a la definición correspondiente; es decir, exhibiendo una biyección f : [0, 1] ←→ (0, 1). Tomaremos los valores de los términos de una sucesión conver1 }. A los puntos del [0, 1] gente en ambos intervalos, por ejemplo { n+1 distintos de los de la sucesión la función los dejará igual, les asignará su mismo valor. Con los de la sucesión haremos lo siguiente: los extremos de [0, 1], es decir el 0 y el 1, los mandaremos a los dos primeros términos de la sucesión en el intervalo abierto y todos los de la sucesión del intervalo cerrado los enviaremos a la sucesión en el abierto recorriéndolos dos lugares (los que fueron ocupados por el envío del 0 y el 1). Así, de la manera en que hacíamos las cosas con los ejemplos de los hoteles de Hilbert, quedan apareados todos los puntos del cerrado y el abierto sin que sobre ninguno en alguno de los dos conjuntos (ver figura 3.6).
174
TRES PREGUNTAS IMPORTANTES
Figura 3.6
Expresando formalmente la regla de correespondencia de f tendríamos x, 1
si si 2, f (x) = 1 , si 3 1 , si n+3
x 6= 0, n1 , ∀ n ∈ N. x = 0. x = 1. 1 x = n+1 , ∀ n ∈ N.
(3.12)
Solución 2. Recordemos que la cardinalidad de cualesquiera dos intervalos cerrados es la misma (proposición 2, pág. 131). Podemos entonces tomar cualquier intervalo cerrado contenido en el (0, 1) y aplicarle el corolario 3.10. Es decir, como [ 31 , 32 ] ⊆ (0, 1) ⊆ [0, 1] y |[ 13 , 23 ]| = |[0, 1]| =⇒ |(0, 1)| = |[0, 1]|. Solución 3. También se puede decir simplemente que el (0, 1) contiene a un intervalo abierto (él mismo) y aplicar directamente el corolario 3.11. Naturalmente, lo anterior es válido no solo para el intervalo (0, 1), sino para cualquier intervalo en general (los argumentos son los mismos): ∀ a, b ∈ R, a < b :
|(a, b)| = |[a, b]|.
(3.13)
Teorema 3.13. La unión numerable de conjuntos no vacíos, finitos y ajenos entre sí, resulta siempre numerable. Demostración. Ya hemos visto (teorema 2.8) que la unión finita de conjuntos numerables es numerable, pero la formulación aquí es diferente.
175
OTROS RESULTADOS
Sea {Bk : k ∈ N} una familia numerable de conjuntos finitos, tales que Bk 6= ∅ ∀ k ∈ N y Bk ∩ Bm = ∅ ∀ k 6= m. Lo que debemos S demostrar es que ∞ k=1 Bk es un conjunto numerable. Como Bk 6= ∅, existe por lo menos un bk ∈ Bk ∀ k ∈ N. Y como Bk ∩ Bm = ∅ ∀ k 6= m, tenemos que bk 6= bm ∀ k 6= m. Sean Bk 1 = {bk }, y Bk ∗ = Bk ∪ N, ∀ k ∈ N. Por el teorema 2.6 sabemos que la unión de un conjunto finito con uno numerable resulta siempre numerable, así es que Bk ∗ es numerable ∀ k ∈ N, y además Bk 1 ⊆ Bk ⊆ Bk ∗ ∀ k ∈ N; pero entonces
∞ [
k=1
1
Bk ⊆
∞ [
k=1
Bk ⊆
∞ [
Bk ∗ .
k=1
En el lado izquierdo estamos uniendo una familia numerable de conjuntos con un solo elemento, siendo distintos todos esos elementos entre sí: nos resulta algo idéntico —en cardinalidad— a los naturales. En el lado derecho tenemos una unión numerable de conjuntos numerables, que sabemos por el teorema 2.9 que resulta numerable. Si llamamos A al conjunto del lado izquierdo, B al de enmedio y C al del lado derecho, tenemos que A ⊆ B ⊆ C y |A| = ℵ0 = |C|. Entonces, por el Corolario 3.10, tenemos que |B| = ℵ0 .
Teorema 3.14. La unión numerable de conjuntos finitos resulta siempre finita o numerable. La demostración se deja como ejercicio (ejercicio 9).
3.4.2.
Dimensión y cardinalidad
Habiendo demostrado que los reales constituían un infinito más grande que el de los números naturales, Cantor le planteó la siguiente cuestión a R. Dedekind en una carta fechada el 5 de enero de 1874: ¿Es posible mapear en forma única una superficie (digamos un cuadrado incluyendo sus fronteras) sobre una línea (digamos una recta incluyendo sus extremos), de forma que a
176
TRES PREGUNTAS IMPORTANTES
cada punto en la superficie le asociemos un punto en la línea, y recíprocamente a cada punto en la línea le corresponda un punto en la superficie?75 Consideraba que la solución a este problema podría resultar muy difícil, y que podía parecer superfluo planteárselo, pues la respuesta en sentido negativo era casi evidente. Tres años y medio después no solo estaba seguro de lo contrario, sino que lo había demostrado. La prueba fue sorprendentemente simple, aunque con un pequeño error que en el momento de corregirlo la hizo un poco más complicada. Para simplificar las cosas haremos la demostración combinando el teorema CBS con la idea original de Cantor, y trabajaremos con el intervalo y el cuadrado sin sus fronteras. Teorema 3.15. El intervalo I = (0, 1) y el cuadrado C = (0, 1) × (0, 1) tienen la misma cardinalidad. Demostración. Tenemos que aparear los elementos del cuadrado unitario (parejas ordenadas) con los puntos del intervalo (0, 1). La idea básica consiste en intercalar ordenadamente, una y una, las cifras de la primera y la segunda componente de la pareja. Al hacerlo, generamos la expansión decimal de un número del intervalo (0, 1), y de regreso hacemos lo inverso: tomamos la expansión decimal de un real en el (0, 1) y entresacamos sus cifras en orden, colocando las impares en un número (la primera componente de la pareja ordenada) y las pares en otro número (la segunda componente). Así, hemos establecido una correspondencia entre los puntos del cuadrado y los del intervalo unitario. Veamos algunos ejemplos al derecho y al revés: (x, y) −→ α (0.5, 0.3) (0.0319, 0.3752) (0.7272 . . . , 0.815)
−→ −→ −→
0.53 0.03371592 0.782175207020 . . .
α −→ (x, y) 0.7931 0.373737 . . . 0.591591 . . .
−→ −→ −→
(0.73, 0.91) (0.333 . . . , 0.777 . . . ) (0.519519 . . . , 0.951951 . . . )
177
OTROS RESULTADOS
Veamos el procedimiento en general. Los puntos del cuadrado unitario son parejas ordenadas de la forma (0.x1 x2 x3 . . . , 0.y1 y2 y3 . . . ), donde xk y yk = 0, 1, 2, . . . 9 ∀ k ∈ N, y no son todos 9’s a partir de algún momento (ni son todos iguales a 0 desde el principio, pues le quitamos la frontera al cuadrado para simplificar). Definimos una función f : (0, 1) × (0, 1) −→ (0, 1), que a cada pareja de esa forma le asigne el número α = (0.x1 y1 x2 y2 x3 y3 . . . ) que pertenece al (0, 1). Si no hubiéramos quitado las colas infinitas de 9’s, sucedería por ejemplo que (x, y) −→ α (0.4999 . . . , 0.131313 . . . ) (0.5, 0.131313 . . . )
−→ −→
0.4193919391 . . . 0.510301030103 . . .
Mientras que las dos parejas ordenadas corresponden a un mismo punto del cuadrado, el número real que les asociamos en uno y otro caso es distinto: nuestra función que va del cuadrado al intervalo no estaría bien definida. Pero esto se resuelve al quitar las colas infinitas de 9’s. El detalle está en que, al hacer esto, creamos otro problema: ¿de quién sería imagen el punto 0.4193919391 . . . ?, porque aplicando la regla tendría que serlo del (0.4999 . . . , 0.131313 . . . ); pero ese en realidad es el (0.5, 0.131313 . . . ), cuya imagen es otra. Es decir, que la función f que construimos, aunque es inyectiva, no llena todo el intervalo (0, 1); es decir, no es sobreyectiva y por lo tanto no es una biyección. Aquí es donde nos saltamos al teorema CBS: resulta que encontramos un apareamiento entre el cuadrado y el intervalo para el cual ¡le sobran puntos al intervalo! Bueno, ya tenemos lo más difícil. ¿Podemos pensar ahora en una función inyectiva g : I → C? Eso es sencillo: basta con “subir” el intervalo (0, 1) una distancia menor que 1 y obtenemos una raya contenida en el cuadrado. Se trata de una función evidentemente inyectiva, aunque sea, también evidentemente, no sobreyectiva. Pero eso ya no importa, como tenemos dos funciones inyectivas, una del cuadrado al intervalo y otra del intervalo al cuadrado, aplicamos el teorema CBS y concluimos que los dos conjuntos tienen la misma cardinalidad. La prueba se generaliza fácilmente a un cubo de tres, cuatro o n dimensiones (de hecho, así lo demostró Cantor). Después le plantearía Dedekind que el precio que había que pagar al establecer una biyección
178
TRES PREGUNTAS IMPORTANTES
entre un conjunto de una dimensión y otro de una dimensión diferente, era el de la pérdida de la continudad de la función que define la biyección. Pero esa es otra historia.[8] o Para finalizar, solo agregaremos que, como tantas otras cosas descubiertas por Cantor, este nuevo resultado que volvía a contradecir “el sentido común”, permitió avanzar en diversas direcciones. Por un lado, mostró que para estudiar ciertas características de los conjuntos infinitos de dimensiones mayores bastaba con hacerlo para los números reales; por el otro, obligó a precisar cuáles eran las propiedades que realmente caracterizaban el concepto de dimensión, cómo definirlo. Por la sencillez y la claridad de la explicación, vale la pena citar nuevamente a H. Poincaré sobre este tema. La cita no se refiere a una definición analítica del concepto de dimensión, sino a lo que sería más bien una definición topológica del mismo. Veamos (los subrayados son del original): [. . . ] Es entonces posible deformar un plano de manera tal que se obtenga una línea recta, partiendo de que esta deformación no es continua. Esto sería imposible, por otro lado, con una deformación continua. Entonces la cuestión del número de dimensiones está estrechamente vinculada con la noción de continuidad y no tendría ningún significado para alguien que deseara excluir esta noción. Basaré la determinación del número de dimensiones en la noción de cortes. Consideremos en primer lugar una curva cerrada, esto es, un continuo de una dimensión. Si tomamos cualesquiera dos puntos sobre esta curva sobre los cuales no nos permitimos pasar, la curva se verá cortada en dos partes, y será imposible ir de la una a la otra, permaneciendo siempre sobre la curva, pero sin pasar por los puntos excluidos. Consideremos, por otro lado, una superficie cerrada que forma un continuo de dos dimensiones. Es posible tomar en esta superficie uno, dos, o cualquier número de puntos excluidos. La superficie no se dividirá en dos partes por ello; será posible ir de un punto a otro en la superficie sin encon[8]
El problema está concretamente en que una función continua que va de un conjunto de cierta dimensión en otro de dimensión menor, no puede ser inyectiva. En cambio, no podemos hacer la afirmación aparentemente análoga “una función continua de un conjunto de cierta dimensión en uno de dimensión mayor no puede ser sobreyectiva”.
OTROS RESULTADOS
179
trar ningún obstáculo, porque siempre es posible rodear los puntos excluidos. Pero si trazamos en la superficie una o varias curvas cerradas y si las consideramos como cortes que no deben ser atravesados, la superficie puede entonces ser cortada en varias partes. Consideremos ahora el caso del espacio. Este no puede ser dividido en varias partes ni prohibiendo el paso por ciertos puntos ni prohibiendo el cruce de ciertas líneas; estos obstáculos pueden siempre ser rodeados. Será necesario prohibir el cruce de ciertas superficies; es decir, ciertos cortes de dimensión dos. Y es por esto que decimos que el espacio tiene tres dimensiones. Ahora ya sabemos qué es un continuo de n dimensiones. Un continuo tiene n dimensiones cuando es posible dividirlo en varias regiones a través de uno o más cortes que son en sí mismos continuos de n − 1 dimensiones. Esta es una definición recursiva.”76
3.4.3.
Dimensión infinita y aritmética cardinal
¿Y qué podríamos decir de R∞ ? Si Rn = {(x1 , x2 , . . . xn ) : xk ∈ R ∀ k = 1, 2, . . . n} está formado por todas las n-adas de números reales, lo que usualmente se identifica como R∞ —que sería más preciso identificar con el símbolo Rω , como veremos en el siguiente capítulo— consiste en las “n-adas infinitas” =sucesiones de números reales: R∞ = Rω = {{x1 , x2 , x3 , . . . } : xk ∈ R ∀ k ∈ N}. El paso a la dimensión infinita ¿produce un salto en la cardinalidad? Una combinación del razonamiento hecho por Cantor para el cuadrado de dimensión n —que seguimos en la sección anterior (teorema 3.15)— y del razonamiento también hecho por Cantor para numerar los racionales —que utilizamos en la discusión del ejemplo 2.5 (ver pág. 95)—, nos da la respuesta. Sea {xk } una sucesión arbitraria de números reales que asumiremos en el (0, 1) para simplificar, al fin que ya sabemos que (0, 1) tiene la misma cardinalidad que todo R. ¿De qué forma son sus elementos? Enlistemos algunos de ellos para plantear la idea:
180
TRES PREGUNTAS IMPORTANTES
x1 = 0. a1 a2 a3 a4 a5 . . . x2 = 0. b1
b2
b3
b4
b5
...
x3 = 0. c1
c2
c3
c4
c5
...
(3.14)
x4 = 0. d1 d2 d3 d4 d5 . . . x5 = 0. e1 .. .
e2 .. .
e3
e4 .. .
e5 . . .
¿Podemos asignarle un único número real α a toda la sucesión anterior? Sí, para construirlo vamos intercalando de una en una las cifras de todos los términos de la sucesión pero ordenadas, por ejemplo, siguiendo las diagonales SO → N E: α = 0. a1 b1 a2 c1 b2 a3 d1 c2 b3 a4 e1 d2 . . .
(3.15)
¿Hay riesgo de que se genere una cola infinita de 9’s? No, pues para que ocurriera eso todos los términos de la sucesión tendrían que tener colas infinitas de 9’s, y como son números reales, estas están descartadas (ninguno de los términos de la sucesión tiene una cola de 9’s). ¿Es biyectiva la relación? Veamos. Vista de regreso puede ocurrir que al “desdoblar” —es decir, pasar de (3.15) a (3.14)— un número que no tiene cola infinta de 9’s, se generen términos de la sucesión con colas infinitas de 9’s. Por ejemplo: α −→ {x1 , x2 , x3 , x4 , . . . } 0.519109100910009 . . .
−→ x1 = 0.599 . . . x2 = 0.1 x3 = 0.1 x4 = 0.1 x5 = 0.1 .. .
(3.16)
Entonces, no hay ninguna sucesión que sea asignada a 0.5191091009 . . . , pues la sucesión {0.6, 0.1, 0.1, 0.1, 0.1 . . . } está asignada al 0.6101001000 . . . , que es distinto.
OTROS RESULTADOS
181
¿Qué ocurrió? Que encontramos una función inyectiva f : {sucesiones de números reales en el (0, 1)} −→ (0, 1) ¡a la que le sobran elementos en el (0, 1)! No hay problema, basta con encontrar ahora una función inyectiva que a cada real en (0, 1) le asocie una sucesión de reales del (0, 1), y aplicando el teorema CBS podremos concluir que los dos conjuntos tienen la misma cardinalidad. Esa función es la parte fácil del asunto, puede ser la sucesión de constantes que en todos sus términos tiene precisamente al número real que tomamos en (0, 1); es decir, g : (0, 1) −→ {sucesiones de números reales en el (0, 1)}, g(x) = {x, x, x, . . . } Aunque está lejos de ser sobreyectiva, no importa, porque es claramente inyectiva y con eso basta. Hemos demostrado entonces el siguiente teorema. Teorema 3.16. La cardinalidad de R∞ = Rω = {sucesiones de números reales} es la misma que la de R. Es decir, cℵ0 = c. O sea que el salto de lo finito a lo infinito en la dimensión no produce un salto de un infinito a otro en la cardinalidad, al menos hablando de espacios con la cardinalidad del continuo. o Ahora pongamos atención en la formulación final del teorema. Recordando (3.8) y (3.4), tenemos que 2ℵ0 = c y ℵ0 · ℵ0 = ℵ0 , entonces ℵ0
cℵ0 = (2ℵ0 )
= 2ℵ0 ·ℵ0 = 2ℵ0 = c.
La exponenciación con cardinales pareciera cumplir una de las reglas básicas de la exponenciación con números reales. En realidad, si recordamos lo visto en la primera parte de la sección §3.2 (págs. 151 a 152), los números cardinales tienen su propia aritmética. Una a una las reglas con las que se rige se demuestran en general (no lo haremos aquí). Algunas de esas reglas son las siguientes:
182
TRES PREGUNTAS IMPORTANTES
Sean α, β, γ números cardinales. Entonces: Si α ≤ β =⇒ α + β = α · β = β.∗ γ
γ
γ
(α · β) = α · β . β
γ
α ·α =α
β+γ
(3.17) (3.18) (3.19)
.
β γ
(α ) = αβ·γ .
(3.20) γ
γ
Si α ≤ β =⇒ α ≤ β .
(3.21)
(*Se presupone que al menos uno de los dos cardinales es infinito, y el otro distinto de cero). Una vez que son probadas las reglas anteriores, se pueden utilizar para demostrar otros muchos resultados. Veamos un ejemplo. Ejemplo 3.17. Probar que ℵ0 ℵ0 = c. Solución. Si hacemos α = 2, β = ℵ0 , γ = ℵ0 en (3.21), tenemos que c = 2ℵ0 ≤ ℵ0 ℵ0 . Si ahora hacemos α = ℵ0 , β = c, γ = ℵ0 en (3.21), tenemos que ℵ0 ℵ0 ≤ cℵ0 = c. Entonces ℵ0 ℵ0 = c por el teorema CBS. Observen las dos reglas implicadas por (3.17): el cardinal más grande absorbe al más chico cuando se trata de uniones y productos cartesianos. El siguiente corolario es consecuencia de ello. Corolario 3.18. La unión de un conjunto con la cardinalidad del continuo y otro con la cardinalidad de los naturales, nos resulta siempre un conjunto con la cardinalidad del continuo. Por otro lado, nótese que las propiedades enunciadas no dicen nada de la resta de dos conjuntos, y es que ahí pueden ocurrir otras cosas. Piensen, por ejemplo, que a los naturales les quitamos el conjunto de los naturales mayores que 5, ¿qué resulta?, el conjunto {1, 2, 3, 4, 5}, finito. ¿Y si a N le quitamos los pares?, nos resultan los impares, que es un conjunto numerable. Pensemos que a un conjunto X con la cardinalidad del continuo le quitamos un conjunto Y numerable, ¿cómo esperaríamos que resultara X \ Y?
OTROS RESULTADOS
183
Desde luego, no podría ser finito ni numerable, pues en ese caso tendríamos que como (X \ Y) ∪ Y = X, si X \ Y fuera finito o numerable, como Y es numerable X sería numerable, lo cual es falso. De lo anterior se podría concluir que X \ Y deberá tener entonces la cardinalidad del continuo, pero en ello hay un problema, pues estaríamos suponiendo que un subconjunto de un conjunto con la cardinalidad del continuo no puede más que ser finito, numerable o tener la misma cardinalidad del continuo. Es decir, estaríamos suponiendo la hipótesis del continuo.[9] En realidad, la prueba directa de este resultado —que consiste en exhibir una biyección entre X y X \ Y— no resulta complicada, tal y como veremos a continuación. Teorema 3.19. Sean X y Y ⊂ X dos conjuntos, | X |= c. a) Si Y es finito, entonces | X \ Y |= c. b) Si Y es numerable, entonces | X \ Y |= c. Demostración. Ya argumentamos que en cualquiera de los dos casos X \ Y no puede ser finito ni numerable. Sea entonces A = {a1 , a2 , . . . } ⊂ X \ Y ⊂ X un conjunto numerable. a) Si Y es finito, llamemos b1 , b2 , . . . , bN a sus elementos. En este caso la biyección entre X y X \ Y estaría dada por la función f : X → X \ Y, definida como[10] f (x) =
x
a ,
k a n+N
si x 6= bk y x 6= an , ∀ k = 1, 2, . . . , N y ∀ n ∈ N. si x = bk , ∀ k = 1, 2, . . . , N. si x = an , ∀ n ∈ N.
b) Si Y es numerable, llamemos b1 , b2 , . . . a sus elementos. En este caso la biyección entre X y X\Y estaría dada por la función f : X → X\Y, definida como f (x) =
x
a
2n a 2n−1
si x 6= bn y x 6= an , ∀ n ∈ N. si x = bn , ∀ n ∈ N. si x = an , ∀ n ∈ N.
En ambos casos es inmediato que la función propuesta resulta una biyección. [9]
En el siguiente capítulo discutiremos más detalladamente la hipótesis del continuo. Aquí nos basta con saber lo que mencionamos de ella en la introducción a este capítulo. [10] Nótese que la función f aquí propuesta es una simple generalización de la que utilizamos en (3.12).
184
TRES PREGUNTAS IMPORTANTES
El segundo inciso del resultado anterior es un caso particular de un teorema bastante más general77 probado por W. Sierpinski sin utilizar el axioma de elección [11] (y por lo tanto sin utilizar la hipótesis del continuo, de acuerdo a lo que comentaremos al final del siguiente capítulo), que dice que si m ≥ ℵ0 es un cardinal cualquiera, entonces 2m −m = 2m . Como seguramente ya habrán descubierto, este teorema tiene una consecuencia muy importante en el estudio de los números reales. Corolario 3.20. Los números irracionales tienen la misma cardinalidad que los reales. Costaba trabajo encontrar números irracionales, y nos encontramos ahora con que son una infinidad mucho mayor que los números racionales. Parecía que los racionales tapizaban la recta dejando “uno que otro hoyo”, y resulta que dejan más hoyos que los que tapan.
3.4.4.
Números algebraicos y trascendentes: un primer acercamiento
Por polinomio real entendemos una función descrita por la fórmula P (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 , con n ∈ N, x ∈ R.
(3.22)
Los números an , an−1 , . . . a1 , a0 son constantes, llamados coeficientes del polinomio. El grado del polinomio se define como el exponente más grande al cual está elevada la variable cuyo coeficiente sea diferente de cero: en (3.22) si an 6= 0 el grado del polinomio es n. Cuando an , an−1 , . . . a1 , a0 son enteros, se dice que P (x) es un polinomio con coeficientes enteros. Los valores x para los cuales P (x) = 0, son llamados raíces del polinomio (geométricamente hablando, se trata de las abcisas de los puntos en que la gráfica del polinomio cruza el eje X). Así por ejemplo, si P (x) = 3x + 5, la única raíz de P (x) es x = − 35 . Si P (x) = x2 − 1, las raíces de P (x) son x = 1 y x = −1. [11]
Para el estudio de la aritmética ordinal y, más en general, de toda la teoría de conjuntos haciendo explícitos los resultados que no requieren al AE, es recomendable el libro de W. Sierpinski Cardinal and Ordinal Numbers. Originalmente se trataba de unas notas de clase de 1912, y con el paso de los años se fue puliendo y ampliando sucesivamente hasta el año 1952. En la bibliografía aparece la referencia completa.
OTROS RESULTADOS
185
Un polinomio real puede no tener raíz alguna: si pensamos, por ejemplo, en P (x) = x2 + 1, se trata de la parábola y = x2 subida una unidad, y su gráfica nunca cruza el eje X. Por lo demás, si tratamos de despejar √ la x en la ecuación x2 +1 = 0, llegaremos a que x = −1, lo cual no está definido en R, pues no existe un número real que elevado al cuadrado resulte −1. Sin embargo, si aceptamos que la variable x se mueva no solo entre los números reales, sino entre los números complejos, la cosa cambia. √ Estos se definen como el conjunto de los números de la forma a + b √−1, con a, b ∈ R. Si b = 0, se trata de los números reales. El número −1 se conoce como número i. La suma y el producto entre complejos se √ √ definen de manera tal que al multiplicar i · i = i2 = −1 · −1 = −1. Así es que en el universo de los polinomios complejos con coeficientes √ enteros, el polinomio P (x) = x2 + 1 sí tiene una raíz: x = −1 = i. En realidad tiene dos, pues si tomamos x = −i, igual se cumple que (−i) · (−i) = (−1)(−1)(i · i) = i2 = −1.[12] Ahora bien, llamamos números algebraicos a los que son raíces de un polinomio real o complejo con coeficientes enteros (como se iguala a cero el polinomio, basta con tomar aquellos en los que an > 0). Llamemos A al conjunto de estos números. Todo número entero, y más en general todo número racional, es algebraico. La demostración es muy sencilla: si x = pq , p ∈ Z, q ∈ N =⇒ qx−p = 0, por lo tanto x es raíz de un polinomio con coeficientes enteros; es decir, es algebraico, de manera que Q ⊆ A. Asimismo, toda raíz de cualquier grado de un número racional es q también un número algebraico: si x = n pq =⇒ qxn − p = 0 =⇒ x ∈ A. Combinaciones lineales con coeficientes enteros de raíces de distinto grado de números racionales también son números algebraicos. o Los números reales y complejos que no son algebraicos reciben el nombre de números trascendentes (digamos que porque trascienden a los métodos algebraicos). Centrándonos en los reales, de lo dicho queda claro que todo número trascendente es irracional, pero resulta difícil encontrar métodos para proponerlos en concreto.
[12]
No trabajaremos aquí con los complejos. Los mencionamos solamente para que se tenga presente que los números algebraicos no solo incluyen a todos los racionales y muchos de los irracionales conocidos, sino incluso a una buena cantidad de números complejos.
186
TRES PREGUNTAS IMPORTANTES
En 1844 el matemático francés Joseph Liouville (1809-1882) demostró que los números algebraicos tenían la propiedad de que para acercarse a ellos con números racionales se debían hacer muy grandes los denominadores, estableciendo una cota que relacionaba la distancia entre el número algebraico y cualquier aproximación racional a él, con el denominador de dicho racional y el grado del polinomio del que el número algebraico era raíz. A partir de ello, en 1850 construyó un número irracional al cual fuera posible acercarse con números racionales cuyos denominadores fueran menores que los indicados por la cota establecida, obteniendo así el primer número cuya trascendencia se pudo demostrar; de hecho, obtuvo toda una familia de dichos números.[13] El siguiente es el más conocido de ellos: 1 1 1 1 + 2! + 3! + 4! + . . . 1! 10 10 10 10 =0.1 + 0.01 + 0.000001 + 0.000000000000000000000001 + . . . =0.11000100000000000000000100 . . . El ejemplo de Liouville vino a demostrar que existen efectivamente los números trascendentes, pues habiendo sido definidos en términos de lo que no son (son aquellos que no son algebraicos), su existencia no estaba garantizada, por más que todo mundo la consideraba segura. Euler, a quien algunos historiadores atribuyen haber sido el primero en definir los números trascendentes —aunque hay polémica sobre esto—, no logró mostrar alguno. Los candidatos naturales eran por supuesto e y π. Pero hubo que trabajar mucho para probar que eran trascendentes, se logró primero con e. Fue el matemático francés Charles Hermite (1822-1901) quien lo consiguió en el año de 1873. Cuando le sugirieron que continuara con π, respondió: No me atrevo a intentar probar la trascendencia de π. Si otros lo logran, nadie estará más feliz que yo con su éxito, pero créame, mi querido amigo, que no dejará de costarles un cierto esfuerzo.(Carta a C. W. Borchardt)78 [13]
Liouville demostró que, en general, todos los números de la forma a2 a3 a4 a1 + 2! + 3! + 4! + . . . 101! 10 10 10
con ak = 1, 2, . . . 9 ∀ k ∈ N son trascendentes.
OTROS RESULTADOS
187
Fue nueve años después que otro matemático alemán, Ferdinand Lindemann (1852-1939), aplicando un procedimiento similar al utilizado por Hermite, logró demostrar la trascendencia de π. El caso es que exhibir números trascendentes era, y sigue siendo, muy difícil (por más que en la actualidad se cuenta, como es natural, con muchas más familias de ellos). Por contraste, los números algebraicos se ocurren a borbotones: los racionales, casi todos los irracionales más conocidos y hasta una buena parte de los complejos son números algebraicos. o A la luz de lo anterior, ¿qué esperaríamos que hubiera más: números algebraicos o números trascendentes? Seguramente que algebraicos, pero ¿cómo comparar sus cardinalidades si no tenemos una regla específica que nos permita representar en general a los trascendentes? Cantor pensó una idea, en principio no tanto para ver de cuáles había más, sino para confirmar que había, efectivamente, números trascendentes; pero que a la postre, junto con su resultado de que hay más reales que naturales, vino a establecer una comparación entre la cantidad de algebraicos y la cantidad de trascendentes. ¿Qué fue lo que probó Cantor? Que hay tantos números algebraicos como números naturales, y como los reales son más que los naturales, eso muestra que existen los trascendentes: son todos aquellos reales que no son algebraicos. Así, Cantor demostró la existencia de los números trascendentes sin exhibir uno solo de ellos, sino apoyándose en un razonamiento por reducción al absurdo, tal y como se venía haciendo ampliamente en la matemática desde la época de los griegos.[14] De esta manera mostró algo más: como la unión de dos conjuntos numerables es numerable, si los trascendentes fueran numerables, su unión con los algebraicos (reales) resultaría un conjunto numerable, lo cual es una contradicción, pues eso querría decir que los números reales son numerables. Ocurre una situación similar a la de los irracionales, pero más extrema aun. En realidad, el teorema 3.19 garantiza que los números trascendentes tienen la misma cardinalidad que la totalidad de los números reales, y por lo tanto son más que los algebraicos contra todos los pronósticos, para variar. [14]
Este tipo de pruebas de existencia, que se basan en el principio lógico del tercero excluido, han sido objetadas por una tendencia dentro de los matemáticos (constructivistas—intuicionistas) por lo menos desde el siglo xix.
188
TRES PREGUNTAS IMPORTANTES
Lo anterior basándonos en el resultado ya mencionado de Cantor, que a continuación procederemos a demostrar. Teorema 3.21. (Cantor, 1873-4) El conjunto de los números algebraicos[15] es numerable. Demostración. Si llamamos Pn = {Polinomios de grado n con coeficientes enteros}, entonces el conjunto P de todos los polinomios con coeficientes enteros sería igual a P = P1 ∪ P2 ∪ . . . ,
y si llamamos An al conjunto de las raíces de todos los polinomios de Pn , y A al conjunto de los números algebraicos, tenemos que A = A 1 ∪ A2 ∪ . . . Observemos que, dada una n ∈ N, cada polinomio de grado n Pn (x) = an xn + an−1 xn−1 + · · · + a1 x + a0
lo podemos representar por una (n + 1)-ada (an , an−1 , . . . a1 , a0 ) con an 6= 0 y ak ∈ Z ∀ k = 0, 1, . . . n, así es que la cardinalidad de Pn es igual a la cardinalidad de (Z \ {0}) × Z × · · · × Z y ∴ Pn es numerable. Por otro lado, una consecuencia del teorema fundamental del álgebra[16] es que cualquier polinomio de grado n tiene a lo más n raíces distintas, o sea, siempre un número finito. Entonces An es igual a una unión numerable (el número de polinomios) de conjuntos finitos (las raíces de cada polinomio) que, por el teorema 3.14, es finito o numerable. Ahora bien, como todo racional pq es raíz del polinomio de grado n con coeficientes enteros Pn (x) = q n xn − pn , tenemos que Q ⊆ An , de modo que An no puede ser finito y ∴ es numerable. S Finalmente, como A = ∞ n=1 An , tenemos que A es numerable, pues es igual a una unión numerable de conjuntos numerables. [15]
Nótese que el enunciado incluye tanto a los algebraicos reales como a los algebraicos complejos. [16] Ver, por ejemplo, R. Beaumont, y R. Pierce, 1963, pp. 355-358.
EJERCICIOS
189
o La clasificación —en el fondo, la comprensión— de los números reales ha sido motivo de reflexión en las matemáticas durante muchos siglos, y está lejos de haber concluido. Los griegos colocaron una lupa sobre ellos y encontraron una diferencia esencial entre dos subconjuntos suyos: los racionales y los irracionales. El cristal con el que los enfocaron fue el de la conmensurabilidad. Después (siglo xviii) fue colocada una nueva lupa y se encontró una diferencia clave entre otros dos subconjuntos de ellos: los algebraicos (dentro de los que estaban sumergidos los racionales) y los trascendentes. El cristal con el que se les observó fue el de las raíces de los polinomios con coeficientes enteros. Más adelante (a partir de finales del mismo siglo xviii, durante el xix y muy particularmente a lo largo del siglo xx) fue colocada una lupa distinta que ha permitido organizar a los algebraicos en clases de equivalencia y agrupar a algunos subconjuntos de los trascendentes en función de un nuevo criterio. El criterio ha sido el análisis de la rapidez con la que pueden ser aproximados unos y otros números reales por números racionales (análisis diofantino). Con mucho, es el conjunto de los números trascendentes —abrumadoramente más grande y diverso que el de los algebraicos— el que siguiendo este criterio de clasificación permanece en gran medida aún en la penumbra. Está abierta por supuesto la posibilidad de que, colocando nuevos cristales para observarlos, surjan clasificaciones de otra naturaleza de los números reales que nos permitan ahondar más en su comprensión.
3.5.
Ejercicios
1. a) Demuestren, exhibiendo una biyección a través de diagramas o gráficas convenientes, que el cuadrado unitario tiene el mismo número de puntos que cualquier cuadrado de lado ` y que todo R2 . b) Igual que en el inciso anterior para el cubo unitario, el cubo de lado ` y el espacio R3 . c) Argumenten, utilizando el teorema de CBS, que cualquier círculo y esfera tienen la cardinalidad de los reales. 2. Argumenten que la siguiente formulación del AE es equivalente a la que está en el texto:
190
TRES PREGUNTAS IMPORTANTES
AE2: si X es un conjunto de conjuntos no vacíos, existe una función f definida en X tal que f (A) ∈ A ∀ A ∈ X. 3. Demostrar que el conjunto C de todas las circunferencias en R2 tiene la cardinalidad del continuo. Hint: Cada circunferencia está determinada por su centro y su radio. 4. Demuestren que no existe ningún conjunto cuyo conjunto potencia sea N. 5. B. Russell propuso la paradoja de Tristram Shandy, que comienza así: Tristram Shandy, como sabemos, tardó dos años en escribir la historia de los dos primeros días de su vida, y lamentó que, a ese ritmo, se acumularía material más rápidamente de lo que podría relatarlo, de manera que nunca podría terminar. Si Tristram hubiera vivido para siempre, no hubiera cesado en su empeño, y su vida hubiese seguido siendo tan memorable como al principio, ¿habría alguna parte de su biografía que se hubiese quedado sin escribir? 6. Si les diera mi palabra de que en nuestro curso habrá un examen sorpresa un día inesperado, ¿podría cumplir mi palabra? Piensen en lo siguiente: el examen, ¿podría ser el último día de clases? No, porque no habiendo sido antes, sería el único día restante y ya no sería sorpresa, de modo que no podría aplicarlo. Pero si eso es así, tampoco podría ser el penúltimo día de clases, pues el antepenúltimo, sabiendo todos que el último no podría ser y quedando entonces solo el penúltimo, sabrían todos que ese día lo aplicaría; de nuevo, no sería sorpresa y tampoco podría aplicarlo. ¿Podría ser entonces el día anterior?, ¿y el anterior?, ¿cuándo podría ser el examen? 7. a) Den un ejemplo de dos conjuntos X y Y tales que: i) |X| = 3c , |Y | = c3 . ii) |X| = ℵ0 c , |Y| = cℵ0 .
b) Digan qué operación entre números cardinales representa a: i) El conjunto de las sucesiones infinitas de enteros.
191
EJERCICIOS
ii) El conjunto de las sucesiones infinitas de vectores en el plano. 8. ¿Cómo se prueban las propiedades de la aritmética cardinal? Veámoslo con un ejemplo. Demuestren que ℵ0 · c = c. Es decir, propongan tres conjuntos X, Y, W con |X| = ℵ0 , |Y| = c = |W|, y que sean tales que exista una biyección entre X × Y y W. (Cualesquiera otros conjuntos X0 ∼ X, Y0 ∼ Y, W0 ∼ W cumplirían lo mismo, pues están relacionados entre sí por funciones biyectivas). 9. Demuestren el teorema 3.14. 10. Para compenetrarse más con la demostración del teorema de CantorBernstein-Schröder (pág.168): a) Argumenten por qué: i) Si Im(f ) = Y o Im(g) = X el resultado es inmediato. Lo mismo si ambos conjuntos son finitos. ii) Si Y \ Im(f ) 6= ∅ y X \ Im(g) 6= ∅, X y Y deben ser ambos infinitos. b) Imaginen que en lugar de ir aplicando las funciones inversas aplicamos las funciones directamente: f
g
f
g
f
g
x1 −→ y1 −→ x2 −→ y2 −→ x3 −→ y3 −→ . . . Argumenten por qué: i) ∀ x1 ∈ X \ Im(g) la sucesión x1 , y1 , x2 , y2 , x3 , y3 , . . . es necesariamente infinita, y el conjunto de todos los términos xk de estas sucesiones coincide precisamente con el conjunto XX . Análogamente, el conjunto de las yk de todas estas sucesiones coincide con YX . ii) Si desarrollamos el mismo procedimiento, pero comenzando en cualquier y1 ∈ Y \ Im(f ) todo es análogo: las sucesiones que se generan son infinitas, y las x’s de ellas forman el conjunto XY , mientras que las y’s forman el conjunto YY . iii) Si comenzamos el proceso con x0 ∈ Im(g) ⊆ X o con y0 ∈ Im(f ) ⊆ Y, se genera un ciclo finito o se genera una sucesión que es infinita “hacia delante y hacia atrás”: . . . x−2 , y−2 , x−1 , y−1 , x0 , y0 , x1 , y1 , x2 , y2 , . . .
192
TRES PREGUNTAS IMPORTANTES
Y las x’s y y’s que forman estas sucesiones corresponden respectivamente a los conjuntos X∞ y Y∞ de la demostración que hicimos. c) Sean f : [0, 1] −→ [0, 2], g : [0, 2] −→ [0, 1] las funciones inyectivas 1 f (x) = x + , 2
g(x) =
x 1 + . 4 4
Hagan el análisis geométrico de los conjuntos XX , XY , X∞ , YX , YY y Y∞ , y de la función h que se construyó en la demostración del teorema. √ √ 11. Prueben que los números de la forma a + 3 b, a, b ∈ N son siempre algebraicos. 12. La idea de este ejercicio es que ustedes hagan otra demostración del teorema 3.21 siguiendo la idea desarrollada por Cantor. Sea Pn (x) = an xn +an−1 xn−1 +· · ·+a1 x+a0 , con n ∈ N un polinomio arbitrario con coeficientes enteros. Definimos la altura del polinomio como el número entero positivo h = n + |an | + |an−1 | + · · · + |a1 | + |a0 |.
(3.23)
Si, por ejemplo, 3x5 − 4x3 + 2x2 − 9 −→ h = 5 + 3 + 4 + 2 + 9 = 23 2x7 − 3x + 1 −→ h = 7 + 2 + 3 + 1 = 13, ¿qué polinomios tienen altura 2? Como n ≥ 1, solo tenemos dos: P (x) = ±x. ¿Altura 3? P (x) = ±x2 , P (x) = ±x ± 1.
¿Altura 4? P (x) = ±x3 , P (x) = ±2x2 , P (x) = ±x2 ± x, P (x) = ±x2 ± 1, P (x) = ±3x, P (x) = ±2x ± 1, P (x) = ±x ± 2. Pues bien: sea h ∈ N arbitraria. Demuestren que:
a) El número de polinomios con altura h es siempre finito.
b) El número de raíces de todos los polinomios con altura h es siempre finito. A partir de los incisos anteriores (y algo más) argumenten que el conjunto de los números algebraicos es numerable.
EJERCICIOS
193
13. ¿Cuál podría ser un ejemplo de un conjunto que nos resulte familiar y que tenga una cardinalidad mayor que la del continuo? El de las funciones f : [0, 1] → R (o de cualquier intervalo a los reales). Veamos: Sea Ω = {f : [0, 1] → R}. a) Argumenten que Ω tiene al menos la cardinalidad de los reales. Hint: ∀x0 ∈ [0, 1], si hacemos fx0 (x) =
(
1, si x = x0 0, si x 6= x0
tenemos que si xo 6= x00 =⇒ fx0 6= fx00 .
b) Supongan que |Ω| = c. Eso significa que hay una forma de aparear cada elemento u ∈ (0, 1) con una función fu ∈ Ω, de tal manera que {fu : u ∈ [0, 1]} = Ω. Apliquen entonces un razonamiento análogo al de la diagonal de Cantor (du Bois Reymond), pero sobre todos los reales del [0, 1]. Hint: Definan la función g : [0, 1] −→ R de la siguiente manera: g vale en u cualquier número real distinto de lo que vale fu en él.
Capítulo 4
La hipótesis del continuo y los números ordinales 4.1.
Hilbert: París, 1900
La mañana del 8 de agosto de 1900, en una sala de la Sorbona de París, David Hilbert leía su ponencia como conferencista invitado al segundo congreso internacional de matemáticos. No fue en una sesión plenaria, sino en la sección del congreso sobre bibliografía e historia. La asistencia no fue muy grande y la reacción fue un poco decepcionante, según reportó después Hilbert a su maestro Adolf Hurwitz (1859-1919), que no estuvo presente.79 La ponencia llevaba por nombre El futuro de las matemáticas, y en ella planteaba 23 problemas sin resolver en algunas áreas, fundamentando la importancia que representaba su solución para el futuro de las matemáticas. Por cuestiones de tiempo solo pudo exponer 10 de ellos; la ponencia completa se distribuyó por escrito. Tenía en ese momento 38 años de edad y ya era un investigador reconocido del Departamento de Matemáticas de la Universidad de Göttingen, entonces dirigido por Felix Klein (1849-1925). Antes del congreso envió un borrador de su trabajo a su amigo Hermann Minkowski (1864-1909), pidiéndole su opinión. Este le decía al final de su respuesta:[1] Solo puedo desearte suerte en tu charla; ciertamente será el acontecimiento del congreso y su éxito será muy duradero . . . [1] Dado el número y la extensión de las citas de este y otros capítulos, hemos omitido las comillas en ellas para hacer más ligera su lectura.
195
196
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Pues creo que esta charla, que probablemente leerán todos los matemáticos sin excepción, hará que crezcan todavía más tus poderes de atracción sobre los matemáticos jóvenes, si eso es posible. . . 80 Con el paso del tiempo, Los 23 problemas de Hilbert acabaron convirtiéndose en el signo distintivo de aquel congreso. Su escrito fue reproducido en diversos países, y marcó líneas de trabajo hacia delante que perduraron durante varios años en algunas de las áreas de la matemática. El problema que encabezaba la lista era el de la hipótesis del continuo (HC) de Cantor. El planteamiento de Hilbert era el siguiente (los subrayados provienen del original): Se dice que dos sistemas, i.e. dos conjuntos de números reales ordinarios o de puntos, son equivalentes (según Cantor) o del mismo número cardinal, si pueden ponerse en una relación mutua tal que a todo número del primer conjunto corresponde uno y solo un número definido del segundo. Las investigaciones de Cantor sobre tales “conjuntos-de-puntos” sugieren un teorema muy plausible, que de todas formas, a pesar de los mayores esfuerzos, nadie ha conseguido demostrar. Este es el teorema. Todo sistema de infinitos números reales, i.e., todo conjunto infinito de números (o puntos), es o bien equivalente al conjunto de los números naturales, 1,2,3. . . o bien equivalente al conjunto de todos los números reales y por lo tanto al continuo, es decir, a los puntos de una recta; con respecto a la equivalencia existen, por consiguiente, solo dos conjuntos de números, el conjunto numerable y el continuo. De este teorema se seguiría inmediatamente que el continuo tiene el siguiente número cardinal más allá del cardinal del conjunto numerable; la demostración de este teorema constituiría, por lo tanto, un nuevo puente entre el conjunto numerable y el continuo. Este primer problema tenía una segunda parte que en realidad era otro problema, también sugerido por Cantor desde tiempo atrás (ver sección §3.1, pág. 145): la idea de que todo conjunto —en particular los números reales— podía ser bien-ordenado. La ponencia de Hilbert continuaba así:
HILBERT: PARÍS, 1900
197
Permítanme mencionar otro enunciado muy notable de Cantor que está en la más íntima conexión con el teorema mencionado y que, quizá, ofrezca la clave para su demostración. Se dice que un sistema de números reales es ordenado si para cada dos números del sistema está determinado cuál es anterior y cuál es posterior, y si al mismo tiempo esta determinación es de un tipo tal que, si a es anterior a b y b es anterior a c, entonces a siempre es anterior a c. La disposición natural de los números de un sistema se define como aquella en la que el más pequeño precede al más grande. Pero existen, como es fácil ver, otras infinitas maneras de disponer un sistema. Si pensamos en una disposición definida de números y seleccionamos de entre ellos un sistema concreto de dichos números, un denominado subsistema o subconjunto, también se demostrará que este subsistema está ordenado. Ahora, Cantor considera un tipo particular de conjunto ordenado que él designa como conjunto bien ordenado y que está caracterizado de esta manera: que no sólo en el propio conjunto sino también en todo subconjunto existe un primer número. El sistema de enteros 1,2,3 . . . en su orden natural es evidentemente un conjunto bien ordenado. Por el contrario, el sistema de todos los números reales, i.e., el continuo en su orden natural, no es evidentemente bien ordenado. En efecto, si consideramos los puntos de un segmento de una línea recta, con su punto inicial excluido, como nuestro conjunto parcial, este no tendrá primer elemento. Surge ahora la pregunta de si la totalidad de los números puede disponerse de alguna otra manera tal que todo subconjunto pueda tener un primer elemento, i.e., si puede considerarse el continuo como un conjunto bien ordenado —una pregunta que Cantor piensa que debe responderse afirmativamente—. Creo que es muy deseable obtener una demostración directa de este notable enunciado de Cantor, quizá dando realmente una disposición de números tal que en todo sistema parcial pueda señalarse un primer número.81 La idea sobre la validez de la HC —y de que el infinito más pequeño era el de los naturales— la planteó Cantor desde el año 1878,82 varios
198
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
años antes de probar que no se puede hablar de un infinito mayor que todos los demás. Podría decirse que lograr “demostrar que entre los numerables y el continuo no había otro infinito”, se convirtió en uno de los objetivos centrales de su trabajo durante muchos años de su vida. En el fondo, se trataba de entender cómo era el paso, el tránsito de un infinito al otro. Y se convirtió, como vimos, en uno de los grandes problemas no resueltos de la matemática. Debieron transcurrir 60 años, ya no digamos para resolverlo, sino para que apenas se empezara a aclarar la situación, en dónde radicaba el problema. Fue el matemático y lógico Kurt Gödel (1906-1978) quien obtuvo el primer avance importante. o Hilbert sostenía que las matemáticas debían fundarse sobre un sistema formal que tuviera tres características: debía ser consistente, completo y decidible. Consistente significa que sea imposible que una proposición y su negación puedan demostrarse ambas dentro del sistema; en caso contrario, es inconsistente. Completo quiere decir que toda proposición propiamente escrita debiera ser tal que ella o su negación puedan obtenerse a partir de los axiomas en los que se basa el sistema; en caso contrario, es incompleto. Decidible significa que existe un procedimiento efectivo o algoritmo para establecer si es demostrable una proposición cualquiera o su negación; en caso contrario, es indecidible. Basándose en un intento previo —fallido— de Hilbert,83 Gödel construyó en 1938 un modelo particular de la teoría de conjuntos a partir de los axiomas usuales (ZF),[2] que cumple con ser bien-ordenado —por lo tanto cumple el AE— y que cumple la HC. Esto significa que tanto la HC como el AE son consistentes con los axiomas usuales de la teoría de conjuntos. Es decir, si los axiomas de la teoría de conjuntos son consistentes, entonces al agregarle la HC no se genera ninguna inconsistencia. Lo mismo si se agrega el AE. Esto no quiere decir que hubiera probado que la HC (o el AE) se desprendieran de los axiomas de la teoría de conjuntos, tal y como planteaba el Problema 1 de Hilbert. Pero pudiera sugerir que a final de cuentas fueran ciertas las dos conjeturas de Cantor, porque no inducen a ninguna contradicción en el sistema de axiomas. [2]
En toda esta parte es importante tener fresca la discusión presentada sobre el axioma de elección (AE), el Principio del Buen Orden (PBO) y los axiomas de ZermeloFraenkel (ZF) en las secciones 3.1 (págs. 145 a 146) y 3.3 (págs. 163 a 165).
HILBERT: PARÍS, 1900
199
Sin embargo, 25 años después, en 1963, el matemático norteamericano Paul Cohen (1934-2007) ideó un nuevo método, llamado forcing, con el cual podía generar modelos ZF muy diversos; en particular, construyó uno en el que al incluir la negación de la HC no se generaba ninguna inconsistencia. O sea, que si los axiomas de la teoría de conjuntos son consistentes, al agregarle la negación de la HC el sistema seguía siendo consistente. Los dos resultados juntos —el de Gödel y el de Cohen— mostraban que de los axiomas usuales de la teoría de conjuntos no podía desprenderse ni la HC ni su negación. Es decir, que se trata de enunciados independientes. En ese sentido, quedaba respondido el Problema 1 planteado por Hilbert: no es posible demostrar la HC a partir de los axiomas existentes de la teoría de conjuntos. Tal y como había ocurrido con el célebre 5◦ postulado de la geometría euclidiana: si a los demás axiomas le agregamos el 5◦ postulado, tenemos un tipo de geometría. Si en su lugar agregamos una u otra forma de negar el 5◦ postulado, obtenemos geometrías alternativas. Por este descubrimiento, Paul Joseph Cohen —además de otros tres matemáticos, por sus trabajos en otros temas— obtuvo la medalla Fields de 1966, que es el equivalente al Premio Nobel en investigación matemática otorgado cada cuatro años a uno o varios matemáticos destacados con edades menores de 40 años. Es posible pensar entonces en una teoría de conjuntos como la usual con el axioma adicional de que se cumple la hipótesis del continuo, y en otra con el axioma que estipula su negación. En la primera no hay ningún conjunto que sea a la vez mayor que los naturales y menor que los reales; en la segunda puede haber otros infinitos entre ellos. Un modelo podrá servir para resolver cierto tipo de problemas, otro para resolver otros (por lo menos en teoría). o Sin embargo, en el camino fueron ocurriendo más cosas. Antes de su demostración sobre la consistencia de la HC, Gödel había probado algo que significó una cubetada de agua helada para los diversos intentos puestos en marcha con el objetivo de establecer un marco formal estricto al cual sujetar las pruebas en matemáticas, que fuera tal que quedara plenamente garantizado que todas las propiedades tendrían que ser demostradas a partir de ciertas reglas de inferencia y axiomas establecidos de antemano, sin que hubiera lugar para inconsistencia alguna.
200
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
El 26 de agosto de 1930, en una conferencia Gödel anunció que había demostrado el que terminaría siendo llamado Primer Teorema de Incompletez de Gödel,[3] que establece que en cualquier sistema formal que pretenda ser consistente, ya no digamos para la matemática en general, sino empezando por la aritmética, siempre van a existir proposiciones verdaderas que no pueden ser probadas a través de dicho sistema; el universo de las proposiciones verdaderas en cualquier sistema de axiomas resulta siempre mayor que el de las proposiciones demostrables en él. Y lo probó utilizando una idea similar a la de la prueba diagonal de Cantor (Du Bois Reymond). No está de más aclarar que esto no quiere decir que Gödel haya probado que existen proposiciones que nunca podrán ser demostradas (como parece sugerirse en algunos materiales de divulgación), sino que no existe un sistema de axiomas y reglas fijo que sirva para probar todas las propiedades. Siempre habrá propiedades que requieran de otras bases. Si queremos que el sistema sea consistente, no puede ser completo. El objetivo de Hilbert comentado, y en el que llevaba varios años trabajando —dotar a la matemática de una estructura consistente, completa y decidible—, no podría siquiera pasar a la segunda condición, si se exigía la primera. De hecho no se pudo realizar, lo cual no significa, por supuesto, que no hubiera frutos de lo trabajado en ello. Poco después Gödel fue aun más lejos: la consistencia misma de un sistema formal no se puede probar desde dentro del mismo sistema, a partir de sus propios axiomas. Este se conoce como el Segundo Teorema de Incompletez de Gödel. En cuanto al tercer objetivo de los sistemas formales planteado por Hilbert (que fueran decidibles; es decir, que exista un procedimiento general efectivo para establecer si una proposición cualquiera es demostrable), el problema fue abordado simultáneamente por el británico Alan Turing (1912-1954) y el norteamericano Alonzo Church (1903-1995), y en 1936 probaron, cada uno por su lado, que ningún sistema formal de la aritmética que sea consistente es decidible. Dado de antemano cualquier algoritmo que pretendamos aplicar a todas las proposiciones para determinar si son demostrables o no, siempre encontraremos proposiciones [3]
La palabra completez aparece reconocida en el Diccionario de la Real Academia Española (xxii edición), precisamente como sinónimo de completitud, que es como se suele traducir del inglés. Dado que nos parece más cercana a nuestro lenguaje cotidiano, es con ella que nos referiremos al concepto correspondiente.
HILBERT: PARÍS, 1900
201
para las que el algoritmo dado no funciona, que requieren inventar otro algoritmo. o Hagamos una última reflexión sobre el desenlace final que tuvo todo el problema de la HC. ¿Realmente quedó resuelta? Desde un cierto punto de vista, tal y como lo comentamos, sí: Gödel y Cohen demostraron que no es demostrable a partir de los axiomas usuales de la teoría de conjuntos. Pero la idea que nos hacemos de la recta, y que nos ha llevado a afirmar que hay más reales que naturales, ¿debiera dejar indefinido si existen o no subconjuntos con más puntos que los naturales pero menos que los reales?, ¿debiera ser algo realmente sujeto a nuestra elección si cualquier subconjunto de la recta tiene o no más opción que esas dos cardinalidades? Es difícil quedarse tan tranquilo con la respuesta de “tú escoges”, ante algo de esa naturaleza. No se puede dejar de pensar si más bien lo que se nos muestra es que los instrumentos con los que contamos para aprehender la naturaleza del continuo, del infinito, han llegado hasta un cierto punto y no nos permiten llegar más lejos. Han servido para muchas cosas, pero hacen falta mejores instrumentos para poder avanzar. Hay que decir que el mismo Gödel al final tuvo sus reservas. En 1947 escribió lo siguiente: Solo alguien que (como los intuicionistas) niegue que los conceptos y axiomas de la teoría clásica de conjuntos tienen algún significado (o cualquier significado bien definido) podría estar satisfecho con una solución así, no alguien que piensa que describen una realidad bien-determinada. Porque en esta realidad la conjetura de Cantor debe ser verdadera o falsa, y su indecibilidad a partir de los axiomas tal y como son conocidos hoy en día solo puede significar que esos axiomas no contienen una descripción completa de esta realidad[. . . ]84 Uno puede razonablemente sospechar que el rol del problema del continuo en teoría de conjuntos será este, que eventualmente llevará a descubrir nuevos axiomas que harán posible descartar la conjetura de Cantor.[4]86 [4]
Años después, en un artículo de 1970 que finalmente no fue publicado, Gödel creía haber demostrado que la HC era falsa, pues la cardinalidad de los reales en realidad coincidía con ℵ2 (en ese mismo año se dio cuenta de que la demostración tenía un error).85
202
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Por su parte, Cohen escribió, en 1966: Un punto de vista que el autor siente que eventualmente será aceptado es que la HC es obviamente falsa[. . . ] ℵ1 es el conjunto de los ordinales contables y es meramente una forma especial, y la más simple de generar un cardinal mayor. El conjunto C (el continuo), en contraste, es generado por un principio totalmente nuevo y más potente, que es el axioma del conjunto potencia. No es razonable esperar que una descripción de un cardinal mayor que pretende construirse a partir de ideas que surgen del axioma de reemplazo puedan alguna vez alcanzar a C. Entonces C es mayor que ℵn , ℵω , ℵα donde α = ℵω etc.[5] Este punto de vista concibe a C como un conjunto increíblemente rico, que no puede ser aproximado a través de un proceso gradual de construcción, sino que nos es dado por un nuevo y audaz axioma. Posiblemente generaciones futuras verán más claramente el problema y lo expresarán de forma más elocuente.87 La enorme complejidad de este problema queda de manifiesto en lo que escribió recientemente el matemático australiano John Stillwell:88 El siglo xx trajo muchos avances dramáticos en nuestra comprensión de lo que es demostrable, pero la hipótesis del continuo permanece como un misterio. Parece descansar en el límite mismo de la capacidad humana de entender el infinito. Para cerrar esta reflexión me parece pertinente citar el punto de vista del físico y matemático inglés Roger Penrose:89 [. . . ] la afirmación “2ℵ0 = ℵ1 ”, conocida como la hipótesis del continuo, se convirtió en una cuestión no resuelta durante muchos años después de que Cantor la propusiera. Aun sigue sin estar resuelta, en un sentido “absoluto”. Kurt Gödel y Paul Cohen demostraron que la hipótesis del continuo (y también el axioma de elección) no es decidible por medio de la teoría de conjuntos estándar. Sin embargo, debido al teorema de la incompletitud de Gödel y varias cuestiones [5] En la discusión que se desarrolla a partir de la sección §4.2.2 se verá qué significan estos símbolos.
LOS NÚMEROS ORDINALES
203
relacionadas, esto no resuelve propiamente la cuestión de la verdad de la hipótesis del continuo. Sigue siendo posible que métodos de demostración más poderosos que los de la teoría de conjuntos estándar puedan ser capaces de decidir la verdad o falsedad de la hipótesis del continuo; por otra parte, podría darse el caso de que su verdad o falsedad fuera una cuestión subjetiva dependiente del punto de vista que se adopte.[6]
4.2.
Los números ordinales Mis investigaciones en teoría de conjuntos han llegado a un punto en el que su progreso depende de una extensión del concepto de número entero más allá de sus límites actuales [. . . ] Dependo tanto de esta ampliación del concepto de número, que sin ella no podría ya dar el menor paso adelante en la teoría de conjuntos. . . lo que está en juego es la extensión o continuación de la sucesión de los números enteros hacia el interior del infinito; por atrevido que esto parezca, puedo proclamar no solo la esperanza, sino la firme convicción de que esta extensión con el tiempo será reconocida como algo bastante simple, apropiado y natural. Al mismo tiempo, no oculto que con esta decisión me coloco a mí mismo en oposición a las intuiciones ampliamente difundidas sobre el infinito matemático y a las opiniones comúnmente sostenidas acerca de la esencia del concepto de número [. . . ]. Lo que yo afirmo y creo haber demostrado en este y en otros trabajos anteriores es esto: que siguiendo a lo finito hay un transfinito (al cual también se le puede llamar suprafinito), es decir, hay una escala ascendente ilimitada [. . . ] que puede ser determinada por medio de números concretos, bien definidos y distinguibles.90 G. Cantor, 1883.
[6]
En una nota al final del capítulo correspondiente, R. Penrose agrega: “Comentarios similares se aplican a la hipótesis del continuo generalizada de Cantor: 2ℵα = ℵα+1 (donde α es ahora un “número ordinal”, cuya definición no he discutido aquí), y estos comentarios se aplican también al axioma de elección.”
204
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Habremos observado que la formulación que aparece en la cita de R. Penrose sobre la hipótesis del continuo con la que cerramos la sección anterior, (y de P. Cohen más atrás), es que 2ℵ0 = ℵ1 . ¿Qué es ℵ1 ? Hay toda otra parte del trabajo de Cantor que se refiere a lo que él llamó los números ordinales transfinitos, en los cuales se basa su definición de los siguientes cardinales después de ℵ0 . Trataremos de dar una idea grosso modo de qué se trata el asunto. El tema es de por sí suficientemente amplio.
4.2.1.
El origen de los números ordinales
La idea partió del estudio de las series de Fourier. Después de probar que la unicidad de la representación de una función como una suma infinita de senos y cosenos no requería que la convergencia de la serie fuera uniforme, Cantor probó que incluso si la convergencia dejaba de ocurrir en un número finito de puntos, la serie seguía siendo única. Pero quiso llevar más lejos el resultado, analizando si seguía siendo válido fallando la convergencia de la serie en ciertos conjuntos infinitos de puntos. En lo que sigue utilizaremos con frecuencia el concepto de punto de acumulación, como se define a continuación. Definición 13. Decimos que un punto p es un punto de acumulación (o de adherencia, o de condensación, o punto límite) de un conjunto A si en toda vecindad de p hay una infinidad de elementos de A. o Hay una situación que al estudiar la integral les resultará familiar con lo que Cantor fue haciendo para abordar su problema. Una función continua en un intervalo cerrado siempre resulta integrable. Cuando el conjunto de discontinuidades es finito —siendo acotada la función— se puede demostrar que la función sigue siendo integrable. La clave de la demostración consiste en que si los puntos de discontinuidad en el dominio de la función pueden encerrarse en una familia finita de intervalos con suma de longitudes tan pequeña como se quiera, la integrabilidad no se ve alterada. Si eso es así, piensen ahora que las discontinuidades fueran una infinidad que formara una sucesión convergente en el dominio (siempre un intervalo cerrado): bastaría con que dieran un intervalo suficientemente pequeño que encerrara al límite, y en ese mismo intervalo quedarían encerrados todos los puntos de la sucesión a partir de alguno (una infinidad), quedando fuera a lo más un número finito de puntos en donde
LOS NÚMEROS ORDINALES
205
la función habría sido discontinua, los cuales podrían ser encerrados a su vez en una familia finita de intervalos pequeños. Así que la totalidad —infinita— de los puntos de discontinuidad habría podido ser encerrada en un número finito de intervalos pequeños, siendo entonces integrable la función. ¿Qué pasaría si ahora las discontinuidades fueran una infinidad que no converge a un punto, pero se acumula en torno a un número finito de puntos? (es decir, si el conjunto de discontinuidades es infinito pero con un número finito de puntos de acumulación); que encerrando en un intervalito suficientemente pequeño cada punto de acumulación, en esa familia finita de intervalos quedarían encerradas todas las discontinuidades, excepto a lo más un número finito de ellas, que con otro conjunto finito de intervalos podrían ser encerradas a su vez. De manera que como la unión de dos familias finitas de intervalos resulta a final de cuentas una familia finita de intervalos, la totalidad de las discontinuidades habría sido encerrada en una familia finita de intervalos con suma de longitudes pequeña; y la función seguiría siendo integrable. Ahora pensemos en que el conjunto de puntos en el dominio en que la función es discontinua es un conjunto infinito con una infinidad de puntos de acumulación, los cuales a su vez tienen un único punto de acumulación (forman una sucesión convergente). Si logramos encerrar toda esa infinidad de puntos de discontinuidad en una familia finita de intervalos con suma de longitudes tan pequeña como se quiera, la integrabilidad de nuestra función queda garantizada. ¿Cómo hacerlo?, al encerrar el punto de acumulación de los puntos de acumulación de los puntos de discontinuidad en un intervalo tan pequeño como se quiera, en él quedan encerrados todos los puntos de acumulación a partir de alguno (una infinidad), y fuera de ese intervalo solo quedarían un número finito de puntos de acumulación, que al encerrar cada uno en su respectivo intervalo suficientemente pequeño, tendríamos que todos los puntos de acumulación habrían quedado encerrados en un número finito de intervalos pequeños, fuera de los cuales solo quedarían por encerrar un número finito de puntos de discontinuidad. Así es que encerramos cada uno de estos últimos en un intervalo pequeño, y a final de cuentas con una familia finita de intervalos quedan encerrados todos. El razonamiento se puede reproducir de manera similar si la función es discontinua en una infinidad de puntos con una infinidad de puntos de acumulación, que se acumulan no en torno a un número finito sino infinito de puntos de acumulación, los cuales a su vez se acumulan en
206
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
torno a un número finito de puntos. Y así sucesivamente, siempre y cuando al cabo de un número finito de pasos, los puntos de acumulación de los puntos de acumulación de los puntos de acumulación de. . . resulten ser un conjunto finito. o Volviendo a la discusión sobre las series de Fourier, Cantor definió al derivado X’ de un conjunto X como el conjunto de puntos de acumulación de X (él los llamó puntos límite del conjunto), y al derivado X” de orden 2 de X como el conjunto de puntos de acumulación del conjunto de puntos de acumulación de X; es decir, como (X’)’. En general, X(k+1) = (X(k) )’. Para simplificar la notación, llamaremos X(1) , X(2) , X(3) . . . a los derivados de orden 1, 2, 3, . . . del conjunto X. Lo que Cantor demostró fue que aun si la convergencia de la serie a la función dejaba de cumplirse en un conjunto infinito de puntos, la serie seguía siendo única, siempre y cuando el derivado de orden k de tal conjunto resultara finito para alguna k ∈ N. Algo muy similar a lo que decíamos sobre la integral. o Pero lo que nos interesa aquí es mostrar cómo al hacer este análisis fue surgiendo la idea de tratar al infinito como algo que podía ser rebasado, como un número más después del cual se podía hablar del siguiente, y del siguiente. . . Para ello construiremos un ejemplo que, aunque un poco laborioso, resulta muy ilustrativo.91 Sean: A0 = {x0 } un conjunto con un solo elemento. A1 = A0 ∪ {xk : k ∈ N}, donde {xk } es una sucesión no constante[7] que converge a x0 . Ahora, por cada elemento de A1 —una infinidad— tomemos una sucesión no constante que converja a él y llamemos A2 al conjunto que resulta de unir A1 con la infinidad de sucesiones consideradas. Luego formamos A3 uniendo A2 con una infinidad de infinidades de sucesiones no constantes, una por cada elemento de A2 al cual converge cada una de tales sucesiones. Y así sucesivamente. ¿Qué observamos? El derivado de A0 es el vacío (siendo A0 un conjunto finito, no tiene ningún punto de acumulación), y el derivado de A1 es el conjunto que incluye tan solo al punto en el cual converge la sucesión {xk }, es decir {x0 } = A0 . El derivado de A2 es A1 , pues cada uno de [7] Cuando hablamos de una sucesión no constante nos referimos a que no es constante a partir de término alguno.
207
LOS NÚMEROS ORDINALES
sus elementos es uno de los puntos de acumulación de las sucesiones que conforman A2 . En general, por la forma en que se fueron construyendo los conjuntos, tenemos que Ak+1 ’ = Ak ∀ k ∈ N. Observemos que cualquier conjunto de estos puede ser construido dentro de un intervalo [a, b] arbitrario, por pequeño que este sea. Tomemos ahora el intervalo [0, 1] y la sucesión {1 − 21k } dentro de él. Los términos de esta sucesión pueden ser vistos como extremos de subintervalos —una infinidad— que dividen el intervalo [0, 1]:
0,
1 1 3 3 7 7 15 , , 2 , 2, 3 , 3, 4 ,... 2 2 2 2 2 2 2
Pues bien, construiremos un conjunto X de la siguiente manera: En el primer subintervalo incluimos un conjunto X0 que sea como A0 , es decir con un solo punto x0 . El segundo subintervalo nos lo saltamos. En el tercer subintervalo metemos un conjunto X1 del tipo de A1 ; es decir, una sucesión convergente a un punto de él junto con su límite. El cuarto subintervalo nos lo saltamos. En el quinto subintervalo construimos un conjunto X2 del tipo de A2 , cuyo derivado es un conjunto del tipo de A1 . El sexto nos lo saltamos. Y así sucesivamente. Llamemos entonces X = X0 ∪ X1 ∪ X 2 ∪ X3 ∪ . . . ,
(4.1)
¿quién sería el conjunto derivado de X? En el primer subintervalo no queda ningún punto; en el tercero nos quedará solamente un punto, es decir un nuevo conjunto tipo A0 ; en el quinto un conjunto tipo A1 ; y así sucesivamente (recordar que en los intervalos pares no había nada). ¿Cuál sería el conjunto derivado de orden 2 de X? Pues ahora será un conjunto que en el tercer intervalo tendrá un único punto (es decir, un conjunto tipo A0 ), en el quinto, un conjunto tipo A1 , en el séptimo un conjunto tipo A2 , etcétera. Cantor definió el derivado de orden infinito de un conjunto como el conjunto de puntos comunes a todos los derivados de orden finito del conjunto, es decir, X(∞) =
∞ \
k=1
X(k) .
(4.2)
208
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
¿Cuál sería en nuestro ejemplo el derivado de orden infinito del conjunto X? El conjunto que tiene como único elemento al 1, que es el único número real que “sobrevive” a la obtención del derivado de cualquier orden de X: X(∞) = {1}, y entonces tiene sentido hablar de
X(∞+1) = (X(∞) )’ = ({1})’ = ∅. Si lo que hicimos solo con el intervalo [0, 1] lo hacemos a la vez con N intervalos, el derivado de orden infinito nos habría resultado no un conjunto con un solo punto, sino con N puntos. Por ejemplo, si el proceso de construcción de los conjuntos X1 , X2 , X3 , . . . lo desarrollamos simultáneamente en los intervalos
0,
1 1 2 2 3 N −1 , , ,1 , , , ,... N N N N N N
partiendo cada uno de estos intervalos en sus respectivas infinidades de subintervalos con sucesiones del tipo
1 m − N N · 2k
, ∀ m = 1, 2, . . . N,
obtendremos al final que X(∞) =
N −1 1 2 , ,..., , 1 , e igualmente X(∞+1) = ∅. N N N
Pero vayamos más lejos. ¿Qué pasaría si hacemos lo mismo, pero no en un número finito de intervalos, sino en una infinidad de ellos a la vez? Imaginen que tomamos, por ejemplo, la sucesión {1 − n1 }. Con sus términos podemos generar una infinidad de intervalos de la forma
0,
1 2 2 3 3 4 1 , , , , , , ,... 2 2 3 3 4 4 5
Llamemos [ai , bi ], i = 1, 2, . . . a cada uno de estos intervalos y ham gamos lo que hicimos en el caso anterior con los intervalos [ m−1 N , N ], pero aquí con todos y cada uno de la infinidad de intervalos [ai , bi ]. Es decir, tomemos una sucesión dentro de cada uno de ellos que converja a su extremo derecho bi , generemos la respectiva infinidad de subintervalos con sus extremos, sumergiendo en los impares conjuntos del tipo
209
LOS NÚMEROS ORDINALES
A0 , A1 , A2 , . . . y dejando los pares libres, tal y como lo hicimos en el ejemplo inicial. ¿Qué resultará al final?, que ahora el derivado de orden infinito será un conjunto infinito, concretamente X
(∞)
=
1 2 3 4 5 , , , , ,...,1 , 2 3 4 5 6
y entonces X(∞+1) = {1}, X(∞+2) = (X(∞+1) )’ = ∅; y así podríamos seguir, generando conjuntos de los cuales tenga sentido hablar de X = X(0) , X(1) , X(2) , . . . , X(∞) , X(∞+1) , X(∞+2) , . . . , X(2∞) , (4.3) 2
3
∞)
X(2∞+1) , X(2∞+2) , . . . , X(3∞) , . . . , X(∞ ) , . . . , X(∞ ) , . . . , X(∞
,...
El número que aparece como supraíndice señala en cada caso el orden de derivación del conjunto correspondiente, y en función de ello su lugar en la lista en la que ordenamos todos los conjuntos derivados. Es lo que se conoce como número ordinal. Con el problema de la derivación de los conjuntos resultaba natural considerar al infinito como un número más, y continuar la numeración de los enteros más allá de él. Cantor diría tiempo después: Descubrí estos números enteros infinitos desde muchos años atrás, sin ser completamente consciente de que son números concretos, con significado real.92 Cuando surgieron no se trataba aun de estudiar al infinito en sí, sino de generar conjuntos de puntos suficientemente complicados que permitieran llevar más lejos el resultado que había obtenido sobre las series de Fourier. Pero quedó sembrada la idea que después utilizaría para intentar “meter orden” entre los conjuntos infinitos. Más adelante decidió cambiar el símbolo para representar al infinito cuando quería referirse a él como un número ordinal más, y no simplemente como algo que rebasa cualquier magnitud finita o que decrece tanto como se quiera (como es utilizado en el análisis y que es simbolizado por ∞), representándolo con la última letra del alfabeto griego: ω (omega minúscula).
210
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Así, ω y sus sucesores son introducidos (en 1883) como continuación de los números naturales para medir “todas las diferentes, sucesivas, ascendentes numerosidades presentes en la naturaleza física y mental”, y “tienen la misma determinación y objetividad que los números anteriores”.93 o Hay aquí un punto importante: la introducción de estos números presupone que el orden definido en los conjuntos a ser “contados”, garantice que siempre es posible considerar el siguiente de cualquier elemento, y que hay un elemento con el cual empezar el conteo. Si recordamos la discusión planteada en la introducción del concepto de conjunto bienordenado (ver págs. 109-110), esto queda garantizado si pedimos que cualquier subconjunto no vacío del conjunto siempre tenga un primer elemento. En otras palabras: aunque analiza con detenimiento los diversos conjuntos infinitos simplemente ordenados en general, toda la construcción de Cantor de los números ordinales se restringe a los conjuntos bienordenados. Sobre las consecuencias de esta restricción hablaremos más adelante.
4.2.2.
Los tres principios de Cantor para generar nuevos números
La primera construcción de Cantor de sus números ordinales transfinitos, consistió en establecer tres grandes reglas a seguir para obtenerlos a todos. Empezaremos citando textualmente algunos de sus razonamientos:[8] [8] Esta primera construcción aparece en la obra de Cantor Ueber unendliche lineare Punktmannichfaltigkeiten. 5. (Sobre variedades lineales infinitas de puntos. 5.), que fue publicada en la revista Mathematische Annalen, t.21, pp. 545-591 en 1883. Se trata de uno de sus trabajos más difundidos, reeditado en Leipzig el mismo año como folleto con el título de Grundlagen einer allgemeninen Mannigfaltigkeitslehre (Fundamentos para una teoría general de conjuntos), frecuentemente citado simplemente como “los Grundlagen”. En 1926 Zermelo propuso a la casa editorial Springer Verlag la publicación de la obra completa de Cantor bajo su propia dirección. La publicación salió a la luz (en alemán) en el año 1932, con el nombre Gesammelte Abhandlungen (Colección de Ensayos). Lo más común en los libros que tratan sobre los trabajos de Cantor, es extraer las citas de interés precisamente de esta recopilación editada por Zermelo. El trabajo recién mencionado (“los Grundlagen”) aparece en la edición de Zermelo entre las páginas 165 y 209.
LOS NÚMEROS ORDINALES
211
La formación de los enteros finitos descansa en el principio de agregar una unidad a un número existente previamente formado; yo llamo a este principio (el cual, como veremos de inmediato, también juega un papel esencial en la generación de los enteros mayores) el primer principio de generación [. . . ] Si bien no podemos hablar del mayor de los números 1, 2, 3, . . . , n, . . . (Clase I de números), no hay por otro lado nada objetable en pensar en un nuevo número que llamaremos ω y que será la expresión del hecho de que la colección I, reunida como un todo, está dada en su sucesión natural de acuerdo con una regla (de la misma manera que el número n es la expresión de que una cierta colección de unidades ha sido reunida en un todo). Podemos incluso imaginar el número ω recién creado como un límite al que se aproximan los números n, con lo cual no entendemos otra cosa que ω es el primer entero que sigue a todos los números n; es decir, que deberá ser considerado mayor que cada uno de los números n. Permitiendo entonces aumentar unidades sucesivamente al número ω recién formado, con ayuda del primer principio de generación se obtienen los números ω + 1, ω + 2, . . . , ω + n, . . . Como no se llega a un máximo número por esta vía, uno puede entonces imaginar otro nuevo número que podemos llamar ω · 2,[9] y que es el primero después de todos los núLas citas de los Grundlagen que aparecen aquí fueron tomadas de la recomendable traducción al inglés realizada por William B. Ewald de varias obras de autores clásicos —entre ellas, algunas de G. Cantor— con el nombre From Kant to Hilbert, vol. II, pp. 878-920. Una traducción al español del texto completo que nos ocupa —y de muchas otras obras de Cantor— se puede encontrar en C. Gómez, 2009, pp. 160-208. Otra más, en J. Ferreirós, 2006, pp. 81-143. [9] En un principio —en particular en este escrito— Cantor denotó con 2ω al primer número posterior a todos los números de la forma ω + n, 3ω al primero posterior a todos los números 2ω + n, etc. Pero después cambió la notación por la que utilizamos aquí (ω · 2, ω · 3, etc.), pues estableció un sentido distinto para la notación que utilizó inicialmente (ver sección §4.2.4). Otros dos detalles que cambiamos son: 1) la utilización de la letra n para representar un entero positivo arbitrario; Cantor utilizaba la letra correspondiente del alfabeto griego (ν) para este efecto. 2) Cantor utilizaba el nombre de potencia de un conjunto para referirse a lo que aquí —y en todo el libro— hemos llamado cardinalidad de un conjunto.
212
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
meros n y ω + n previamente formados; si otra vez se aplica repetidamente el primer principio de generación al número ω · 2, se obtiene la continuación ω · 2 + 1, ω · 2 + 2, . . . , ω · 2 + n, . . . de los números antes formados. La función lógica que nos permitió obtener los números ω y ω · 2 es obviamente distinta del primer principio de generación. Yo le llamo segundo principio de generación de enteros y lo defino más exactamente así: dada cualquier sucesión definida de determinados enteros expuesta de tal manera que no tiene un elemento máximo, se crea un nuevo número a partir de este segundo principio de generación, que es pensado como el límite de dichos números; es decir, el siguiente número mayor que todos ellos. Con la aplicación combinada de ambos principios de generación, uno obtiene sucesivamente la siguiente continuación de los números que previamente habíamos formado: ω · 3, ω · 3 + 1, ω · 3 + 2, . . . , ω · 3 + n, . . . .. . ω · n, ω · n + 1, ω · n + 2, . . . , ω · n + n, . . . .. .
ωω .. . Pero si ahora observamos que todos los números obtenidos previamente y sus sucesores inmediatos cumplen una cierta condición, entonces esta condición, si es impuesta como requerimiento a todos los nuevos números a ser formados, pasa a ser un tercer principio que llamaré principio de limitación o restricción; como habré de demostrarlo, resulta que la clase (II) de números definida con su ayuda no solo tiene una cardinalidad mayor que la clase (I), sino que tiene
LOS NÚMEROS ORDINALES
213
precisamente la siguiente mayor cardinalidad, es decir, la segunda cardinalidad. La condición mencionada, que satisfacen todos los números infinitos α definidos anteriormente, es, como uno mismo puede convencerse, que todos los números que preceden a α en la sucesión en que los fuimos enlistando, tienen la cardinalidad de la clase (I) de números (es decir, corresponden a conjuntos numerables cada uno). [. . . ] Los números de la segunda clase son de dos especies: (1) números α que tienen un inmediato predecesor en la sucesión —yo llamo a estos números de la primera especie; y (2) números α que no tienen un inmediato predecesor en la sucesión —yo llamo a estos números de la segunda especie. Los números ω, ω · 2, ω n + ω, ω ω son, por ejemplo, de la segunda especie, pero en contraste ω + 1, ω 2 + ω + 2, ω ω + 3 son de la primera especie. [. . . ] [El principio de limitación o restricción consiste en] la exigencia de que un nuevo entero puede ser formado con la ayuda de alguno de los otros dos principios de creación solo si la totalidad de los números previos tiene la cardinalidad de una determinada clase de números que ya existe en toda su extensión. Armado con estos tres principios para establecer el universo de los nuevos números, Cantor procedió al estudio de sus propiedades, guiado por el objetivo de ir escalando paso a paso su numerosidad de manera que todos los posibles infinitos quedaran ubicados en algún peldaño de la escala. Los principios mismos fueron pensados para avanzar en esta dirección. El primero de los principios surge de la observación de un rasgo esencial de los números más comúnmente aceptados (y que son el modelo del concepto de conjunto bien-ordenado): los naturales. ¿Cuál es ese rasgo esencial?, partiendo de la existencia del primero de ellos —el 1— se garantiza la existencia del siguiente de todo número que ya existe. Con base en este primer principio se puede generar una infinidad de números —todos los enteros positivos finitos—, pero si solo contamos
214
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
con él no podemos ir más allá de esa primera infinidad (no podemos trascender a los naturales). Con el estudio de los órdenes de derivación de un conjunto (ver pág. 209), a Cantor se le ocurrió la idea de considerar a ω como un número más, el primero de los ordinales transfinitos. De la reflexión sobre la relación entre este nuevo número y todos los anteriores, surgió el segundo principio generador: cada vez que se tenga una sucesión infinita de números ordinales enlistados en forma creciente de acuerdo a su magnitud, consideraremos que existe un nuevo número que es mayor que todos los de la sucesión, pero menor que cualquiera otro con esta misma propiedad; es decir, siempre existe un nuevo número que es el más pequeño de los números mayores que todos los de la sucesión.[10] No se trata del siguiente de alguno en particular, sino en tal caso del siguiente de todos los de la sucesión considerada de números previamente formados. Así, utilizando el primer principio obtiene Cantor ω números (1,2,. . .); aplicando el segundo principio, genera otro (ω); le aplica a este y sus sucesores el primer principio y obtiene otros ω nuevos números (ω + 1, ω + 2, ω + 3, . . . ); les aplica a estos el segundo principio y genera otro más (ω · 2) . . . y así sucesivamente. Dos tipos de números surgen a partir del empleo de uno u otro principio de generación: los que son el siguiente de alguno previamente formado y los que son el límite (o el supremo) de una sucesión creciente de ordinales sin elemento máximo. o Con base en estos dos simples principios, Cantor fue capaz de crear un universo muy amplio de nuevos números, una diversidad impresionante de ellos. Pero no hay que olvidar que ya en esta etapa todo estaba guiado por un objetivo, que era “desmenuzar” el paso del infinito de los naturales al infinito del continuo: dos cardinalidades infinitas distintas. Cada número ordinal indica el lugar que ocupa este en la lista ordenada de todos los enteros (finitos y transfinitos): llamamos 1038 al número que sigue a 1, 2, 3, . . . , 1037 y con ese símbolo (1038) indicamos el lugar de dicho número en la lista ordenada de todos los enteros; llamamos ω al número que sigue a 1, 2, 3, . . . , y con ese símbolo (ω) indicamos su lugar en la lista de todos los enteros finitos y transfinitos. En ese
[10]
Se trata del concepto de supremo de un conjunto, que después jugaría un papel tan importante en la construcción de los números reales. Con la diferencia de que en este caso el concepto abarca a conjuntos de números transfinitos.
LOS NÚMEROS ORDINALES
215
sentido, podemos decir que cada número ordinal queda definido por el conjunto de todos los anteriores a él.[11] Pero sucede algo con todos los ejemplos de números ordinales transfinitos vistos hasta ahora (incluyendo los que menciona Cantor en la extensa cita expuesta). El número ordinal ω + 1, por ejemplo, es mayor que el ordinal ω; sin embargo, la cardinalidad del conjunto de los números previos a ω es igual a la del conjunto de los números anteriores a ω + 1. Si analizamos la cardinalidad del conjunto de todos los ordinales anteriores a cualquiera de los ejemplos que hemos mencionado hasta el momento, observaremos que esta cardinalidad siempre ha sido la misma: ℵ0 . Es cierto que al tomar números ordinales mayores y mayores, estos pueden ir siendo puestos en correspondencia con conjuntos de puntos más y más concentrados en la recta —a la manera en que lo hicimos con los ejemplos que vimos en la sección §4.2.1 (ver pp. 206-209)—, y en ese sentido podríamos pensar que al avanzar en los números ordinales nos vamos acercando al continuo. Pero ¿en qué momento se pasa de una infinidad cardinal a otra?, ¿se pasa en realidad?, ¿es posible siquiera salir de la cardinalidad de los números naturales por esta vía? Los dos principios de generación de números permitían formar infinidades de infinidades de ellos, pero no era claro cómo por sí mismos podrían lograr ordenar in ascensum su propia cardinalidad. Y entonces se le ocurrió a Cantor “separar en grupos” (limitar) las infinidades de números ordinales que se iban obteniendo, atendiendo precisamente al criterio de la cardinalidad de los conjuntos que esos ordinales podían “representar”. Para empezar, agrupó a todos los ordinales que “corresponden” a conjuntos numerables en la clase II (dejando el nombre de clase I para el conjunto de los ordinales finitos). o Antes de seguir, precisemos dos cosas: 1) cuando hablamos del conjunto que “representa” un número ordinal, nos referimos al conjunto de todos los ordinales previos a él, que de hecho lo definen (lo que ya comentamos); 2) se define la cardinalidad de un número ordinal como la cardinalidad precisamente del conjunto de todos los ordinales menores que él. La clase II está formada entonces por todos los ordinales con la propiedad de que el conjunto de los números previos a cualquiera de ellos resulta siempre numerable. Son los que se llaman ordinales numerables. [11]
De hecho, esto permite definir a los números en términos de conjuntos.
216
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Una vez que Cantor formó este conjunto —la clase II—, se hizo la pregunta, de cuál era su propia cardinalidad, el conjunto de todos los números ordinales numerables ¿es en sí mismo numerable? Para responderla mostró primero que tal conjunto está efectivamente bien-ordenado por la magnitud de sus elementos, de modo que a él mismo debería corresponderle un número ordinal (al que le dio el nombre de Ω), que como tal sería mayor (el siguiente mayor) que todos sus elementos; es decir, mayor que todos los ordinales numerables, pero entonces él no podría ser un ordinal numerable, pues en ese caso habría sido mayor que sí mismo. Como la clase II incluye, por ejemplo, a la colección {ω + n} con n ∈ N, que es numerable, entonces sabemos que la cardinalidad de la clase II de números ordinales no solo es diferente, sino que es mayor que el infinito de los números naturales (ℵ0 ). Pero había más: Cantor tomó un subconjunto arbitrario de la clase II y mostró que no tenía más opción que ser finito, numerable o de la misma cardinalidad que toda la clase II. De modo que no había posibilidades de que entre ℵ0 y el infinito cardinal de la clase II entrara algún otro infinito (cardinal) intermedio: se trataba del siguiente. Por esta razón lo denotó —años después— con el símbolo ℵ1 . Así las cosas, tenemos que: 1 ) La cardinalidad del conjunto de los números de la clase I (los ordinales finitos, —es decir los naturales—) es ℵ0 . Este es el primer número cardinal transfinito. 2 ) La cardinalidad del conjunto de todos los números ordinales numerables (la clase II) es ℵ1 y se trata de el siguiente infinito (cardinal) después de ℵ0 . 3 ) El primer elemento de la clase II es ω. Se trata del primer número ordinal transfinito. Como ya podemos imaginar, la clase I y la clase II pasaron a ser tan sólo los dos primeros universos posibles de números ordinales. Tras ellos vino la clase III, que constaría de todos los números ordinales que pudieran formarse con ayuda de los conocidos principios y que tuvieran cardinalidad ℵ1 (Ω —cuyo nombre cambió más tarde por ω1 — es su primer elemento). Con argumentos similares a los utilizados para la clase II, se prueba que la cardinalidad de la clase III es mayor que la de cualquier ordinal perteneciente a ella —es decir, que ℵ1 —, y se trata además
LOS NÚMEROS ORDINALES
217
del siguiente cardinal mayor, abriéndose paso entonces la introducción de ℵ2 , de la clase IV y de ω2 , y así sucesivamente.[12] o ¿Y dónde quedó la hipótesis del continuo? Cantor había logrado dar el brinco del infinito de los naturales al siguiente infinito. Y trazó el camino para de ahí pasar al siguiente, y al siguiente, y al siguiente. . . Pero no logró hacer encajar al infinito de los números reales en esta escala de infinitos. En particular, no logró mostrar con este nuevo esfuerzo que el segundo de sus infinitos (ℵ1 ) era precisamente el de los números reales (es decir, la hipótesis del continuo). Muy poco después de publicar los resultados que hemos tratado de reseñar, Cantor cayó en la primera de sus crisis nerviosas, la cual hubo de durar varias semanas.[13] Pero al cabo de pocos meses de haber salido del hospital, ya tenía pensada —y escrita— una nueva forma de abordar todo el problema, de definir y trabajar con los números ordinales y de intentar dar el paso de lo numerable a lo continuo. Hizo a un lado como idea rectora la de los tres principios generadores de nuevos números, y adoptó en su lugar la del análisis del tipo de orden que prevalece entre los elementos de los conjuntos (ordenados). Esto no solo dio lugar a un desarrollo mucho más claro de su teoría sobre el infinito y los números ordinales, sino que abrió todo un nuevo terreno, una nueva perspectiva desde la cual estudiar a los conjuntos en general. Es lo que veremos a continuación. [12]
A manera de ejercicio, definan explícitamente cuáles serían ℵ2 , la clase IV y ω2 ; ℵ3 , la clase V y ω3 ; en general, ℵn , la clase (n + 2) y ωn . [13] Cantor sufrió cada vez más de severas crisis nerviosas a lo largo de su vida. Es frecuente leer (aunque no en las fuentes más serias sobre el tema) que dichas crisis obedecieron fundamentalmente a dos factores: sus investigaciones sobre el infinito —imagen misma de lo complejo y lo difícil de comprender—, y el hostigamiento personal por sus ideas matemáticas de parte de su ex-profesor Leopold Kronecker, quien contaba con suficiente peso político en la Universidad de Berlín. Sin embargo, vale la pena conocer la opinión de Karl Pönitz, uno de los médicos responsables de su tratamiento en la clínica Halle Nerverklinik: La enfermedad de Cantor era básicamente endógena, y probablemente se debía a un problema maníaco-depresivo: los factores exógenos, tales como la dificultad de sus investigaciones y las controversias en la Universidad de Halle, lo más probable es que hayan influido muy poco en la génesis de sus ataques, poco más que la palmada que comienza una avalancha. De manera que igual habría sufrido dichos ataques si él hubiera seguido una carrera común y corriente.94
218
4.2.3.
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Tipos de orden y números ordinales La cantidad, que ha sido considerada como el verdadero hogar del infinito, el infinitesimal y la continuidad, debe dejarle el lugar, a este respecto, al orden. B. Russell, 1903.95
Como hemos visto, Cantor se abocó a desarrollar una clasificación de los conjuntos infinitos que fuera más allá de su cardinalidad. Después de todo, no presentaban el mismo grado de “concentración” de sus elementos conjuntos como el de los números naturales; por ejemplo, que conjuntos como los que había construido en su trabajo sobre las series de Fourier, capaces de “soportar” múltiples derivaciones sin disolverse, o que los números racionales, por citar otro ejemplo; y todos ellos eran numerables. Se requería echar mano de otro criterio de comparación para diferenciarlos, y escogió, en un segundo momento de su investigación, al análisis del tipo de orden entre sus elementos como el criterio fundamental.[14] Todo conjunto simplemente ordenado M tiene un tipo de orden, que Cantor denotó con el símbolo M . Empezó estudiando el caso más simple [14]
Ya mencionamos que Cantor pensó en los tipos de orden como la nueva idea clave y reconstruyó su teoría de los números ordinales sobre esta base unos meses después de publicar los Grundlagen. En 1884 terminó el trabajo Principien einer Theorie der Ordnungstypen (Principios de una teoría de tipos de orden) y lo envió para su publicación a la revista Acta Mathematica, fundada y dirigida por el matemático sueco Gösta Mittag-Leffler, el cual se rehusó diplomáticamente a publicar el trabajo de Cantor, enviándole una carta de respuesta a comienzos de 1885 en la que, entre otras cosas, le decía lo siguiente: Encuentro las nuevas ideas fundamentales que Ud. desarrolla en su ensayo muy buenas, y creo que Ud. tiene mucho que ganar desde ese punto de vista. Pero no puedo ocultarle que me parece que sería mejor para Ud. incluso no publicar estas investigaciones, antes de que pueda Ud. poner de manifiesto resultados nuevos y muy positivos de su nuevo modo de ver. Si Ud. consiguiera p. e. decidir por medio de la teoría de tipos, si el continuo lineal tiene o no la misma potencia que la segunda clase de números, entonces su teoría tendría el mayor éxito entre los matemáticos. Tal como están las cosas ahora, temo que la mayoría se asustarán mucho ante su nueva terminología y su modo filosófico muy general de expresarse [. . . ] la publicación de su nuevo trabajo antes de que Ud. presente nuevos resultados, dañará mucho su reputación entre los matemáticos [. . . ] Algún día, después de 100 años o más, su teoría puede que alguien la descubra y posteriormente se encuentre que Ud. ya lo había hecho antes, y entonces finalmente se le hará justicia.96
LOS NÚMEROS ORDINALES
219
de los conjuntos infinitos —los números naturales— y fue colocando paulatinamente elementos después —o antes— de todos sus elementos, distinguiendo el caso en que esta acción modificaba el tipo de orden que los caracterizaba del caso en que no lo hacía. o ¿Qué características tiene el orden definido en los números naturales? 1, 2, 3 . . . Son dos las propiedades básicas: a) Dado cualquier elemento suyo, los que le preceden siempre son un número finito. b) No tienen un último elemento. De estas propiedades se desprende que hay un primer elemento y que cualquiera tiene un siguiente y un anterior (excepto el primero), pero esto por sí solo no basta (ver ejercicios 13 y 10). Este tipo de orden lo representó Cantor con la letra ω. Sí, con el mismo símbolo con el que se refirió al infinito de los números naturales como número ordinal. De hecho, cuando los conjuntos están no solo ordenados sino bien-ordenados, asoció un número ordinal a cada tipo de orden. Así, todos los conjuntos con un orden que cumple las dos propiedades enunciadas, son clasificados como conjuntos con tipo de orden ω: 1, 2, 3, . . . ←→ ω.
¿Qué podemos decir de los números que contaban (supraíndices) las derivaciones X(1) , X(2) , X(3) , . . . , X(∞) del conjunto X que vimos en la sección §4.2.1? (ver pp. 206-209). Si tuviéramos que enlistarlos, formarían una sucesión del tipo 1, 2, 3, . . . , ω; este tipo de orden lo representó Cantor con el número ordinal ω + 1 (haciéndolo coincidir con el símbolo
El trabajo de Cantor no fue publicado en el Acta Mathematica sino hasta abril de 1970. No alcanzaron a cumplirse los 100 años pronosticados por el fundador de la revista, sino tan solo 85 . . . Cosas tenedes, el Cid, que farán fablar las piedras. . . Pero Cantor no esperó a su muerte —ni a lograr demostrar la hipótesis del continuo— para que fueran difundidas sus ideas sobre este asunto. En el que fue uno de sus trabajos más importantes —en realidad, el último de ellos— Beiträge zur Begründung der transfiniten Mengenlehre (Contribuciones a la fundamentación de la teoría de los conjuntos transfinitos), publicado en la revista alemana Mathematische Annalen en los años 1895 y 1897, desarrolló más a fondo su teoría de los números ordinales, basada en la clasificación de los tipos de orden posibles de establecer en los conjuntos bien-ordenados, censurada “por su bien” en 1885.
220
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
utilizado en su primer trabajo para referirse al lugar de este número en el enlistado de todos los números ordinales finitos y transfinitos): 1, 2, 3, . . . , ω ←→ ω + 1. Que se trata de un tipo de orden distinto de ω podemos constatarlo al observar que en este caso hay un último elemento (ω). Por otra parte, hay un elemento (ω) tal que los que le preceden no son un número finito. De modo que no cumple las condiciones a) y b) señaladas. o Supongamos que tenemos dos conjuntos ordenados arbitrarios A≺ y B≺∗ (con esta notación indicamos que los elementos de A están ordenados por la relación ≺ y los de B por la relación ≺∗ ). ¿Qué propiedad general permite identificar si ambos conjuntos tienen un mismo tipo de orden?, que podemos establecer una correspondencia biunívoca entre A y B que respeta el orden en cada conjunto, en el sentido de que si tomamos dos elementos a y a’ en A con sus correspondientes b y b’ en B, si a es anterior a a’ en A, entonces b también es anterior a b’ en B. Definición 14. Decimos que los conjuntos ordenados A≺ y B≺∗ tienen un mismo tipo de orden si existe una biyección f : A ←→ B tal que para cualesquiera a, a’ ∈ A, b, b’ ∈ B, con b = f (a), b’= f (a’), a ≺ a’⇐⇒ b ≺∗ b’. Cuando dos conjuntos tienen un mismo tipo de orden se dice que son semejantes o similares entre sí, y lo denotamos con el símbolo A ' B. La biyección que cumple lo anterior recibe el nombre de orden-isomorfa.[15]
[15]
No debemos confundir el concepto de equivalencia entre conjuntos que planteamos en la definición 1 (ver pág. 97), con el de semejanza o similaridad que hemos establecido aquí. Cinco cosas a señalar: 1) La equivalencia se define para conjuntos en general, mientras que la semejanza o similaridad se restringe a los conjuntos ordenados. 2) Que A y B sean equivalentes significa simplemente que existe una biyección entre ambos. Que sean semejantes o similares significa que existe una biyección ordenisomorfa entre los dos conjuntos. 3) Lo primero lo denotamos así: A ∼ B, lo segundo así: A ' B. 4) Es inmediato que A ' B ⇒ A ∼ B, pero A ∼ B ; A ' B (razónenlo). 5) El primer caso se refiere al hecho de que A y B tienen la misma cardinalidad (les asociamos el mismo número cardinal). El segundo a que tienen el mismo tipo de orden (lo cual, como veremos un poco más adelante, si adicionalmente los conjuntos son bien-ordenados —no simplemente ordenados— significa que les asociamos el mismo número ordinal).
LOS NÚMEROS ORDINALES
221
Cualquier biyección que quisiéramos establecer entre los conjuntos ordenados A = {1, 2, 3, . . . } y B = {1, 2, 3, . . . , ω} mencionados tendría que utilizar alguno de los naturales de A para ponerlo en correspondencia con ω (el último elemento de B), y luego seguir adelante con los demás (pues el primer conjunto no tiene un último elemento). Pero entonces, al pasar al siguiente elemento de A, la correspondencia tendrá inevitablemente que asociarle uno de los elementos de B que estaba a la izquierda de ω, que era el último, contraviniendo así la condición establecida en la definición anterior, lo cual confirma que ambos conjuntos no tienen un mismo tipo de orden, a pesar de ser ambos numerables (es decir, de tener la misma cardinalidad). o Es importante observar que el sentido en que se habla aquí de distintos tipos de orden no se refiere a lo que se llama “distintas formas de ordenar los elementos de un conjunto” cuando se trabaja, por ejemplo, con el cálculo combinatorio. Si tenemos el conjunto {a, b, c} y nos preguntamos de cuántas formas podemos ordenar los elementos de este conjunto, pensamos en (a, b, c), (a, c, b), (b, a, c), (b, c, a), (c, a, b) y (c, b, a), seis formas diferentes de hacerlo (las permutaciones), pero todas ellas corresponden a un mismo tipo de orden en el sentido que nos planteamos aquí. La definición que establecimos nos permite comprobarlo fácilmente: dadas cualesquiera dos permutaciones, tomamos la biyección que asocia el primer elemento de la primera de ellas con el primer elemento de la segunda, el segundo con el segundo y el tercero con el tercero, cualesquiera que hayan sido estos en una u otra permutación. De hecho, cualesquiera dos conjuntos finitos con el mismo número de elementos tienen un único tipo de orden. La demostración es una calca de la que acabamos de hacer para un conjunto con tres elementos. Esa es una diferencia clave con los conjuntos infinitos: estos tienen siempre una infinidad de tipos de orden diferentes entre sí. Esto no es difícil ver (será evidente un poco más adelante —en la sección §4.2.5— para los conjuntos numerables).
4.2.4.
Suma y producto de números ordinales
En nuestro ejemplo del conjunto X que fuimos derivando una y otra vez (pág. 209), el tipo de orden que representamos con el número ordinal ω + 1 fue {1, 2, 3, . . . , ω}, que correspondía a derivar el conjunto X una
222
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
infinidad actual de veces (obtener X(∞) ). ¿A qué habría correspondido el tipo de orden representado por el número ordinal 1 + ω?, a derivar el conjunto una primera vez y después derivarlo una infinidad de veces, lo cual habría resultado exactamente lo mismo que derivarlo una infinidad de veces sin más. Es decir, que mientras que, como vimos 1, 2, 3, . . . ω ←→ ω + 1 6= ω, ocurre en cambio que 1, 1, 2, 3, . . . ←→ 1 + ω = ω. Que 1 + ω = ω lo podemos constatar checando que cumple tal cual las propiedades a) y b) que caracterizan a ω (pág. 219), o bien con la biyección orden—isomorfa que asocia el primer 1 del segundo conjunto al 1 de ω, el segundo 1 al 2 de ω, el 2 del segundo conjunto al 3 de ω, y así sucesivamente. De modo que, mientras que 1 + ω = ω, sucede que ω + 1 6= ω, y entonces ω + 1 6= 1 + ω. Tal como sucedió con el 1, podemos decir en general que para cualquier n: 1, 2, 3, . . . , n, 1, 2, 3, . . . ←→ n + ω = ω,
pues de nueva cuenta se trata de un conjunto que cumple las condiciones a) y b). No así el conjunto 1, 2, 3, . . . , ω, ω + 1, ω + 2, . . . , ω + (n − 1) ←→ ω + n. Así es que n + ω = ω, pero ω + n 6= ω, y entonces n + ω 6= ω + n. De manera que colocar antes o después de los elementos de un conjunto los elementos de otro, puede dar lugar a distintos tipos de orden. Esto nos permite entender la idea de Cantor para definir la suma entre números ordinales:
Definición 15. Si A y B son dos conjuntos con números ordinales (tipos de orden) α y β respectivamente, definimos α + β como el tipo de orden que resulta de colocar primero los elementos de A y a continuación los elementos de B. Es decir, los elementos de A y B retienen sus respectivos órdenes, pero todo elemento de A precede a cualquier elemento de B. Entonces tenemos que si α y β son finitos, α + β = β + α. Pero si al menos uno de ellos no lo es, la igualdad no necesariamente se cumple. Es
LOS NÚMEROS ORDINALES
223
decir, que en general la suma de números ordinales no es conmutativa, tal como lo ilustran los ejemplos recién vistos. Lo que se cumple siempre es la asociatividad de la suma; es decir, α + (β + γ) = (α + β) + γ.
(4.4)
o Un ejemplo típico de un orden tipo ω + ω es enlistar primero todos los números impares y luego todos los pares: 1, 3, 5, . . . , 2, 4, 6, . . .
←→ ω + ω.
El valor numérico (que incluso podría ni siquiera ser numérico) de los objetos que ordenamos —números impares y pares en este caso— no es relevante: lo que importa es el orden en que los colocamos, de modo que un conjunto como el siguiente, sería similar al anterior (es inmediata la biyección orden-isomorfa entre ambos): 1, 2, 3, . . . , ω, ω + 1, ω + 2, . . . ←→ ω + ω. Cantor también distinguió 2 · ω de ω · 2: lo primero lo identificó con colocar una infinidad de parejas una a continuación de la otra, así es que eso resultaba nuevamente un orden idéntico a ω, mientras que lo segundo lo identificó con colocar dos infinidades tipo ω una a continuación de la otra; es decir, lo que llamamos ω + ω (que desde luego es un tipo de orden distinto de ω). Esto nos da la pauta para plantear la forma general en que Cantor definió el producto entre dos números ordinales cualesquiera. Definición 16. Si A y B son dos conjuntos con números ordinales (tipos de orden), α y β respectivamente, definimos α · β como el tipo de orden que resulta de sustituir cada elemento de B por un conjunto cualquiera de elementos con el tipo de orden de A, es decir α. De manera que cuando hablamos de n · ω lo que hacemos es sustituir en lugar de cada elemento de un conjunto con tipo de orden ω —por ejemplo los naturales—, un conjunto con n elementos, mientras que cuando hablamos de ω · n lo que hacemos es sustituir en lugar de cada elemento de un conjunto con n elementos, un conjunto como los números naturales:
224
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
ω:
1 , 2 , 3 z }| { z }| { z }| { n · ω : 1, 2, . . . , n , 1, 2, . . . , n , 1, 2, . . . , n n:
ω·n:
1 z }| { 1, 2, . . .
,
,
2 z }| { 1, 2, . . .
,
,
3 z }| { 1, 2, . . .
,
...
,
...
...
,
...
,
n . z }| { 1, 2, . . .
Entonces 1, 2, . . . , n | 1, 2, . . . , n | 1, 2, . . . , n | . . . ←→ n · ω = ω, pues se trata de un conjunto que cumple las dos propiedades mencionadas que caracterizan a los conjuntos con tipo de orden ω. Sin embargo, 1, 2, · · · | 1, 2, · · · | · · · | 1, 2, · · · | . ←→ ω + ω + · · · + ω = ω · n 6= ω, pues el conjunto que resulta no cumple que los anteriores a cualquier elemento suyo son siempre un número finito, ∴
n · ω 6= ω · n.
Tenemos entonces que al igual que ocurría con la suma, el producto de dos números ordinales, α y β, cumple que α · β = β · α cuando ambos son finitos. Pero si al menos uno de ellos no lo es, la igualdad no necesariamente se cumple; es decir, que en general el producto de números ordinales tampoco es conmutativo. Se puede probar que el producto de números ordinales es asociativo, y que distribuye a la suma por la izquierda, no así por la derecha. Es decir, que α · (β · γ) = (α · β) · γ,
y α · (β + γ) = (α · β) + (α · γ). Pero no siempre se cumple que (α + β) · γ = (α · γ) + (β · γ).
(4.5) (4.6)
225
LOS NÚMEROS ORDINALES
4.2.5.
Conjuntos numerables: una sola cardinalidad, una infinidad de tipos de orden
? ¿Qué tipo de orden resultaría si quisiéramos ordenar los racionales positivos, numerando primero todos los que tienen denominador 1 (en orden creciente), luego todos los que tienen denominador 2 (también en orden creciente y saltándonos los que ya hubiéramos numerado antes), luego los de denominador 3, etcétera?, sería un orden del tipo 1 2 3 1 3 5 1 2 4 , , , . . . ; , , , . . . ; , , , . . . ; . . . ←→ ω · ω = ω 2 . 1 1 1 2 2 2 3 3 3 Otro conjunto con un tipo de orden igual al anterior es el de los números de la forma nk , con n, k ∈ N, definiendo entre ellos el orden ≺ de la siguiente manera: a) Si k < l =⇒ nk ≺ ml , ∀ k, l ∈ N. b) Si n < m =⇒ nk ≺ mk . Con esta relación de orden, los elementos del conjunto quedarían enlistados así: 11 , 21 , 31 , . . . ; 12 , 22 , 32 , . . . ; 13 , 23 , 33 , . . . ; . . . ? Los ejemplos previos son casos particulares de sucesiones infinitas (tipo ω) de conjuntos ordenados tipo ω cada uno, con lo cual generan un orden tipo ω 2 : 1, 2, 3, . . . ; 1, 2, 3, . . . ; 1, 2, 3, . . . ; . . .
←→
Figura 4.1: Tipo de orden ω 2 .
ω · ω = ω2.
97
? Si tomamos ahora una sucesión infinita (tipo ω) de conjuntos con orden ω 2 , obtenemos otro con orden ω 3 : 1, 2, . . . ; 1, 2, . . . ; . . . | 1, 2, . . . ; 1, 2, . . . ; . . . | . . . {z } | {z } | ω2 ω2 ...
←→
ω2 · ω = ω3 .
226
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Podemos reproducir este procedimiento para obtener conjuntos con tipo de orden ω n en general: para ello basta con tomar una sucesión (tipo ω) de conjuntos ordenados con orden ω n−1 . En lo anterior está implícito lo que en el fondo es una definición de exponenciación de ordinales, para el caso particular en que el exponente es finito (aquí se formula para el caso en que la base es ω): ω n = ω n−1 · ω.
(4.7)
? Un conjunto con tipo de orden ω ω se puede representar en la recta desarrollando un proceso análogo al que seguimos para construir un conjunto con derivado de orden infinito distinto del vacío en la sección §4.2.1 (ver pág. 209). Tomamos la sucesión {1 − n1 }, con sus términos considerados como extremos podemos generar una infinidad de intervalos de la forma
1 2 2 3 3 4 1 , , , , , , ,... 0, 2 2 3 3 4 4 5
Llamamos [ai , bi ], i = 1, 2, . . . a cada uno de estos intervalos, e introducimos un conjunto de orden ω en el primero de ellos, otro de orden ω 2 en el segundo, otro más de orden ω 3 en el tercero, y así sucesivamente. Observemos que lo anterior nos plantea que ω + ω2 + ω3 + · · · = ωω .
(4.8)
? Si ahora en un conjunto con orden ω ω sustituimos cada uno de sus elementos por otro conjunto con orden ω ω , generamos un nuevo conjunto con orden (ω ω )2 = ω ω·2 . En general: si en un conjunto de orden ω ω sustituimos cada uno de sus elementos por otro conjunto con orden (ω ω )n = ω ω·n , generamos un nuevo conjunto con orden (ω ω )n+1 = ω ω·(n+1) . ? Y así ad infinitum. Pasaremos por ω y más allá . . .
ωω
,...ω
ω ωω
,...ω
ω ωω
·· ω·
...
227
LOS NÚMEROS ORDINALES
Figura 4.2: Tipo de orden ω ω .
98
o ¿Cómo describiríamos por ejemplo un conjunto con número ordinal ω 4 · 3 + ω 2 · 5 + ω · 4 + 8? Colocados uno a continuación de otro, de izquierda a derecha, se trata de tres conjuntos de orden ω 4 , cinco conjuntos de orden ω 2 , cuatro conjuntos de orden ω y ocho elementos más. Después de definir en general la operación de exponenciación entre números ordinales de conjuntos numerables bien-ordenados (no lo haremos aquí),99 Cantor demostró algo más que también resulta muy significativo: que todo número ordinal α de esa clase puede ser representado en forma única como α = ω α0 · k0 + ω α1 · k1 + · · · + ω αr · kr ,
(4.9)
donde α0 , α1 , . . . αr son enteros no negativos o números ordinales de conjuntos numerables tales que α0 > α1 > · · · > αr ≥ 0, mientras que k0 , k1 , . . . , kr , r + 1 ∈ N.
228
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
A la expresión anterior dio el nombre de forma normal, agregando que α0 sería llamado “grado” y αr “exponente” de α (para r = 0 grado y exponente son iguales entre sí),100 que si la vemos con atención, no puede sino recordarnos la forma en que un número entero no negativo se puede representar en una base entera b > 1 arbitraria (ver sección §6.3.2): x = ϕn · bn−1 + ϕn−1 · bn−2 + · · · + ϕ2 · b1 + ϕ1 · b0 , con ϕk ∈ {0, 1, . . . , b − 1} ∀ k = 1, 2, . . . n. La expresión anterior la podemos traducir en otra como la siguiente para cualquier entero positivo x, si anulamos en ella todas las potencias de b en que el coeficiente es cero: x = k0 bα0 + k1 bα1 + · · · + kr bαr ,
(4.10)
donde α0 , α1 , . . . αr son enteros no negativos tales que α0 > α1 > · · · > αr ≥ 0, mientras que k0 , k1 , . . . , kr , r + 1 son números naturales menores que b.[16] Es decir, Cantor probó que todo número ordinal de un conjunto numerable bien-ordenado se puede expresar, digamos, en base ω, en forma completamente análoga a como lo hace un entero positivo en base b > 1: otra vez, los números ordinales transfinitos se comportan de manera muy similar a los ordinales finitos.[17] En su famoso trabajo sobre teoría de conjuntos escrito unos años después (1914), el matemático alemán Félix Hausdorff probó una versión [16]
Nótese que decir aquí que k0 , k1 , . . . , kr , r + 1 “son menores que b” no modifica la analogía con la expresión (4.9), pues allí, siendo naturales los coeficientes, queda garantizado automáticamente que todos ellos son menores que omega. [17] Hay sin embargo una limitación en esta forma de representar a los ordinales infinitos de conjuntos numerables: en el caso de casi todos los ejemplos que hemos visto, el grado es menor que el número ordinal mismo (es decir, α0 < α en la expresión ωω
ωω
··
·
, que Cantor representó con el símbolo (4.9) ). Pero al “llegar” al ordinal ω 0 , esto no resulta así, pues, como podemos observar, 0 = ω 0 . Entonces, pensada la forma normal como una manera de representar cualquier número ordinal de un conjunto numerable bien-ordenado, para el caso del número 0 se trataría de una expresión auto-referencial, y no es el único ordinal con esta característica: Cantor, en la parte final de su trabajo de 1895-1897101 obtuvo varios resultados para los números con esta propiedad, a los que llamó en general los -números, el más pequeño de los cuales es precisamente 0 —todos ellos correspondientes a conjuntos numerables—.
229
LOS NÚMEROS ORDINALES
más general de este resultado: que dado cualquier número ordinal ζ > 0, y dada cualquier base ordinal β > 1, ζ = β α · η + β α1 · η1 + · · · + β αn · ηn ,
(4.11)
donde α, α1 , . . . αn son tales que α > α1 > · · · > αn ≥ 0, y 0 < η, η1 , . . . , ηn < β, y dicha representación es única[18]102
4.2.6.
Límite, exponenciación e inducción transfinita
En la sección §4.2.2 (ver pág. 214) mencionamos la idea de Cantor de límite de una sucesión de números ordinales en el contexto de su primer enfoque sobre los números ordinales. Plantearemos ahora un poco más en detalle su idea sobre el concepto de límite de lo que él llamó sucesiones fundamentales de elementos de un conjunto transfinito simplemente ordenado, en el contexto de su segundo enfoque global. Empecemos por citar al propio Cantor: Si en un conjunto ordenado M invertimos todas las relaciones de precedencia de sus elementos, de manera que “menor” se convierte en “mayor” y “mayor” se convierte en menor” en todas partes, obtenemos nuevamente un conjunto ordenado que denotaremos con la letra ∗ M y llamaremos “inverso” de M . Si α = M (es decir, α es el tipo ordinal de M ), denotamos el tipo ordinal de ∗ M por ∗ α.103 [. . . ] Consideremos cualquier conjunto transfinito M simplemente ordenado. Todo subconjunto de M es en sí mismo un conjunto ordenado. Para el estudio del tipo de orden M , aquellos subconjuntos de M que tienen los tipos ω y ∗ ω resultan especialmente valiosos; los llamaremos “sucesiones fundamentales [. . . ] contenidas en M ”, y a las primeras —las de tipo ω— las llamamos sucesiones “crecientes” mientras que a las segundas —las de tipo ∗ ω— las llamamos sucesiones “decrecientes”.[19] [18]
Aquí aplica la misma limitación que mencionamos en la nota anterior. La traducción literal de la versión en inglés del trabajo de Cantor publicada por Jourdain, diría aquí “ascendentes” y “descendentes” en lugar de “crecientes” y “decrecientes”. Puede que la diferencia no sea tan sutil, pues se trata de términos que vinculan menos el concepto al caso particular en que la relación de orden es la de
[19]
230
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
[. . . ] Si existe en M un elemento m0 que tiene una posición ante la sucesión fundamental creciente {an } tal que: a) para toda n
an ≺ m0 , b) para todo elemento m de M que precede a m0 existe un cierto número n0 tal que an m, para n > n0 , entonces llamaremos a m0 un “elemento límite en M ” o bien un “elemento principal” en M . De la misma manera (si {bn } es una sucesión fundamental decreciente) llamamos a m0 un “elemento principal de M ” y también “elemento límite de bn en M ” si se satisfacen estas condiciones: a) para toda n b n m0 , b) para todo elemento m de M que está después de m0 existe un cierto número n0 tal que bn ≺ m, para n > n0 . Una sucesión fundamental nunca puede tener más de un elemento límite en M ; pero M tiene, en general, muchos elementos principales.104 Como podemos ver, se trata tal cual de la definición contemporánea de los conceptos de supremo e ínfimo de un conjunto, aplicados al caso de las sucesiones crecientes y decrecientes (en cuyo caso supremo e ínfimo coinciden precisamente con el límite, también en términos actuales). la magnitud. Pero es mucho más común el uso en la literatura de los conceptos de sucesiones crecientes y decrecientes, de manera que preferimos traducirlo así. Sin embargo, debemos tener presente siempre que cuando hablamos de conjuntos ordenados arbitrarios, decir “menor que” o “mayor que” se refiere a ser “anterior a” o “posterior a”, o bien que “precede a” o “sucede a”. En el caso particular en que la relación de orden es la de la magnitud de los elementos del conjunto ordenado, “menor que” y “mayor que” coinciden con el sentido usual que tienen para nosotros estas palabras.
LOS NÚMEROS ORDINALES
231
Pero con un detalle: que al formular la idea para conjuntos transfinitos en general, no restringe la aplicación del concepto al caso de los conjuntos acotados por un determinado valor real. Más adelante prueba que los números ordinales —definidos como tipos de orden de conjuntos bien-ordenados— forman, arreglados en orden de magnitud, un conjunto bien-ordenado ellos mismos. De manera que se puede llevar el concepto de límite “usual” a sucesiones fundamentales de números ordinales. Ya ahí, demuestra que cualquier número ordinal que corresponde a un tipo de orden de un conjunto numerable, no tiene más que dos opciones: ser el siguiente de otro número ordinal (ordinales de primera especie), o ser el límite de una sucesión fundamental creciente de números ordinales —estrictamente menores que él, naturalmente— (ordinales de segunda especie). En otras palabras: establece un puente con su primer enfoque de los números ordinales, pues lo anterior significa, en términos de los viejos principios de generación de números ordinales, que estos surgen, bien como resultado de aplicar el primer principio, o bien como resultado de aplicar el segundo. o Cuando las sucesiones fundamentales son tomadas en conjuntos bien-ordenados (no tan solo ordenados), el límite adquiere propiedades particularmente importantes. ? Por ejemplo, se puede mostrar que si A≺ es un conjunto bienordenado y {an } es una sucesión fundamental creciente de elementos de A “acotada” arriba por un elemento b ∈ A (es decir, que an ≺ b ∀ n ∈ N), entonces la sucesión converge a un elemento de A. El argumento es sencillo: Si llamamos B al conjunto de los elementos de A que son mayores[20] que todos los términos de la sucesión, sabemos que B ⊆ A y B 6= ∅, pues por lo menos b ∈ B. Al ser subconjunto de A, B está bien-ordenado y tiene un primer elemento, llamémosle β. Tenemos que an ≺ β 2 b ∀ n ∈ N. ¿Qué pasa si tomamos a ∈ A, a ≺ β?, que debe existir algún término de la sucesión que sea mayor que a, pues si todos fueran menores a habría sido un elemento de B menor que β, el menor de los elementos de B, lo cual es una contradicción. Así es que β ∈ B ⊆ A es el límite de la sucesión {an } y queda demostrado el resultado. ? ¿Podríamos plantear que de manera análoga, toda sucesión fundamental {bn } decreciente, acotada inferiormente de elementos de un conjunto bien-ordenado A también deberá de converger?, no, por un pe[20]
Ver la parte en cursivas de la nota al pie de la pág. 230.
232
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
queño detalle: que con los elementos de un conjunto bien-odenado jamás podremos formar una sucesión fundamental decreciente. Si se pudiera, el conjunto de los términos de la sucesión, al ser un subconjunto de A, estaría bien-ordenado, y tendría entonces un elemento mínimo. Pero si eso es así, los términos siguientes a ese tendrían que ser menores que él, resultando entonces que la sucesión tiene una infinidad de términos menores que el menor de sus elementos, lo cual es una contradicción. En los conjuntos bien-ordenados, si son suficientemente numerosos, se puede viajar “de ida” con recorridos que pasan por infinidad de infinidades de puntos, ¡pero de regreso todas las trayectorias son finitas!; desde donde quiera que estemos en el conjunto llegaremos al inicio de él en unos cuantos pasos, ¡y solo podemos hacerlo de esa manera! o Aunque, como dijimos en algún momento, no veremos la definición general de la operación de exponenciación entre números ordinales, trataremos de ilustrar con algunos ejemplos la utilidad del concepto de límite para llegar a esa definición. Ya hemos trabajado antes con casos particulares de esta operación. Así por ejemplo, en (4.8) vimos que ω + ω2 + ω3 + · · · = ωω , y como el producto distribuye a la suma por la izquierda, y la suma de ordinales es asociativa, llegamos a lo siguiente: 1 + ω = ω, ω + ω 2 = ω(1 + ω) = ω(ω) = ω 2 , ω + ω 2 + ω 3 = ω 2 + ω 3 = ω 2 (1 + ω) = ω 2 (ω) = ω 3 , y así sucesivamente. De modo que ω + ω2 + · · · + ωn = ωn, y entonces ∞ X
k=1
ω k = l´ım
n→∞
n X
k=1
ω k = l´ım ω n = l´ım {ω, ω 2 , ω 3 , . . . }, n→∞
(4.12)
así es que finalmente resulta ω ω = l´ım {ω, ω 2 , ω 3 , . . . }.
(4.13)
LOS NÚMEROS ORDINALES
233
Si aplicamos el mismo razonamiento para obtener k ω , tendremos lo siguiente: 2ω = l´ım 2n = l´ım {2, 4, 8, . . . } = ω,
y en general
3ω = l´ım 3n = l´ım {3, 9, 27, , . . . } = ω, k ω = l´ım k n = l´ım {k, k 2 , k 3 , . . . } = ω.
? Nótese la diferencia entre lo que sucede con la exponenciación de los números cardinales (ver (3.8)) y con los números ordinales: mientras que 2ℵ 0 = c > ℵ0 , ocurre en cambio que
2ω = ω. Esto a pesar de que casi estaríamos tentados a decir que ω y ℵ0 son “el mismo número”. ? En (4.7) planteamos un camino inductivo para definir αβ en el caso en que β es un ordinal sucesor: αβ = αβ−1 · α.
Con lo que acabamos de hacer se esboza un camino también inductivo para definir αβ , cuando β es un ordinal límite: tomamos el universo de los ordinales anteriores a β y calculamos el límite de los valores que resultan al elevar α a tales ordinales previos; es decir, αβ = l´ım αξ ,
ξ < β.
El detalle está en que los ordinales anteriores a un ordinal determinado por lo general no forman una sucesión tipo ω, y hasta el momento solo hemos definido el límite para ellas. Se requeriría extender el concepto para adoptar la anterior definición de exponenciación de números ordinales en general.105 Finalmente comentaremos que se pueden demostrar las siguientes propiedades de la exponenciación de números ordinales: αβ · αγ = αβ+γ
(αβ )γ = αβγ .
234
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Sin embargo, dado que la conmutatividad del producto no se cumple, tampoco es verdadero que (αβ)2 = α2 β 2 , pues (αβ)2 = (αβ)(αβ) = αβαβ 6= ααβα = α2 β 2 . o Si queremos demostrar una propiedad que se pretende válida para conjuntos de ordinales transfinitos, la existencia en este caso de dos especies de números (los “ordinales límite” y los “ordinales sucesor”) obliga a modificar el viejo Principio de Inducción (de hecho, lo acabamos de hacer en la discusión de la definición general de exponenciación de ordinales). ? ¿Cómo debíamos proceder cuando queríamos probar que una propiedad se cumple para todo número natural? Demostrando dos cosas: 1) Que la propiedad es válida para n = 1. 2) Que si fuese válida para un natural arbitrario n, lo sería también para el siguiente (n + 1). Con eso quedaba garantizado que la propiedad se cumple para todo número natural; pues habiendo sido comprobada para n = 1, por la segunda condición sería válida para n = 2; pero en ese caso, también para n = 3, y para n = 4, y así sucesivamente. Este era el Principio de Inducción Finita. ? ¿En qué cambian las cosas si ahora queremos probar una propiedad para todos los números ordinales transfinitos que corresponden a conjuntos numerables? El viejo principio de inducción nos serviría para demostrar la propiedad para todos los ordinales de la primera especie mencionados; es decir, para los sucesores de algún ordinal que los precede inmediatamente. Pero nos faltaría probarla para los ordinales de la segunda especie, aquellos que son el límite de una sucesión fundamental creciente de ordinales. Para demostrar la propiedad para unos y otros números, tendríamos ahora que probar: 1) Que se cumple para n = 1, y que simpre que se cumpla para un ordinal α, se cumple para el ordinal α + 1. 2) Que siempre que se cumpla para los términos de una sucesión fundamental creciente de ordinales {αn }, se cumple para su ordinal límite α. Al anterior podríamos llamarle Principio de Inducción Transfinita para conjuntos bien-ordenados numerables. ? El Principio de Inducción Transfinita para conjuntos bien-ordenados en general, dice lo siguiente:
LOS NÚMEROS ORDINALES
235
Sea A un conjunto bien-ordenado cualquiera. Si demostramos que una cierta propiedad: 1) Se cumple para un primer elemento de A. 2) Siempre que se cumple para todo x ∈ A, x < a, se cumple para a mismo (y esto es válido para toda a ∈ A). Entonces la propiedad la cumplen todos los elementos de A. No es difícil comprobar que lo anterior se cumple en todo conjunto bien-ordenado. Pensemos en el conjunto B de todos los elementos de A que no cumplen la propiedad que nos interesa. Supongamos que B 6= ∅. Es inmediato que B ⊆ A, por lo tanto B es un conjunto bien ordenado y tiene un primer elemento α que no puede ser el primer elemento de A, por la condición 1). Pero entonces la propiedad es verdadera para todo elemento menor que α, y si esto es así, por la condición 2) debe ser verdadera para α. Lo anterior es una contradicción, de manera que B debe ser vacío. ? ¿Existe un principio de inducción transfinita aun más amplio, que sirva para todos los conjuntos simplemente ordenados, no solo para los bien-ordenados?, sí. No lo formularemos en general,106 pero lo haremos para el más importante de los conjuntos simplemente ordenados con el orden usual: los números reales. Si una cierta propiedad: 1) Se cumple para un intervalo (−∞, a), para alguna a ∈ R. 2) Siempre que se cumple para un intervalo de la forma (−∞, a), existe otro (−∞, b) con b > a para el que también se cumple. Entonces, la propiedad se cumple para todo número real. Esto ofrece un camino para demostrar propiedades que son válidas en todo R.[21]
4.2.7.
El desenlace: la escalera de ordinales arriba al siguiente infinito cardinal
Hemos comentado que hay una diferencia entre los conjuntos finitos y los infinitos en lo que se refiere a los tipos de orden: mientras que los primeros solo pueden ser arreglados con base en un único tipo de orden (cualquier forma de ordenar un conjunto con n elementos es semejante [21]
Puede consultarse por ejemplo el artículo de Pete L. Clark, The Instructor’s Guide to Real Induction, en donde el autor demuestra algunos de los teoremas clásicos del cálculo utilizando el principio de inducción en los números reales (página electrónica: http://arxiv.org/abs/1208.097, Universidad de Cornell).
236
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
a las demás), los conjuntos infinitos en cambio pueden ser ordenados de una infinidad de maneras distintas no semejantes entre sí. Lo hemos confirmado en el caso de los conjuntos numerables. Decía Cantor: A uno y el mismo número cardinal transfinito a pertenecen una infinidad de números ordinales que forman un sistema unitario y conexo. Llamaremos a este sistema “la clase de números Z(a)” [. . . ] El siguiente objeto de nuestra consideración es la clase de números Z(ℵ0 ), que llamaremos “la segunda clase de números”. Pues en conexión con esto entendemos por “la primera clase de números” a la totalidad {n} de los números ordinales finitos.107 La segunda clase de números es entonces la totalidad {α} de tipos de orden de conjuntos bien-ordenados con la cardinalidad ℵ0 , y ω es el más pequeño de los elementos de esta segunda clase.[22] o Pensemos en un conjunto arbitrario con tipo de orden ω: A = {a1 , a2 , a3 , . . . }. Sean cuales sean los valores que adopten los elementos an , el conjunto resultante A siempre va a ser semejante (es decir, orden-isomorfo) al conjunto de todos los números ordinales menores que ω: {a1 , a2 , a3 , . . . } ' {1, 2, 3, . . . } ←→ ω. Análogamente, si pensamos en conjuntos con orden tipo ω · 2, como por ejemplo {1, 3, 5, . . . , 2, 4, 6, . . . } o {1, 12 , 13 , . . . , −1, − 12 , − 31 , . . . }, es inmediato que resultan orden-isomorfos (semejantes) al conjunto de todos los ordinales menores que ω · 2: {a1 , a2 , a3 , . . . , b1 , b2 , b3 , . . . } ' {1, 2, 3, . . . , ω, ω + 1, ω + 2, . . . } ←→ ω · 2. Cantor probó que esta propiedad se cumple en general para cualquier número ordinal de la clase II:108 si α es el número ordinal de un conjunto bien-ordenado numerable A, entonces el conjunto T de todos [22]
Es evidente la analogía con el primer desarrollo de Cantor sobre el tema que tratamos en la sección §4.2.2.
LOS NÚMEROS ORDINALES
237
los ordinales de las clases I y II menores que α es semejante a A.[23] Dicho con símbolos: Si α = ord(A) y T = {ξ : ξ < α} =⇒ T ' A (y ∴ α = ord(T )). (4.14)
Los conjuntos (como T ) que incluyen a todos los números ordinales menores que alguno, son llamados segmentos del conjunto de los números ordinales.[24] Así es que (4.14) nos plantea que sea cual sea la naturaleza de los elementos de un conjunto bien-ordenado, desde el punto de vista del orden, podemos trasladar su análisis al universo de los números ordinales. Más específicamente: trabajar con un conjunto bien-ordenado A con número ordinal α, es equivalente a trabajar con un segmento T del universo de los números ordinales, aquel constituido por todos los ordinales menores que α. Uno y otro conjunto son, digámoslo así, la misma cosa desde el punto de vista del orden. Ya ubicados en el universo de los números ordinales, si α es el número ordinal de un segmento T , α es mayor que todos los elementos de T , así es que α no puede estar en T , pues sería mayor que sí mismo. o Esto tiene una consecuencia muy importante: si agrupamos en un todo a los ordinales numerables, es previsible que ese conjunto en sí mismo no sea numerable. Veamos por qué.[25] Denotemos con Z2 = Z(ℵ0 ) a la segunda clase y con Z1 a la primera clase de números ordinales (en Z2 están todos los ordinales numerables y en Z1 (= N) todos los finitos). Sea S = Z1 ∪ Z2 . Como se trata de un conjunto de números ordinales, está bien-ordenado y por tanto le corresponde un número ordinal. Llamémosle ω1 = S.[26] En S estarían entonces todos los ordinales menores que ω1 , es decir que se trata de un segmento de números ordinales y ω1 ∈ / S.
[23]
Sierpiński (1957, teorema 1, p. 272) ofrece una demostración general de este resultado que no se restringe a los conjuntos de la clase II. [24] Este concepto se define en general para cualquier conjunto ordenado: Sea A un conjunto ordenado, a ∈ A. Entonces, el conjunto {x ∈ A : x < a} es llamado segmento de A (generado por a). Los segmentos ordenados de R son los intervalos de la forma (−∞, a). [25] En esta última parte se hará evidente la cercanía entre los razonamientos que iremos haciendo y los que hicimos en el útimo parágrafo de la sección §4.2.2 (pp. 215-217). [26] Recordemos que A denota el número ordinal (tipo de orden) del conjunto bienordenado A.
238
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
¿Puede ser entonces Z2 numerable? De ser así, S también sería numerable (pues sería la unión de dos conjuntos numerables). Pero todos los ordinales numerables están en Z2 , entonces ω1 ∈ Z2 ⊆ S; es decir, ω1 ∈ S, lo cual sería una contradicción, ∴ |Z2 | = 6 ℵ0 . Por ejemplo como el conjunto numerable {ω + n | n ∈ N} está contenido en Z2 , sabemos que |Z2 | ≥ ℵ0 , ∴ |Z2 | > ℵ0 . o Demostraremos ahora que no existe ningún conjunto bien-ordenado cuya cardinalidad caiga entre ℵ0 y |Z2 |. Sea M cualquier conjunto bien-ordenado. Sea µ su número ordinal y m su número cardinal. Trasladaremos el análisis de M al del segmento T que es similar (o semejante) a M en el universo de los ordinales. Es decir: Por (4.14) sabemos que existe un segmento T de números ordinales tal que T = M = µ. (En T están todos los números ordinales menores que µ.) Sabemos también que si dos conjuntos tienen el mismo número ordinal, entonces tienen la misma cardinalidad (ver nota al pie de la pág. 220), pues que tengan el mismo número ordinal significa que son ordenisomorfos y eso quiere decir que existe una biyección que preserva el orden entre ambos; pero la simple existencia de una biyección ya garantiza que tienen la misma cardinalidad. Así, |T | = |M | = m. Comparemos ahora µ con ω1 = S = Z1 ∪ Z2 : Si µ > ω1 =⇒ T ⊇ (Z1 ∪ Z2 ) =⇒ |T | = |M | = m ≥ |Z2 |. Si µ ≤ ω1 =⇒ T ⊆ (Z1 ∪ Z2 ) =⇒ T es finito o numerable =⇒ |T | = |M | = m ≤ ℵ0 . Y no hay más opciones, de manera que no existe un conjunto bienordenado cuya cardinalidad sea mayor que ℵ0 y menor que |Z1 ∪ Z2 | = |Z2 | (esta última igualdad es fácil de probar (ejercicio 9a)). Llegamos entonces a la conclusión final: la cardinalidad del conjunto de los números de la clase Z(ℵ0 ) es un infinito mayor que ℵ0 , pero no
LOS NÚMEROS ORDINALES
239
solo eso, sino que se trata de el siguiente infinito después de ℵ0 . Por esa razón, Cantor llamó ℵ1 = |Z(ℵ0 )|, y abrió el camino hacia delante: comenzando con ω1 , se puede pensar en la clase Z(ℵ1 ), que es el conjunto de todos los números ordinales (tipos de orden) de conjuntos con la cardinalidad ℵ1 . Con argumentos semejantes a los utilizados hace un momento se puede probar que |Z(ℵ1 )| es el siguiente infinito cardinal mayor que ℵ1 , y por ello este nuevo número es llamado ℵ2 . Se construye la clase Z(ℵ2 ) con los ordinales de cardinalidad ℵ2 . El primer ordinal de esta clase es ω2 . . . y así sucesivamente. o Cantor demostró entonces que en general, si tomamos un conjunto infinito bien-ordenado, el número de formas de reordenar sus elementos con distintos tipos de orden, es siempre un infinito mayor que el de los elementos mismos. Más aun, es el infinito cardinal que sigue al del conjunto que reordenamos de múltiples maneras, no hay forma de construir un conjunto bien-ordenado que tenga una cardinalidad mayor que la del conjunto inicial y menor que la del conjunto de tipos de orden no semejantes susceptibles de crearse entre sus elementos. Logró su objetivo de ir escalando, de uno en uno, los tamaños del infinito. Pero con un pequeño punto débil: que todo esto solo era válido en el universo de los conjuntos bien-ordenados. Ese fue el talón de Aquiles de su creación. El objetivo de descubrir si el infinito del continuo era el siguiente después del de los naturales (la hipótesis del continuo), se reducía ahora a mostrar que el número de formas no similares en que podemos bienordenar los números naturales era el mismo que el número de puntos en la recta (o que el número de subconjuntos de los naturales). O lo que es lo mismo: que a cada tipo de buen-orden que puede definirse entre los números naturales, le podemos hacer corresponder un diferente número real y viceversa. El problema estaba en que para poder comparar ambos conjuntos se requería que los dos estuvieran bien-ordenados. Cantor pudo probar que el conjunto de tipos de buen-orden de los naturales efectivamente era un conjunto bien-ordenado. Pero no logró probar que los reales podían ser bien-ordenados. El orden usual (el de su magnitud) no garantiza lo que se requiere para ser un buen-orden (basta con tomar el intervalo abierto (0, 1) y observar que no existe en él un primer elemento).
240
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Podemos imaginar sus esfuerzos por demostrarlo, esto era esencial para tratar de cerrar el círculo. Mientras no quedara garantizado esto, ni siquiera se podía saber si el infinito del continuo era realmente uno de los alephs, o simplemente no entraba en esa escala; pero si lo fuera, aun habría quedado por responder si era justamente ℵ1 u otro posterior a él.[27] La importancia que para su obra tenía el problema, se aprecia en la siguiente cita de los Grundlagen: El concepto de conjunto bien ordenado resulta fundamental para toda la teoría de conjuntos. En un artículo posterior discutiré la ley del pensamiento que dice que siempre es posible dar a un conjunto bien definido la forma de un conjunto bien ordenado— una ley que me parece a mí fundamental y de suma importancia y sorprendente dada su validez general.109 Desde luego, formular como una ley del pensamiento un principio general tan relevante reflejaba su imposibilidad de probarlo, a la vez que su convicción de que se trataba de un principio natural que debía ser aceptado en la lógica, o en su defecto de algo que tarde o temprano podría ser demostrado. Como sabemos, esto no ocurrió.
4.2.8.
Algunos agregados y comentarios finales sobre los números ordinales
1) Podríamos preguntarnos dónde quedan ubicados conjuntos con un tipo de orden bien definido, como el de los números enteros negativos (que no tienen un primer elemento y dado cualquiera de ellos, los que le siguen siempre forman un conjunto finito). O el de los enteros completos (no tienen primer ni último elemento, y entre dos de ellos [27]
Demostrar que ℵ1 = c es en realidad demostrar dos cosas: que los reales pueden ser bien ordenados y que el continuo es el siguiente infinito después de los naturales. Se trata de las dos cosas planteadas por Hilbert en su Problema 1 presentado ante el 2◦ Congreso Internacional de los Matemáticos (ver pp. 196-197): que se cumplen la HC y el PBO —que como recordaremos, es equivalente al AE—. Por eso, esta segunda forma de plantear la HC es conocida como la HC fuerte. Esta HC fuerte tiene a su vez su versión general, llamada Hipótesis del Continuo Generalizada (HGC): 2ℵα = ℵα+1 , para cualquier ordinal α. Esta es la formulación que presenta R. Penrose en su pie de página citado (ver pág. 203).
LOS NÚMEROS ORDINALES
241
puede haber ninguno o a lo más un número finito), o los racionales entre 0 y 1 (no tienen ni primer ni último elemento, son numerables y entre cualesquiera dos hay otros más —densidad—), o los reales del [0, 1] (toda sucesión fundamental de elementos del conjunto tiene un elemento límite en él, todos sus elementos son límite de sucesiones fundamentales, y tiene un subconjunto con el tipo de orden de los racionales tal que entre cualesquiera dos elementos del conjunto hay siempre elementos del subconjunto), por citar tan solo algunos ejemplos. Cantor también estudió y representó con símbolos el tipo de orden de conjuntos como los mencionados (∗ ω, π ∗ (=∗ ω + ω), η, θ respectivamente), pero no reconociendo a tales símbolos como números ordinales, pues tales conjuntos no son bien-ordenados con el orden ahí considerado (el de su magnitud). Su lista de números ordinales partía de la gran premisa que hemos comentado ampliamente: solo entrarían a formar parte de ella los conjuntos bien ordenados. A los demás tipos de orden no se les asignaría un número ordinal. 2) Es pertinente hacer una diferenciación entre el significado del concepto de límite que usualmente se utiliza al trabajar con funciones definidas en los números reales, y el que utiliza Cantor para las sucesiones de números ordinales (transfinitos). Hay un pasaje de una carta escrita por Cantor en 1886 al Profesor Dr. (médico) A. Eulemburg, en el que él mismo se encarga de explicar las cosas con toda claridad: Finalmente, debo explicarle a usted en qué sentido concibo al mínimo de los transfinitos como el límite de los finitos crecientes. Para ello debemos considerar que el concepto de “límite” en el dominio de los números finitos tiene dos características esenciales. Por ejemplo, el número 1 es el límite de los números zn = 1 − n1 , donde n es un número entero variable finito, que rebasa todo límite finito. En primer lugar, la diferencia 1− n1 es una magnitud que se hace infinitamente pequeña; en segundo lugar, 1 es el menor de los números que son mayores que todas las magnitudes zn . Cada una de estas dos propiedades caracteriza al número finito 1 como el límite de la magnitud variable zn .
242
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
Ahora bien, si nosotros queremos extender el concepto de límite también a los límites transfinitos, se utiliza la segunda de las dos características mencionadas; la primera aquí debe dejarse de lado porque solo tiene sentido para límites finitos. De acuerdo con esto, yo llamo ω al límite de los números enteros, finitos, crecientes n, porque ω es el menor de los números que son mayores que todos los números finitos. Sin embargo, ω − n es siempre igual a ω, y entonces no podemos decir que los números crecientes n se acercan tanto como queramos a ω; de hecho cualquier número n, por grande que este sea, se encuentra tan lejos de ω como el menor de los números finitos. Aquí vemos con especial claridad el muy importante hecho de que mi número ordinal transfinito más pequeño ω, y consecuentemente todos los números ordinales mayores, caen fuera de la sucesión interminable 1, 2, 3, . . . Entonces ω no es el máximo de los números finitos, pues tal cosa no existe.110 3) Cantor definió la clase II (Z(ℵ0 ) = Z2 ) como el conjunto de todos los números ordinales numerables. En esta definición se hace uso de un concepto no ordinal, que es la cardinalidad de los conjuntos que componen la clase. ¿Se puede establecer una definición estrictamente ordinal de los elementos de esta clase y de la clase en su conjunto?, en 1905 el matemático norteamericano Oswald Veblen publicó un artículo111 en el que propuso definiciones ordinales para los elementos de cada una de las clases Z(n), Z(ℵ0 ), Z(ℵ1 ), Z(ℵ2 ), Z(ℵ3 ), . . . y para las clases en su conjunto. Es decir, clasificó el tipo de orden común de los conjuntos que componen cada una de las clases, y el tipo de orden específico de las clases como un todo (o lo que es equivalente, del primer elemento en particular de cada una de las clases a partir de la segunda). Por ejemplo, caracterizó a los elementos de la clase I —los conjuntos finitos—, como conjuntos bien-ordenados que cumplen que: a1 ) Todo elemento, excepto el primero tiene un antecesor. b1 ) Tienen un último elemento. La clase I como tal es un conjunto bien-ordenado que cumple a1 ) y :
LOS NÚMEROS ORDINALES
243
b1 ’) No tiene un último elemento (es decir, la negación de b1 )). La caracterización de la clase I corresponde a la caracterización de los conjuntos con tipo de orden ω en general. ¿Cómo quedan caracterizados los elementos de la clase II, —es decir de Z(ℵ0 )—? Son aquellos conjuntos bien-ordenados que no son de la clase anterior y que cumplen, en lugar de las condiciones a1 ) y b1 ), las siguientes: a2 ) Todo elemento excepto el primero tiene un antecesor o es el límite de alguna sucesión fundamental contenida en el conjunto (que podemos identificar con un subconjunto tipo ω). b2 ) Tienen un último elemento o un subconjunto de tipo ω que sobrepasa cualquier elemento que tomemos del conjunto. La clase II como tal es un conjunto bien-ordenado que cumple a2 ) y la negación de b2 ): b2 ’) No existe un último elemento, y toda sucesión fundamental en el conjunto (es decir, todo subconjunto de tipo ω) tiene límite en el conjunto. Dado que ω1 es el número ordinal de la clase II, tenemos entonces que todos los conjuntos con tipo de orden ω1 corresponden a esta última caracterización. Análogamente, los conjuntos de la clase III, —es decir de Z(ℵ1 )—, se caracterizan por ser conjuntos bien-ordenados que no son de la primera ni de la segunda clase, y que cumplen que: a3 ) Todo elemento, excepto el primero, tiene un antecesor, o es el límite de algún subconjunto tipo ω, o es el límite de algún subconjunto tipo ω1 . b3 ) Tienen un último elemento o un subconjunto de tipo ω o de tipo ω1 que sobrepasa cualquier elemento que tomemos del conjunto. La clase III como tal (es decir, el tipo de orden ω2 ) se define por a3 ) y b3 ’), siendo esta última condición la negación de b3 ): b3 ’) No existe un último elemento, todo subconjunto de tipo ω tiene límite dentro del conjunto y todo subconjuntos de tipo ω1 tiene límite dentro del conjunto. Y así sucesivamente. El detalle aquí está en que para trabajar con esta caracterización a partir de la clase III, tendríamos que ampliar
244
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
el concepto de límite, pues en el libro solo lo definimos para las sucesiones fundamentales (que cuando son crecientes coinciden con los conjuntos tipo ω).112 4) En febrero del año 1897, Cesare Burali-Forti, colaborador del matemático italiano Giussepe Peano, publicó el artículo Una questione sui numeri transfiniti en el que demostraba un teorema que decía lo siguiente: Existen números ordinales transfinitos (o tipos de orden) a y b tales que a no es igual a b, no es menor que b y no es mayor que b. De modo que, decía Burali-Forti, los números ordinales no pueden ser ordenados en forma creciente. Lo cual por supuesto contradecía un resultado explícito de Cantor a este respecto[28] y toda la serie de resultados que se desprendían de él. Al respecto, Bertrand Russell señaló que el error de Burali-Forti estaba en suponer que del hecho de que cualquier segmento de números ordinales podía ser bien-ordenado (que era en realidad lo probado por Cantor) se desprendía que la totalidad de los números ordinales era un conjunto bien-ordenado. Pero esta era una cuestión diferente que por lo demás no podía ser verdadera, pues de serlo, a tal totalidad tendría que corresponderle un número ordinal que sería el más grande de todos los ordinales. Pero tal cosa no puede existir, pues él más uno tendría entonces que ser también un ordinal y sería mayor que el más grande de todos los ordinales, lo cual es una contradicción. Russell decía que la afirmación de que la serie de todos los números ordinales está bien-ordenada “[. . . ] no se sigue del hecho de que todos sus segmentos están bien-ordenados, y debe, yo pienso, ser rechazada, pues, hasta donde yo sé, es imposible de ser demostrada”.113 La contradicción así planteada fue conocida como la paradoja de Burali-Forti, aunque inicialmente Burali-Forti no le dio el carácter de una paradoja de la teoría de conjuntos de Cantor en sí. Para Cantor el problema estaba en que la totalidad de los números ordinales era una totalidad inconsistente. En una carta dirigida a Dedekind el 3 de agosto de 1899, escribió lo siguiente:114 [28]
Se trata del teorema (A) que aparece en la página 153 de G. Cantor, 1895-1897.
LOS NÚMEROS ORDINALES
245
Si partimos del concepto de una multiplicidad determinada (un sistema, una colección) de cosas, se me ha hecho evidente la necesidad de distinguir dos tipos de multiplicidades (y me refiero siempre a multiplicidades determinadas). Pues una multiplicidad puede ser de tal naturaleza que el supuesto de una “coexistencia” de todos sus elementos conduzca a una contradicción, de manera que es imposible concebir la multiplicidad como una unidad, como “una cosa disponible”. A tales multiplicidades las denomino multiplicidades absolutamente infinitas o inconsistentes. Resulta fácil convencerse de que, por ejemplo, la “colección de todo lo pensable” es una de esas multiplicidades; más abajo se nos presentarán otros ejemplos. Si en cambio la totalidad de los elementos de una multiplicidad puede ser pensada sin contradicción como “coexistente”, de manera que sea posible reunirlos en “una cosa”, la denomino una multiplicidad consistente o un “conjunto”. [. . . ] Toda submultiplicidad de un conjunto es un conjunto. [. . . ] El sistema Ω de todos los números es una multiplicidad inconsistente, absolutamente infinita. Como podemos observar, sucede con la paradoja de Burali-Forti lo mismo que con la paradoja de Russell: pretender abarcar colecciones demasiado amplias con el concepto de conjunto conduce a contradicciones. El problema se acabó resolviendo con los axiomas de Zermelo-Fraenkel, que se encargaron de delimitar adecuadamente el concepto de conjunto. Obsérvese, por cierto, que la necesidad del “cambio de esquema” (el paso del principio de abstracción ilimitada al principio de abstracción limitada, cuestión a la que hicimos referencia en la pág. 163) adoptado por Zermelo con su definición axiomática del concepto de conjunto, es algo que estaba presente en las propias reflexiones de Cantor sobre el tema.
246
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
5) Todas las construcciones en uso de los números reales (ver sección §6, p. 385) los definen a través de los números racionales, se apoyan en ellos. El análisis de los conjuntos desde la óptica del tipo de orden definido entre sus elementos ofrece otras alternativas. Bertrand Russell, en su libro varias veces aquí citado, Principles of Mathematics, plantea un ejemplo que resulta sumamente original y que ofrece la posibilidad de definir los números reales sin recurrir a los racionales, sin requerir que estos sean construidos con anterioridad sino tan solo apoyándose en los naturales. Veamos el planteamiento de Russell:115 No debe suponerse que la continuidad como fue definida más arriba puede ser ejemplificada solamente, en aritmética, siguiendo el tortuoso camino de los enteros a los racionales y de ahí a los reales. Por el contrario, los enteros en sí mismos pueden servir para ilustrar la continuidad. Considere todos los posibles conjuntos infinitos ordenados de números enteros arreglados de acuerdo al siguiente plan. De dos conjuntos ordenados u y v de los cuales el primer elemento de u es menor que el primer elemento de v, u se coloca primero. Si los primeros n elementos de u y v son idénticos, pero los (n + 1)-ésimos elementos son diferentes, aquel con el (n + 1)-ésimo elemento menor va primero. Esta clase ordenada tiene un primer elemento, que sería la sucesión completa de todos los enteros, pero no tiene un último término. Cualquier segmento que formemos de la clase ordenada, sin embargo, es un conjunto ordenado continuo, como el lector puede fácilmente verificar por sí mismo. Analizaremos la relación de orden sugerida por Russell y a continuación propondremos una de las posibles biyecciones orden-isomorfas que pueden construirse entre los elementos del continuo [0, 1) y el conjunto de subconjuntos infinitos de los números naturales, sin hacer la prueba formal correspondiente. La intención es sobre todo “saborear” el ejemplo de Russell.[29] [29]
La lectura de este desarrollo será más fluida si se tiene presente lo discutido sobre la representación de los números reales con expansiones decimales en la sección §2.9.1, y mejor aun si se puede leer antes lo que se plantea sobre las expansiones base b como
LOS NÚMEROS ORDINALES
247
Sea K = {subconjuntos infinitos de N} (como es usual, ningún elemento del conjunto deberá repetirse en él). Sean A, B ∈ K. Definimos la relación de orden ≺ de acuerdo a la siguiente regla: a) Si el menor elemento de A es menor que el menor elemento de B, entonces A ≺ B.
b) En caso de que los primeros n elementos menores de A coincidan con los primeros n elementos menores de B, y sea hasta el (n + 1)ésimo elemento que ambos conjuntos se diferencian entre sí, si tal elemento de A (el (n + 1)-ésimo) es menor que el correspondiente de B, entonces A ≺ B. (Naturalmente, si todos los elementos de uno y otro conjunto son iguales, ambos conjuntos son el mismo). Convénzanse primero ustedes mismos que K es un conjunto simplemente ordenado (ejercicio 9b). Cualquier subconjunto de N es un conjunto bien-ordenado, pero ¿K es un conjunto bien-ordenado? Veamos: Para empezar, podemos observar que K tiene un primer elemento, que es N mismo; dado cualquier conjunto infinito A ⊂ N distinto de N, tomaríamos el primer natural —llamémosle n0 — que no está en A, y entonces, como n0 sí está en N, la condición (a) hace que N ≺ A.
Sin embargo, K no es un conjunto bien-ordenado. Para convencernos de ello basta con considerar K’ = K \ {N} ⊂ K, el cual no tiene un primer elemento. Si algún conjunto A ∈ K’ pretendiera ser el primer elemento de K’, tomaríamos el primer natural n0 ∈ N \ A (que debe existir, pues N \ A ⊂ N y N es bien-ordenado), y tomamos cualquier conjunto infinito B ⊂ N, B 6= N que incluya a todos los naturales menores o iguales que n0 , y tendremos que B ∈ K’ y B ≺ A, lo cual contradice que A fuese el primer elemento de K’.
Ahora veamos cómo poner en una correspondencia biunívoca el conjunto K con los reales del intervalo [0, 1).
Sabemos que si representamos cualquier elemento del [0, 1) con su expansión binaria, todos aquellos puntos a los que les corresponde modelo de la recta en la sección §6.3.3. (aunque no es estrictamente indispensable).
248
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
una expansión finita tienen dos representaciones posibles cada uno: la finita y la que tiene una cola infinita de 1’s a partir de alguna cifra. Para que la correspondencia sea biunívoca debemos eliminar esta dualidad para todos esos puntos. Pues bien: eliminemos todas las representaciones con colas infinitas de 1’s (en forma análoga a como eliminábamos en la representación con expansiones decimales a todas aquellas expansiones con colas infinitas de 9’s). Así: [0, 1) ←→ B = {0.a1 a2 a3 · · · | ai = 0, 1 ∀ i ∈ N} \ T , donde T = {expansiones binarias con colas infinitas de 1’s}. Entonces establecemos una correspondencia biunívoca entre los elementos de K y los elementos de B, de la siguiente manera:
A cada expansión binaria 0.a1 a2 a3 · · · ∈ B le asociamos el subconjunto de N que incluye a n si an = 0, y no incluye a n si an = 1; eso, ∀ n ∈ N. Como las colas infinitas de 1’s están excluidas, todas las expansiones binarias consideradas tienen una infinidad de ceros =⇒ todo subconjunto de N generado por nuestra regla de correspondencia tiene una infinidad de elementos (es decir, es un elemento de K). Por ejemplo: 0 ←→ N
0.1 ←→ {2, 3, 4, . . . }
0.01 ←→ {1, 3, 4, 5, . . . }
0.010101 . . . ←→ {1, 3, 5, 7, . . . }
0.101010 . . . ←→ {2, 4, 6, 8, . . . }
0.110110110 . . . ←→ {3, 6, 9, 12, . . . } 0.101001000100001 . . . ←→ {2, 4, 5, 7, 8, 9, 11, 12, 13, 14, 16 . . . } 0.11 ←→ {3, 4, 5, 6, . . . }
LOS NÚMEROS ORDINALES
249
Si quisiéramos formular con símbolos nuestra relación biunívoca, una opción podría ser la siguiente: f : B ←→ K,
f (0.a1 a2 a3 . . . ) = A1 ∪ A2 ∪ A3 ∪ . . . , donde Ak =
(
{k} si ak = 0, ∅ si ak = 1.
La regla de correspondencia la podemos razonar también de regreso: dado un subconjunto infinito cualquiera de los naturales, le asociamos la expansión binaria que tiene 0 en el lugar que corresponde a cada natural presente en el conjunto, y 1 en los lugares indicados por los naturales ausentes en el conjunto. 6) Y hablando de ejemplos ingeniosos que se inventan al calor del estudio de los conjuntos desde la óptica de los tipos de orden que pueden establecerse entre sus elementos, hay otro más, propuesto en 1917 por el matemático norteamericano Edward V. Huntington en su libro The continuum and other types of serial order,116 que consiste en lo siguiente: Como señalamos en el punto 1) de estos comentarios finales, el orden usual de los números racionales tiene como una de sus características distintivas que entre cualesquiera dos de sus elementos siempre hay otros más. Los conjuntos con esta propiedad fueron llamados por Cantor conjuntos densos (en sí mismos). Los números racionales están tan pegados unos con otros que si tomamos su derivado (es decir, el conjunto de sus puntos de acumulación) obtenemos el continuo. Resulta difícil imaginar en una reflexión espontánea que si a un conjunto denso le agregamos otro conjunto denso el resultado pueda ser un conjunto no denso (pareciera más bien que debería resultar otro conjunto “más denso aun”). Pero no. A Huntington se le ocurrió un ejemplo sencillísimo que nos muestra que todo depende del tipo de orden que se defina en el conjunto. El ejemplo consiste en lo siguiente: supongamos que tenemos dos conjuntos, A y B, definidos de la siguiente manera: A consta de todos los números racionales en el intervalo (0, 1) que supondremos están pintados de rojo; B consta de todos los racionales en el (0, 1), pero pintados de azul. Nuestro conjunto será A ∪ B, pero con la relación de orden ≺ definida de la siguiente manera:
250
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
a) Si x, y ∈ A ∪ B, y x < y en el sentido usual, entonces x ≺ y, independientemente de cuál sea su color. b) Si el valor numérico de x es igual al de y, entonces es ≺ el que tenga color rojo. ¿Qué ocurre? Que al interpolar los elementos de los dos conjuntos, ambos densos, el conjunto que resulta pierde la densidad, pues todo elemento rojo tiene un inmediato sucesor. 7) ¿Podríamos imaginar que uniendo dos conjuntos continuos su unión podría dejar de ser un continuo? De nuevo, todo depende del orden que definamos al unirlos. Huntington mismo nos brinda el ejemplo, que se construye exactamente con la misma idea del anterior: pensemos ahora en que A = (0, 1) con sus elementos pintados de rojo, y B = (0, 1) con sus elementos pintados de azul, y definamos la misma relación de orden que antes. Lo que obtendremos al interpolar los dos continuos no será un conjunto “más continuo”, como quizás podría pensarse, sino un conjunto que deja de ser continuo, dado que nuevamente todo elemento rojo tiene un inmediato sucesor y el conjunto final entonces ni siquiera resulta denso.117 8) En la sección §4.2.1 comentamos ampliamente acerca de la búsqueda de Cantor de generar conjuntos de puntos cada vez más concentrados, en su intento por tender un puente que permitiera transitar “suavemente” del infinito de los naturales al infinito del continuo. Este esfuerzo dejó sembrados en el camino una serie de conceptos que habrían de florecer más adelante como toda otra rama de la matemática de la mayor trascendencia, que es la topología. Conceptos como los de conjuntos densos en sí mismos, densos en otros, densos en todas partes; conjuntos cerrados, perfectos, conexos, puntos límite, salen a la luz uno tras otro en el trabajo de Cantor, agolpándose casi para encontrar su lugar en la matemática. Poco después, matemáticos como Félix Hausdorff llevaron las ideas topológicas en ciernes en el trabajo de Cantor hasta límites de generalidad que permitieron ampliar el panorama de la matemática de una manera impresionante.
4.3.
Tres breves comentarios finales sobre la HC
o La generalización de Cantor de la HC comenzó en 1883, con la proposición de que el conjunto de todas las funciones reales tiene la tercera
TRES BREVES COMENTARIOS FINALES SOBRE LA HC
251
potencia infinita (ℵ2 ), lo cual implicaba que 2ℵ1 = ℵ2 . Él no planteó una forma más general de la HC, quizás porque no le veía uso. La hipótesis generalizada del continuo (HGC) mencionada, que establece que 2ℵα = ℵα+1 para todo ordinal α, fue en realidad formulada por primera vez como tal por el matemático alemán Felix Hausdorff (1868-1942) en 1908, y le fue dado ese nombre por el matemático y lógico polaco Alfred Tarski(1901-1983) en 1925.118 o En 1934, el matemático polaco Waclaw Franciszek Sierpiński (18821969), autor de los conocidos fractales que llevan su nombre (el triángulo, la carpeta y la curva de Sierpiński) —y a quien ya hemos citado en diversas ocasiones en el texto— publicó el libro Hypothese du continu, en el cual hace un estudio exhaustivo de las consecuencias de la HC. En el primer capítulo de la obra prueba la equivalencia entre la HC y 11 propiedades que a primera vista no parecen guardar relación alguna con ella. En los capítulos del 2 al 6 muestra 82 consecuencias de la HC, y en el 7 expone formas alternativas de enunciar la HGC y algunos resultados relacionados con ella. Entre las propiedades equivalentes a la HC que formula, están por ejemplo las siguientes: P1: El plano se puede expresar como la unión de dos conjuntos A y B, donde A es finito o numerable en su intersección con cualquier recta vertical, y a su vez, B es finito o numerable en su intersección con cualquier recta horizontal. P2: El plano se puede expresar como la unión de una familia numerable de curvas, donde por una curva entiende la gráfica de una función inyectiva con dominio el eje X o bien el eje Y . Jueguen un poco a imaginarse los conjuntos A y B de la P1, o las curvas de la P2, para percibir que el asunto no es inmediato.[30] o Sobre la relación entre la HC y el AE. Una consecuencia del resultado demostrado por Cohen en 1963 es que siendo verdadero el AE, la HC puede ser falsa. Es decir, el AE no garantiza la HC. Se podría
[30]
En otro trabajo que también hemos citado en varias ocasiones en este libro,119 Sierpiński hace el siguiente comentario: “No es nada fácil probar que el plano no es la unión de una familia finita de curvas: fue probado en 1933 por S. Mazurkiewicz”. Se trata de una propiedad que a primera vista pudiera parecer que debe ser evidente, pero ya vemos que no es así.
252
LA HIPÓTESIS DEL CONTINUO Y LOS NÚMEROS ORDINALES
pensar que se trata de dos propiedades independientes, pero no, pues desde 1947120 el mismo W. Sierpiński ya había probado que La Hipótesis General del Continuo (HGC) =⇒ El Axioma de Elección (AE).
4.4.
Ejercicios
1. Considerando los incisos 1 ’), 1 ”) y 2 ) de la definición dada del concepto de conjunto simplemente ordenado (ver pág. 109), den ejemplos originales de conjuntos con una relación de orden definida entre sus elementos, pero que no sean simplemente ordenados debido a que falla alguna de las tres condiciones, considerando todas las posibilidades (en las que fallando una no fallen las otras dos y en las que fallando dos, no falle la tercera). 2. Prueben las siguientes propiedades de conjuntos bien-ordenados: a) Si A≺ es un conjunto bien-ordenado y A’⊆ A, entonces A’≺ es un conjunto bien-ordenado. b) Si A≺ es un conjunto bien-ordenado y B≺∗ ' A≺ entonces B≺∗ es un conjunto bien-ordenado. c) Si en un conjunto bien-ordenado G≺ sustituimos cada uno sus elementos por conjuntos bien-ordenados, de manera que si Fx y Fy son los conjuntos que sustituyen a los elementos x y y, y x ≺ y ⇒ Fx ≺ Fy , entonces el conjunto H obtenido agrupando de esta manera los elementos de todos los conjuntos Fx , es bien-ordenado. Nota: La relación ordinal ≺ establecida entre los elementos de un conjunto ordenado se extiende a conjuntos de elementos de la siguiente manera: M ≺ N significa que todos los elementos de M preceden a todos los elementos de N . 3. Se define la resta entre números ordinales de la siguiente manera: Si α ≺ β, definimos ξ = β − α como el número ordinal (tipo de orden) que es solución de la ecuación α + ξ = β. Es decir, β − α es un tipo de orden que colocado a continuación de α produce β. Pero
253
EJERCICIOS
la ecuación ξ + α = β a veces no tendrá solución y otras veces tendrá una infinidad de soluciones. Den ejemplos correspondientes a cada situación. 2
4. Construyan un conjunto con tipo de orden ω ω . 5. a) Razonen la validez de las siguientes propiedades de las operaciones entre números ordinales: i) ii) iii) iv) v)
α(β + γ) = αβ + αγ. α(βγ) = (αβ)γ. µα µβ = µα+β . (µα )β = µαβ . 1 · α = α · 1.
b) Demuestren, dando contraejemplos, que no se verifican las siguientes propiedades en general: i) (α + β)γ = αγ + βγ. ii) (αβ)2 = α2 β 2 . 6. Demuestren que cualquier intervalo (a, b) en R es orden-isomorfo con todo R con el orden usual. 7. Demuestren que puede definirse un orden en R2 con el cual R ' R2 , estando R ordenado con el orden usual. 8. Un teorema de Z. Chajoth dice lo siguiente: “En todo conjunto infinito ordenado podemos cambiar de lugar un elemento de forma que al hacerlo cambie el tipo de orden”. Den ejemplos de diversos conjuntos ordenados y bien-ordenados que confirmen la validez del teorema. 9. a) Demuestren que Z1 ∪ Z2 ' Z2 .
b) Demuestren que el ejemplo del conjunto K que introdujimos en el punto 5 de la sección §4.2.8 es un conjunto simplemente ordenado.
10. Demostrar que el conjunto formado por la unión de las sucesiones {1 − n1 }, {1 + n1 } y {3 − n1 }, con el orden de magnitud, cumple con tener un primer elemento y cada elemento tiene un sucesor y un antecesor (excepto el primero). Sin embargo, se trata de un orden distinto a ω. ¿Cuál es su tipo de orden?
Parte II
Los reales
Capítulo 5
Los reales, lo cuántico y el continuo 5.1.
Lo cuántico en la física y el continuo en la matemática
El 14 de diciembre de 1900, en una reunión de la Sociedad Alemana de Física, Max Planck (1858-1947) planteó que un conocido resultado erróneo que se obtenía al aplicar las leyes de la termodinámica al cálculo de la intensidad de la radiación emitida por un cuerpo caliente, podía corregirse si se abandonaba el supuesto clásico de que la emisión de energía ocurría en forma continua, y se partía en su lugar de la hipótesis —no considerada antes— de que la energía era transportada por las ondas electromagnéticas en forma discreta a través de pequeños “paquetes” a los que dio el nombre de cuantos de energía (quantum-quanta en latín —singular y plural respectivamente—). De modo que la cantidad de energía transmitida por una onda era un número entero de veces una unidad mínima de energía contenida en cada paquete, la cual a su vez era proporcional a la frecuencia de la onda (a mayor frecuencia mayor energía por paquete). La constante de proporcionalidad correspondiente —identificada con la letra }, que recibe el nombre de constante de Planck— se mostró como una de las constantes fundamentales de la naturaleza. Los cálculos a partir de esta hipótesis fueron coincidiendo en forma precisa con los resultados experimentales. Este descubrimiento le valió a Planck el premio Nobel de física en el año 1918.
257
258
LOS REALES, LO CUÁNTICO Y EL CONTINUO
En 1905, un hasta entonces desconocido empleado de patentes de la ciudad de Berna, capital de Suiza, publicó cinco artículos que hicieron historia en el mundo de la física. Dos de ellos, en los que presentó su teoría de relatividad especial que algunos años después llevó más lejos con su teoría de relatividad general. Otro, proponiendo una explicación del movimiento azaroso de partículas suspendidas en un líquido, que es generalmente reconocido como la prueba final de la existencia de los átomos; otro más, desarrollando un método propio para determinar las dimensiones de las moléculas; y el último —en realidad el primero de los cinco— que llevó las ideas de Planck al análisis de la luz y su interacción con los electrones de una lámina de metal, sugiriendo que los objetos calientes no son los únicos que emiten radiación en paquetes de energía, sino que la luz misma, y de hecho toda la radiación, consiste en múltiplos de paquetes de energía;121 abriendo con ello definitivamente las puertas al desarrollo de la teoría cuántica iniciada por Planck, por lo que obtuvo en 1921 el premio Nobel. 1905 fue el año estelar del físico teórico de origen alemán Albert Einstein (1879-1955). Tiempo después, en 1923, el físico francés Louis de Broglie (18921987, premio Nobel 1929) sugirió que la dualidad onda-partícula era aplicable no solo a la luz, sino a toda la materia en general. Los cuantos asociados con los rayos de luz deberían verse como una clase de partículas elementales a las que hoy se conoce como fotones.122 Citando al físico norteamericano Richard Feynman (1918-1988): “Las cosas que solemos considerar como ondas se comportan también como partículas, y las partículas se comportan como ondas; de hecho, todas las cosas se comportan de la misma forma. No hay distinción entre una onda y una partícula”.123 La polémica sobre la naturaleza de la luz venía de mucho tiempo atrás. Newton la concebía compuesta por pequeños corpúsculos o partículas de materia, mientras que otros importantes personajes de su época —como el físico holandés Christian Huygens— consideraban que más bien se trataba de una onda. La controversia se resolvió temporalmente a favor de estos últimos muchos años después, cuando a principios del siglo xix el físico inglés Thomas Young (1773-1829) presentó una serie de experimentos en los que se mostraba la indudable cualidad de onda de la luz. Sin embargo, el descubrimiento de Einstein puso sobre la mesa otra vez la discusión, dándole una solución diferente: la luz era las dos cosas, estaba compuesta por una nube de pequeñas partículas —los fotones—
LO CUÁNTICO EN LA FÍSICA Y EL CONTINUO EN LA MATEMÁTICA
259
cuya energía era proporcional a la frecuencia de la onda —relacionada con el color de la luz—, siendo la constante de proporcionalidad la misma propuesta por Planck; estas partículas a su vez eran capaces de transferir toda su energía a un electrón. o De modo que el siglo xx abrió con dos grandes teorías que cambiaron radicalmente nuestra percepción sobre el mundo físico: la relatividad y la cuántica. Una, en relación con el espacio y el tiempo; y la otra respecto de la materia y la radiación. Una teoría trata de explicar el comportamiento de lo muy grande —y con mucha velocidad y mucha masa—, y la otra de lo extremadamente pequeño. Ambas han demostrado ser extraordinariamente efectivas y sorprendentemente precisas en su propio ámbito, pero resultan incompatibles entre sí, pues se basan en suposiciones contradictorias. Durante varias décadas se ha buscado hacer un planteamiento que sea coherente con ambas teorías, sin haberlo conseguido hasta ahora (particularmente, entre la relatividad general y la mecánica cuántica). Este es para algunos físicos el problema central de la física contemporánea. Pero hay otro problema adicional que plantea que aún hay mucho camino por andar, particularmente en el caso de la física cuántica, ya que de ella se desprenden diversas consecuencias que no dejan de resultar extrañas, muy difíciles de comprender y de aceptar. Algunos ejemplos son los siguientes: a) La idea de que en todo momento una partícula tiene una posición y una velocidad definidas aquí no se cumple, debido a que en el micromundo vale el llamado principio de incertidumbre, planteado en 1927 por el físico alemán Werner Heisenberg (1901-1976), premio Nobel en 1932, que expresa que si se sabe la posición, no es posible saber con precisión la velocidad, y viceversa. Pero no como algo producto de las limitaciones de los instrumentos para hacer las mediciones adecuadas, sino como algo teóricamente imposible de resolverse.[1] b) A contrapelo de lo que se consideraba como uno de los requisitos fundamentales de la ciencia, de que en un experimento bajo las mismas condiciones debe siempre suceder lo mismo, aquí resulta que no siempre es así: es fundamentalmente imposible hacer una predicción precisa de qué sucederá exactamente en un experimento dado, y lo único posible es [1] Aunque se trata de dos cosas distintas, no deja de percibirse un aire de familiaridad entre este resultado y el principio de incompletez probado en el terreno de la lógica por Göedel apenas tres años después (ver pág. 199).
260
LOS REALES, LO CUÁNTICO Y EL CONTINUO
encontrar un promedio estadístico de lo que va a suceder (y los diversos momentos de la distribución de probabilidad).124[2] c) Cuando un fotón choca con un átomo, haciendo saltar un electrón a una órbita más elevada, el electrón se mueve de la órbita inferior a la superior instantáneamente, sin atravesar el espacio intermedio. Los mismos radios orbitales están cuantizados, y el electrón simplemente deja de existir en un punto para aparecer simultáneamente en el otro.127 . Un objeto puede manifestarse en diversos lugares al mismo tiempo.128 d) Al pasar un rayo de luz por una rendija perforada en una lámina intermedia y proyectarlo en una placa fotográfica, se graba una imagen. Si la lámina intermedia tiene dos rendijas paralelas en lugar de una, no se proyecta la imagen anterior “duplicada”, sino todo un espectro de luces y sombras. Esto sorprendió en su momento, pero siendo la luz una onda, resulta coherente. Y también puede tener coherencia pensando en la luz como partículas, si se considera que se trata de un gran número de fotones desplazándose conjuntamente. Lo extraño es que sucede lo mismo aun si los fotones son lanzados uno por uno, dejando pasar un tiempo significativo entre cada lanzamiento; la imagen que queda grabada no es la de los fotones enviados por una rendija primero y por otra después, sino que se reproduce el mismo patrón de interferencias que en el caso de un gran flujo de ellos lanzados simultáneamente por las dos rendijas. Como si al estar abiertas las dos rendijas, en el espacio quedaran automáticamente marcadas las rutas que habrían de seguir los fotones que pasaran por una y otra rendija, con la intensidad que les corresponde por cada trayectoria posible.129 Un destacado teórico danés de la física cuántica, premio Nobel en 1922, Niels Bohr (1885-1962), dijo alguna vez que: [2]
Einstein no terminó de convencerse de la validez de estos resultados. En diversas cartas escritas a su amigo Max Born expresa su desacuerdo: “Hallo totalmente intolerable la idea de que un electrón expuesto a la radiación elija por su propio arbitrio, no solo su momento para saltar, sino también su dirección”. “La mecánica cuántica ciertamente es imponente, pero una voz interior me dice que no es lo real. La teoría dice mucho, pero no nos acerca verdaderamente al secreto de “el viejo”. Yo, al menos, estoy convencido de que Él no juega a los dados.” “Estoy plenamente convencido de que alguien, con el tiempo, dará con una teoría cuyos objetos, vinculados por leyes, no sean probabilidades, sino hechos considerados”.125 Al respecto, Stephen Hawking ha dicho que en este punto “Einstein estaba confundido, no la teoría cuántica”.126
LO CUÁNTICO EN LA FÍSICA Y EL CONTINUO EN LA MATEMÁTICA
261
Si alguien dice que puede pensar en los problemas cuánticos sin sentir vértigo, esto solo demuestra que no ha comprendido lo más elemental de ellos.130 R. Feynman, quien también obtuvo el premio Nobel en 1965, escribió al respecto: Hubo una época que en los periódicos decían que solo doce hombres comprendían la teoría de relatividad. No creo que existiera una época así. Podría haber existido una época en que tan solo un hombre comprendiera dicha teoría, antes de publicarla, porque fuera el único que había caído en cuenta de que las cosas podían ser así. Pero, después de que los demás leyeran su publicación, muchas personas comprendieron, de una forma o de otra, la teoría de la relatividad. Seguramente más de doce. Por otra parte, creo que puedo afirmar, sin riesgo de equivocarme, que nadie comprende la mecánica cuántica.131 o El desarrollo de la física cuántica también trajo consigo una discusión acerca de las características del espacio y el tiempo, en el sentido de que todo parecía indicar que ambos tenían más bien una naturaleza discreta y no continua, como se había considerado desde la época de los griegos; y junto con ello, una discusión acerca de que las nuevas teorías físicas demandan una matemática distinta; que el cálculo, construido sobre la base del continuo, debía ceder su lugar al desarrollo de las matemáticas discretas para adecuarse a las nuevas necesidades de la física. Naturalmente que esto ha generado polémica, aun entre los mismos físicos. A manera de muestra, citaremos algunos argumentos en una y otra dirección. En el libro Infinity: New Research Frontiers, publicado recientemente (2011) por Michael Heller y W. Hugh Woodin, doce investigadores de distintas especialidades y de diferentes países, ofrecen un panorama de la discusión actual en torno al infinito en diversas áreas del conocimiento. En uno de los artículos, que lleva por nombre Some Considerations on Infinity in Physics, el investigador Carlo Rovelli plantea lo siguiente: [Hay] dos problemas clásicos donde el infinito ha sido discutido al paso del tiempo: la divisibilidad infinita del espacio y
262
LOS REALES, LO CUÁNTICO Y EL CONTINUO
la extensión infinita del espacio físico, es decir, infinito en lo pequeño y en lo grande. Las dos disciplinas que usualmente tratan estos problemas en la física son la gravedad cuántica y la cosmología. [. . . ] Si nos apoyamos en la teoría cuántica y la teoría de la relatividad, estamos obligados a concluir que el espacio, siendo una entidad con propiedades dinámicas como el campo electromagnético, está también hecho en sí mismo de pequeños “cuantos”. En otras palabras, para nuestro mejor conocimiento del mundo natural, es suficientemente probable que el espacio no sea infinitamente divisible. [. . . ] Este reemplazo de una estructura continua por una estructura discreta es típico de la evolución de la ciencia en el último siglo. El ejemplo más característico es el descubrimiento de la estructura atómica de la materia. El agua en un vaso, o el aire en un cuarto se nos presenta como un continuo infinitamente divisible. Hemos aprendido en el último siglo que este continuo aparente es en realidad un agregado de átomos discretos, y en la actualidad estamos bien acostumbrados a ello. La cantidad de agua en el vaso es, finalmente, el número de átomos en el vaso.132 El volumen 137 de la serie de libros Advances in Imaging and Electron Physics, publicado en 2005, lleva por nombre Dogma of the Continuum and the Calculus of Finite Differences in Quantum Physics. En él, los autores Henning F. Harmuth y Beate Meffert, plantean lo siguiente: Una tercera gran sombra sobre el desarrollo de la física ha sido impuesta por el dogma del continuo del espacio físico y el tiempo (siendo las dos primeras “sombras” el círculo y la geometría Euclidiana, según los autores). Desde los argumentos de Aristóteles contra Zenón, la física del espacio y el tiempo se convirtió en una rama de las matemáticas. [. . . ] Cuando mencionamos espacio y tiempo ya no estamos en matemáticas sino en física, y requerimos que un concepto
LO CUÁNTICO EN LA FÍSICA Y EL CONTINUO EN LA MATEMÁTICA
263
como “el continuo espacio-tiempo” sea algo observable. Si pudiéramos observar algo en la posición x y algo más en x + dx o al tiempo t y t + dt, podríamos probar la existencia de un continuo espacio-tiempo por observación. Pero uno no esperaría que cualquiera que propusiera una prueba así fuese tomado en serio. Una resolución espacial dx o un tiempo resolución dt no es más observable que el número de ángeles que pueden danzar en la punta de un alfiler. ¿Cómo llegamos a esta situación en la que algunos de los conceptos más básicos de la física son inherentemente no observables? ¡Tratamos a la física como una rama de las matemáticas! Esto era aceptable en los tiempos de los antiguos griegos. Pero en la actualidad reconocemos a las matemáticas como una ciencia de lo pensable y a la física como una ciencia de lo observable. No pueden ya ser la una respecto de la otra más que una herramienta o una fuente de inspiración. [. . . ] El cálculo de diferencias finitas precede al cálculo diferencial, ya que las diferenciales son obtenidas como límites de diferencias finitas [. . . ] Si queremos usar diferencias finitas (∆x, ∆t) en lugar de diferenciales (dx, dt), debemos utilizar el cálculo de diferencias finitas en lugar del cálculo diferencial. Es una verdadera generalización, pues no se especifican valores iniciales para ∆x y ∆t al comienzo de los cálculos. En la física cuántica relativista se trabaja con ello [. . . ] El cálculo de diferencias ofrece claramente la mejor opción.133 Por contraste con estos planteamientos, la posición de Stephen Hawking ha sido tajante desde hace mucho tiempo (el subrayado es nuestro): Yo asumo el punto de vista positivista de que una teoría física es solo un modelo matemático y que no tiene sentido preguntarse si corresponde a la realidad. Todo lo que uno se puede preguntar es si sus predicciones están de acuerdo con la observación. Aunque ha habido sugerencias de que el espacio-tiempo puede tener una estructura discreta, no veo razón para abandonar las teorías continuas que han sido tan exitosas. La relatividad general es una teoría hermosa que concuerda con todas las observaciones que se han hecho.
264
LOS REALES, LO CUÁNTICO Y EL CONTINUO
Puede requerir modificaciones en la escala de Planck, pero eso no creo que afecte muchas de las predicciones que pueden ser obtenidas de ella.134 En realidad, la idea de que quizás se estaba ante un momento en el que la matemática discreta fuese una alternativa más acorde con las necesidades planteadas por los nuevos avances de la física, aparece desde las primeras décadas de desarrollo de la física cuántica. Por ejemplo, el físico alemán Erwin Schrödinger (1887-1961), premio Nobel en 1933, planteaba en 1956: No debemos admitir la posibilidad de una observación continua... La idea de un rango continuo, tan familiar para los matemáticos en nuestros días, resulta exorbitante, una extrapolación enorme de lo que es realmente accesible para nosotros.135 Einstein mismo, un año antes, había señalado lo siguiente: Se pueden dar buenas razones por las que la realidad no puede representarse como un campo continuo [. . . ] Los fenómenos cuánticos [. . . ] deben llevar a un intento de encontrar una teoría puramente algebraica para la descripción de la realidad. Pero nadie sabe cómo obtener la base de una teoría semejante.136 Roger Penrose, en su extensa obra El camino hacia la realidad publicada en 2004, le dedica un espacio mayor a esta reflexión. Citaremos tan solo dos breves fragmentos de sus conclusiones al respecto (los subrayados son nuestros): Pese a todo, podemos seguir preguntándonos si el sistema de los números reales es realmente “correcto” para la descripción de la realidad física en sus niveles más profundos. Cuando empezaron a introducirse las ideas mecanicocuánticas a comienzos del siglo xx, existía la sensación de que quizá entonces empezábamos a ser testigos de una naturaleza discreta o granular del mundo físico en sus escalas más pequeñas [. . . ] Por ello, varios físicos intentaron construir una imagen alternativa del mundo en la que procesos discretos gobernaban todas las acciones en los niveles más ínfimos.
LOS REALES EN EL CÁLCULO
265
Sin embargo, tal y como ahora entendemos la mecánica cuántica, esta teoría no nos obliga (ni siquiera nos lleva) a la idea de que hay una naturaleza discreta o granular para el espacio, el tiempo, o la energía en sus niveles más ínfimos [. . . ]137 en las teorías exitosas de nuestros días consideramos el espaciotiempo continuo aun cuando están involucrados conceptos cuánticos, y las ideas que implican discretización a pequeña escala deben considerarse “poco convencionales”. El continuo sigue siendo un protagonista esencial incluso en aquellas teorías que intentan aplicar las ideas de la mecánica cuántica a la propia estructura del espacio y el tiempo.138 Todo indica que habrá continuo y habrá números reales por mucho tiempo más en la matemática y en la física. Resulta difícil imaginar que después de veinticuatro siglos de desarrollo, de repente se llegara a la conclusión de que no son más la alternativa. Los autores del libro citado sobre el cálculo de diferencias finitas —una de las variantes de la matemática discreta— en la física cuántica, se lamentan en su introducción porque, señalan, en una investigación que hicieron de los libros en inglés, francés, alemán, ruso y español, solo encontraron “10 libros matemáticos del cálculo en diferencias finitas publicados durante el siglo xx”.139 No parece haber, por el momento, una convicción en el propio mundo de la física —menos aun en el de la matemática— de que ahí está el obstáculo a remontar para lograr que las cosas avancen. A juzgar por el panorama que ofrecen varios de los autores mencionados en la bibliografía y citados a lo largo de esta sección, pareciera ser que por ahora el problema está más bien en el terreno de comprender, darle una coherencia global a la interpretación de un sinnúmero de resultados particulares asombrosamente precisos. Por supuesto, esto sin menoscabo de que habrá también estructuras matemáticas nuevas, y paradigmas nuevos dentro de las existentes, que ayudarán a entender mejor el mundo físico, entre otras cosas.
5.2.
Los reales en el cálculo
Si sacamos la cuenta del tiempo que tomó al hombre precisar el concepto de número real, la historia corre desde el siglo vi a. n. e., cuando los pitagóricos descubrieron que había magnitudes inconmensurables, hasta finales del siglo xix, en que Weierstrass, Méray, Heine, Cantor y Dede-
266
LOS REALES, LO CUÁNTICO Y EL CONTINUO
kind resolvieron la cuestión por caminos alternativos. Más de veintitrés siglos. Hemos visto que los números racionales tapizan la recta, en el sentido de que en cualquier pedacito suyo podemos contar con tantos como hagan falta. Es posible aproximarse con ellos cuanto sea necesario al punto que escojamos. Se pueden sumar, restar, multiplicar y dividir tan fácilmente que lo aprendemos a hacer casi desde la primaria. Las operaciones cumplen todas las propiedades esperables y en cualquier momento podemos llevar nuestros razonamientos al terreno geométrico sin mayor dificultad, de suerte que el apego de los procedimientos formales a la intuición es casi inmediato. ¿Por qué entonces, si resulta un conjunto de números tan versátil y práctico, fue necesario recurrir a otro tipo de números bastante más difíciles de definir como los reales? Precisamente lo ocurrido a los pitagóricos nos muestra una primera razón: hasta los trazos geométricos más sencillos (como la obtención de la hipotenusa de un triángulo) conducen a magnitudes no representables por los números racionales. o Pero al surgir el cálculo, la necesidad de los números reales adquirió mucha más relevancia: cuando Bolzano demostró una importante propiedad de las funciones continuas en un intervalo cerrado —que consistía en que siendo negativa la función en un extremo del intervalo y positiva en el otro, necesariamente debía existir un punto en el que valiese cero— se tropezó con la dificultad de que el paso clave en la demostración dependía de utilizar alguna propiedad que garantizara la continuidad de la recta (y que en el fondo era equivalente a lo que quería demostrar). ¿Por qué sucedía esto? Porque la propiedad misma no era válida si el dominio de la función no fuese un continuo, si tuviese algún “hoyo”. Pensemos, por ejemplo, que nuestro universo fuesen los racionales, y la función fuera la parábola f : [0, 2] ∩ Q → Q , f (x) = x2 − 2 =⇒ f (0) = −2 < 0 < 2 = f (2); sin embargo, no existe ningún punto en √ el dominio en el que la función valga cero: quien podría serlo, sería 2, pero el dominio ahí está perforado (ver figura 5.1). Basta con que los números reales dejen un punto de la recta sin cubrir para que el resultado se venga abajo, pues al no estar definida la función en ese punto, tendría ella misma un punto ausente en su gráfica. ¿Qué puede suceder?, que el orificio de la gráfica esté justo en el cruce con el eje X (ver figura 5.2), de manera que pasaría de ser negativa a
LOS REALES EN EL CÁLCULO
267
ser positiva sin valer cero nunca (y esto siendo continua en el dominio en que quedó definida, pues al acercarnos a cualquier punto de él —con puntos también de él— los valores de la función siempre tienden a su valor en el punto).
(a)
En [0, 2]R = [0, 2]: √ f ( 2) = 0
(b)
En [0, 2]Q = [0, 2] ∩ Q:
@ ξ ∈ [0, 2]Q tal que f (ξ) = 0.
Figura 5.1: La función f (x) = x2 − 2 y el teorema de Bolzano.
(a) ∃ ξ ∈ (a, b) tal que f (ξ) = 0
(b) @ ξ ∈ (a, b) tal que f (ξ) = 0
Figura 5.2: El teorema de Bolzano.
o Este caso ejemplifica el problema principal. Hay una variedad de resultados que juegan un papel crucial en toda la estructura del cálculo y que no serían verdaderos si fueran enunciados sobre una recta no continua, con “hoyos”. Algunos ejemplos (además del teorema de Bolzano), son: ? El teorema de Weierstrass, que dice que toda función continua en un intervalo cerrado alcanza su máximo y su mínimo. Si los reales dejaran
268
LOS REALES, LO CUÁNTICO Y EL CONTINUO
un punto del intervalo [a, b] sin cubrir, se podría producir un hoyo en la imagen —y en la gráfica— que dejara sin máximo a la función (ver figura 5.3).
(a) f alcanza su máximo en ξ
(b)
f no tiene máximo
Figura 5.3: El teorema de Weierstrass.
Es lo que sucede por ejemplo con la función f : [0, 2]∩Q → Q, f (x) = 3 x− x6 . Si el universo en que estuviera sumergido el dominio fuesen todos √ los reales, alcanzaría su máximo en 2, pero restringido todo al campo ordenado Q (lo cual no la hace discontinua en ningún punto de Q), no habría un máximo valor de la función: habría, coloquialmente hablando, un “hoyo” en su lugar (ver figura 5.4).
(a)
En [0, 2]R = [0, 2]: √ f ( 2) es máximo
Figura 5.4: La función f (x) = x −
(b)
En [0, 2]Q = [0, 2] ∩ Q: f no tiene máximo
x3 y el teorema de Weierstrass. 6
? El teorema del valor medio de Lagrange para la derivada (TVMD), que dice que si una función es derivable en un intervalo cerrado (es decir, con recta tangente bien definida en todos los puntos de la gráfica que corresponden a tal intervalo), siempre existirá un punto en el que
LOS REALES EN EL CÁLCULO
269
la tangente sea paralela a la secante que une los extremos de la gráfica. De nuevo: bastaría con que el dominio estuviese perforado en un punto para que esta propiedad dejara de ser válida (ver figura 5.5).
(a) mtan = f 0 (ξ) =
f (b)−f (a) b−a
= msec
(b) En ningún punto la tangente es paralela a la secante.
Figura 5.5: El teorema del valor medio para la derivada (TVM-D).
Un ejemplo es la función f : [0, 1]∩Q → Q, f (x) = x3 . No hay ningún punto en su dominio en el que la recta tangente a la gráfica sea paralela a la secante que une sus extremos; lo habría si el dominio incluyera a todos los reales (el punto sería ξ = √13 , pues la pendiente de la recta
1 tangente a la gráfica en (ξ, f (ξ)) = ( √13 , 3√ ) vale 1, que coincide con el 3 valor de la pendiente de la secante que une los extremos (0, 0) y (1, 1)), pero el punto desaparece al restringir el universo a Q (pues ξ = √13 no es racional) (ver figura 5.6).
(a)
En [0, 1]R = [0, 1]: mtan = f
0
√1 3
= 1 = msec
(b)
En [0, 1]Q = [0, 1] ∩ Q: No existe ningún punto en que la tangente y la secante sean paralelas.
Figura 5.6: La función f (x) = x3 y el TVM-D.
270
LOS REALES, LO CUÁNTICO Y EL CONTINUO
? El teorema del valor medio para la integral, que dice que si una función es continua en un intervalo cerrado, siempre encontraremos un punto en el que, evaluando la función en él, obtenemos la altura de un rectángulo con base en el intervalo cuya área es igual al área por debajo de la gráfica de la función (la integral). Lo mismo: un solo orificio podría dar al traste con el resultado (ver figura 5.7).
Rb
(a) a
(b)
f = f (ξ)(b − a)
@ ξ ∈ [a, b] tal que f (ξ)(b − a) =
Rb a
f
Figura 5.7: Teorema del valor medio para la integral (TVM-I).
Como ejemplo particular podríamos pensar en la función f : [0, 1] ∩ Q → Q, f (x) = x2 : el área bajo esta parábola coincide con la del rectángulo con base en el intervalo [0, 1] y altura f ( √13 ) = 31 ; pero tal valor de
la función no existe, pues
√1 3
es irracional (ver figura 5.8).
LOS REALES EN EL CÁLCULO
(a)
En [0, 1]R = [0, 1]:
R1 0
f =f
√1 3
(1 − 0)
(b)
271
En [0, 1]Q = [0, 1] ∩ Q: @ ξ ∈ [0, 1]Q tal que
R1 0
f = f (ξ)(1 − 0).
Figura 5.8: La función f (x) = x2 y el TVM-I.
o Todos los casos anteriores no son resultados menores: son resultados esenciales sobre los que se levantan muchos otros. Y son solo algunos. Por lo demás, aunque trabajar con los racionales, o más aun con los enteros, desde el punto de vista lógico parece mucho más sencillo que hacerlo con los reales, esto es engañoso, pues depende de la situación. Si lo que se quiere es resolver una ecuación diofantina, por ejemplo (ecuaciones con soluciones enteras), las más de las veces resulta tan difícil hacerlo que a lo que se recurre es precisamente a sumergir los enteros en los racionales y estos a su vez en los reales (o incluso los complejos), para aplicar la herramienta construida con ellos, muchísimo más versátil, y luego sobre esa base emprender el regreso a la búsqueda de las soluciones enteras. La continuidad de la recta es fundamental para el cálculo. Pero entendámonos: no se trata de afirmar que la recta es continua, porque después de todo, la recta es una idea abstracta: somos nosotros los que la definimos. Nadie ha visto nunca una recta, y hay quien la puede imaginar irremediablemente perforada y quien la pueda imaginar continua. Pero ese no es el punto. El punto es si queremos modelar una recta continua o una discontinua. Suponiendo lo primero, el cálculo ha construido un modelo matemático para representarla (los números reales) y con eso ha desarrollado una herramienta formidable para resolver una amplia variedad de problemas (incluso, discretos).
Capítulo 6
Las expansiones decimales como modelo del continuo Entraremos ya en materia a modelar la recta, imagen geométrica del continuo por excelencia. De hecho, ya empezamos a hacerlo. La lectura de este capítulo se debe comenzar leyendo la primera parte de la sección §2.9, en donde representamos los puntos de la recta con las expansiones decimales finitas e infinitas, excluidas las colas de 9’s (y acaso el apéndice A de definiciones preliminares para consultar los conceptos que sean necesarios). Este será nuestro primer modelo del continuo, nuestra primera alternativa de definición de los números reales. Veremos cómo diferenciar a los racionales de los irracionales entre las expansiones decimales, cómo generar fácilmente infinidades de irracionales, que parecían tan difíciles de encontrar. Veremos también cómo funcionan las representaciones de los puntos de la recta con expansiones en otras bases. Después se regresará a definir el orden, la suma y analizar la dificultad que surge al intentar definir un algoritmo para multiplicar las expansiones decimales. Esto conduce a una discusión sobre las ventajas y desventajas de este modelo, lo cual a su vez plantea la necesidad de construir otro —en el siguiente capítulo— cualitativamente distinto, no tanto a partir de asignar un cierto tipo de número a cada punto de la recta, sino de identificar un conjunto de propiedades que se cumplan con el orden, la suma y el producto definidos geométricamente en la recta, y que sean tan relevantes que podamos decir que si un conjunto de objetos cumple esas propiedades, necesariamente tendría que ser como la recta. Es decir, caracterizaremos a la recta en términos de las propiedades 273
274
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
que se cumplen al operar en ella, no tanto en términos de qué números particulares representan a cada uno de sus puntos. Es lo que se llama un modelo axiomático de la recta. Operaremos con él, y a partir de ahí obtendremos una familia de resultados que serán esenciales en todo el trabajo del cálculo con los números reales. La primera sección la dedicaremos a ampliar lo que se plantea en el apéndice A respecto a los conjuntos y la lógica, tan solo al nivel de lo que necesitaremos después. No está de más insistir en leer previamente lo ya discutido sobre estos temas en dicho apéndice (ver págs. 441-452).
6.1.
Algo más sobre conjuntos y lógica
Volviendo a la definición Al comienzo del apéndice A decimos: Por un conjunto entenderemos una colección de objetos bien definida, de forma que no pueda suceder que un objeto determinado pertenezca y no pertenezca a ella a la vez. El conjunto vacío (notación: ∅)[1] será aceptado también como un conjunto (sin elementos). Esta definición tiene obviamente un defecto: definimos “conjunto” en términos de “colección”, pero ¿cómo se define una colección? Veamos qué ocurre al consultar ambos conceptos en el diccionario enciclopédico Larousse 2012: Conjunto. Colección de elementos o de números que tienen varias propiedades que los caracteriza. Al buscar la definición de colección en el mismo diccionario, aparece lo siguiente: Colección. Conjunto de cosas de la misma clase reunidas por afición o interés. Se trata de una definición circular. Por supuesto, podemos intentar evitarla, por ejemplo definiendo una colección como una unión de objetos, y después una unión como una totalidad, y luego una totalidad como un agrupamiento. . . hasta que se nos agoten los sinónimos y regresemos a la palabra conjunto. El problema aquí es que un nuevo concepto se define usualmente como caso particular de otro más general definido previamente; pero el [1] El símbolo ∅ corresponde a una letra noruega y danesa que al pronunciarla suena como la “u” en “put” en inglés.140
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
275
concepto de conjunto es el que engloba a todos los demás, no es caso particular de otros. La solución por la que se optó en la matemática fue la de definirlo en términos de una serie de propiedades, de suerte que por conjunto se entiende “todo aquello que cumpla tales propiedades”. Esas propiedades son los axiomas a los que hicimos referencia en la sección §3.3. Esa es la salida formal, conceptual, a la dificultad. Sin embargo, la teoría de conjuntos se puede desarrollar razonablemente bien sin recurrir a tales axiomas (incluso sin conocerlos). Y eso es lo que haremos. Esto de hecho ayuda a comprender mejor los axiomas, para quien requiera o esté interesado en ello. La definición que dimos al principio será suficiente para lo que tenemos que hacer. Tan solo tengamos presente lo que se discutió en la sección §3.3, de tener cuidado con no querer abarcar colecciones demasiado totalizadoras, como aquellas de “el conjunto de todos los conjuntos”, “el conjunto de todas las cosas”, “el conjunto de todo lo que existe que no cumple tal propiedad”, etc.; ni definir un conjunto a partir de propiedades que posibiliten que un determinado objeto pertenezca y no pertenezca a él a la vez. En todos los casos los conjuntos se definen sobre un conjunto universal bien definido, adecuado a cada contexto, que en el cálculo no es otro que el de los números reales o espacios de dimensión mayor generados por este. Así evitaremos las famosas paradojas. Dicho esto, avancemos. Diagramas, propiedades y demostraciones Ya establecimos las operaciones básicas entre conjuntos (unión, intersección, complementación, resta, producto cartesiano, conjunto potencia). Para saber si una u otra propiedad de estas operaciones se cumple o no, es útil recurrir a los llamados diagramas de Venn (nombre que reciben en honor al lógico inglés John Venn (1834-1923)). Aunque formalmente no constituyen una prueba de que una propiedad se cumple, ayudan en el desarrollo de los razonamientos (ver figura 6.1). Ejemplo 6.1. Identifiquen, en términos de las operaciones entre los conjuntos A, B y C del diagrama que aparece en la figura 6.2, los conjuntos señalados con los números del 1 al 8.
276
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
Figura 6.1
Solución. (1) A r (B ∪ C).
(2) (A ∩ B) r C. (3) B r (A ∪ C). (4) A ∩ B ∩ C.
(5) (A ∩ C) r B. (6) (B ∩ C) r A. (7) C r (A ∪ B). c
Figura 6.2
(8) (A ∪ B ∪ C) .
Por supuesto, hay otras expresiones para representar los mismos conjuntos, que son equivalentes. Por ejemplo el 1) pudo expresarse también como A ∩ B c ∩ C c . Con lo que iremos viendo a continuación tendrán la herramienta para probar la equivalencia entre una y otra expresión. o Sobre el conjunto vacío analicemos el siguiente teorema. Teorema 6.2. Ø ⊆ A, ∀ conjunto A.
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
277
Demostración. Haremos la prueba por reducción al absurdo (en este caso no hay otra opción). ¿Qué significa que un conjunto B esté contenido en un conjunto C?, que todo elemento del primero es elemento del segundo. ¿Qué querría decir entonces que fuera falso que B ⊆ C?, que existe al menos un elemento de B que no pertenece a C. ¿Podría ser falso que Ø ⊆ A?, pues no, porque tendría que existir un elemento de Ø que no estuviese en A, pero en Ø no hay elemento alguno, de manera que tal elemento no existe. Entonces Ø ⊆ A. Si se objetara que aunque no existe ningún elemento de Ø que no pertenezca a A, tampoco existe elemento alguno que sí pertenezca, habría que considerar que la definición de contención de conjuntos fue cuidadosa en esto: No dice que “todo elemento de uno debe pertenecer al otro y además debe existir al menos un elemento que cumpla lo anterior”. Así es que el todo al que se refiere incluye el caso ninguno, siempre y cuando no haya algún elemento que no la cumpla. Este tipo de pruebas se conocen como pruebas “por vacuidad” (cuando no hay ningún elemento que niegue una propiedad, lo cual la hace verdadera aunque no exista algún elemento “que la afirme”). Si les queda un sinsabor ante una prueba como esta, sepan que no son los únicos en el mundo. ? El ejercicio que aparece a continuación, además de afinar nuestra percepción sobre el conjunto vacío, puede ayudarnos a distinguir bien la diferencia entre “ser elemento de” un conjunto y “estar contenido en” el conjunto. Ejemplo 6.3. En los siguientes ejemplos, digan si cada proposición es verdadera o falsa, argumentando brevemente su respuesta: i) Ø ∩ {Ø} = {Ø} ii) Ø ∩ {Ø} = Ø iii) Ø ∪ {Ø} = {Ø, {Ø}} iv) Ø ⊂ Ø v) Ø ⊆ Ø vi) Ø ⊂ {Ø} Solución i) Falsa, porque la intersección del vacío con cualquier conjunto es vacía, y el conjunto del lado derecho sí tiene un elemento, que es el conjunto vacío.
278
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
ii) Verdadera, por lo mencionado al principio del inciso anterior. iii) Falsa, porque la unión del vacío con cualquier conjunto deja igual a dicho conjunto. Entonces, la unión que aparece del lado izquierdo es nuevamente { Ø }, que tiene como elemento al vacío, pero no a { Ø }. iv) Falsa, porque tratándose de una contención propia, tendría que existir al menos un elemento en el conjunto del lado derecho que no estuviera en el del izquierdo. Pero el conjunto del lado derecho no tiene elemento alguno (pues es el vacío). v) Verdadera: el vacío es subconjunto (no necesariamente propio, como acabamos de ver) de cualquier conjunto. vi) Verdadera, por un lado el vacío es subconjunto de cualquier conjunto; y por otro, el del lado derecho tiene al menos un elemento (el conjunto vacío) que no pertenece al del lado izquierdo. Así es que la contención es propia. o Enlistaremos varias propiedades básicas de las operaciones entre conjuntos, todas ellas fáciles de probar. La demostración de cada una quedará como ejercicio para el lector. Teorema 6.4. Sean A, B, C conjuntos definidos en un universo (conjunto) X. Entonces: i) ii) iii) iv) v) vi) vii) viii) ix) x) xi) xii) xiii) xiv) xv)
A∩B A∪B A ∩ (B ∩ C) A ∪ (B ∪ C) A ∩ Ac A ∪ Ac A∩Ø A∪Ø A∩X A∪X c Ø c X c (Ac ) A A
= = = = = = = = = = = = = = =
B∩A B∪A (A ∩ B) ∩ C (A ∪ B) ∪ C Ø X Ø A A X X Ø A (A ∩ B) ∪ (A ∩ B c ) (A ∪ B) ∩ (A ∪ B c )
o Trabajemos ahora en algunos ejemplos con el uso de los diagramas para checar la validez de las propiedades, y en su caso las pruebas formales que deben acompañarlos.
279
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
? Empecemos con una propiedad sencilla:
=
∩ BC
A
ArB
Figura 6.3
Teorema 6.5. A r B = A ∩ B c
Demostración.
def r
x ∈ A r B ⇐⇒ x ∈ A y x ∈ /B def B c
⇐⇒ x ∈ A y x ∈ B c
def ∩
⇐⇒ x ∈ A ∩ B c .
? Si comparamos los diagramas de A ∩ (B ∪ C) y de (A ∩ B) ∪ (A ∩ C) (ver figura 6.4), todo indica que los conjuntos son iguales. Hagamos la demostración formal: Teorema 6.6. Sean A, B, C tres conjuntos cualesquiera. Entonces A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
Demostración. Para probar que dos conjuntos son iguales, debemos probar dos cosas: que el primero está contenido en el segundo y que el segundo está contenido en el primero. Sin embargo, hay ocasiones —pocas— en que todos los razonamientos son “si y solo si”, como ocurre en este caso. Observen en cada paso que efectivamente es así: def ∩
x ∈ A ∩ (B ∪ C) ⇐⇒ x ∈ A y x ∈ (B ∪ C) def ∪
⇐⇒ x ∈ A y (x ∈ B o x ∈ C) ~
⇐⇒ (x ∈ A y x ∈ B) o (x ∈ A y x ∈ C) def ∩
⇐⇒ x ∈ (A ∩ B) o x ∈ (A ∩ C) def ∪
⇐⇒ x ∈ (A ∩ B) ∪ (A ∩ C).
280
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
=
∪ A∩B
=
∩ A
(A ∩ B) ∪ (A ∩ C)
A∩C
B∪C
A ∩ (B ∪ C)
Figura 6.4
En el 1◦ , 2◦ , 4◦ y 5◦ pasos, la equivalencia se debe a que simplemente aplicamos definiciones, y todas las definiciones son “si y solo si”. Del 3◦ , diremos algo después de la siguiente proposición.
? Ahora comparemos los diagramas de A ∪ (B ∩ C) y de (A ∪ B) ∩ (A ∪ C) (ver figura 6.5).
De nuevo, todo indica que ambos conjuntos son iguales. Procedamos a la demostración. Teorema 6.7. Sean A, B, C tres conjuntos cualesquiera. Entonces A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
=
∪
A ∪ (B ∩ C)
B∩C
A
=
∩ A∪B
281
A∪C
(A ∪ B) ∩ (A ∪ C)
Figura 6.5
Demostración. def ∪
x ∈ A ∪ (B ∩ C) ⇐⇒ x ∈ A o x ∈ (B ∩ C) def ∩
⇐⇒ x ∈ A o (x ∈ B y x ∈ C) ~~
⇐⇒ (x ∈ A o x ∈ B) y (x ∈ A o x ∈ C) def ∪
⇐⇒ x ∈ (A ∪ B) y x ∈ (A ∪ C) def ∩
⇐⇒ x ∈ (A ∪ B) ∩ (A ∪ C). Falta solo explicar (~~). Veremos cómo argumentar ese tipo de equivalencias en general. Tablas de verdad Pensemos en la siguiente situación imaginaria: Si alguien nos dice: “Fíjate que conozco un compañero que al menos estudia dos carreras; una de ellas es actuaría, y la otra no recuerdo bien si es física o matemáticas”; podríamos deducir de ello que estudia actuaría y física o estudia actuaría y matemáticas. Igual si nos dijeran lo segundo, podríamos concluir que estudia actuaría y estudia física o matemáticas. Lo que resulta un poco más confuso es el siguiente ejemplo: Si lo que nos dijeran es: “Fíjate que conozco a un compañero que no recuerdo bien si estudia actuaría, o estudia física y matemáticas”, ¿es lo
282
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
mismo que nos hubieran dicho que “estudia actuaría o física y estudia actuaría o matemáticas”?, podría pensar que no, pues si por ejemplo, estudiara actuaría y matemáticas, pero no física, parecería que no está en el primer caso, pues ahí se habla de física y matemáticas, y aquí no estudia física. Sin embargo, como estudia actuaría, ya está en el primer caso, pues este es verdadero si al menos una de las dos proposiciones (estudiar actuaría — estudiar física y matemáticas) es verdadera. La forma de asegurarnos es considerar todos los casos posibles y ver si ambas proposiciones se cumplen exactamente en los mismos casos. Eso, planteado en general, es elaborar lo que se conoce como una tabla de verdad. Tratemos de llevar nuestros ejemplos al caso general. Llamaremos A ={estudiantes de actuaría} B ={estudiantes de física} C ={estudiantes de matemáticas} Lo que nos preguntamos en el primer ejemplo es si x ∈ A y x ∈ B ∪C es equivalente a que x ∈ (A ∩ B) o x ∈ (A ∩ C). Y en el segundo ejemplo, si es lo mismo decir que x ∈ A o x ∈ (B ∩ C), que decir que x ∈ (A ∪ B) y x ∈ (A ∪ C). Así formuladas, son precisamente las equivalencias (~) y (~~) de las que hablamos en los dos teoremas previos. Sean p, q y r las proposiciones: p = x ∈ A, q = x ∈ B y r = x ∈ C. Nuestro problema es ver si se cumple que: (~) p ∧ (q ∨ r) (~~) p ∨ (q ∧ r)
⇐⇒ ⇐⇒
(p ∧ q) ∨ (p ∧ r) (p ∨ q) ∧ (p ∨ r)
(6.1) (6.2)
Las proposiciones solo tienen dos opciones: ser verdaderas (V) o ser falsas (F). Elaboraremos una tabla considerando todas las posibilidades combinadas para p, q y r (las tres verdaderas, las dos primeras verdaderas y la tercera falsa, la primera y la tercera verdaderas y la segunda falsa, . . . , las tres falsas). En total son ocho casos diferentes, y para cada uno de ellos, veremos si siempre que p ∧ (q ∨ r) es verdadero (p ∧ q) ∨ (p ∧ r) también lo es y viceversa. Y lo mismo con las otras dos proposiciones cuya equivalencia nos interesa probar. Como se trata de proposiciones compuestas, podemos simplificar la valoración de su veracidad o falsedad para cada uno de los ocho casos mencionados, armando paso a paso las
283
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
proposiciones compuestas a partir de sus partes más simples. Eso es lo que se hace en las columnas de la tabla de verdad. Es sencillo en realidad, pues a cada paso solo hay que considerar que si la conexión entre dos proposiciones es un “y”, se requiere que ambas sean verdaderas, y si es un “o”, basta con que al menos una sea verdadera: Las dos columnas del lado izquierdo de la segunda parte de la tabla nos muestran que las dos proposiciones de (**) son equivalentes entre sí; y las dos del lado derecho, que las de (*) también son equivalentes. Por lo general no es necesario recurrir a las tablas de verdad, pero cuando tenemos duda acerca de la equivalencia entre ciertas proposiciones compuestas suficientemente elaboradas, es un recurso simple y seguro para aclarar las cosas. p V V V V F F F F
q V V F F V V F F
p ∨ (q ∧ r) V V V V V F F F
r V F V F V F V F
p∨q V V V V V V F F
p∨r V V V V V F V F
(p ∨ q) ∧ (p ∨ r) V V V V V F F F
q∨r V V V F V V V F
p∧q V V F F F F F F
p ∧ (q ∨ r) V V V F F F F F
p∧r V F V F F F F F
q∧r V F F F V F F F
(p ∧ q) ∨ (p ∧ r) V V V F F F F F
o Frecuentemente la igualdad entre dos conjuntos no es válida en general, pero bajo ciertas condiciones sí lo es. Los diagramas pueden servir también para identificar esas condiciones. Ejemplo 6.8. ¿Es cierto que (A ∪ B) ∩ C = A ∪ (B ∩ C)? Si sí, demuéstrenlo. Si no, encuentren una condición necesaria y suficiente con la cual la igualdad se cumpla.
284
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
Solución. Si comparamos los diagramas de ambos conjuntos (ver figura 6.6), vemos que no son iguales. Más precisamente, podemos observar que (A∪B)∩C ⊆ A∪(B ∩C). ¿Qué le sobra al segundo respecto al primero? ArC. De modo que para que fueran iguales, este último conjunto tendría que ser igual al vacío. Es decir, que no hubiera nada de A fuera de C; o sea, que A ⊆ C. Veremos que bajo esa condición los dos conjuntos son iguales: P.D. (A ∪ B) ∩ C = A ∪ (B ∩ C) ⇐⇒ A ⊆ C.
=
∩ A∪B
(A ∪ B) ∩ C
C
=
∪ A
B∩C
A ∪ (B ∩ C)
(A ∪ B) ∩ C
A ∪ (B ∩ C)
ArC
Figura 6.6
⇒) Demostraremos la contrapositiva correspondiente. No perdamos de vista que nuestra hipótesis aquí es que se cumple la igualdad del lado izquierdo. Supongamos que A * C =⇒ ∃ x ∈ A tal que x ∈ / C. Por estar x en A, está en la unión de A con cualquier otro conjunto, en particular, x ∈ A ∪ (B ∩ C). Pero para estar en (A ∪ B) ∩ C tiene que estar en C,
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
285
cosa que no ocurre. Así es que si fuese cierto que A * C, no sería cierto que (A ∪ B) ∩ C = A ∪ (B ∩ C). Es decir, suponer que A * C nos lleva a una contradicción con nuestra hipótesis, ∴ A ⊆ C (recuerden aquello de que si ¬q ⇒ ¬p entonces p ⇒ q). ⇐) Ahora tenemos que probar la igualdad entre dos conjuntos, apoyándonos en que A ⊆ C. Eso significa que tenemos que probar la doble contención. Hagámoslo por partes: ⊆) Por la propiedad (i) del teorema 6.4, (A ∪ B) ∩ C = C ∩ (A ∪ B). Por el teorema 6.6, C ∩ (A ∪ B) = (C ∩ A) ∪ (C ∩ B). Así que si x ∈ C ∩ (A ∪ B) =⇒ x ∈ (C ∩ A) ∪ (C ∩ B) =⇒ x ∈ C ∩ A o x ∈ C ∩ B. Pero si x ∈ C ∩ A =⇒ x ∈ C y x ∈ A =⇒ x ∈ A. Por lo tanto, tenemos que x ∈ A o x ∈ B ∩ C. Es decir, x ∈ A ∪ (B ∩ C). Observemos que en esta parte de la demostración no utilizamos la hipótesis, porque desde el diagrama era claro que la contención ⊆ se cumplía en general. Lo que no se cumplía en general era la contención al revés, ahí es donde será necesario utilizar la hipótesis. ⊇) Tomemos ahora x ∈ A∪(B∩C) =⇒ x ∈ A o x ∈ B∩C. Como A ⊆ C, estando x en A, automáticamente está también en C, y por lo tanto en la intersección de ambos. Así es que x ∈ (A∩C) o x ∈ (B ∩C) =⇒ x ∈ (A∩ C)∪(B ∩C), o lo que es equivalente, x ∈ (C ∩A)∪(C ∩B) = C ∩(A∪B), la última igualdad gracias al teorema 6.6, ∴ x ∈ C ∩ (A ∪ B), que es equivalente a lo que teníamos que demostrar. Representación gráfica de conjuntos Cuando un conjunto está definido en forma específica como un subconjunto de R, R2 o R3 , se puede analizar representando el lugar geométrico que describen sus puntos en la recta, el plano o el espacio, según corresponda. Veamos algunos ejemplos. Ejemplo 6.9. Representar geométricamente en la recta los conjuntos a) b)
([−2, 1) ∪ (3, 6)) ∩ ((0, 4] ∪ [5, 7)).
((−∞, 5] ∩ (1, ∞)) ∪ ((−2, 2) ∩ [0, 6]).
Solución. Ver figura 6.7. De ahí se desprende que los resultados son: a) b)
(0, 1) ∪ (3, 4] ∪ [5, 6). [0, 5].
286
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
(a) ([−2, 1) ∪ (3, 6)) ∩ ((0, 4] ∪ [5, 7))
(b) ((−∞, 5]∩(1, ∞))∪((−2, 2)∩[0, 6])
Figura 6.7
Ejemplo 6.10. Representar geométricamente en el plano los conjuntos a) b)
B2 = {(x, y) :
p
x2 + x2 < 1}.
B1 = {(x, y) : |x| + |y| < 1}.
Solución. a) Dado un punto (x, y) en el plano, proyectándolo ortogonalmente hacia los ejes X y Y y trazando un segmento de línea que una el punto al origen, formamos un triángulo rectángulo (ver figura 6.8). Sus catetos medirán |x| y |y|, y como |a|2 = (±a)2 = a2 ∀a ∈ R, aplicando el teorema de Pitágoras obtenemos que la medida de la q hipotenusa —es decir, la distancia del punto al origen— está dada por
Figura 6.8
|x|2 + |y|2 =
x2 + y 2 .
p
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
287
Así es que nuestro conjunto B2 consta de todos aquellos puntos en el plano cuya distancia al origen es menor que 1. O sea que se trata del círculo de radio 1 con centro en el origen (sin incluir a su frontera). b) Para identificar al conjunto B1 tenemos que trabajar con la desigualdad |x| + |y| < 1. Las cosas se simplifican si hacemos por separado nuestro análisis en cada cuadrante. Cuadrante I: x ≥ 0, y ≥ 0 |x| = x, |y| = y. Entonces |x| + |y| < 1 ⇐⇒ x + y < 1 ⇐⇒ y < 1 − x. La ecuación y = 1 − x corresponde a la recta con pendiente −1 y ordenada al origen igual a 1. ¿Cuáles son entonces los puntos de B1 en el primer cuadrante?, aquellos cuya altura está por debajo de la recta que pasa por los puntos (1, 0) y (0, 1). Cuadrante II: x < 0, y ≥ 0 |x| = −x, |y| = y. Entonces |x|+ |y| < 1 ⇐⇒ −x+ y < 1 ⇐⇒ y < 1+ x. La ecuación y = 1 + x corresponde a la recta con pendiente 1 y ordenada al origen igual a 1. ¿Cuáles son entonces los puntos de B1 en el segundo cuadrante?, aquellos cuya altura está por abajo de la recta que pasa por los puntos (−1, 0) y (0, 1). Cuadrante III: x < 0, y < 0 |x| = −x, |y| = −y. Entonces |x| + |y| < 1 ⇐⇒ −x − y < 1 ⇐⇒ y > −1 − x. La ecuación y = −1 − x corresponde a la recta con pendiente −1 y ordenada al origen igual a −1. ¿Cuáles son entonces los puntos de B1 en el tercer cuadrante?, aquellos cuya altura está por arriba de la recta que pasa por los puntos (−1, 0) y (0, −1). Cuadrante IV: x ≥ 0, y < 0 |x| = x, |y| = −y. Entonces |x| + |y| < 1 ⇐⇒ x − y < 1 ⇐⇒ y > x − 1. La ecuación y = x − 1 corresponde a la recta con pendiente 1 y ordenada al origen igual a −1. ¿Cuáles son entonces los puntos de B1 en el cuarto cuadrante?, aquellos cuya altura está por arriba de la recta que pasa por los puntos (1, 0) y (0, −1). Juntando los cuatro casos, tenemos que B1 es el cuadrado (girado, de acuerdo a la posición usual) que tiene sus vértices √en los puntos (1, 0), (0, 1), (−1, 0) y (0, −1). Sus lados miden todos 2 (ver figura 6.9).
288
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
Figura 6.9
Ejemplo 6.11. Representar geométricamente los conjuntos a) b) c)
[1, 3] × [1, 2].
([1, 2] ∪ [3, 4]) × [1, 2]}.
([1, 2] × [1, 3] × (2, 3)}.
Solución. a) [1, 3] × [1, 2] = {(x, y) : x ∈ [1, 3], y ∈ [1, 2]}. Se trata del rectángulo ilustrado en la figura 6.10a, con su frontera incluida. b) ([1, 2] ∪ [3, 4]) × [1, 2] = {(x, y) : x ∈ ([1, 2] ∪ [3, 4]), y ∈ [1, 2]}. Es la unión de los dos rectángulos mostrados en la figura 6.10b, con sus fronteras incluidas. c) ([1, 2]×[1, 3])×(2, 3) = {(x, y, z) : 1 ≤ x ≤ 2, 1 ≤ y ≤ 3, 2 < z < 3}. Es el paralelepípedo que aparece en la figura 6.10c, con las paredes incluidas pero sin las tapas. En el inciso b) del ejemplo anterior, se ilustra una propiedad que es válida en general, no solo para intervalos. Teorema 6.12. Sean A, B, C tres conjuntos. Entonces (A ∪ B) × C = (A × C) ∪ (B × C). def ×
def ∪
Demostración. (x, y) ∈ (A∪B)×C ⇐⇒ x ∈ (A∪B) y y ∈ C ⇐⇒ (x ∈ A o x ∈ B) y y ∈ C. Lo anterior, por la propiedad (6.1) es equivalente a
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
289
def ×
decir que (x ∈ A y y ∈ C) o (x ∈ B y y ∈ C) ⇐⇒ (x, y) ∈ A × C o def ∪ (x, y) ∈ B × C ⇐⇒ (x, y) ∈ (A × C) ∪ (B × C).
(a) [1, 3] × [1, 2]
(b) ([1, 2] ∪ [3, 4]) × [1, 2]
(c) ([1, 2] × [1, 3]) × (2, 3)
Figura 6.10
Análogamente se podría ilustrar que, por ejemplo, {1} × [1, 5] es un segmento de línea vertical; [0, 1] × [0, 1] × {1} es un pedacito cuadrado de plano elevado una unidad sobre el plano horizontal; R × {1, 2, 3} × R son tres planos verticales paralelos al plano XZ; etc. Uniones e intersecciones no numerables Hay dos conocidas propiedades de operaciones entre conjuntos que, en palabras, lo que establecen es que el complemento de la unión es igual a la intersección de los complementos, y el complemento de la intersección coincide con la unión de los complementos: (A ∪ B)c =Ac ∩ B c
(A ∩ B)c =Ac ∪ B c Se trata de las llamadas Leyes de De Morgan, en honor del matemático y lógico inglés Augustus De Morgan (1806-1871). Pueden ser formula-
290
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
das también en términos de lógica proposicional (las tablas de verdad correspondientes son realmente sencillas): ¬(p ∨ q) =¬p ∧ ¬q
¬(p ∧ q) =¬p ∨ ¬q.
(6.3) (6.4)
Sin embargo, en el caso de conjuntos es común trabajar con el complemento de uniones e intersecciones más amplias, incluso no numerables, lo que lleva a generalizar estas propiedades. o ¿Cómo podría ser una familia no numerable de conjuntos? Veamos algunos ejemplos: 1 1 , α + 1000 ) : α ∈ [0, 2]}. ¿Cuántos elementos a) A = {(α − 1000 —conjuntos— tiene A? Tantos como números reales existen en [0, 2]; es decir, una infinidad no numerable. b) B = {(−β, β) : β ∈ (0, 21 )}. Aquí de nuevo tenemos tantos conjuntos en la familia B como valores puedan adoptar sus índices, que son todos los reales en el (0, 21 ), una infinidad no numerable. c) C = {(γ − 1, γ + 1) : γ ∈ R}. Otra vez no numerable, pues tiene tantos elementos como reales hay en general. Los conjuntos de índices en nuestros ejemplos fueron, respectivamente, [0, 2], (0, 12 ) y R. ? ¿Cuál es la idea central de la unión de conjuntos?, considerar los elementos del espacio que pertenecen por lo menos a uno de los conjuntos. ¿Y de la intersección?, tomar los elementos que simultáneamente están en todos los conjuntos. Cuando las familias de conjuntos no son numerables, su unión —lo mismo que su intersección— no opera siguiendo un orden del tipo “primero este, luego este, etc.”, como ocurría con las familias finitas y numerables. Pero igual podemos analizar si cada elemento del espacio pertenece a alguno de los conjuntos o si pertenece a todos, en el caso de la intersección. En el primero de nuestros ejemplos, la unión no numerable nos re1 1 , 2 + 1000 ); en el segundo, el intervalo (− 12 , 12 ); sultará el intervalo (− 1000 y en el tercero, todo R. Análogamente, la intersección no numerable nos resulta, en el primer caso, el conjunto vacío (pues, por ejemplo, para los 1 1 valores α = 0 y α = 2, los conjuntos Aα = (α − 1000 , α + 1000 ) correspondientes son ajenos entre sí, de suerte que ya no pudo haber elementos en común de todos los conjuntos); en el segundo ejemplo, la intersección es el {0}, pues el 0 es el único elemento que pertenece a todos los conjun-
ALGO MÁS SOBRE CONJUNTOS Y LÓGICA
291
tos de la familia; y en el tercero, la intersección es nuevamente el vacío (C5 = (4, 6) y C8 = (7, 9), por ejemplo, son ajenos). Definición 17. Sea I = {α} 6= Ø un conjunto (finito o infinito, numerable o no). Sea {Aα : α ∈ I} una familia de conjuntos, Aα ⊆ X ∀α ∈ I. Definimos: [
α∈I
\
α∈I
Aα ={x ∈ X : x ∈ Aα para alguna α ∈ I}.
(6.5)
Aα ={x ∈ X : x ∈ Aα ∀ α ∈ I}.
(6.6)
I es llamado conjunto de índices de la familia de conjuntos {Aα }.
? Ahora sí, veamos la versión más general de las Leyes de De Morgan, que abarca tanto el caso de las familias finitas de conjuntos, como el de las numerables y no numerables.
Teorema 6.13. Leyes de De Morgan Sea I un conjunto de índices (finito o infinito, numerable o no). Sea {Aα : α ∈ I} una familia de conjuntos, Aα ⊆ X ∀α ∈ I. Entonces: (a)
[
Aα
\
Aα
α∈I
(b)
α∈I
S
!c
=
!c
=
\
Aα c
(6.7)
[
Aα c .
(6.8)
α∈I
α∈I
S
/ α∈I Aα . ¿Cuáles perteneDemostración. (a) x ∈ ( α∈I Aα )c ⇐⇒ x ∈ cen a la unión de todos los conjuntos de la familia? Los que son elementos de al menos uno de ellos. Si x no está en la unión de todos implica entonces que no estuvo en ninguno. O lo que es lo mismo, que pertenece al complemento de todos. Pero esto significa que está en la intersección T de todos los complementos, ∴ x ∈ α∈I Aα c . Y este razonamiento vale igual de regreso. T T / α∈I Aα . ¿Cuáles pertenecen a la inter(b) x ∈ ( α∈I Aα )c ⇐⇒ x ∈ sección de todos los conjuntos de la familia?, los que simultáneamente están en todos ellos. Para que x no esté en la intersección basta con que deje de estar en alguno, o lo que es lo mismo, que pertenezca al complemento de alguno de los conjuntos. Pero si esto es así, pertenece también a la unión de todos los complementos (pues para estar en ella basta con S ser elemento de alguno de los complementos). Entonces, x ∈ α∈I Aα c , razonamiento que también es válido de regreso tal cual.
292
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
6.2.
Más sobre las expansiones decimales
o A lo largo de lo que resta de este capítulo, pasaremos por algunos puntos “espinosos” sin detenernos en ellos en un primer momento, pues por un lado la imprecisión que desde el punto de vista teórico se comete al hacer esto no afecta la validez del uso que haremos de ellos; y por otro lado, son puntos finos que se comprenden mejor después de haber trabajado un rato con los conceptos. Al final del siguiente capítulo abriremos una sección que lleva por nombre “El diablo está en los detalles”, en la que, entre otras cosas, abordaremos esos puntos, así sea brevemente. Asimismo, hablaremos de los reales considerando ya definidos los racionales, y por lo tanto los enteros y los naturales. En realidad así ocurrió históricamente, y fue hasta después de construidos los primeros modelos de los reales (aunque antes del modelo axiomático) que se entró a precisar la construcción de los naturales. En la sección §7.7 esbozaremos en qué consiste este asunto. o En la sección §2.9 construimos detenidamente el primer modelo de la recta —o la primera forma de representar a los números reales— a través de las expansiones decimales. A lo que llegamos finalmente fue que si denotamos con R a la recta, R←→R={±(A.a1 a2 . . . ) : A ∈ N∪ {0}, ak ∈ {0, 1, 2, . . . , 9}∀k ∈ N} \ T , donde T ={Colas infinitas de 9’s}
={±(A.a1 a2 . . . ) : ∃ N ∈ N tal que ak = 9 ∀ k > N }.
o Observen que al representar los puntos de la recta con estos números, suponemos dos cosas: Una, que dado cualquier punto P de la recta, siempre existe una N ∈ N, que multiplicada por la unidad rebasa a P ; esto lo presupusimos cuando decíamos que para medir la distancia del punto al origen (y a través de ello obtener el número buscado) había que colocar la unidad a continuación de sí misma hasta rebasarlo, y quedarse con el entero justo anterior. La otra, que por muy pequeña que sea una distancia en la recta, siempre hay una subdivisión de la unidad (en nuestro caso, de la forma 1 10n , dado que trabajamos todo en base diez) capaz de hacerse más pequeña que dicha distancia. Es así que lográbamos pegarnos tanto como quisiéramos al punto.
MÁS SOBRE LAS EXPANSIONES DECIMALES
293
Estas dos propiedades son muy importantes, y reciben un nombre: la primera, Propiedad arquimedeana (PA); la segunda, Principio de Divisibilidad Infinita (PDI). Al modelar la recta supusimos implícitamente que esta cumplía la PA y el PDI. Mas adelante retomaremos este punto. o También tengan en cuenta que no es lo mismo hablar de ±(A.a1 a2 . . . ) : A ∈ N ∪ {0}, ak ∈ {0, 1, 2, . . . , 9} ∀ k ∈ N que hacerlo de A.a1 a2 · · · : A ∈ Z, ak ∈ {0, 1, 2, . . . , 9} ∀ k ∈ N. En el primer caso el signo lo carga toda la expansión, mientras que en el segundo lo lleva solo la parte entera. Entonces, por ejemplo, si tomamos A = −1, el número (−1).5 correspondería a movernos hacia la izquierda una unidad, y 5 décimas hacia la derecha, quedando finalmente a 21 de la distancia de origen, del lado izquierdo. Mientras que el número −(1.5) se encuentra a una distancia igual a 23 del origen, también del lado izquierdo. No es que no se puedan representar también así los puntos de la recta, sí se puede, el problema es que a la hora de definir el orden, la suma y el producto, habría que tomar las debidas providencias, pues las reglas no serían las usuales. o Habiendo sacado a las colas de 9’s, la igualdad y el orden natural entre las expansiones infinitas positivas sería el siguiente (a manera de ejercicio, extiendan ustedes la definición para incluir a las negativas): Definición 18. Sean x = A.a1 a2 . . . , y = B.b1 b2 . . . Entonces: (1) x = y ⇐⇒ (2) x < y ⇐⇒
A=B A y 0 , que tiene su mismo período y también justo a partir del punto decimal y 00 = 152371687.687687687 . . . Si los dos números que obtuvimos los restamos entre sí, como sus expansiones decimales son idénticas, estas se anularán y nos quedará un entero positivo q: y 00 − y 0 = 152 371 687.687 687 687 . . .
−152 371.687 687 687 . . .
= 152 219 316.000 000 000 . . . = p ∈ N. Pero y 00 − y 0 = 107=m+n y − 10m=4 y =(107=m+n − 10m=4 )y
=(10 000 000 − 10 000) y
=9 990 000 y = q · y, q ∈ N.
∴ q · y = p =⇒ y =
p 152 219 316 = , q 9 990 000
entonces y ∈ Q. En los dos ejemplos anteriores queda de hecho descrita la prueba general, pero de cualquier manera la desarrollaremos. Teorema 6.15. x ∈ R es racional ⇐⇒ la expansión decimal de x es finita o infinita periódica. Demostración. ⇒) Ya fue demostrado. ⇐) a) Si x tiene expansión decimal finita, consideraremos tres casos: (i) x ∈ Z. (ii) x ∈ / Z, x > 0. (iii) x ∈ / Z, x < 0. El caso (i) es inmediato, pues x = x1 con x ∈ Z y 1 ∈ N, ∴ x ∈ Q. En el caso (ii) x tiene la siguiente forma general: x = ϕM ϕM −1 . . . ϕ1 . a1 a2 . . . am ,
(6.9)
ϕi , aj ∈ {0, 1, . . . , 9} ∀ i = 1, 2, . . . , M, j = 1, 2, . . . , m, am 6= 0.
296
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
La única diferencia respecto a la notación que habíamos usado hasta ahora es que, en lugar de referirnos a la parte entera como A ∈ N ∪ {0}, expandimos decimalmente su expresión para facilitar las manipulaciones algebraicas que haremos. Entonces: 10m · x =ϕM ϕM −1 . . . ϕ1 a1 a2 . . . am = p ∈ N p p ∴ x = m = , p, q ∈ N ⇒ x ∈ Q. 10 q El caso (iii) es análogo al anterior. b) Si x tiene expansión decimal infinita periódica y x > 0 (el caso x < 0 es análogo), su forma general es del siguiente estilo: x = ϕM ϕM −1 . . . ϕ1 . a1 a2 . . . am b1 b2 . . . bn b1 b2 . . . bn . . .
(6.10)
ϕi , aj ,bk ∈ {0, 1, . . . , 9} ∀ i = 1, 2, . . . , M, j = 1, 2, . . . , m, k = 1, 2, . . . , n, bk 6= 0 p.a. k = 1, 2, . . . , n.
Ahora lo que haremos es prácticamente calcar el procedimiento que seguimos en el ejemplo: 10m+n · x = ϕM ϕM −1 . . . ϕ1 a1 a2 . . . am b1 b2 . . . bn . b1 b2 . . . bn b1 b2 . . . bn . . . y 10m · x = ϕM ϕM −1 . . . ϕ1 a1 a2 . . . am . b1 b2 . . . bn b1 b2 . . . bn . . .
Restamos las dos expresiones y factorizamos: (10m+n − 10m ) · x =
ϕM ϕM −1 . . . ϕ1 a1 a2 . . . am b1 b2 . . . bn . b1 b2 . . . bn b1 b2 . . . bn . . . − ϕM ϕM −1 . . . ϕ1 a1 a2 . . . am . b1 b2 . . . bn b1 b2 . . . bn . . . =
p . 0 0 ... 0 0 0 ... 0...
∈ N.
Como 10m+n − 10m = q ∈ N, tenemos entonces que q · x = p =⇒ x = pq .
Hay un detalle implícito en la demostración, y es que se supone que al multiplicar una potencia de diez por una expansión infinita se recorre el punto decimal, y al restar dos expansiones infinitas con la parte decimal igual, estas se anulan. Al margen de que aun no se definen
MÁS SOBRE LAS EXPANSIONES DECIMALES
297
estas operaciones para expansiones infinitas, ambas son verdaderas de acuerdo a la definición usual de ellas. o Siendo la anterior una condición necesaria y suficiente para que una expansión decimal corresponda a un racional, tenemos resuelto el problema de identificar en estos términos a los irracionales: son aquellos cuya expansión decimal es infinita no periódica. Frecuentemente, al pedir en clase un ejemplo que ilustre este resultado, la respuesta inicial es algo como 351.374625385 . . . ¿Por qué se propone un “número” como este como ejemplo de un número irracional?, porque no se ve la menor posibilidad de periodicidad en él. Pero en esto hay un error: el problema de un “número” como el anterior no se reduce a “no ser racional”, sino que simple y sencillamente no es nada, pues resulta indescifrable qué sigue después de los puntos suspensivos. Es decir, antes de hablar de si una expansión corresponde a un racional o a un irracional, tenemos que ponernos de acuerdo en qué significa que una expansión esté bien definida. Decimos que una expansión decimal está bien definida si para toda n ∈ N está claramente determinado cuál es la n-ésima cifra decimal del número. Puede ser porque al poner los tres puntos suspensivos sea evidente cuáles son las cifras que siguen (como por ejemplo cuando escribimos 0.357357357 . . . , o como en tantos otros ejemplos que veremos aquí); o porque especifiquemos un algoritmo para √ obtener cualquiera de las cifras (como por ejemplo cuando decimos 2 = 1.41421356 . . . , en donde no hay regularidad alguna en las cifras, pero el señalamiento de √ que se trata de 2 ofrece un procedimiento —como el método “de la casita”— para obtener cualquier cifra que se desee, no hay ambigüedad P 1 posible en ello; o cuando decimos e = 2.718281 · · · = ∞ k=0 k! , en donde, no obstante que no es inmediato el método para ir obteniendo la n-ésima cifra del número —pues al sumar nuevos términos se afectan dígitos previamente obtenidos—, la regla está bien definida). De modo que solo se acepta una expansión decimal como representativa de un número real cuando está claro cómo obtener cualquiera de sus cifras. Específicamente, cuando ponemos los tres puntos suspensivos a un número debe ser porque cualquier otra persona puede determinar qué sigue después de ellos.
298
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
o Dicho esto, ¿cuáles podrían ser ejemplos de expansiones decimales de números irracionales?, entre muchas otras, las siguientes: 0.101001000100001 . . . ,
0.12123123312333 . . . ,
0.270270027000 . . .
Ejemplo 6.16. Sea x = 3.215323232 . . . un número racional. Obtener cuatro sucesiones {an }, {bn }, {cn }, {dn }que se peguen tanto como queramos a x y que cumplan, cada una de ellas, la siguiente propiedad: a) {an } sea una sucesión de racionales creciente. b) {bn } sea una sucesión de irracionales creciente. c) {cn } sea una sucesión de racionales decreciente. d) {dn } sea una sucesión de irracionales decreciente. Solución. Por supuesto, las soluciones no son únicas. Plantearemos aquí algunas posibles. Sugerimos que antes de verlas intenten ustedes obtener las suyas. a) Sea {an } la sucesión 3.2, 3.21, 3.215, 3.2153, 3.21532, 3.215323, 3.2153232, . . . Claramente es creciente; sus términos son racionales, pues constan todos ellos de una expansión decimal finita, y cumple que: (*) El error de aproximación del primer término es menor 1 que 10 , el del segundo es menor que 1012 , el del tercero es menor que 1013 , el del n-ésimo menor que 101n , . . . de manera que la sucesión se pega tanto como queramos a x. b) Sea {bn } la sucesión b1 = 3.201001000100001000001 . . . b2 = 3.2101001000100001000001 . . . b3 = 3.21501001000100001000001 . . . b4 = 3.215301001000100001000001 . . . b5 = 3.2153201001000100001000001 . . . ··· Ahora cada término es irracional, la sucesión es creciente y por un argumento similar al señalado en (*) del inciso (a), la sucesión se pega tanto como queramos a x.
MÁS SOBRE LAS EXPANSIONES DECIMALES
299
c) Sea {cn } la sucesión 3.3, 3.22, 3.216, 3.2154, 3.21533, 3.215324, 3.2153233, . . . Son racionales, van decreciendo y cumplen una condición análoga a (*). d) Sea {dn } la sucesión d1 = 3.301001000100001000001 . . . d2 = 3.2201001000100001000001 . . . d3 = 3.21601001000100001000001 . . . d4 = 3.215401001000100001000001 . . . d5 = 3.2153301001000100001000001 . . . ···
De nuevo cumple todas las condiciones, por razones equivalentes. o Como vemos, trabajando con las expansiones decimales es bastante fácil generar infinidades de irracionales. Más aun, si lo meditamos un poco, lo realmente raro en una expansión decimal es que aparezca una periodicidad en él, y lo más común es que esta característica no se presente. Piensen ustedes en cuando caminando por la calle ven un escaparate con billetes de lotería expuestos en él, o se los muestra un vendedor, y descubren que hay un billete como el siguiente: 3 6 3 6 3 6, ¿no dirían “mira, qué curioso, qué casualidad que sea tan regular el número”? Ahora imaginen que el billete tuviera no seis números, sino 1000, y se encontraran con que se repite impecablemente un patrón periódico en él. ¡Qué decir si el billete tuviera una infinidad de dígitos, hallar uno así sería verdaderamente como encontrar una aguja en un pajar! Los “raros” entre toda la infinidad de números reales no son los irracionales, sino los racionales; los irracionales serían lo más común, los racionales los extraordinarios. Si metieran en una urna imaginaria tantas bolitas como números reales, cada una marcada con uno de ellos, y sacaran al azar una bolita, la probabilidad de que saliera un racional sería cero. Esto contrasta con la percepción que uno tiene al principio, de que racionales hay muchos pero irracionales resultan muy difíciles de encontrar. El asunto es exactamente al revés, de ahí que el resultado del corolario 3.20 sea realmente lógico, natural. o Aunque por otro lado, reflexionen en lo siguiente: si representáramos cada letra del alfabeto, y el espacio entre palabras, el punto, la
300
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
coma, el punto y coma, el guión largo, con un número de dos cifras: A → 01, a → 02, B → 03, b → 04, . . . , Z → 53, z → 54, → 55, . → 56, , → 57, ; → 58, todo libro se podría representar con un número racional con expansión decimal finita entre 0 y 1, asignando a cada símbolo sus dos letras en el orden en que aparecen en la obra. Todo lo escrito por la humanidad utilizando nuestro alfabeto entraría en el (0, 1), y a cada libro le correspondería un único punto, y sobraría una infinidad de puntos mucho mayor que la ocupada por toda la literatura universal.141 o El ejemplo 6.16 sugiere una propiedad general de los números reales, y es que a cualquiera de ellos nos podemos acercar tanto como queramos con racionales e irracionales. Esto es una consecuencia del resultado del siguiente teorema. Teorema 6.17. Entre cualesquiera dos números reales siempre hay un racional y un irracional. Demostración. Lo haremos para el caso en que ambos son positivos, los demás casos son completamente análogos. Sean x = A. a1 a2 . . . y y = B. b1 b2 . . . dos números reales arbitrarios, 0 < x < y (no olvidemos que las colas de 9’s están excluidas de los reales). Si A < B, sea aN el primer dígito de x a la derecha del punto decimal que sea menor que 9. Sean z = A. a1 a2 . . . aN −1 (aN + 1)
z 0 = A. a1 a2 . . . aN −1 (aN + 1) 0 1 0 0 1 0 0 0 1 . . . z y z 0 son números menores que y, pues tienen parte entera igual a A, mientras que la de y es B, y A < B. Son mayores que x, pues teniendo todas sus cifras iguales antes de la N -ésima, esta cifra de x es menor que las correspondientes de z y z 0 . Así, z y z 0 están entre x y y, y es inmediato que uno es racional y el otro irracional.[2] Si A = B, sea aN el primer dígito de x tal que aN < bN (debe existir, pues si no x y y serían iguales). Dado que es posible que después de esa cifra x tenga varios 9’s seguidos (aunque no una infinidad), llamemos M al primer natural para el cual aN +M < 9. Sean entonces [2]
Ojo: no confundir aN + 1 con aN +1 . Lo primero corresponde a incrementar en una unidad el valor del N -ésimo dígito de x, mientras que lo segundo es tomar el valor del (N + 1)-ésimo dígito de x.
OTRAS BASES
301
z = A. a1 a2 . . . aN −1 aN aN +1 . . . (aN +M + 1)
z 0 = A. a1 a2 . . . aN −1 aN aN +1 . . . (aN +M + 1) 0 1 0 0 1 0 0 0 1 . . . z y z 0 son un número racional y un irracional menores que y —pues sus primeras (N − 1) cifras decimales son iguales y su N -ésima es más pequeña—, y mayores que x —pues sus primeras (N + M − 1) cifras son iguales, pero su (N + M )-ésima cifra es mayor.[3] Corolario 6.18. Entre dos números reales cualesquiera existe una infinidad de racionales y una infinidad de irracionales. Demostración. Supongamos que entre dos ciertos reales, x y y, solo hubiera un número finito de irracionales (el razonamiento es análogo si esto ocurriera con los racionales). En ese caso tomaríamos el más próximo de estos a x, llamémosle z, y entonces ocurriría que entre x y z no habría ningún irracional, lo cual contradice el teorema anterior, así es que debe haber una infinidad. Corolario 6.19. Dado un número real cualquiera, no existe “el siguiente” ni “el anterior”. Demostración. Si lo hubiera, entre ellos dos no habría ningún otro, negando lo probado en el teorema. ? Lo notable de esta situación es que aunque no existe “el siguiente” ni “el anterior” de cualquier real, tampoco hay hoyo alguno entre ellos. ? Eso establece la gran diferencia con el conjunto de los racionales pensado como universo: con sucesiones de racionales nos podemos acercar tanto como queramos a números racionales, pero también a números que no son racionales. Mientras que con sucesiones de reales podemos acercarnos tanto como queramos a números reales, y solo a números reales.
6.3.
Otras bases
Quizás la característica más importante de nuestro sistema numérico es que se trata de un sistema posicional, en el que contando tan solo con unos cuantos símbolos se puede representar cualquier número siguiendo un algoritmo bastante sencillo. Lo esencial no es que sea un sistema [3]
Mismo comentario aquí respecto de aN +M + 1 y aN +M +1 .
302
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
decimal, eso está más bien relacionado con la circunstancia de contar con diez dedos en las dos manos e identificar cada unidad con un dedo (de haberse extendido la costumbre de algunas culturas de utilizar no los dedos de ambas manos como aparato primario de cálculo, sino las falanges —tres por dedo— de cuatro de los dedos de una sola mano, dejándose libre el dedo pulgar para llevar la cuenta, probablemente hoy haríamos todo en base doce). En los ejercicios veremos que incluso el uso del cero es prescindible en un sistema posicional (aunque esto tenga un costo a la hora de operar con dicho sistema).
6.3.1.
Números enteros positivos
o Para entender cómo funciona la representación de los números en otras bases, lo esencial es entender cómo funciona un sistema posicional en general. Supongamos que tenemos b símbolos diferentes: #, 7, . . . , 4, , D. Imaginen que contamos con unos baleritos iguales —tantos como se requieran— insertados en una varilla, comenzando por la derecha y extendiéndose hacia la izquierda, y que tienen marcados estos símbolos en el mismo orden en que los escribimos arriba. Supongamos que colocamos inicialmente todos los baleros en la posición D (ver figura 6.11).
Figura 6.11
303
OTRAS BASES
Para contar una cantidad vamos girando en la dirección que indica el primer balero. Si la cantidad es mayor que , al llegar nuevamente a la posición D (símbolo que jugará el papel del 0), giramos una sola posición el segundo balero, y el primero vuelve a dar toda la vuelta si no llega antes a la cantidad deseada. Cuando vuelve a llegar a D, aumenta otra vez un paso el segundo balero, y así hasta que este último llegue también a D, momento en el cual giramos un paso el tercer balero, y así sucesivamente hasta llegar a la cantidad que queremos contar. El número que representa dicha cantidad está indicado por la sucesión de símbolos que quedaron fijos al alcanzarla. ? Observemos que cualquier cantidad puede ser contada de esta forma, independientemente del número de símbolos diferentes que hayamos considerado inicialmente (en cualquier caso, al menos dos). Es decir, toda cantidad entera se puede representar en cualquier base. o Supongamos que queremos enlistar los primeros naturales en base 4. Eso significa que contamos con cuatro símbolos, digamos ♣, 4, ♥, F. ¿Cómo avanzarían los números? (Intenten hacerlo ustedes antes de ver cómo resulta, suponiendo que quisiéramos que el último de los símbolos jugara el papel del 0): ♣, 4, ♥, ♣F, ♣♣, ♣4, ♣♥, 4F, 4♣, 44, 4♥, ♥F, ♥♣, ♥4,
♥♥, ♣FF, ♣F♣, ♣F4, ♣F♥, ♣♣F, ♣♣♣, ♣♣4, ♣♣♥, ♣4F,
♣4♣, ♣44, ♣4♥, ♣♥F, ♣♥♣, ♣♥4, ♣♥♥, 4FF, 4F♣,
4F4, 4F♥, 4♣F, 4♣♣, 4♣4, 4♣♥, 44F, 44♣, 444, 44♥, 4♥F, 4♥♣, 4♥4, 4♥♥, ♥FF, ♥F♣, ♥F4, ♥F♥,
♥♣F, ♥♣♣, ♥♣4, ♥♣♥, ♥4F, ♥4♣, ♥44, ♥4♥, ♥♥F,
♥♥♣, ♥♥4, ♥♥♥, ♣FFF,
...
Ahora imaginemos cómo serían las tablas de sumar y de multiplicar.
+ ♣ 4 ♥
♣ 4 ♥ ♣F
4 ♥ ♣F ♣♣
♥ ♣F ♣♣ ♣4
♣ +
♣
4 ♣ ♥ 4 ♣ 4 F
♥ 4 ♣
304
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
× ♣ 4 ♥
♣ 4 ♣ 4 4 ♣F ♥ ♣4
♥ 4 4 4 ♣ ♥ F 4 ♣ 4
♥ ♥ ♣4 4♣
×
4 ♥ 4 4
Indudablemente que si en lugar de trabajar con estos extraños símbolos lo hacemos con los números 1, 2, 3 y 0 todo resulta más fácil (estamos extraordinariamente habituados a manipular nuestros números). Lo haremos más adelante. Intenten ustedes razonar por su cuenta las dos operaciones que se presentan como ejemplos en el lado derecho. Para encarrilarlos, diremos tan solo cómo obtuvimos el primer renglón de la multiplicación. Este corresponde a multiplicar ♥ × (♥ 4). Desglosamos ese producto parcial, consultamos la tabla de multiplicar y obtenemos que: ♥ × 4 = ♣ 4, ♥ × ♥ = 4 ♣.
Entonces, lo que debemos hacer es sumar en forma desfasada estos dos números: ×
♥
4 ♥ 4
♣ 4 ♣ 4 4 4
Si detallamos la suma: Al primer sumando 4 no le agregamos nada = 4. ♣ + ♣ = 4, y no “llevamos” nada.
Al tercer sumando 4 no le agregamos nada = 4.
Estas sumas las obtenemos en general de la tabla de sumar. Finalmente (♥ 4) × ♥ = 4 4 4,
que es lo que aparece en el primer renglón de la suma parcial de la multiplicación original.
305
OTRAS BASES
6.3.2.
Cambios de base
Veamos cómo son las cosas para una base b arbitraria. Cada paso que avanza el primer balero vale una unidad, y cada vuelta completa tiene un valor de b unidades. Pero al dar el primer balero la vuelta completa, el segundo avanza una posición, así es que cada unidad del segundo balero vale b unidades. Cuando el segundo balero ha terminado una vuelta completa (que ocurre una vez que el primero ha dado b · b vueltas), en el tercero se avanza una posición; entonces, una unidad en la tercera posición tiene el valor b · b = b2 unidades. Y así sucesivamente: cada unidad en la cuarta posición vale b3 unidades (pues corresponde a b vueltas completas del tercer balero, cada una de las cuales correspondía a b2 unidades). Entonces, cuando estamos en base b, el valor de una unidad en el k-ésimo lugar es bk−1 unidades. De modo que el valor de a unidades en el k-ésimo lugar es igual a a · bk−1 . ¿Y qué valores podemos tener en cada lugar?, los que tenemos marcados en cada balero, que corresponden a 0, 1, 2, . . . , b − 1. Así es que la expresión general de un número x en base b es de la forma x = (ϕn , ϕn−1 , . . . , ϕ2 , ϕ1 )b ,
(6.11)
con ϕk ∈ {0, 1, . . . , b − 1} ∀ k = 1, 2, . . . , n, ϕn 6= 0, y su valor está dado por x = ϕn · bn−1 + ϕn−1 · bn−2 + · · · + ϕ2 · b1 + ϕ1 · b0 . (6.12) Así, por ejemplo, (1, 2, 0, 1)4 =1 · 43 + 2 · 42 + 0 · 41 + 1 · 40 = 64 + 32 + 0 + 1 = 97
(2, 1, 2, 2)4 =2 · 43 + 1 · 42 + 2 · 41 + 2 · 40 = 128 + 16 + 8 + 2 = 154.
Separamos con comas cada símbolo, pues trabajando solo con los 10 símbolos numéricos usuales, si la base fuera mayor que 10 los coeficientes pueden resultar de más de una cifra y sería ambigua la expresión. Por ejemplo, el número (11)12 no sabríamos si es 1 · 121 + 1 · 120 = 13, o si es 11 · 120 = 11. Con las comas, el primero sería (1, 1)12 , mientras que el segundo (11)12 . o ¿Y cómo es el proceso “de regreso”? Es decir, ¿cómo expresamos en base b un número dado en base 10? Tomemos un entero arbitrario expresado en base 10:
306
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
x = (ϕn ϕn−1 . . . ϕ2 ϕ1 )10 , = ϕn · 10n−1 + ϕn−1 · 10n−2 + · · · + ϕ2 · 101 + ϕ1 · 100 . con ϕk ∈ {0, 1, . . . , 9} ∀ k = 1, 2, . . . , n y ϕn 6= 0. Lo que queremos es obtener el valor m y los coeficientes correspondientes, para los cuales x = (ψm , ψm−1 , . . . , ψ2 , ψ1 )b , = ψm · bm−1 + ψm−1 · bm−2 + · · · + ψ2 · b1 + ψ1 · b0 , con ψk ∈ {0, 1, . . . , b − 1} ∀ k = 1, 2, . . . , m, y ψm 6= 0. ? Procedimiento 1: Enlistamos las potencias de b y obtenemos la m, para la cual bm−1 ≤ x < bm .
(6.13)
Vemos cuántas veces cabe bm−1 en x; es decir, tomamos la parte entera del cociente
x bm−1
(6.14)
= ψm .
Está claro que 1 ≤ ψm < b, entonces tomamos la diferencia x0 = x − ψm · bm−1
(6.15)
y repetimos el procedimiento aplicándolo ahora a x0 . Así sucesivamente hasta llegar al valor 0. Las potencias de b que no aparezcan indican que en esos lugares la expansión tiene un coeficiente cero. Hagámoslo con un ejemplo para ver el procedimiento en la práctica: Ejemplo 6.20. Obtener la expansión en base 4 de 2177. Solución. Empezamos por enlistar las potencias de 4, justo hasta que lleguemos a 2177 o lo rebasemos: 40 = 1, 41 = 4, 42 = 16, 43 = 64, 44 = 256, 45 = 1024, 46 = 4096. h
i
2177 = 2, por De modo que, de acuerdo con (6.13), m − 1 = 5, y como 1024 (6.14), ψ6 = 2. Tomamos entonces la diferencia 2177 − 2(1024) = 129.
307
OTRAS BASES
3 Así que el exponente distinto de cero que seguiría i 3 (pues 4 = 64 ≤ h es = 2 ⇒ b4 = 2 y 129 < 44 = 256). Entonces m0 = 3. Como 129 64 3 00 00 0 129 − 2 · 4 = 1 = x . Finalmente, x = 1 = 4 , por lo tanto b1 = 1. Expresando todo en una sola ecuación, tenemos que
2177 = 2 · 45 + 2 · 43 + 1 · 40
= 2 · 45 + 0 · 44 + 2 · 43 + 0 · 42 + 0 · 41 + 1 · 40 = (2, 0, 2, 0, 0, 1)4 .
? Procedimiento 2: Aquí la idea es ir dividiendo entre b, tomar la parte entera del cociente y anotar el residuo, una y otra vez hasta llegar al 0. Se trata de aplicar repetidas veces el siguiente esquema, colocándolo a la izquierda del anterior cada nueva ocasión que se aplica. La expansión buscada la ofrecen los residuos. Razonen por qué. [÷b]
cociente ←− cantidad ↓ residuo
(6.16)
Véamoslo con el mismo ejemplo, pero resuelto con el otro procedimiento, para comparar los dos. Ejemplo 6.21. Obtener la expansión en base 4 de 2177 con el segundo procedimiento. Solución. 0 r
↓ (2
[÷4]
[÷4]
[÷4]
[÷4]
[÷4]
←− 2 ←− 8 ←− 34 ←− 136 ←− 544 r
,
↓ 0
r
,
↓ 2
r
,
↓ 0
r
,
↓ 0
r
,
[÷4]
←−
2177
↓ 1 ) −→ (202001)4
6.3.3.
Las expansiones base b como modelo de la recta
Para obtener la expansión en base b de los números reales no negativos menores que 1 (y con ello de cualquier número real no negativo, pues estos constan de una parte entera y una fraccionaria menor que 1, y lo
308
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
primero ya fue resuelto), se aplica el mismo procedimiento discutido en la sección §2.9, solo que cada subunidad va siendo dividida en b partes iguales, y en consecuencia los coeficientes resultantes pueden tomar los valores {0, 1, 2 . . . , b − 1} en cada nueva subdivisión. De esta manera, la expansión en base b de cualquier número en [0, 1) es de la forma x = (0.a1 , a2 , a3 , . . . )b ,
con ak ∈ {0, 1, 2, . . . , b − 1} ∀ k ∈ N,
(6.17)
y su valor está dado por x=
a1 a2 a3 + 2 + 3 + ... b b b
(6.18)
En la expresión (6.17) colocamos otra vez comas entre los coeficientes, pues al igual que ocurre con los enteros, no hacerlo se presta a una ambig´’uedad al trabajar con bases mayores que 10. Por ejemplo, ¿quién 1 21 11 o 20 + 2012 = 400 ? Con las comas, la primera sería (0.11)20 ?, ¿sería 20 fracción mencionada sería (0.11)20 , mientras que la segunda (0.1, 1)20 . o La expresión (6.18) nos da la fórmula para pasar a base 10 un número fraccionario expresado en base b. ¿Cómo es el proceso inverso? Podemos obtener un algoritmo similar al planteado en (6.16) para los números enteros positivos. La diferencia es que ahora debemos multiplicar la cantidad por b, separar del resultado la parte entera de la fraccionaria, y aplicar de nuevo el procedimiento a la parte fraccionaria, y así hasta que esta última sea cero. El número expresado en base b será la sucesión de cifras obtenidas con las partes enteras que fueron resultando. Por supuesto, aquí el proceso puede ser infinito. Si denotamos con [a] al máximo entero menor o igual que a, y {a} a la parte fraccionaria ( {a} = a − [a]), el esquema sería el siguiente: ×b
{·}
cantidad w −→ producto −→ parte f raccionaria {bw} [·]
&
(6.19)
parte entera [bw]
Igual que con los números enteros, reflexionen sobre este procedimiento. (La razón por la que se debe multiplicar por b en lugar de dividir por b, radica en que el número entero de veces que 1b “cabe” en x está
dado por
x 1 b
= [bx]).
Veamos con algunos ejemplos cómo funciona este algoritmo.
Ejemplo 6.22. Pasar el número x = 0.140625 a base 4.
309
OTRAS BASES
Solución. 0.140625
×4
−→
{·}
0.5625
−→
0.5625
&
0
[·]
×4
−→
2.25
{·}
−→
0.25
&
2
[·]
Así es que 0.140625 = (0.021)4 .
×4
−→
1
{·}
−→
0
&
1
[·]
Las fracciones se pueden trabajar igual sin recurrir a sus expansiones decimales. 9 Ejemplo 6.23. Pasar el número x = a base 4. 64 Solución. 9 9 {·} 1 ×4 9 9 {·} {·} ×4 ×4 −→ −→ −→ 1 −→ 0 −→ −→ 64 16 16 4 4 [·]
&
[·]
0
&
[·]
2
&
1
9 = (0.021)4 . Así es que 64 Veamos ahora un ejemplo en donde una expansión finita en base 10 da lugar a una expansión infinita en base 8. Ejemplo 6.24. Pasar el número x = 0.4125 a base 8. Solución. ×8
0.4125 −→
×8
−→
1.6
3.3
{·}
−→
0.3
&
3
−→
0.6
−→
&
1
[·]
{·} [·]
×8
×8
−→
4.8
2.4
{·}
−→
0.4
&
2
−→
0.8
−→
&
4
[·]
{·} [·]
×8
×8
−→
6.4
3.2
{·}
−→
0.2
&
3
−→
0.4
···
&
6
[·]
{·} [·]
La reaparición de la parte fraccionaria 0.4 da lugar a que se repita todo el ciclo. Es decir, el resultado es una expansión infinita periódica en base 8: 0.4125 = (0.3231463146 . . . )8 . o Para cambiar de base un número negativo x, lo hacemos de la manera que hemos discutido para −x (que es positivo) y al final aplicamos el signo menos a toda la expresión obtenida. o ¿Cuál sería, en una base b arbitraria, el equivalente del 0.999 . . . de la base 10? ¿Cómo surge este número? Realizamos la primera división de
310
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
la unidad en 10 partes, y tomamos 9; luego dividimos cada una de estas, otra vez en 10 partes, y tomamos otras 9; y así sucesivamente. Ante cada nueva subdivisión de la unidad en diez partes iguales tomamos siempre nueve de ellas, que es el máximo número que podemos tomar. ¿Qué sería lo equivalente en base b?, en este caso todas las divisiones son en b partes, y el número máximo de subunidades que se pueden tomar en cada paso es b − 1, de modo que el equivalente sería el (0.b − 1, b − 1, b − 1, . . . )b . Por ejemplo, en base 4, el (0.3, 3, 3, . . . )3 ; en base 2, el (0.1, 1, 1, . . . )2 , etcétera. ¿También ocurre que (0 . b − 1, b − 1, b − 1, . . . )b = 1? Veamos: por (6.18) x =(0.b − 1, b − 1, b − 1, . . . )b = =(b − 1) =(b − 1)
1 b
+
2
∞ k X 1
k=1
b
1 b
+
b−1 b−1 b−1 + 2 + 3 + ... b b !b
3
1 b
+ ...
,
que se trata de una serie geométrica con 0 < r = = (b − 1)
1 b
1−
1 b
!
= (b − 1)
1 b b−1 b
1 b
< 1, ∴ por (1.2)
!
= 1.
o Por supuesto, esto no solo pasa con el 1. Sucede con cualquier número con expansión finita en base b. Si aN > 0:[4] ± (ϕm , ϕm−1 , . . . , ϕ1 . a1 a2 . . . , aN )b =
± (ϕm , ϕm−1 , . . . , ϕ1 . a1 a2 . . . , aN − 1, b − 1, b − 1, . . . )b .
(6.20)
o Por lo tanto, si queremos modelar la recta con las expansiones base b, debemos retirar de ellas las finitas o las que tienen colas infinitas de (b − 1)’s a partir de un cierto momento, lo usual es retirar las segundas. Si nuevamente denotamos con R a la recta, tenemos que ∀ b ∈ N, b > 1: R ←→ R = {±(ϕm , ϕm−1 , . . . , ϕ1 . a1 a2 . . . ) : ϕj , ak ∈ {0, 1, 2, . . . , b − 1} ∀ j ∈ {1, 2, . . . , m}, m, k ∈ N} \ T ∗,
[4]
(6.21)
No confundir aN − 1 con aN −1 en la expresión que aparece a continuación.
OTRAS BASES
311
donde T ∗ = {Colas infinitas de (b − 1)0 s}
= {±(ϕm , ϕm−1 , . . . , ϕ1 . a1 a2 . . . ) : ∃ N ∈ N tal que ak = b − 1 ∀ k > N }.
Es inmediato que las expansiones decimales son un caso particular de este tipo de modelo de la recta. o La expresión (6.18) constituye la forma teórica de pasar un número de base b a base 10. ¿Por qué decimos “teórica”?, porque a la hora de la verdad, en la obtención práctica de (6.18), hay dos grandes dificultades: una, que cada sumando puede resultar en sí una expansión infinita, y aun no establecemos cómo se suman las expansiones infinitas (lo hemos venido haciendo para casos sencillos, no problemáticos). La otra —más esencial—, que se trata a su vez de sumar una infinidad de sumandos —cada uno de los cuales, como hemos dicho, puede ser infinito—, para lo cual no hay un método general, cada caso es diferente; el problema es que no es inmediato cuándo una cifra es segura, pues al agregar nuevos sumandos las cifras previamente obtenidas se modifican. Por supuesto que lo mismo ocurre al pasar un número de base 10 a base b. En realidad, hay que tener presente que aquí se está trabajando con series (aunque son todas series que se comportan bastante bien y eso ayuda a resolver las cosas en cada caso particular). No profundizaremos en esto, pero más adelante veremos cómo funciona el procedimiento práctico en un ejemplo.
6.3.4.
Operando en otras bases
Realizaremos algunas operaciones en base 4 primero, y en base 2 después, para adquirir alguna familiaridad en el manejo práctico de otras bases. o Si pensamos en base 4, con nuestros números básicos reducidos a 1, 2, 3 y 0, el listado de los primeros naturales quedaría así: 1, 2, 3, 10, 11, 12, 13, 20, 21, 22, 23, 30, 31, 32, 33, 100, 101,102,103, 110, 111, 112, 113, 120, 121, 122, 123,130,131, 132, 133, 200 . . . Las tablas de sumar y multiplicar serían:
312
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
+ 1 2 3
1 2 3 2 3 10 3 10 11 10 11 12
× 1 2 3
1 2 3 1 2 3 2 10 12 3 12 21
Para confirmar alguno de los valores de la tabla siempre tienen la opción de checarlo con la enumeración de los primeros naturales. Por ejemplo, ¿cuál sería 3+3?, el número que corresponde a tomar 3 y luego 3, contamos en la lista y vemos que es el 12. ¿Cuál sería 3 × 3?, tres veces tres, así es que nos colocamos en el listado, contamos tres unidades, otras tres y tres más, y donde lleguemos —que es el 21—, ese es 3 × 3. Si quisiéramos restar, por ejemplo, 11 − 2, podríamos hacer la cuenta mentalmente (¡o con los dedos, por qué no!): “2 para 10, son 2, más 1, 3, ∴ 11 − 2 = 3”. Cada quien encuentra su forma de hacerlo. Hagamos ahora un ejemplo de una suma, una resta, un producto y una división con números de varias cifras:
1
+
1
×
2 1 3 3 2 2 1 2 0 1
1 2
3 3 2 1 2 3 − 2 3 3 1 2 3 1 3 2
2
3
3 2 2 3 2 2 2 3 0 1 2 2 3 2 . 0 2 1 0 1 2 1 3 2 0 2 0 0 1 0 0 0 2
Como vemos, las reglas que seguramente tenemos grabadas en la memoria cambian: por ejemplo, aquí no se cumple que “2 más 3 es 5”, pues no hay 5; aquí se cumple que “2 más 3 es 11, así que anotamos 1 y llevamos 1”, si fuera una suma de varias cifras; “3 por 2 es 12, de modo que anotamos 2 y llevamos 1”, etcétera. ? Podemos checar los resultados, pasando todo a base 10. Por ejemplo, la multiplicación: (3, 2)4 = 3 · 41 + 2 · 40 = 14, (2, 3)4 = 2 · 41 + 3 · 40 =
313
OTRAS BASES
11, (2, 1, 2, 2)4 = 2 · 43 + 1 · 42 + 2 · 41 + 2 · 40 = 128 + 16 + 8 + 2 = 154, y 14 · 11 = 154. La comprobación de la división nos servirá a la vez para ilustrar el problema de los cambios de base de la parte fraccionaria mencionado al final de la subsección anterior: (3, 0, 1, 2)4 = 3 · 43 + 0 · 42 + 1 · 41 + 2 · 40 = 192 + 0 + 4 + 2 = 198,
(3, 2)4 = 3 · 41 + 2 · 40 = 14,
1 1 1 (3, 2 . 0, 2, 1, 0, 2, 1, . . . )4 = 3 · 4 + 2 · 4 + 0 · + 2 · 2 + 1 · 3 + 4 4 4 1 1 1 1 1 1 0 · 4 + 2 · 5 + 1 · 6 + 0 · 7 + 2 · 8 + 1 · 9 + ... 4 4 4 4 4 4 9 9 1 1 9 + 3 + 6 + ... = 14 + 64 4 64 4 64 1
0
∞ 9 X 1 k (1.3) 9 = 14 + = 14 + 3 64 k=0 4 64
= 14 +
9 1 = 14 + . 63 7
1 1 − 413
!
(6.22)
Trabajando con los números expresados en base 10 obtenemos 99 1 198 = = 14 + . 14 7 7 Así es que el resultado de la división en base 4 es correcto. ? En cuanto a la expansión decimal de (0 . 0, 2, 1, 0, 2, 1, . . . )4 , gracias a que se pudo obtener el valor de la serie que representan sus coeficientes en este caso, sabemos que es igual a 71 y tenemos entonces la opción de obtenerla simplemente efectuando la división, la cual a cada paso nos ofrece ya la cifra final que ocupa cada lugar de la expansión: 1 = 0.142857 142857 . . . 7 Es decir, no hay nada en la obtención de las cifras siguientes que altere, por ejemplo, que la doceava cifra decimal es 7. Sin embargo, si hubiéramos tenido que ir obteniendo las cifras de la expansión decimal poco a poco, avanzando paulatinamente en el número de cifras que vamos cambiando de una base a otra, el proceso es bastante más errático:
314
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
2 42 2 (0. 0, 2, 1)4 = 2 4 2 (0. 0, 2, 1, 0, 2)4 = 2 4 2 (0. 0, 2, 1, 0, 2, 1)4 = 2 4 (0. 0, 2)4 =
= 0.125 1 = 0.140625 43 1 2 + 3 + 5 = 0.142578125 4 4 1 2 1 + 3 + 5 + 6 = 0.142822265 4 4 4 +
Como vemos, al avanzar en el número de cifras que son sometidas al cambio de base, varias de las obtenidas previamente se ven modificadas. El problema en cada caso concreto es ¿hasta dónde tenemos que avanzar para tener n cifras seguras? La buena noticia es que siempre que el número es racional, se puede aplicar un procedimiento como el desarrollado en (6.22) —pues siempre aparece la serie geométrica para sacar las castañas del fuego— y obtener las cifras decimales en forma segura a través de la división de dos enteros en base 10; la mala es que con los irracionales las cosas se complican. o Regresando a la división, hay otra observación que es importante. Si se fijan, todos los residuos resultan siempre menores que el divisor, igual que en base diez; así es que solo puede haber un número finito de ellos diferentes entre sí. Entonces, si ninguno es 0, en algún momento se tiene que repetir alguno, y a partir de ese momento la repetición es cíclica e indefinida. En nuestro ejemplo el cociente “completo” fue 32.021021021 . . . Por supuesto que lo anterior es válido para cualquier base b, de suerte que siempre se cumple que un número racional en esa base tiene expansión finita o infinita periódica, y el inverso también es verdadero. Obsérvenlo a través de un par de ejemplos. Supongan que x = 13.23113. Si multiplicamos por 105 (que pasado a base 10 sería como multiplicar por 45 ), simplemente se desplaza el punto decimal 5 lugares (sí, aquí también, chéquenlo). Entonces 105 ·x = p 1323113, de modo que x = 1323113 100000 = ( q )4 . ¿Y si la expansión es infinita periódica?, también. Supongan que nos hubieran dado el número x = 21.323232 . . . Entonces 102 · x − x = 2111 = 2132−21, pues las expansiones son idénticas y se anulan =⇒ x = 100−1 p 2111 = ( ) . 33 q 4
315
OTRAS BASES
Sabemos que el hecho de que una propiedad se cumpla en algunos casos particulares no la hace válida en general. Pero los ejemplos vistos nos permiten ver que el procedimiento con el cual demostramos el teorema 6.15 se puede aplicar en cualquier base, de suerte que es de esperar que se cumpla que ∀ b ∈ N, b > 1. Una expansión en base b corresponde a un número racional
⇐⇒ es finita o infinita periódica.
(6.23)
La demostración, como ya hemos sugerido, es esencialmente la misma que para las expansiones decimales, así es que la dejaremos como ejercicio. o Los cálculos en base 2 son los más sencillos de todos. El problema es que aun cantidades muy pequeñas requieren de muchas cifras para ser representadas. Haremos a continuación algunos cálculos en esta base. Utilizaremos los más clásicos de los símbolos: 0 y 1. Empecemos por hacer una lista de los primeros naturales: 1,10,11,100,101,110,111,1000, 1001, 1010, 1011, 1100, 1101, 1110, 1111, . . . Las tablas de sumar y multiplicar quedarían así: + 0 1
0 0 1
1 1 10
× 0 1
0 0 0
1 0 1
Veamos ahora un ejemplo de cada operación, incluyendo la raíz cuadrada, que indicaremos paso a paso por si no recuerdan el método de “la casita” (se reproduce tal cual en base 2): 1 + 1
0 1 0
0 1 −
0 1 1
1 1 1 1 0 0
1 0 0 1 1 1
0 1 0 0 1 1
1 1 0 1 0 1
1
0 1 1 1 1 0
× 1
1 0
1 0
1 0 0
1 1 1 1 0
0 0 0
1 1 1
0
1
316
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
0
1
/
∴
1 0
1 0 1 0
1 0
√
0 1 1 0
1 0 0 1 0
11110.01 ↓
0 1
1 0
0 1
1 0
0 1
1
=
2 4 + 23 + 2 2 + 21 +
= 1 22
30.25 √
6.4.
.
1
0
101.1 ↓
22 + 1 + =
1
1
0
...
1 2
5.5
30.25 = 5.5.
Desventaja del modelo
En la definición 18 vimos cómo definir un orden entre las expansiones decimales, que está en correspondencia con el orden natural entre los puntos de la recta. Veremos ahora cómo definir la suma entre las expansiones decimales. Si dos expansiones son finitas, no hay nada que decir: se suman igual que los números enteros, colocando el punto decimal en el lugar conveniente y completando con ceros la que tenga una expansión con menos dígitos. Si una de ellas es infinita y la otra finita, esencialmente tampoco hay problema: en las cifras de la expansión infinita que rebasan la finita, queda todo igual, y en las demás se suman como si fueran enteros. El problema es cuando ambas expansiones son infinitas. Lo primero que hay que aclarar es qué significa que quede bien definida la suma de dos expansiones así. Lo mismo que cuando veíamos qué quiere decir que una expansión infinita esté bien definida, aquí diremos que la suma está bien definida si podemos decir cuáles son las primeras n cifras de la expansión, sea cual sea la n que tomemos.
DESVENTAJA DEL MODELO
317
Esto podría hacer pensar que entonces habría que hacer lo siguiente: tomar las n primeras cifras de ambos números, sumarlos como enteros y ya está, ahí tenemos las primeras n cifras de la suma. Pero es fácil convencernos de que esto no es necesariamente así, pues si en la (n + 1)-ésima cifra al sumar los dígitos de los dos sumandos obtenemos un número mayor o igual que 10, tendríamos que “llevar 1” hacia la n-ésima cifra y eso alterará su valor. Entonces tomamos hasta la (n + 1)-ésima cifra de ambos números, los sumamos como enteros y nos quedamos con las primeras n. ¿Qué pasaría si en la cifra n + 2 la suma fuera mayor o igual que 10, de manera que hubiera que incrementar en 1 la cifra n + 1?, al parecer nada, porque el problema era asegurar que no afectara la n-ésima . . . a menos que en la (n + 1)-ésima haya quedado un 9, pues en ese caso, al incrementarla en 1 acabamos modificando la n-ésima también. Como vemos, el problema tiene sus vericuetos. Vamos entonces a tratar de plantear en forma ordenada cómo sería el procedimiento: Sean x, y > 0, x = A.a1 a2 . . . , y = B.b1 b2 . . . , z = x + y, n ∈ N. Objetivo: conocer hasta la n-ésima cifra decimal de x + y. Tomamos hasta la cifra n+1 y sumamos ambos números: A . a1 a2 . . . + B . b1 b2 . . . C . c1 c2 . . .
an an+1 bn bn+1 cn
Definición 19. 1. Si an+1 + bn+1 < 9, la suma hasta la n-ésima cifra se obtiene sumando simplemente las n primeras cifras de los dos números. 2. Si an+1 + bn+1 ≥ 10, sumamos hasta la cifra n + 1 y nos quedamos con las primeras n cifras. 3. Si an+1 + bn+1 = 9 : a) Si an+2 + bn+2 < 9, la suma hasta la n-ésima cifra se obtiene sumando simplemente las n primeras cifras de los dos números. b) Si an+2 + bn+2 ≥ 10, sumamos hasta la cifra n + 2 y nos quedamos con las primeras n de hecho, podrían ser las primeras (n + 1).
318
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
c) Si an+2 + bn+2 = 9 : i Si an+3 + bn+3 < 9, la suma hasta la n-ésima cifra se obtiene sumando simplemente las n primeras cifras de los dos números. ii Si an+3 + bn+3 ≥ 10, sumamos hasta la cifra n + 3 y nos quedamos con las primeras n de hecho, podrían ser las primeras (n + 2). iii Si an+3 + bn+3 = 9, .. . Así hasta que lleguemos a una cifra en la que la suma sea distinta de 9. Si las expansiones son tales que las cifras que se obtienen al sumar son todas iguales a 9 a partir de alguna —es decir, si resulta una cola infinita de 9’s—, entonces lo que hay que hacer es incrementar en una unidad el último dígito de la suma previo al inicio de la cola de 9’s, y quedarnos con la expansión finita correspondiente. ¿Cómo nos damos cuenta de que en cualquier lugar resultaría un 9 al hacer la suma correspondiente? Para que los números hayan sido considerados bien definidos se debe contar con una expresión general para la n-ésima cifra de cada uno de ellos, y es la suma de estas expresiones generales lo que debe resultar igual a 9 a partir de algún momento. Lo cierto es que se debe obtener un argumento general para la n-ésima cifra, sea cual sea la n. o ¿Qué resulta al realizar las operaciones básicas con números racionales e irracionales? Veamos (supondremos en lo que sigue que la suma y producto de naturales es natural, y la suma, resta y producto de enteros es entero). Teorema 6.25. 1) La suma, resta, producto y cociente de racionales (el denominador distinto de cero en el último caso) resulta siempre un racional. 2) La suma, resta, producto y cociente de irracionales puede ser racional o irracional. 3) De la suma, resta, producto y cociente de un racional y un irracional resulta siempre un irracional (siendo el racional distinto de cero en los dos últimos casos).
DESVENTAJA DEL MODELO
Demostración. 1) Sean x = pq , y = 0
0
p0 q0 ,
319
p, p0 ∈ Z, q, q 0 ∈ N. Entonces:
±p q ∈ Q, pues el numerador es entero y el denominador a) x ± y = pq qq 0 natural. 0 b) x · y = pp qq 0 ∈ Q, igual que en el inciso previo.
c)
x y
=
p q p0 q0
=
pq 0 p0 q ,
p0 6= 0 pues y 6= 0. Aquí el numerador y el denomina-
dor son enteros, el segundo distinto de cero, de modo que se pueden ver como el cociente de un entero y un natural, resultando racional.
2) Para cada una de las cuatro operaciones daremos dos ejemplos de irracionales: uno en el que la operación resulte racional y otro en el que resulte irracional. (a) x = 0.010010001 . . . , y = 0.101101110 . . . , entonces la suma x + y = 0.111111111 · · · ∈ Q, pues es una expansión infinita periódica. x0 = 0.010010001 . . . , y 0 = 0.050050005 . . . =⇒ x + y = 0.060060006 · · · = z 0 ∈ I. b) La resta z 0 − x0 del inciso 2(a) es un ejemplo. 0 0 0 x0 = 0.030030003. √. . , y = 0.010010001. . . =⇒ x − y = 0.020020002. . . ∈ I. √ 2 ∈ Q. c) x = √ 2,0 y =√ 2 =⇒ 0x · y0 = √ 0 x = 2, 3 =⇒ x · y = 6 ∈ I. √y = √ d) x = 8, y = 2 =⇒ xy = 2 ∈ Q. √ √ √ 0 x0 = 6, y 0 = 2 =⇒ xy0 = 3 ∈ I. 3) Sean x ∈ Q, y ∈ I. a) Si y ± x = z ∈ Q =⇒ y = z ∓ x ∈ Q por el inciso 1(a) (!). b) Como x 6= 0, si x · y = z ∈ Q =⇒ y = xz ∈ Q por el inciso 1(c) (!). c) Como x 6= 0, si z = xy ∈ Q =⇒ y = x · z ∈ Q, por el inciso 1(b) (!). Análogamente con el cociente al revés. o Regresando a la suma de dos expansiones decimales, en la definición 19 quedó resuelto el problema para el caso en que las dos son positivas. Cuando las dos son negativas, todo es igual, tan solo afectando el resultado por el signo menos correspondiente. Cuando una es positiva y la otra negativa, lo que debemos definir es el equivalente a la resta x − y. Se puede hacer partiendo de que x > y, y en el caso contrario simplemente se le cambia el signo al resultado. De nuevo, el objetivo es obtener la n-ésima cifra segura ahora de la resta, sea cual sea la n ∈ N que tomemos. ¿Sería la que obtuviéramos al restar las n primeras ci-
320
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
fras de ambas expansiones?, si no “traemos 1” de la cifra n + 1, sí; es decir, si an+1 > bn+1 , sí. Pero si an+1 < bn+1 , la cifra n-ésima se verá afectada. Entonces, en ese caso tomamos hasta la cifra n + 1, restamos y nos quedamos con las primeras n cifras. Solo faltaría el caso en que an+1 = bn+1 . Lo que sucede ahí es que lo que pase en la cifra n + 2 puede alterar el resultado haciendo que an+1 quede menor que bn+1 , y por lo tanto afectar también la n-ésima cifra. ¿Qué hacer?, algo enteramente similar a lo que hicimos con la suma. Escribámoslo en orden. Sean x > y > 0, x = A.a1 a2 . . . , y = B.b1 b2 . . . , z = x − y, n ∈ N. Objetivo: conocer hasta la n-ésima cifra decimal de x − y. Tomamos hasta la cifra n+1 y restamos ambos números: A . a1 a2 . . . — B . b1 b 2 . . . C . c1 c2 . . .
an an+1 bn bn+1 cn
Definición 20. 1. Si an+1 > bn+1 , la resta hasta la n-ésima cifra se obtiene restando simplemente las n primeras cifras de los dos números. 2. Si an+1 < bn+1 , restamos las n + 1 primeras cifras y nos quedamos con las n iniciales. 3. Si an+1 = bn+1 : a) Si an+2 > bn+2 , la resta hasta la n-ésima cifra se obtiene restando simplemente las n primeras cifras de los dos números. b) Si an+2 < bn+2 , restamos hasta la cifra n + 2 y nos quedamos con las primeras n —de hecho, podrían ser las primeras (n + 1)—. c) Si an+2 = bn+2 : i Si an+3 > bn+3 , la resta hasta la n-ésima cifra se obtiene restando simplemente las n primeras cifras de los dos números. ii Si an+3 < bn+3 , restamos hasta la cifra n + 3 y nos quedamos con las primeras n —de hecho, podrían ser las primeras (n + 2)—.
DESVENTAJA DEL MODELO
321
iii Si an+3 = bn+3 , .. . Así hasta que nos encontremos una cifra en que sean diferentes. Y si son iguales en todas a partir de alguna, tomamos hasta la última cifra en que fueron distintos, los restamos y nos quedamos con la expansión finita correspondiente. De nuevo vale un comentario similar al que hicimos despúes de la definición de la suma. Hay casos en que la resta no presenta el menor problema. Por ejemplo, si todas las cifras del número más grande son mayores que las del menor, o si todas las cifras a partir de alguna son iguales en los dos números. Son de ese tipo los ejemplos de restas que realizamos en secciones anteriores. o Si la suma y la resta de las expansiones infinitas resultan enredadas, ya podemos imaginar lo que sucede con el producto. El asunto tiene que ver con cómo se multiplican dos series (aunque estas son series bastante nobles), y eso puede resultar muy laborioso. Es en este tema donde aparece el que pudiéramos llamar el punto débil del modelo de las expansiones decimales, lo mismo que las expansiones base b y, de hecho, de los distintos modelos que buscan representar la recta por la vía de exhibir números concretos con los cuales representar cada punto de ella. Con todo, de ese tipo de modelos, el de las expansiones es el más accesible (más adelante se comenta sobre otros más). Una buena cantidad de los resultados del cálculo no precisan de exhibir la forma específica que tiene cada número real, sino más bien de utilizar sus propiedades. Piensen, por ejemplo, que quieren probar que la función f (x) = x2 es creciente en el intervalo (0, ∞). ¿Qué deben hacer?, tomar dos reales arbitrarios 0 < x < y, y demostrar que f (x) < f (y); es decir, que x2 < y 2 . Para ello no es relevante ver que la expansión de x2 sea menor que la de y 2 , utilizando el hecho de que la de x fue menor que la de y. Eso sería bastante pesado de hacer cada vez que quisiéramos probar un resultado. Basta con garantizar que si tenemos dos números reales, a < b, y los multiplicamos por otro, 0 < c, entonces se preserva la desigualdad, es decir ac < bc. Porque si esto estuviera garantizado, multiplicamos la desigualdad 0 < x < y por 0 < x, y obtenemos que 0 < x2 < xy. Luego volvemos a la desigualdad inicial, y en lugar de multiplicar por x lo hacemos por y, obtenemos que 0 < xy < y 2 . Ahora, si también tuviéramos
322
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
garantizado que siempre que a < b y b < c entonces a < c, sean los números reales que sean, entonces, dadas las dos desigualdades que obtuvimos antes, tendríamos ya que x2 < y 2 . Es decir, habríamos probado la propiedad que queríamos para cualesquiera dos reales positivos, sin tener que “abrir” en ningún momento sus expansiones. En el caso del tipo de propiedades que comentamos en la sección §5.2, lo esencial es contar con una propiedad que garantice que los reales no dejan huecos sin llenar, independientemente de si los representamos de una manera o de otra. Así es como funciona el cálculo, de modo que si lo que queremos es operar con los números reales, habría que pensar en un modelo guiados por la idea de caracterizar a los números reales en términos de sus propiedades, sin importarnos tanto si es con uno o con otro tipo de número específico que podemos identificar a cada uno de ellos. Es decir, pensar en un conjunto de propiedades que cumplan los números reales, pero más que eso: que por el simple hecho de que un conjunto las cumpla, tengamos la certeza de que ese conjunto es como los números reales. Eso es lo que se llama un modelo axiomático de los números reales (o de los puntos de la recta, o del continuo). Es el modelo que construiremos en el siguiente capítulo.
6.5.
Ejercicios
1. Identifiquen en términos de las operaciones entre los conjuntos A, B, C y D del diagrama que aparece en la figura 6.12, los conjuntos señalados con los números del 1 al 12.
Figura 6.12
EJERCICIOS
323
2. ¿Verdadero o falso? Argumenten brevemente su respuesta: a) Ø y { Ø } son ajenos. b) Ø ∈ P(Ø).
c) Ø ⊆ P(Ø).
d) |Ø| = |P(Ø)|. e) Ø = {0}. f) 0 ⊆ {0}.
g) Si A * B y B * C =⇒ A * C. 3. Ilustrar con diagramas y probar que: a) A ⊆ B ⇐⇒ A ∩ B = A ⇐⇒ A ∪ B = B. b) A ∪ B = (A r B) ∪ (A ∩ B) ∪ (B r A).
c) Si A ∩ C = B ∩ C y A ∪ C = B ∪ C =⇒ A = B.
d) Si A ∩ C = B ∩ C y A r C = B r C =⇒ A = B. e) A = Ø ⇐⇒ (B r A) ∪ (A r B).
4. En los siguientes incisos digan si se cumple en general la igualdad indicada. Si no es así, apoyándose en el uso de los diagramas convenientes, propongan una condición necesaria y suficiente bajo la cual sí se cumpla. Finalmente, prueben su afirmación. a) A ∪ (B ∩ C) = (A ∪ B) ∩ C.
b) (A ∪ B) r C = (A r C) ∪ (B r C).
c) (A ∩ B) r C = (A r C) ∩ (B r C).
5. Construyan las tablas de verdad correspondientes a las Leyes de Morgan para tres conjuntos, A, B, C. 6. Representen geométricamente el conjunto B3 = {(x, y) :
q 3
|x|3 + |y|3 ≤ 1}.
7. Representen geométricamente los siguientes conjuntos: a) ((−∞, 1] ∪ (4, ∞)) ∩ ((−∞, −3) ∪ [0, 2) ∪ [3, 5]) .
324
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
b) (((−5, 3) ∩ [0, 5]) ∪ ((−7, −3) ∩ (−4, 0]))c . 8. Ayudándose con gráficas para el caso en que los conjuntos están en R, demuestren que en general, dados A, B, C, D arbitrarios: a) A × (B ∩ C) = (A × B) ∩ (A × C).
b) (A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D).
c) (A × B) ∪ (C × D) ⊆ (A ∪ C) × (B ∪ D).
9. Describan en términos de productos cartesianos los siguientes conjuntos: a) Una línea vertical en R3 que pasa por el punto (3, 5, 0). b) Un plano paralelo al XY a la altura z = −2.
c) Un plano paralelo al Y Z que pasa por el punto (3, 0, 0). d) Una línea paralela al eje X que pasa por (2, 1, 3). 10. Sea x = 0.a1 a2 . . . an un número real. Construyan una sucesión de racionales y otra de irracionales, que sean decrecientes y se acerquen tanto como queramos a x. 11. Encuentren en qué base se cumple que (distinta en cada inciso): a)
+ J
J J 4
F F J
b)
+ 4
J J J
F F 4
12. Identifiquen en qué base b sucede que: a) (4, 7)b = 51. b) (1, 0, 1, 0, 1)b = 91. c) (1, 3, 4)b = 74. 13. a) ¿Qué puntos del intervalo [0, 1] tienen una expansión en base 3 de la forma (0.a1 , a2 , a3 , a4 , a5 )3 con ai 6= 2 ∀ i = 1, 2, 3, 4, 5? Construyan geométricamente paso a paso el conjunto. 27 28 b) Representen en base 3 los números del intervalo [ 81 , 81 ].
c) Construyan las tablas de sumar y multiplicar en base 3 y realicen las siguientes operaciones:
EJERCICIOS
i) ii) iii) iv) v)
325
211202 + 20212. 201210 − −121201. 2102 × 202. 2112110 ÷ 221. √ 20021.
14. Prueben que 111 no puede ser el cuadrado de un número en ninguna base. 15. Demuestren que la expansión decimal de un número real x: a) Repite al menos un dígito una infinidad de veces si x es racional. b) Pero si x es irracional repite al menos dos dígitos una infinidad de veces. 16. Enumeren los primeros 100 naturales con un sistema de 9 dígitos distintos: {1, 2, . . . , 9}, sin el cero. Construyan las tablas de sumar y multiplicar correspondientes. ¿Se cumple en general que a(b + c) = ab + ac? 17. Propongan la menor base b para la cual: a) b)
1 2, 1 2,
1 1 3 y 4 tengan expansión finita. 1 1 1 1 3 , 4 , 5 y 6 tengan expansión finita.
18. a) Demuestren que un número x tiene expansión decimal finita ⇐⇒ x = ± 2sr5t para algunas r, s, t ∈ N ∪ {0}, expresado en su forma irreducible. b) Más en general: Demuestren que para que un racional irreducible pq tenga expansión finita en base b, es condición necesaria y suficiente que todo factor primo de q sea un factor primo de b. c) Argumenten por qué en cualquier base b (tal y como ha sido definida en este capítulo), siempre existirán racionales (de hecho, una infinidad) que no tienen expansión finita en esa base. 19. El número 142857 tiene la propiedad de que multiplicado por cualquiera de los números 2,3,4,5 o 6 produce solo una permutación cíclica de sus dígitos. ¿Por qué sucede esto? 20. Observen y expliquen por qué ocurre en cualquier base que:
326
LAS EXPANSIONES DECIMALES COMO MODELO DEL CONTINUO
a) En la tabla de sumar los valores de la diagonal N O → SE siempre aumentan de 2 en 2. b) El número en la esquina a la derecha abajo de la tabla de multiplicar es igual al de la tabla de sumar con sus dígitos intercambiados. c) En el último renglón de la tabla de multiplicar, si nos movemos de derecha a izquierda, cada último dígito crece y cada primero disminuye de 1 en 1. 21. Obtengan, colocando los puntos suspensivos hasta que esté claro qué sigue en cualquier momento después de ellos, las expansiones decimales que resultan de: a) Sumar: 0.789789 · · · + 0.4567845678 . . . b) Restar: 0.9292 · · · − 0.163163 . . .
c) Pasar a base 10: (0.2, 1, 3, 5, 0, 1, 5, 3, 5, 0, 1, 5, . . . )6
Capítulo 7
El modelo axiomático Como decíamos al final del capítulo anterior, iniciamos este con la construcción de un nuevo modelo de la recta. El objetivo ahora es descubrir una familia de propiedades o reglas de la suma, el producto y el orden, que tengan la característica, por un lado, de que la recta las cumpla, pero por otro que sean tan virtuosas que si un conjunto las cumple, eso garantice que sea como la recta. El desenlace de toda esta discusión será que cualquier conjunto X en donde puedan ser definidas una suma, un producto y una relación de orden “ 0 (está a la derecha del origen), −b < 0 y viceversa (ver figura 7.2). ? La resta a − b se define como la suma a + (−b). Ver figura (7.3).
? El producto Para obtener ab se aplica el siguiente procedimiento: 1◦ ) Trazamos las rectas L y L0 que se intersecan en O. 2◦ ) Ubicamos la magnitud a en L, y la unidad y la magnitud b en L0 . 3◦ ) Trazamos el segmento que une la unidad con a, y lo desplazamos en forma paralela hasta hacerlo coincidir con b. El punto en donde este segmento desplazado se interseca con L es el valor del producto ab (la semejanza de los triángulos generados conduce a ello). Por supuesto, si
330
EL MODELO AXIOMÁTICO
intercambiamos las rectas en que se ubican unas y otras magnitudes, el resultado aparecerá en L0 (ver figura 7.4)
(a) Con compás. (b) Sin compás.
Figura 7.2: El inverso aditivo.
(a) Con compás.
(b) Sin compás.
Figura 7.3: La resta.
? El inverso multiplicativo Dado b 6= 0, el inverso multiplicativo b−1 = 1b lo obtenemos ubicando la unidad en L, y la unidad misma y b en L0 . Trazamos el segmento que une b con 1 ∈ L, y donde corte en L el segmento paralelo que pase por la unidad en L0 , ahí se encuentra b−1 . Nótese que aplicando el procedimiento establecido para la multiplicación, resulta que b · b−1 = 1.
LAS OPERACIONES Y EL ORDEN EN LA RECTA
(a) ab en L.
Figura 7.4: El producto.
331
(b) ab en L0 .
Hagan ustedes la imagen para el caso en que b < 0. Finalmente, observen que si b se acerca al valor 0, la recta que lo une con la unidad tiende a la horizontal, de manera que la paralela que pasa por la unidad en L0 tiende a una paralela con L, que no se intersecaría con ella. De ahí que el inverso multiplicativo no esté definido si b = 0 (ver figura 7.5).
Figura 7.5: El inverso multiplicativo.
? La división Siendo b 6= 0, el cociente se define como ab = a( 1b ). Tras aplicar el procedimiento para el producto en cuestión, se obtiene el método simplificado ilustrado por la figura 7.6.
Figura 7.6: La división.
332
7.2.
EL MODELO AXIOMÁTICO
Deducción geométrica de las propiedades básicas
? Cerradura Hay algunas propiedades que no se demuestran, sino que se suponen de la recta. Por ejemplo, cuando definimos la suma y el producto entre dos magnitudes, a y b, damos por descontado que al realizar la operación nos resulta nuevamente un punto de la recta, lo cual establece entonces dos reglas que debe cumplir cualquier conjunto X que pretenda ser como la recta: S1 : ∀ a, b ∈ X, a + b ∈ X.
M1 : ∀ a, b ∈ X, ab ∈ X.
Se podría pensar que al suponer esto suponemos que la recta es continua, pero no es así. Estas dos propiedades las pueden cumplir desde conjuntos que no solo dejan “hoyos” sino grandes “barrancos” entre sus elementos, como es el caso de los naturales, hasta conjuntos que tienen sus elementos tan cercanos como se quiera unos de otros, pero dejan puntos sin cubrir, como los racionales (otros, como los irracionales, no las cumplen). o Para probar varias de las propiedades que veremos a continuación, será necesario utilizar un resultado que lleva el nombre del matemático griego Pappus de Alejandría (290-350), en el cual se hace referencia a lo que podríamos definir en general como un hexágono. Se trata de la figura que obtenemos al unir seis puntos en el plano en forma ordenada por medio de otros tantos segmentos de recta, de manera que comencemos y terminemos en el mismo punto. Los lados no solo pueden ser de distinto tamaño, sino que pueden cruzarse entre sí. Si los numeramos en el orden en que los vamos trazando, se consideran los lados opuestos el 1 y el 4, el 2 y el 5, y el 3 y el 6. Teorema 7.1 (Teorema de Pappus).[1] Tómense dos rectas, L y L0 , que se intersecan en un punto o son paralelas entre sí. Considérense los puntos P, Q, R y P 0 , Q0 , R0 en una y [1]
Debemos prevenir al lector: las pruebas comunes de este resultado, que suelen ser muy sencillas, en el fondo utilizan la conmutatividad del producto, y por lo tanto no nos servirían aquí. Una posible prueba —más complicada— que no lo hace, puede ser consultada en Los fundamentos de la Geometría de Hilbert (él le da el nombre de Teorema de Pascal al resultado). Ver D. Hilbert, 1902, pp. 40-46.
DEDUCCIÓN GEOMÉTRICA DE LAS PROPIEDADES BÁSICAS
333
otra recta, ninguno en el punto de intersección de L y L0 , que unimos uno con otro con segmentos de recta de la siguiente manera: P → Q0 → R → R0 → Q → P 0 → P
De esta forma generamos un hexágono, cuyos lados nunca coinciden con las rectas tomadas. Entonces, si dos pares de lados opuestos son paralelos, el tercer par también lo es. El hexágono que obtenemos luce como una especie de “dos equis” pegadas, con los segmentos rectos que unen sus puntas exteriores incluidos (ver figura 7.7).
(a) Para rectas no paralelas.
(b) Para rectas paralelas.
Figura 7.7: Teorema de Pappus.
? Conmutatividad Desde pequeños aprendimos que en la multiplicación y la adición “el orden de los factores no altera el producto” y “el orden de los sumandos no altera la suma”. Claro que aquello se refería a operaciones con enteros, o a lo más racionales, y aquí estamos hablando de todos los puntos de la recta. Tendríamos que preguntarnos si estas propiedades son extendibles a partir de cómo fueron definidas las operaciones en la recta, y la respuesta es que sí lo son. Vamos a demostrarlo. Teorema 7.2. Sean a, b las magnitudes que representan dos puntos cualesquiera en la recta. Entonces ab = ba. Demostración. Tracemos nuestras dos rectas, L y L0 , que se intersecan en un punto O, y ubiquemos a en L, y la unidad y b en L0 . Tomemos el producto ab en L. Llamemos S y S 0 a los segmentos que unen a con el 1 y b con ab respectivamente. Es claro, por la definición de producto, que S k S 0 (ver figura 7.8a). Por otra parte, si ubicamos a y b tanto en L como en L0 , los segmentos T y T 0 que unen a con a y b con b, cumplen claramente que T k T 0 , (ver figura 7.8b).
334
EL MODELO AXIOMÁTICO
Entonces, por el Teorema de Pappus, los segmentos U y U 0 que unen el 1 con b y a con ab, respectivamente (el 1 y a en L0 y b y ab en L), son paralelos entre sí (ver figura 7.8c). Pero como U une b con el 1, el segmento paralelo a él que pasa por a (es decir U 0 ), es el que por definición del producto “ba” corta L en ba. De modo que ab = ba (ver figura 7.8d).
(a)
(b)
(c)
(d)
Figura 7.8: ab = ba.
En cuanto a la conmutatividad de la suma, observen antes que nada la figura 7.7b. Si llaman a = P Q y b = QR, si P Q0 k QR0 y P 0 Q k Q0 R, es inmediato que b = P 0 Q0 y a = Q0 R0 , de modo que, resultando paralelas P P 0 y QQ0 , tenemos que a + b = b + a. El teorema de Pappus es prácticamente la expresión geométrica de esta propiedad. Aunque en la demostración formal tendremos que ajustarnos a obtener a + b y b + a de la manera en que fueron formalmente definidas. Teorema 7.3. Sean a, b las magnitudes que representan dos puntos cualesquiera en la recta. Entonces a + b = b + a. Demostración. 1) Trazamos las dos rectas, L y L0 , que se intersequen en el punto O, y la recta auxiliar ` paralela a L a cualquier altura, que intersecará a L0 en un punto O0 . 2) Localizamos a y b en L, y trazamos los segmentos: S, que une b con O0 ; T k L0 que pasa por a; S 0 k S que pasa por la intersección de T
DEDUCCIÓN GEOMÉTRICA DE LAS PROPIEDADES BÁSICAS
335
con ` (punto A). Por definición de la suma a + b, S 0 corta a L en a + b (figura 7.9a). 3) Sea T 0 k T que pasa por b (corta a ` en un punto B). Por el Teorema de Pappus, los segmentos U que pasa por O0 , y a y U 0 que pasa por A y a + b, son paralelos (figura 7.9b). 4) Pero entonces, por definición de la suma b + a, el segmento U 0 k U que pasa por B corta a L en b + a (figura 7.9c), ∴ a + b = b + a.
(a)
(b)
(c)
Figura 7.9: a + b = b + a.
La suma y la multiplicación en la recta cumplen con ser conmutativas, de modo que si un conjunto X pretende modelar a la recta, debe cumplir lo mismo que la recta cumple: S2 : ∀ a, b ∈ X, a + b = b + a.
M2 : ∀ a, b ∈ X, ab = ba. ? Asociatividad
Teorema 7.4. Sean a, b las magnitudes que representan dos puntos cualesquiera en la recta. Entonces a + (b + c) = (a + b) + c. Demostración. 1) Trazamos las dos rectas, L y L0 , que se intersequen en el punto O, y la recta auxiliar ` paralela a L a cualquier altura, que intersecará a L0 en un punto O0 .
336
EL MODELO AXIOMÁTICO
Sean: A k L0 que pasa por a ∈ L, P = A ∩ ` , y A0 k L0 que pasa por a + b ∈ L, Q = A0 ∩ ` (ver figura 7.10a). 2) Sean: S el segmento que une O0 con c ∈ L, y S 0 k S que pasa por Q ∈ `. Por definición de suma de (a + b) y c, S 0 ∩ L = (a + b) + c (ver figura 7.10b). 3) Sean: T el segmento que une P ∈ ` con c ∈ L y T 0 el segmento que une Q ∈ ` con b + c ∈ L (ver figura 7.10c). Si demostráramos que T k T 0 , se seguiría que 4) por el Teorema de Pappus, los segmentos U que une O0 con b + c ∈ L y U 0 que une P ∈ ` con (a + b) + c ∈ L, serían paralelos. Pero por la definición de la suma entre a y (b + c), el punto en que U 0 corta a L es igual a a + (b + c). Por lo tanto (a + b) + c = a + (b + c) (ver figura 7.10d). Así es que el problema se reduce a probar que T k T 0 . 5) Para ello, todo el arte está en descubrir entre los múltiples trazos otro hexágono de Pappus adecuado: observen la figura 7.10e. Si tomamos el punto R ∈ ` donde llega la paralela a L0 que pasa por c ∈ L, las líneas azules son claramente paralelas entre sí (por construcción). Las cafés también lo son, por la definición de a + b y c + b (que dada la conmutatividad de la suma es igual a b+c). Entonces, por el Teorema de Pappus, T k T 0 , y con ello hemos terminado nuestra demostración. Teorema 7.5. Sean a, b las magnitudes que representan dos puntos cualesquiera en la recta. Entonces a(bc) = (ab)c. Demostración. Como el producto es conmutativo, a(bc) = (bc)a, y ab = ba, por lo tanto, si demostramos que (bc)a = (ba)c habremos terminado. Sean, como siempre, L y L0 que se intersecan en un punto O. Tomamos 1, a y c en L0 y b en L. 1) Sean los segmentos R que pasa por b ∈ L y 1 ∈ L0 , S k R que pasa por a ∈ L0 y S 0 k R que pasa por c ∈ L0 . Por definición del producto, S y S 0 cortan L en ba y bc respectivamente (ver figura 7.11a). 2) Sean ahora los segmentos T que une 1 ∈ L0 con bc ∈ L y T 0 k T que pasa por a ∈ L0 . Por definición del producto, T 0 corta a L en (bc)a (ver figura 7.11b). 3) Tomemos finalmente los segmentos U que une 1 ∈ L0 con ba ∈ L y U 0 que une c ∈ L0 con (bc)a ∈ L. Por el Teorema de Pappus, U k U 0 (ver figura 7.11c).
DEDUCCIÓN GEOMÉTRICA DE LAS PROPIEDADES BÁSICAS
(a)
(b)
(c)
(d)
(e)
Figura 7.10: a + (b + c) = (a + b) + c.
337
338
EL MODELO AXIOMÁTICO
4) Pero si U k U 0 , por definición del producto (ba)c, como U pasa por 1 ∈ L0 y ba ∈ L, la paralela a U que pasa por c ∈ L0 (es decir, U 0 ) corta a L en (ba)c (ver figura 7.11d), ∴ (ba)c = (bc)a.
(a)
(b)
(c)
(d)
Figura 7.11: (bc)a = (ba)c.
Tenemos entonces que el producto y la suma son asociativas en la recta, por lo tanto deberán serlo también en el conjunto con el cual sea modelada la recta: S3 : ∀ a, b, c ∈ X, a + (b + c) = (a + b) + c.
M3 : ∀ a, b, c ∈ X, a(bc) = (ab)c.
? Existencia del neutro Si observamos la definición de suma en la recta (figura 7.1), es inmediato que al sumarle b = 0 a cualquier número a en la recta, lo deja igual. Si b se separa del 0 aunque sea mínimamente, al sumar a + b el resultado se desplaza de la posición inicial de a aunque sea muy poco, es decir que la suma en la recta tiene un elemento neutro (el origen) y es único. Algo similar ocurre con el producto (figura 7.4): para obtener ab cuando b = 1, tenemos que trazar un segmento paralelo S 0 al segmento S que une a ∈ L con el 1 ∈ L0 , que pasa por el 1 ∈ L0 , así que S 0 = S y entonces a·1 = a. Esto deja de ocurrir si el segmento paralelo lo hacemos pasar por cualquier punto que se separe del 1, así sea muy poco, de modo
DEDUCCIÓN GEOMÉTRICA DE LAS PROPIEDADES BÁSICAS
339
que el producto en la recta tiene también un único elemento neutro, que es el que corresponde a la unidad. Otro detalle: en la recta el 0 es diferente del 1. Tenemos entonces tres propiedades más que debe cumplir un conjunto que modele a la recta: S4 : ∃ un elemento “0” ∈ X tal que ∀ a ∈ X, a + “000 = a
M4 : ∃ un elemento “1” ∈ X tal que ∀ a ∈ X, a · “100 = a A : “000 6= “100
? Existencia del inverso De la figuras 7.2 y 7.5, y de lo comentado en las definiciones correspondientes, es claro que todo punto tiene inverso aditivo, y si es distinto del cero (el neutro aditivo) también inverso multiplicativo, obteniéndose ambos de manera única. Así es que si X modela la recta, debe cumplir que: S5 : ∀ a ∈ X, ∃ − −a ∈ X tal que a + (− − a) = “000
M5 : ∀ a ∈ X, a 6= “000 ∃ a−1 ∈ X tal que a · a−−1 = “100 ? Distributividad Recordemos que entre los enteros el producto distribuye a la suma. Veremos que tal y como fueron definidas estas operaciones en la recta, esta es una propiedad que cumplen todos sus puntos. Teorema 7.6. Sean a, b, c las magnitudes que representan tres puntos cualesquiera en la recta. Entonces a(b + c) = ab + ac. Demostración. Trazamos como siempre nuestras rectas, L y L0 , que se intersecan en un punto O. 1) Tomamos a ∈ L y 1, b, c ∈ L0 . Obtenemos los productos ab y ac en L, recurriendo a los segmentos paralelos S1 , S2 , S3 que se ilustran en la figura 7.12a. 2) Ahora obtenemos la suma b+c pero sobre L0 (no sobre L, como en todos los casos anteriores). Para ello tomamos una línea auxiliar `0 k L0 que hacemos pasar por ac ∈ L, y tomamos un segmento T k L que pase por b ∈ L0 . El segmento S4 k S2 que pasa por la intersección de T y `0 , corta L0 en b + c. Pero además ese mismo segmento S4 prolongado hasta
340
EL MODELO AXIOMÁTICO
L (llamémosle S40 ) la toca en a(b + c), pues es paralelo al segmento S1 , que une al 1 ∈ L0 con a ∈ L, y pasa por b + c ∈ L0 (ver figura 7.12b). 3) Finalmente sumamos ab + ac sobre L. Para ello trazamos una línea auxiliar ` k L que hacemos pasar por c ∈ L0 . Tomamos después un segmento U k L0 que vaya de ab ∈ L a la recta ` (obsérvese que ese segmento tiene longitud c), alcanzándola en el punto Q, que coincide con ser a su vez la intersección de S4 con `. El segmento paralelo a S2 que pase por ese punto, cortará L en ab + ac. Pero ese segmento es precisamente S40 , que cortaba L en a(b + c) (ver figura 7.12c), ∴ a(b + c) = ab + ac.
(a)
(b)
(c)
Figura 7.12: a(b + c) = ab + ac.
DEDUCCIÓN GEOMÉTRICA DE LAS PROPIEDADES BÁSICAS
341
Así es que nuestro conjunto X también debe cumplir que D : ∀ a, b, c ∈ X, a(b + c) = ab + ac. o El orden en la recta Mencionaremos brevemente cuatro propiedades básicas del orden en la recta que resultan más o menos inmediatas, aportando tan solo alguna idea intuitiva (tal y como fue la “definición” misma que dimos del orden en la recta) para respaldarlas: ? Dados dos puntos en ella, no hay más que tres posibilidades: o el primero está a la izquierda del segundo, o está a su derecha o son el mismo. ? Si un punto está a la izquierda de otro, y este a su vez a la izquierda de otro más, el primero habrá quedado a la izquierda del tercero. ? Si un punto está a la izquierda de otro, y sumamos a ambos la misma cantidad, sea positiva o negativa, simplemente desplazamos a ambos la misma distancia hacia la derecha o hacia la izquierda, así es que después del desplazamiento el que estaba a la izquierda lo sigue estando. Es fácil comprobar esto aplicando el procedimiento con el que definimos la suma en la recta. ? ¿Qué sucede si un punto está a la izquierda de otro, y multiplicamos ambos por una magnitud positiva?, veamos: Sean a, b, c tres magnitudes que representan puntos en la recta, tales que a < b y c > 0. Localicemos a, b ∈ L y al 1 y c ∈ L0 . Tomemos los segmentos S y T que unen el 1 en L0 con a y b en L respectivamente. Para obtener ac y bc debemos tomar dos segmentos S 0 k S y T 0 k T y hacer pasar ambos por el punto c ∈ L0 , de modo que S 0 y T 0 coinciden en c, formando un ángulo idéntico al que forman S y T coincidiendo en el 1. Como a < b, S queda a la izquierda de T , así es que S 0 quedará a la izquierda de T 0 , y entonces ac < bc (ver figura 7.13).
Figura 7.13: ac < bc y c > 0 =⇒ ac < bc.
342
EL MODELO AXIOMÁTICO
Estas son cuatro propiedades básicas que debe cumplir el orden que se defina en un conjunto X que pretenda representar a la recta (pues en ella efectivamente se cumplen): O1 : ∀ a, b ∈ X, a < b, ob < a o a = b.
O2 : ∀ a, b, c ∈ X, a < b y b < c =⇒ a < c.
Tricotomía Transitividad
O3 : ∀ a, b, c ∈ X, a < b =⇒ a + c < b + c.
O4 : ∀ a, b, c ∈ X, a < b, c > 0 =⇒ ac < bc.
7.3.
Propiedades que se desprenden de las básicas
Las propiedades de las operaciones y el orden en la recta que vimos en la sección anterior ¿son todas?, no, hay muchas más. Pero sucede algo interesante con ellas que comentaremos después del siguiente resultado. Teorema 7.7. Sea a la magnitud que representa a cualquier punto en la recta. Entonces a · 0 = 0 (donde 0 es, naturalmente, la magnitud que corresponde al origen). Demostración tipo I. Tomemos nuestras rectas L y L0 que se intersecan en el punto O. Ubicamos a a ∈ L y al 1 en L0 y trazamos el segmento S que los une. ¿En qué punto corta a L el segmento S 0 k S que pasa por el origen de L0 , que no es otro que O?, pues en O mismo, así es que a · 0 = 0 (ver figura 7.14).
Figura 7.14: a · 0 = 0.
PROPIEDADES QUE SE DESPRENDEN DE LAS BÁSICAS
343
Demostración tipo II. S M S S D a·0 =4 a·0+0 =5 a·0+(a+(−a)) =3 (a·0+a)+(−a) =4 (a·0+a·1)+(−a) = S
M
S
a(0 + 1) + (−a) =4 a · 1 + (−a) =4 a + (−a) =5 0.
o ¿Qué observaciones podemos hacer de una y otra demostración? 1) La segunda nos ilustra que la propiedad enunciada por este teorema no es esencial (no es que no sea importante), en el sentido de que se trata de una propiedad que se desprende de las demás. 2) La primera demostración garantiza la propiedad tan solo para los puntos de la recta. Mientras que la segunda lo hace para los elementos de cualquier conjunto en el que se puedan definir una suma y un producto entre sus elementos que cumplan las propiedades S3 , S4 , S5 , M4 y D. Lo primero es importante para ir haciendo el “cernido” del que hablábamos más atrás, de manera que nos vayamos quedando con las propiedades esenciales que cumple la recta al operar entre sus elementos y podamos determinar así las condiciones que deberá cumplir un conjunto que pretenda modelarla. Lo segundo será importante más adelante, pues veremos que hay conjuntos muy diversos que satisfacen las propiedades básicas que cumple la recta respecto a sus operaciones, y entonces cada nueva propiedad que probemos con una demostración tipo II, automáticamente pasará a ser válida también para esos otros conjuntos; sin sentirlo, estaremos obteniendo resultados mucho más generales de lo que nos imaginamos. Respecto de lo primero debemos subrayar que las propiedades que probamos en la sección anterior nos permiten deducir todas las reglas que hemos aplicado durante años en nuestro trabajo con los racionales: las reglas que establecen cómo se suman, restan, multiplican y dividen; las de los signos; las que aplicamos para despejar en una ecuación; las reglas de las potencias, etc. En el álgebra juegan un papel similar al que juegan en la geometría los postulados de Euclides: con cinco propiedades básicas[2] (más otras tantas “nociones comunes”), se deducen (en los 13 libros de Los Elementos) a base de razonamientos lógicos no menos de 467 proposiciones diferentes. [2] Con el paso del tiempo, particularmente en el siglo xix, se fue haciendo claro que implícitamente se estaban presuponiendo otras cosas en algunas de las demostraciones. Eso llevó a reformular la base axiomática de la geometría euclidiana. El trabajo más relevante en este sentido fue el de los Fundamentos de la Geometría de Hilbert, en el que rehizo todo a partir de 20 axiomas, en lugar de los cinco originales de Euclides.
344
EL MODELO AXIOMÁTICO
Todo el álgebra que aprendimos en la secundaria para los racionales queda demostrado a partir de S1 , S2 , . . . , S5 , M1 , M2 , . . . , M5 , D, A. Se trata de una magnífica selección de propiedades, que al pedirle a un conjunto que las cumpla, tenemos garantizado que podremos operar con él como siempre lo hemos hecho con los racionales y, geométricamente al menos, con la recta. Algo similar ocurre con las cuatro propiedades del orden. Los conjuntos que cumplen S1 , . . . , D, A reciben el nombre de campos, y dentro de ellos, los que además cumplen las propiedades O1 , O2 , O3 y O4 son llamados campos ordenados. Enlistaremos entonces, dentro de solo dos enunciados, una amplia familia de estas propiedades. Las pruebas son bastante accesibles y se pueden encontrar en un sinnúmero de libros de cálculo, de modo que las omitiremos aquí.[3] Se trata de un excelente ejercicio para ir aprendiendo a demostrar ordenadamente proposiciones matemáticas. Teorema 7.8. Sea X un campo. Sean a, b, c, d y x en X. Entonces: 1. Los neutros e inversos aditivos y multiplicativos son únicos.[4] 2. −a = −“1”(a). 3. −(−a) = a. 4. a(b − c) = ab − ac, (a − b)c = ac − bc. 5. (a + b)(c + d) = ac + ad + bc + bd. 6. a(−b) = −(ab) = (−a)b, (−a)(−b) = ab. 7. Si a + b = a + c =⇒ b = c. 8. Si a 6= 0, (a−1 )
−1
= a.
9. Si ab = ac y a 6= 0 =⇒ b = c. [3]
Ver, por ejemplo, Haaser, La Salle, Sullivan, 1959, pp. 12-23; G. Bates, F. Kiokemeister, 1960, pp. 12-31; T. Apostol, 1966, vol. 1, pp. 17-21; E. Bloch, 2011, pp. 66-69. [4] Habremos observado que en la deducción geométrica de las propiedades básicas, la unicidad de los neutros e inversos iba quedando garantizada a la par de su existencia. Sin embargo, a la hora de enunciar formalmente las propiedades no hicimos mención de las unicidades. Esto fue así porque se pueden deducir de las básicas, como se propone en este inciso.
PROPIEDADES QUE SE DESPRENDEN DE LAS BÁSICAS
345
10. ab = 0 ⇐⇒ a = 0 o b = 0.
a b a 12. Si b, d 6= 0, b
c ad + bc = . d bd c ac · = . d bd
11. Si b, d 6= 0,
+
13. Si b, c, d 6= 0,
a b c d
=
ad . bc
14. Si a 6= 0, ax + b = 0 ⇐⇒ x = −a−1 b. 15. a2 = b2 ⇐⇒ a = b o a = −b. A veces un resultado parece tan evidente, que podemos pensar que no dice nada nuevo. Pero no es así; el inciso 2), por ejemplo, establece que podemos obtener el inverso aditivo de un número cualquiera multiplicando el inverso aditivo del 1 (el neutro multiplicativo) por el número. El inciso 3) nos dice que el inverso aditivo del inverso aditivo de un número, es el número original. El 6) establece las “reglas de los signos”. El 7) da la pauta para que lo que está sumando pasa restando y al revés. El 8) establece que el inverso multiplicativo del inverso multiplicativo de un número es de nuevo el número original. El 9) da la pauta para pasar dividiendo lo que está multiplicando y viceversa. Los incisos 11) y 12) extienden las reglas conocidas para sumar y multiplicar “quebrados” al caso de cualesquiera dos números en X. El 13) nos plantea que la “ley de la tortilla” es válida en general. El 14) da la base para la solución de ecuaciones de primer grado. El 15) da la clave para la solución de ecuaciones de segundo grado. Si todas estas propiedades las probamos con demostraciones tipo II, su validez irá más allá de los puntos de la recta (y los conjuntos que la modelen), podremos darlas por garantizadas para los elementos de cualquier conjunto que cumpla las propiedades de campo. Cumpliendo estas últimas tenemos garantizado que se puede operar con sus elementos tal y como lo hacemos; por ejemplo, con los racionales. ¿Y hay más conjuntos que cumplen las que hemos llamado básicas (es decir, las de campo)? Los números complejos son un ejemplo notable de lo anterior, u “objetos” más “diferentes” de los números, como las funciones racionales (cocientes de polinomios) con coeficientes racionales. Una vez que se demuestra que con la suma y el producto que se define entre ellos
346
EL MODELO AXIOMÁTICO
se cumplen las propiedades de campo, queda garantizado que es posible operarlos utilizando todas las reglas mencionadas antes (y las no enlistadas, pero que pueden igualmente probarse con base en las prime√ ras). También forman un campo todos los números de la forma a+b p, donde a, b ∈ Q y p es un número primo. Otro ejemplo relevante es el conjunto de los números algebraicos, que mencionamos en el capítulo 3. o Las propiedades de campo no obligan por sí mismas a un conjunto a ser infinito. Si tomamos por ejemplo X = {0, 1}, con la suma y producto definidos como + 0 1
0 0 1
1 1 0
0 0 0
× 0 1
1 0 1
es fácil probar que se trata de un campo, que por cierto es utilizado en lógica y teoría de la computación. O un conjunto como X = {0, 1, 2, 3, 4}, con suma y producto: + 0 1 2 3 4
0 0 1 2 3 4
1 1 2 3 4 0
2 2 3 4 0 1
3 3 4 0 1 2
4 4 0 1 2 3
× 0 1 2 3 4
0 0 0 0 0 0
1 0 1 2 3 4
2 0 2 4 1 3
3 0 3 1 4 2
4 0 4 3 2 1
que también se puede probar que cumple todos los requisitos de un campo. Obsérvese que en uno y otro ejemplo las operaciones funcionan igual que si sumáramos en base 2 y 5 respectivamente, pero anulando el segundo dígito (de derecha a izquierda) en los casos en que aparece. En realidad, estamos tomando los números que son congruentes con 2 y 5. Se puede probar que esta forma de definir las operaciones convierte cualquier conjunto finito de números naturales en un campo, siempre y cuando el número p de sus elementos sea un número primo. Estos campos (finitos módulo p), utilizados en teoría de números, son conocidos como campos de Galois de característica p. o Veamos ahora algunas otras propiedades que se deducen de las propiedades de orden agregadas a las de campo (es decir, las que definen a un campo ordenado).
PROPIEDADES QUE SE DESPRENDEN DE LAS BÁSICAS
347
En lo sucesivo dejaremos de colocar las comillas en el 0 y el 1; en todo momento se sobreentenderá que estamos hablando del elemento del campo ordenado que juega el papel del 0 (es decir el neutro aditivo) y del que juega el papel del 1 (es decir el neutro multiplicativo). Teorema 7.9. Sea X un campo ordenado. Sean a, b, c y d en X. Entonces: 1. Si a 6= 0 =⇒ a2 > 0. 2. 0 < 1. 3. Si a < b y c < d =⇒ a + c < b + d. 4. Si a < b =⇒ −a > −b. 5. Si a < b y c < 0 =⇒ ac > bc. 6. ab > 0 ⇐⇒ a, b > 0 o a, b < 0. 7. ∴ ab < 0 ⇐⇒ a > 0, b < 0 o a < 0, b > 0. 8. Si 0 ≤ a < b, 0 ≤ c < d =⇒ ac < bd. 9. a−1 tiene el mismo signo que a. 10. Si a, b tienen el mismo signo y a < b =⇒ a−1 > b−1 . a 11. (i) Si 0 < a y 0 < b < 1 =⇒ > a. b a (ii) Si 0 < a y b > 1 =⇒ < a. b 12. Si 0 < a < b =⇒
a b 1. b a
13. Si a, b ≥ 0, a < b ⇐⇒ a2 < b2 . De manera análoga a las propiedades que vimos, estas proveen la herramienta básica para trabajar con desigualdades. No debemos perder de vista que todo el desarrollo formal del concepto de límite, el trabajo con los conceptos de función monótona, función acotada y función continua requiere del manejo algebraico sistemático de desigualdades. Algunas propiedades, como la 11) y la 12), son clave además para realizar el análisis geométrico de los cocientes de funciones.
348
EL MODELO AXIOMÁTICO
Antes de retomar el hilo de nuestro capítulo, preguntándonos si cumpliendo las propiedades de campo ordenado es suficiente para que un conjunto sea como la recta (es decir, si con esas propiedades ya queda bien modelada la recta), haremos una doble pausa, por un lado, para hacer algunos comentarios más sobre el teorema de Pappus y su lugar en la fundamentación de la matemática; y por el otro, para echarle un vistazo a otras dos características de la recta que desde un comienzo supusimos verdaderas y aun no hemos abordado: la propiedad arquimedeana y la divisibilidad infinita.
7.4.
La importancia del teorema de Pappus
o Hay una reflexión que valdría la pena hacer a la luz de lo visto en las dos últimas secciones. No deja de llamar la atención que todas las reglas que se requieren en el álgebra se resuman en cuatro propiedades clave de cada operación (conmutatividad, asociatividad, existencia del neutro y existencia del inverso) y una más que relaciona las dos operaciones fundamentales (distributividad). A la vez, no deja de ser significativo que exista un puente tan directo entre lo que ocurre en dos terrenos aparentemente independientes de la matemática —el álgebra y la geometría— resultando tan relativamente fácil pasar del uno al otro, desprender de uno lo que se necesita en el otro. Dentro de esta cadena de asombros, en la cúspide se encuentra el hecho de que en última instancia toda el álgebra se pueda deducir de un solo resultado de la geometría (junto con otros tres axiomas que le permiten desenvolverse): el teorema de Pappus. El matemático australiano, brillante escritor de textos, John Stillwell, ha dicho hace no mucho que aquellos científicos que han dedicado sus esfuerzos a encontrar señales de vida inteligente en el universo a través de identificar posibles patrones relacionados con los número primos o el teorema de Pitágoras en medio de la radiación cósmica de microondas que llega a la Tierra, quizás debieran empezar a buscar señales relacionadas con el teorema de Pappus, habida cuenta de la sorprendente universalidad que encierra este resultado. Parece mentira que acompañando el teorema de Pappus de la aceptación de tres hechos simples, a saber: 1) que cualesquiera dos puntos caen en una sola línea; 2) que cualesquiera dos líneas se encuentran en un único punto;
LA IMPORTANCIA DEL TEOREMA DE PAPPUS
349
3) que podemos empezar todo al menos con cuatro puntos, de los cuales a lo más dos coinciden en una misma línea, podamos levantar todo el álgebra y la geometría a partir de ahí.
Figura 7.15: Las líneas paralelas se intersecan en un punto.142
350
EL MODELO AXIOMÁTICO
Nótese que el segundo de los supuestos niega el sentido que en la geometría euclidiana tienen las rectas paralelas. Aquí las paralelas también se tocan en un punto, que podemos llamar el punto al infinito. Pero esto no tiene nada de extraño. Hemos visto en más de una ocasión los dibujos hechos en perspectiva, o imágenes de largos pasillos, o grandes explanadas con mosaicos cuyas líneas de separación se juntan a lo lejos en lo que quizás llamamos alguna vez punto de fuga. Si dirigimos las líneas en una dirección diferente, obtendremos otro punto al infinito, que también pertenece al plano en que se desenvuelve esta geometría.
Figura 7.16: Tres puntos al infinito, una línea al horizonte.143
Dado lo que señala el primero de los supuestos, basta con que existan dos puntos al infinito para que se pueda hablar de toda una línea al infinito, lo cual tampoco es extraño. Si alguna vez, estando frente al mar, hemos dirigido nuestra mirada a lo lejos, hemos tenido frente a nosotros una imagen de lo que es esa línea al infinito: el horizonte.
LA IMPORTANCIA DEL TEOREMA DE PAPPUS
351
Podemos imaginar que dirigimos familias de líneas paralelas entre sí, pero no paralelas las de una familia con las de otra, y veremos que cada familia “se junta” en un punto del horizonte. Todo esto no es extraño, ya que desde el siglo xv diversos pintores reflejaron en sus obras esta geometría que se ajusta perfectamente a nuestros sentidos. o La formulación general del teorema de Pappus es un poco distinta a la que vimos dos secciones atrás. Lo que dice es que si formamos un hexágono alternando sus vértices en dos líneas, tres en cada una, y prolongamos suficientemente los lados opuestos, estos se intersecarán en tres puntos (uno por cada par de lados) que siempre caen sobre una misma línea (ver figuras 7.17 y 7.18).
(a) Ningún par de lados paralelos.
(b) Un par de lados paralelos.
(c) Dos-tres pares de lados paralelos.
Figura 7.17: Teorema de Pappus general.
352
EL MODELO AXIOMÁTICO
Figura 7.18: Dos-tres pares de lados paralelos: traslado al plano proyectivo.
Solo que como aquí las paralelas también se intersecan, esto da lugar a tres casos: 1) Cuando ningún par de lados opuestos es paralelo. En este caso, los tres puntos de intersección son finitos y la línea a la que pertenecen es una línea común de la geometría euclidiana (ver figura 7.17a). 2) Cuando un par de lados es paralelo, y los otros dos pares no lo son, ¿qué ocurre en este caso?, que los dos pares no paralelos definen
LA IMPORTANCIA DEL TEOREMA DE PAPPUS
353
una línea, y la única forma de coincidir con las intersección de los dos paralelos es en el punto al infinito. Es decir, que en este caso, la línea que incluye las dos intersecciones finitas resulta paralela al par de lados opuestos que son paralelos entre sí (ver figura 7.17b). 3) Cuando dos pares de lados son paralelos entre sí, ¿cuáles serían los dos puntos de intersección de uno y otro par?, dos diferentes puntos al infinito, y los cuales definen la línea al infinito. Como la intersección del tercer par debe caer también en esa línea, eso significa que los lados del tercer par deben ser también paralelos entre sí. Eso es lo que dice el teorema 7.1, que es conocido como la versión afín del teorema de Pappus (en razón de que es en la geometría afín donde se estudian las propiedades de las líneas paralelas, que no existen como tales en el plano proyectivo) (ver figuras 7.17c y 7.18). Nótese que el que podríamos haber pensado como cuarto caso, que sería cuando los tres pares de lados opuestos sean paralelos entre sí, es de hecho el caso anterior. Lo que no ocurrió fue que dos pares de lados fueran paralelos y el tercero no lo fuese. o El teorema de Pappus no se puede demostrar a partir de las tres propiedades básicas de esta geometría (proyectiva) a la que hicimos referencia. Dentro de ella se considera el cuarto (y último) axioma. Si no nos apoyamos en ella, sino en la geometría euclidiana, podemos hacer diversas pruebas de él. Una prueba sencilla es la siguiente (la haremos para la versión afín, es decir la enunciada en el teorema 7.1):
Figura 7.19
Tomemos nuestras dos rectas, L y L0 , que se intersecan en el punto O, y los puntos A, B, C ∈ L y P, Q, R ∈ L0 (ver figura 7.19). Trazamos nuestro hexágono de manera que los lados AP k CR (líneas verdes) y AQ k BR (líneas azules). Lo que tenemos que demostrar es que BP k CQ (líneas rojas). Pero basta con observar el dibujo para percatarnos
354
EL MODELO AXIOMÁTICO
de que con ello hemos generado dos pares de triángulos semejantes (los delimitados por L, L0 y los pares de lados del mismo color). Entonces, si llamamos OA = a, OB = b, OC = c, OP = p, OQ = q, OR = r, tenemos que a c = =⇒ ar = pc p r a b y = =⇒ ar = bq q r b c =⇒ bq =pc =⇒ = =⇒ BP k CQ, p q
(7.1) (7.2) (7.3)
y está bien. El detalle es que si luego vamos a usar este teorema para probar la conmutatividad del producto, tal y como hicimos en la sección §7.2, tendríamos que tener cuidado de no haber supuesto la conmutatividad en esta prueba. Si hacemos con cuidado las cosas, veremos que aquí la usamos no una, sino varias veces. Esto, además de la asociatividad, la existencia del neutro y del inverso multiplicativos. Veamos: ¿Cómo definimos el cociente de dos números xy ?, como x · y −1 (ver pág. 331). Entonces, haciendo nuevamente lo que hicimos antes pero cuidando “los detalles”, el desarrollo sería así: Empezando con (7.1): a c = ⇒ ap−1 = cr−1 . p r Multiplicamos a ambos lados por pr: M3 ,M2
(ap−1 )(pr) = (cr−1 )(pr) =⇒ a(p−1 p)r = (cr−1 )(rp) M2 ,M3 ,M5
=⇒
M5 ,M2
a(pp−1 )r = c(r−1 r)p =⇒ a(1)r = c(rr−1 )p M4 ,M5
M
4 =⇒ ar = c(1)p =⇒ ar = cp.
Y algo análogo ocurre al dar los pasos cuidadosamente en (7.2) y (7.3). Este es un problema general de las demostraciones comunes del teorema de Pappus. Hilbert, como mencionamos en el pie de las páginas 332 y 343, desarrolló una demostración que se basaba en algunos de los
LA PROPIEDAD ARQUIMEDEANA Y LA DIVISIBILIDAD INFINITA
355
20 axiomas introducidos por él para reformular la geometría euclidiana, pero evitaba hacer uso de la conmutatividad. o Por cierto, como comentamos también en uno de esos pies de página, Hilbert se refiere al teorema de Pappus como teorema de Pascal. Blaise Pascal (1623-1662) fue un brillante matemático, físico, inventor y filósofo religioso francés; hijo de Étienne Pascal, que a su vez fue amigo de Girard Desargues (1591-1661), otro matemático e ingeniero francés que desarrolló la geometría proyectiva, uno de cuyos resultados está íntimamente relacionado con el teorema de Pappus. No nos detendremos en este último, pero haremos un breve comentario del teorema de Pascal (propuesto por Blaise cuando tenía apenas 16 años). El teorema dice prácticamente lo mismo que el de Pappus, pero construyendo el hexágono sobre cualquier cónica. Es decir: si formamos un hexágono tomando seis puntos en una cónica, y prolongamos suficientemente sus lados, entonces los tres pares de lados opuestos se intersecarán en tres puntos que caen en una misma línea (ver figura 7.20). Como recordaremos, una cónica se obtiene al cortar con un plano un cono; si lo cortamos en una determinada posición, lo que nos resulta en realidad es un par de rectas (hipérbolas degeneradas), y es en ese caso el teorema coincide tal cual con el de Pappus.
7.5.
La propiedad arquimedeana y la divisibilidad infinita
o Comencemos esta parte haciéndonos una pregunta que tenemos pendiente: ¿cómo es que unas propiedades pueden “moldear” un conjunto? Por el inciso 2 del teorema 7.9, 0 < 1. Entonces, aplicando S1 , S4 y O3 llegamos a que 1 + 1 ∈ X y 0 + 1 = 1 < 1 + 1. Así es que tendría que haber un elemento en X que fuese como el 2 ∈ N. Definimos entonces 2 = 1 + 1, y volvemos a aplicar las mismas tres propiedades, obteniendo que 2 + 1 ∈ X y como 1 < 2 ⇒ 1 + 1 < 2 + 1 ⇒ 2 < 2 + 1. O sea que habría otro elemento en X que juega el papel del 3 ∈ N. Definimos entonces el 3 ∈ X como 3 = 2 + 1. En general, si hay un elemento en X como el n ∈ N, al aplicar S1 , S4 y O3 llegaremos a que n + 1 ∈ X y n < n + 1, dando lugar a definir al elemento n + 1 ∈ X.
356
EL MODELO AXIOMÁTICO
Figura 7.20: Teorema de Pascal: los tres casos sobre la elipse.
En otras palabras, cumpliendo las propiedades citadas, X deberá contener a un conjunto que es como N. Por otra parte, por S5 , dada n ∈ X, debe existir una −n ∈ X tal que n + (−n) = 0. Así es que X tuvo que ser al menos como Z. Por otra parte, considerando la propiedad M5 , dada n ∈ N, debe existir un n−1 = n1 ∈ X tal que n · n−1 = 1. Pero entonces, por M1 , dada cualquier otra m ∈ Z ⇒ m · n−1 = m n ∈ X. Es decir que X tiene que ser al menos como Q. Las propiedades de campo ordenado “obligan” a X a ser por lo menos como Q (a contener a un conjunto como Q). o Pero hay algo más que no queda recogido aun por las propiedades de campo ordenado. Tal y como lo comentamos en la sección §6.2 (ver pág. 293), desde la construcción del modelo de las expansiones decimales —y en otras bases— hay dos propiedades de la recta que supusimos “sin sentirlo” todo el tiempo, que analizaremos a continuación.
LA PROPIEDAD ARQUIMEDEANA Y LA DIVISIBILIDAD INFINITA
357
Una, que dado cualquier punto P , siempre existe una n ∈ N, que multiplicada por la unidad rebasa a P . Esto lo utilizamos cuando decíamos que para medir la distancia del origen al punto (y a través de ello obtener el número buscado) había que colocar la unidad a continuación de sí misma hasta rebasarlo, y quedarse con el entero justo anterior. La otra, que por muy pequeña que sea una distancia en la recta, siempre hay una subdivisión de la unidad capaz de hacerse más pequeña que la distancia dada. Es así que lográbamos pegarnos tanto como quisiéramos al punto por la izquierda (estando este ubicado a la derecha del origen). Como lo mencionamos, la primera se conoce como la Propiedad arquimedeana (PA), y la segunda como Principio de Divisibilidad Infinita (PDI).[5] Enunciadas sobre un campo ordenado X en general, diríamos tal que n > x. 1 P DI : ∀ x ∈ X, x > 0 ∃ n ∈ N tal que 0 < < x. n Nótese que ambas presuponen a los números naturales dentro del campo, pero acabamos de ver que en todo campo ordenado está inmerso un conjunto como los naturales, así es que no tenemos problema. Es fácil demostrar que una y otra propiedad son en realidad equivalentes. P A : ∀ x ∈ X, x > 0 ∃ n ∈ N
Teorema 7.10. Sea X un campo ordenado. Entonces: X satisface la propiedad arquimedeana ⇐⇒ X cumple el principio de divisibilidad infinita. T.7.9(9) 1 Demostración. Sea x ∈ X, x > 0 =⇒ > 0. De aquí partiremos en x la prueba tanto en una dirección como en la otra: 1 hip. ⇒) =⇒ ∃ n ∈ N tal que n > > 0. x 1 x Multiplicando a ambos lados por > 0 =⇒ 0 < < x. n n 1 1 hip. ⇐) =⇒ ∃ n ∈ N tal que 0 < < . n x Multiplicando a ambos lados por nx > 0 =⇒ 0 < x < n. [5]
En la sección §2.8 comentamos que el crédito de esta idea se la dio el propio Arquímedes a Eudoxo. La formulación original de Arquímedes dice así: “La mayor de dos cantidades dadas, sea línea, superficie o sólido, excede a la menor en una diferencia que, multiplicada suficientes veces, supera a ambas cantidades”.144
358
EL MODELO AXIOMÁTICO
o Aunque no es inmediata su construcción, se pueden obtener campos ordenados que no cumplen estas dos propiedades (de hecho, por el teorema anterior basta con argumentar que no cumplen alguna de ellas),145 lo cual viene a demostrar que no se pueden deducir de las propiedades de campo ordenado. Necesitamos agregar una de ellas a nuestra seleccción de propiedades básicas para modelar la recta, lo usual es agregar la PA. Así, los campos ordenados que la cumplen son llamados campos ordenados arquimedeanos. Teorema 7.11. Q es un campo ordenado arquimedeano. Dejamos la prueba al lector es bastante sencilla. Si unimos el último teorema con lo que obtuvimos al inicio de esta sección, podemos concluir que Q es de hecho “el más chico” de los campos ordenados arquimedeanos (en el sentido de que cualquiera otro contiene a uno “como él”). o El PDI (o la PA) juega un papel muy importante en toda la teoría de convergencia, pues es constantemente utilizado en las demostraciones de límite de sucesiones. Sin mostrar por ahora el tránsito desde la idea más intuitiva hasta la definición formal del concepto de límite (es otro tema que reviste el mayor interés), solamente adelantaremos que restringiéndonos al caso en que el límite fuese un valor L ∈ X, una sucesión {an } → L cuando n → ∞, si dada cualquier distancia ε > 0 alrededor de L, hay un término de la sucesión a partir del cual todos están más cerca de L que la distancia dada. El siguiente es un ejemplo clásico. Ejemplo 7.12. Probar que la sucesión { n1 } → 0. Solución. Damos una ε > 0, aplicamos el PDI y afirmamos entonces que ∃ N ∈ N tal que N1 < ε. Luego utilizamos el inciso 10 del teorema 7.9 para deducir que si n > N =⇒ n1 < N1 < ε y tenemos entonces que todos los términos de la sucesión a partir del que nos garantizó el PDI, quedan más cerca del 0 que la ε > 0 dada, así es que el 0 es el límite de la sucesión { n1 }. ? Nótese que lo que hemos probado aquí es que en cualquier campo ordenado arquimedeano la sucesión { n1 } → 0, no estamos hablando simplemente de Q (o de R); de hecho, la convergencia a cero de esta
LA PROPIEDAD ARQUIMEDEANA Y LA DIVISIBILIDAD INFINITA
359
sucesión en un campo ordenado cualquiera, es otra forma de decir que el campo es arquimedeano. o También se utiliza el PDI (o la PA) en la obtención formal de diversas uniones e intersecciones infinitas de intervalos (pues en el fondo se trata de tomar límites). Ejemplo 7.13. Obtener el conjunto que resulta de las siguientes intersecciones infinitas, argumentando formalmente el resultado obtenido. 1. 2. 3. 4. 5.
T∞
− n1 , n1 .
T∞
0, n1 .
T∞
−a − n1 , a +
n=1
i
T∞ h
− n1 , n1 .
T∞ h
0, n1 .
n=1
n=1
n=1
n=1
i
1 n
, a > 0.
Solución. 1. Conforme avanza la n, los intervalos se van cerrando: comienza el (−1, 1), luego el (− 21 , 12 ), (− 13 , 31 ) . . . Cuando n = 1000, por ejemplo, 1 1 tenemos el intervalo (− 1000 , 1000 ), cuyos extremos están próximos al 0. De hecho, es inmediato a partir del ejemplo 7.13, que los extremos izquierdos forman una sucesión creciente, y los derechos una decreciente, ambas convergentes a 0. Cada nuevo intervalo está contenido en el anterior, así es que al irlos intersecando siempre nos vamos quedando con el último. Hay un elemento que seguro está en la intersección infinita, pues está en todos los intervalos de la familia: el 0. Como − n1 < 0 0 cualquiera. Por el PDI, sabemos que existe N ∈ N tal que 0 < N1 < x, pero entonces x ∈ / (− N1 , N1 ) =⇒ x ∈ / T∞ 1 1 , ). Algo completamente análogo sucede con cualquier x < 0; (− n=1 n n es decir, ninguna x 6= 0 puede pertenecer a la intersección infinita,
T
∴
∞ \
n=1
1 1 − , n n
= {0}.
2. ¿En qué cambia la situación si los intervalos de hla intersección son i 1 1 cerrados? El 0 sigue estando en todos los intervalos − n , n , de modo
360
EL MODELO AXIOMÁTICO
que está en la intersección infinita, y sigue siendo válido que ningún número positivo (ni negativo) puede estar en la intersección de todos los intervalos, pues hay un momento a partir del cual los intervalos lo dejan fuera (por el PDI), ∞ \ 1 1 − , ∴ = {0}. n n n=1
3. Ahora el 0 no está en ninguno de los intervalos —pues son abiertos—, de modo que no está en la intersección de ellos (bastaría con que no fuese elemento de uno solo), y a cualquier x > 0 le sigue ocurriendo exactamente lo mismo que en los dos ejemplos anteriores: por el PDI, a partir de una n se queda fuera de los intervalos, así es que no puede pertenecer a la intersección de todos ellos, entonces ∞ \
n=1
1 0, n
= Ø.
4. En este caso, como los intervalos son cerrados —en particular del lado izquierdo—, el 0 pertenece a todos ellos y por lo tanto a la intersección infinita, y a los números distintos de cero se les aplica el mismo argumento que en los incisos anteriores. Así, ∞ \
0,
n=1
1 = {0}. n
5. Queda como ejercicio para el lector probar que ∞ \
n=1
−a −
1 1 ,a + n n
= [−a, a] =
∞ \
n=1
−a −
Figura 7.21: Encajes de intervalos.
1 1 . ,a + n n
PRINCIPIOS DE COMPLETEZ
361
? Nuevamente, observen que todos los resultados obtenidos en este ejemplo se refieren a campos ordenados arquimedeanos en general, no solo a Q o a R.
7.6.
Principios de completez
La propiedades básicas con las que contamos hasta ahora para modelar la recta —las de campo ordenado arquimedeano—, si bien garantizan que el conjunto que las cumpla sea al menos como Q, no terminan de resolver el problema, pues por lo establecido en el teorema 7.11 Q las cumple y no es todavía como la recta, ¿qué les falta?, llenar los “hoyos” que dejan en ella los irracionales. Esto, si queremos modelar una recta continua, lo cual fue discutido al inicio de la segunda parte de este libro. Así las cosas, para que nuestro conjunto de propiedades refleje bien a la recta, haría falta una más (o las que fueren necesarias) que evite que queden puntos sin cubrir; que solo sea cumplida por los campos ordenados que no tengan “hoyos”. La presencia de esta propiedad es el rasgo característico de los números reales, su punto clave. Es lo que los diferencia de manera esencial de los racionales. Lograr resolver este problema fue el paso decisivo en la fundamentación del cálculo. Veremos que hay una variedad de alternativas para solucionar esto, esencialmente equivalentes entre sí. Reciben el nombre de principios de completez —o de continuidad— de un campo ordenado. En la segunda mitad del siglo xix trabajaron en ello, entre otros, Weierstrass, Dedekind, Cantor, Heine, Méray y Thomae, quienes pudieron basarse en lo planteado por Bolzano desde varias décadas atrás, en 1817, y por Cauchy cuatro años después. Discutiremos aquí las propiedades de continuidad subyacentes en los modelos propuestos por varios de ellos. o Para lo anterior será necesario introducir en cada caso algunos conceptos, pero antes hay un detalle sobre el que es necesario llamar la atención. Los conceptos en sí que se requieren para formular varios de los principios de completez no se limitan a los campos ordenados, sino que pueden ser definidos sobre conjuntos ordenados en general.[6] Aunque los [6]
Recordemos que X es un conjunto ordenado si se puede proponer una relación
362
EL MODELO AXIOMÁTICO
principios de completez deben ser planteados sobre campos ordenados para que resuelvan lo que se busca con ellos (garantizar la continuidad de la recta). Por esta razón, las definiciones que daremos de cortaduras de Dedekind, encajes de intervalos, conjuntos acotados, supremo e ínfimo, serán planteadas sobre conjuntos ordenados en general. Pero al utilizarlas para establecer los principios de completez correspondientes nos restringiremos a los campos ordenados. Si lo anterior causa alguna confusión, se puede suponer que todo ha sido planteado sobre campos ordenados y no hay ningún problema.
7.6.1.
Cortaduras de Dedekind
En esta parte utilizaremos algunas de las ideas desarrolladas por Richard Dedekind en su pequeño escrito de 1872, que llevó por nombre Continuidad y números irracionales. Como mencionamos en nuestro primer acercamiento a los números irracionales, en el capítulo 2, en el fondo se basaban en la teoría de proporciones ideada por Eudoxo precisamente para trabajar tanto con las magnitudes conmensurables como con las inconmensurables; es decir, con todos los puntos de la recta (ver pág. 123). o La recta cumple la siguiente propiedad: dado cualquier punto P en ella, este la corta en dos partes: la de la izquierda y la de la derecha. ¿Qué características tienen esas dos partes? Se trata de dos conjuntos, A y B, tales que: i) A 6= Ø, B 6= Ø.
ii) ∀ x ∈ A, y ∈ B =⇒ x < y.
iii) A ∪ B es igual a la recta.
Obsérvese que la condición ii) implica que A ∩ B = ∅. Cuando dos subconjuntos de un conjunto ordenado satisfagan estas tres propiedades, recibirán el nombre de cortadura del conjunto ordenado. Definición 21. Sea X un conjunto ordenado, A, B ⊂ X. Decimos que (orden) entre sus elementos que cumpla simplemente la tricotomía y la transitividad (ver definición 3 en la pág. 109).
363
PRINCIPIOS DE COMPLETEZ
la pareja (A, B) forma una cortadura de X ⇐⇒ i) A 6= Ø, B 6= Ø.
ii) ∀ x ∈ A, y ∈ B =⇒ x < y.
iii) A ∪ B = X.
En la figura 7.22 aparecen varios ejemplos geométricos de parejas de subconjuntos de la recta, unos que forman una cortadura de ella y otros que no. 7
7
7
X
7
7
7
X
Figura 7.22: Cortaduras y no cortaduras.
La propiedad que mencionamos al principio ¿la cumple Q? Es decir: dado cualquier elemento r ∈ Q ¿este nos genera una cortadura de Q? Sí, de hecho nos genera dos cortaduras de Q, que podríamos decir que son “esencialmente iguales”: (i) A = {x ∈ Q : x ≤ r} = (−∞, r] ∩ Q, B = {x ∈ Q : r < x} = (r, ∞) ∩ Q (ii) B = {x ∈ Q : x < r} = (−∞, r) ∩ Q, B = {x ∈ Q : r ≤ x} = [r, ∞) ∩ Q
De modo que pedirle a un campo ordenado que pretenda modelar la recta que cumpla dicha condición, no le impide dejar “hoyos”. La clave de la continuidad, decía Dedekind, está en su inverso. La recta —si la suponemos continua— también cumple que para cualquier cortadura (A, B) que tomemos de ella siempre existe un punto p en la recta tal que x ≤ p ≤ y ∀ x ∈ A, y ∈ B,
lo cual no ocurre con cualquier campo ordenado. Por ejemplo, si√en Q llamamos A al conjunto de todos los racionales √ a la izquierda de 2 y B a todos los racionales a su derecha, como 2 no es racional, la unión de A con B resulta ser todo Q; claramente A y B son distintos del vacío y los elementos de A son todos menores que
364
EL MODELO AXIOMÁTICO
los de B, de modo que (A, B) forma una cortadura de Q. Sin embargo, no existe ningún racional que sea mayor o igual que todos los elementos de A y√menor o igual que todos los de B; el único número que cumple eso es 2 ∈ / Q. Si pensamos en un racional a la izquierda de raíz de 2 como posible punto p, es verdad que cumple con ser menor que todos los elementos de B, pero √ hay elementos de A que lo rebasan (dado que √ si p < 2, entre p y 2 hay una infinidad de racionales). Algo similar ocurre √ si propusiéramos como posible punto p a un racional a la derecha de 2. El detalle por arreglar en el razonamiento √ anterior es que si nuestro universo es Q no tendría sentido referirse a 2 como tal en la descripción de los conjuntos A y B; habría que definirlos hablando solo de racionales. Pero esto es fácil de resolver, basta con tomar A = {x ∈ Q : x < 0}∪{x ∈ Q, x ≥ 0 : x2 ≤ 2}, B = {x ∈ Q, x ≥ 0, x2 > 2}. El problema señalado no es exclusivo de Q. Cualquier campo ordenado X dejaría de cumplir la propiedad así planteada en cualquier “hoyo” que dejara sin cubrir, pues en tal caso podríamos generar una cortadura (A, B) de X para la cual no existiera ningún elemento del campo mayor o igual que todos los de A y menor o igual que todos los de B (ver figura 7.23).
Figura 7.23
En resumen: en cualquier campo ordenado todo elemento genera una cortadura, pero no toda cortadura induce un elemento del campo con la propiedad mencionada; esto solo ocurre si el campo no deja “hoyos”. Esa es la idea central con la que Dedekind resolvió el problema de la continuidad. Principio de completez por cortaduras de Dedekind P C1 : ∀cortadura(A, B) de X,∃p ∈ X tal que x ≤ p ≤ y,∀x ∈ A, y ∈ B. o Debemos tener presente que esta propiedad no obliga a cualquier conjunto ordenado X a “llenar” la recta. Podríamos tomar por ejemplo
365
PRINCIPIOS DE COMPLETEZ
X = Z, lo cual deja grandes espacios entre sus elementos, y sin embargo sí satisface la propiedad P C1: si “cortamos” el conjunto en un z ∈ Z, ese mismo elemento z cumplirá con lo que se pide; y si el corte cae entre z y z + 1, tanto z como z + 1 lo cumplirían (ver figura 7.24).
(a)
(b)
Figura 7.24
Lo que la propiedad P C1 impide es que los campos ordenados dejen “hoyos”. Son las propiedades de campo ordenado las que no permiten que X sea como Z, que obligan a que los “hoyos” que eventualmente dejara X fuesen a lo más como los que deja Q, y son ese tipo de “hoyos” los que al pedir adicionalmente que se cumpla P C1 quedan descartados. Es con las propiedades de campo ordenado y esta nueva propiedad cumpliéndose conjuntamente que se garantiza que el modelo sea como la recta.
7.6.2.
Encajes de intervalos
Cuando una sucesión de intervalos {In } definidos en un campo ordenado X cumple que In ⊇ In+1 ∀ n ∈ N, se dice que forma un encaje de intervalos, oque se trata h de una i sucesión deh intervalos i anidados. Las suce1 1 1 1 1 1 1 1 siones { − n , n }, { − n , n }, { 0, n }, { 0, n }, { −a − n , a + n }, que trabajamos en el ejemplo 7.13, forman todas ellas encajes de intervalos (cerrados, la segunda y la cuarta, y abiertos las otras tres). En los cuatro primeros casos las longitudes de los intervalos tienden a cero, pero en el quinto no (ver figura 7.21, pág. 360). o Pensemos en Q sumergido en la recta. Sabemos que dado cualquier punto p en la recta podemos tomar una sucesión creciente {an } y otra decreciente {bn } de racionales que se acerquen tanto como queramos a p (una por “debajo” y la otra por “arriba”). Si p fuese el punto que corresponde a un irracional, ¿qué pasaría con la sucesión de intervalos {[an , bn ]Q }?; es decir, la sucesión de intervalos {[an , bn ]} que solo incluyen a los números racionales inmersos en ellos. Por un lado, como los extremos izquierdos forman una sucesión creciente y los derechos una decreciente, tenemos que
366
EL MODELO AXIOMÁTICO
[an , bn ] ⊇ [an+1 , bn+1 ] ∀ n ∈ N, de modo que se trata de un encaje de intervalos cerrados. Por otro lado, como tanto los extremos izquierdos como los derechos se pegan a p tanto como queramos, entonces se pegan tanto como queramos entre sí, y por lo tanto las longitudes de los intervalos `([an , bn ]) = (bn − an ) → 0. ¿Qué resulta de la intersección de todos los intervalos? Es decir, T ¿a qué es igual ∞ n=1 [an , bn ]Q ?, si no fuesen intervalos restringidos a los números racionales contenidos en ellos, dicha intersección resultaría {p}, pero incluyendo solo racionales, como p ∈ / Q, la intersección resulta vacía. Tenemos entonces una nueva alternativa para garantizar que un campo ordenado arquimedeano X no deje huecos: pedirle que para todo encaje de intervalos cerrados en X la intersección de los intervalos resulte siempre no vacía. Esto es algo que la recta sí cumple, pero un campo ordenado que no la llena, no. ? Hay una pregunta que podríamos hacernos: ¿es necesario que los intervalos del encaje sean cerrados?, porque en la construcción que hicimos antes en torno al punto p, los intervalos podrían haber sido abiertos y todo hubiera funcionado bien (chéquenlo). El detalle es que hay encajes de intervalos abiertos definidos en la rectamisma cuya intersección 1 es vacía; piensen por ejemplo en la sucesión { 0, n }, cuyas longitudes
1 tienden a cero y ∞ n=1 0, n = Ø, como pudimos ver en el inciso 3 del ejemplo 7.13. Entonces, ni la recta misma cumpliría la propiedad enunciada para intervalos en general. De ahí la necesidad de trabajar con intervalos cerrados. Para escribir el enunciado formal de este otro criterio de completez, precisemos la idea de “intervalo inmerso en un campo ordenado”, específicamente, de intervalo cerrado: Si a, b ∈ X, a < b, X un campo ordenado, definimos [a, b]X = {x ∈ X : a ≤ x ≤ b}.
T
Principio de completez por encajes de intervalos P C2 : ∀ encaje de intervalos cerrados {[an , bn ]X } ∃ p ∈ X tal que p ∈
T∞
n=1 [an , bn ]X .
PRINCIPIOS DE COMPLETEZ
367
Cuando las longitudes de los intervalos tienden a cero —y solo entonces— el punto p ∈ X será único. o En el desarrollo de la discusión de este principio utilizamos la PA (para obtener la intersección infinita de determinados encajes de intervalos); no así cuando discutimos el de las cortaduras de Dedekind. Esto no fue casual. Se puede demostrar que si un campo ordenado satisface el P C2 , eso no garantiza la PA; pero si cumple el P C1 , eso sí la garantiza.[7] Lo mismo ocurre con el próximo principio de completez que estudiaremos (supremo), donde haremos la prueba correspondiente para ilustrarlo. o Hagamos un paréntesis para probar algo que teníamos pendiente: la primera demostración de Cantor de que los reales no son numerables (ver pág. 138). En dicha prueba Cantor utilizó precisamente el criterio de completez por encajes de intervalos (asumiéndolo como algo natural), así es que este es un buen momento para discutirla. Teorema 7.14. Cantor, 1873-4 El intervalo [0, 1] no es numerable. Demostración. Supongamos que [0, 1] es numerable. Eso implica que se puede hacer una lista x1 , x2 , . . . en donde están incluidos todos sus elementos. Sean I1 , I2 , . . . , In , . . . intervalos cerrados tales que: I1 ⊆ [0, 1] con x1 ∈ / I1 , I2 ⊆ I1 con x2 ∈ / I2 , . . . In ⊆ In−1 con xn ∈ / In , . . . La sucesión de intervalos {In } forma un encaje de intervalos T cerrados, así es que por PC2 existe ξ ∈ ∞ n=1 In ⇒ ξ ∈ In ∀n ∈ N. Como In ⊆ I1 ⊆ [0, 1] =⇒ ξ ∈ [0, 1]. Pero ξ 6= xn ∀ n ∈ N, pues mientras que xn ∈ / In , ξ ∈ In . Eso significa entonces que hay un elemento ξ ∈ [0, 1] tal que no está en la lista, lo cual es una contradicción porque los habíamos incluido a todos. ¿Cuál fue la idea central de la demostración? Mostrar que un conjunto numerable no puede cubrir todos los puntos de la recta.
7.6.3.
Supremo
Definición 22. Sea A ⊆ X, X un conjunto ordenado. Decimos que: [7]
Ver comentario 2 en la sección §7.9 al final de este capítulo.
368
EL MODELO AXIOMÁTICO
1. A está acotado superiormente ⇐⇒ ∃ M ∈ X tal que x ≤ M ∀ x ∈ A. En tal caso, M es llamada (una) cota superior del conjunto A. 2. A está acotado inferiormente ⇐⇒ ∃ m ∈ X tal que x ≥ m ∀ x ∈ A. En tal caso m es llamada (una) cota inferior del conjunto A. 3. A está acotado ⇐⇒ ∃ M, m ∈ X tal que m ≤ x ≤ M ∀ x ∈ A.[8] Nótese que si M es una cota superior de A, cualquier elemento de X mayor que M también lo es. Si por ejemplo A = {1 − n1 : n ∈ N} y X = Q, el 2, el 3.5, el 9 y el 1 son diversas cotas superiores de A. ¿Qué querría decir entonces que un conjunto A no esté acotado superiormente?, que ∀ M ∈ X ∃ xM ∈ A tal que xM > M. La x que hay que exhibir que rebasa la M dada, depende de ella; de ahí que la denotemos como xM . Escriban como ejercicio la negación de que un conjunto esté inferiormente acotado. Los naturales son un conjunto no acotado superiormente, pero sí inferiormente; los enteros, ni lo uno ni lo otro. Si observamos las cotas superiores del conjunto A del ejemplo mencionado concluiremos que hay una de ellas que es especial, ¿cuál?, el 1, porque es la más pequeña de todas; cualquier número menor que él ya no es cota superior. Naturalmente, no existe la más grande de las cotas superiores, pero sí la más chica, y que recibe un nombre especial: se le llama el supremo del conjunto A. Se parece al máximo de un conjunto; es decir, al más grande de los elementos de un conjunto. De hecho, cuando existe el máximo, existe el supremo, y son iguales entre sí; pero hay casos en que un conjunto no tiene máximo pero sí tiene supremo. Es precisamente lo que sucedió con el conjunto A mencionado. [8]
La definición usual de conjunto acotado es que ∃ M ∈ X, M > 0 tal que |x| ≤ M ∀ x ∈ A. Y M es llamada (una) cota de A. Pero esto presupone que ha sido definida en X la función valor absoluto, dos de cuyas propiedades más relevantes se relacionan con la suma y el producto entre los elementos de X; de ahí que esta otra definición se introduzca en campos ordenados. A diferencia de la anterior, que solo requiere que X sea un conjunto ordenado (concepto que no presupone la definición de operaciones entre los elementos del conjunto). Cuando X es un campo ordenado, ambas definiciones son equivalentes.
PRINCIPIOS DE COMPLETEZ
369
No perdamos de vista que el máximo de un conjunto siempre debe ser elemento del conjunto, mientras que el supremo no necesariamente. Un ejemplo sencillo que destaca la diferencia entre los dos conceptos es la comparación de lo que sucede con un intervalo abierto y uno cerrado. El [0, 1], por ejemplo, tiene máximo y supremo: ambos coinciden con ser el 1. Pero el (0, 1) no tiene máximo, aunque sí supremo, que vuelve a ser el 1. o Procederemos ahora a precisar la definición de supremo de un conjunto. Lo primero que hay que notar es que el conjunto debe estar acotado superiormente para que tenga sentido hablar de su supremo, pues si no se puede hablar de cotas superiores menos aun puede pensarse en la más pequeña de ellas. Ahora bien, vamos a separar en dos las condiciones que definen al supremo. Decimos que un número c ∈ X es el supremo de un conjunto A ⊆ X acotado superiormente ⇐⇒: 1. c es una cota superior de A.
2. c es la más chica de las cotas superiores de A. Lo anterior se puede expresar de dos maneras equivalentes: 1. x ≤ c ∀ x ∈ A.
2. c es menor o igual que cualquier cota superior de A. O bien: 1. x ≤ c ∀ x ∈ A.
2. Cualquier número de X que sea menor que c, no es cota superior de A. En cuanto a la primera, quedaría entonces así: 1. x ≤ c ∀ x ∈ A.
2. Si x ≤ M ∀ x ∈ A ⇒ c ≤ M . Y la segunda, así: 1. x ≤ c ∀ x ∈ A.
2. Si c∗ < c ⇒ c∗ no es cota superior de A. Es decir:
370
EL MODELO AXIOMÁTICO
1. x ≤ c ∀ x ∈ A. 2. ∀ c∗ ∈ X tal que c∗ < c ∃ xc∗ ∈ A tal que xc∗ > c ∗ .
Como ya hemos mencionado, ambas formulaciones son equivalentes (ejercicio 9). Una u otra se puede adoptar como definición formal del concepto de supremo de un conjunto A ⊆ X, siendo X cualquier conjunto ordenado. Ahora bien, si en X no solo está definido un orden, sino también una suma entre sus elementos (lo cual está garantizado si se trata de un campo ordenado), la idea de que “cualquier número de X que sea menor que c no es cota superior de A”, la podemos formular de la siguiente manera: ∀ ε > 0, c − ε no es cota superior de A, lo cual da lugar a la definición más común de supremo (ver figura 7.25a).
(a) Supremo
(b) Ínfimo
Figura 7.25: Definición de supremo e ínfimo.
Definición 23. Sea X un campo ordenado, A ⊆ X acotado superiormente. Decimos que c es el supremo de A (Notación: c = sup A) si y solo si: 1. x ≤ c ∀ x ∈ A. 2. ∀ ε > 0 ∃ xε ∈ A tal que xε > c − ε.[9]
Esta última definición es equivalente a las otras dos cuando se trata de campos ordenados. Como ya hemos comentado, las dos primeras tienen la ventaja de que funcionan para conjuntos ordenados en general; pero más aun, funcionan incluso para conjuntos transfinitos, tal y como pudimos apreciarlo con el estudio del trabajo de Cantor sobre los números ordinales (ver pág. 214).
o Se puede desarrollar una discusión similar respecto a la más grande de las cotas inferiores de un conjunto, y llegaremos, en el caso de los campos ordenados, al siguiente concepto (ver figura 7.25b). [9]
Se sobrentiende que ε ∈ X.
PRINCIPIOS DE COMPLETEZ
371
Definición 24. Sea X un campo ordenado, A ⊆ X acotado inferiormente. Decimos que c’ es el ínfimo de A (Notación: c’ = ´ınf A) si y solo si: 1. x ≥ c’ ∀ x ∈ A. 2. ∀ ε > 0 ∃ xε ∈ A tal que xε < c’ +ε. o Pensemos nuevamente√en X = Q ubicado sobre la recta. Tomemos un irracional, por ejemplo 2, y definamos A = {x ∈ Q+ : x2 < √ 2} (es decir, A es el conjunto de los racionales positivos menores que 2, solo que definido sin utilizar más que números racionales en su descripción: la idea es considerar a Q como nuestro universo). A es evidentemente un conjunto acotado superiormente, y si el universo fueran todos los √ reales, sería inmediato que A tendría supremo: 2. Pero como X = Q, el supremo de conjunto A caerá en un “hoyo” que deja X sobre la recta; es decir, no existirá ningún elemento de X que sea el supremo de A. Es un razonamiento similar al que hicimos con las cortaduras de Dedekind √ cuando hablamos de los racionales a la izquierda y a la derecha de 2. o En toda esta parte hemos procurado evitar las pruebas formales para no distraer la atención de las ideas principales. Sin embargo, dada la importancia que tiene el manejo preciso del concepto de supremo, haremos ahora la demostración del último ejemplo a manera de ilustración. Sugerimos no perder el hilo con esta “interrupción”. No nos detendremos a citar cuáles son las propiedades de campo ordenado que utilizaremos en cada paso. Tomen papel y lápiz para ir haciendo los dibujos que ilustren cada paso, eso les ayudará. Ejemplo 7.15. Probar que el conjunto A = {x ∈ Q+ : x2 < 2} no tiene supremo en Q. Solución. Lo demostraremos por reducción al absurdo. Supongamos que existe c ∈ Q, c > 0 tal que c = sup A. La prueba consiste en mostrar que: i) c2 no puede ser menor que 2. ii) c2 no puede ser mayor que 2. Así es que c2 tendría que ser igual a 2, lo cual sería una contradicción, pues en tal caso c no sería racional. Probaremos aquí el inciso i), dejando al lector la prueba del inciso ii), que es análoga. Supongamos entonces que c2 < 2. Lo que haremos será exhibir un elemento de A que es mayor que c, lo cual contradice que c = sup A. Es decir, un número racional de la forma c+α con α > 0 tal que (c+α)2 < 2.
372
EL MODELO AXIOMÁTICO
Sea a = 2 − c2 . Es claro que a ∈ Q+ y c2 + a = 2. Para saber qué número proponer que cumpla lo planteado, observemos lo siguiente: a) 1 ≤ c, pues de otra manera el 1 sería un elemento de A mayor que su supremo. Entonces 1 ≤ c ≤ c2 < 2 y por lo tanto 0 < 2 − c2 < 2 − 1 = 1. b) Análogamente, recordemos que si 0 < α < 1 =⇒ α2 < α (basta con multiplicar por α a ambos lados de la primera desigualdad para obtener la segunda). Todo el problema es entonces proponer α ∈ Q, α > 0 tal que (c + 2 α) < 2 = c2 + a. Utilizando (a) y (b) tenemos que (c + α)2 = c2 + 2cα + α2 < c2 + 2 · 2 α + α < c2 + 5α.
a > 0, tendremos que α ∈ Q y 5 2 2 (c + α) < c + a = 2. Es decir, que c + α ∈ A. Pero c + α > c = sup(A), lo cual es una contradicción. Observemos que en la demostración que acabamos de hacer no fue necesario recurrir al PDI ni a la PA. De forma que si tomamos α =
o ¿A qué nos conduce todo lo anterior? A que los campos ordenados que dejan “hoyos” no cumplen que cualquier conjunto acotado superiormente en ellos tiene supremo en el campo, pues siempre habrá la opción —intuitivamente hablando— de tomar un conjunto que caiga a la izquierda del “hoyo”, pegadito a él, de manera que su supremo sea él, pero al no estar incluido en el campo (que juega el papel de universo), el conjunto acabaría sin tener supremo. Antes de escribir este tercer criterio de completez, precisemos tan solo una cosa más: ¿Qué pasaría si el conjunto A fuese el conjunto vacío? Como cualquier número sería cota superior de él (pues por vacuidad “todos” los elementos del vacío serían menores que él), no podría hablarse de “la más chica de las cotas superiores”, aunque nuestro universo fuese la recta. Así es que ese caso debe quedar fuera del juego. Principio del supremo P C3 : ∀ A ⊆ X, A 6= Ø, A acotado superiormente, ∃ c ∈ X tal que c = sup A.
PRINCIPIOS DE COMPLETEZ
373
o ¿Cómo queda aquí la propiedad arquimedeana?, no es necesario pedirla aparte, como veremos a continuación. Teorema 7.16. Si X es un campo ordenado que satisface el principio del supremo, entonces cumple la propiedad arquimedeana. Demostración. Supongamos que X no cumple la PA =⇒ ∃ x ∈ X tal que x > n, ∀ n ∈ N. Así, x sería cota superior del conjunto de los números naturales. Por el principio del supremo eso implica que ∃ c ∈ X, c ≤ x tal que c = sup N, lo cual tiene dos consecuencias, dada la definición de supremo: 1) n ≤ c, ∀n ∈ N. 2) Tomando ε = 1 > 0, debe existir n1 ∈ N tal que c − 1 < n1 . Pero si esto es así, entonces c < n1 + 1 ∈ N, lo que contradice el inciso 1).
7.6.4.
Sucesiones de Cauchy
Cuando una sucesión converge, los términos “del final” —su “cola” — se pegan mucho al límite, y por lo tanto se pegan mucho entre sí. Hablando en un lenguaje informal, podríamos decir que toda sucesión convergente tiene “la cola apachurrada”. ¿A qué nos referimos con esto?, a que dada una distancia o magnitud positiva, por pequeña que esta sea, existe un término de la sucesión a partir del cual cualesquiera dos términos posteriores, los que sean, estarán más pegados entre sí que la distancia dada. Las sucesiones con esta característica son llamadas sucesiones de Cauchy.[10] Definición 25. Sea X un campo ordenado, an ∈ X ∀ n ∈ N. Decimos que la sucesión {an } es de Cauchy ⇐⇒ ∀ ε > 0 ∃ N (ε) tal que si m, n > N =⇒ d(am , an ) = |am − an | < ε. [10]
Hay que decir que la definición de estas sucesiones, presentada exactamente en los términos con que se conoce actualmente, fue publicada en Praga por Bernard Bolzano cuatro años antes de que Cauchy hiciera lo propio en su conocido trabajo Cours d’ Analyse en París (ver B. Bolzano, 1817, reproducido en S. Russ, 2004 (2006) pp. 266-268).
374
EL MODELO AXIOMÁTICO
Lo que dijimos es entonces que toda sucesión convergente es de Cauchy. Esto es válido tanto en la recta como en Q. Pero ¿es válido lo inverso? o ¿Qué tendría que ocurrir si una sucesión de elementos de un continuo como la recta (si así la consideramos), cumpliera con ser de Cauchy?, que toda su “cola” se acumulara en torno a un punto del mismo continuo. Es decir, que en la recta continua toda sucesión de Cauchy converge a un punto de ella. Sin embargo, esto no pasa necesariamente en el caso de Q, pues puede ocurrir que una sucesión de racionales tenga su “cola” apachurrada pero no en torno a un racional, sino a un irracional, de modo que en el universo de los racionales esa sucesión, siendo de Cauchy, no convergería. Tenemos aquí entonces otra alternativa para evitar que un campo ordenado deje “hoyos”, que corresponde a la idea en la que se basaron Cantor, Heine y Meray para construir los números reales. Principio de completez por sucesiones de Cauchy [11] [11]
Bolzano demuestra, en el texto citado, que en R toda sucesión, hoy llamada de Cauchy, converge. No piensa ese resultado como un “principio de completez”, sino como una propiedad más de los números reales —y de esas sucesiones— susceptible de ser demostrada. Pero como su validez presupone que los reales no dejan “hoyos”, la demostración se tenía que basar en otro criterio de completez, así fuera suponiéndolo como algo natural, y ese es el caso: en la demostración genera un encaje de intervalos cerrados cuya longitud tiende a cero, y entonces concluye que la intersección debe incluir un único punto, que era precisamente el límite que buscaba. Por si fuera poco, en otra parte del mismo artículo (pp. 269-272), Bolzano prueba —utilizando nuevamente encajes de intervalos— un teorema que conlleva a lo que podríamos llamar el principio del ínfimo; es decir, una propiedad similar a la del supremo, pero planteada para conjuntos acotados inferiormente; aun más, también conduce a la propiedad que comentaremos en la discusión del PC6. Es decir, que en un solo artículo maneja por lo menos cuatro de los criterios que posteriormente jugarían un papel clave para resolver el problema de la continuidad de la recta. Lo anterior, por no mencionar que el tema del artículo es la demostración de la propiedad que mencionamos en el capítulo 5 (ver pág. 266), de que las funciones continuas en un intervalo cerrado que cambian de signo de un extremo a otro, necesariamente valen cero en algún punto del intervalo; esto lo generaliza hasta una variante de la propiedad que hoy conocemos como el teorema del valor intermedio para las funciones continuas (ver pp. 273-275 de su texto). Lo cual, por cierto, constituye otra opción más como principio de completez para un campo ordenado; ¿y qué definición de continuidad de una función establece para hacer sus demostraciones? (p. 256), casi textualmente la que utilizamos hoy.
PRINCIPIOS DE COMPLETEZ
375
P C4 : ∀ sucesión de Cauchy {an } de elementos de X existe ` ∈ X tal que {an } → `.
o El razonamiento va siendo siempre muy similar, aunque expresado en términos de conceptos distintos. Haremos solamente dos observaciones respecto de este nuevo principio de completez: 1. En la práctica, para garantizar que una sucesión en un campo ordenado sea de Cauchy, debemos probar que la diferencia entre sus términos —a partir de alguno de ellos— se hace tan pequeña como queramos. La PA vuelve a aparecer a la hora de probar que son Cauchy diversas sucesiones. Tal y como sucedió con los encajes de intervalos, esta propiedad no queda garantizada por el propio principio de completez (como ocurrió con el de las cortaduras de Dedekind y el del supremo). 2. El concepto de distancia se puede llevar más allá de los campos ordenados. Utilizando una generalización natural del teorema de Pitágoras, se puede hablar de distancia en Rn en general. Aunque no es posible definir un producto entre sus elementos que cumpla las propiedades de campo, salvo cuando n = 1, 2, y un orden que le permita convertirse en un campo ordenado, salvo cuando n = 1. Pero la generalización del concepto de distancia no termina ahí. Puede subirse un escalón más, llevándolo a estructuras más amplias que se conocen como espacios vectoriales (en donde aun se habla de suma y resta entre los elementos de X y producto por elementos de algún campo). Luego, subiendo otro escalón más —de hecho llevándolo mucho más lejos—, hasta conjuntos X en los que ni siquiera sea necesario definir operaciones entre sus elementos, sino simplemente una función que a cada pareja de elementos les asocie un número real positivo, que cumpla unas cuantas propiedades características de la distancia que siempre las fue cumpliendo en todo ese proceso de generalización. El principio de completez por sucesiones de Cauchy tiene la virtud de que permite llevar el concepto de “completez” tan lejos como sea llevado el concepto de distancia. Supera en ello al de encajes de intervalos, que también se puede generalizar más allá de los campos ordenados, pero tan solo hasta Rn (en su formulación usual).
7.6.5.
Sucesiones crecientes y acotadas
La idea en que Weiertsrass se basó para resolver las cosas fue un poco diferente a las anteriores.146
376
EL MODELO AXIOMÁTICO
Una sucesión creciente por supuesto que no converge necesariamente (los naturales son un ejemplo).[12] Pero si además de ser creciente la sucesión está acotada superiormente, en la recta la convergencia es obligada de nuevo, si se supone continua. No así en los racionales, pues bien puede ocurrir que el punto al que se vayan pegando tanto como se desee conforme aumentan los valores racionales, sea un irracional. Esto plantea una quinta solución al problema de garantizar la continuidad de un campo ordenado: Principio de completez por sucesiones crecientes y acotadas P C5 : ∀ sucesión creciente y acotada {an } de elementos de X existe ` ∈ X tal que {an } → `.
De hecho esta solución ya la habíamos explorado cuando trabajamos con las expansiones decimales (y en otras bases). Al ir agregando dígitos a la aproximación a un número cualquiera, lo que hacíamos era generar una sucesión creciente que se acercaba a él tanto como se quisiera. La idea ahora queda planteada en términos de sucesiones crecientes y acotadas en general, no necesariamente de las que se obtienen con las expansiones finitas en alguna base. En cuanto a la propiedad arquimedeana, podemos probar que queda garantizada por este principio de completez, no es necesario pedirla adicionalmente, como veremos a continuación. Teorema 7.17. Si X es un campo ordenado en el que toda sucesión creciente y acotada converge a un elemento del campo, entonces X satisface la propiedad arquimedeana. Demostración. Supongamos que X no satisface la PA =⇒ ∃ x ∈ X tal que x > n ∀ n ∈ N. Así es que x sería una cota superior del conjunto de los números naturales. Pero los naturales forman en sí mismos una sucesión creciente, que por lo anterior estaría acotada superiormente y tendría que converger. Es decir, {n} → ` ∈ X. Al ser creciente la sucesión {n}, su límite ` tendría que ser cota superior de ella (de hecho es su supremo), pues si algún natural rebasara tal límite, los términos que le siguen serían aun mayores y se irían alejando de su límite, lo [12]
Salvo que estemos hablando de conjuntos transfinitos, como recordaremos de lo visto en el capítulo 4.
PRINCIPIOS DE COMPLETEZ
377
cual no es posible. De modo que n ≤ ` ∀ n ∈ N, y como ` es el límite, si tomamos cualquier número a la izquierda de él (tomaremos ` − 1), existirá un natural N a partir del cual todos los demás quedan más cerca de ` que ese valor. En particular, tenemos entonces que ∃ N ∈ N tal que ` − 1 < N . Pero entonces ` < N + 1 ∈ N, lo cual contradice que todos los naturales caían a la izquierda de `. Así pues, si X no cumpliera la propiedad arquimedeana tendríamos una contradicción.
7.6.6.
Conjuntos infinitos y acotados
La idea intuitiva de que un elemento x ∈ X sea punto de acumulación de un conjunto A ⊆ X es que en torno a él, tan cerca como queramos de él, siempre hay elementos de A diferentes de él. Esto lo reflejamos diciendo que dada cualquier ε > 0 ∃ a ∈ A, a 6= x tal que d(a, x) = |a − x| < ε. Si dada una distancia ε > 0 siempre hay un elemento de A más cerca de x (distinto de él) que esa distancia, entonces debe haber una infinidad de elementos de A con esa propiedad; si para alguna distancia solo hubiera un número finito, tomaríamos de ellos el más próximo a x (diferente de x), y entre ese y x ya no habría ningún otro, negando el hecho de que siempre existe alguno tan cerca como se quiera de x. De ahí la definición que adoptamos en el capítulo 4 (ver definición 13, pág. 204). De lo anterior se desprende que ningún conjunto finito tiene punto de acumulación alguno; para que un conjunto pueda tener uno o varios puntos de acumulación debe ser infinito. Sin embargo, no todo conjunto infinito tiene puntos de acumulación, los naturales son un ejemplo de ello. Por otro lado, observemos que un punto de acumulación de un conjunto no debe ser necesariamente elemento del conjunto. Si tomamos por ejemplo el intervalo A = (0, 1) ⊂ R, el 0 y el 1 son puntos de acumulación de A pero no son elementos de A. Así como no cualquier elemento de un conjunto es punto de acumulación de él (de nuevo, los naturales son un ejemplo). o Dicho todo esto, hagámonos la siguiente pregunta: ¿hay alguna condición que garantice que un conjunto tenga al menos un punto de acumulación? Pensémoslo en la recta. Por lo visto antes, de entrada el conjunto debe ser infinito, pero hay por lo menos dos tipos de situaciones que nos muestran que no basta con ello:
378
EL MODELO AXIOMÁTICO
Una, la que se presenta con los naturales, que al ser no acotados les permite mantener una distancia fija entre sus elementos sin importar que sean una infinidad, y entonces no tener ningún punto de acumulación. La otra es la que podemos observar en casos como el del conjunto {n + n1 : n ∈ N}, en donde aunque las distancias entre sus elementos se van “cerrando” —de hecho, se “cierran” tanto como se quiera—, de nueva cuenta el ser no acotado el conjunto le permite no contar con ningún punto de acumulación; digamos que “se escapa” de la recta el punto en torno al cual se “van cerrando” los elementos del conjunto conforme la n se hace grande en tal caso, sería el infinito el “punto” de acumulación. . . pero ya no estaría en la recta. Estos razonamientos nos llevan a preguntarnos que si un conjunto A en la recta es infinito y acotado ¿por fuerza debe tener algún punto de acumulación en ella (pertenezca o no a A)? Si A es acotado, eso significa que ∃ M > 0 tal que |a| ≤ M ∀ a ∈ A.[13] Lo cual es equivalente a decir que −M ≤ a ≤ M ∀ a ∈ A. Veamos más detenidamente lo primero que decíamos antes: ¿podrían “colocarse” uno tras otro los elementos de A a una distancia fija, así sea muy pequeñita, siendo A infinito? Supongamos que el intervalo [−M, M ] = [−1000, 1000], y que queremos colocar todos los elementos de A a una distancia de .000001. Tras colocar 1000000 de elementos hemos avanzado una unidad. Con paciencia, los seguimos colocando, y después de hacerlo con (2000)(1000000)= 2000000000, hemos tapizado el intervalo con elementos del conjunto A, pegaditos una distancia fija unos a otros —dos a dos—, y todavía nos sobra una infinidad de elementos de A que aun no hemos ubicado. Si en lugar de intentar colocarlos a una distancia de un millonésimo lo hacemos a un billonésimo, la situación esencialmente no cambia (ver figura 7.26) ¿Qué nos ilustra todo esto?, que siendo A infinito no hay forma de meterlo en un intervalo [−M, M ] si queremos mantener una distancia (> 0) fija entre sus elementos. La única alternativa es que al menos en torno a un punto del intervalo [−M, M ], los elementos de A se amontonen unos con otros, haciendo las distancias entre ellos tan pequeñas [13]
Utilizamos aquí la definición de conjunto acotado que corresponde a los campos ordenados, porque es la más usual. Sin embargo, observemos que todo el razonamiento que se desarrolla enseguida se puede hacer igual partiendo de que ∃ m, M ∈ X tales que m ≤ x ≤ M ∀ x ∈ A, que es la definición de conjunto acotado en conjuntos ordenados en general (ver nota al pie de la pág. 368).
LOS NATURALES, LOS ENTEROS Y LOS RACIONALES
379
como se quiera, menores que cualquier valor positivo fijo. Es decir, por fuerza debe haber en [−M, M ] al menos un punto de acumulación del conjunto A.
Figura 7.26
En cuanto al segundo problema planteado, el hecho de que el conjunto sea acotado impide que el punto de acumulación “se escape” hacia el infinito. En otras palabras: en la recta, todo conjunto A que sea infinito y acotado tiene al menos un punto de acumulación. Así es que si un campo ordenado X pretende modelar la recta, debe cumplir esta misma condición. Ahora bien, ¿qué pasa si nuestro campo ordenado es X = Q?, que el conjunto A ⊆ X infinito y acotado estaría inmerso en el universo de los racionales, y perfectamente podría ocurrir que su infinidad de elementos se acumulara, sí, pero en torno a un irracional, de manera que no sería cierto que ∃ x ∈ X = Q fuese punto de acumulación de A. El hecho de que Q deje hoyos, da al traste con la situación. Tenemos entonces otra alternativa para garantizar la completez de un campo ordenado: Principio de completez por conjuntos infinitos y acotados P C6 : ∀ conjunto infinito y acotado A ⊆ X
existe x ∈ X tal que x es un punto de acumulación de A. En cuanto a la relación de este principio con la propiedad arquimedeana, se puede probar que queda garantizada por él.
7.7.
Los naturales, los enteros y los racionales
Como comentamos en varias ocasiones, en todo el texto hemos supuesto que los números naturales y los racionales habían sido definidos de antemano. Los modelos elaborados por Weierstrass, Dedekind, Cantor,
380
EL MODELO AXIOMÁTICO
Heine, Meray, etc. partieron de lo mismo. Fue posterior a esos trabajos que se abordó el problema de definir bien a los naturales y a los racionales. Pero esto ocurrió antes del modelo axiomático desarrollado por Hilbert (ver sección §7.8-(7)). La forma más aceptada como definición de los naturales es la propuesta por el matemático italiano Giuseppe Peano (1858-1932), en su trabajo en latín Arithmetices principia, nova methodo exposita, publicado en 1889. Se trata de un modelo axiomático de los naturales que consta de cinco postulados que en su honor son conocidos como los axiomas de Peano. En resumen, lo que plantean es que los naturales pueden ser identificados con cualquier conjunto X que cumpla las siguientes propiedades: (P1) Existe un 1 ∈ X. (P2) Si n ∈ X, existe su “sucesor” S(n) = n + 1 ∈ X. (P3) El 1 no es el sucesor de ningún elemento de X. (P4) Si m y n tienen el mismo sucesor, entonces m = n. (P5) Si un subconjunto de X contiene al 1, y siempre que contiene a n contiene también a su sucesor S(n), entonces ese subconjunto es igual a todo X. La quinta propiedad constituye la base del Principio de Inducción, que establece las reglas del juego para demostrar una propiedad que se pretenda válida en todos los naturales, habida cuenta de que ello no sería posible si la exigencia consistiera en que tendría que ser probada para cada natural, uno tras otro. Con base en esas propiedades se define una suma, un producto y un orden entre los elementos del conjunto, y se pueden ir demostrando todas las reglas conocidas de esas dos operaciones con los enteros positivos, incluyendo las que se refieren a la exponenciación, una vez caracterizada esta a través de la multiplicación. Se prueba que el conjunto cumple la propiedad arquimedeana y está bien-ordenado (es de hecho el modelo mismo de un conjunto bien-ordenado). La resta n − m puede definirse bien (dentro de N) solo cuando n > m: es igual a un natural k tal que n = m + k. Después debemos ingeniárnosla para construir Z con base en N. Es un juego en el que la regla básica es que solo vale hablar de conjun-
LOS NATURALES, LOS ENTEROS Y LOS RACIONALES
381
tos (operaciones entre conjuntos, relaciones entre conjuntos) y de los números naturales, que a estas alturas ya fueron definidos. La idea que seguimos entonces consiste en identificar cada entero con una pareja de naturales (m, n). ¿Cuál pareja?, aquella cuya resta m − n resulta el entero que queremos definir. Así por ejemplo, identificamos el −1 con el (1, 2). El detalle es que con esa regla el −1 podría quedar también asociado al (2,3), o al (3,4), o . . . En general, cualquier elemento de N × N de la forma (m, m + 1) (naturales ambos), quedaría asociado al −1. Tenemos entonces cuatro buenas noticias y una mala. La primera buena: que pudimos definir -1 en términos de N × N, es decir, apoyándonos solo en N (y en operaciones entre conjuntos). La segunda buena: que lo mismo podemos hacer con cualquier entero tanto positivo como negativo o cero: 0 7−→ (1, 1), (2, 2), (3, 3), . . . 1 − 7 → (2, 1), (3, 2), (4, 3), . . . 2 − 7 → (3, 1), (4, 2), (5, 3), . . . 3 − 7 → (4, 1), (5, 2), (6, 3), . . . ···
−1 − 7 → (1, 2), (2, 3), (3, 4), . . . −2 − 7 → (1, 3), (2, 4), (3, 5), . . . −3 − 7 → (1, 4), (2, 5), (3, 6), . . . ···
Figura 7.27: Clases de equivalencia de N × N y su correspondencia con Z.
382
EL MODELO AXIOMÁTICO
Es decir, que si z ∈ N, 0 7−→ (m, n) ∀ m, n ∈ N tal que m = n.
z 7−→ (m, n) ∀ m, n ∈ N tal que m = n + z.
−z 7−→ (m, n) ∀ m, n ∈ N tal que n = m + z. La mala noticia es que la correspondencia no es biunívoca, pues a cada entero lo identificaríamos con una infinidad de elementos de N × N. Pero la tercera buena es que esos conjuntos infinitos que asociamos a cada entero forman una partición del conjunto N × N: son ajenos entre sí y su unión nos resulta todo N × N. La cuarta buena es que podemos entonces aparear cada entero no con un elemento de N × N, sino con cada uno de esos subconjuntos: 0 ←→ {(m, n) : m = n}
z ←→ {(m, n) : m = n + z}
−z ←→ {(m, n) : n = m + z} En la figura 6.22 se ilustran con un mismo color los elementos de cada uno de los subconjuntos de N×N que asociamos con cada entero (son los puntos con ambas coordenadas naturales que quedan incluidas en cada una de las semirectas con pendiente 1 que “arrancan” de los puntos de la forma (m, 1) y (1, n), para cada m, n ∈ N y que prolongadas hasta el eje X lo intersecan precisamente en el entero que les asociamos). Atendiendo a la misma figura, observen que cada conjunto puede ser “respresentado” por el elemento de la diagonal que pertenece a N × N que está más próximo a cualquiera de los ejes cartesianos; es decir, por los puntos mencionados de donde parten las diagonales. Representaremos entonces a cada uno de esos conjuntos con la notación entre corchetes: [1, 1] ={(m, n) : m = n} [z, 1] ={(m, n) : m = n + z} [1, z] ={(m, n) : n = m + z} No confundir con intervalos cerrados, ni con uno de los elementos de N × N. Se trata de todos los elementos que caen en la diagonal que comienza en el señalado entre corchetes. Esta notación simplifica la forma de referirnos al conjunto que asociamos a cada entero, y de pasada permite imaginar fácilmente la manera de definir la suma y el producto de enteros, una vez definidos estos.
LOS NATURALES, LOS ENTEROS Y LOS RACIONALES
383
¿Cómo piensan que se puede definir la suma entre dos enteros positivos?; es decir, ¿cuál sería la forma natural de definir [m, 1] + [r, 1] con m, r > 1?, pues simplemente [m + r, 1]; ¿y dos negativos?, [1, n] + [1, s] = [1, n + s], donde n, s > 1. En el caso del cero, como es de esperarse, [1, 1] + [1, 1] = [1, 1]. Si uno es positivo y el otro negativo, [m, 1] + [1, r] es igual a [m − r, 1] si m > r; y a [1, r − m], si r > m. Entonces, dado cualquier entero, tomamos el representante del conjunto que lo define y aplicamos esta regla. Se puede probar que esta forma de definir la suma cumple las propiedades esperadas, lo mismo que el producto que se define naturalmente, y que quedará como ejercicio para el lector. o Lo que acabamos de hacer es dividir el conjunto N × N en clases de equivalencia —a partir de una relación entre sus elementos que prueba que se trata de una relación de equivalencia—, y representar cada entero con una de dichas clases. Para definir los racionales se sigue un procedimiento análogo, pero trabajando sobre el conjunto Z × N. Lo que hacemos es representar cada racional pq por un subconjunto de Z × N, cuyos elementos están enlazados por una relación de equivalencia. ¿Cuál?, la que hace que dos racionales sean iguales: pq = m n ⇔ pn = mq. Al plantear así las cosas, caracterizamos la equivalencia a partir de productos entre enteros, ya definidos previamente. En cada uno de los subconjuntos de Z × N entran infinidad de parejas que al expresarlas como racionales corresponden al mismo número. ¿Cuál se puede escoger como representante de cada una de esas clases de equivalencia?, la pareja ordenada sin ningún factor común; es decir, la que correspondería al racional irreducible. Lo anterior permite definir a los racionales tan solo apoyándose en los enteros y en la teoría de conjuntos. Hecho esto, se procede a definir su suma y su producto, expresando a través de las parejas de enteros asociadas a ellos la forma usual de sumar y multiplicar los racionales; es decir, se construye el modelo de manera que se ajuste al comportamiento pn+qm de lo que queremos modelar. (Como queremos que pq + m n = qn , definimos [m, n] + [p, q] = al representante de [pn + qm, qn]; y como pm queremos que pq · m n = qn , definimos [m, n] · [p, q] = al representante de (pm, nq)). Entonces se procede a verificar que se satisfagan todas las reglas de operación esperadas (las de campo ordenado arquimedeano).
384
EL MODELO AXIOMÁTICO
7.8.
Reflexiones finales
1. Al comienzo del capítulo nos planteamos construir un modelo de la recta, alternativo al de las expansiones decimales discutido en el capítulo anterior. Decíamos entonces que se trataba de encontrar una familia de propiedades lo más reducida posible, en relación con la suma, el producto y el orden que se definen en la recta, que tuvieran la virtud de condensar todo el comportamiento de la recta en sí mismas, y que nos permitieran decir: cualquier conjunto X en el que se puedan definir una suma, un producto y una relación de orden, de suerte que se cumplan estas propiedades, es como la recta, lo consideraremos como la recta. Esas propiedades fueron precisamente las de un campo ordenado, arquimedeano y completo; es decir, que cumpla las propiedades de campo ordenado, la propiedad arquimedeana y alguno de los principios de completez discutidos en la sección anterior. 2. Este es el que se conoce como modelo axiomático de la recta. Las propiedades en cuestión se conocen como los axiomas de los reales, en el entendido de que hablar de los números reales es hablar del modelo matemático de la recta. Axiomas no significa “dogmas”. Hemos visto que no se trata de reglas arbitrarias, sino que reflejan el comportamiento de lo que queremos modelar. El nombre de axiomas lo único que significa es que con base en ellos se deducen las demás propiedades, y que los aceptamos para representar, definir a algo —la recta en este caso— a través de ellos. En ese sentido los suponemos como válidos y sobre esa base levantamos todo lo que sea posible levantar. 3. Hay que tener presente algo que comentamos a lo largo de la sección §7.6: como principio de completez puede adoptarse cualquiera de los vistos (y por supuesto hay más). Pero si adoptamos el de sucesiones de Cauchy o el de encajes de intervalos, debemos agregar la propiedad arquimedeana (o su equivalente, el principio de divisibilidad infinita). En caso de adoptar cualquiera de los otros, podemos prescindir del agregado. En resumen, se puede probar que:147 P C1 ⇐⇒ P C2 + P A ⇐⇒ P C3 ⇐⇒ P C4 + P A ⇐⇒ P C5 ⇐⇒ P C6 4. Al definir el modelo axiomático de la recta se escoge uno de los principios de completez, que queda entonces ubicado como “axioma”, y
REFLEXIONES FINALES
385
todos los demás aparecen como “teoremas”. En R lo más común es escoger como “axioma” el principio del supremo, de ahí que sea conocido como el “axioma del supremo”. Pero si se escoge otro, entonces el del supremo se demostraría a partir del escogido, y se hablaría de él como el “teorema del supremo”. Por ejemplo, el PC6 corresponde a un teorema de los cursos de cálculo que se conoce como teorema de Bolzano-Weierstrass. 5. La forma en que Dedekind, Weierstrass, Cantor, Heine, Meray, etc, definieron a los números reales no fue a través de un modelo axiomático con uno u otro principio de completez. No pensaron en representar a la recta en términos de sus propiedades. En todos los casos pensaron en representar a los puntos de la recta con “números” específicos que estuvieran en una correspondencia biunívoca con ellos; a la manera en que hicimos las cosas en el capítulo anterior. Los “números” que nosotros utilizamos para representar los puntos de la recta fueron las expansiones decimales (o en otras bases), finitas e infinitas; cada una de ellas era para nosotros un número, y correspondía a un punto en la recta. Algo similar hicieron todos ellos, cada uno por su lado. Para hacerlo todos se basaron en los racionales, que suponían como ya definidos previamente, y de ahí partían. Nosotros también en realidad, pues las expansiones infinitas se definen a través de aproximaciones finitas, que no son otra cosa que números racionales. 6. Lo interesante es que cada principio de completez lleva en sus “entrañas” un modelo de este tipo. Así, por ejemplo, Dedekind identificó cada punto de la recta con una cortadura de los racionales. La correspondencia biunívoca con los puntos de la recta entraba en problemas cuando el punto era racional, pues en ese caso había dos cortaduras que le correspondían: ((−∞, p], (p, ∞)) y ((−∞, p), [p, ∞)) (ver figura 6.18 (f) y (h)). Pero el problema se podía resolver escogiendo en general solo una de ellas y desechando la otra (de manera análoga a como desechamos las colas infinitas de 9’s). Resuelto esto, lo que quedaba era definir un orden entre las cortaduras, una forma de sumarlas y otra de multiplicarlas, que fueran coherentes con la manera en que se hacen las cosas en la recta. Ese fue el modelo de Dedekind. Por supuesto que a la hora de operar con él no era precisamente ágil hacerlo. Esto, además de lo
386
EL MODELO AXIOMÁTICO
extraño que resultaba identificar como un número (real) a una pareja de conjuntos infinitos de racionales. El modelo de Cantor, Heine y Meray era aun más complicado de asimilar (aunque más relacionado con conceptos que surgen en el análisis que las cortaduras). Ellos identificaban a un punto de la recta con una sucesión de Cauchy de números racionales. Como estas no tenían más que dos opciones, que eran “converger” a un racional o hacerlo a un irracional, esto daba base para tal correspondencia. Solo que aquí lo biunívoco de la cuestión estaba más complicado, pues en el fondo, una sucesión de Cauchy de racionales se ponía en correspondencia precisamente con el punto al cual convergía. Pero ocurre que una infinidad de sucesiones diferentes convergen al mismo punto, así es que el problema no se podía resolver descartando a alguna en particular. ¿Qué hicieron entonces?, mostrar que se podía definir una relación de equivalencia entre las sucesiones de Cauchy a partir de la convergencia a un mismo punto, y dividir el universo de todas las sucesiones de Cauchy de números racionales en clases de equivalencia: en cada clase entraban todas las sucesiones que convergían a un mismo punto. Entonces la correspondencia biunívoca era entre cada punto de la recta y una clase de equivalencia de esas donde entraban una infinidad de sucesiones. A partir de ahí definían una relación de orden entre las clases de equivalencia, una suma y un producto que se correspondiera con la forma de hacer las cosas en la recta. El problema es que al final un número real acaba siendo igual a una clase de equivalencia de sucesiones de Cauchy de números racionales; es decir, un engendro muy difícil de digerir, aunque construido con una lógica impecable. Lo mismo se puede hacer con los encajes de intervalos de racionales, o con las sucesiones crecientes y acotadas de racionales. Si resultó difícil de asimilar como número real una expansión decimal infinita, seguramente después de ver todo esto nos parecerá una maravilla de simplicidad. 7. El modelo axiomático, la idea de representar a la recta a través de sus propiedades, fue una idea de Hilbert (precedida por otra de Thomae publicada un poco antes) que surgió en medio del auge de la lógica y la teoría de conjuntos que narramos en el capítulo 4.
REFLEXIONES FINALES
387
Fue Hilbert quien le dio un giro a la manera de pensar a los números reales. En una conferencia ante la Sociedad Alemana de Matemáticas, pronunciada el 19 de septiembre de 1899, propuso 18 propiedades para caracterizar a los números reales: 16 que corresponden a lo que después se le dio el nombre de campo ordenado; una más para el principio arquimedeano; y la de completez, que no era ninguna de las mencionadas en la sección anterior, sino que planteaba que la totalidad de los números reales contiene, en el sentido de una correspondencia 1 a 1 entre elementos, a cualquier otro conjunto que cumpliera las 17 propiedades previas. O sea, que para que un campo ordenado arquimedeano represente a la recta, no debe ser posible ampliarlo más; no debe existir otro que lo contenga propiamente, a diferencia de lo que ocurre con Q. 8. Hay algo de lo que podemos tener certeza en nuestro trabajo en el cálculo: cada vez que se nos presente una propiedad cuya validez depende de que no haya “hoyos” en la recta, en su demostración será utilizado algún principio de completez (de los ya vistos o de los no vistos, equivalentes a los primeros); y al revés, por lo general esas propiedades, formuladas adecuadamente, podrán dar lugar a nuevos criterios de completez. Prueben a hacer esto con el teorema de Bolzano mencionado al principio de la segunda parte del libro (el relacionado con las funciones continuas en un intervalo cerrado). 9. ¿Qué idea nos hacemos finalmente de la forma en que están distribuidos los racionales e irracionales en la recta?, ¿uno y uno?, no, porque entonces tendrían la misma cardinalidad (entre otras cosas). ¿Una infinidad de irracionales y un racional, otra infinidad de irracionales y otro racional, y así sucesivamente?, no, porque en ese caso habría infinidades de irracionales entre los que no existiría ningún racional, y ya sabemos que eso no es así. Lo que podemos decir con lo visto hasta aquí a este respecto, es que en cualquier pedacito de la recta, por pequeño que este sea, hay infinidad de unos e infinidad de otros, una infinidad siempre más tupida que la otra. Pero los irracionales se pueden diferenciar entre sí en función de qué tan rápidamente se acercan a ellos los racionales; digamos que hay distintos grados de irracionalidad entre unos y otros irracionales. El estudio de estas diferencias se aborda a través de lo que se conoce como aproximaciones diofantinas. En ese estudio juega un papel muy
388
EL MODELO AXIOMÁTICO
importante el trabajo con la representación de los números reales a través de fracciones continuas.
7.9.
El diablo está en los detalles
1. La propiedad arquimedeana es mucho más importante de lo que parece. No solo porque, como ya comentamos en otro momento, se trata de un recurso continuamente utilizado en el trabajo con el concepto de límite. Sino porque sin ella las cosas no serían como quizás nos las imaginamos. Sin ella los naturales del campo no tenderían a infinito. Y los racionales, representados en una recta, no se desplegarían a lo largo de la misma, “entrelazándose” continuamente con los demás elementos del campo. Lo que argumentamos en el texto de que el hecho de que un conjunto X cumpla las propiedades de campo ordenado lo obligan a ser al menos como Q (ver pág. 356), significa tan solo que en X deben estar incluidos todos los elementos de la forma m n , con m ∈ Z, n ∈ N (donde Z y N son los enteros y los naturales del campo). Pero no que esos números deban “entrelazarse” con los demás, como sucede entre Q y R. Esta propiedad (la densidad de Q en X, hablando en términos formales) no es una consecuencia automática de las propiedades de campo ordenado, sino de la propiedad arquimedeana (combinada con aquellas). Se pueden construir campos ordenados en donde los racionales están por un lado, e infinidades de elementos del campo están por otro lado, aislados unos de otros.148 No es difícil probar que los racionales de un campo ordenado son densos en él si y solo si el campo es arquimedeano (ejercicio 11). 2. Y se pueden probar más cosas respecto al vínculo entre la propiedad arquimedeana y los criterios de completez de un campo ordenado: a) Existen campos ordenados en los que toda sucesión de Cauchy converge, pero no son arquimedeanos.149 b) Existen campos ordenados en los que toda sucesión de Cauchy converge, pero no todo encaje de intervalos cerrados tiene una intersección no vacía.150
EL DIABLO ESTÁ EN LOS DETALLES
389
c) Existen campos ordenados en los que todo encaje de intervalos cerrados tiene intersección no vacía, pero no son arquimedeanos. 3. Hay una sutileza en lo que se identifica como un campo ordenado completo. El origen tuvo que ver con la idea de no dejar hoyos en la recta. Pero la enorme posibilidad de generalización que ofrece el PC4 (sucesiones de Cauchy), de la que se comentó en la sección §7.6, llevó más bien a definir como completo a un conjunto en el que esté definida una distancia (llamado “espacio métrico”) y que satisfaga que toda sucesión de Cauchy es convergente en él, pero y si esto es así, un campo ordenado puede ser completo sin ser arquimedeano. No olvidemos que la propiedad arquimedeana la supusimos todo el tiempo en la recta. Para evitar confusiones decimos entonces que el modelo axiomático de la recta es el de un campo ordenado arquimedeano completo. Hay textos en los que la confusión se evita diferenciando los “campos ordenados completos” (partiendo del axioma del supremo como principio de completez, y por lo tanto considerándolos arquimedeanos) de los “campos ordenados Cauchy completos” (en donde el axioma de completez es el de las sucesiones de Cauchy, que no son necesariamente arquimedeanos). 4. Hay un posible malentendido respecto a lo que sí y lo que no íbamos probando en la discusión de los distintos criterios de completez. La lógica del razonamiento que seguimos era la misma que en la obtención de las propiedades de campo ordenado: lo que cumpla la recta lo debe cumplir el modelo. El detalle es que con los criterios de completez hacíamos dos cosas: una, argumentar que Q no los cumplía; la otra, ver que la recta sí los cumpliera. Pero esto último en realidad no era una prueba formal, y no podía serlo, porque la recta no es continua per se; demostrar que cumple alguna condición de continuidad particular presupone que se estableció antes otra que se acepta como definición del concepto. El problema es que precisamente lo que estábamos haciendo era ponernos de acuerdo en una forma aceptable de definir la continuidad. Así, por ejemplo, no demostramos que en la recta las intersecciones de los intervalos cerrados de un encaje resulta siempre distinta del vacío, o que cualquier cortadura induce siempre un punto de la recta, o que en ella todo conjunto no vacío acotado superiormente tiene supremo. Eso es algo que no se puede hacer, pues nadie puede de-
390
EL MODELO AXIOMÁTICO
mostrar que la recta es continua. La continuidad es una propiedad que decidimos asignarle a la recta, porque ello nos permite utilizar toda la herramienta del cálculo y mucho más. En resumen, lo que fuimos haciendo fue identificar criterios que resultaran coherentes para reflejar esa idea de continuidad, sobre la base de constatar que un conjunto como los racionales (u otro que dejara “hoyos” como los que puede dejar un campo ordenado) no los iba cumpliendo. El círculo de la coherencia se cierra cuando se demuestra, ahí sí formalmente, que todos esos criterios son equivalentes. 5. Lo anterior está relacionado con otro problema: cuando representamos los puntos de la recta con las expansiones decimales tampoco “demostramos” que a cada punto le correspondía una expansión decimal finita o infinita, y viceversa. Como Cantor tampoco “demostró” que había una correspondencia biunívoca entre las clases de equivalencia de sucesiones de Cauchy de los racionales y los puntos de la recta. Ni siquiera Dedekind “demostró” que existía una correspondencia biunívoca entre las cortaduras de racionales y los puntos de la recta. Ambos fueron muy explícitos en ello, señalando que eso debía ser considerado un axioma. Dedekind decía que la suposición de que las cortaduras en la recta inducen siempre un punto de la misma “[. . . ] no es más que un axioma por el cual le atribuimos a la recta su continuidad”. Se trata del que se conoce como “axioma de continuidad”, que aplica para los modelos en los que se representa a los puntos de la recta con unos u otros “números”. 6. ¿Qué sí se puede probar formalmente? En efecto, cualquiera de estos modelos, por ejemplo, el de las expansiones decimales, satisface todas las propiedades de campo ordenado (lo cual presupone definir formalmente el orden, la suma y la multiplicación entre las expansiones). Si un conjunto de “números” satisface todas esas propiedades de campo ordenado arquimedeano completo, entonces sus elementos son como las expansiones decimales. De la manera en que vimos que si un conjunto cumple las propiedades de campo ordenado es al menos como los racionales; en este caso tendría que ser, a lo menos y a lo más, como las expansiones decimales. Una prueba bastante accesible de esta equivalencia se puede consultar en el libro Advanced Calculus, de Hans Sagan, pp. 41-46 (ver referencia completa en la bibliografía).
EL DIABLO ESTÁ EN LOS DETALLES
391
7. Otro posible malentendido puede surgir sobre cómo queda definida, qué es realmente una expansión decimal infinita. Cuando decimos que x = 0.121121112 . . . podemos entender que los puntos suspensivos se refieren a que: a) Los valores x1 = 0.1, x2 = 0.12, x3 = 0.121, . . . son solo aproximaciones al valor de la expansión, lo cual es correcto. b) El número real correspondiente a la expansión se define como el límite de las expansiones finitas y eso es lo que simbolizan los puntos suspensivos, lo cual resulta incorrecto, y no porque no sea cierto que existiendo el límite, sería precisamente ese su valor; no, eso es verdadero. El problema es más bien conceptual. Cuando estamos construyendo los reales, viendo cómo definirlos, no lo podemos hacer recurriendo para ello al concepto de límite, porque el concepto de límite se define después —una vez definidos los reales—; y se define precisamente como un número real que cumple cierta condición; es decir, estaríamos definiendo qué es un número real en términos del límite, y el límite en términos de los números reales. Un razonamiento circular. Si nos ocurrió eso no nos preocupemos, no somos los únicos. En 1869 el francés Charles Méray se dio cuenta de que se había producido un “grave lapsus en el razonamiento” desde Cauchy hasta ese momento, pues se había definido al límite como un número real y a los números reales como límites de sucesiones de racionales. Fue Weierstrass quien resolvió el problema por la vía de definir al número real como la sucesión toda de números racionales en lugar de a través de su límite, evitando así la contradicción lógica. ¿Qué querría decir esto en la definición de las expansiones decimales?, que los puntos suspensivos indican que siguen indefinidamente los términos de la sucesión de expansiones finitas. Es decir, volviendo a nuestro ejemplo, que 0.121121112 · · · = 0.1, 0.12, 0.121, 0.1211, . . .
Cantor después diría que pensaba que ese error no fue percibido durante todos los años que transcurrieron hasta que fue detectado, porque en realidad era un error que no conducía a inconsistencias con las propiedades usuales de los números reales, tal y como eran entendidas en la época. Hay que aclarar que este error no se comete si se define a los números reales a partir de sus propiedades (es decir, si se trabaja con el modelo axiomático), y se define luego al límite como un número real que cumple la condición usual. Entonces, establecido —dada la
392
EL MODELO AXIOMÁTICO
completez— que el límite de una sucesión creciente y acotada siempre existe —es decir, es un número real—, el límite de las expansiones decimales finitas conforme el número de dígitos tiende a infinito estaría bien definido. El error se comete cuando se define a un número real como un límite cuya existencia no está garantizada de antemano.
7.10.
Ejercicios
1. Dada una unidad en la recta, ¿cuáles son todos los números que podemos construir tan solo con regla (sin unidades de medida marcadas) y compás? Dibujen una recta, una unidad en ella y: a) Construyan primero todos los enteros, y a partir de ahí los racionales (es decir, desarrollen un procedimiento geométrico para localizar cualquier número racional). b) Describan ahora un método para localizar la raíz cuadrada de cualquier número natural. Hint: i) Sea n ∈ N. Muestren que el problema se reduce a encontrar para qué altura x los triángulos 4ABC y 4CBD de la figura 7.28 son semejantes.
Figura 7.28
ii) Muestren que lo anterior quedaría garantizado si el ángulo ]DCA fuese un ángulo recto. iii) Ingénienselas entonces para construir un triángulo así, de forma tal que el ]DCA resulte efectivamente recto. Hint a esta parte del hint: construyan una circunferencia “adecuada". iv) Una vez hecho todo lo anterior, expliquen el procedimien√ to “de principio a fin" para construir n con solo regla y compás, dado n ∈ N.
EJERCICIOS
393
c) Expliquen cómo con un procedimiento análogo podrían localizar √ x, donde x no fuese necesariamente un número natural, sino cualquier punto localizado previamente en la recta. d) Argumenten cómo, con base en todo lo visto hasta aquí, podrían localizar con regla y compás: √ √ √ i) 4 n, 8 n, 16 n, ... ii)
q 4
m n,
q 8
m n,
q
16
m n , ...
iii) Sumas, productos y cocientes de todos estos números. √ e) ¿Se les ocurre una forma de localizar 3 n con regla y compás. Inténtenlo. Resulta que este es uno de los tres grandes problemas que los griegos no pudieron resolver y que podríamos formular así: “Dado un cubo, encontrar otro cubo cuyo volumen sea el doble del primero”. Si consideramos a la unidad u como el lado del cubo original con volumen v, y llamamos x al lado del cubo buscado con volumen V , tendríamos que v = u3 , V = x3 = 2v = 2u3 ∴ x3 = 2u3 y √ 3 ∴ x = 2u. √ El problema entonces consistía en localizar el número 3 2 tan solo utilizando regla y compás, que es lo que nos planteamos en este inciso para n = 2. Pues bien, tuvieron que transcurrir más de 20 siglos para poder demostrar que esto no es posible. f) ¿Se les ocurre una forma de localizar al número π tan solo con regla y compás?. Piénsenlo. Este es otro de los tres grandes problemas que no pudieron resolver los griegos. Es conocido como el problema de la “cuadratura del círculo”, que consiste en lo siguiente: “Dado un círculo, encontrar un cuadrado que tenga la misma área.” Si consideramos a la unidad u como el radio de un círculo con área A, y a x como el lado del cuadrado buscado con área a, tendríamos √ que A = πu2 , a = x2 ; A = a =⇒ πu2 = x2 =⇒ x = πu. De manera que si pudiéramos localizar al número π con regla y √ compás, usando el inciso (1c) podríamos localizar π y ∴ resolver el asunto. Pero resulta que también se puede demostrar que esto
394
EL MODELO AXIOMÁTICO
no es posible, más aun, se puede probar, más en general, que ningún número trascendente puede ser localizado solo con regla y compás. g) Concluyan entonces estableciendo cuál es la forma general de los números que sí pudieron localizar con regla y compás, y cuáles faltaron. 2. Demuestren que: a) Si A ⊆ B y B es acotado, A 6= Ø, entonces A es acotado y sucede que ´ınf B ≤ ´ınf A ≤ sup A ≤ sup B. b) Sean A 6= Ø y B 6= Ø dos conjuntos tales que ∀ x ∈ A, y ∈ B ⇒ x ≤ y. Demostrar que existen α = sup A y β = ´ınf B y que α ≤ β. Hagan los dibujos correspondientes en ambos incisos para entender mejor las proposiciones. 3. Demostrar todos los incisos del teorema 7.8. 4. Probar que los dos ejemplos comentados en la pág. 346, efectivamente forman un campo. 5. Demostrar todos los incisos del teorema 7.9. 6. Expresen el número e como: a) Una cortadura de números racionales. b) El supremo de un conjunto de números racionales. c) Un encaje de intervalos cerrados de racionales. d) Una sucesión creciente de números racionales. e) Una sucesión de Cauchy de números racionales. ¿Qué le pedirían a un campo ordenado para garantizar que incluyera al número e? Hint útil para todos los incisos: recuerden que e=
1 1 1 1 + + + + ... 0! 1! 2! 3!
395
EJERCICIOS
Hint para el primer inciso (que les resultará útil también para todos): Primero prueben que 1 1 1 1 + + + ··· ≤ (n + 1)! (n + 2)! (n + 3)! n! Observen que
1 n!
∀ n ∈ N.
→ 0 cuando n tiende a ∞.
Entonces, piensen en la pareja de conjuntos A = {x ∈ Q | x
1 1 1 1 + + + ··· + ∀ n ∈ N}. 0! 1! 2! n!
7. Expresen el número log 2 como: a) Una cortadura de números racionales. b) El supremo de un conjunto de números racionales. c) Un encaje de intervalos cerrados de racionales. d) Una sucesión creciente de números racionales. e) Una sucesión de Cauchy de números racionales. Hint: Acoten la región comprendida entre la hipérbola y = x1 y el eje x sobre el intervalo [1, 2], con sendas familias de n rectángulos inscritos y circunscritos, y calculen áreas (recordar lo visto en la sección §1.4.1). Con las desigualdades resultantes construyan los conjuntos de la cortadura siguiendo un razonamiento análogo al del problema anterior. Esto les sirve para el primer inciso y para todos los demás. 8. Expresen el número π como: a) Una cortadura de números algebraicos reales. b) El supremo de un conjunto de números algebraicos reales. c) Un encaje de intervalos cerrados de algebraicos reales. d) Una sucesión creciente de números algebraicos reales. e) Una sucesión de Cauchy de números algebraicos reales.
396
EL MODELO AXIOMÁTICO
√ Hint: Acoten la región comprendida entre la función y = 1 − x2 y el eje x sobre el intervalo [0, 1], con sendas familias de n rectángulos inscritos y circunscritos, y calculen áreas. Con las desigualdades resultantes construyan los conjuntos de la cortadura siguiendo un razonamiento análogo al de los dos problemas anteriores. 9. Demuestren la equivalencia entre las tres definiciones de supremo de un conjunto discutidas en la sección §7.6.3. 10. Sea X un campo ordenado. Demuestren que si se cumple el principio del supremo en X, entonces también se cumple lo que podríamos llamar el “principio del ínfimo”, que diría lo siguiente: Principio del ínfimo ∀ A ⊆ X, A 6= Ø, A acotado inferiormente, ∃ c0 ∈ X tal que c0 = ´ınf A.
11. Demuestren que los racionales de un campo ordenado son densos en él si y solo si el campo es arquimedeano (ver sección §7.9, comentario 1, pág. 388). 12. En la sección §7.6.6 discutimos que todo conjunto infinito y acotado tiene al menos un punto de acumulación. Prueben ahora que si el conjunto es infinito no numerable, entonces, sea o no acotado, siempre tiene al menos un punto de acumulación.
Capítulo 8
Expansiones factoriales 8.1.
Los números reales del intervalo [0, 1)
Obtendremos una expresión de los números reales similar a las expansiones decimales (binarias, terciarias), pero introduciendo una modificación en su construcción: en lugar de ir dividiendo cada subunidad en un mismo número de partes iguales (diez, dos, tres), la unidad inicial se dividirá en dos partes iguales, la siguiente subunidad en tres, la que sigue en cuatro, y así sucesivamente (ver figura 8.1). Empecemos con los números del intervalo [0, 1).
Figura 8.1: u = 2u0 , u0 = 3u00 , u00 = 4u000 , . . . .
397
398
EXPANSIONES FACTORIALES
Si tomamos un punto P en la recta, después del 0 y antes de la unidad OP ←→ 0u+1u0 +0u00 +3u000 . . . , donde u = 2u0 , u0 = 3u00 , u00 = 4u000 , . . . (ver figura 8.2).
Figura 8.2: OP = (0.1, 0, 3, . . . )b! .
En general, tendríamos OP = 0u + x1 u0 + x2 u00 + · · · + xk u(k) + . . . con
x1 ∈ {0, 1}, u(0) = u = 2u0 ,
x2 ∈ {0, 1, 2}, u0 = 3u00 ,
x3 ∈ {0, 1, 2, 3}, u00 = 4u000 , ···
xk ∈ {0, 1, 2, . . . , k}, u(k−1) = (k + 1)u(k) , ···
De modo que al punto P ∈ [0, 1) le haríamos corresponder la expansión en base factorial 0.x1 , x2 , x3 , . . . donde xk ∈ {0, 1, . . . , k} ∀ k = 1, 2, 3, . . . Notación: P ←→ (0.x1 , x2 , x3 , . . . )b! Obsérvese que
(0.x1 , x2 , x3 , . . . )b! =
8.2.
x1 x2 x3 + + + ··· 2! 3! 4!
(8.1)
Las colas infinitas de 90 s y (ℵ0 )!
¿Quién jugaría en esta base el papel que juega el 0.999 . . . en base 10?
LAS COLAS INFINITAS DE 90 S Y (ℵ0 )!
399
Podemos imaginar al 0.999 . . . en base 10, como el número que generamos al acercarnos al 1 desde el 0 con una sucesión estrictamente creciente, dividiendo la unidad en diez partes, y tomando todas ellas menos una; luego volviendo a dividir la subunidad recién obtenida en otras diez, y agregando todas ellas menos una; y así sucesivamente. Lo equivalente en la base factorial correspondería a dividir la unidad en dos partes, y tomar una de ellas; a continuación dividir la Figura 8.3 subunidad obtenida en tres partes, y tomar dos de ellas; después la división será en cuatro partes, y sumaremos tres de ellas; y así sucesivamente (ver figuras 8.3 y 8.4). Es decir, el papel del 0.999... en base 10 lo juega el (0.1, 2, 3, . . . )b!
Figura 8.4
Las figuras 8.3 y 8.4 sugieren la siguiente proposición.
Lema 8.1.
1 2 3 n 1 + + + ··· + =1− 2! 3! 4! (n + 1)! (n + 1)!
Demostración. Si n = 1 el resultado es inmediato. Si lo suponemos válido para n, tendremos que, en el caso n + 1,
400
EXPANSIONES FACTORIALES
1 2 3 n n+1 + + +· · ·+ = + 2! 3! 4! (n + 1)! (n + 2)! n + 1 − (n + 2) 1 = 1+ = 1− (n + 2)! (n + 2)!
1 1− (n + 1)!
+
n+1 (n + 2)!
∞ X
k =1 (k + 1)! k=1
Corolario 8.2. Demostración. ∞ X
n X k k = l´ım n→∞ (k + 1)! (k + 1)! k=1 k=1
!
= l´ım
n→∞
1−
1 (n + 1)!
=1
Corolario 8.3. (0.1, 2, 3, . . . )b! = 1 Demostración. Por (8.1) y corolario 8.2, (0.1, 2, 3, . . . )b! =
∞ X 1 k 2 3 + + + ··· = =1 2! 3! 4! (k + 1)! k=1
El corolario 8.3 confirma que el (0.1, 2, 3, . . . )b! es equivalente al 0.999 . . . en base diez, como lo señalamos. En forma similar podemos argumentar que, por ejemplo, (0.1, 1, 0, 2, 5, 6, 7, . . . )b! = (0.1, 1, 0, 3)b! , o que (0.1, 2, 2, 1, 4, 6, 7, 8, 9, . . . )b! = (0.1, 2, 2, 1, 5)b! . Sin embargo,
y
(0.1, 2, 1, 3, 4, 5, 6, . . . )b! 6= (0.1, 2, 2)b! (0.0, 1, 3, 2, 1, 5, 6, 7, . . . )b! 6= (0.0, 1, 3, 2, 2)b! .
Para que una expansión infinita en base factorial coincida con una expansión finita, no basta con que a partir de un cierto momento aparezca la sucesión de números k, k + 1, k + 2, k + 3, . . . , sino que esto debe ocurrir precisamente a partir del k-ésimo lugar.
LAS COLAS INFINITAS DE 90 S Y (ℵ0 )!
401
Corolario 8.4. (0.x1 , x2 , . . . , xk−1 , xk , xk+1 , . . . )b! = (0.x1 , x2 , . . . , xk−1 + 1)b! ⇐⇒ 0 ≤ xk−1 ≤ k − 2
y
xk = k, xk+1 = k + 1, xk+2 = k + 2, . . . Demostración. Es análoga a la discutida para el corolario 8.3. Esto vuelve a recordar lo que sucedía con las colas infinitas de 90 s a partir de un cierto dígito en las expansiones decimales. Dado todo lo anterior, si queremos representar biunívocamente a los puntos del intervalo [0, 1) en nuestra nueva base, tendríamos que extraer del conjunto de las expansiones aquellas de la forma 0.x1 , x2 , . . . , xk , . . . para las cuales exista una N ∈ N tal que xk = k ∀ k ≥ N (o dejar esas y extraer todas las expansiones factoriales finitas). Es decir, si llamamos F = {(0.x1 , x2 , x3 , . . . )|xk ∈ {0, 1, 2, . . . , k} ∀ k ∈ N} y T = {(0.x1 , x2 , x3 , . . . )|xk = k ∀ k ≥ N para alguna N ∈ N}, tenemos que los elementos de [0, 1) y F − T son biyectables. Teorema 8.5. [0, 1) ←→ F − T (La demostración aparece en el Anexo). El corolario 8.4 garantiza que T es equivalente al conjunto de todas las expansiones finitas en base factorial. Pero ¿qué podemos decir de ellas? Si x = (0.x1 , x2 , . . . , xn )b! , entonces x=
xn x1 x2 + + ··· + , con xk ∈ {0, 1, . . . , k} ∀ k = 1, 2, . . . , n, 2! 3! (n + 1)!
así es que es una suma finita de números racionales, y por tanto racional. De modo que todo número con expansión factorial finita es racional, y por ello mismo, el conjunto (infinito) de expansiones factoriales finitas es un conjunto numerable. Como (0, 1] ←→ F − T y |(0, 1]| = c, |T | = ℵ0 =⇒ |F| = c, si a un conjunto con la cardinalidad del continuo le agregamos uno numerable, nos resulta un conjunto que vuelve a tener la cardinalidad del continuo.
402
EXPANSIONES FACTORIALES
Pero, por otro lado, si pensamos en “cuantificar” los elementos de F (0.x1 , x2 , x3 , . . . ), en el primer lugar hay dos posibles valores: 0 y 1; en el segundo, hay tres: 0, 1 y 2; en el tercero hay cuatro: 0, 1, 2 y 3; etc. De modo que en total habría 2 · 3 · 4 · · · = (ℵ0 )! posibles valores. Teorema 8.6. c = (ℵ0 )!
8.3.
Todos los racionales tienen expansión factorial finita
Teorema 8.7. x ∈ [0, 1)es racional ⇐⇒ Su expansión factorial es finita. Demostración. ⇐) Fue argumentado anteriormente. ⇒) Si x = 0, es inmediato. p Sea entonces x 6= 0; x = irreducible, p, q ∈ N, p < q. Si subdividiq mos la unidad en q! partes iguales, x se podrá expresar como un número 1 entero de veces la subunidad u(q−1) = : q! 1 p x = = p(q − 1)! q q!
=K
1 q!
= Ku(q−1) ,
(8.2)
con K = p(q − 1)! ∈ N. Como u(q−1) cabe a su vez un número exacto de veces en todas las subunidades previas u0 , u00 , . . . , u(q−2) , tenemos que: 1 1 0 < x < 1 =⇒ x = x1 · + r1 , x1 ∈ {0, 1}, 0 ≤ r1 < . 2! 2! Si r1 = 0, x tiene expansión finita. 1 1 1 Si 0 < r1 < =⇒ r1 = x2 · + r2 , x2 ∈ {0, 1, 2}, 0 ≤ r2 < . 2! 3! 3! Si r2 = 0, x tiene expansión finita. 1 1 1 Si 0 < r2 < =⇒ r2 = x3 · + r3 , x3 ∈ {0, 1, 2, 3}, 0 ≤ r3 < . 3! 4! 4! Repetimos el argumento hasta llegar a rq−2 : Si rq−2 = 0, x tiene expansión finita. 1 1 =⇒ rq−2 = xq−1 · + rq−1 , Si 0 < rq−2 < (q − 1)! q! 1 xq−1 ∈ {0, 1, 2, . . . , q − 1}, 0 ≤ rq−1 < . q!
LA EXPANSIÓN FACTORIAL DE LOS NÚMEROS REALES EN GENERAL
403
Entonces substituimos recursivamente cada residuo en la igualdad obtenida en el paso previo, obteniendo que: 1 1 1 1 + x2 · + · · · + xq−1 · + rq−1 ∴ x = N · + rq−1 , con 2! 3! q! q! 1 0 ≤ rq−1 < < 1, N = [x1 (3 · 4 · · · q) + x2 (4 · 5 · · · q) + · · · + xq−1 ] ∈ N. q! x = x1 ·
Pero como vimos en (8.2), x =⇒ rq−1 = 0.
1 cabe un número exacto de veces en q!
∴ x = (x1 , x2 , . . . , xq−1 )b! , xk ∈ {0, 1, 2, . . . , k}∀k = 1, 2, . . . , q−1. (8.3) Es decir, x tiene expansión factorial finita. ¿Qué tan larga puede llegar a ser la expansión factorial de un número racional?, en realidad resulta muy sencillo establecer una cota para ello: p Si x = ∈ [0, 1), con p, q ∈ N, (p, q) = 1, de (8.3) se desprende que x q tendrá a lo más q cifras en su expansión factorial (pueden ser menos, si los coeficientes xk valen cero a partir de algún valor de k anterior o igual a (q − 1)). En la sección §8.4 veremos cómo obtener la expansión factorial de los números enteros y de los números reales en general (más allá del [0, 1)). Como es de esperar, el ser finita o infinita dicha representación dependerá tan solo de si lo es o no su parte fraccionaria, que resulta siempre menor que 1. De modo que la propiedad establecida en el teorema 8.7 es en realidad generalizable para todos los números racionales, no meramente los del [0, 1). Nos permitiremos enunciar de una vez este resultado, que es simplemente un corolario del anterior. Corolario 8.8. x ∈ Q ⇐⇒ x tiene una expansión factorial finita.
8.4.
La expansión factorial de los números reales en general
Si x ∈ N ∪ {0}, obtendremos su expansión factorial siguiendo la misma idea que para las fracciones menores que la unidad, pero haciendo ahora el recorrido de las cifras de derecha a izquierda. Representaremos a x con una sucesión finita de cifras ϕn , ϕn−1 , . . . , ϕ2 , ϕ1 , de manera que ϕ1
404
EXPANSIONES FACTORIALES
solo puede tomar los valores 0 y 1, ϕ2 los valores 0, 1 y 2, . . . , ϕn los valores 0, 1, 2, . . . , n. El paso de un número natural al siguiente, será siguiendo un orden similar al que seguimos con nuestro sistema decimal (posicional), pero con los “topes” en cada posición que corresponden a lo dicho. Es decir, el avance en los enteros no negativos sería como se ilustra a continuación: (0), (0, 1), (1, 0), (1, 1), (2, 0), (2, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1), (1, 2, 0), (1, 2, 1), (2, 0, 0), (2, 0, 1), (2, 1, 0), (2, 1, 1), (2, 2, 0), (2, 2, 1), (3, 0, 0), (3, 0, 1), (3, 1, 0), (3, 1, 1), (3, 2, 0), (3, 2, 1) (1, 0, 0, 0), . . . Teorema 8.9. N ←→ {(ϕn , ϕn−1 , . . . , ϕ1 )b!} donde (ϕn , ϕn−1 , . . . , ϕ1 )b! = ϕn ·n!+ϕn−1 ·(n−1)!+· · ·+ϕ1 ·1!, con ϕk ∈ {0, 1, . . . , k} ∀ k = 1, 2, . . . , n. (La demostración aparece en el Anexo). Ejemplo 8.10. Expresar (5, 3, 0, 1, 1)b! en base decimal. Solución. (5, 3, 0, 1, 1)b! = 5 · 5! + 3 · 4! + 0 · 3! + 1 · 2! + 1 · 1! = 675. Ejemplo 8.11. Expresar 221 en base factorial. Solución. Procedimiento 1. Analizamos primero cuál es el primer valor de n! para el cual rebasamos el número buscado, y trabajamos con el valor justo anterior de n: como 1! = 1, 2! = 2, 3! = 6, 4! = 24, 5! = 120, 6! = 720, la primera cifra significativa de nuestro número será la quinta (de la sexta en adelante todas serían cero). ¿Cuántas veces cabe 5! = 120 en 221?, una: 221 = 1(120) + 101. Repetimos ahora el razonamiento para el residuo: 4! = 24 es el mayor valor del factorial menor que 101, y cabe 4 veces en él: 101 = 4(24) + 5. Volvemos a hacer lo mismo con el residuo, y tenemos que 5 = 2(2) + 1. Así las cosas, tenemos que 221 = 1 · 5! + 4 · 4! + 0 · 3! + 2 · 2! + 1 · 1! = (1, 4, 0, 2, 1)b! . Procedimiento 2, algoritmo de la división. En forma análoga a lo que hicimos con los cambios de base cuando el número de subdivisiones permanece constante (ver pág. 307), la idea es
LA EXPANSIÓN FACTORIAL DE LOS NÚMEROS REALES EN GENERAL
405
ir dividiendo primero entre 2, luego entre 3, después entre 4, etc., tomar la parte entera del cociente y anotar el residuo tras cada división, una y otra vez hasta llegar al 0. Se trata de aplicar repetidas veces el siguiente esquema, colocándolo a la izquierda del anterior cada nueva ocasión que se aplica. La expansión buscada la ofrecen los residuos. cociente ↓ residuo
[÷bk ]
←−
cantidad
Véamoslo con el mismo ejemplo resuelto con el otro procedimiento, para comparar los dos: 0 r
↓ (1
[÷6]
[÷5]
[÷4]
[÷3]
←− 1 ←− 9 ←− 36 ←− r
,
↓ 4
r
,
r
↓ 0
↓ 2
,
,
110 r
[÷2]
←−
221
↓ 1 ) −→ (14021)b!
o Al igual que sucedía con los cambios de base 10 a base b (ver (6.19) en la sección §6.3), podemos desarrollar un algoritmo análogo para pasar a base factorial las expansiones decimales fraccionarias. La idea consiste en aplicar iterativamente el siguiente esquema, hasta que la parte fraccionaria en cuestión se haga 0. La expansión factorial buscada se obtiene listando las partes enteras que van resultando en cada etapa del procedimiento, el cual puede ser infinito. {·}
×b
k cantidad w −→ producto −→ parte f raccionaria {bk w}
[·]
&
(8.4)
parte entera [bk w]
La notación es la usual: [a] es la parte entera de un número a, y {a} su parte fraccionaria ({a} = a − [a]). Veamos cómo funciona con un ejemplo. Ejemplo 8.12. Pasar el número 0.625 a base factorial. Solución ×2
{·}
×3
{·}
×4
{·}
0.625 −→ 1.25 −→ 0.25 −→ 0.75 −→ 0.75 −→ 3 −→ 0 [·]
&
[·]
1
&
[·]
0
& 3
406
EXPANSIONES FACTORIALES
Así es que 0.625 = (0.103)b! . Si tenemos un número racional expresado como una fracción, se puede hacer todo igual sin tener que pasarlo primero a su expansión decimal. Ejemplo 8.13. Expresar el número x =
5 en base factorial. 8
Solución 5 8
×2
−→
Por lo tanto
5 4
−→
1 4
&
1
{·} [·]
×3
−→
3 4
−→
3 4
&
0
{·} [·]
×4
{·}
−→ 3 −→ 0
5 = (0.103)b! . 8
[·]
&
3
o De hecho, de este algoritmo se puede deducir un razonamiento simple para argumentar que si un número es racional, su expansión factorial p resulta siempre finita. Si x = , para obtener su expansión factorial deq bemos ir multiplicando progresivamente por 2, 3, . . . ; tarde o temprano llegamos a p, momento en el cual —si no sucedió antes— el producto resulta un entero y el proceso termina, teniendo expansión factorial finita; y esto a su vez nos ilustra algo más: si p es primo, el procedimiento no puede terminar antes, así es que su expansión resultará con p − 1 cifras (dado que empezamos multiplicando por 2). o Finalmente, si x es un número real positivo cualquiera, expresamos su parte entera como la ilustramos, a la izquierda del punto decimal, y su parte fraccionaria (menor que 1) tal y como lo hicimos en la sección §8.1, o siguiendo el algoritmo que acabamos de ver, a la derecha del punto decimal. En caso de que se trate de un número real negativo, afectamos con un signo menos toda la expresión de su valor positivo correspondiente.
8.5. 8.5.1.
Algunos números especiales El número e
Resulta sumamente atractiva la representación en base factorial del número e. Como 1 1 (8.5) e = 1 + 1 + + + ··· , 2! 3!
407
ALGUNOS NÚMEROS ESPECIALES
tendremos entonces que (8.6)
e = (1, 0.1, 1, 1, 1, . . . )b! ,
y el solo hecho de que su expansión factorial sea infinita, constituye, gracias al corolario 8.8, la más simple de las demostraciones. Teorema 8.14. e es irracional. Esto garantiza a la vez algo más. Teorema 8.15. El valor de cualquier subserie (infinita) de
∞ X 1
es un k! número irracional. Es decir: dada cualquier sucesión creciente {nk } de ∞ X 1 resulta siempre un número irracional. números naturales, (n k )! k=0 k=0
8.5.2.
e−1
Evaluando la serie de Taylor de ex en x = −1, tenemos que e−1 =
∞ X 1 1 1 1 1 1 − + − ± ··· = − . 0! 1! 2! 3! (2k)! (2k + 1)! k=0
(8.7)
Pero
1 1 − (2k)! (2k + 1)!
∴ e−1 =
∴
8.5.3.
=
2k (2k + 1) − 1 = (2k + 1)! (2k + 1)!
∞ X
2 4 6 8 2k = + + + + ··· (2k + 1)! 3! 5! 7! 9! k=0 1 = (0.0, 2, 0, 4, 0, 6, 0, 8, . . . )b! e
(8.9)
senh (1) y cosh (1)
Sumando (8.5) y (8.7), tenemos que −1
e+e
1 1 1 + + + ··· =2 0! 2! 4!
(8.8)
.
408
EXPANSIONES FACTORIALES
Si ahora restamos (8.5) menos (8.7), obtenemos e − e−1 = 2
1 1 1 + + + ··· 1! 3! 5!
.
Lema 8.16. (i) (ii) y por lo tanto
8.5.4.
∞ X
e + e−1 1 = (2k)! 2 k=0
(8.10)
∞ X
e − e−1 1 = , (2k + 1)! 2 k=0
(8.11)
cosh(1) = (1.1, 0, 1, 0, 1, 0, 1, 0, . . . )b!
(8.12)
senh(1) = (1.0, 1, 0, 1, 0, 1, 0, 1, . . . )b!
(8.13)
sen (1)
Aplicando Taylor tenemos que sen(1) =
1 1 − 1! 3!
+
1 1 − 5! 7!
+ ··· +
1 1 − (4k − 3)! (4k − 1)!
+ ···
Pero las diferencias anteriores se pueden expresar como una suma de factoriales convenientes. 1 4k − 2 4k − 3 1 − + = k∈N Lema 8.17. (4k − 3)! (4k − 1)! (4k − 2)! (4k − 1)!
Demostración. 1 (4k − 1)(4k − 2) − 1 1 − = (4k − 3)! (4k − 1)! (4k − 1)! (4k − 1)(4k − 3) + (4k − 1) − 1 4k − 3 4k − 2 = = + (4k − 1)! (4k − 2)! (4k − 1)! Regresando entonces al sen (1), tenemos que ∴ sen(1) =
∞ X 4k − 3
k=1
=
4k − 2 + (4k − 2)! (4k − 1)!
2 1 + 2! 3!
+
6 5 + 6! 7!
+
10 9 + 10! 11!
+ ···
409
ALGUNOS NÚMEROS ESPECIALES
(8.14)
∴ sen(1) = (0.1, 2, 0, 0, 5, 6, 0, 0, 9, 10, . . . )b!
8.5.5.
cos (1)
Haciendo un desarrollo análogo al caso anterior, obtenemos cos(1) =
∞ X
n=0
1 1 , − (4n)! (4n + 2)!
y probando que Lema 8.18. N
1 1 − (4k)! (4k + 2)!
=
4k 4k + 1 + (4k + 1)! (4k + 2)!
∀ k ∈
tendremos que 1 cos(1) = 0 + 2!
+
4 5 + 5! 6!
+
8 9 + 9! 10!
∴ cos(1) = (0.1, 0, 0, 4, 5, 0, 0, 8, 9, . . . )b!
8.5.6.
+ ··· (8.15)
ei
Haciendo x = 0, y = 1 en la fórmula de Euler ex+iy = ex (cos(y) + isen(y)) y utilizando los resultados obtenidos en 8.14 y 8.15, llegamos a que, en base factorial ei = (0.1, 0, 0, 4, 5, 0, 0, 8, 9, . . . ) + i(0.1, 2, 0, 0, 5, 6, 0, 0, 9, 10, . . . ) De hecho, tendríamos que cosh(i) =
ei + e−i = cos(1) = (0.1, 0, 0, 4, 5, 0, 0, 8, 9, 0, . . . )b! 2
y que senh(i) =
ei − e−i = i sen(1) = i(0.1, 2, 0, 0, 5, 6, 0, 0, 9, 10, . . . )b! 2
410
EXPANSIONES FACTORIALES
8.6.
Criterios de divisibilidad en base factorial
En base 10, un número es divisible entre 2 si la última cifra lo es; entre 4 = 22 si las dos últimas cifras lo son, entre 8 = 23 si ocurre lo mismo con las tres últimas cifras; y entre 2n si las últimas n cifras forman un número divisible entre 2n . Lo mismo ocurre con el 5. Ahora bien, este criterio se cumple en base factorial, pero para garantizar la divisibilidad entre cualquier número, no solo entre los de la forma 2n y 5n . Veamos lo siguiente: dado x = (ϕn , ϕn−1 , . . . , ϕ1 )b! : ? Los números divisibles entre 2 son los que tienen su última cifra igual a 0 (si un número termina en 0 es par, si termina en 1 es impar). ? Los números divisibles entre 3 son los que tienen sus últimas dos cifras iguales a (0, 0) o (1, 1) (0 y 3 respectivamente). ? Los números divisibles entre 4 son los que tienen sus últimas tres cifras iguales a (0, 0, 0), (0, 2, 0), (1, 1, 0), (2, 0, 0), (2, 2, 0) o (3, 1, 0) (0, 4, 8, 12, 16 y 20 respectivamente). Teorema 8.19. x = (ϕn , ϕn−1 , . . . , ϕ1 )b! es divisible entre 1 < k 6 n, si las primeras (k − 1) cifras de x (de derecha a izquierda) representan un número divisible entre k; es decir, si (ϕk−1 , ϕk−2 , . . . , ϕ1 )b! es divisible entre k. Demostración. x = [ϕn (n)!+ϕn−1 (n−1)!+· · ·+ϕk (k)!]+[ϕk−1 (k−1)! · · ·+ϕ2 (2)!+ϕ1 (1)!] Es inmediato que k divide a cada uno de los sumandos del primer corchete, y por lo tanto a su suma, de modo que si k divide a la suma del segundo corchete (tal y como lo establece la hipótesis), k dividirá a la suma de ambos; es decir, k|x.
8.7.
Algunas formas generales de números trascendentes
En esta sección veremos que todos los números cuya expansión factorial es de la forma (ϕM , ϕM −1 , . . . , ϕ1 .x1 , x2 , . . . , xN , a, a, a, a, a, . . . )b!
a∈N
(8.16)
ALGUNAS FORMAS GENERALES DE NÚMEROS TRASCENDENTES
411
o de la forma (ϕM , ϕM −1 , . . . , ϕ1 .x1 , x2 , . . . , xN , k, k+1, k+2, k+3, k+4, . . . )b! (8.17) 0 < k < N + 1, así como todas las expansiones periódicas de período dos (ϕM , ϕM −1 , . . . , ϕ1 .x1 , x2 , . . . , xN , a, c, a, c, a, c, . . . )b!
(8.18)
a, c ∈ N ∪ {0}, (a, c) 6= (0, 0), corresponden a números trascendentes. (Haremos un comentario adicional referente a las expansiones periódicas de período 4). o Establezcamos antes algunos acuerdos de notación que harán más ligeras las demostraciones en esta parte. Si x ∈ R, sabemos que x tiene una expansión factorial única (desechadas las “colas factoriales” de las que hablamos en la sección §8.2): x = (ϕM , ϕM −1 , . . . , ϕ1 .x1 , x2 , x3 , . . . )b!
con únicos ϕk ∈ {0, 1, . . . k} ∀ k = 1, 2, . . . , M
xj ∈ {0, 1, . . . j} ∀ j ∈ N, xj 6= j para una infinidad de j 0 s.
Representaremos con las letras mayúsculas indexadas ΦM = (ϕM , ϕM −1 , . . . , ϕ1 )b! XN = (0.x1 , x2 , . . . xN )b!
a segmentos finitos de la parte entera y fraccionaria de la expansión factorial de x. De modo que x = (ΦM .XN , xN +1 , xN +2 , xN +3 . . . )b! Nota: En ocasiones, en diversos pasos de las demostraciones omitiremos (sin lugar a confusión) hacer explícito en la notación que se trata de expansiones factoriales. o Veremos primero una propiedad sencilla de las expansiones factoriales (en F − T ), que nos permite relacionar entre sí aquellas que tienen una misma “cola”.
412
EXPANSIONES FACTORIALES
Teorema 8.20. Sean x = (ΦM .x1 , x2 , x3 . . . )b! , y = (ΨM 0 .y1 , y2 , y3 . . . )b! , x > y. Si x y y tienen el mismo signo, entonces ∃ N ∈ N tal que xk = yk ∀ k > N ⇐⇒ ∃ r ∈ Q+ tal que x = y + r. Observación. Las expansiones decimales cumplen la implicación en una dirección, pero no en la otra: x = 0.666 . . . y y = 0.333 . . . satisfacen que x = y + 31 , pero las expansiones decimales no coinciden a partir de ningún dígito. Demostración. Haremos las demostraciones para el caso en que x y y son positivas. Si ambas son negativas, se aplica la misma prueba a (−x) y (−y). ⇒) Por hipótesis, ambas expansiones son iguales a partir del (N +1)ésimo “decimal”, de modo que x − y = [(ΦM .XN ) + (.0, 0, . . . 0, xN +1 , xN +2 , xN +3 . . . )]− [(ΨM 0 .YN ) + (.0, 0, . . . 0, yN +1 , yN +2 , yN +3 . . . )] = (ΦM .XN )b! − (ΨM 0 .YN )b! . Como son expansiones factoriales finitas, se trata de dos racionales, cuya resta, por supuesto, es un racional. También resulta positivo, pues también por la hipótesis x > y, por tanto ∃ r ∈ Q+ tal que x − y = r. ⇐) Tenemos ahora que ∃ r ∈ Q+ tal que x = y + r. Por ser r racional su expansión factorial es finita: r = (ΛM 00 .RN 00 )b! . Entonces y+r = [(ΨM 0 .YN 00 )+(.0, 0, . . . , 0, yN 00 +1 , yN 00 +2 , yN 00 +3 . . . )]+(ΛM 00 .RN 00 ), pero 00
(ΨM 0 .YN 00 ) + (ΛM 00 .RN 00 ) = (ΨM 0 + ΛM 00 ) +
N X (rk + yk )
k=1
(k + 1)!
El primer sumando de la parte derecha de la igualdad anterior es la suma de dos enteros positivos, la cual se podrá ver afectada en tal caso
ALGUNAS FORMAS GENERALES DE NÚMEROS TRASCENDENTES
413
por un entero adicional si la suma que aparece a continuación rebasa la unidad. Esta última corresponde a una expansión con N 00 “cifras factoriales”, cuya parte entera puede ser 0 o 1, y cuya parte fraccionaria tiene N 00 términos, permitiendo eventualmente que algunos de ellos sean cero. Así, que a final de cuentas tenemos que (ΨM 0 .YN 00 ) + (ΛM 00 .RN 00 ) = (ΓM 000 .ZN 00 ), entonces y + r = (ΓM 000 .ZN 00 , yN 00 +1 , yN 00 +2 , yN 00 +3 . . . )b! Por otra parte, x = (ΦM .XN 00 , xN 00 +1 , xN 00 +2 , xN 00 +3 . . . )b! Dado que por hipótesis x = y +r, y considerando que las expansiones factoriales son únicas si se evitan las “colas factoriales infinitas”, que x y y fueron tomadas de entrada sin tales “colas factoriales infinitas”, y que y + r preservó la “cola” de y a partir del (N 00 + 1)-ésimo término, tendremos que (ΓM 000 .ZN 00 , yN 00 +1 , yN 00 +2 , yN 00 +3 . . . )b! = (ΦM .XN 00 , xN 00 +1 , xN 00 +2 , xN 00 +3 . . . )b!
=⇒
xk = yk ∀ k > N 00 .
Cuando y < x < 0, r = x − y > 0, pero r < |y|. Esto es relevante, porque al tomar y + r estaríamos sumando dos números con signo contrario —uno con expansión finita, el otro con expansión infinita—, y se podría pensar que se puede afectar toda la “cola” del que tiene expansión infinita, pues el procedimiento a aplicar es en realidad el de una resta. Y efectivamente eso podría ocurrir si el que tiene expansión infinita estuviera en el sustraendo de la resta (ver ejemplo 8.23); pero en este caso y siempre quedará en el minuendo (precisamente porque r < |y|).
8.7.1.
Las expansiones (ΦM .XN , a, a, a, a, a, . . . )b! , a ∈ N
Ejemplo 8.21. Obtener la expansión factorial de x = 5e + 73 .
Solución. El máximo valor posible del n-ésimo coeficiente de una expansión factorial cualquiera es precisamente n. Entonces, al multiplicar e = (1, 0.1, 1, 1, 1, 1, . . . )b! por 5, del quinto lugar en adelante todos los
414
EXPANSIONES FACTORIALES
términos de la expansión serán iguales a 5, (esto es así sea cual sea el entero positivo a por el que multipliquemos el número e: a partir de la a-ésima cifra nos va a resultar una sucesión infinita de a’s). Del cuarto lugar hacia la izquierda, siendo finito el número de cifras, se trata de un racional, que multiplicado por 5 nos vuelve a resultar un racional cuya expansión solo afecta de la cuarta cifra hacia la izquierda. Al sumar 73 , siendo este también un racional, ocupa solo un número finito de cifras que eventualmente puede ir más allá de la quinta cifra, pero eso no afectará que la “cola” siga siendo una sucesión infinita de 5’s: 5e = 5
1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + +. . . , +5 0! 1! 2! 3! 4! 5! 6! 7! 8! 9! 10!
que haciendo la suma del primer paréntesis, y expresándola como la suma conveniente de los factoriales correspondientes resulta 1 0 2 0 = 2 · 3! + 0 · 2! + 1 · 1! + + + + + 2! 3! 4! 5! 5 5 5 5 5 + + + + + ... 6! 7! 8! 9! 10! = (2, 0, 1.1, 0, 2, 0) + (.0, 0, 0, 0, 5, 5, 5, 5, 5, . . . ) en base factorial.
Por otro lado, 3 2 2 1 2 4 = + + + + = (0.0, 2, 2, 1, 2, 4)b! 7 3! 4! 5! 6! 7! De modo que, contando su expansión con seis “cifras factoriales”, extendemos el segmento inicial de 5e hasta alcanzar seis cifras, y obtenemos 3 = 7 ((2, 0, 1.1, 0, 2, 0, 5, 5) + (.0, 0, 0, 0, 0, 0, 5, 5, 5, . . . )) + (0.0, 2, 2, 1, 2, 4) 5e +
Lo que queda es básicamente sumar los dos segmentos finitos: (4) (3) (2) . (2) (3) (4) (5) (6) (7)
+
2 0
0 0
1 0
. .
1 0
0 2
2 2
0 1
5 2
5 4
=
2
1
0
.
0
0
0
3
2
2
ALGUNAS FORMAS GENERALES DE NÚMEROS TRASCENDENTES
415
El algoritmo de la suma es similar al utilizado en el sistema decimal, solo que en lugar de decir en cualquier lugar “...ocho y siete, quince y llevamos una”, queriendo decir con ello que si resulta un 15 en la k-ésima cifra, restamos 10 (la base) a ella, dejamos 5 en el lugar y agregamos 1 al que le sigue (a la izquierda); en el caso de la expansión factorial, al sumar dos cifras en el k-ésimo lugar, debemos observar si obtenemos un valor mayor o igual que el “tope” para esa cifra (que no es otra cosa que el número de veces que esa subunidad cabe en la siguiente a la izquierda), y en ese caso restarle ese tope y agregar una unidad a la que sigue. Los topes los indicamos entre paréntesis en el renglón superior de la imagen anterior, para tenerlos presente al hacer la operación en cada posición. Finalmente, 5e +
3 = ((2, 1, 0.0, 0, 0, 3, 2, 2, 5, 5, 5, 5, 5, . . . ))b! 7
o En general, si x = (ϕM , ϕM −1 , . . . , ϕ1 .x1 , x2 , . . . , xN , a, a, a, a, a, . . .)b! , 0 < a ≤ N + 1 =⇒ x = (ΦM .XN ) + (.0, 0, . . . , 0, a, a, a, a, a . . . )b! Veremos que cualquier expansión de este tipo corresponde a un número de la forma ae+r, con r ∈ Q. Introduciremos para ello una notación más: (.0N , a) = (.0, 0, . . . , 0, a, a, a, a, a, . . . ), (8.19) entendiendo que el subíndice N del 0 indica el número de ceros antes de aparecer la primera a, entonces x = (ΦM .XN ) + (.0N , a).
(8.20)
Supongamos primero que x > 0. Sea y = ae (> 0 también). Como comentamos en el paréntesis de la solución del ejemplo 8.21, la “cola” de la expansión de ae a partir de su a-ésima “cifra factorial” constará solo de a’s, de modo que y = (ΨM 0 .YN 0 ) + (.0N 0 , a).
(8.21)
Tomamos N 00 = m´ ax{N, N 0 } y extendemos los segmentos finitos de x y y hasta contar ambos con N 00 “cifras factoriales” (de hecho, a lo más se extendería uno de los dos segmentos). En caso de que N 00 > N , el
416
EXPANSIONES FACTORIALES
segmento de x se extenderá incorporando (N 00 − N ) a’s; y si N 00 > N 0 , será el de y el que se extienda incorporando (N 00 − N 0 ) a’s. Así, x = (ΦM .XN 00 ) + (.0N 00 , a) y = (ΨM 0 .YN 00 ) + (.0N 00 , a) ∴ x − y = (ΦM .XN 00 ) − (ΨM 0 .YN 00 ) que es la diferencia de dos números racionales, y por tanto igual a otro número racional, digamos r (que puede ser positivo, negativo o cero, según hubiera ocurrido que 0 < y < x, 0 < x < y o 0 < x = y), y entonces x = y + r = ae + r, r ∈ Q.
Si x hubiera sido negativa, toda la expansión obtenida en (8.20) estaría afectada por un signo menos. Lo que haríamos entonces es multiplicar e por −a y proceder de manera análoga, pudiendo obtener al final que x = −(ae + r) para alguna r ∈ Q. Hemos demostrado entonces el siguiente teorema. Teorema 8.22. Si x = ±(ϕM , ϕM −1 , . . . , ϕ1 .x1 , x2 , . . . , xN , a, a, a, . . . )b! , entonces x = ±(ae + r), a ∈ N, r ∈ Q. La validez del inverso de este teorema se comenta más adelante.
8.7.2.
Las expansiones (ΦM .XN , k, k+1, k+2, k+3, k+4, . . . )b! , 0 0 (aquí no hay esencialmente ningún cambio si afectamos todo por un signo negativo). No hay pérdida de generalidad en suponer que antes de comenzar el período hay un número par 2N de cifras, N = 0, 1, 2, . . . Sea y = (ψM , ψM −1 , . . . , ψ1 .x1 , x2 , . . . , x2N , a, c, a, c, a, c, . . . )b!
a, c ∈ N ∪ {0}, (a, c) 6= (0, 0), a ≤ 2N + 1, c ≤ 2N + 2.
Si llamamos α = (.02N , a, c, a, c, a, c, ...)b! , tenemos que
Como
∞ X
∞ X
1 1 . + c (2k)! (2k + 1)! k=N +1 k=N +1
α = a
(8.26)
∞ X
∞ N ∞ X X X 1 1 1 1 = − = −A (2k)! k=0 (2k)! k=0 (2k)! k=0 (2k)! k=N +1
∞ X
∞ N ∞ X X X 1 1 1 1 = − = − C, (2k + 1)! k=0 (2k + 1)! k=0 (2k + 1)! k=0 (2k + 1)! k=N +1
donde A, C son dos constantes racionales, pues ambas resultan de una suma finita de racionales.
421
ALGUNAS FORMAS GENERALES DE NÚMEROS TRASCENDENTES
Por (8.10) y (8.11) tenemos entonces que e + e−1 α=a 2
!
e − e−1 +c 2
!
− aA − cC,
y como y = (ΨM .Φ2N )b! + α = K + α, K ∈ Q, tenemos finalmente que e + e−1 y =K +a 2
!
e − e−1 +c 2
!
− aA − cC.
Factorizando e y e−1 , tenemos que y=
a+c e+ 2
Si ahora hacemos A0 = tenemos que
a − c −1 e + (K − aA − cC). 2
a+c a−c 0 6= 0, B 0 = , C = (K − aA − cC), 2 2
y = A0 e + B 0 e−1 + C 0 , con A0 , B 0 , C 0 ∈ Q, A0 6= 0,
(8.27)
que es un número trascendente. De modo que todas las expansiones factoriales periódicas con período 2 son trascendentes. La trascendencia de y = ±(ae + r), a ∈ N, r ∈ Q es inmediata, así es que con los teoremas 8.22, 8.24 y el desarrollo hecho en esta subsección, hemos probado el siguiente corolario. Corolario 8.29. Todos aquellos números reales cuya expansión factorial sea de la forma (8.16), (8.17) u (8.18), son números trascendentes. En el caso de las expansiones periódicas de período 4, también es más o menos rápido obtener su forma general. Igual no hay pérdida de generalidad en suponer que el período comienza después de 4N cifras, con N = 0, 1, 2, . . . Entonces:
Sea y =(ψM , ψM −1 , . . . , ψ1 .x1 , x2 , . . . , x4N , s, t, u, v, s, t, u, v, . . . )b! s, t, u, v ∈ N ∪ {0}, (s, t, u, v) 6= (0, 0, 0, 0),
s ≤ 4N + 1, t ≤ 4N + 2, u ≤ 4N + 3, v ≤ 4N + 4.
422
EXPANSIONES FACTORIALES
Si llamamos α = (.04N , s, t, u, v, s, t, u, v, . . . )b! , tenemos que ∞ X
α=s
k=N +1
1 (4k − 2)!
!
+t
∞ X
k=N +1
1 (4k − 1)!
∞ X
+u
1 (4k)!
k=N +1
!
!
+v
∞ X
k=N +1
1 (4k + 1)!
!
(8.28)
Como ∞ N ∞ X X X 1 1 1 1 = − = −S (4k − 2)! k=1 (4k − 2)! k=1 (4k − 2)! k=1 (4k − 2)! k=N +1 ∞ X
∞ X
∞ N ∞ X X X 1 1 1 1 = − = −T (4k − 1)! k=1 (4k − 1)! k=1 (4k − 1)! k=1 (4k − 1)! k=N +1 ∞ X
∞ N ∞ X X X 1 1 1 1 = − = −U (4k)! (4k)! (4k)! (4k)! k=N +1 k=1 k=1 k=1
∞ X
∞ N ∞ X X X 1 1 1 1 = − = − V, (4k + 1)! k=1 (4k + 1)! k=1 (4k + 1)! k=1 (4k + 1)! k=N +1
donde S, T, U.V son constantes racionales, pues las cuatro resultan de una suma finita de racionales. Sustituyendo en (8.28) tenemos que α=s
∞ X k=1
1 (4k − 2)!
+u
∞ X k=1
!
+t
1 (4k)!
∞ X k=1
!
+v
1 (4k − 1)! ∞ X k=1
!
1 (4k + 1)!
!
− (sS + tT + uU + vV ).
(8.29)
Si colocamos frente a nosostros las series que corresponden al cosh(1), senh(1), sen(1) y el cos(1) (ver la sección §8.5), resulta notorio lo que debemos hacer: 1 1! 1 sen(1) = 1! 1 cosh(1) = 0! 1 cos(1) = 0!
senh(1) =
1 3! 1 − 3! 1 + 2! 1 − 2! +
1 5! 1 + 5! 1 + 4! 1 + 4! +
1 7! 1 − 7! 1 + 6! 1 − 6! +
+ ··· + ··· + ··· + ···
423
CONJUNTOS DE CANTOR FACTORIALES
Sumando o restando la primera y la segunda, y por separado la tercera y la cuarta, y dividiendo luego cada resultado entre 2, obtenemos ∞ X senh(1) + sen(1) 1 1 1 1 = + + + ··· = 1 + 2 1! 5! 9! (4k + 1)! k=1 ∞ X 1 1 1 1 senh(1) − sen(1) = + + + ··· = 2 3! 7! 11! (4k − 1)! k=1 ∞ X 1 1 1 1 cosh(1) + cos(1) = + + + ··· = 1 + 2 0! 4! 8! (4k)! k=1
∞ X 1 1 1 1 cosh(1) − cos(1) = + + + ··· = 2 2! 6! 10! (4k − 2)! k=1
Sustituyendo ahora en (8.29), llegamos a que
senh(1) − sen(1) cosh(1) − cos(1) +t 2 2 cosh(1) + cos(1) senh(1) + sen(1) +u −1 +v −1 2 2 −(sS + tT + uU + vV ) u−s t+v s+u cosh(1) + cos(1) + senh(1) = 2 2 2 v−t + sen(1) − (u + v) − (sS + tT + uU + vV ). 2
α =s
que
Como y = (ΨM .Φ4N )b! + α = K + α, K ∈ Q, tenemos finalmente y = A cosh(1) + B cos(1) + C senh(1) + D sen(1) + E
(8.30)
donde A=
s+u u−s t+v v−t ,B = ,C = ,D = , E = K − (u + v + sS + tT + uU + vV ) 2 2 2 2
son todas constantes racionales. Nótese que si s = u y t = v, la expansión sería de período 2, y los valores obtenidos en (8.30) coinciden con los obtenidos en (8.27).
8.8.
Conjuntos de Cantor factoriales
Haremos ahora una construcción ligeramente diferente a la clásica de un conjunto de Cantor. Nuestro punto de partida no será el intervalo
424
EXPANSIONES FACTORIALES
unitario, sino el [0, 21 ]. Las subdivisiones no serán en tres partes cada vez, sino primero en tres, luego en cuatro, en cinco, y así sucesivamente, y cuando la división sea en un número impar de subintervalos, extraemos el central; pero cuando sea en un número par extraemos no uno, sino los dos subintervalos centrales de cada parte dividida (para mantener la simetría en el conjunto). Si llamamos Sk a la unión de subintervalos abiertos que sustraemos en la k-ésima etapa, tenemos lo siguiente:
Figura 8.5: Conjunto de Cantor factorial.
S1 = S2 = S3 =
1 2 , , 3! 3!
µ(S1 ) = 20 · 1 ·
1 3 [ 9 11 , , , 4! 4! 4! 4!
1 3!
µ(S2 ) = 21 · 2 ·
2 3 [ 17 18 [ 42 43 [ 57 58 , , , , , 5! 5! 5! 5! 5! 5! 5! 5!
1 4!
µ(S3 ) = 22 ·1·
1 5!
S4 es la unión de 23 intervalos abiertos de longitud 2 · 6!1 cada uno, S5 es la unión de 24 intervalos abiertos de longitud 1 · 7!1 cada uno, y así sucesivamente. Definimos el conjunto de Cantor factorial como Cf =
∞ [
k=1
Sk
!c
Teorema 8.30. Cf tiene medida positiva.
(8.31)
425
CONJUNTOS DE CANTOR FACTORIALES
Demostración. ¿Cuál es la medida de todos los intervalos que sacamos del [0, 21 ]? µ
∞ [
k=1
Sk
!
=
∞ X
µ(Sk )
k=1
1 1 1 1 1 1 + 21 · 2 · + 22 · + 23 · 2 · + 24 · + 25 · 2 · + · · · 3! 4! 5! 6! 7! 8! 1 23 24 25 26 27 28 = 3 +2· + +2· + +2· + ··· 2 3! 4! 5! 6! 7! 8! 4 3 4 5 6 7 8 1 2 2 2 2 2 2 2 26 28 = 3 + + + + + +· · · + + + +· · · 2 3! 4! 5! 6! 7! 8! 4! 6! 8! "∞ # "∞ #! k 2k X2 X 2 1 = − (1 + 2 + 2) + − (1 + 2) 8 k! (2k)!
=1·
k=0
k=0
La primer sumatoria es igual a e2 ; para resolver la segunda veremos un lema breve, que es una generalización del lema 8.16. Lema 8.31. Sea N ∈ N. (1) (2)
∞ X N 2k
k=0 ∞ X
(2k)!
=
eN + e−N 2
(8.32)
eN − e−N N 2k+1 = (2k + 1)! 2 k=0
(8.33)
Demostración. Por Taylor, N0 N1 N2 N3 N4 N5 + + + + + + ··· 0! 1! 2! 3! 4! 5! N0 N1 N2 N3 N4 N5 − + − + − + ··· = 0! 1! 2! 3! 4! 5!
eN = e−N
Si sumamos ambas ecuaciones y dividimos entre 2, obtenemos la primera fórmula; si las restamos y dividimos entre dos, obtenemos la segunda. Regresando al conjunto de Cantor factorial, tenemos que si sustituimos N = 2 en (8.32) obtenemos: µ
∞ [
k=1
Sk
!
"
i e2 + e−2 1 h 2 e −5 + −3 = 8 2
#!
≈ 0.393906473 . . . ,
426
EXPANSIONES FACTORIALES
∴
µ(Cf ) = µ
1 0, 2
−µ
∞ [
Sk
k=1
!
≈ 0.106093527 . . .
Se trata entonces de un conjunto de Cantor gordo. Observación. En el momento de construir el conjunto de Cantor podríamos haber extraído solo un intervalo (y no dos), tanto en el caso en que dividamos en un número impar de subintervalos, como cuando lo hicimos en un número par (escogiendo, por ejemplo, uno de los dos intervalos centrales de la división). El detalle es que pierde simetría, pero si así lo hiciéramos, la medida del conjunto de Cantor factorial correspondiente sería 1 1 2 − e − 5 ≈ 0.20136799 . . . 2 8
Veamos ahora de qué forma son las expansiones de los números de Cf . Si observamos los conjuntos S1 , S2 , S3 . . . que sacamos del intervalo [0, 21 ] para formar Cf , tenemos que los puntos del [0, 21 ] son de la forma x = (0.0, x2 , x3 , x4 , . . . ) : x ∈ S1 =⇒ x2 = 1
x ∈ S2 =⇒ x3 = 1, 2 x ∈ S3 =⇒ x4 = 2
x ∈ S4 =⇒ x5 = 2, 3 ···
x ∈ S2k−1 =⇒ x2k = k
x ∈ S2k =⇒ x2k+1 = k, k + 1 ···
La propiedad clave que define a los coeficientes de las expansiones infinitas de los elementos del conjunto de Cantor factorial, es que x2k 6= k, x2k+1 6= k, k + 1 ∀ k ∈ N.
(8.34)
En cuanto a las “pocas” expansiones finitas que pertenecen a él —los extremos izquierdos de los intervalos abiertos que vamos sacando del [0, 1]—, todas sus cifras, excepto la última, satisfacen la misma propiedad anterior, y la última cumple que x2N = N,
x2N +1 = N.
(8.35)
CONJUNTOS DE CANTOR FACTORIALES
427
Teorema 8.32. Cf es compacto y tiene la cardinalidad del continuo. Demostración. 1) Se trata de un conjunto compacto, es inmediato a partir de (8.31), pues es el complemento de un abierto y está acotado. 2) Respecto de su cardinalidad, dejando de lado los puntos de los extremos izquierdos arriba mencionados (que forman un conjunto numerable), se trata de expansiones que en su segunda componente pueden tener dos posibles valores (0 y 2); en su tercera también tienen dos opciones (0 y 3); en su cuarta, cuatro (0,1,3 y 4); y en su quinta, también cuatro (0,1,4 y 5). En general, en su 2k-ésima componente tienen 2k opciones: 0, 1, . . . , k, k + 2, . . . , 2k; en la 2k + 1, de nuevo 2k opciones: 0, 1, . . . , k − 1, k + 2, . . . , 2k + 1. De modo que en total habría 2 · 2 · 4 · 4 · · · 2k · 2k · · · ≥ 1 · 2 · 3 · · · k · · · = (ℵ0 )!, y como a la vez es un subconjunto del [0, 12 ], por el teorema (2.6) tenemos, que |Cf | = c. Teorema 8.33. Cf es perfecto. Demostración. La descripción de Cf que hemos hecho se puede reformular de la siguiente manera: x ∈ Cf ⇐⇒ x = (0.0, x2 , . . . , xk , . . . ), con xk ∈
n 0, 1, . . . ,
n 0, 1, . . . ,
k 2
o
− 1, k2 + 1, . . . , k ,
k−1 2
− 1,
k−1 2
si k es par (8.36) o
+ 2, . . . , k , si k es impar
o x = (0.0, x2 , . . . , xN ), con xN =
N 2,
si N es par
N −1 2 ,
si N es impar
(8.37)
y xk satisface (8.36) si k < N. Si x ∈ Cfc , como es un conjunto abierto, x no puede ser punto de acumulación de Cf . Entonces Cf contiene a todos sus puntos de acumulación. Supongamos ahora que x ∈ Cf . Ahí hay dos posibilidades: 1) Que cumpla con (8.37) (es decir, que sea un extremo izquierdo de alguno de los intervalos que generan los conjuntos SN ).
428
EXPANSIONES FACTORIALES
2) Que cumpla con (8.36). Tomemos una ε > 0, y escojamos una N ∈ N tal que N1 ! < ε. Caso 1): h i Sea x = (0.0, x2 , . . . , xK ), con xK = K2 . Si K < N , tomamos y = (0.0, x2 , . . . , xK−1 , xK − 1, K + 1, K + 2, . . . , N , yN +1 , yN +2 . . . ), con yk cumpliendo (8.36) ∀k > N . Entonces 1 y ∈ Cf y 0 < x − y ≤ (N +1)! < N1 ! < ε. Si K ≥ N , en forma parecida tomamos y = (0.0, x2 , . . . , xK−1 , xK − 1, yK+1 , yK+2 , . . . ), con yk cumpliendo (8.36) ∀k > K ≥ N . Entonces 1 1 ≤ (N +1)! < N1 ! < ε. y ∈ Cf y 0 < x − y ≤ (K+1)! Caso 2): Si x = (0.0, x2 , . . . , xN , xN +1 , xN +2 , . . . ), tomamos y = (0.0, x2 , . . . , xN , yN +1 , yN +2 , . . . ) con yk que cumpla (8.36) ∀k > N, ∴ y ∈ Cf . Como x ≥ (0.0, x2 , . . . , xN ) y y ≤ (0.0, x2 , . . . , xN ) + (0.0N −1 , 1), tenemos que 1 0 < y − x ≤ (N +1)! < (N1 )! < ε. En todos los casos resulta que x es punto de acumulación de Cf ; es decir, Cf contiene a todos sus puntos de acumulación. Nótese en la demostración anterior que en cada caso habríamos podido escoger una y 0 entre la y escogida y el punto x, de manera que 0 y2k+1 = k + 1 para cualquier k > N , con lo que el punto y 0 exhibido sería un elemento de Cfc . Es decir, que en toda vecindad de un elemento x de Cf existe también siempre un elemento y 0 de su complemento, que además pertenece a un intervalo abierto que se encontraría entre x y y, y por ello en la vecindad de radio arbitrario tomada alrededor de x, es decir, que se cumple el siguiente teorema. Teorema 8.34. En cualquier vecindad de cualquier elemento de Cf hay un intervalo abierto de su complemento contenido en él. De ahí se desprenden los corolarios que vienen a continuación. Corolario 8.35. Cf no contiene ningún intervalo. Corolario 8.36. El interior de Cf es vacío. Como su cerradura es igual a él mismo, el interior de su cerradura es vacío, de manera que de ahí se desprende el corolario que sigue. Corolario 8.37. Cf es denso en ninguna parte.
CONJUNTOS DE CANTOR FACTORIALES
Figura 8.6: Cantor factorial y clásico.
429
430
EXPANSIONES FACTORIALES
8.9.
Otras bases para representar a los números reales
o Las representaciones decimal, binaria, ternaria, o la que hemos estudiado en este capítulo (factorial), encajan todas dentro de un esquema, que consiste en asignar a cada punto de la recta una expresión del tipo x = ±(A0 u(0) + a1 u0 + a2 u00 + · · · + ak u(k) + . . . ), con u(k−1) = bk u(k) ,
A0 ∈ N ∪ {0},
∀ k ∈ N.
0 ≤ ak ≤ bk − 1,
En los primeros casos bk es constante (10, 2 o 3); y en el último es variable (bk = k + 1). Si tomamos x ∈ R+ , u(0) = 1, lo anterior se puede expresar como x = A0 +
a2 a3 ak a1 + ··· + + + ··· + b1 b1 b2 b1 b2 b3 b1 b2 . . . bk
1 1 1 1 = A0 + a1 + a2 + a3 + (· · · ) b1 b2 b3 b4
.
(8.38)
(8.39)
En realidad son dos sucesiones las que entran en juego para representar a un número real con una determinada base: la sucesión de radios entre las subunidades (respecto de la subunidad inmediata anterior) n o 1 1 1 b1 , b2 , . . . bk , . . . , y la sucesión de coeficientes {A0 , a1 , a2 , . . . ak , . . . }. y en la expansión factorial es la sucesión armónica
n
1 1 1 , , . . . 10 ,... o n 10 10 1 1 1 , , . . . , . . . . 2 3 k
En la expansión decimal la sucesión de radios es
o
,
o Pero podemos dar más pasos en la generalización. En todo el esquema anterior se parte de que las bk ’s son enteros no negativos para toda k. ¿Cómo serían las cosas si permitimos que las bk ’s sean números racionales? Aquí se presentarían a su vez los dos casos: que fueran constantes o que fueran variables. Las dos únicas condiciones son que (k−1) bk = u uk > 1, y que 0 ≤ ak < bk , ak ∈ N ∪ {0}. Ejemplo 8.38. ¿Qué número es el (0.1, 1, 1, 1, 1, ...) en una base tal que cada subunidad es igual a 23 de la anterior?
431
OTRAS BASES PARA REPRESENTAR A LOS NÚMEROS REALES
Solución. Aquí, Entonces
n
1 bk
o
=
2 3
x = (0.1, 1, 1, 1, 1, ...) 3 = 1 · 2
∀k. La sucesión de radios es
2 +1· 3
2
2 3
+1·
3
2 3
n
2 2 2 3, 3, 3, · · ·
+ ··· =
2 3
1−
2 3
o
.
=2
Partiendo de la representación de un número con una serie, se puede identificar una base en la que ese número tenga una expresión sencilla. Hay series que también conducen a expresiones accesibles para los radios de la base. Veamos un par de ejemplos. Ejemplo 8.39. Tomando como punto de partida la expresión π 1 1·2 1·2·3 =1+ + + + ··· 2 3 3·5 3·5·7
obtener una base en la que
π 2
tenga una expresión sencilla.
Solución. En este caso es fácil la obtención de tal base y de la respectiva expansión, pues en la serie escogida para expresar π2 se observa de inmediato la correspondencia con las expresión (8.38), y su paso a (8.39) es directo: 1 π =1+ 2 3
2 3 1+ 1 + (· · · ) . 5 7
(8.40)
De modo que la sucesión de radios (racionales, variables) 1
2 3 3, 5, 7, · · ·
, es decir
u(0) = 1, En dicha base
u(k−1) = bk · u(k) =
(2k + 1) (k) u k
n
1 bk
o
sería
∀ k ≥ 2.
π = (1.1, 1, 1, 1, 1, ...). 2
Ejemplo 8.40. Partiendo de la expresión ln(2) =
∞ X 1
k=1
k2k
obtener una base en la que ln(2) tenga una expansión sencilla.
432
EXPANSIONES FACTORIALES
Solución. En este caso no es inmediata la identificación con una expresión como (8.38) o (8.39). Tomamos entonces para k ≥ 2 u(k−1) =
1 1 = bk · u k = bk · k , k−1 (k − 1)2 k2
y despejamos bk , obteniendo bk =
2k , ∀ k ≥ 2, b1 = 2. k−1
Nuestra sucesión de radios sería entonces
1 bk
=
1 1 2 3 4 , , , , ,··· 2 4 6 8 10
;
de hecho, podríamos expresar ln(2) = o bien ln(2) = 0 +
1·2 1·2·3 1 1·1 + + + + ··· , 2 2·4 2·4·6 2·4·6·8 1 1 2 3 1+ 1+ 1 + (1 + · · · ) 2 4 6 8
(8.41)
De modo que en esta base ln(2) = (0.1, 1, 1, 1, 1, . . . ). Se puede observar cierta relación entre la expresión (8.40) para π2 y la (8.41) para ln(2): los denominadores de una corren sobre los pares, los de la otra sobre los impares; los numeradores son iguales, aunque ligeramente desfasados. Pero las bk ’s también pueden ser irracionales. Veamos un ejemplo. Ejemplo 8.41. Proponer una expansión de radios irracionales constan√ 1 con la cual 2 = (1.1, 1, 1, 1, 1, ...). tes b Solución. Como 0
1,
y con ello quedará demostrado nuestro teorema. ¿Cuántos elementos tiene Fn ?, como 1 ≤ ϕn ≤ n, ϕn puede tomar n valores diferentes, y como 0 ≤ ϕk ≤ k ∀ k = 1, 2, . . . , (n − 1), cada ϕk puede tomar (k + 1) valores distintos. Entonces Fn tiene, a lo más, n · n · (n − 1) · · · (2) = n · n! elementos. Por otra parte, es inmediato que en Mn hay (n + 1)! − n! = n(n!) elementos, así es que lo que nos faltaría por probar es que si (ϕn , ϕn−1 , . . . ϕ1 )b! = (ψn , ψn−1 , . . . ψ1 )b! =⇒ ϕk = ψk
∀k = 1, 2, . . . n.
Supongamos que existe al menos una k ∈ {1, 2, . . . n} tal que ϕk 6= ψk . Sea N la más grande de dichas k’s. Entonces 1 ≤ N ≤ n y podemos suponer que ϕN < ψN . Como son enteros, eso significa que ψN −ϕN ≥ 1, entonces
436
EXPANSIONES FACTORIALES
(ϕn , ϕn−1 , . . . ϕ1 )b! =
N −1 X k=1
≤ que por el lema 8.43
N −1 X k=1
ϕk · k! + ϕN · N ! + k · k! + ϕN · N ! +
= (N ! − 1) + ϕN · N ! +
(ψn , ψn−1 , . . . ψ1 )b! =
N −1 X k=1
ψk · k! + ψN · N ! +
≥ 0 + ψN · N ! + = ψN · N ! + Pero
n X
k=N +1
de modo que
ϕk · k! =
n X
k=N +1
n X
k=N +1 n X
k=N +1
n X
k=N +1 n X
k=N +1 n X
k=N +1
n X
k=N +1
ϕk · k!
ϕk · k!,
ϕk · k!
ψk · k!
ψk · k!
ψk · k!
ψk · k!,
(ψn , ψn−1 , . . . ψ1 )b! − (ϕn , ϕn−1 , . . . ϕ1 )b! ≥ −(N ! − 1) + (ψN − ϕN ) · N ! ≥ −N ! + 1 + 1 · N ! = 1,
∴
(ϕn , ϕn−1 , . . . ϕ1 )b! < (ψn , ψn−1 , . . . ψ1 )b! .
o A continuación se hará la demostración del teorema 8.5, que establece lo siguiente: Si llamamos F = {(0.x1 , x2 , x3 , . . . )|xk ∈ {0, 1, 2, . . . , k} ∀ k ∈ N}, y T = {(0.x1 , x2 , x3 , . . . )|xk = k ∀ k ≥ N, para alguna N ∈ N},
437
ANEXO
entonces [0, 1) ←→ F − T . Demostración. ⇐) x ∈ F =⇒ x = 0≤x≤
∴
∞ X
xk , xk ∈ {0, 1, . . . k}, k ∈ N, (k + 1)! k=1
∞ X
k = 1, (k + 1)! k=1
por el corolario 8.2.
Como x ∈ / T , ∃ N ≥ 1 tal que xN < N (de hecho, existe una infinidad), ∞ X xk < 1. ∴ por el corolario 8.42 tenemos que (k + 1)! k=1 ⇒) Sea ahora x ∈ [0, 1). Probaremos primero que existe una expansión factorial en F − T igual a x, y luego que esta es única. Sea x ∈ [0, 1). Dada cualquier n ∈ N, sucede que p p+1 x∈ para alguna 0 ≤ p < (n + 1)!, , (n + 1)! (n + 1)!
∴
x=
1 p + rn , con 0 ≤ rn < . (n + 1)! (n + 1)!
Pero en el curso de la demostración del teorema 8.7 vimos que si p∈N n X xk p = (0.x1 , x2 , . . . xn )b! = (n + 1)! (k + 1)! k=1 con xk ∈ {0, 1, . . . k}∀k = 1, 2, . . . n, ∴
x=
n X
xk + rn , (k + 1)! k=1
0 ≤ rn
1, xn = n, con 0 ≤ xn−1 ≤ n − 2 (pues x < 1). Entonces x = (0.x1 , x2 . . . , xn−1 , n, n + 1, . . . )b! que por el corolario 8.4 = (0.x1 , x2 . . . , xn−1 + 1, 0, 0, . . . )b! = (0.x1 , x2 . . . , xn−1 + 1)b! ∈ F − T . De modo que x ∈ F − T . Es decir, que si hubiera un elemento de T asociado a x, habría además otro de F − T también asociado a él, por lo tanto siempre hay uno de F − T . Veamos ahora la unicidad. Supongamos que (0.x1 , x2 , . . . )b! = (0.y1 , y2 , . . . )b! y que al menos en una cifra ambas expansiones son distintas. Sea s el primer natural para el cual xs 6= ys , digamos, xs < ys . Sean x = (0.x1 , x2 , . . . , xs )b! , y = (0.y1 , y2 , . . . , ys )b! . x=
s−1 X
s−1 X xk yk xs xs + = + (k + 1)! (s + 1)! k=1 (k + 1)! (s + 1)! k=1
0 dos números reales. Por una vecindad de radio r del número a entendemos el conjunto de todos los números reales que distan de a menos que r, con símbolos Vr (a) = {x ∈ R | d(x, a) =| x − a |< r}. Es intuitivamente claro y fácil de probar que Vr (a) = {x ∈ R | a − r < x < a + r} = (a − r, a + r). ? Definimos la gráfica de la función f (Notación: Graf (f )) como el conjunto de puntos (x, y) en el plano tales que x ∈ D ⊆ R y y = f (x) (ver figura A.2). Es decir, Graf (f ) = {(x, f (x)) ∈ R2 : x ∈ D}. ? Está implícito en lo anterior que estamos representando los puntos del plano con parejas ordenadas de números reales; es decir, con R2 . Es
452
DEFINICIONES PRELIMINARES
Figura A.2: Gráfica de una función.
lo que se conoce como plano cartesiano, en honor al matemático, físico y filósofo francés René Descartes (1596-1650).[5] ? Nótese que trabajando con la gráfica de la función, su dominio se encuentra en el eje x y su imagen en el eje y. ? Decimos que una función f es creciente en un dominio D ⊆ R ⇐⇒ ∀ x1 , x2 ∈ D, x1 < x2 =⇒ f (x1 ) < f (x2 ). Decreciente ⇐⇒ ∀ x1 , x2 ∈ D, x1 < x2 =⇒ f (x1 ) > f (x2 ) (ver figura A.3).
(a) Función creciente.
(b) Función decreciente.
Figura A.3 [5]
Descartes introdujo las que después fueron llamadas coordenadas cartesianas en su trabajo La Geometrie, publicado en 1637 como apéndice de su obra Discours de la méthode, para resolver un problema de geometría planteado por Pappus varios siglos antes. Después, en 1668, Newton —lector de la obra de Descartes— desarrolló más la idea, entre otras cosas utilizando libremente valores negativos. En 1748 Euler hizo una exposición general del procedimiento, en su libro Introductio in Analysin Infinitorum. Hay que decir que una idea similar fue desarrollada en la misma época por Fermat, y que ambas tuvieron por antecedente un trabajo escrito por Nicole de Oresme más de dos siglos antes.152
SUCESIONES Y SERIES
A.5.
453
Sucesiones y series
? Por una sucesión de números reales {ak } entendemos un “listado infinito” de la forma a1 , a2 , a3 , . . . Formalmente hablando es una función que va de N a R, cuya regla de correspondencia es f (k) = ak ∀ k ∈ N. Los valores reales ak son llamados los términos de la sucesión. Ejemplos de sucesiones son: 1 1 1 1 1 → = 1, , , , , . . . 2 3 4 5 k 1 1 1 1 1 1 = , , , , ,... → k 2 4 8 16 32 22 → nk o = 1, 4, 9, 16, 25, . . . → rk = r, r2 , r3 , r4 , r5 , . . . → {c} = c, c, c, c, c, . . . → {2k} = 2, 4, 6, 8, 10, . . . → {2k − 1} = 1, 3, 5, 7, 9, . . . → {k o = 1001, 1002, 1003, 1004, 1005, . . . n + 1000} k → (−1) = −1, 1, −1, 1, −1, . . . n
o
→ (−1)k+1 = 1, −1, 1, −1, 1, . . . (
)
1 1 1 1 (−1)k = −1, , − , , − , . . . → k 2 3 4 5 ? Se llaman progresiones aritméticas las sucesiones {ak } que cumplen que ak+1 − ak = c, c cualquier constante. Es decir, las de la forma a, a + c, a + 2c, a + 3c, . . . ? Se llaman progresiones geométricas las sucesiones {ak } que cumak+1 plen que = r, r cualquier constante. Es decir, las de la forma ak 2 3 a, ar, ar , ar , . . . ?Se llaman progresiones armónicas las sucesiones {ak } que cumplen 1 forma una progresión aritmética. Es decir, las de la forma que ak 1 1 1 , , , ... a + c a + 2c a + 3c ? Asociadas con las progresiones aritméticas, geométricas y armónicas, se definen tres tipos diferentes de promedios (medias) que sirven para distintos fines. Como es de esperar de cualquier promedio, sus valores se encuentran siempre entre el menor y el mayor de los valores promediados. Sean a, b dos números cualesquiera. Se define:
454
DEFINICIONES PRELIMINARES
a) La media aritmética µ de a, b como su punto medio, de modo que a, µ, b quedan en progresión aritmética: µ − a = b − µ. O sea µ = a+b 2 . b) Si 0 < a, b : la media geométrica G, como el número para el b cual a, G, b quedan en progresión geométrica. Es decir, G a = G , que √ despejando conduce a que G = ab. Geométricamente G es el lado de un cuadrado cuya área es idéntica a la del rectángulo que tiene base a y altura b. c) Si 0 < a, b : la media armónica H como el número para el cual a, H, b quedan en progresión armónica. Entonces, sus inversos multiplicativos forman una progresión aritmética, es decir: 1 1 1 1 2 1 1 2 a+b 2ab − = − =⇒ = + =⇒ = =⇒ H = . H a b H H a b H ab a+b O sea que H =
ab a+b 2
=
G2 . µ
El origen de la media armónica está relacionado con la nota musical a la que en las escalas griegas tradicionales daban el nombre de nota media o “armonía”. Se puede probar que siempre sucede que a < H < G < µ < b. ? La discusión de qué se entiende por el límite de una sucesión {ak } cuando k → ∞ no es algo simple de tratar en una síntesis tan apretada como esta. Por el momento, baste decir que de lo que se trata es de observar si al hacer crecer y crecer la k, los valores de las ak correspondientes muestran una tendencia hacia un único valor; es decir, si se acercan a él tanto como queramos. Si esto es así, diremos que la sucesión converge a ese valor, o que ese número es su límite cuando k → ∞. Si no, diremos que la sucesión diverge. ? Dada una sucesión {ak }, con base en ella podemos generar otra sucesión {Sn } de la siguiente manera: S1 = a1 S2 = a1 + a2 S3 = a1 + a2 + a3
.. .
Sn = a1 + a2 + · · · + an .. .
La sucesión {Sn } así construida es llamada sucesión de sumas parciales de {ak }. Hay una notación que resulta muy práctica para sumas como esta, que es la siguiente:
455
EJERCICIOS
N ot.
Sn = a1 + a2 + · · · an =
n X
ak .
k=1
? La sucesión de sumas parciales es también llamada serie, y su límite, cuando existe, se conoce como la suma (infinita) de la sucesión {ak }: ∞ X
k=1
N ot.
ak = a1 + a2 + · · · = l´ım
n→∞
n X
ak .
k=1
Los valores {ak } son llamados términos de la serie.
A.6.
Ejercicios
1. Representen en el plano los siguientes conjuntos: a) {(x, y) : x < y}.
b) {(x, y) : x + y < 0} ∪ {(x, y) : 0 < x,
√
√ x < y ≤ 2 x}.
c) {(x, y) : 0 < y < x2 } ∩ {(x, y) : x < y < 2x2 } ∪ {(x, y) : x = ±1}.
d) {(x, y) : |x − 1| < |y + 3|}.
2. ¿Cierto o falso? Argumenten. a) ∀ n ∈ N ∃ m ∈ Z tal que m − n < 0.
b) ∃ n ∈ N tal que ∀ m ∈ Z, m − n < 0.
c) ∀ n ∈ N, ∀ m ∈ Z, m − n < 0.
d) ∃ n ∈ N y ∃ m ∈ Z tal que m − n < 0. 3. Sean A, B, y C conjuntos. Digan si se cumplen en general las siguientes igualdades. En caso de que no, agreguen una condición lo más general posible bajo la cual sí se cumplan. Por ahora, justifiquen sus respuestas simplemente con diagramas. a) A ∩ (B ∪ C) = (A ∩ B) ∪ C. b) A ∪ (B ∩ C) = (A ∪ B) ∩ C.
c) A ∪ (B\A) = A ∪ (B ∩ A).
d) Ac ∪ (B c ∪ (A\B)) = (A ∪ B) ∪ B c . 4. Digan si son verdaderas o no las siguientes afirmaciones. Justifiquen sus respuestas.
456
DEFINICIONES PRELIMINARES
a) ∃ f, g : [0, 1] → R tales que f (x) < g(x) ∀ x 6= 12 , pero f ( 21 ) > g( 12 ). b) Si f es creciente y g es decreciente en [0, 1], entonces ∀ x1 , x2 ∈ [0, 1], x1 < x2 =⇒ f (x1 ) − g(x2 ) < f (x2 ) − g(x1 ). c) ∀ n ∈ N, n3 − −n es divisible entre 3.
d) Para saber si un natural p es un número primo, basta con ver si √ es divisible por todos los naturales menores o iguales que p. 5. Grafiquen las siguientes funciones, procurando dar argumentos generales sobre su comportamiento, no simplemente tabulándolas: a) f (x) = xn , n = 1, 2, 3. b) f (x) = c) f (x) = d) f (x) =
1 xn , n = 1, 2, 3. x2 + x12 . x + x1 .
6. Dada cualquier función f : [a, b] → R, expliquen cómo sería la gráfica, el dominio y la imagen de la función g(x) definida por: a) g(x) = f (x) + c, distinguiendo los casos c > 0 y c < 0. b) g(x) = f (x + c), distinguiendo los casos c > 0 y c < 0. c) g(x) = cf (x), distinguiendo los casos c > 1, 0 < c < 1, c = −1, c < −1 y −1 < c < 0.
d) g(x) = f (cx), distinguiendo los casos c > 1, 0 < c < 1, c = −1, c < −1 y −1 < c < 0. 7. Apliquen las conclusiones a las que llegaron en el problema anterior a la función f : [0, 4] → R cuya gráfica aparece en la figura A.4, y obtengan el dominio, la imagen y las gráficas de las funciones 2f (x), f (2x), − 21 f (x), f (− 21 x), f (x) + 1, f (x + 1) y −2f ( x+1 2 ) + 3.
Figura A.4
EJERCICIOS
457
8. Sobre las implicaciones “hacia delante” o “hacia atrás” en los pasos que damos al resolver una ecuación: √ a) Supongan que quieren resolver la ecuación x − 1 = 3 − 3x. Probablemente harían algo como lo siguiente: √ x − 1 = 3 − 3x =⇒ (x − 1)2 = 3 − 3x =⇒ x2 + x − 2 = 0
=⇒ (x − 1)(x + 2) = 0
=⇒ x = 1 o x = −2.
Sin embargo, mientras que el valor x = 1 la ecuación original, el valor x = −2 no lo hace. ¿Por qué sucede esto? √ b) Si la ecuación hubiera sido 2 x + x + 1 = 0, tendríamos que √ 2 x = −x − 1 √ =⇒ (2 x)2 = (−x − 1)2 =⇒ 4x = x2 + 2x + 1
=⇒ (x − 1)2 = 0 =⇒ x = 1.
Pero x = 1 no es solución. ¿Qué está pasando? c)
i) Observen que todos los pasos que dimos en ambos ejemplos eran implicaciones en una dirección (⇒), pero ¿habrían sido válidas las implicaciones en sentido contrario (⇐) en todos los casos? Chéquenlo. ¿Tendrá esto que ver con lo que ocurrió? ii) Si al resolver la ecuación f (x) = 0, ocurre que f (x) = 0 =⇒ · · · =⇒ x = α1 o x = α2 o · · · x = αn ¿Qué nos dice esto de los valores α1 , α2 , · · · αn y qué no nos dice? iii) Por otro lado, si lo que tenemos es que x = α1 o x = α2 o · · · x = αn =⇒ · · · =⇒ f (x) = 0, ¿qué nos dice y qué no nos dice esto de los valores α1 , α2 , · · · αn ?
458
DEFINICIONES PRELIMINARES
iv) ¿Y si todos los pasos son si y solo si? d) Den un ejemplo de una ecuación con tres únicas soluciones posibles, de las cuales solo una lo sea realmente. 9. Sea f : D ⊆ R → R. Escriban con símbolos la negación de las siguientes proposiciones. Acompañen sus razonamientos con gráficas adecuadas. a) b) c) d)
f es creciente en D. f es decreciente en D. f es 1 a 1 en D. ∀ x ∈ D, x < f (x) < 1.
10. Redacten la negación de las siguientes proposiciones. a) Existen galaxias en las que todas sus estrellas tienen girando a su alrededor entre cinco y nueve planetas. b) Todos los estudiantes de física que cursan al menos diez materias de matemáticas, disfrutan más de la mitad de ellas. c) Quienes han estudiado la historia tienen algo que decir de lo que ocurrió antes cuando presencian lo que ocurre. d) Todos los peces de la laguna de Pátzcuaro que son comestibles serán puestos a resguardo mientras se descontaminan las aguas en que habitan, y serán regresados a ellas antes de cumplise tres meses del inicio de su cautiverio. 11. Den un ejemplo —o prueben que no existe— de un número de la forma n2 + n + 1, con n ∈ N, que sea divisible entre 5. 12. Tomen una matriz de m renglones y n columnas, con diversos números (naturales, para simplificar) en sus entradas. Supongan que de cada renglón escogen el menor, y al final escogen el mayor de los m escogidos. Luego, de cada columna escogen el mayor y al final escogen el menor de los n escogidos. ¿Cuál de los dos números es más grande (partiendo de que no son iguales), el mayor de los menores o el menor de los mayores? 13. ¿Puede un caballo de ajedrez moverse desde la esquina inferior izquierda del tablero hasta la esquina superior derecha pasando una sola vez por todos los cuadros del tablero?
Notas 1. Dineen, S., 2012, pp. xiv-xv. 2. Wussing, H., 1998, pp. 199-200. 3. Citado por Vilenkin, N. Ya., 1995, p. 9. 4. Aristóteles, Física, libro VI, capítulo I, pp. 201-202. 5. Stifel, M., Arithmetica Integra,1544. Citado por Wussing, H., 1998, p. 206. 6. Berkeley, G., Principles of Human Knowledge, Part One. Incluido en Ewald, W., 1999, vol. 1, pp. 33-34. 7. Euler, L., 1755, Foundations of Differential Calculus. Blanton, J. D., 2000, p. 48. 8. LeRond D’Alembert, J., Infinite. Incluido en Ewald, W., 1999, vol. 1, p. 129. 9. Gauss, C. F., Carta a Schumacher, citada en: Ferreirós, J., 2007, p. 20. Se trata de un fragmento de una carta en respuesta a un intento de prueba del postulado de las paralelas de Euclides que le había enviado Schumacher. Diversos autores (ver la misma fuente, pp. 2021) han planteado que esta cita tenía un fin muy específico, y que no puede ser utilizada en contra del infinito de la teoría de conjuntos. 10. Bolzano, B., 1851, p. 52. 11. Poincaré, H., The Logic of Infinity. En Poincaré, H. 1913b, p. 47. 12. Cantor, G., Carta al Sr. Giulio Vivanti, mayo de 1886. Gómez, C., 2009, pp. 467-469. 13. Russell, B., 1903 (2010), Principles of Mathematicas, p. 189. 14. Hilbert, D., Sobre el infinito. Incluido en Van Heijenoort, J., 1967, p. 371. 15. Gamow, G., 1947, pp. 7-9. 16. Sagan, C., 1998, pp. 13-18. 17. Aristóteles, 1995, Física, libro III, capítulo 6, p. 101. 459
460
18. 19. 20. 21. 22. 23.
NOTAS
Aristóteles, 1995, Física, resumen libro III, p. 77. Kline, M., 1972, vol. II, pp. 591-593. Euler, L., 1755. Blanton, J. D., 2000, pp. 47-61. Boas, R. P., Wrench, J. J., 1971, pp. 864-870. Kline, M., 1972, vol. II, pp. 588-589. Idea de A. J. Kemner, 1914. Citado por Havil, J., Gamma, 2003, p. 31. 24. Valor obtenido por R. Baillie en 1979 Sums of reciprocals of integers missing a given digit, Am. Math. Mon. 86, pp. 372-374. Citado por Havil, J., Gamma, 2003, p. 33. 25. Ibid., p.34. 26. Baron, M., 1969, pp.66-70. 27. Anglin, W. S., 1994, p. 138. 28. Hairer, E., Wanner, G., 1996, p. 29. 29. Anglin, W. S., 1994, p. 153. 30. Kline, M., 1972, vol. I, p. 343. 31. Kline, M., 1972, vol. I, p. 467-468. 32. Russell, B., t. 4, p. 370. 33. Poincaré, H., 1913a, p. 217 y 219. 34. Russell, B., 1903, p. 352. 35. Russell, B., 1914, pp. 171-188. 36. Adaptación de una idea planteada en un artículo aparecido en junio de 1948 en la revista American Mathematical Monthly, citado por Lieber, Lillian R., 1953, pp. 211-214. 37. Stewart, I., 1987, cap. 6, traducción castellana 1998, p. 83. 38. Ejercicio tomado de Higgins, P. M., 1998, p. 18. 39. Vilenkin, N. Ya., 1995, p. 6. 40. Buckley, B., 2012, pp. 18-19. 41. Ver nota de Carlos Solís Santos en Galileo, 1638, p. 107. 42. Galileo, 1638, pp. 107-110. 43. Gamow, G., 1947, p. 17. 44. Ver Havil, J., 2012, pp. 20-22, entre otros. 45. Ver Hollingdale, S., 1989, pp. 19-20. 46. Desarrollo geométrico a partir de una idea que aparece en Penrose, R., 2004, pp. 106-107. 47. Página https://en.wikipedia.org/wiki/Spiral_of_Theodorus. Día de consulta: 15 septiembre de 2013. 48. Ibid 49. Ver AMM, 80, 4, Apr. 1973, pp. 423-424.
NOTAS
50. 51. 52. 53. 54. 55. 56.
461
Russell, B., 1914, pp. 164-168. Ver Knorr, 1975, pp. 36-49, 298-313. Russell, B., 1914, p. 168. Ver Torretti, R., 1998, p. 43. Dauben, J. W., p. 241. Ibid., p. 298. Para ver más ejemplos de utilización de este resultado, consultar Niven, I., 1961. 57. Ver Cantor, G., 1895-1897 (1955), p. 105. 58. Mathematische Annalen, vol. 59, issue 4, 1904, p. 516. 59. Ver Moore, G. H., 2013, p. viii. 60. Para ver una monografía de múltiples resultados equivalentes al AE, se puede consultar Rubin, H. y Rubin, J. E., 1963. 61. Sierpinski, W., 1957, p. 92. 62. Ibid., p. 93. 63. Ibid., pp. 92-93. 64. Ibid., p. 93. 65. Recuento hecho por Martin Löff P., con base en Moore, G. H., 1982. Aunque un recuento similar aparece, incluyendo la fecha de publicación de sus artículos, en Huntington, V., 1917, pp. 71-72. 66. Ferreirós, J., 1999 (2007), p. 263. 67. Dunham, W., 1994, p. 219. 68. Ibid., p. 220. 69. Köning, J., On the foundations of set theory and the continuum problem. El artículo completo se puede consultar en Van Heijenoort, 1967, pp. 145-149. El párrafo que citamos aparece en la p. 145. 70. Dauben, J. W., 1988, en Brummelen, K. y Kinyon, M., 2005, pp. 231-233. 71. Ver Zermelo, E., 2010, pp. 191-201. 72. Poincaré, H., 1913, (1963), pp. 56-57. 73. Para ver las diferencias entre este sistema y el de ZF, se pueden consultar las introducciones hechas por el editor y por Von Newmann a su propuesta inicial en Heijenoort, J. van, 1967, pp. 393-396. 74. Gillman, L., 2002, p. 546. 75. Cita reproducida en Dauben, J. W., 1990, p. 54. 76. Why space has three dimensions, incluido en Poincaré, H., 1913, pp. 28-29. 77. Sierpinski, W., 1957 (1965), p. 152. 78. Kline, M., 1972 (1992), p. 1295.
462
79. 80. 81. 82.
NOTAS
Grattan-Guinness, I., 2000. Gray, J. J., 2000, p. 72. Gray, J. J., 2000, pp. 272-273. Ver Dauben, 1990, pp. 65-66 y nota 48, p. 323 sobre su primera formulación de la HC; y p. 59 sobre el infinito más pequeño. 83. Ver Stillwell, J., 2012, pp. 62-65. 84. Gödel, K., 1947 (1990), p. 181. 85. Ibid., p. 186. 86. Some considerations leading to the probable conclusion that the true power of the continuum is ℵ2 , 1970a, Gödel, K., 1995, pp. 420-422. 87. Cohen, P., 1966, p. 151. 88. Stillwell, J., 2010, p. 40. 89. Penrose, R., 2004, pp. 509-510. 90. Cantor, Fundamentos para una teoría general de conjuntos. Ewald, W. B., 1996, t. II, p. 882 y p. 891 respectivamente. Ver nota al pie p. 210. 91. Ejemplo elaborado a partir de una idea de Cantor desarrollada en líneas generales en Huntington, E. V., 1917, pp. 66-67. 92. Cantor, Fundamentos de una teoría general de conjuntos. Ewald, W. B., 1996, t. II, p. 883. 93. Cantor, Fundamentos para una teoría general de conjuntos. Ewald, W. B., 1996, t. II, p. 911. 94. Ver Grattan-Guinness, I., “Towards a biography de Georg Cantor”, Annals of Science, 27 (1971), pp. 210-228. En general, hay varios textos recomendables sobre la biografía y la obra de Cantor. Entre ellos están, además del anterior: Grattan-Guinness, I., 1970 y 2000; Dauben, J. W., 1979 y 2005; Hallet, M., 1984; Ferreirós, J., 2007 y 2006; Gómez, B. C., 2009; Lavine, S., 2005. 95. Ver Russell, B., 1903 (2010), p. 189. 96. Puede consultarse la carta completa en Gómez, B. C., 2009, pp. 290-291 (de ahí fueron tomados los presentes extractos). 97. Página https://en.wikipedia.org/wiki/Ordinal_number. Día de consulta: 12 julio de 2015. 98. Ibid. 99. Ver Cantor, G., 1895-1897, (1955), pp. 178-183. 100. Ver Cantor, G., 1895-1897 (1955), p. 187. 101. Ver Cantor, G., 1895-1897 (1955), pp. 195-201. 102. Ver Hausdorff, F., 1914 (1937), pp. 78 y 79. 103. Cantor, G., 1895-1897, p. 114.
NOTAS
463
104. Ibid., pp. 128-131. 105. Ver Haursdorff, F., 1914, pp. 65-80. 106. Se puede consultar el enunciado y la demostración en Sierpiński, W., 1957, p. 264. 107. Cantor, G., 1895-1897 (1955), pp. 159-160. 108. Ver Cantor, G., 1895-1897, p. 165 (teorema (H)). 109. Cantor, G., 1883, p. 886. 110. Cita tomada de la Introducción de Jourdain a Cantor, G., 18951897, p. 78. La cita de Jourdain consta de fragmentos de la carta. La carta completa aparece en Gómez, C., 2009, pp. 458-465. 111. El artículo de O. Veblen fue publicado en la revista Transactions of the American Mathematical Society, vol. 6, p. 170 (1905), de acuerdo con Huntington, E. V., 1917. Toda la explicación de este inciso fue desarrollada a partir de este último texto, pp. 72-73. 112. Esta ampliación del concepto de límite, como se mencionó en otro momento, se puede consultar por ejemplo en Hausdorff, F., 1914, pp. 65-80. 113. Russell, B., 1903 (2010), p. 327. 114. Cita tomada de Ferreirós, J., 2006, pp.259-261. 115. Russell, B., 1903 (2010), p. 312. 116. Huntington, E. V., 1917, pp. 41-42. 117. Ibid., pp. 56-57. 118. Moore, G., Introducción a los trabajos de K. Gödel de 1947 a 1964, en Gödel, K., 1990, p.155. 119. Sierpiński, W., 1957, p. 380. 120. Ver Gillman, L., 2002. 121. ‘t Hooft, G., 1996, p. 24. 122. Ibid., p. 25. 123. Feynman, R., Lecciones de Física, 1963. Reproducido en Feynman, R., pp. 68-69. 124. Feynman, R., 1963, p. 67. 125. Born, M., The Born-Einstein Letters, Walker, Nueva York, 1971, pp. 82, 91 y 158 respectivamente. El subrayado en la primera es de Einstein. Citadas por Ferris, T., 1990, p. 237. 126. Hawking, S., ponencia en Amsterdam Symposium on Gravity, Black Holes, and String Theory, 21 de junio de 1997. Citado por Greene, B., 2001, p. 128. 127. Ferris, T., 1990, p. 235.
464
NOTAS
128. Penrose, R., Introducción al libro Einstein’s Miraclulous Year, 1998, Princeton University Press, p. vii. 129. Ver explicación e imágenes de Greene, B., 2001, pp. 118-125. 130. Citado en Ferris, T., 1990, p. 236. 131. Feynman, R., The Character of Physical Law, Cambridge, Mass.: mit Press, 1965, p. 129. Citado en Greene, B., 2001, p. 107. 132. Heller, M. y Hugh Woodin, W., 2011, pp. 167-185. 133. Harmuth, H. F., Meffert, B., 2005, pp. xx-xxi, 26-30. 134. Hawking, S. y Penrose, R., 1996, p. 4. 135. Citado en Harmuth, H. F., Meffert, B., 2005, p. 30. 136. Citado en Penrose, R., 2004, p. 120. 137. Penrose, R., 2004, p. 119. 138. Ibid., p. 499. 139. Harmuth, H. F., Meffert, B., 2005, p. xxi. 140. Gillman, L., 2002, p. 544. 141. Idea de Jorge Luis Borges, en su cuento La biblioteca de Babel. Retomada por Paenza, A., 2007, pp. 62-65. 142. Fotografía de Martín Zalba tomada de http://www.ojodigital.com/ foro/otras/388631-punto-de-fuga.html. Día de consulta: 15 de septiembre de 2013. 143. Fotografía de “pgivaud” (pseudónimo) tomada de http://www.ojodigital.com/foro/urbanas-arquitectura-interiores-yescultura/341636-perpectiva-y-punto-de-fuga.html. Día de consulta: 15 de septiembre de 2013. Trazo digital de los puntos de fuga y la línea del horizonte por Miguel Daniel Garrido Reyes. 144. Citado en Wussing, H., 1989, p. 47. 145. Ver Gelbaum y Olmsted, 1964, pp. 15-16. 146. Ver Tweddle, J. C., 2010. 147. La prueba de unas u otras equivalencias de las señaladas, son relativamente comunes en diversos libros de cálculo y análisis. Un compendio de ellas se puede ver en Cohen, L. y Ehrlich, G., 1963, pp. 95-101. 148. Ver Gelbaum, B. y Olmsted, J., 1963, p. 16. 149. Ibid., p. 17, y Cohen, L. y Ehrlich, G., 1963, p. 101. 150. Ibid., p. 101. 151. Citado por Wussing, H., 1998, p. 207. 152. Referencia tomada de Osterman, A. y Wanner, G., 2012, pp. 188189.
Bibliografía [1] Aksoy, A. G. y Khamsi, M. A. 2010. A Problem Book in Real Analysis. Springer, New York, USA. [2] Anglin, W. 1994. Mathematics, a Concise History and Philosophy. Springer-Verlag, New York, USA. [3] Apostol, T. M. 1966. Calculus Vol. 1. Second edition edition, Wiley International Edition, New York. [4] Aristóteles 1995. Física. Editorial Gredos, S.A., Madrid. [5] Aristóteles s.f. Metafísica. Edición Electrónica de www.philosophia.cl. Escuela de Filosofía Universidad ARCIS. [6] Artin, E. 1957. Geometric Algebra. Interscience Publishers, USA. [7] Baillie, R. 1979. Sums of reciprocals of integers missing a given digit. The American Mathematical Monthly, Mathematical Association of America, Vol. 86 (No. 5), 372–374. [8] Baker, H. 1922. Principles in Geometry Vol. I. Cambridge At the University Press, Great Britain. [9] Baron, M. E. 1969. The Origins of the Infinitesimal Calculus. Dover Publications, New York, USA. [10] Bates, G. E. y Kiokemeister, F. L. 1960. The Real Number System. Allyn and Bacon, Inc., Boston. [11] Beaumont, R. A. y Pierce, R. S. 1963. The Algebraic Foundations of Mathematics. Addison-Wesley Publishing Company, Inc., USA. 465
466
BIBLIOGRAFÍA
[12] Beck, M. y Geoghegan, R. 2010. The Art of Proof. Springer Science+Business Madia LLC, New York, USA. [13] Bernays, P. 1958. Axiomatic Set Theory. North-Holland Publishing Company Amsterdan, The Netherlands. [14] Binmore, K. 1980. The Foundations of Analysis: Logic, Sets and Numbers. Cambridge University Press, England. [15] Bloch, E. D. 2011. The Real Numbers and Real Analysis. Springer, USA. [16] Boas, R. P. y Wrench, J. W. 1971. Partial sums of the harmonic series. The American Mathematical Monthly, Vol. 78 (No. 8), 864– 870. [17] Bolzano, B. 1991. Las paradojas del Infinito. Colección Mathema, Servicios Editoriales de la Facultad de Ciencias, UNAM, México. Versión en español. [18] Boyer, C. 1949. The History of the Calculus and its Conceptual Development. Dover, New York. [19] Boyer, C. y Merzbach, U. 1968. A History of Mathematics. John Wiley & Sons, Inc., USA. [20] Briggs, J. y Schaffter, T. 1979. Measure and Cardinality. The American Mathematical Monthly, Mathematical Association of America, Vol. 86 (No. 10). [21] Brummelen, G. V. y Kinyon, M. 2005. Mathematics and the Historian’s Craft. Springer, USA. [22] Buckley, B. L. 2012. The Continuity Debate: Dedekind, Cantor, du Bois-Reymond, and Peirce on Continuity and Infinitesimals. Docent Press, Boston, Massachusetts, USA. [23] Burger, E. B. 2000. Exploring the Number Jungle: A Journey into Diophantine Analysis. American Mathematical Society, USA. [24] Burger, E. B. 2008. An Introduction to Number Theory Parts I and II. The Teaching Company.
BIBLIOGRAFÍA
467
[25] Cajori, F. 1893. A History of Mathematics. The Macmillan Company, USA. [26] Cajori, F. 1915. History of zeno’s arguments on motion: phases in the development of the theory of limits. The American Mathematical Monthly, Mathematical Association of America, Vol. 22 (No. 9), 292– 297. [27] Cantor, G. 1915. Contributions to the Founding of the Theory of Transfinite Numbers. Dover Publications, Inc., New York, USA. [28] Cantor, G. 1970. An unpublished paper by georg cantor. GrattanGuinness Acta Mathematica, (No.124), 65–107. [29] Cohen, L. W. y Ehrlich, G. 1963. The Structure of the Real Number System. Litton Educational Publishing, Inc., New York & Canadá. [30] Cohen, P. J. 1966. Set Theory and the Continuum Hypothesis. W.A. Benjamin, Inc., New York. [31] Coolidge, J. L. 1990. The Mathematics of Great Amateurs. Oxford University Press, New York. [32] Dauben, J. 1979. Cantor, his Mathematics and Philosophy of the Infinity. Princeton University Press, USA. [33] Dedekind, R. 1877. Theory of Algebraic Integers. Cambridge University Press, New York, USA. [34] Dedekind, R. 1979. Números irracionales. Sigma. El mundo de las matemáticas, T 4, pp. 119–128. [35] Dence, T. P. y Dence, J. B. 2009. A survey of euler’s constant. Mathematics Magazine, Mathematical Association of America, Vol. 82 (No. 4), 255–265. [36] Devlin, K. 1979. The Joy of Sets: Fundamentals of Contemporary Set Theory. Springer-Verlag, New York, USA. [37] Devlin, K. 2003. Sets, Functions, and Logic: An Introduction to Abstract Mathematics. Chapman & Hall/crc Mathematics. [38] Dineen, S. 2012. Analysis, a Getaway to Understanding Mathematics. World Scientific Publishing Co. Pte. Ltd., Singapore.
468
BIBLIOGRAFÍA
[39] Dubinsky, E., Weller, K., McDonald, M. A. y Brown, A. 2005. Some Historical Issues and Paradoxes Regarding the Concept of Infinity: An Apos-Based Analysis: Part 1. Springer. [40] Dunham, W. 1990. Journey Through Genius: the Great Theorems of Mathematics. Penguin Books, USA. [41] Dunham, W. 1994. The Mathematical Universe. John Wiley & Sons, Inc., USA. [42] Dunham, W. 2005. The Calculus Gallery: Masterpieces from Newton to Lebesgue. Princeton University Press, USA. [43] Dyer, J. 1967. A note on redundancies in the axiom system for the real numbers. The American Mathematical Monthy, Mathematical Association of America, Vol. 74 (No. 10), 1244–1246. [44] Euler, L. 1755. Foundations of Differential Calculus. SpringerVerlag, New York. [45] Eves, H. 1958. Foundations and Fundamental Concepts of Mathematics. Dover, New York. [46] Ewald, W. 1996. From Kant to Hilbert: A Source Book in the Foundations of Mathematics Volumen II. Oxford University Press. [47] Ewald, W. 1999. From Kant to Hilbert: A Source book in the Foundations of Mathematics, vol. 1 y 2,. Oxford University Press. [48] Faticoni, T. G. 2006. The Mathematics of Infinity. John Willey & Sons, Inc., New Jersey. [49] Ferreirós, J. 2007. Labyrinth of Thought. Birkhäuser Verlag AG, Germany. [50] Ferris, T. 1988, 1990. La Aventura del Universo. De Aristóteles a la teoría de los cuantos: una historia sin fin. Crítica Drakontos, Barcelona, España. [51] Fetisov, A. 1977. Proof in Geometry. Mir Publishers. 1978, Moscow. [52] Feynman, R. P. 1963. Seis piezas fáciles. Crítica Drakontos, Barcelona, España.
BIBLIOGRAFÍA
469
[53] Fitzpatrick, R. 2007-2008. Euclides Elements of Geometry, The Greek Text of J.L. Heiberg (1883-1885). [54] Fomín, S. V. 1975. Sistemas de Numeración. Editorial Mir, Moscú. [55] Foreman, M. y Kanamori, A. 2010. Handbook of Set Theory. Springer, USA. [56] Galilei, G. 1981. Consideraciones y demostraciones matemáticas sobre dos nuevas ciencias. Editora Nacional, Madrid, España. [57] Gamow, G. 1947. One, Two, Three... Infinity. Facts and Speculations of Science. The Viking Press, New York. [58] Gamow, G. 1966. Thirty Years that Shook Physics. The Story of Quantum Theory. Dover Publications, New York, USA. [59] Gardiner, A. 1982. Understanding Infinity: the Mathematics of Infinite Processes. Dover Publications, New York, USA. [60] Gardner, M. 1984. Martin Gardner’s 6th. Book of Mathematical Diversions from Scientific American. The University of Chicago Press. [61] Gelbaum, B. G. y Olmsted, J. M. H. 1964. Counterexamples in Analysis. Dover Publications, New York. [62] Gillman, L. 2002. Two classical surprises concerning the axiom of choice and the continuum hypothesis. The American Mathematical Monthly, Mathematical Association of America, Vol. 109 (No. 6), 544– 553. [63] Gödel, K. 1947. What is cantor’s continuum problem? The American Mathematical Monthy, (No. 54), 181. [64] Gödel, K. 1990. Collected Works. Volumen II: Publications 19381974. Oxford University Press, New York, USA. [65] Gödel, K. 1995. Collected Works. Volumen III: Unpublished Essays and Lectures. Oxford University Press, New York, USA. [66] Gómez, C. 2009. Georg Cantor. Sistema de números y conjuntos. Universidade da Coruña, Servizo de Publicacións, España.
470
BIBLIOGRAFÍA
[67] Grattan-Guinnes, I. 1994. Companion Encyclopedia of the History and Philosophy of the Mathematical Sciences Volumen II. The Johns Hopkins University Press. [68] Grattan-Guinnes, I. 2000. The Search for Mathematical Roots 18701940: Logics, Set Theories and The Foundations of Mathematics from Cantor through Russell to Gödel. Princeton University Press. [69] Grattan-Guinness, I. 1980. From the Calculus to Set Theory, 16301910. Princeton University Pres, Princeton and Oxford, USA. [70] Grattan-Guinness, I. 2000. A sideways look at hilbert’s twenty-three problems of 1900. Noticies of the American Mathematical Society, Vol. 47 (No. 7), 752–757. [71] Gray, J. 1991. Did poincaré say «set theory is a disease»? The Mathematical Intelligencer, Vol. 13 (No. 1), 19–22. [72] Gray, J. 2000. El reto de Hilbert. Crítica Drakontos, Barcelona, España. [73] Greene, B. 2001. El Universo Elegante. Crítica Planeta Drakontos, Colombia. [74] Gregersen, E. 2011. The Britannica Guide to the History of Mathematics. Britannica Educational Publishing, New York. [75] Hairer, E. y Wanner, G. 1996. Analysis by Its History. Springer, New York. [76] Hallett, M. 1984. Cantorian Set Theory and Limitation of Size. Oxford University Press, New York. [77] Hamilton, A. G. 1982. Numbers, Sets and Axioms: The Apparatus of Mathematics. Cambridge University Press. [78] Hardy, G. y Wright, E. 1938. An Introduction to the Theory of Numbers. Oxford University Press, Great Britain. [79] Harmuth, H. y Meffert, B. 2005. Dogma of the continuum and the calculus of finite differences in quantum physics. Advances in imaging and electron physics, vol. 137,. Elsevier Academic Press, USA.
BIBLIOGRAFÍA
471
[80] Hasser, N., LaSalle, J. y Sullivan, J. 1959. Introduction To Analysis, Vol. 1. Blaisdell Publishing Company, Waltham, Massachusetts, Toronto, London. [81] Hausdorff, F. 1914. Set Theory. Chelsea Publishing Company, New York. [82] Havil, J. 2003. Gamma: Exploring Euler’s Constant. Princeton University Press, New Jersey, USA. [83] Havil, J. 2007. Nonplussed!: Mathematical Proof of Implausible Ideas. Princeton University Press, New Jersey. [84] Havil, J. 2012. The Irrationals. Princeton University Press, New Jersey, USA. [85] Hawking, S. y Penrose, R. 1996. The Nature of Space and Time. Priceton University Press, USA. [86] Heller, M. y Woodin, W. 2011. Infinity: New Research Frontiers. Cambridge University Press, New York, USA. [87] Higgins, P. M. 1956. Mathematics for the Curious. Oxford University Press, England. [88] Higgins, P. M. 2008. Number Story: From Counting to Cryptography. Copernicus Books. Springer-Verlang, London. [89] Higgins, P. M. 2011. Numbers, a Very Short Introduction. Oxford University Press, London. [90] Hilbert, D. 1902. The Foundations of Geometry. The Open Court Publishing Company, Chicago. [91] Hilbert, D. y Ackermann, W. 1928,1938. Principles of Mathematical Logic. Chelsea Publishing Company, USA. [92] Hinkis, A. 2013. Proofs of the Cantor-Bernstein Theorem: A Mathematical Excursion. Springer Basel. [93] Hollingdale, S. 1989. Makers of Mathematics. Dover Publications, New York.
472
BIBLIOGRAFÍA
[94] Holz, Steffens, K. y Weitz, E. 1999. Introduction to Cardinal Arithmetic. Birkhäuser Verlag AG, Basel, Switzerland. [95] Hrbacek, K. y Jech, T. 1999. Introduction To Set Theory. Marcel Dekker, Inc., USA. [96] Hughes, P. y Brecht, G. 1976. Vicious Circles and Infinity. Jonathen Cape. Thirty Bedford Square London, Great Britain. [97] Huntington, E. V. 1917. The Continuum and Other Types of Serial Order. Dover Publications, Mineola, New York. [98] Ivorra, C. La Paradoja de Banach-Tarski. http://www.uv.es. [99] Jech, T. 1978. Set Theory. The Third Millenium Edition. SpringerVerlag, Germany. [100] Jones, D. y Bush, W. 1996. Mathematical structures: answering the «why» questions. The Mathematics Teacher, Nacional Council of Teachers of Mathematics, Vol. 89 (No. 9), 716–722. [101] Jones, J. y Toporowski, S. 1973. Irrational numbers. The American Mathematical Monthy, Mathematical Association of America, Vol. 80 (No. 4), 423–424. [102] Kamke, E. 1950. Theory of Sets. Dover Publications, New York. [103] Kanamori, A. 1996. The mathematical development of set theory from cantor to cohen. The Bulletin of Symbolic Logic, Association for Symbolic Logic, Vol. 2 (No. 1), 1–71. [104] Kaplan, R. y Kaplan, E. 2003. The Art of the Infinite: the Pleasures of Mathematics. Oxford University Press. [105] Kennedy, H. C. 1973. Selected Works of Giuseppe Peano. University of Toronto Press, USA. [106] Kleiner, I. y Movshovitz-Hadar, N. 1994. The role of paradoxes in the evolution of mathematics. The American Mathematical Monthly, Mathematical Association of America, Vol. 101 (No. 10), 963–974. [107] Kline, M. 1967. Mathematics for the Nonmathematician. Dover, USA.
BIBLIOGRAFÍA
473
[108] Kline, M. 1972. El pensamiento matemático de la Antigüedad a nuestros días, I, II, III. Alianza Editorial, S.A., Madrid, España. [109] Knoebe, A., Laubenbacher, R., Lodder, J. y Pengelley, D. 2007. Mathematical Masterpieces. Springer. [110] Knorr, W. R. 1975. The Evolution of the Euclidian Elements. A Study of the Theory of Incommensurable Magnitudes and Its Significance for Early Greek Geometry. D. Reidel Publishing Company, Holland - USA. [111] Kolmogorov, A. N. y Fomin, S. V. 1970. Introductory Real Analysis. Dover Publications, New York. [112] Komjáth, P. y Totik, V. 2006. Problems and Theorems in Classical Set Theory. Springer Science+Business Media, LLC, New York, USA. [113] Laubenbacher, R. y Pengelley, D. 1999. Mathematical Expeditions: Chronicles by the Explorers. Springer-Verlag New York, Inc., New York, USA. [114] Lavine, S. 1994. Comprendiendo el infinito. Fondo de Cultura Económica, México. [115] Lieber, L. R., Lieber, H. G. y Mazur, B. 1953. Infinity. Rinehart & Company, Inc., New York-Toronto. [116] Lipschutz, S. 1964. Theory and Problems of Set Theory and Related Topics. Mc Graw Hill, USA. [117] Löf, M. 2009. 100 years of zermelo’s axiom of choice: what was the problem with it? Logicism, Intuitionism, and Formalism. Springer, Vol. 341, 209–219. [118] López, S. 1974. Notas sobre cálculo. Miscelánea Matemática, Sociedad Matemática Mexicana, (No. 12). [119] Marchisotto, E. A. 2002. The theorem of pappus: a bridge between algebra and geometry. The American Mathematical Monthly, Vol. 109 (No. 6), 497–516. [120] Marek, W. y Mycielski, J. 2001. Foundations of mathematics in the twentieth century. The American Mathematical Monthy, Mathematical Association of America, Vol. 108 (No. 5), 449–468.
474
BIBLIOGRAFÍA
[121] Moore, G. H. 1982. Zermelo’s Axiom of Choice. Its Origins, Development, and Influence. Springer-Verlag New York Inc., New York, USA. [122] Moore, G. H. 2011. Early history of the generalized continuum hypothesis: 1878-1938. The Bulletin of Symbolic Logic, Association for Symbolic logic, Vol. 17 (No. 4), 489–532. [123] Moreno, L. E. y Waldegg, G. 1991. The conceptual evolution of actual mathematical infinity. Educational Studies in Mathematics, Springer, Vol. 22 (No. 3), 211–231. [124] Newman, J. R. 1956. El mundo de las Matemáticas. Editorial Grijalbo, S.A., Barcelona, España. [125] Niven, I. 1956. Irracional Numbers. The Mathematical Association of America, USA. [126] Niven, I. 1961. Números racionales e irracionales. Random House. Editorial Norma, Cali, Colombia. [127] Old, C. 1963. Continued Fractions. The Mathematical Association of America, USA. [128] Paenza, A. 2007. Matemática... ¿Estás ahí? Siglo XXI Editores Argentina S. A., Argentina. [129] Penrose, R. 2004. El camino a la realidad. DEBATE, Barcelona, España. [130] Penrose, R. y Stachel, J. 1998. Einstein’s Miraculous Year. Five Papers that Changed the Face of Physics. Princeton University Press, USA. [131] Péter, R. 1957. Playing with Infinity. Dover Publications, New York, USA. [132] Poincaré, H. 1913a. The Foundations of Science: Science and Hypothesis, The Value of Science, Science and Method. The Science Press, New York and Garrison, N.Y. [133] Poincaré, H. 1913b. The logic of infinity. Mathematics and Science: Last Essays. Dover, p. 47.
BIBLIOGRAFÍA
475
[134] Poincaré, H. 1913c. Why space has three dimensions. Mathematics and Science: Last Essays. Dover, pp. 28–57. [135] Poincaré, H. 1914. Science and Method. Translated by Francis Maitland. Forgotten Books, Hong Kong. [136] Propp, J. 2013. Real analysis in reverse. Mathematical Association of America, . [137] Rae, A. I. 2005. Quantum Physics. A Beginner’s Guide. Oneworld publications, Oxford, England. [138] Rana, I. K. 1998. From Numbers to Analysis. World Scientific Publishing Co. Pte. Ltd., Singapore. [139] Ross, M. 2004. Irrational thoughts. The Mathematical Gazette, The Mathematical Association, Vol. 88 (No. 511), 68–78. [140] Rubin, H. y Rubin, J. 1985. Equivalents of the Axiom of Choice, II. Elsevier Science Publishers B. V., The Netherlands. [141] Rucker, R. 1976. Truth and infinity. Proceedings of the American Mathematical Society, American Mathematical Society, Vol. 59 (No. 1), 138–143. [142] Russ, S. 2004. The Mathematical Works of Bernard Bolzano. Oxford University Press. [143] Russell, B. 1903. Principles of Mathematics. Routledge Classics, London and New York. [144] Russell, B. 1914. Our Knowledge of the External World. George Allen & Unwin Ltd, London. [145] Sagan, C. 1998. Miles de Millones. Ediciones B, S.A., España. [146] Sagan, H. 1974. Advanced Calculus. Houghton Mifflin Company, Boston, USA. [147] Sierpiński, W. 1934. Hypothèse du continu. Instytut Matematyczny Polskiej Akademi Nauk, Warszawa-Lwów. [148] Sierpiński, W. 1957. Cardinal and Ordinal Numbers. PWN-Polish Scientific Publishers, Warszawa, Poland.
476
BIBLIOGRAFÍA
[149] Sierpiński, W. 1964a. Elementary Theory of Numbers. NorthHolland, PWN-Polish Scientific Publishers, Warszawa. [150] Sierpiński, W. 1964b. A Selection of Problems in the Theory of Numbers. The Macmillan Company, Pergamon Press Limited, New York. [151] Smullyan, R. 1992. Satán, Cantor y el infinito. Editorial Gedisa, S.A., Barcelona, España. [152] Smullyan, R. M. y Fitting, M. 1996. Set Theory and the Continuum Problem. Clarendon Press, Oxford, USA. [153] Stachel, J. 1998. Einstein’s Miraculous Year. Five Papers That Changed the Face of Physics. Princeton University Press, USA. [154] Stewart, I. 1987. De aquí al infinito. Grijalbo Mondadori, S.A., Barcelona, España. [155] Stillwell, J. 2002. The evolution of the continuum problem. The American Mathematical Monthly, Mathematical Association of America, Vol. 109 (No. 3), 286–297. [156] Stillwell, J. 2005. The Four Pillars of Geometry. Springer, USA. [157] Stillwell, J. 2006. Yearning for the Imposible. The Surprising Truths of Mathematics. A K Peters, Ltd., Wellesley, Massachusetts. [158] Stillwell, J. 2010. Roads to Infinity: The Mathematics of Truth and Proof. A K Peters, LTD., Natick, Massachusetts. [159] Stillwell, J. 2013. The Real Numbers. Springer International Publishing Switzerland. [160] Suppes, P. 1960. Axiomatic Set Theory. D. Van Nostrand Company, Inc., New York, USA. [161] ’t Hooft, G. 1996. Partículas elementales: en busca de las estructuras más pequeñas del universo. Crítica Drakontos, Barcelona, España. [162] Torretti, R. 1998. El Paraíso de Cantor. Editorial Universitaria, Universidad Nacional Andrés Bello, Chile.
BIBLIOGRAFÍA
477
[163] Tweddle, C. 2010. Weierstrass’s construction of the irrational numbers. Springer-Verlag, pp. 47–58. [164] Van Heijenoort, J. 1967. From Frege to Gödel. A Source Book in Mathematical Logic, 1879-1931. Harvard University Press., Cambridge, Masachusetts. [165] Vilenkin, N. Y. 1965. Inc.,1968, New York.
Stories About Sets.
Academic Press,
[166] Vilenkin, N. Y. 1995. In Search of Infinity. Birkhäuser, Boston. [167] Wagon, S. 1985. The Banach-Tarski Paradox. Cambridge University Press, New York, USA. [168] Wallace, D. F. 2003. Everything and More. A Compact History of ∞. Phoenix, London. [169] Weintraub, S. H. 1997. Early transcendentals. The American Mathematical Monthy, Mathematical Association of America, Vol. 104 (No. 7), 623–631. [170] Weiss, R. J. 1996. A Brief History of Light and Those That Lit the Way. World Scientific Publishing Co., Singapore. [171] Weyl, H. 1987. The Continuum: A Critical Examination of the Foundation of Analysis. Dover Publications, New York. [172] Wilder, R. L. 1952, 1965. Introduction to the Foundations of Mathematics. Dover Publications, Mineola, New York. [173] Wilder, R. L. 1968. Evolution of Mathematical Concepts: an Elementary Study. Dover Publications, Mineola, New York. [174] Wilson, R. y Gray, J. 2001. Mathematical Conversations. SpringerVerlag New York, Inc., New York, USA. [175] Wussing, H. 1998. Lecciones de historia de las matemáticas. Siglo XXI Editores, S.A., España. [176] Zermelo, E. 2010. Collected Works. Springer.
Índice analítico Born, Max, 260 Brahe, Tycho, 61 Broglie, Louis de, 258 Burale-Forti, Cesare, 160
alef cero (ℵ0 ), 143 Anaxágoras, 85 Aquiles y la tortuga, 79 área debajo de la curva, 29, 37 infinita, 42 Aristóteles, 86 aritmética cardinal, 151, 165 Arquímedes ley de la palanca de, 26 Arquímedes de Siracusa, 86 axioma, 163 de elección (AE), 146 de fundación, 164 de reemplazo, 164 numerable (AN), 147
cambio de base, 314 Cantor conjunto de, 77 conjunto factorial de, 423– 428 prueba diagonal de, 136 teorema, 144, 159, 188 Cantor, Georg, 89, 133, 138, 166, 175, 265, 361, 379, 423 cardinalidad, 85 comparar, 89 enteros, 102 intervalo, 130, 131 misma, la, 97 naturales, 99 racionales, 107 recta, 134 Cauchy, Augustin Louis, 373 Cavalieri principio de, 82 Cavalieri, Bonaventura, 82 centro de masa, 26 sistema, de un, 26 Church, Alonzo, 200 Cohen, Paul, 199
Baire, René-Louis, 150 Banach, Stephan, 148 Barrow, Isaac, 444 bases irracionales, 432 bases racionales, 430 Bernoulli, Daniel, 1 Bernoulli, Jacques, 1 Bernoulli, Jean, 1 Bernstein, Alex, 150 Bernstein, Felix, 166 Bohr, Niels, 260 Bolzano, Bernard, 3, 361, 373 Borel, Émile, 145, 150 478
ÍNDICE ANALÍTICO
colas infinitas de 9’s, 292 de 9’s factorial, 398 de (b − 1)’s, 310 conjunto, 441–443 bien ordenado, 110 bien-ordenado, 145 Cantor factorial, de, 423–428 Cantor, de, 77 finito, 99 infinito, 85–138 numerable, 99, 100 ordenado, 109 potencia, 156, 443 cardinalidad, 159 propiedades, 275 universal, 441 vacío, 441 potencia cardinalidad, 156 constante Euler, 31 Planck, 257 continuo, 151 orden, 197 cortaduras de Dedekind, 362–365 cuántica, 259 Dedekind, Richard, 99, 123, 160, 166, 175, 266, 361, 362, 379, 385, 390 Demócrito de Abdera, 85 derivada, 63–68 Desargues, Girard, 355 Descartes, René, 452 dimensión, 166, 175 infinita, 179 Dirichlet, Peter Gustav Lejeune, 38
479
distancia entre números reales, 451 Du Bois-Reymond, Paul, 41 Einstein, Albert, 258 encajes de intervalos, 365–367 equivalencia clases de, 444 relación de, 443 Euclides de Alejandría, 87, 120, 124 Eudoxo de Cnido, 81, 123 Euler, Leonhard Paul, 1 expansiones base b, 307 decimales, 273 factoriales, 397 finitas, 294 infinitas no periódicas, 297 periódicas, 294 orden, 293 familia finita conjuntos numerables, 100 intervalos, 137 numerable conjuntos numerables, 100, 103, 107 Feynman, Richard, 258, 261 Fraenkel, Abraham, 165 función, 449–452 biyectiva, 450 contradominio de una, 449 creciente, 452 decreciente, 452 dominio de una, 449 gráfica de una, 451
480
ÍNDICE ANALÍTICO
imagen de una, 450 inversa, 451 inyectiva, 450 límite, 13 sobreyectiva, 450 Galileo Galilei, 87 geometría proyectiva, 328 Göedel, Kurt, 198, 259 Hadamard, Jacques, 150 Hamel, Georg, 150 Hardy, Godfrey Harold, 150 Harmuth, Henning F., 262 Harnack, Axel, 138 Hausdorff, Felix, 150 Hawking, Stephen, 260, 263 Heine, Heinrich Eduard, 265, 361, 380 Heisenberg, Werner, 259 Heller, Michael, 261 Hermite, Charles, 186 Hessenberg, Gerhard, 150 Hilbert 23 problemas de, 196 hoteles de, 90–97 Hilbert, David, 90, 145, 160, 195, 198, 380 Hipaso de Metaponto, 111 hipótesis del continuo (HC), 144, 203–252 hipótesis generalizada del continuo, 160 Hobson, Ernest William, 150 horizonte, 350 Hurwitz, Adolf, 195 Huygens, Christian, 44, 258 inconmensurabilidad, 119–125 infinito
actual, 3, 85 conjunto, 85–138 línea, 350 más pequeño, 144–151 potencial, 3 punto al, 350 integral, 50–62 intervalo abierto, 445 cardinalidad, 130, 131 cerrado, 445 intuición engañosa, 72–73 Jourdain, Philip, 150 König, Julius, 150 Lagrange, Joseph-Louis, 1 Lebesgue, Henri, 150 Leibniz, Gottfried Wilhelm, 1, 13, 44, 47 Leucipo de Mileto, 85 Liouville, Joseph, 186 lógica, 446–449 media aritmética, 454 armónica, 454 geométrica, 454 Meffert, Beate, 262 Méray, Charles, 265, 361, 380, 391 Napier, John, 61 Newton, Isaac, 61, 258, 444 Nicolás de Cusa, 82 numerable, 99 numerar, 108–111 números algebraicos, 166, 184
ÍNDICE ANALÍTICO
cardinales, 151 operaciones, 151 complejos, 166 irracionales, 111–117 ordinales, 202–252 ordinales transfinitos, 160 racionales, 103–108 distribución, 103 reales, 125–138 trascendentes, 184, 185 Oresme, Nicole de, 21, 43 Pappus de Alejandría, 332 paradoja Banach-Tarski, 148 conjunto, definición de, 160– 165 Russell, 160 Zenón, 78 partición, 443 Pascal, Blaise, 47, 355 Peano, Giuseppe, 150, 380 Penrose, Roger, 264 perspectiva, 350 Pitágoras de Samos, 286, 348 Planck, Max, 257 Poincaré, Henri, 74, 150, 166 principio buen orden, del (PBO), 146 Cavalieri, 82 completez, de, 361–379 divisibilidad infinita, de (PDI), 293 elección, de, 146 elecciones dependientes, de (PED), 147 tercero excluido, del, 446 producto cartesiano, 324
481
progresión aritmética, 453 armónica, 453 geométrica, 453 propiedad arquimedeana (PA), 293 proposición, 446 punto de fuga, 350 recta cardinalidad, 134 relación, 443 equivalencia, de, 443 relatividad, 259 especial, 258 general, 258 Richard, Jules, 150 Riemann, Bernhard, 38 Rovelli, Carlo, 261 Russell, Bertrand, 73, 78, 150, 160 Saint Vicent, Grégoire de, 61 Sarasa, Alfonso Antonio de, 61 Schoenflies, Arthur Moritz, 150 Schröder, Ernst, 166 Schrödinger, Erwin, 264 secante, 63 serie(s), 455 alternante, 33 armónica, 20–42 condicionalmente convergente, 38 criterio de convergencia cociente, 20 raíz, 20 criterio de divergencia, 39 divergente, 21 geométrica, 2–20
482
ÍNDICE ANALÍTICO
convergencia, 7, 20 p, 40 término de una, 455 sistema de axiomas von Neumann-Bernays-Gödel, 165 Zermelo-Fraenkel (ZF), 165 Zermelo-Fraenkel con AE (ZFC), 165 sistema posicional, 301 Skolem, Albert, 165 sucesión, 453 armónica convergencia, 20 convergente, 454 divergente, 454 límite de una, 454 sumas parciales, de, 454 funciones, de, 13 término de una, 453 sucesiones de Cauchy, 373 supremo, 367–373 tablas de verdad, 281 tangente curva, a una, 49 gráfica, a una, 63 Tarski, Alfred, 148 teorema Bolzano, 266 Bolzano-Weierstrass, 385 Cantor (1873-4), 188 Cantor (1891), 159 Cantor (1895), 144 Cantor-Bernstein-Schröder, 166, 168 fundamental del cálculo, 71, 68− −71 incompletez de Gödel, 200
Lagrange, 268 Pappus, 332 Pascal, 355 valor medio para la integral, 270 Weierstrass, 267 Thomae, Carl Johannes, 361 Torricelli, Evangelista, 41 trompeta de Torricelli, 42 valor absoluto, 451 Venn, John, 275 volumen sólido, del, 41 Weierstrass, Karl, 265, 361, 375, 379, 391 Woodin, W. Hugh, 261 Young, Thomas, 258 Zenón de Elea, 78, 86 Zermelo, Ernst, 145