311 72 22MB
Portuguese Pages [567] Year 2010
Carlos Correia de Sá e Jorge Rocha (ed.)
TREZE Viagens pelo mundo da Matemática
2010
FICHA TÉCNICA Título Treze Viagens pelo Mundo da Matemática
Editores Carlos Correia de Sá e Jorge Rocha
Revisor Helder Marques
Coordenação Editorial Sara Ponte U.Porto editorial
Série Para Saber, 17 1.ª Edição, Porto, Outubro de 2010
© Universidade do Porto Endereço Praça Gomes Teixeira, 4099-002 Porto http://editorial.up.pt | e-mail [email protected]
© Design idd.fba.up.pt Paginação José Carlos Santos
Impressão e acabamentos Invulgar Artes Gráficas ISBN 978-989-8265-34-0 e-ISBN 978-989-8265-35-7
Depósito legal 315102/10
Carlos Correia de Sá e Jorge Rocha (ed.)
TREZE Viagens pelo mundo da Matemática
2010
ÍNDICE
EM JEITO DE PREFÁCIO
7
NOTA DOS EDITORES
11
NOTAS BIOGRÁFICAS
15
1 ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
19
António Machiavelo
2 PERSPECTIVA
69
José Carlos Santos
3 GEOMETRIA: DA INTUIÇÃO AO RIGOR
91
António Bivar
4 CENTROS DE GRAVIDADE
153
João Filipe Queiró
5 POLIEDROS
179
Luís António Teixeira de Oliveira
6 GRAFOS: NO SÍTIO E A CORES
211
Maria Leonor Moreira
7 ESPELHOS MEUS
263
Samuel António Lopes
8 DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
309
António Guedes de Oliveira
9 LÓGICA MATEMÁTICA
357
Lucinda Lima
5
10 QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
415
António M. Fernandes
11 QUADRATURA ARITMÉTICA DO CÍRCULO
447
Maria Pires de Carvalho
12 SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
495
Christian Lomp e Sandra Mónica Costa Pires
13 QUANTIFICAR O ACASO Ana Cristina Moreira Freitas e Jorge Milhazes Freitas
6
525
EM JEITO DE PREFÁCIO: PELA HONRA DO ESPÍRITO HUMANO
É uma honra para mim escrever um prefácio para este livro, tal como foi um privilégio ter acesso aos seus textos antes da sua publicação. Diverti-me com os números perfeitos e entretive-me com a perspectiva linear. Procurei adivinhar onde é o centro de Portugal e estive a usar o Geogebra para a procura de caminhos. Aprendi muitas coisas sobre a decomposição de rectângulos e viajei até à modernidade ao encontro de Lebesgue e de Kac. Este livro é divertido e instrutivo. E é um livro directo. Tudo nele é claro: os propósitos, os destinatários, a linguagem e o desenvolvimento dos temas. A Nota dos Editores explica-o com clareza e precisão. A ideia é simultaneamente simples e ambiciosa. Existe no mercado livreiro, sobretudo em língua inglesa, mas também no nosso idioma, um número razoável de textos de matemática que caem em duas categorias: o livro técnico expositivo, nas suas diversas variantes, desde o manual didáctico à monografia, e o livro de divulgação, desde os relativamente avançados até aos livros de ciência e matemática para jovens. Os professores, no entanto, e todos os interessados em aprofundar o seu conhecimento de alguns tópicos matemáticos modernos — ou tópicos antigos, mas numa visão moderna — têm dificuldade em encontrar obras adequadas. Descobrir monografias avançadas é fácil, mas essas raramente estão ao alcance dos que não são especialistas nas matérias, ou exigem uma digestão prudente, demasiado pesada para quem apenas pretende dominar os rudimentos de um determinado tópico. Quem leu, por exemplo, Caos, de James Gleick (Gradiva, 1998), terá ficado entusiasmado com os «atractores estranhos», com a metáfora da borboleta e com as histórias passadas nos corredores de Los Alamos. Ficará com uma ideia bastante pormenorizada das razões por que a teoria matemática do caos é tão falada. Perceberá que essa teoria radica em problemas matemáticos complexos, alguns deles notórios pela sua dificuldade. Mas quem tenha uma formação matemática necessita de ir mais além. Precisa de definições precisas, equações e alguns cálculos para entrar no assunto. Sem esses instrumentos matemáticos não pode verdadeiramente perceber os conceitos em causa.
7
EM JEITO DE PREFÁCIO: PELA HONRA DO ESPÍRITO HUMANO
Se recuarmos 70 anos, encontramos um livro que procurava responder a estas preocupações. Trata-se dos Conceitos Fundamentais da Matemática, que Bento Jesus Caraça escreveu e publicou em 1941 e 1942 (a terceira parte da obra só sairia em 1951, depois do falecimento do autor). O livro de Caraça, continuamente editado e reeditado no nosso país, é apropriado para estudo autónomo, como complemento da escola e como formação do professor. Coloca-se entre a obra de divulgação e o manual escolar. Nele aparecem definições, fórmulas, teoremas, gráficos e todas as componentes do verdadeiro texto matemático. Mas é passível de uma leitura ligeira, saltando alguns pormenores técnicos e incidindo sobre os aspectos conceptuais e históricos, tal como é passível de uma leitura cuidada, com papel e lápis ao lado, e tempo para reflexão. O livro que o leitor tem consigo segue esse modelo. Não é tão sistemático como o livro de Bento de Jesus Caraça, que traça uma história de alguns temas centrais na matemática, tais como o número, desde a pré-história até ao século XX. Mas situa-se na mesma linha de divulgação exigente, ou de complemento académico mais ligeiro. Estas Treze Viagens Pelo Mundo da Matemática podem ser lidas de diversas formas. Se o leitor pretende apenas aprender mais, sem nenhum objectivo prático imediato, damos-lhe desde já os parabéns. Há valor no saber pelo saber, no saber desinteressado, no saber de que não resulta nenhuma «competência» aplicada nem nenhum valor material imediato. Por vezes, com a nossa preocupação em apontar aos jovens a utilidade do que se estuda, caímos na armadilha de justificar todas as componentes do ensino com base numa aplicabilidade imediata. Essa armadilha, para que nos empurram também muitas das orientações pedagógicas em moda, é perigosa porque desvaloriza o conhecimento e porque desorganiza o ensino, sobretudo o da matemática, que não pode orientar-se pela aplicabilidade de cada tema, devendo antes seguir uma ordem de progressão lógica e pedagógica intrínseca aos temas e não às suas aplicações. Mas se o leitor é estudante ou professor e lê este livro ou algum dos seus capítulos com objectivos académicos, damos-lhe também os parabéns. Em primeiro lugar, porque da sua leitura certamente surgirão esclarecimentos úteis — e certamente surgirão ideias e paralelismos que beneficiarão o ensino ou o estudo. Em segundo lugar, porque de alguns capítulos podem surgir ideias práticas, para actividades dos alunos ou para aulas complementares. O ensino é uma actividade organizada de transmissão de conhecimentos, procedimentos, atitudes e valores. A escola centra-se ou dever-se-ia centrar nos 8
NUNO CRATO
primeiros. Sem conhecimentos, sem fluência em rotinas e processos, não é possível ocupar um papel dinâmico na sociedade nem ter uma atitude activa perante a vida e os valores humanos que prezamos. Essa transmissão de conhecimentos tem de ser organizada, metódica, progressiva. E tem de se avaliar constantemente, de forma a que se possa progredir com segurança. Mas faz parte da escola desviar-se de vez em quando do seu caminho sistemático e fazer uma incursão por temas novos, que podem estar ou não directamente relacionados com os programas. Nesses desvios dão-se referências e abrem-se horizontes. Entusiasmam-se alguns alunos; despertam-se outros. O erro não está em motivar os estudantes com matérias atractivas, está em fazer dessa atracção o pressuposto do estudo. Estuda-se com gosto quando se tem gosto. E tem-se gosto quando se conhece. Usar um só caminho nesta dialéctica é um tremendo erro. Os bons mestres praticam uma via eclética. Tendem a ser sistemáticos e organizados. E pretendem ser motivadores e promover uma aprendizagem activa. Este livro pode ser uma ajuda preciosa aos professores quando estes encaram esta segunda vertente do ensino. Pode também ajudá-los na primeira. Estejam motivados apenas pela curiosidade ou estejam interessados nos objectivos práticos de ensino, todos têm a lucrar com a leitura deste livro. Mas perdoem-me que reforce a ideia de que se aprende para saber. E que o saber desinteressado tem valor. Em 1830, um grande matemático do século XIX, C. G. J. Jacobi, escreveu numa carta a um seu colega francês uma frase que se tornou célebre e que é o maior apelo ao saber matemático que conheço. Tenho-a escrita em letras de ouro na minha memória. Parece-me apropriado repeti-la aqui. Dizia Jacobi: «… Fourier tinha a opinião que o fim principal da matemática é a sua utilidade pública e a explicação dos fenómenos naturais; mas um filósofo como ele deveria saber que o fim único da ciência é a honra do espírito humano e que, por isso, uma questão sobre números tem tanto valor como uma questão sobre o sistema do mundo.» Nuno Crato Presidente da Sociedade Portuguesa de Matemática
9
NOTA DOS EDITORES
A Reitoria da Universidade do Porto teve a amabilidade de nos convidar para a edição de um livro de matemática que pudesse ser uma participação no debate sobre a questão do «insucesso» escolar nesta disciplina e, se possível, contribuir para a solução de alguns aspectos do problema. Pelo menos na matemática, que é o ramo que conhecemos melhor, a produção nacional de livros científicos, em certo sentido intermédios entre a criação original e a divulgação, é ainda diminuta, quando comparada com a de outros países da nossa dimensão demográfica. A publicação de literatura matemática parece-nos, contudo, um indicador do nível de cultura científica da população e um instrumento para a sua elevação. Se outras razões não houvesse, esta teria sido suficiente para que tivéssemos encarado o convite da Reitoria da Universidade do Porto, para além de amável, também como irrecusável. Pensámos num livro que pudesse ser útil aos professores de matemática do Ensino Secundário. Idealizámos um livro que, sem concessões ao facilitismo imperante no sistema de ensino público nacional, tivesse um grau de complexidade relativamente moderado, de modo a que também alunos com mais maturidade pudessem aproveitar com a sua leitura. Pareceu-nos que o ideal seria uma obra de autoria múltipla, com contribuições de matemáticos profissionais e em que a variedade de estilos e de sensibilidades pudesse constituir uma mais-valia. Fizemos também questão de que o conjunto de autores não se confinasse aos nossos colegas de Departamento; congratulamo-nos por poder contar com a colaboração de uma professora do Ensino Secundário, de uma colega da Faculdade de Economia da nossa Universidade e de três professores de outras tantas prestigiadas instituições universitárias do país: a Universidade de Coimbra, a Universidade de Lisboa e a Universidade Técnica de Lisboa. Confortou-nos desde a primeira hora o entusiasmo de todos os colegas que contactámos, incluindo o daqueles que, em virtude de outros afazeres já agendados, não puderam colaborar connosco neste projecto. Pudemos sempre contar com a disponibilidade, o profissionalismo e o rigor de todos os autores. E não queremos deixar de referir também a flexibilidade e a simpatia com que aturaram a nossa ingerência editorial. A todos o nosso muito obrigado!
11
NOTA DOS EDITORES
Deixamos também um agradecimento especial ao nosso colega José Carlos Santos pela sua preciosa colaboração na edição final deste livro. A colecção de textos que agora apresentamos não se destina exclusivamente a professores e alunos. Gostaríamos de contribuir para alargar os horizontes matemáticos de um público mais vasto, inteligente e culto, que acreditamos existir. Temos, porém, absoluta consciência de que é no seio da população escolar que se encontra a maioria dos potenciais leitores deste livro. Sejam-nos, por isso, permitidas duas palavras especialmente destinadas, uma aos professores de matemática com predisposição mental para serem estudantes toda a vida (acreditamos que são a maioria) e outra aos jovens alunos cuja inteligência e cuja curiosidade merecem ser estimuladas por todas as vias possíveis. Gostaríamos de chamar a atenção dos professores para duas características do conteúdo deste livro: por um lado, alguns dos assuntos abordados serão certamente mais conhecidos do que outros, mas todos são tratados de forma original por matemáticos profissionais; e por outro lado, propositadamente, os temas não têm correspondência directa com os conteúdos programáticos do Ensino Secundário. Acreditamos que a actualização científica dos professores é um processo contínuo e dinâmico de intercâmbio cultural com a comunidade matemática activa, que deve contemplar aspectos que estão para lá das alterações aos programas oficiais. Esperamos que este livro possa ajudar os professores de matemática a procurar novos campos de utilização didáctica da ciência que ensinam e a fomentar hábitos de pesquisa nos seus alunos. O livro permite suficiente margem de manobra para a selecção de temas e a sua adaptação a um certo ano de escolaridade e a uma certa turma. Se nos perguntassem qual o tipo de tratamento que os professores poderiam dar aos temas na sala de aula, a nossa resposta seria: «Quanto mais variado, melhor!». Pode haver aulas em formato mais ou menos tradicional dadas pelos professores sobre alguns dos capítulos, pode haver exposições (individuais ou em seminário) feitas por alunos sobre alguns dos temas, pode haver pesquisas feitas em casa em que o livro seja uma entre várias obras de consulta bibliográfica, e pode ainda haver combinações de alguns destes ou doutros tipos de utilização que o professor julgue adequado num certo momento e para uma certa turma. Não é uma colecção de módulos curriculares prontos-a-usar. E, seria escusado dizê-lo, também não é um livro para ser lido de fio a pavio, nem a ser seguido textualmente nas aulas. Será sobretudo, assim o esperamos, um livro inspirador de novas abordagens…
12
CARLOS CORREIA DE SÁ E JORGE ROCHA
Aos alunos deixamos uma breve história, que nos chega em duas versões datadas do século V d.C., relatando episódios que teriam ocorrido mais de 800 anos antes. As personagens são diferentes, mas o conteúdo e a intenção são idênticos. João Estobeu conta-nos que o jovem príncipe Alexandre da Macedónia terá certa vez perguntado ao geómetra ateniense Menecmo, seu mestre, se não haveria alguma maneira mais rápida de aprender geometria do que aquela que o professor utilizava. Menecmo terá respondido: «Não! Não há nenhuma estrada real para a geometria!» Proclo de Lícia coloca a história alguns anos depois, em Alexandria, com o rei Ptolomeu I do Egipto (que tinha sido general de Alexandre) e com Euclides (que bem poderá ter sido discípulo de Menecmo em Atenas). A pergunta do governante e a resposta do geómetra são as mesmas. Menecmo e Euclides referiam-se certamente à antiga e famosa «estrada real persa», mandada construir por Dario I, ligando Susa e Sardis. Era o correspondente às vias de alta velocidade dos nossos dias… Pode muito bem nunca ter acontecido nenhum destes dois episódios. Mas a transmissão da história durante tantos séculos ilustra bem que, como seria natural esperar, a «revolta» dos jovens contra a morosidade da aprendizagem de algumas matérias é de todos os tempos. E ilustra que também é muito antiga entre a elite erudita dedicada ao ensino a convicção de que, quanto a este aspecto, não são de esperar milagres. Parece bem tratar-se dum exemplo de sabedoria milenar que a moderna pedagogia ainda não conseguiu derrubar, nem sequer abalar: não se aprende matemática sem esforço! Como se aprenderá então matemática? A pergunta pode ser entendida em dois contextos diferentes, e admitirá portanto resposta a dois níveis. Ao nível pessoal, ou psicológico, as histórias de João e de Proclo sugerem a resposta: a aprendizagem não dispensa o trabalho individual e a reflexão solitária, seja a colmatar os pequenos passos deixados em claro nas deduções (nenhum livro é completo…; se o fosse, seria ilegível…), seja na busca de exemplos e contra-exemplos que dêem sentido às situações estudadas, seja na (muito antiga, mas nunca fora de moda) resolução de exercícios. Ao nível institucional, como é óbvio, nunca nada poderá substituir um ensino consistentemente ministrado ao longo da infância e da adolescência por professores competentes e com programas bem estruturados. Mas a cultura não se confina à Escola. Lendo bons textos de matemática não curricular também se pode aprender muito. Com a plena consciência de que nenhum livro (nem nenhum filme, nem nenhum jogo de computador, nem…, por excelente que seja) alguma vez será uma «estrada real» para o que quer que seja, temos o prazer de propor ao leitor estas 13
NOTA DOS EDITORES
Treze Viagens pelo Mundo da Matemática. São treze passeios agradáveis, treze percursos estimulantes, treze trilhos que valerá a pena calcorrear, que nos levam por treze paisagens relevantes da cultura matemática do nosso tempo, cada uma com uma beleza própria. Boas viagens! Bons olhares! Porto, 6 de Outubro de 2009 Carlos Correia de Sá e Jorge Rocha
14
NOTAS BIOGRÁFICAS
ANA CRISTINA MOREIRA DE FREITAS Licenciou-se em Matemática — Ramo Matemática Aplicada pela Faculdade de Ciências da Universidade do Porto e doutorou-se em Matemática, na área de Probabilidades e Estatística, pela Universidade do Porto. Actualmente é Professora Auxiliar no Grupo de Matemática e Informática da Faculdade de Economia da Universidade do Porto.
ANTÓNIO BIVAR Licenciou-se em Matemática pela Faculdade de Ciências da Universidade de Lisboa e doutorou-se na área da Teoria dos Operadores e Equações Diferenciais Parciais pela Universidade de Lisboa. Actualmente é Professor Associado do Departamento de Matemática da Faculdade de Ciências da Universidade de Lisboa.
ANTÓNIO GUEDES DE OLIVEIRA Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área da Matemática na Universidade Técnica de Darmstadt, na Alemanha. Actualmente é Professor Catedrático no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
ANTÓNIO MACHIAVELO Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área de Teoria dos Números pela Universidade de Cornell, nos Estados Unidos da América. Actualmente é Professor Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
ANTÓNIO MARQUES FERNANDES Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade de Lisboa doutorou-se na área da Lógica Matemática pela Universidade de Lis-
15
boa. Actualmente é Professor Auxiliar no Departamento de Matemática do Instituto Superior Técnico.
CARLOS CORREIA DE SÁ Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área de História da Matemática pela Universidade de Birmingham. Actualmente é Professor Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
CHRISTIAN LOMP Licenciou-se em Matemática e doutorou-se na área de Álgebra pela Naturwissenschaftlichen Fakultät da Heinrich-Heine Universität Düsseldorf. Actualmente é Professor Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
JOÃO FILIPE QUEIRÓ Licenciou-se e doutorou-se em Matemática pela Faculdade de Ciências e Tecnologia da Universidade de Coimbra. Actualmente é Professor Catedrático no Departamento de Matemática da mesma Faculdade.
JORGE ROCHA Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área de Sistemas Dinâmicos pelo Instituto de Matemática Pura e Aplicada do Rio de Janeiro. Actualmente é Professor Catedrático no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
JORGE MIGUEL MILHAZES DE FREITAS Licenciou-se em Matemática — Ramo Matemática Aplicada pela Faculdade de Ciências da Universidade do Porto e doutorou-se em Matemática, na área de Sistemas Dinâmicos, pela Universidade do Porto. Actualmente é Professor Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
16
JOSÉ CARLOS SANTOS Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área de Teoria das Representações pela Universidade de Paris VII — Denis Diderot. Actualmente é Professor Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
LUÍS OLIVEIRA Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área da Teoria de Semigrupos (Álgebra) pela Marquette University, Milwaukee, USA. Actualmente é Professor Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
LUCINDA LIMA Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área de Teoria de Semigrupos pela Universidade de York, UK. Actualmente é Professora Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
MARIA LEONOR MOREIRA Licenciou-se em Matemática Pura na Faculdade de Ciências da Universidade do Porto: Fez mestrado em Matemática no Instituto de Ciências Exactas da UFMG e é doutorada em Matemática Pura, na especialidade de Geometria, pela Universidade do Porto. Actualmente é Professora Auxiliar no Departamento de Matemática Pura da Faculdade Ciências da Universidade do Porto.
MARIA PIRES DE CARVALHO Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se em Sistemas Dinâmicos no Instituto de Matemática Pura e Aplicada do Rio de Janeiro. Actualmente é Professora Associada no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
17
SAMUEL ANTÓNIO LOPES Licenciou-se em Matemática Pura pela Faculdade de Ciências da Universidade do Porto e doutorou-se na área de Álgebra e Teoria de Representação pela Universidade de Wisconsin-Madison, nos EUA. Actualmente é Professor Auxiliar no Departamento de Matemática Pura da Faculdade de Ciências da Universidade do Porto.
SANDRA MÓNICA PIRES Licenciou-se em Ensino de Matemática pela Universidade de Aveiro, e concluiu o mestrado em Ensino da Matemática pela Faculdade de Ciências da Universidade do Porto. Actualmente é Professora do quadro na Escola Secundária de Arouca.
18
1 ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS António Machiavelo
… et qu’il s’y livrait [à la Théorie des Nombres] avec une sorte de passion, comme il arrive à presque tous ceux qui s’en occupent. Legendre
1.1 INTRODUÇÃO O objectivo deste capítulo é conduzir o leitor numa breve viagem por alguns dos aspectos basilares da Teoria dos Números. Esta é a área da Matemática por vezes também designada por Aritmética, a que alguns adicionam o adjectivo de Superior para a distinguir do que se aprende no ensino básico, e que tem por objectivo investigar as propriedades mais ou menos subtis dos números naturais1 : 1, 2, 3, 4, 5, 6, 7, . . . ou, um pouco mais geralmente, dos números inteiros2 : 0, ±1, ±2, ±3, ±4, . . . e mesmo de algumas generalizações destes números3 . Os tópicos aqui abordados incluem: • Números figurados e algumas relações que se deduzem de diversos arranjos pictóricos dos números naturais; • As noções e resultados básicos relacionadas com a divisibilidade, incluindo o algoritmo de Euclides e algumas considerações sobre os números primos; • A noção de congruência e as suas propriedades básicas e fundamentais; • O chamado «pequeno» teorema de Fermat e a sua generalização descoberta por Euler; • A cifra RSA, uma aplicação da Teoria dos Números à Criptografia. A Teoria dos Números é uma das áreas de investigação mais antigas da humanidade, sendo a sua história multimilenar4 . Contém um conjunto de técni1 Cujo conjunto é denotado por N. 2 Cujo conjunto é denotado por Z. Denotaremos por N0 o conjunto dos inteiros não-negativos. 3 Nomeadamente, certos subanéis dos números complexos, como o anel dos inteiros Gaussianos e outros anéis de «inteiros» de extensões nitas dos números racionais, e números p -ádicos. Estes assuntos não serão aqui abordados. 4 Ver (Dickson, 1919), (Machiavelo, 2008a), (Morgado, 1992), (Ore, 1948), (Weil, 1984). 19
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
cas e um corpo considerável de resultados, alguns de uma profundidade e dificuldade enormes. Por outro lado, contém também alguns problemas simples de enunciar e compreender, mas que têm frustrado as mentes mais brilhantes da nossa espécie. Alguns desses problemas em aberto, que constituem um dos atractivos da Teoria dos Números, são mencionados ao longo deste capítulo5 .
1.2 A FORMA DOS NÚMEROS Certas relações entre os números inteiros podem ser descobertas representando números por conjuntos de pontos, arranjados de forma conveniente, como era já do conhecimento dos pitagóricos (século V e IV a.C.), isto segundo os relatos de neo-pitagóricos6 como Nicómaco de Gerasa (século I) e Téon de Esmirna (ca. 70 – ca. 135). Por exemplo, a imagem da esquerda na figura 1.1 sugere imediatamente
FIGURA 1.1 Duas maneiras diferentes de ver um quadrado de números.
que a soma dos primeiros n números ímpares é precisamente n 2 , ou seja: 1 + 3 + 5 + · · · + (2n − 1) = n 2 ,
(1.1)
enquanto que a imagem da direita sugere que: 1 + 2 + 3 + · · · + (n − 1) + n + (n − 1) + · · · + 3 + 2 + 1 = n 2 ,
(1.2)
de onde resulta: 2 × (1 + 2 + 3 + · · · + (n − 1)) = n 2 − n,
e, portanto, 1 + 2 + 3 + · · · + (n − 1) =
n(n − 1) . 2
(1.3)
5 Partes deste texto são baseadas em apontamentos escritos pelo autor, em 1993–94, para a disciplina de Tópicos de Matemática Elementar da licenciatura de Matemática da FCUP. A primeira secção é baseada no artigo (Machiavelo, 2007). 6 Que não são fontes completamente dedignas (Machiavelo, 2009). 20
ANTÓNIO MACHIAVELO
Esta última relação pode ainda ser «vista», de um modo imediato, na figura seguinte:
FIGURA 1.2 2 (1 + 2 + · · · + (n − 1)) = (n − 1)n
Estas representações de números por pontos dão também lugar a toda uma variedade de classes interessantes de números, nomeadamente os números poligonais: números triangulares, quadrados, pentagonais, etc. Em geral, o primeiro
FIGURA 1.3 Números pentagonais
número m -gonal é 1, o segundo é m (o número de vértices de um polígono regular com m -lados) e o n -ésimo número poligonal, para n > 2, é o número de pontos da representação formada a partir da anterior do seguinte modo: selecciona-se arbitrariamente um dos vértices e prolongam-se as duas arestas incidentes nesse vértice, acrescentando um ponto nas extremidades opostas a esse vértice. De seguida completa-se a figura de modo a formar um polígono com m lados, em que cada lado tem n pontos, contando com os vértices. A figura 1.3 ilustra a construção do terceiro número pentagonal, 12, a partir do segundo, 5. Exercício 1.1 Determine os primeiros dez números triangulares, os primeiros dez números quadrados, os primeiros dez números pentagonais e os primeiros dez números hexagonais. Consegue deduzir uma fórmula geral para o n -ésimo número m -gonal? 21
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
Exercício 1.2 Mostre que o octúplo de um número triangular aumentado de uma unidade é um número quadrado (mencionado por Plutarco, século I — ver (Morgado, 1992), p. 16). Um dos resultados mais notáveis relativos a números figurados é, sem dúvida, o resultado conhecido pelo nome de Teorema dos Números Poligonais, descoberto por Pierre de Fermat (1601 – 1665) e anunciado numa carta7 a Blaise Pascal (1623 – 1662), datada de 25 de Setembro de 1654: Todo o número (inteiro positivo) pode ser escrito como soma de m , ou menos, números m -gonais. Ou seja, todo o número pode ser escrito como soma de, no máximo, três triangulares, quatro quadrados, cinco pentagonais, etc. Como acontece com muitos dos seus resultados, em especial em Teoria dos Números, não se conhece a demonstração do próprio Fermat. Em 1772 Carl Gustav Jacobi (1804 – 1851) e Joseph Louis Lagrange (1736 – 1813) demonstram, de forma independente, o resultado de Fermat para os números quadrados. Em 1796, e como resultado das suas investigações sobre a representação de números inteiros por formas quadráticas, Carl Friedrich Gauss (1777 – 1855) obtém uma demonstração para os números triangulares, tendo anotado o acontecimento no seu pequeno diário matemático, a 10 de Julho desse ano, de um modo conciso mas expressivo: EΥPHKA
nu m = ∆ + ∆ + ∆
Em 1813 o resultado foi, finalmente, demonstrado em toda a sua generalidade por Augustin Louis Cauchy (1789 – 1857)8 . De modo análogo se definem números poliedrais e outras classes de números usando generalizações da noção de poliedro para dimensões superiores a três. Há dois artigos curiosos, (Lucas, 1886a) e (Lucas, 1886b), sobre números poligonais e poliedrais do matemático francês Édouard Lucas (1842 – 1891), publicados na revista La Nature9 , em 1886. No segundo destes artigos é esboçada 7 Resultado registado também numa nota na margem da sua cópia da Aritmética de Diofanto — ver (Nathanson, 1996), p. 3. 8 Para uma demonstração elementar e curta deste resultado ver (Nathanson, 1987). 9 Esta revista encontra-se digitalizada e disponível online em: http://cnum.cnam.fr
22
ANTÓNIO MACHIAVELO
uma demonstração interessante de um belíssimo resultado, que era já do conhecimento do matemático hindu Ariabata10 (476 – 550), que o menciona sem demonstração numa sua obra, e que é o seguinte: A soma dos cubos de um qualquer número de inteiros positivos consecutivos, a começar em 1, é igual ao quadrado da soma desses mesmos números. Ou seja: 13 + 23 + 33 + · · · + n 3 = (1 + 2 + 3 + · · · + n)2 , para todo n ∈ N.
(1.4)
Este resultado é mencionado no tratado de álgebra Al-Fakhri fi’l-jabr wa’l-muqabala (algo como o «Livro Glorioso de Álgebra»), do matemático muçulmano Abu Beqr ibn Muhammad ibn al-Hasan Al-Karaji11 (ca. 953 – ca. 1029), com a demonstração que Lucas esboça, e que advém da seguinte observação. Considere-se a tabela de multiplicação dos números de 1 a n .
1
2
3
4
5
6
2
4
6
8
10
12
3
6
9
12
15
18
4
8
12
16
20
24
5
10
15
20
25
30
6
12
18
24
30
36
TABELA 1.1 Tabela de multiplicação 6 × 6
Cada um dos seus gnómons (um gnómon é uma figura com a forma ù), marcados na figura por tonalidades alternadamente distintas, é igual a: n × (1 + 2 + 3 + · · · + (n − 1) + n + (n − 1) + · · · + 3 + 2 + 1) = n × n 2 = n 3 ,
por um resultado acima mencionado (ver (1.2)). A soma de todos os números da tabela de multiplicação n × n é assim igual à soma dos primeiros n cubos. Mas é também igual a (1 + 2 + 3 + · · · + n)2 , o que se torna claro visualizando a tabela de multiplicação com pontos, da seguinte forma: 10 Não temos a certeza se esta é a forma como deve o seu nome ser transliterado para português. Em inglês é Aryabhata. 11 Usamos aqui a transliteração para inglês, por desconhecimento de como deverá ser feita para português. 23
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
.
..
...
....
.....
......
..
.. ..
... ...
.... ....
..... .....
...... ......
.. .
.. .. ..
... ... ...
.... .... ....
..... ..... .....
...... ...... ......
.. ..
.. .. .. ..
... ... ... ...
.... .... .... ....
..... ..... ..... .....
...... ...... ...... ......
.. .. .
.. .. .. .. ..
... ... ... ... ...
.... .... .... .... ....
..... ..... ..... ..... .....
...... ...... ...... ...... ......
.. .. ..
.. .. .. .. .. ..
... ... ... ... ... ...
.... .... .... .... .... ....
..... ..... ..... ..... ..... .....
...... ...... ...... ...... ...... ......
É curioso que tudo isto esteja contido na tabela de multiplicação! De facto, há algumas outras relações interessantes contidas na «tabuada» e muitas outras relações que podem ser «vistas» usando representações pictoriais como as que acima se referiram. Para mais exemplos, o leitor interessado poderá consultar o livro (Conway e Guy, 1996) e as páginas da internet (PI1)12 e (PI3). A Teoria dos Números poderá ter começado com observações como as que acima foram referidas, e outras análogas, mas o estudo dos números poligonais e congéneres não produziu nenhum corpo coerente de resultados, nem um conjunto de técnicas que se tornassem frutíferas na descoberta de outros segredos dos números. Por isso, os livros actuais de Teoria dos Números que mencionam os números poligonais fazem-no apenas de passagem. Já o estudo da resolução em números racionais e inteiros de certos tipos de equações, como a chamada equação pitagórica x 2 + y 2 = z 2 , revelou-se de uma imensa fecundidade13 e desempenhou, desempenha ainda, um papel central na evolução da Teoria dos Números. O estudo das equações diofantinas14 , como hoje se diz quando está em 12 Referências da forma (PIx) referem-se às páginas da internet cujos nomes e endereços são dados no m do capítulo, após as referências bibliográcas. 13 Ver (Dickson, 1920), capítulo 8 de (Ore, 1948), (Mordell, 1969), (Lang, 1962) e (Schappacher, 2005). 14 Em homenagem a Diofanto de Alexandria (ca. 250 d.C.), que escreveu um tratado com o nome de Aritmética, a primeira obra dedicada ao estudo da resolução de equações em números racionais que é conhecida, infelizmente de um modo incompleto. Originalmente constituída por treze «livros», a que hoje mais naturalmente chamaríamos capítulos, só dez são conhecidos. Manuscritos contendo cópias, em grego, de seis desses capítulos foram descobertos em nais do século XV, tendo sido então publicadas traduções para o latim (ver (Heath, 1910)). Uma tradução árabe de outros quatro capítulos, que se pensam ser os «livros» 4, 5, 6 e 7, quase de certeza incluindo comentários posteriores, foi descoberta no início da década de 1970 numa biblioteca no Irão: ver (Rashed, 1874), (Rashed, 1975), (Sesiano, 1982) e tam24
ANTÓNIO MACHIAVELO
causa a resolubilidade de equações em números inteiros15 , é uma área activa de investigação desde os trabalhos seminais de Pierre de Fermat (1601 – 1665) e Leonhard Euler (1707 – 1783) até aos dias de hoje. Outro assunto que conduziu a descobertas importantes, e que também se revelou de uma enorme fecundidade, foi o estudo de relações de divisibilidade entre números inteiros. O resto deste capítulo é dedicado a uma introdução à parte mais elementar do corpo de resultados e técnicas a que tal estudo conduziu.
1.3 NOÇÕES BÁSICAS E O ALGORITMO DE EUCLIDES Duas das noções centrais da Teoria dos Números são a de múltiplo e a de divisor, ou factor, noções estas intimamente relacionadas entre si, correspondendo a modos diferentes de olhar a mesma coisa. Por ser conveniente em muitas situações, estas noções são aqui introduzidas no contexto dos números inteiros. Definição 1.1 Dados d , m ∈ Z, diz-se que m é um múltiplo de d , ou que d é um divisor ou um factor de m , ou ainda que d divide m , quando se tem m = d k para algum k ∈ Z. Isto é simbolicamente expresso do seguinte modo: d |m
que se lê: «d divide m », sendo a sua negação representada por: d -m
que se lê: «d não divide m ». Exemplos: • d | 0 para todo d ∈ Z, 0 | 0 e 0 - m sempre que m ̸= 0. • 1 | m , −1 | m e m | m , para todo m ∈ Z. • d | m =⇒ d | −m , −d | m e −d | −m . bém (Sesiano, 1977), (Bulmer-Thomas, 1985), (Knorr, 1985) e (Saliba, 1988). Em 1621, Claude Gaspard Bachet (1581 – 1638), senhor de Méziriac, publicou a primeira tradução para o latim contendo o texto original grego dos seis «livros» da Aritmética então conhecidos. Foi na sua cópia desta publicação que Fermat fez as suas observações enigmáticas. 15 Apesar de ter sido Fermat quem colocou a ênfase nos números inteiros, enquanto que Diofanto considerou apenas a resolubilidade de diversos tipos de equações em números racionais. Mas a inuência de Diofanto em Fermat é enorme (ver (Weil, 1984), capítulo 1, §X).
25
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
Exercício 1.3 Mostre que: • a | b ∧ b | c =⇒ a | c . • 8 | (n 2 − 1) sempre que n é um número ímpar, ou seja, tal que 2 - n . Um resultado que é repetidamente usado, e portanto fundamental, é o seguinte: Proposição 1.1 Dados a ,b, m ∈ Z, tem-se: m | a ∧ m | b =⇒ m | a x + b y ,
para todos os x , y ∈ Z.
Demonstração: Resulta imediatamente do facto de a = m k e b = m ℓ implicarem a x + b y = m k x + m ℓy = m (k x + ℓy ), o que mostra que se a e b são múltiplos de m , então a x + b y também o é, quaisquer que sejam x , y ∈ Z. 16 Dado um qualquer inteiro positivo17 m e um inteiro arbitrário a , há um múltiplo de m que é o maior dos múltiplos de m que não excede a . Seja q m tal múltiplo. a
qm
(q +1)m
(A que é igual m nesta figura?)
Tem-se então que q m ≤ a < (q +1)m e r = a −q m satisfaz 0 ≤ r < m . Daqui resulta o chamado Teorema da Divisão: Teorema 1.1 Dados a ∈ Z e m ∈ N, existem inteiros q e r tais que: a = qm + r
e 0 ≤ r < m.
Os inteiros q e r nessas condições são únicos. Demonstração: A existência e a unicidade podem ser facilmente deduzidas do que se escreveu antes do enunciado. Observe-se que q é a parte inteira do número racional a /m . 16 Este símbolo será usado para indicar o m de uma demonstração ou de uma vericação. 17 Tudo o que se segue seria muito fácil de adaptar a inteiros negativos, mas nada de essencial se ganha com esta aparente generalização.
26
ANTÓNIO MACHIAVELO
O Teorema da Divisão pode também ser demonstrado sem sair do «universo» dos números inteiros, o que é preferível do ponto de vista lógico, argumentando que o conjunto {a − k m : k ∈ Z} ∩ N0
não é vazio e, portanto, tem um mínimo e daí deduzir a existência de q e r . Quanto à unicidade, ela resulta do facto de a = q1 m + r1 = q2 m + r2 implicar m | r1 −r2 e de só haver um múltiplo de m no intervalo ]−m , m [, nomeadamente 0. Os detalhes são deixados como exercício para o leitor. Definição 1.2 Os inteiros cuja existência e unicidade são garantidas pelo resultado anterior designam-se, respectivamente, por o quociente e o resto da divisão de a por m . Exercício 1.4 Qual é o quociente e o resto da divisão de −7 por 3? (Cuidado! O quociente não é −2…) Uma noção cuja preponderância na Teoria dos Números é surpreendente, dada a sua simplicidade, é a noção de máximo divisor comum, que desempenha um papel crucial em toda a teoria e nas suas extensões a outros tipos de «números inteiros». Definição 1.3 O máximo divisor comum de dois números inteiros que não sejam ambos nulos é, como o nome o indica, o maior dos inteiros que os divide simultaneamente. A exigência de não serem ambos nulos serve para garantir a existência de máximo divisor comum. É comum18 usar-se a notação (a ,b ) para o máximo divisor comum de a e b . A noção «dual», a de mínimo múltiplo comum de dois números inteiros, tem uma importância muito menor (a história assim o mostrou!). O mínimo múltiplo comum de dois números a ,b ∈ Z é, como o nome o indica, o menor número positivo que é múltiplo de ambos, sendo usualmente denotado por [a ,b ]. Exercício 1.5 Dado a ∈ Z com a ̸= 0, diga qual o valor de: (0, a ), (1, a ) e (a , a ). (Cuidado! O último pode não ser igual a a . Porquê?) 18 Quando há risco de confusão com vectores, o que é muito raro acontecer, usa-se mdc(a ,b ). 27
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
O cálculo eficiente do máximo divisor comum de dois números é feito usando um algoritmo contido já nos Elementos de Euclides, uma das obras mais importantes e influentes de todos os tempos, escrita por volta de 250 a.C. (ver (PI4) e (PI5)). Antes de o descrever, e porque será útil na demonstração de que esse algoritmo de facto dá o que se afirma, tem-se: Lema 1.1 Se a ,b, c ∈ Z são tais que a = b k + c para algum k ∈ Z, então: (a ,b ) = (b, c ).
Demonstração: Da relação a = b k + c conclui-se, usando a proposição 1.1, que qualquer número que divida b e c também divide a , assim como todo o número que divida a e b também divide c = a −b k . Ou seja, os divisores comuns de a e b coincidem com os divisores comuns de b e c . Em particular, estes dois pares de números têm o mesmo maior divisor comum. O resultado seguinte está contido nas proposições 1 e 2 do livro VII dos Elementos: Teorema 1.2 (Algoritmo de Euclides) Sejam a e b dois inteiros positivos. Aplicando sucessivamente o teorema da divisão, obtêm-se r1 , r2 , r3 , . . . satisfazendo: a
=
b q1 + r1
, 0 < r1 < b
b
=
r1 q2 + r2
, 0 < r2 < r1
r1
=
r2 q3 + r3
, 0 < r3 < r2
.. . rk −2
=
(1.5) rk −1 qk + rk
, 0 < rk < rk −1
.. . enquanto rk ̸= 0. Então, algum dos rn dividirá o anterior sem deixar resto, ou seja rn +1 = 0, e tem-se que rn = (a ,b ).
Demonstração: Em primeiro lugar, observe-se que a sequência r1 , r2 , r3 , . . . tem de ser finita, pois b > r1 > r2 > r3 > · · · ≥ 0. Seja então n o índice do último elemento da sequência (rk )k que não é nulo. Tem-se, pois, rn −1 = rn qn +1 . Agora, o lema anterior mostra que as igualdades (1.5) implicam que se tem: (a ,b ) = (b, r1 ) = (r1 , r2 ) = · · · = (rn−1 , rn ) = rn ,
por se ter rn | rn−1 . Fica assim demonstrado o que se pretendia. 28
ANTÓNIO MACHIAVELO
Uma consequência (ou corolário, como é usual dizer-se em matemática) imediata é a seguinte: Corolário 1.1 Todos os divisores comuns de a e b dividem (a ,b ). Ou seja, c | a , c | b ⇒ c | (a ,b ).
Demonstração: Das igualdades (1.5), aplicando repetidamente a proposição 1.1, resulta que c | a , c | b =⇒ c | r1 =⇒ c | r2 . . . até que se obtém c | rn = (a ,b ), usando a notação da demonstração anterior. Ou seja, os divisores comuns de dois números são exactamente os divisores do seu máximo divisor comum. Tem-se também o resultado seguinte, que é extremamente útil, tendo inúmeras aplicações, como se verá. Corolário 1.2 O máximo divisor comum de dois números é a soma de um múltiplo de um dos números com um múltiplo do outro. Isto é, (a ,b ) = a x + b y , para alguns inteiros x , y . Existe uma infinidade de pares de tais inteiros, um dos quais pode ser calculado a partir dos ri ’s e dos qi ’s. Demonstração: Usando as notações da descrição do algoritmo de Euclides, e sendo n o índice do último resto não-nulo, ou seja rn = (a ,b ), tem-se: (
rn
=
rn −2 − rn−1 qn
rn −1
=
rn −3 − rn−2 qn−1 .
Eliminando rn −1 da 1.ª, usando a 2.ª, obtém-se: rn = ? rn −3 + ? rn −2 ,
onde os símbolos ? designam inteiros que não é necessário aqui precisar. Em seguida, de
rn rn −2
= =
? rn −3 + ? rn −2 rn −4 − rn−3 qn−2
obtém-se: rn = ? rn −4 + ? rn −3 .
29
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
Prosseguindo deste modo, obtém-se: rn = ? a + ? b.
Ou seja, usando as equações (1.5), da última com resto não-nulo para a primeira, escreve-se assim rn = (a ,b ) sucessivamente à custa dos r ’s anteriores até se obter rn escrito em termos de a e b (ver o exemplo a seguir). Finalmente, se x e y é um par de inteiros nas condições referidas, então também o são x − b t e y + a t , para todo o inteiro t (porquê?). Exemplo: a = 105,b = 22 (Qual a diferença se tomar a = 22,b = 105 ?) 105
=
22 × 4 + 17
22
=
17 × 1 + 5
17
=
5×3+2
5
=
2×2+1
2
=
2×1
1 = 5 − 2 × 2 = 5 − (17 − 3 × 5) × 2 = = 7 × 5 − 2 × 17 = 7 × (22 − 17) − 2 × 17 = = 7 × 22 − 9 × 17 = 7 × 22 − 9 × (105 − 4 × 22) = = 43 × 22 − 9 × 105
Resulta que x = −9, y = 43 é uma solução de 1 = 105x + 22y . Definição 1.4 Dois números a ,b ∈ Z dizem-se primos entre si se (a ,b ) = 1. Ou seja, dois números são primos entre si se não tiverem factores comuns para além de ±1, números estes que dividem todos os números. Tem-se: Proposição 1.2 Se (a ,b ) = 1 e a | b c , então a | c . Demonstração: De (a ,b ) = 1 resulta a existência de dois inteiros x , y tais que 1 = a x +b y . Mas então c = a c x +b c y , e como a | b c , tem-se a | a c x +b c y , de onde se conclui que a | c . Na proposição 2 do livro X dos Elementos, Euclides dá uma versão geométrica do processo acima descrito para determinar o máximo divisor comum. Nesta versão, o algoritmo resolve o problema de encontrar uma «medida comum» a dois segmentos que sejam «comensuráveis», ou seja, que admitam tal medida comum. Tal processo consiste no seguinte: sejam A
30
B
ANTÓNIO MACHIAVELO
dois segmentos comensuráveis. Meça-se A usando B; se B não medir A exactamente, seja C o segmento que resta, que é menor que B: A B
B
B
C
Use-se agora C para medir B, e seja D o segmento que resta… etc. Quando obtivermos um segmento que divida exactamente o anterior, esse segmento é a medida comum pretendida. Talvez esta ideia geométrica tenha inspirado o algoritmo aritmético, ou talvez tenha sido ao contrário. Isto é, provavelmente, algo que nunca se saberá, assim como se foi ou não Euclides que descobriu estes processos ou se estes eram já bem conhecidos na altura em que Euclides escreveu a sua obra.
1.4 OS NÚMEROS PRIMOS E UM RESULTADO FUNDAMENTAL A relação de divisibilidade dá origem à separação dos números em certas classes, como pares e ímpares, ou seja, os números divisíveis por 2 e os que não o são. Uma característica que se revelou muito subtil e geradora de interessantes problemas que conduziram a descobertas importantes é a de número primo: Definição 1.5 Um número natural que seja igual ao produto de dois números menores diz-se composto. Um número maior do que um que não seja composto diz-se primo. Ou seja, um número é primo se representa uma quantidade de coisas que não é possível repartir igualmente pelos indivíduos de um qualquer grupo com mais de um elemento. O número 1 não é considerado nem primo nem composto. Uma das razões que levam a esta exclusão é o facto de 1 dividir todos os números e, portanto, a divisibilidade por 1 não contém nenhuma informação. Parte da importância dos números primos advém do facto de serem uma espécie de «átomos», multiplicativamente indivisíveis, a partir dos quais todos os números são multiplicativamente construídos, como veremos. Um considerável esforço tem sido despendido por diversos matemáticos, desde tempos imemoriais, no estudo desses números. A proposição 20 do livro IX dos Elementos de Euclides é um enorme monumento ao engenho e à inteligência humana, contendo uma demonstração muito elegante e astuta de que há uma infinidade de números primos. Antes de prosseguir, convidamos o leitor
31
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
2 31 73 127 179 233 283 353 419 467
3 37 79 131 181 239 293 359 421 479
5 41 83 137 191 241 307 367 431 487
7 43 89 139 193 251 311 373 433 491
11 47 97 149 197 257 313 379 439 499
13 53 101 151 199 263 317 383 443 503
17 59 103 157 211 269 331 389 449 509
19 61 107 163 223 271 337 397 457 521
23 67 109 167 227 277 347 401 461 523
29 71 113 173 229 281 349 409 463 541
TABELA 1.2 Os primeiros 100 primos
a reflectir um pouco sobre como tal poderá ser feito. Repare-se que está fora de questão verificar a finitude ou infinitude dos números primos por uma via computacional. De facto, no caso de estes serem finitos, como saberíamos se tinhamos encontrado ou não o último? E como se há-de mostrar que há sempre outro? Um dos ingredientes da demonstração é a observação que todo o número tem algum divisor primo, algo que Euclides faz na proposição 31 do livro VII de um modo ligeiramente diferente, mas perfeitamente equivalente, ao que é a seguir feito. Proposição 1.3 O menor divisor maior do que 1 de qualquer número natural superior a 1 é necessariamente um número primo. Ou seja, dado n ∈ N com n > 1 e se d = min{k ∈ N : k > 1 ∧ k | n}, então d é primo. Demonstração: Sejam n e d como no enunciado. Se d fosse composto, então teria um divisor, d ′ tal que 1 < d ′ < d . Mas então d ′ | n (pela primeira parte do exercício 1.3), o que contradiria a escolha de d . Um outro ingrediente é a observação seguinte, cuja justificação é deixada como exercício ao leitor. Exercício 1.6 Mostre que, dados n , d ∈ N, se d > 1 e d | n , então d - n + 1. Estamos agora em condições de demonstrar que os números primos são mais do que uma qualquer multitude deles (isto é, um conjunto finito), como Euclides diria, por boas razões filosóficas, ou simplesmente:
32
ANTÓNIO MACHIAVELO
Teorema 1.3 Existe uma infinidade de números primos. Demonstração: Dada qualquer família finita p 1 , p 2 , . . . , p t de números primos, o número p 1 × p 2 × · · · × p t + 1,
não sendo divisível por nenhum dos primos dessa família, tem necessariamente um factor primo diferente de p 1 , p 2 , . . . , p t . Fica assim mostrado que existe um primo que não pertence à família dada. Alternativamente: O número n! + 1 tem um factor primo que é necessariamente maior que n . Exercício 1.7 Designando por p 1 , p 2 , p 3 , . . . os números primos pela sua ordem natural (isto é, 2, 3, 5, 7, 11, . . .), determine o primeiro natural t tal que o número p 1 × p 2 × · · · × p t + 1 não seja primo. Mas como determinar se um número é ou não primo? Em princípio é necessário, de uma forma ou de outra, verificar que não tem nenhum divisor próprio. Há maneiras muito eficientes de, indirectamente, fazer essa verificação19 ; limitamo-nos aqui a fazer a seguinte observação muito simples: Proposição 1.4 Todo o número composto admite um divisor primo menor ou igual à sua p raiz quadrada. Ou seja, dado n ∈ N composto, existe p primo com p ≤ n tal que p | n . Demonstração: Seja p o menor divisor maior que um de n . Então n = p m para algum m ∈ N que, como é também um divisor de n , tem de satisfazer p ≤ m . Mas p então p 2 ≤ p m = n , de onde resulta p ≤ n . Daqui resulta imediatamente: Se um número não for divisível por nenhum primo menor ou igual à sua raiz quadrada, então ele é primo. 19 Em Agosto de 2002, três matemáticos indianos, M. Agrawal, N. Kayal e N. Saxena, anunciaram a descoberta de um algoritmo de primalidade dito «polinomial», o que signica que o tempo que demora a averiguar se um número é ou não primo é limitado por um polinómio no número de bits do número (Bornemann, 2003). O seu trabalho está publicado em Annals of Mathematics 160 (2004), 2, pp. 781–793.
33
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
A propriedade fundamental dos números primos é a sua «atomicidade», como acima referimos. Daqui decorre, como agora veremos, que cada «combinação» distinta de primos forma números distintos, ou seja, dito de um modo mais preciso, que cada número se pode escrever de um modo único como produto de números primos, a menos de permuta dos factores. Para se perceber que este resultado não é tão trivial como possa parecer depois de ver a sua demonstração, desafiamos o leitor a tentar resolver o seguinte exercício, antes de prosseguir. Exercício 1.8 Mostre que não existem quatro primos distintos p,q, r, s tais que pq = r s . Para números pequenos isto pode ser verificado directamente, por exaustão, mas por que será verdade para todos os números? Como ter a certeza de que não existem quatro números primos, cada um com centenas de milhares de algarismos, por exemplo, tais que o produto de dois deles seja igual ao produto dos outros dois? O leitor que tentou seriamente resolver o exercício anterior poderá agora melhor apreciar a importância do resultado seguinte, a proposição 30 do livro VII dos Elementos. Proposição 1.5 Se p é um número primo e a ,b ∈ Z, então: p | a b =⇒ p | a
ou
p | b.
Demonstração: Para mostrar a afirmação feita, basta mostrar que se p | a b e se p - a , então p | b (porquê?). Sejam então p, a ,b nestas condições. Como p - a e como p não tem divisores próprios, então (p, a ) = 1. Da proposição 1.2 conclui-se que p | b , como se pretendia mostrar. Munidos deste resultado sobre os números primos, um resultado fundamental na generalização da noção de primo a outros conjuntos de números, podemos agora mostrar aquilo a que se chama o Teorema Fundamental da Aritmética, que merece este nome por ter inúmeras consequências e estar no centro de muitos outros resultados sobre a aritmética dos números inteiros. Teorema 1.4 (Teorema Fundamental da Aritmética) Todo o número inteiro m ̸= 0 se decompõe como um produto m = ±p 1e 1 p 2e 2 · · · p te t , 34
ANTÓNIO MACHIAVELO
onde p 1 , p 2 , . . . , p t são números primos distintos e e 1 , e 2 , . . . , e t ∈ N, sendo esta decomposição única, a menos da ordem dos factores. Demonstração: É necessário, antes de mais, fazer a observação de que é usual em muitos contextos convencionar que um produto de uma colecção vazia de factores é, por definição, igual a 1. Isto serve apenas para evitar algumas excepções em algumas fórmulas e nalguns resultados, tornando os seus enunciados mais elegantes. Assim, com esta convenção, o resultado acima inclui os casos m = ±1. É claro que basta mostrar o resultado para números positivos e é também claro que o resultado é válido para m = 1. Mostremos, em primeiro lugar, a existência da decomposição. Suponha-se que o resultado é falso e seja n o primeiro (presumível) número natural para o qual o resultado não se verificaria, ou seja, n não seria decomponível como um produto de números primos. Em particular, n não poderia ser primo. Então, ter-se-ia n = a b com a < n e b < n . Mas assim, tanto a como b , seriam produtos de números primos e, portanto, também o seria n . Isto mostra que tal n simplemente não pode existir. Fica assim mostrado que todo o número natural é o produto de números primos. Mostre-se, finalmente, que tal produto é único, a menos da ordem dos factores. Para tal, suponha-se novamente que este resultado é falso. Então, existiria o menor número natural que teria mais do que uma decomposição como produto de primos. Designe-se tal número por n e seja p um dos seus divisores primos. Como np < n , o número np tem uma decomposição única e, portanto, qualquer decomposição de n que contenha p é também única. Falta apenas mostrar que uma decomposição de n tem necessariamente de conter o primo p . Seja então n = q1q2 · · ·qs uma decomposição de n em primos (onde os q1 ,q2 , . . . são primos não necessariamente distintos). De p | q1 q2 · · ·qs resulta, usando uma generalização óbvia do resultado da proposição 1.5 (cujos detalhes o leitor cuidadoso deverá completar), que p | q j para algum j . Mas a única maneira de um primo dividir outro é se forem iguais (sendo ambos positivos, como aqui). Isto mostra que qualquer decomposição de n contém o primo p . Fica, assim, completa a demonstração do teorema fundamental. A decomposição cuja existência e unicidade (a menos de permutas de factores) é assegurada pelo teorema fundamental diz-se «a factorização de m em números primos». Um problema muito importante em Teoria dos Números que, como veremos na secção 1.8, tem implicações muito sérias na segurança de mui35
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
tas comunicações onde é necessário garantir a confidencialidade das mensagens (por exemplo, pagamentos e transacções electrónicas), é o de saber se existem ou não algoritmos «rápidos» de factorização, ou seja, algoritmos que determinem de um modo «eficiente» a decomposição de um número em factores primos. Enquanto que se conhecem algoritmos determinísticos polinomiais de primalidade20 , e excelentes algoritmos probabilísticos, os melhores algoritmos de factorização hoje conhecidos são probabilísticos com tempo esperado da ordem de 1/3 2/3 e c (log n) (log log n) , onde c é uma constante — ver (Crandall e Pomerance, 2001).
1.5 O MISTÉRIO MAIS ANTIGO Nas definições do livro VII dos Elementos, Euclides (ca. 250 a.C.) introduz a noção ´ de divisor de um número de uma forma geométrica, como uma «parte» (µερoς ) 21 que «mede» (καταµετρ η˜ ) o número . Por exemplo, a figura seguinte ilustra que «2 mede 6»: | {z }| {z }| {z }
Apesar de não ser absolutamente claro das definições, infere-se do uso que de´ ) de «número» (αριϑµoς ` , que las faz que, embora distinguindo «unidade» (µoν ας define como uma «multitude de unidades»), é claro que Euclides considera a unidade como «parte» de um qualquer número22 . Porém, já não considera o próprio número como uma das suas «partes». Na última definição do livro VII, Euclides introduz a noção de número per´ ` ´ ) como um número que é igual à soma das suas partes, ou feito (τελιoς αριϑµ oς seja, um número que é igual à soma dos seus divisores, excluindo o próprio número. Na linguagem usada por Euclides a designação de «número perfeito» é, pelo menos linguisticamente, natural. Exemplos: Os números 6 e 28 são perfeitos, pois: 6
=
1+2+3
20 Ver nota-de-rodapé anterior. O algoritmo AKS tem um tempo de execução que é majorado por k (log n)7 , onde k é uma constante que depende do sistema operativo e log n denota o logaritmo natural. Observe-se que log n é proporcional ao número de algarismos (ou de bits) de n . 21 Ver (PI4) e (PI5). 22 Diz-se muitas vezes que Euclides não considera 1, a unidade, como um número. A denição 3 do livro VII e o facto inequívoco de considerar 1 como uma «parte» de um qualquer número faz-me duvidar fortemente dessa armação. Parece-me mais uma distinção com carácter linguístico do que propriamente de conteúdo. 36
ANTÓNIO MACHIAVELO
28
=
1 + 2 + 4 + 7 + 14,
mas 10 e 12 já não são, uma vez que: 10
>
1+2+5
12
1 e b > 1, então 2m − 1 = (2a )b − 1 = (2a − 1) 1 + 2a + (2a )2 + · · · + (2a )b −1 , | {z } | {z } ≥3
≥5
pelo lema 1.2.
Por conseguinte, 2m −1 só pode ser primo quando m o for. No entanto, tem-se que 211 − 1 = 23 × 89, o que mostra que, na proposição anterior, a implicação recíproca é falsa. Os primos da forma 2m −1 são denominados primos de Mersenne, em homenagem a Marin Mersenne (1588 – 1648), que se interessou pelo seu estudo. Não se conhece nenhuma descrição simples dos primos de Mersenne, se é que tal descrição existe. Cerca de dois mil anos após Euclides, o matemático suiço Leonhard Euler (1707 – 1783) obteve o seguinte resultado, um recíproco parcial do teorema 1.5: Teorema 1.6 (Euler, em Tractactus25 ) O resultado de Euclides fornece todos os números perfeitos pares. Isto é, se n é um número par que é perfeito, então n é da forma 2m −1 (2m − 1), para algum m tal que 2m − 1 é um número primo. Demonstração: Seja n um número perfeito par. O número n pode então ser escrito na forma n = 2t −1 a , com a ímpar e t ≥ 2. Tem-se, por hipótese: 2t a = 2n = σ(n),
e como 2t −1 e a não têm factores comuns, σ(n) = σ 2t −1 σ(a ). 25 Euler iniciou a escrita de um livro intitulado Tractatus de numerorum doctrina capita sedecim, quae supersunt, que nunca chegou a terminar, e que foi publicado postumamente, em 1849. Uma digitalização da publicação original está disponível em (PI6). 40
ANTÓNIO MACHIAVELO
Designando por x a soma dos divisores de a que são distintos de a , vem então que: 2t a = σ 2t −1 σ(a ) = 2t − 1 (a + x ) = 2t a − a + 2t − 1 x ,
de onde resulta a = (2t − 1) x , o que mostra que x | a e x ̸= a (pois 2t − 1 > 1). Mas, então ∑ d = x + termos não negativos. x= d |a ;d ̸=a
Daqui se conclui que esta soma não pode ter mais termos para além de x , e como 1 é um divisor de a , tem de ser o único que é distinto de a . Portanto, x = 1 e a = 2t − 1 é primo, de onde se conclui o pretendido. Este resultado levanta, naturalmente, a seguinte questão: Quais são os perfeitos ímpares? Esta é uma pergunta feita há mais de dois mil e quinhentos anos e à qual ainda hoje não se sabe responder! Ou seja, não se conhece nenhum exemplo de um número perfeito ímpar, nem nunca ninguém conseguiu provar que tal exemplo não existe. É o problema matemático mais antigo que ainda continua em aberto! Há, no entanto, algumas propriedades que se mostrou que um tal número, se existir, terá necessariamente de satisfazer. Por exemplo, se n for um perfeito ímpar, então26 : • n tem a forma p a m 2 , para algum p primo, sendo p e a da forma 4x + 1 (isto é dão resto 1 quando divididos por 4) (Euler, em Tractatus27 ); • n tem pelo menos 9 factores primos distintos (Nielsen, 2007); • n > 10300 , isto é, n tem pelo menos 300 algarismos (Brent et al., 1991). Do que acima se viu, surge também a questão: Para que primos p é 2p − 1 primo? O estudo deste problema conduziu Pierre de Fermat a uma importante descoberta que descreveremos mais abaixo. Antes, porém, vamos fazer um pequeno desvio por alguns resultados que nos serão úteis nessa tarefa. 26 Ver (PI9) para mais informações sobre os esforços da procura de números perfeitos ímpares. 27 Ver nota-de-rodapé 25. 41
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
1.6 O TRIÂNGULO DE PASCAL E A EXPANSÃO BINOMIAL Matemáticos hindus, árabes e chineses do século XI usavam já o triângulo que muitos séculos depois se viria a chamar Triângulo de Pascal28 , para gerar os coeficientes binomiais, ou seja, os coeficientes dos termos que se obtêm quando se expande o binómio (a + b )n para sucessivos valores de n ∈ N, sendo a e b variáveis29 . A representação esquemática que a seguir se apresenta mostra como tais coeficientes se podem obter de uma forma organizada: (a + b )0 =
1 a ↙
(a + b )1 =
+
a a ↙
(a + b )2 =
+ b ↘
+
a3
.. .
b
b ↘
a2 a ↙
(a + b )3 =
b ↘ a ↙
b ↘
+
2a b a ↙
b2
b ↘
+
3a 2 b
.. .
a ↙
3a b 2
.. .
b ↘
+
b3
.. .
Escrevendo apenas os coeficientes, obtemos um triângulo de números, o Triângulo de Pascal30 : 1 1 1 1 1 1
3 4
5
.. .
1 2
1 3
6 10
10
.. .
1 4
1 5
1
.. .
onde, como facilmente se deduz do esquema anterior, cada elemento é a soma dos dois que ficam imediatamente por cima. 28 Em honra ao matemático e lósofo francês Blaise Pascal (1623 – 1662). 29 Ver (Biggs, 1979), (Yadegari, 1980) e (Lay-Yong, 1980). 30 Em 1654, Pascal escreveu uma obra, que intitulou Tratado do Triângulo Aritmético, onde expõe de uma forma particularmente clara várias propriedades e aplicações dos elementos deste triângulo numérico, na sua maioria já conhecidas. A grande contribuição de Pascal, neste tratado, é o uso ecaz que faz dos coecientes binomiais para resolver uma questão sobre jogos de apostas, conhecida pelo nome de «o problema dos pontos» ou «o problema da divisão» — ver (A. Edwards, 1987) e (Ore, 1960). 42
ANTÓNIO MACHIAVELO
O Triângulo de Pascal fornece assim um método rápido de cálculo dos coeficientes de (a + b )n . Tem, no entanto, a desvantagem de ser necessário calcular todos os coeficientes de (a + b )k para todo o k ≤ n . Há, porém, uma maneira de calcular directamente um dado coeficiente binomial, que passamos a descrever. Comecemos por observar que o coeficiente de a n −i b i em (a + b )n é igual ao número de maneiras diferentes de ir buscar i b ’s de entre os n factores de (a +b )n , uma vez que, quando este produto é expandido, obtemos todas as parcelas da forma e 1 · e 2 · · · e n onde e i ∈ {a ,b }. Mas:
número de maneiras diferentes de ir buscar i b ’s aos n factores
número de maneiras diferentes de escolher i = = sítios (para os b ’s), de entre n
número de maneiras diferentes de escolher i objectos de entre n objectos distintos
Notação: ni = número de maneiras diferentes de escolher i objectos de entre n objectos distintos, e que se lê: «combinações de n , i a i ». Este número pode ser calculado usando o seguinte processo, composto de duas etapas31 : em primeiro lugar, imaginemos que temos i caixinhas onde iremos colocar i objectos escolhidos de entre os n existentes, um em cada caixinha. Na primeira caixinha podemos colocar um qualquer dos n objectos. Para cada uma dessas n possíveis escolhas, ficamos com n − 1 objectos para colocar na segunda caixinha. Temos assim n ×(n −1) maneiras de preencher as duas primeiras caixinhas. Para cada uma dessas escolhas, ficamos com n −2 objectos para colocar na terceira caixinha, etc. i
z
}|
{
··· ↑
↑
···
↑
n
n −1
···
n − (i − 1)
31 O processo que a seguir se descreve é análogo ao método que uma formiga míope poderia utilizar para contar girafas: começar por contar as pernas e depois dividir por quatro, o número de pernas de cada girafa, supondo que nenhuma é deciente. 43
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
Temos, pois, n × (n − 1) × · · · × (n − (i − 1)) maneiras de colocar i dos n objectos nas caixinhas32 . Em segundo lugar, suponhamos que colocávamos agora os i objectos seleccionados todos juntos numa caixa maior, como na figura 1.4. Falta agora saber quantos arranjos de um dado subconjunto fixo de i elementos nas i caixinhas resultam numa mesma combinação nessa caixa maior. Mas isto corresponde a calcular de quantas maneiras se podem distribuir i objectos distintos por i caixinhas, o que é um caso particular do que foi feito no raciocínio anterior. Esse número é, por conseguinte, igual a i × (i − 1) × (i − 2) × · · · × 2 × 1.
E
X
M
P
L
O
X EM PO L
FIGURA 1.4
Concluímos, assim, que as n ×(n −1)×· · ·×(n −(i −1)) maneiras de escolher i objectos, de entre n , para as i caixinhas, se dividem em grupos com i × (i − 1) × (i − 2) × · · · × 2 × 1 elementos cada33 , correspondendo a uma mesma selecção de i objectos. Resulta que34 : n n × (n − 1) × · · · × (n − (i − 1)) = i i × (i − 1) × (i − 2) × · · · × 2 × 1
Exemplo: Sejam n = 4, i = 2, e sejam A, B, C, D os 4 objectos. Procedendo como na explicação dada atrás, obteríamos:
A B
B A
A
C
A B
C
A
B C
C B
A
D
A C
D
A
C
D
B
D
B C
D
B
A D
C D
B D
D
C
32 Temos o número total de pernas das girafas. 33 Temos assim o número de pernas de cada girafa. 34 Dividindo o número total de pernas pelo número de pernas de cada girafa, temos o número de girafas…
44
ANTÓNIO MACHIAVELO
Notação: Para n ∈ N, o produto de todos os inteiros positivos de 1 a n , inclusivé, denota-se por n !, que se lê «n factorial». Convenciona-se que 0! = 1. Usando esta notação, tem-se: n n! = i (n − i )! i !
(1.8)
Esta expressão é válida para i = 0 e i = n graças à convenção feita. De tudo isto se conclui: Teorema 1.7 (Expansão Binomial) Para todo n ∈ N0 , tem-se: (a + b ) = n
n ∑ n i =0
com
n n! = (n −i , i )!i !
i
a n−i b i ,
onde a e b são duas variáveis (tais que a b = b a ).
Pelo caminho ficamos também com um método rápido de calcular o número de maneiras de escolher i objectos de entre n objectos distintos, ou, o que é o mesmo, o número de subconjuntos com i elementos de um conjunto com n elementos35 . De um modo mais geral tem-se: Teorema 1.8 (Expansão Multinomial) Para todo n ∈ N0 e k ∈ N, tem-se: (a 1 + a 2 + · · · + a k )n =
∑ i 1 +i 2 +···+i k =n
n! i a i 1 a i 2 · · · a kk , i 1 !i 2 ! · · · i k ! 1 2
onde a 1 , a 2 , . . . , a k são variáveis que comutam umas com as outras, e onde i 1 , i 2 , . . . , i k percorrem todos os k -úplos formados por elementos de N0 cuja soma é igual a n . Demonstração: O coeficiente de a 1i 1 a 2i 2 · · · a ki k pode ser calculado do seguinte modo: há in1 maneiras diferentes de escolher os i 1 sítios, de entre os n possíveis, 1 de onde provêm os a 1 ’s; para cada uma dessas maneiras, há n −i diferentes i2 35 Este aspecto combinatório dos números do «triângulo de Pascal» era, muito provavelmente, já conhecido por hindus do século VI a.C. (Biggs, 1979). Como os coecientes binomiais surgem naturalmente em vários contextos, é possível que tenham sido descobertos múltiplas vezes e de modos independentes. É curioso que uma das referências mais antigas tenha a ver com o número de perfumes diferentes que se podem obter misturando diversos ingredientes ((Biggs, 1979), p. 115), enquanto que outra tem a ver com uma contagem de métricas distintas em certos poemas em sânscrito (Bag, 1966).
45
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
escolhas de i 2 sítios, de entre os restantes n − i 1 , de onde escolher os a 2 ’s; para cada uma destas, há agora n−ii13−i 2 escolhas para os a 3 ’s; etc. Resulta assim que o coeficiente procurado é igual a:
n − i 1 − i 2 − · · · − i k −1 n −i1 n −i1 −i2 = ··· ik i2 i3 n! (n − i 1 )! (n − i 1 − i 2 )! = ··· (n − i 1 )!i 1 ! (n − i 1 − i 2 )!i 2 ! (n − i 1 − i 2 − i 3 )!i 3 ! (n − i 1 − · · · − i k −2 )! (n − i 1 − · · · − i k −1 )! ··· (n − i 1 − · · · − i k −2 − i k −1 )!i k −1 ! (n − i 1 − · · · − i k −1 − i k )!i k ! n! = i 1 !i 2 ! · · · i k !
n i1
Exercício 1.12 Calcule o coeficiente de a 2b 3 c na expansão de (a + b + c )6 .
1.7 O «PEQUENO» TEOREMA DE FERMAT E O TEOREMA DE EULER Para dar exemplos de números perfeitos usando o resultado de Euclides (teorema 1.5, acima), é necessário determinar, para um primo p , se 2p − 1 é também primo. Isto conduz ao problema de saber quando é que um primo q divide um número da forma 2p − 1. Suponha-se que se quer determinar se 213 − 1 é ou não primo. Para tal há que ver se é ou não divisível por algum primo menor ou igual à sua raiz quadrada (ver proposição 1.4). Este é um processo algo tedioso. Talvez por isso um método mais expedito tenha sido descoberto por Fermat36 que observou que há um padrão nos restos deixados pelas sucessivas potências de 2 quando divididas por um primo. Isto é ilustrado para o primo 7 na tabela seguinte: Potências de 2
1
2
22
23
24
25
26
27
···
212
213
Resto da divisão por 7
1
2
4
1
2
4
1
···
···
···
2
Observe-se que o resto de uma potência de 2 pode ser calculado à custa do resto da potência anterior, evitando assim o cálculo explícito das potências de 2, pois de 2a = 7q + r ⇒ 2a +1 = 7(2q ) + 2r , conclui-se que, para achar o resto da divisão de 36 Não há nenhuma evidência directa disto, mas é bastante plausível — ver (H. Edwards, 1977), secção 1.8. 46
ANTÓNIO MACHIAVELO
2a +1 por 7, e conhecendo o resto r da divisão de 2a por 7, basta achar o resto da
divisão de 2r por 7, uma vez que 2r = 7q ′ +r ′ ⇒ 2a +1 = 7(2q +q ′ )+r ′ e daqui resulta, pela unicidade do teorema da divisão (teorema 1.1), que r ′ é o resto pretendido. Em particular, quando um 1 é encontrado numa tabela como a anterior, tudo se repete, pois o que se faz a seguir é o mesmo que se fez no início da tabela. Vê-se assim que 213 − 1 dá resto 2 − 1 = 1 quando dividido por 7. Tudo isto se generaliza facilmente a outros números, mas para tornar a notação mais leve e os raciocínios mais claros, é conveniente usar uma noção e uma notação introduzidas por K. F. Gauss (1777 – 1855), na sua monumental obra Disquisitiones Arithmeticae, de 1801, e cuja utilidade é difícil sobrevalorizar. Definição 1.7 Dados m ∈ N e a ,b ∈ Z, os inteiros a e b dizem-se congruentes módulo m se deixam o mesmo resto quando divididos por m . Notação: a ≡ b (mod m ) significa «a congruente com b módulo m »37 . Exemplos: Tem-se que 23 ≡ 9 (mod 7), já que tanto 23 como 9 deixam resto 2 quando divididos por 7. Analogamente, 5 ≡ −11 (mod 8), uma vez que −11 = 8 × (−2) + 5. Proposição 1.8 Para todo m ∈ N e a ,b ∈ Z, tem-se: a ≡ b (mod m ) ⇔ m | a − b ⇔ a = b + t m , para algum inteiro t .
Demonstração: a ≡ b (mod m ) significa que a = mq1 +r e b = mq2 +r (para alguns q1 ,q2 , r ). Mas então, a − b = m (q1 − q2 ). Isto mostra a primeira «⇒». De facto, podemos mostrar a primeira «⇔» duma só vez, observando que se a = mq1 + r1 e b = mq2 + r2 , com 0 ≤ r1 , r2 < m , então a − b = m (q1 − q2 ) + r1 − r2 , e como −m < r1 − r2 < m , vê-se imediatamente que m | a − b ⇔ r1 = r2 , isto é a ≡ b (mod m ). A segunda «⇔» é fácil e a sua prova é deixada como exercício. Exemplos: Nos dois exemplos dados acima tem-se: 7 | (23 − 9) e 8 | (5 − (−11)). Também: 23 = 9 + 2 × 7 e 5 = −11 + 2 × 8. O que torna a noção de congruência um instrumento muito eficaz no cálculo de restos é o facto de se ter: 37 «Congruentes» deriva do latim e signica «concordantes», «correspondentes»; «módulo» signica «pequena medida». 47
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
Teorema 1.9 (Propriedades da relação de congruência) Para todo m ∈ N, a ,b, c , d ∈ Z, tem-se: (i) (ii) (iii)
a ≡ a (mod m ); a ≡ b (mod m ) ⇒ b ≡ a (mod m );
a ≡ b (mod m ) ∧ b ≡c (mod m ) ⇒ a ≡ c (mod m ); a ≡ b (mod m ) a + c ≡ b + d (mod m ) (iv) ⇒ c ≡ d (mod m ) a c ≡ b d (mod m ).
(As propriedades (i), (ii) e (iii), conhecidas por reflexividade, simetria e transitividade, respectivamente, mostram que ≡ é aquilo a que se chama uma relação de equivalência.) Demonstração (da 2ª parte de (iv)): De guns inteiros t , s . Mas então,
n
a ≡b (mod m ) c ≡d (mod m )
resulta que
¦ a =b +t m c =d +s m
, para al-
a c = b d + b s m + d t m + t s m 2 = b d + (b s + d t + t s m )m ,
de onde se conclui a c ≡ b d (mod m ). As outras demonstrações são fáceis e são deixadas como exercício.
Exemplo: O resultado anterior justifica os cálculos seguintes, que mostram como verificar que 23 | 211 − 1 com alguma economia computacional: 25 = 32 ≡ 9 (mod 23) ⇒ 210 = (25 )2 ≡ 92 = 81 ≡ 12 (mod 23) ⇒ 211 = 2 × 210 ≡ 2 × 12 = 24 ≡ 1 (mod 23) ⇒ 23 | 211 − 1.
Alternativamente: 24 = 16 ≡ −7 (mod 23) ⇒ 28 = (24 )2 ≡ (−7)2 = 49 ≡ 3 (mod 23) ⇒ 211 = 23 × 28 ≡ 8 × 3 = 24 ≡ 1 (mod 23) ⇒ 23 | 211 − 1.
A propriedade (iv) dá à noção de congruência muito do seu poder, mostrando que esta noção é «bem-comportada» relativamente à adição e à multiplicação, o que permite efectuar cálculos de restos de um modo muito eficiente. Não é claro a partir das definições, mas há um caso importante em que se pode «dividir» numa congruência. Para ver como, sejam a ∈ Z e n ∈ N dois números primos 48
ANTÓNIO MACHIAVELO
entre si. Pelo algoritmo de Euclides, existem x , y ∈ Z tais que a x +ny = 1. Resulta que a x ≡ 1 (mod n), para algum x ∈ Z. Por analogia com o facto de se chamar inverso de um número ao que por ele multiplicado dá 1, tem-se: Definição 1.8 Dados dois inteiros a e n com (a , n ) = 1, chama-se inverso de a módulo n a qualquer um dos inteiros x tais que a x ≡ 1 (mod n). Ficou visto que se (a , n ) = 1, então existem inversos de a módulo n , um dos quais pode ser calculado usando o algoritmo de Euclides. É claro que se a e n tiverem factores comuns, então a não tem nenhum inverso módulo n (porquê?). Exemplo: a = 5, n = 17. 17
=
3×5+2
5
=
2×2+1
1 = 5 − 2 × 2 = 5 − (17 − 3 × 5) × 2 = = 7 × 5 − 2 × 17.
Conclui-se assim que 7 é um inverso de 5 módulo 17 (observe-se que −10 e 24 são também inversos de 5 módulo 7, assim como qualquer número da forma 7 + 17k , k ∈ Z).
Usando a existência de inversos para números que são primos com o módulo, tem-se o seguinte resultado, que será muito útil adiante: Proposição 1.9 Se (a , n) = 1 e a x ≡ a y (mod n), então x ≡ y (mod n). Demonstração: Como (a , n) = 1, o algoritmo de Euclides garante a existência de b ∈ Z tal que b a ≡ 1 (mod n). Usando (iv) acima, tem-se: a x ≡ a y (mod n) =⇒ b a x ≡ b a y (mod n ) =⇒ x ≡ y (mod n).
(Exercício: Justifique cuidadosamente estas duas últimas implicações.) Alternativamente: a x ≡ a y (mod n) equivale a n | a x − a y = a (x − y ), de onde se conclui, usando a proposição 1.2 e o facto de se ter (a , n) = 1, que n | x − y , o que é o mesmo que x ≡ y (mod n). Regressando agora ao problema de estudar quando é que um primo q divide 2p − 1, depois de construir várias tabelas como a da página 46, e tendo em conta
a importância da localização do primeiro 1 após o inicial, obter-se-ia a seguinte tabela: 49
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
Primo p
3
5
7
11
13
17
19
23
29
31
37
...
Primeiro expoente d ≥ 1 tal que 2d ≡ 1 (mod p )
2
4
3(∗)
10
12
8
18
11
28
5
36
...
[(*) resulta da tabela da página 46.]
Pierre de Fermat, muito provavelmente considerando o problema que estamos a tratar38 , a procura de exemplos de números perfeitos, sem que necessariamente tenha feito alguma tabela como as anteriores, de algum modo notou um padrão que está contido na última tabela. Antes de prosseguir, consegue o leitor ver alguma relação entre as duas filas de números? Numa carta dirigida a Frénicle de Bessey, datada de 18 de Outubro de 1640, Fermat escreveu o seguinte39 : Parece-me que depois disto lhe devo dizer qual a fundação na qual assento todas as demonstrações que dizem respeito a progressões geométricas, nomeadamente: Todo o número primo mede infalivelmente uma das potências menos a unidade em qualquer progressão, e o expoente dessa potência é um divisor do dado número primo menos um; e depois de encontrada a primeira potência que satisfaz esta condição, todos aqueles cujos expoentes são múltiplos do primeiro satisfazem essa mesma condição. Vamos ver que assim é: Teorema 1.10 («Pequeno»40 Teorema de Fermat): Se p é um número primo e a é um inteiro não divisível por p , então: a p −1 ≡ 1 (mod p )
(equivalentemente: a p ≡ a (mod p ), para todo o inteiro a .) Daremos aqui várias demonstrações deste resultado, para ilustrar que há vários caminhos possíveis para chegar a um resultado e que diferentes caminhos podem oferecer diferentes perspectivas.
38 (H. Edwards, 1977), secção 1.8. 39 (Ore, 1948), p. 272. 40 O adjectivo «pequeno» não deve ser aqui tomado como signicando algo de somenos importância. É um dos resultados mais úteis e fecundos de Fermat! Só que um seu outro resultado, que deu que fazer a várias gerações de matemáticos, cou conhecido como o «Grande» (ou o «Último») Teorema de Fermat e, como são os dois mais citados, tornou-se necessário distingui-los... 50
ANTÓNIO MACHIAVELO
1.ª Demonstração: 1.ª etapa: a t ≡ 1 (mod p ), para algum t > 0. Razão: Como p - a , os restos módulo p dos p números 1, a , a 2 , . . . , a p −1 estão entre os p − 1 números 1, 2, . . . , p − 1. Pelo «princípio das meias e das gavetas»41 , há dois desses números com o mesmo resto. Ou seja, existem i , j com 0 ≤ j < i ≤ p − 1 tais que a i ≡ a j (mod p ). Uma vez que (p, a ) = 1, resulta da proposição 1.9 que a i −j ≡ 1 (mod p ). Seja agora d o menor dos inteiros t ≥ 1 tal que a t ≡ 1 (mod p ). 2.ª etapa: d | p − 1 Razão: Considerem-se os números 1, a , a 2 , . . . , a d −1 . Estes números dão restos distintos quando divididos por p , uma vez que se houvesse dois com o mesmo resto, então pelo raciocínio feito acima obter-se-ia um expoente 1 ≤ t < d tal que a t ≡ 1 (mod p ), o que não pode ser, pois d é o menor destes. Se agora todos os números 1, 2, 3, . . . , p − 1 aparecerem como restos de 1, a , a 2 , . . . , a d −1 , então d = p − 1 e a prova acaba aqui. Se não, seja b um inteiro não divisível por p , que dê um resto, módulo p , distinto dos de 1, a , a 2 , . . . , a d −1 . Então, os restos de b,b a ,b a 2 , . . . ,b a d −1 são distintos entre si e distintos dos de 1, a , a 2 , . . . , a d −1 , pois: b a i ≡ b a j (mod p )
a ==========⇒ (proposição 1.9 ; (b,p )=1)
i
≡ a j (mod p ),
e b a i ≡ a j (mod p )
b ===========⇒ (proposição 1.9 ; (a i ,p )=1)
≡ a j −i (mod p ).
No caso em que j < i , esta última congruência pode ser interpretada de duas maneiras, que é fácil ver serem equivalentes: uma é reparar que podemos substituir j por j + (um múltiplo de d ) (porquê?) e, portanto, fazer com que j seja maior do que i ; a outra é interpretar a −t como sendo o inverso módulo p de a t , para todo i t , tendo-se a −i ≡ a −1 (mod p ) (porquê?). Se ainda não foram esgotados todos os restos possíveis, 1, 2, . . . , p − 1, seja c um número não divisível por p cujo resto é distinto dos de 1, a , a 2 , . . . , a d −1 e 41 Se tivermos m > n meias e as colocarmos em n gavetas, haverá necessariamente uma gaveta com pelo menos duas meias! 51
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
dos de b,b a ,b a 2 , . . . ,b a d −1 . Como acima, verifica-se que os restos dos números c , c a , c a 2 , . . . , c a d −1 módulo p são distintos dos anteriores. Prosseguindo deste modo, obtém-se: aqui vão estar representados, 1
b
c
···
a
ba
ca
···
a2
ba2
ca2
···
.. .
.. .
.. .
.. .
a d −1
b a d −1
c a d −1
···
d nos
d nos
d nos
ao fim de um número finito de escolhas, todos os restos 1, 2, 3, . . . , p − 1, uma e uma só vez (porquê?). Exercício: Construa explicita
mente um quadro como este para a = 2, p = 31.
Os números 1, 2, 3, . . . , p − 1 ficam, assim, divididos em grupos de d , o que mostra que d | p − 1. 42 3.ª e última etapa: s Seja então p − 1 = d s . Tem-se a p −1 = a d ≡ 1s ≡ 1 (mod p ).
2.ª Demonstração: Os números a , 2a , 3a , . . . , (p − 1)a têm restos distintos módulo p , pois p - i a − j a = (i − j )a para 0 ≤ j < i ≤ p − 1, uma vez que p é primo e por hipótese não divide a , enquanto que i − j < p . Mas, então, os restos dos números a , 2a , 3a , . . . , (p −1)a são necessariamente os números 1, 2, 3, . . . , p −1 (numa outra ordem, possivelmente…). Donde resulta que: (p − 1)! = 1 · 2 · 3 · · · (p − 1) ≡ a · 2a · 3a · · · (p − 1)a = (p − 1)! a p −1 (mod p ).
Como p é primo, tem-se que (p, (p − 1)!) = 1 e, usando a proposição 1.9, resulta que 1 ≡ a p −1 (mod p ). 3.ª Demonstração: Vamos mostrar por indução que a p ≡ a (mod p ), para todo a ∈ N. É claro que 1p ≡ 1 (mod p ). Agora, suponhamos que, para um determinado número natural (fixo) a , é verdade que a p ≡ a (mod p ). Então, usando o teorema 1.7: 42 Observe-se que este argumento é essencialmente o argumento da demonstração do chamado Teorema de Lagrange em Teoria de Grupos, que arma que a ordem de um subgrupo de um grupo nito necessariamente divide a ordem deste.
52
ANTÓNIO MACHIAVELO
(a + 1)p
=
ap +
p p p p a p −1 + a p −2 + · · · + a2 + a +1 1 2 p −2 p −1 | {z }
≡
≡0 (mod p )
≡ a + 1 (mod p ), uma vez que p |
p! (p −i )! i !
para todo 0 < i < p , pois nestes casos
p não figura no denominador.
4.ª Demonstração: Usando o teorema 1.8, tem-se: a p = (1 + 1 + · · · + 1)p = {z } | a
∑ i 1 +i 2 +···+i a =p
p! 1i 1 · 1i 2 · · · 1i a ≡ i 1! i 2! · · · i a !
≡ 1p + 1p + · · · + 1p = a (mod p ), pois p | | {z }
p! , i 1 ! i 2 ! ···i a !
excepto quando um dos i j ’s é
a
igual a p e todos os outros são, necessariamente, iguais a 0. Tem-se ainda o seguinte resultado:
Proposição 1.10 Seja p primo e a não divisível por p . Se d é o menor expoente positivo tal que a d ≡ 1 (mod p ), e se a t ≡ 1 (mod p ), então d | t . q
Demonstração: Divida-se t por d : t = d q + r . Então 1 ≡ a t ≡ a d · a r ≡ ≡ a r (mod p ). Mas 0 ≤ r < d . Pela minimalidade de d , resulta que r é necessariamente igual a 0, ou seja, d | t . Destes resultados podemos retirar informações importantes sobre os divisores primos dos números de Mersenne43 da forma 2p − 1 com p primo, e sobre n os divisores dos números de Fermat, isto é os números da forma 22 + 1 (n ∈ N0 ), como veremos de seguida. Corolário 1.3 Seja p ̸= 2 um primo. Os factores primos de 2p −1 são da forma 2k p +1, com k ∈ N. Demonstração: Seja q um primo que divide 2p − 1. Então 2p ≡ 1 (mod q ). Como p é primo, resulta de proposição anterior que p é necessariamente o menor expoente d tal que 2d ≡ 1 (mod q ) (já que d | p ⇒ d = 1 ou d = p , e d ̸= 1 pois 2 ̸≡ 1 (mod q )). Por outro lado, 2q −1 ≡ 1 (mod q ), pelo teorema de Fermat (por que é que q ̸= 2?). Usando novamente o resultado anterior, conclui-se que p | q − 1. Logo, q = p t + 1 para algum inteiro t . Finalmente, como p e q são ímpares, t é necessariamente par. Donde, t = 2k para algum k e portanto q = 2k p + 1. 43 Um número de Mersenne é um número da forma 2n − 1, com n ∈ N. 53
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
Exemplos: • Os factores primos de 211 − 1 estão entre os números primos da forma 22k + 1 (k = 1, 2, . . .). De facto, 211 − 1 = 23 × 89, o factor 23 correspondendo a k = 1 e o factor 89 a k = 4. • Os factores primos de 213 − 1 são da forma 26k + 1 (k = 1, 2, . . .). Como p p p 213 − 1 < 213 = 26 × 2 < 64 × 1,5 = 96,
os únicos primos da forma pretendida que são menores ou iguais à raiz quadrada de 213 − 1 são: 53 e 79. Resulta que, se 213 − 1 não for divisível por 53 nem por 79 (o que de facto é verdade — verifique-o!), então é primo. O resultado acima permite assim verificar a primalidade de 213 − 1 efectuando apenas duas divisões! Corolário 1.4 Os factores primos de 22 +1 (n ≥ 0) são da forma 2n +1 k +1 para algum k ∈ N. n
Demonstração: Seja p um primo tal que p | 22 +1, ou, equivalentemente, 22 ≡ −1 n +1 n 2 (mod p ). Então, 22 ≡ 22 ≡ (−1)2 ≡ 1 (mod p ). Se designarmos por d o menor d inteiro positivo tal que 2 ≡ 1 (mod p ), como acima, resulta então da proposição anterior que d | 2n+1 . Mas, então, d = 2t para algum 0 ≤ t ≤ n + 1. Se se tivesse t ≤ n n , então ter-se-ia que d | 2n e, portanto, −1 ≡ 22 ≡ 1 (mod p ). Isto implicaria p = 2, o que é falso (porquê?). Resulta assim que t = n +1, ou seja, d = 2n +1 . Pelo teorema de Fermat, sabe-se que 2p −1 ≡ 1 (mod p ), resultando da proposição anterior que 2n +1 | p − 1, isto é: p = 2n+1 k + 1 para algum k . n
n
Exemplos: • Os factores primos de F3 = 22 + 1 = 257 são da forma 24 k + 1 = 16k + 1 (k = p 8 1, 2, 3, . . .). Mas 2 + 1 < 24 + 1 = 17 (porquê?). Resulta que 257 é primo sem ser necessário efectuar qualquer divisão!!! Isto dá uma pequena amostra do poder dos resultados provados acima. 4 • Os factores primos de F4 = 22 +1 = 65 537 são da forma 32k +1 (k = 1, 2, 3, . . .). p Como 216 + 1 < 28 +1 = 257 (porquê?), os únicos primos da forma pretendida 3
54
ANTÓNIO MACHIAVELO
que são menores ou iguais à raiz quadrada de F4 são: 97 e 193. Que nenhum destes dois primos divide F4 , pode ser verificado do seguinte modo44 : 97 não divide F4 : 26 ≡ 64 ≡ −33 (mod 97) ⇒ 26 + 25 ≡ −1 (mod 97) ⇒ 3 × 25 ≡ −1 (mod 97) ⇒ 9 × 210 ≡ 1 (mod 97) ⇒ 9 × 216 ≡ 26 ≡ 64 (mod 97). Agora, se 216 ≡ −1 (mod 97),
então −9 ≡ 64 (mod 97), o que é falso. Donde 216 ̸≡ −1 (mod 97). 193 não divide F4 : 28 ≡ 256 ≡ 63 (mod 193) ⇒ 28 − 26 ≡ −1 (mod 193) ⇒ 3 × 26 ≡ −1 (mod 193) ⇒ 9 × 212 ≡ 1 (mod 193) ⇒ 9 × 216 ≡ 24 ≡ 16 (mod 193). Agora, se se tivesse 216 ≡ −1 (mod 193), então −9 ≡ 16 (mod 193), o que é falso. Portanto, 216 ̸≡ −1 (mod 193).
Conclui-se, assim, que F4 = 216 + 1 é primo! 5 • Os factores primos de F5 = 22 + 1 = 4 294 967 297 são da forma 64k + 1 (k = 1, 2, 3, . . .). O valor correspondente a k = 10 fornece o factor primo 641, descoberto por Euler, mostrando assim que é falsa uma conjectura feita por Fern mat de que 22 + 1 é primo para todo n ≥ 0. A generalização de Euler Seja n um inteiro positivo. Claro que se (a , n ) > 1, então não existe nenhum inteiro d tal que a d ≡ 1 (mod n) (porquê?). Mas, e se (a , n) = 1? Vamos ver que neste caso existem tais expoentes, à semelhança do que acontece módulo números primos. Sejam m 1 , m 2 , . . . , m k todos os números de 1 a n que são primos com n (exemplo: para n = 9 esses números são: 1, 2, 4, 5, 7 e 8). Agora, se a é tal que (a , n) = 1, então os números a m 1 , a m 2 , . . . , a m k são primos com n (porquê?) e, portanto, também o são os seus restos, pelo lema 1.1. Mas, a m i ̸≡ a m j (mod n) para i ̸= j , pois a m i ≡ a m j (mod n ) ⇒ m i ≡ m j (mod n) ⇒ i = j . Resulta que os números a m 1 , a m 2 , . . . , a m k deixam restos m 1 , m 2 , . . . , m k (em geral numa outra ordem) módulo n , isto é: {restos de a m 1 , a m 2 , . . . , a m k } = {m 1 , m 2 , . . . , m k }. 44 A ideia é usar uma das potências de 2 mais perto do primo p , para p = 97 e p = 193, e o facto fortuito de aqui acontecer que uma delas é tal que a diferença para p é “quase” uma potência de 2, o que permite obter facilmente, usando as propriedades básicas das congruências, uma relação que envolve 216 e que mostra imediatamente não se poder ter 216 ≡ −1 (mod p ).
55
ARITMÉTICA: AS SUBTILEZAS DOS NÚMEROS NATURAIS
(exemplo: para n = 9, a = 4 os restos, módulo 9, dos números 4 × 1, 4 × 2, 4 × 4, 4 × 5, 4 × 7, 4 × 8 são: 4, 8, 7, 2, 1, 5, respectivamente). Então: m 1 m 2 · · · m k ≡ a m 1 a m 2 · · · a m k ≡ a k m 1 m 2 · · · m k (mod n). Como (m 1 m 2 · · · m k , n ) = 1 (porquê?), pode-se aplicar a proposição 1.9 para concluir que a k ≡ 1 (mod n)
Vê-se assim que k é um dos expoentes procurados, e justifica-se que se lhe dê um nome: Definição 1.9 O número de inteiros positivos menores ou iguais a n que são primos com n é denotado por φ(n). A φ chama-se a função de Euler. Observação: φ(1) = 1. De tudo o que acima se viu, resulta: Teorema 1.11 (Euler): Se n é um número inteiro positivo e a ∈ Z é tal que (a , n) = 1, então a φ(n) ≡ 1 (mod n). Observe-se que no caso particular em que n é primo, se tem φ(n) = n − 1 (porquê?). O Teorema de Euler contém, assim, o resultado de Fermat como um caso particular. Surge agora o seguinte problema: como calcular φ(n ) rapidamente? Se, por exemplo, quisermos calcular φ(10 000), seria excessivamente trabalhoso enumerar todos os números de 1 a 10 000 que são primos com 10 000. Pode-se, alternativamente, começar por observar que 10 000 = 104 = 24 ×54 , e que, por conseguinte, um número é primo com 10 000 se e só se não for múltiplo nem de 2, nem de 5. Assim, denotando o cardinal de um conjunto S por #S , tem-se: φ(10 000) = 10 000 − #{múltiplos de 2 entre 1 e 10 000} − #{múltiplos de 5 entre 1 e 10 000} + #{múltiplos de 10, entre 1 e 10 000}.
Esta última parcela é necessária uma vez que os múltiplos de 10 foram descontados duas vezes nas parcelas anteriores: uma como múltiplos de 2 e outra como múltiplos de 5. Portanto, φ(10 000) = 10 000 −
56
10 000 10 000 10 000 − + = 4 000. 2 5 10
ANTÓNIO MACHIAVELO
Em geral, seja n = p 1α1 · · · p tαt a factorização de n em números primos. Tem-se: ´ ´ φ(n ) = n − #{multiplos de p 1 , de 1 a n} − · · · − #{multiplos de p t , de 1 a n} + ´ ´ + #{multiplos de p 1 p 2 , de 1 a n} + · · · + #{multiplos de p t −1 p t , de 1 a n } −
(1.9)
´ − #{multiplos de p 1 p 2 p 3 , de 1 a n} − · · · etc. · · · ,
onde na 2.ª fila são consideradas todas as combinações possíveis de dois primos; na 3.ª fila todas as de três primos; etc ... Exemplo: φ(12) = φ(22 × 3) = 12 − #{2, 4, 6, 8, 10, 12} − #{3, 6, 9, 12} + #{6, 12}.
Exercício 1.13 Escreva (1.9) explicitamente para n = 420. β
β
β
Note-se que em (1.9) um número da forma c p i 11 p i 22 · · · p i kk < n , com (c , n) = 1, k ≥ 1, β j ≤ αi j (observe-se que estes são, precisamente, os números compreendidos entre 1 e n e que não são primos com n ) é contado: 1−k +
k k k − + · · · + (−1)k = (1 − 1)k = 0 2 3 k
vezes! Isto é, só os números entre 1 e n que são primos com n é que são contados em (1.9) uma e uma só vez. Resulta que: φ(n)
=
=
= (∗∗)
= =
n n n n n − ··· − + + + ··· + + ··· + p1 pt p 1p 2 p 1p 3 p 1p t n n +··· + − − ··· = p t −1 p t p 1p 2p 3 ∑ 1 ∑ 1 ∑ 1 n 1 − + − + ··· = p p p p p p (∗∗) i i j i i 0), e continuando a supor que a tela é o plano y = 0, a projecção (2.1) deverá ser substituída por λx λz , . y +λ y +λ
(x , y , z ) 7→
Mais geralmente, nada obriga a que a tela seja o plano y = 0. Aliás, no último exemplo apresentado o olho estava situado em (0, −6, 0) e a tela era o plano y = −4, o que faz com que a projecção fosse dada por (x , y , z ) 7→
2x 2z , . y +6 y +6
A tela não tem que ser um plano vertical; qualquer plano serve. Aliás, um problema interessante consiste em, dado um objecto tridimensional, encontrar as suas projecções em diversos planos e relativamente a diversos «olhos». Outro problema reside no facto de, mesmo que se siga a sugestão do parágrafo anterior, poder obter-se uma figura inesperada, tal como a figura 2.19, que não é mais do que a projecção de um cubo. Não parece sê-lo, mas isso deve-se ao facto de o verdadeiro cubo, do qual a figura 2.19 é uma projecção no plano, não estar situado em frente ao observador (ou seja, o seu centro não está próximo da recta x = z = 0), mas sim bastante para o lado. O aspecto inabitual daquela figura
FIGURA 2.19 Anamorfose de um cubo
prende-se com o facto de, quando observamos o que se passa à nossa frente e algo que está na periferia do nosso campo de visão nos desperta a atenção, virarmo88
JOSÉ CARLOS SANTOS
-nos para essa coisa em vez de nos limitarmos a apreender a figura tal como a vemos nesse momento.
2.7 BIBLIOGRAFIA COMENTADA Uma excelente referência bibliográfica sobre Geometria com muito material sobre perspectiva (linear e não só) escrita em português é: Eduardo Veloso, 1998: Geometria: Temas actuais: Materiais Para Professores, Desenvolvimento Curricular no Ensino Secundário, Instituto de Inovação Educacional. Um livro sobre desenho matemático, com muitos exemplos e bastante material sobre perspectiva é: Robert Dixon, 1991: Mathographics, Dover. Quem estiver interessado em fazer desenhos em perspectiva usando software de Geometria Dinâmica terá interesse em consultar: Cathi Sanders, 1994: Perspective Drawing With the Geometer’s Sketchpad, Key Curriculum Press. O século dezanove assistiu à última grande efusão da Geometria Euclidiana. Muitos dos grandes tratados sobre aquele tipo de Geometria datam dessa época e contêm muitos resultados úteis para o tipo de construções vistas neste texto. Por exemplo, a construção das tangentes a uma elipse que passam por um ponto exterior dado, ilustrada pela figura 2.15, foi extraída do seguinte livro, (cuja primeira edição data de 1885): Thomas Henry Eagles, 2007: Constructive Geometry of plane curves: With numerous examples, Merchant Books. Podem-se ver projecções (inclusivamente em estereoscopia) de um grande número de poliedros (regulares e não só) na página do Atractor, disponível em http://www.atractor.pt/mat/fr-in.htm. Contrariamente aos livros aqui indicados, que estão a ser sugeridos aos professores, esta página pode ser vista com proveito por estudantes, mesmo do Ensino Básico. A Geometria Projectiva tem na sua génese o estudo das projecções em planos de figuras tridimensionais. Sendo assim, não admira que o estudo daquele ramo da Geometria seja relevante para o desenho de imagens em perspectiva. Um livro que realça isto é: Ivan Herman, 1992: The Use of Projective Geometry in Computer Graphics, Lecture Notes in Computer Science 564, Springer-Verlag. Como se pode facilmente verificar a partir de diversos dos exemplos vistos neste texto, a Álgebra Linear também é uma ferramenta importante para este tipo de construções. Estas aplicações da Álgebra Linear são o ponto central do livro: John Loustau e Meighan Dillon, 1993: Linear Geometry with Computer Graphics, Pure and Applied Mathematics 170, Marcel Dekker. 89
PERSPECTIVA
Finalmente, quem quiser consultar um tratado sobre as técnicas empregues para criação de gráficos por computador terá todo o interesse em consultar: James D. Foley, Andries van Dam, Steven K. Feiner e John F. Hughes, 1995: Computer Graphics: Principles and Practice, Addison-Wesley.
90
3 GEOMETRIA: DA INTUIÇÃO AO RIGOR António Bivar
Si on cherche avec une véritable attention la solution d’un problème de géométrie, et si, au bout d’une heure, on n’est pas plus avancé qu’en commençant, on a néanmoins avancé, durant chaque minute de cette heure, dans une autre dimension plus mystérieuse. Sans qu’on le sente, sans qu’on le sache, cet effort en apparence stérile et sans fruit a mis plus de lumière dans l’âme. Simone Weil (1909–1943; filósofa, irmã do matemático André Weil).
3.1 INTRODUÇÃO: A ARITMÉTICA E A GEOMETRIA COMO SISTEMAS DE CONHECIMENTOS EMPÍRICOS E COMO CONSTRUÇÕES FORMAIS A Aritmética e a Geometria elementares podem ser consideradas os dois pilares fundamentais em que assenta não só toda a Matemática mas também, em certo sentido, toda a Ciência, tal como tem vindo a ser desenvolvida ao longo dos séculos. Procuremos perceber alguns dos factores que permitem explicar a emergência dessas duas grandes áreas das ciências exactas, não tanto com preocupações de grande rigor histórico ou antropológico, mas mais propriamente com o objectivo de clarificar os respectivos conceitos básicos em articulação com as aplicações que os justificam. Será depois mais particularmente da Geometria que nos ocuparemos. Comecemos, no entanto, por analisar o papel da Aritmética1 ; as operações de contagem e, portanto, os números naturais (inteiros positivos), a partir dos quais aquele ramo do conhecimento se desenvolveu, são, em certo sentido, o ponto de partida para uma organização racional de muitos dos conhecimentos adquiridos em resultado da nossa interacção com o mundo exterior. Consequências essenciais desse modo de apreender a realidade são, por um lado, a utilização eficaz dos recursos naturais, e, por outro, uma possibilidade acrescida de transmissão de conhecimentos que ultrapasse as barreiras geográficas e geracionais. Todavia devemos reconhecer que nem todas as sociedades humanas, mesmo na actualidade, sentiram necessidade da «quantificação», ainda que ao 1 cf. [Bivar Weinholtz, 2004]
91
GEOMETRIA: DA INTUIÇÃO AO RIGOR
nível elementar da simples contagem de colecções de objectos; desse facto é testemunho a existência ainda hoje de línguas em que não se criaram termos para designar os números para além da unidade e do par, ficando as restantes quantidades englobadas numa noção genérica de «multiplicidade». Tais sociedades baseiam a respectiva subsistência na caça e na recolecção, desconhecendo a pastorícia e a agricultura; não há assim necessidade premente de controlar efectivos, ao contrário do que acontece nos grupos humanos em que se desenvolveu, nomeadamente, a criação de gado. A propriedade (de um rebanho, por exemplo) e as inerentes operações comerciais, ainda que se limitem à troca directa, acarretam a necessidade de avaliar e comparar diferentes colecções de bens, controladas por diferentes proprietários, ou os efectivos de um mesmo detentor ao longo do tempo; o estabelecimento de correspondências um-a-um («biunívocas») com colecções-padrão (sacos de pedras2 , riscos em placas de madeira, etc.) permitia comodamente efectuar esse controlo e essas comparações sem que houvesse necessidade de ter sempre presentes os bens efectivos3 . O passo essencial seguinte consistiu em substituir essas colecções-padrão «materiais» por colecções simbólicas constituídas por expressões da linguagem comum, memorizáveis e registáveis pela escrita; as regras de formação sucessiva dessas expressões (os chamados sistemas de numeração) permitiam substituir por uma palavra ou expressão composta (escrita ou oral) ou por um símbolo (idêntico ou não à designação escrita associada) qualquer conjunto de objectos-padrão. Diferentes conjuntos entre os quais se pudessem estabelecer correspondências biunívocas passaram a corresponder à mesma expressão e ao mesmo símbolo, que identificamos com o número de elementos de cada um desses conjuntos; a determinação desse número baseia-se na própria construção sucessiva dessas «expressões numéricas», partindo das que representam a unidade4 , por um processo que permita obter as expressões correspondentes a conjuntos sucessivamente com mais um 2 A palavra latina calculus da qual deriva o termo «cálculo» signica precisamente «pequena pedra», tendo aliás também esse signicado em medicina (por exemplo, na expressão «cálculos biliares»). 3 Para comparar dois rebanhos, por exemplo, ou «o mesmo» rebanho em momentos diferentes, não seria necessário ter acesso efectivo aos animais que os constituem, desde que se tivesse previamente estabelecido as referidas correspondências biunívocas com colecções de objectos que se pudessem mais comodamente transportar e guardar. Como é obvio, quando se pretende analisar a evolução dos efectivos de determinado rebanho não há mesmo outra opção, pois não é possível voltar ao passado para comparar directamente as situações em momentos diferentes. 4 A unidade, também designada por «um» e representada pelo símbolo 1, é o «número de elementos» de um conjunto C não vazio tal que quaisquer elementos x , y de C são iguais (tal C diz-se conjunto unitário); ou seja, esse símbolo representa, em certo sentido, um «conjunto-padrão» de entre esses. O processo efectivo de escolha de um conjunto-padrão para «unidade» ou «número um» apenas intervém numa fase 92
ANTÓNIO BIVAR
elemento5 . «Contar» significa precisamente determinar qual o símbolo ou expressão que, no sistema de numeração utilizado, corresponde a determinada colecção de objectos; o modo mais «primitivo» de contar consiste em estabelecer directamente uma correspondência biunívoca enunciando oralmente, mentalmente ou por escrito a sucessão de símbolos ou expressões que representam os repetidos incrementos de uma unidade ao número 1, ao mesmo tempo que, passo a passo, se vão «retirando» material ou mentalmente ao conjunto a contar os objectos que o constituem, até que se esgote. Algumas operações elementares que podem efectuar-se com conjuntos (por exemplo, reunir num só conjunto os elementos de duas ou mais colecções disjuntas, ou seja, sem elementos comuns duas a duas, ou agrupar em pares ordenados os elementos de dois conjuntos) traduzem-se em operações sobre números, com propriedades que, precisamente, são estudadas na Aritmética. O estudo destas operações permite substituir em muitos casos a contagem directa avançada de formalização da Aritmética a que nos referiremos mais adiante (essa formalização, como veremos, também lida com as operações lógicas e as relações de «igualdade» e «pertença»). Ao longo de milénios essa questão não foi abordada, pois o uso corrente dos números naturais não depende dessa escolha; analogamente, podemos utilizar os sucessivos números naturais sem que os identiquemos rigorosamente com colecções concretas de objectos construídas no quadro de uma linguagem formalizada. 5 Por exemplo, no sistema de numeração decimal que adoptamos usualmente, devemos, em primeiro lugar, memorizar o símbolo que representa a unidade (ou «número um») e, em seguida, os símbolos que representam as colecções que se obtêm das que «têm um elemento» acrescentando sucessivamente um novo objecto até que se chegue ao que chamamos «nove» e representamos por «9» (a colecção-padrão que explica por que razão paramos neste ponto é, sem dúvida, um conjunto de dedos das duas mãos, na situação em que, acrescentando apenas um, obteríamos a totalidade dos dedos). O símbolo utilizado para as colecções que resultam de acrescentar um objecto a uma colecção com nove elementos (em particular o conjunto dos dedos das duas mãos) é já uma composição de dois símbolos, um deles o da unidade («1»), à direita do qual se introduz o «zero» (representado por «0»); esta notação signica que o símbolo «10» passou a representar as colecções com o mesmo «número de elementos» (já é agora claro o que signica este conceito) que o conjunto dos dedos das duas mãos, distinguindo-se da unidade pelo facto de ter um símbolo à sua direita (neste caso «0», que signica não se ter feito qualquer acrescento a um tal conjunto, que se diz ter «dez» ou «uma dezena de» elementos). Utilizando os nove símbolos introduzidos para as colecções com «menor número de elementos» que os dedos das duas mãos («algarismos») e o símbolo designado por «zero» podemos agora, pela conhecida extensão desta regra, ir representando colecções de objectos sucessivamente com mais elementos, até chegarmos a 99; podemos agora passar a utilizar três símbolos (de entre os algarismos e o zero) e representar colecções com mais objectos e assim sucessivamente sem qualquer limite teórico. Acompanhando este processo, e para facilitar a transmissão de informações quantitativas (nomeadamente por via oral) e a memorização, vai-se estabelecendo um sistema de «nomenclatura» para estas «colecções simbólicas» que se identicam, informalmente, com o que chamamos «números»; diferentes línguas adoptam regras variadas para estas designações, embora com algumas características comuns, estreitamente ligadas ao carácter «decimal» deste sistema de numeração. Em qualquer caso, essas regras permitem, em princípio, designar qualquer número, por maior que seja. 93
GEOMETRIA: DA INTUIÇÃO AO RIGOR
pela aplicação de «regras de cálculo» – os chamados algoritmos; assim, por exemplo, quando se considera um conjunto A obtido por reunião de outros dois (disjuntos), B e C , dos quais se conhece o número de elementos, fica-se dispensado de contar o número de elementos do conjunto A , bastando aplicar regras aritméticas aos números de elementos de B e C (neste caso um algoritmo da soma)6 . Do mesmo modo que invocámos a pastorícia para exemplificar um dos modos primordiais de emergência da Aritmética, podemos indicar a agricultura como actividade ligada ao desenvolvimento da Geometria. A pastorícia permitiu substituir em parte a caça pelo abate de animais domesticados e utilização programada de outros benefícios deles provenientes (como sejam as peles, a lã, os ossos, etc.). A agricultura, analogamente, veio organizar a recolecção de produtos vegetais (tanto para alimento e abrigo dos seres humanos como dos animais entretanto postos ao seu serviço), procedendo a uma verdadeira «domesticação» de algumas dessas plantas; no entanto, enquanto que a actividade de pastorícia era compatível com o nomadismo, havendo mesmo necessidade periódica de procurar novas pastagens, a agricultura tornou-se progressivamente factor de sedentarização, uma vez que os terrenos cultiváveis passaram a poder ser reutilizados, à medida que as técnicas agrícolas se foram apurando. A consequente progressiva apropriação de terrenos por indivíduos ou grupos induziu naturalmente a necessidade de avaliação desses terrenos, em particular da respectiva «medição», conceito mais sofisticado que a simples contagem, embora estreitamente baseado nessa operação; essa «avaliação» não só poderia ter por objecto trocas comerciais, como também estimativas de produtividade, permitindo previsões que se foram tornando essenciais à medida que as sociedades foram atingindo níveis de maior complexidade. Essa tomada de consciência progressiva da dimensão do espaço circundante enquanto factor económico não foi, no entanto, o único incentivo ao estudo da Geometria; outra grandeza cuja medição com algum rigor passou a ser essencial foi o tempo, já que o carácter cíclico das variações climatéricas se tornou num dos factores a ter em conta para o sucesso da actividade agrícola. Para esse efeito pôde-se contar com fenómenos periódicos naturais, em primeiro lugar a sucessão dos dias e das noites, cuja contagem fornece um primeiro modo de medir o tempo, também as fases da Lua que facili6 Voltando ao exemplo da pastorícia, se alguém herdar dois rebanhos de cada um dos quais conhece o número de efectivos, bastará efectuar a soma desses dois números para saber qual o total de cabeças de gado que herdou, sem que tenha de as contar efectivamente; não é difícil imaginar exemplos análogos que ilustrem a aplicação das operações de subtracção, multiplicação e divisão inteira. 94
ANTÓNIO BIVAR
taram o agrupamento dos dias em conjuntos mais extensos naturalmente balizados por esse fenómeno observável nos céus e finalmente, de maneira essencial, o chamado ciclo anual do Sol que regula a sucessão das estações. Este último ciclo pode ser observado de diversas maneiras, nomeadamente na variação diária da altura do Sol acima do horizonte no instante do dia em que se encontra o mais alto possível (o chamado meio-dia)7 , na posição do Sol nascente ou poente no horizonte quando avistado de determinado ponto fixo e ainda, exigindo maior perspicácia, na variação da posição do Sol relativamente ao fundo estelar; a coincidência nos períodos destes três ciclos, em concomitância também com o ciclo das estações do ano, tão essencial para a agricultura, terá naturalmente suscitado a curiosidade humana. A observação dos astros e da esfera celeste aparece assim como essencialmente ligada à contagem do tempo, ao estabelecimento dos calendários e à actividade agrícola; as regularidades observadas foram certamente factores que levaram alguns a procurar estruturar a percepção do espaço de modo que permitisse, por um lado, compreender a necessidade dessas regularidades em função de princípios simples e facilmente aceitáveis por todos, e, por outro, fazer previsões acerca dos movimentos observados dos astros. Essa organização encontrou a sua expressão no desenvolvimento da Geometria, em particular ao serviço da Astronomia; as duas vertentes que até agora identificámos como motivando este ramo do conhecimento acabam por se unir intimamente pois a consideração da esfericidade da Terra e dos movimentos «aparentes» dos astros em relação à Terra conduzem à possibilidade de se efectuar a localização de pontos na superfície terrestre utilizando coordenadas geográficas, cuja determinação se pode fazer em muitos casos recorrendo a observações astronómicas, mediante a utilização de propriedades geométricas. Assim se pode «cartografar» a Terra, actividade essencial para as grandes viagens e descobertas, começando por apurar a cartografia celeste; pode depois utilizar-se essa cartografia terrestre para medir grandes extensões de terreno. Também alguns desenvolvimentos da Geometria, 7 Esta variação da altura do Sol ao meio-dia acompanha a variação da duração do dia (entendido aqui como o período de tempo entre um nascer e um sucessivo ocaso do Sol) e corresponde a uma variação do tempo e modo de exposição da superfície da Terra aos raios solares, nesse local. Quando a altura do Sol é menor ao meio-dia não só a superfície local da Terra ca menos tempo exposta aos raios solares, como o âgulo de incidência dos raios solares com essa superfície (considerada, «em média», horizontal) é menor, ou seja, um mesmo «feixe de raios solares» incide numa área maior, pelo que tem menos capacidade para aquecer essa área (para além de atravessar uma maior extensão da atmosfera). Daí a variação das temperaturas ao longo do ano num mesmo local da Terra e a razão pela qual o ciclo anual do Sol determina o ciclo das estações.
95
GEOMETRIA: DA INTUIÇÃO AO RIGOR
em particular da trigonometria plana, permitem obter processos práticos de medir distâncias à superfície da Terra, base para a medição de áreas nessa superfície. Numa primeira fase, em paralelo em diversas sociedades, ao longo dos tempos foram sendo coligidos diversos conhecimentos empíricos de carácter geométrico, ligados às actividades que acabámos de descrever e também, com importância crescente, ao desenvolvimento técnico, em particular na área da construção. Em alguns meios, no entanto, surgiu a pretensão de estruturar esses conhecimentos de modo que fosse possível mostrar a necessidade lógica da maior parte deles utilizando métodos de raciocínio que parecessem indiscutíveis a partir de determinados pressupostos em número tão reduzido quanto possível (os Axiomas e Postulados8 ) e dotados também de um grau de «evidência» que justificasse de algum modo a respectiva aceitação a priori; na formulação desses pressupostos utilizar-se-iam termos primitivos e relações primitivas entre esses termos, sem prévia definição, mas aos quais se atribuiriam significados intuitivos que justificariam o carácter «evidente» desses Axiomas e Postulados9 . Nesse empreendimento notabilizou-se a civilização grega, a qual bebeu evidentemente em diversas fontes anteriores, nomeadamente em todas as grandes civilizações que a precederam na bacia do Mediterrâneo, como a sumério-babilónica e a egípcia, para citar apenas as mais antigas que se conhecem. A longa História da chamada «axiomatização» da Geometria abarcou mais de vinte e três séculos, tendo conduzido finalmente ao apuramento actual, embora o trabalho da escola de Euclides nessa área, compilado cerca de três séculos antes de Cristo, tenha sido considerado dificilmente aperfeiçoável praticamente até ao século XIX. A situação actual é fruto essencialmente dos trabalhos de diversos matemáticos nascidos 8 Embora na formulação actual das teorias hipotético-dedutivas não haja lugar para distinguir o signicado destes dois termos, tomados habitualmente como sinónimos, no passado designou-se por «axiomas» proposições consideradas evidentes em si mesmas, de alguma maneira transcendendo o quadro de determinada teoria (por exemplo «duas entidades iguais a uma terceira são iguais entre si», «o todo é maior que a parte», exemplos extraídos da lista das «noções comuns» dos Elementos de Euclides), ao passo que os postulados teriam um carácter mais especíco de pontos de partida para determinada Teoria, servindo em parte de caracterização dos respectivos objectos primitivos ou derivados (por exemplo, «todos os ângulos rectos são iguais entre si», o quarto postulado de Euclides). 9 A preocupação de atribuir esses signicados intuitivos levava a introduzir pretensas «denições» desses termos e relações primitivas, mas que não seriam utilizadas no desenvolvimento da teoria, pois, obviamente teria sempre de se partir de algum ponto em que determinados termos e relações não fossem objecto de denição, para que se evitasse uma «regressão ao innito». Assim essas «denições» dos termos e relações primitivas apenas podiam auxiliar a nossa imaginação e permitir uma mais fácil identicação dos objectos materiais que se pretendia em cada caso representar pelos conceitos abstractos utilizados. 96
ANTÓNIO BIVAR
nesse século, culminando na obra de Hilbert10 , mas algumas simplificações notáveis foram obtidas já na segunda metade do século XX, como veremos. No que se segue procuraremos analisar a Geometria em primeiro lugar como organização da nossa percepção do espaço circundante, identificando os conceitos básicos que dessa percepção se podem dissecar tendo em vista uma axiomatização no sentido acima expresso, mas sem perder de vista a componente «física» da qual se parte. Nesse sentido, está pressuposto que dispomos da Aritmética elementar, a qual, como se viu, consiste numa compreensão adequada das operações que conduzem à «contagem» do número de elementos dos conjuntos. Também até ao século XIX não se procurou aplicar à própria fundamentação da Aritmética o método axiomático; os número inteiros eram tomados como entidades conhecidas a priori, com as suas propriedades elementares, sem que se procurasse deduzi-las de princípios mais simples. Em finais do século XIX e ao longo de todo o século XX desenvolveu-se a fundamentação da Matemática de acordo com diferentes escolas de pensamento, algumas das quais preconizaram também uma construção da Aritmética com base numa Teoria dos Conjuntos axiomatizada no quadro de uma linguagem formalizada, a exemplo do que há muito se procurara fazer com a Geometria. Deste modo, os números naturais, tal como todos os objectos matemáticos, passaram a poder ser definidos no quadro dessa linguagem, cujos símbolos e regras primitivas admitem uma interpretação intuitiva que estabelece a ponte entre a Matemática assim formalizada e a utilização prática que dela pode ser feita. A construção rigorosa da Aritmética não necessita, para a respectiva motivação, mais do que as operações de contagem atrás descritas, mas as extensões sucessivas do conceito de número, que podem ser feitas nesse quadro formal, dificilmente se justificariam sem referência prévia, com maior ou menor rigor, à noção geométrica de medida, em particular de medida de segmento, embora do ponto de vista estritamente lógico-formal dispensem essa referência. Com efeito, um processo de medição de objectos de determinada natureza, fixada uma unidade, envolve necessariamente a definição prévia das operações que conduzem a «contar» o número máximo de vezes que a unidade «cabe» no objecto a medir. O paradigma deste tipo de operações pode ser a medida de segmentos ou distância entre pontos; para além de requerer o entendimento do que será um segmento e de quais os critérios para uma utilização prática desse conceito, requer uma prévia definição rigorosa das operações geomé10 Para uma apresentação da Geometria baseada essencialmente na axiomática de Hilbert, cf. [Dionísio, 2004]; cf. também [Hartshorne, 2000], [Hilbert, 1952]. 97
GEOMETRIA: DA INTUIÇÃO AO RIGOR
tricas que podem levar à identificação de segmentos que sejam «múltiplos inteiros» da unidade escolhida (intuitivamente, a «justaposição extremo a extremo» de certo número de cópias do segmento-unidade). Em seguida, verificando-se que é necessário considerar situações em que os múltiplos inteiros da unidade não são suficientes para obter medidas, suficientemente rigorosas para as aplicações, das distâncias a avaliar, surge a necessidade de considerar sub-múltiplos da unidade, o que leva a introduzir as medidas fraccionárias; finalmente, após a descoberta pitagórica, no quadro da Geometria elementar, de segmentos incomensuráveis, tornou-se necessário de algum modo alargar o conceito de medida de segmento de modo a abarcar esses casos. As sucessivas extensões do conceito de número, passando dos naturais para os fraccionários e, finalmente, para os chamados números reais, têm por motivação essencial as necessidades de base geométrica associadas a este conceito de medida, que fundamenta todos os outros11 . Procurando respeitar esta anterioridade empírica da Geometria relativamente às extensões do conceito de número, abordaremos a formalização da Geometria elementar dispensando a prévia construção dos conjuntos de números, para além dos naturais, embora esta possa ser feita sem referência à Geometria, no quadro acima referido de uma formalização da Teoria dos Conjuntos12 . Qual será então o «estatuto» da Geometria como Teoria Matemática, com referência a essa formalização que integra já a Aritmética elementar? Em certo sentido, podemos encarar a Geometria como uma teoria física pretendendo descrever determinados aspectos da nossa inserção no espaço exterior, pressupondo já a Aritmética, a qual, como vimos, pode ser entendida como formalização das operações associadas à contagem no quadro de uma Teoria Axiomática de Conjuntos. Enquanto teoria física inteiramente matematizada, a Geometria consistirá na introdução de determinados objectos primitivos, constituindo um conjunto (ou um conjunto para cada tipo de objectos primitivos, se for o caso), e determinadas relações primitivas entre esses objectos, admitindo-se como Axiomas algumas proposições envolvendo apenas esses objectos e relações primitivas, todas podendo ser expressas na linguagem formal da Teoria dos Conjuntos. Constitui11 Razões de ordem algébrica e também motivadas por aplicações levaram entretanto à introdução dos números negativos. Não teremos necessidade de invocar a extensão aos números complexos. 12 cf. [Ventura Araújo, 1998] para uma apresentação da Geometria com base numa axiomática pressupondo já a teoria dos números reais. Para uma formalização da teoria dos conjuntos cf. [Bourbaki, 1967] e para uma apresentação elementar dos conceitos fundamentais de uma tal formalização cf. [Guerreiro, 2008], [Bivar Weinholtz, 2004]. 98
ANTÓNIO BIVAR
rão a Geometria todas as proposições que puderem ser demonstradas no quadro da referida linguagem formal a partir desse conjunto de Axiomas13 . O carácter físico revela-se na interpretação intuitiva que é feita dos objectos e relações primitivas, conduzindo portanto à possibilidade de atribuir significado material às proposições geométricas, as quais poderão assim ser experimentalmente testadas, legitimando-se desta maneira a Axiomática escolhida, para as utilizações que se considerarem relevantes. Depois de desenvolvida a Geometria deste ponto de vista, torna-se possível procurar encontrar modelos para essa teoria que sejam construídos apenas a partir dos objectos matemáticos introduzidos no quadro formalizado acima referido da Aritmética. Assim, por exemplo, surgindo no quadro da Geometria o conceito de medida de segmento ou de distância entre pontos, o qual leva a construir, com essa motivação geométrica, um sistema algébrico com as propriedades de «corpo ordenado completo» que identificamos com o sistema dos «números reais», podemos depois mostrar que tal sistema é univocamente determinado a menos de «isomorfismo», ou seja, tal estrutura algébrica só admite realizações «identificáveis entre si» através de bijecções (correspondências biunívocas) que 13 Em [Bourbaki, 1967] descreve-se a Matemática como uma linguagem formal constituída por determinados agrupamentos de símbolos («termos» e «relações»); as relações podem envolver variáveis, os símbolos «=» e «∈» e as operações lógicas elementares, que podem ser reduzidas à utilização de dois outros símbolos representando intuitivamente a conjunção e a negação. Além disso, é permitido construir objectos («termos»), a partir de relações contendo variáveis, utilizando um outro modo de alterar agrupamentos de símbolos que traduz a ideia intuitiva de «escolha de um objecto satisfazendo a uma relação» (trata-se da formalização do chamado «símbolo de escolha de Hilbert»); os quanticadores (existencial e universal) podem ser introduzidos já como «abreviaturas» utilizando-se apenas os processos anteriormente referidos. Fixadas algumas relações como Axiomas (traduzindo os pressupostos básicos da Teoria dos Conjuntos), serão Teoremas, para além dos Axiomas, as relações que podem fazer parte do que se chama «sequências demonstrativas» ou, simplesmente, «demonstrações»; trata-se de listas de relações tais que qualquer agrupamento de símbolos pertencente à lista ou é um Axioma, ou um Teorema anteriormente estabelecido, ou é uma relação T para a qual existem anteriormente na lista Teoremas S e R (cada um dos quais poderá ser, em particular, um Axioma) tais que R é exactamente S ⇒ T (utilizando já a abreviatura designada por «implicação» correspondente a determinado agrupamento de símbolos construído a partir de S e T ). «Demonstrar um Teorema» consistirá em vericar que a relação em questão pode fazer parte de uma «sequência demonstrativa». No §7 de [Bivar Weinholtz, 2004] pode encontrar-se uma exposição introdutória destas questões, seguindo essencialmente [Bourbaki, 1967]. Deste ponto de vista, os Axiomas da Geometria podem ser entendidos como Teoremas em qualquer modelo para esta Teoria construído apenas com os recursos da referida linguagem formal que se identica com a Matemática (construir pelo menos um tal modelo, e portanto demonstrar como Teoremas as traduções «concretas» nesse modelo de todos os axiomas da Geometria, é requisito essencial para que esta possa ser considerada consistente, relativamente à Teoria dos Conjuntos); as demonstrações de proposições geométricas serão aceitáveis na medida em que que claro que podem traduzir-se em demonstrações de Teoremas, no sentido acima referido, em qualquer modelo que se xe para a Geometria. 99
GEOMETRIA: DA INTUIÇÃO AO RIGOR
respeitam as operações e a relação de ordem. Finalmente, podemos construir explicitamente um tal corpo no quadro da Aritmética (os objectos serão obtidos do conjunto dos números naturais por utilização apenas das operações permitidas na Teoria formalizada dos conjuntos), e a partir dele elaborar um modelo para a própria Geometria, ou seja, definir explicitamente um conjunto de objectos e relações respeitando a Axiomática da Geometria. Em certo sentido mostra-se, portanto, que os objectos e relações cuja existência e propriedades somos levados a postular com o objectivo de representar alguns aspectos da nossa percepção da realidade exterior podem, efectivamente, ser construídos apenas com base nos objectos mais primitivos que são os números naturais, no quadro ainda mais primitivo da Teoria dos Conjuntos; ou seja, a Geometria assim entendida é inteiramente «aritmetizável». Uma Axiomática da Geometria pode, deste modo, ser interpretada como uma lista de «requisitos mínimos» a que devem satisfazer determinados objectos e relações primitivas para servirem o propósito de representarem alguns aspectos da nossa percepção do espaço físico. A partir dessa «lista» podemos deduzir um conjunto de proposições (Teoremas) que constituem a parte da Geometria que nos interessa para determinado objectivo, sendo depois possível mostar que esses requisitos são cumpridos com uma escolha adequada dos objectos e relações, definidos no quadro da Teoria dos Conjuntos, utilizando já a Aritmética elementar.
3.2 ANÁLISE DE CONCEITOS EMPÍRICOS MOTIVADORES DOS OBJECTOS E RELAÇÕES BÁSICAS DA GEOMETRIA Comecemos por reflectir acerca de alguns termos que utilizamos para exprimir aspectos da nossa inserção no espaço circundante e da inserção nesse mesmo espaço dos objectos que individualizamos: «perto», «longe», «grande», «pequeno». Os dois primeiros termos exprimem a convicção de alguma facilidade («perto») ou dificuldade («longe») de «atingir» determinada região circunscrita («Sintra é perto de Lisboa, mas Bragança é longe…», «moro perto do emprego», etc.) e os dois últimos referem-se ao espaço ocupado por determinado objecto, o qual excede («grande») ou, pelo contrário, não atinge («pequeno») determinado padrão que em cada caso fixamos explícita ou implicitamente («Portugal é um pequeno país», «O Sol é muito grande», «este lápis é pequeno», «esta sala de aula é grande»). Como é fácil reconhecer, afirmações como as atrás reproduzidas, utilizando os referidos termos, poderiam ser facilmente contestadas, uma vez que a respectiva 100
ANTÓNIO BIVAR
validade depende de pressupostos não explícitos, o que lhes confere o carácter habitualmente designado por «subjectivo». Consideremos agora frases como «Sintra é mais perto de Lisboa que Bragança», «a sala de aula é mais pequena que o pátio», «o lápis azul é maior que o verde» ; embora ainda haja alguma margem para dúvida quanto à validade destas afirmações (seria necessário clarificar ou considerar clarificado no contexto da «conversa» o significado exacto respectivamente de «mais perto», «mais pequeno» e «maior»), torna-se mais fácil agora presumir que se poderá chegar a uma convicção generalizada acerca dessa mesma validade. Com efeito, podemos imaginar processos «objectivos» para verificar cada uma daquelas afirmações, ou seja, actividades em princípio repetíveis por quem o desejar, desde que esteja dotado de meios adequados. Procuremos identificar situações em que seja particularmente simples determinar a «grandeza relativa» de dois objectos; se em determinado objecto distinguirmos partes, qualquer que seja o sentido a atribuir à «grandeza», o uso comum que fazemos das palavras implica que qualquer dessas partes será considerada «mais pequena» que o objecto no seu conjunto14 . Os objectos podem ser-nos revelados através dos sentidos; em particular a visão e o tacto permitem-nos isolar objectos, de acordo com determinada organização das nossas percepções, e, em determinado objecto, isolar partes que podemos considerar como novos objectos, «mais pequenos» que o inicial. As limitações dos nossos sentidos levam a que em determinados objectos (que podem ser partes de outros, por definição «maiores») não consigamos distinguir novas partes; diremos que tais objectos ocupam um ponto do espaço15 . O sinal deixado por um lápis afiado num papel ou a picada de uma agulha num dedo podem constituir exemplos, utilizando respectivamente a visão e o tacto, de «pontos», no sentido referido. O modo como conhecemos a realidade inclui a capacidade de «abstracção», ou seja, de atribuir características comuns a entidades distintas, como a atrás referida de, utilizando os nossos sentidos, não conseguirmos neles distinguir partes; os objectos com essa característica têm em comum o carácter «pontual», ou seja, são realizações de uma primeira ideia de «ponto», que é, assim, já uma abstracção. O facto de podermos distinguir diversos objectos pontuais permite-nos aceder ao conceito, também abstraído das nossas experiências, de «posição» ou «localização» de um 14 Era esta a quinta «noção comum» de Euclides («O todo é maior que a parte»). 15 A primeira frase dos Elementos de Euclides é exactamente a «denição de ponto» como «aquilo que não tem partes». 101
GEOMETRIA: DA INTUIÇÃO AO RIGOR
ponto no espaço. Podemos depois questionar a dependência em que estas noções ficam da acuidade dos nossos sentidos; um ponto a lápis num papel, se observado à lupa deixa de ser «pontual», pois passa a ser possível nele distinguir partes. Um «ponto» marcado no papel, enquanto o observamos à lupa, pode deixar também de ser um ponto quando visto ao microscópio, e assim por diante; passo seguinte na abstracção será imaginar um objecto que continue «pontual» (sem partes distinguíveis) qualquer que seja a capacidade do instrumento que se utilize para melhorar a eficácia da nossa percepção. Sabemos à partida como é irrealista admitir que há uma capacidade indefinida para obter esse resultado, mas nada nos impede de prosseguir essa ficção, utilizando o termo «ponto» para designar esses objectos imaginários a que atribuímos características inspiradas nos «objectos pontuais» que nos são revelados pelos sentidos, auxiliados ou não por instrumentos adequados a cada situação; podemos considerar estes pontos como termos (ditos primitivos) de uma nova linguagem que constituirá precisamente a Geometria e que será construída com base em termos primitivos como este, e em noções (também ditas primitivas) relacionando os termos primitivos, de acordo com regras inspiradas em observações como as que fizemos até agora. Podemos distinguir assim os pontos geométricos (termos primitivos da linguagem que designamos por Geometria) dos pontos «físicos», «espaços ocupados pelos objectos considerados pontuais»; para designar os pontos (geométricos ou físicos, conforme o contexto) podemos utilizar letras maiúsculas do nosso alfabeto, afectadas ou não de outros sinais ou «índices» correntemente utilizados na escrita (A, X , P, Q 3 , D ′ , M ∗ , . . .) Deste modo podemos considerar que o espaço que nos rodeia é constituído por pontos, cada um dos quais se pode identificar com a posição de um objecto pontual; essa posição pode assim ser materializada por um tal objecto, como os sentidos o podem revelar. Quanto aos pontos geométricos constituirão um conjunto, cuja existência postulamos, e que designaremos por espaço geométrico, ou espaço da geometria elementar (que poderá ser designado simplesmente por espaço quando não houver perigo de confusão); à posição ocupada por um objecto em certo instante corresponderá determinado conjunto de pontos do espaço geométrico, que designaremos por figura geométrica. Um objecto opaco A poderá impedir que consigamos ver uma parte do espaço, ou seja, poderá ocultar uma parte do nosso campo de visão e se interpusermos entre esse objecto e o nosso olhar um segundo objecto opaco B que vede completamente a vista de A , é também claro que os objectos ocultados por A são 102
ANTÓNIO BIVAR
também ocultados por B . Diremos que A e B estão na mesma direcção, assim como todos os objectos ocultados por A ou que ocultem A da nossa vista; notemos que esta noção corrente depende essencialmente da posição dos nossos olhos, mas uma vez fixado um objecto A que consigamos observar distintamente (cerrar um dos olhos pode ajudar, se o objecto estiver muito próximo. . .), fica perfeitamente definida a direcção de A – consideraremos que estão na direcção de A exactamente os objectos que, ou ocultem inteiramente A (tais objectos estarão então mais próximos de nós que A ), ou forem ocultados por A (tais objectos estarão mais distantes de nós que A )16 . A direcção de um objecto A , nesta acepção, pode portanto identificar-se com um conjunto de objectos, dependente de A e do nosso olhar, ou, mais abstractamente, com um conjunto de posições susceptíveis de serem ocupadas por objectos nas referidas condições; se A for objecto pontual e apenas considerarmos como estando na direcção de A objectos pontuais, obteremos um conceito mais estrito de direcção, o qual continua associado também ao conceito de maior ou menor proximidade ao nosso olhar. Adoptando a partir de agora esse sentido mais estrito, podemos considerar a figura geométrica que deverá corresponder ao conjunto de pontos com a direcção de A ; fixado um ponto (geométrico) O que associamos à posição do nosso olhar, nela incluiremos o ponto que associamos ao objecto pontual A que define, com o nosso olhar, a referida direcção e todos os pontos que podemos associar a objectos pontuais «na direcção de A », ou seja, susceptíveis de ocultarem A ou de serem ocultados por A . Designa-se tal figura por semirecta de origem O passando por A (usando a mesma letra para designar o objecto A e o ponto geométrico a ele associado), ◦ a qual podemos representar por OA ; por enquanto semirecta é apenas mais um termo a definir no quadro da Geometria, designando certo tipo de figura geométrica (conjunto de pontos) para cuja interpretação intuitiva concorre a noção de interposição com ocultação. Se pretendermos caracterizar as figuras que designamos por semirectas utilizando estas sugestões, deveremos então introduzir na linguagem da Geometria um conceito primitivo que traduza esta noção de «interposição com ocultação»; se um objecto pontual B se interpuzer entre o nosso olhar (associado ao ponto O ) e um objecto pontual A por nós avistado, será natural dizer dos pontos correspondentes B , O , A , que B se situa entre O e A , na mesma direcção. Podemos então introduzir no espaço da Geometria elementar uma relação 16 Como se percebe pela denição adoptada, utilizamos aqui o termo direcção na acepção da linguagem corrente, a qual pressupõe também o «sentido». 103
GEOMETRIA: DA INTUIÇÃO AO RIGOR
FIGURA 3.1
envolvendo trios de pontos que se designará abreviadamente por «relação situado entre» (estando implícita a ideia de direcção, motivada pela «ocultação por interposição»); dado um trio de pontos (O, P,Q)17 que estejam nessa relação, diremos que «P está situado entre O e Q », ou, mais simplesmente, «P está entre O e Q » o que se representará abreviadamente por O − P −Q . A Geometria envolve portanto, para já, o conceito primitivo de ponto, designando-se por espaço (Geométrico) o conjunto de todos os pontos, e a relação primitiva entre trios de pontos que se designa por relação situado entre; naturalmente designaremos agora por semirecta uma figura geométrica (conjunto de pontos) associada a um par (O, A) de pontos distintos e constituída por todos os pontos B distintos de O tais que, ◦ ou B está entre O e A , ou A está entre O e B 18 ; O dir-se-á origem da semirecta OA e ◦ diremos que a semirecta OA passa por cada ponto a ela pertencente. Deste modo, semirecta passa a ser uma abreviatura para designar um tipo particular de figura geométrica, agora claramente definido; para que se possa continuar a estruturar a Geometria, com intenção de estudar alguns aspectos da realidade como os que destacámos no início do texto, será agora necessário enunciar propriedades envolvendo os pontos e a relação primitiva que acabámos de introduzir, de modo a traduzir tão fielmente quanto possível observações como as que até agora nos conduziram. Tais propriedades, que podem envolver noções previamente definidas a partir dos termos e noções primitivas (como, por exemplo, a de semirecta que acabámos de referir), designam-se por Axiomas e teremos como objectivo delas conseguir deduzir propriedades significativas de figuras geométricas, 17 Na noção de «trio» ou «terno» aqui utilizada e simbolizada na notação (P,Q, R), com o uso de parênteses, está implícita a noção de ordem, ou seja, distinguimos dois trios não apenas pelo conjunto de pontos envolvidos, mas também pela ordem pela qual aparecem no trio; assim sendo, «trio» não determina completamente o número de pontos, sabendo-se apenas que serão um, dois ou três, designados por determinada ordem, em primeira, segunda e terceira posição. 18 Tomaremos a relação «situado entre» em sentido lato, de modo que da Axiomática a adoptar se poderá ◦ deduzir, em particular, que O − A − A , pelo que, da denição dada, já resultará que A está em OA , sem que seja necessário explicitá-lo. 104
ANTÓNIO BIVAR
que nos permitam lidar com determinados problemas do nosso relacionamento com a realidade circundante; a natureza desses problemas é sugerida por algumas das questões com que iniciámos este texto e ir-se-á tornando mais precisa à medida que formos avançando na construção da Geometria. Exemplo de propriedade que associamos imediatamente ao conceito de direcção, tal como foi atrás analisado, é a seguinte: «a posição do nosso olhar e um ponto por nós avistado determinam uma direcção»; será natural associar-lhe o seguinte enunciado geométrico (ou seja, na linguagem da Geometria): «Dados dois pontos O e A existe uma semirecta e uma só com origem O e passando por A »19 . Neste enunciado, na abordagem que até agora adoptámos da Geometria, a primeira afirmação («existência»), desde que seja previamente demonstrada a relação O − A − A , resultará ◦ imediatamente da definição da semirecta OA , uma vez que esta foi definida de modo unívoco como o conjunto dos pontos P tais que O − P − A ou O − A − P . ◦ Restará depois provar que qualquer outra semirecta de origem O , seja ela O B , e contendo A («passando por A ») coincide com OA , ou seja, da hipótese O − A − B ◦ ou O − B − A temos de deduzir que o conjunto dos pontos de OA coincide com o ◦ conjunto dos pontos de O B 20 . A demonstração desta proposição, bem como do facto intuitivo de existir origem única para cada semirecta, depende dos axiomas a adoptar para a construção da Geometria. Notemos também, que a relação «situado entre» já permite dar sentido preciso a expressões como «mais próximo» ou «mais distante», pelo menos no caso de determinados pontos: se O − P − Q e P ̸= Q diremos que «Q está mais distante de O que P » ou outra frase equivalente, utilizando o significado usual de «mais próximo». De entre os conceitos básicos indispensáveis a algumas das actividades que na secção anterior identificámos como motivadoras do estudo da Geometria, sobressai, para além dos que até agora identificámos, o de ângulo. Ao observar19 Muitas vezes em enunciados como este escreve-se «dois pontos distintos», reforçando a ideia de que se trata mesmo de dois pontos e não, eventualmente, de um só ponto com duas designações alternativas. Com efeito, por vezes convenciona-se que frases como «dados dois pontos A, B » constituem abusos de linguagem, querendo signicar apenas «designando por A, B dois pontos ou um mesmo ponto»; por enquanto não adoptaremos esta convenção pelo que, ao enumerarmos objectos matemáticos indicando quantos são, não será necessário precisar que são «distintos». Por comodidade, no entanto, admitiremos utilizar o plural mesmo que o conjunto de objectos a que nos referimos possa ter apenas um elemento; poderemos dizer «Se os pontos A, B . . .», mesmo que admitamos a hipótese de ser A = B , uma vez que, neste caso, não referimos qual o número de pontos envolvidos. Repare-se na distinção relativamente ao que se escreveu em nota anterior, relativamente a trios (ordenados) de pontos e que poderia também aplicar-se a pares (ordenados). 20 Ou seja, que são equivalentes as armações, para qualquer ponto X , «O −A −X ou O −X −A » e «O −B −X ou O − X − B ». 105
GEOMETRIA: DA INTUIÇÃO AO RIGOR
mos objectos distantes (os astros, por exemplo), sem meios para distinguirmos se estão mais ou menos afastados de nós, todos aparentam situar-se à mesma distância, ou seja, situados no que chamamos uma superfície esférica, centrada no olhar do observador. Assim, a posição de cada objecto nessa esfera aparente (a «esfera celeste») fica determinada pela direcção emanando do nosso olhar e dirigida para esse objecto, ou seja pelo que designámos por semirecta, neste caso com origem no nosso olhar situado num ponto O e determinada, além disso, pela posição A do referido objecto, que consideraremos «pontual»; dois objectos situados em pontos A e B , nesta situação, determinarão com a posição O do nosso olhar aquilo que chamamos um ângulo, o qual pode identificar-se com o con◦ ◦ junto constituído pelas semirectas OA e O B (habitualmente designadas por la◦ ◦ dos do ângulo ∠AO B = {OA, O B }). Para um estudo geométrico destes objectos celestes, constituindo a Astronomia dita «de posição», serão assim primordiais as propriedades dos ângulos e a respectiva «medida». Do mesmo modo, as relações entre «medidas de amplitude de ângulos» e «medidas de comprimento de segmentos» serão instrumentos essenciais para a determinação de distâncias, em particular para a cartografia e a medição de terrenos, uma vez que a medição directa de ângulos é tarefa muito mais facilmente exequível que a medição directa de distâncias, como é fácil perceber21 .
FIGURA 3.2
Até agora conduzimos as nossas observações sem necessidade de levar em 21 Sendo um ângulo determinado por um par de semirectas com origem comum, a respectiva «amplitude» não poderá depender duma escolha particular de pontos em cada semirecta, pelo que facilmente se compreende que se poderão escolher para o efeito pontos tão acessíveis quanto nos for conveniente para efectuar a respectiva medição, xado um ângulo-unidade. Já a medida directa do comprimento de um segmento pressupõe, em princípio, o acesso aos extremos desse segmento, os quais poderão ser-nos inacessíveis ou dicilmente acessíveis (cf. gura 3.2). 106
ANTÓNIO BIVAR
conta o movimento, ou seja, procurámos dissecar algumas noções em que podemos considerar apenas o que se observa num instante fixo; é óbvio, no entanto, que o conhecimento que adquirimos da realidade depende de modo fundamental da passagem do tempo e dos movimentos que efectuamos e que observamos. Admitir que determinado objecto se move pressupõe que conseguimos identificar esse mesmo objecto ao longo de um intervalo de tempo, ainda que se altere de alguma maneira a respectiva «posição», «forma», «tamanho» ou outra característica sensível, ou seja, ainda que, em particular, as figuras geométricas (conjuntos de pontos) que associamos a esse objecto variem ao longo do tempo; é o que se passa, em particular, com o nosso próprio corpo. A determinados objectos, no entanto, atribuímos características de «fixidez», que resultam da nossa experiência anterior e do uso que pretendemos deles fazer; conseguimos por vezes manter inalterada determinada vista, forçando o olhar a manter-se dirigido para determinados objectos (uma montanha ou um prédio, por exemplo), enquanto outros objectos se podem intrometer no nosso campo de visão, ocultando aspectos dessa vista «fixa» e, eventualmente, voltando a descobri-los. Utilizando esses cenários considerados «fixos» (em determinado intervalo de tempo) podemos depois identificar determinados objectos que, embora deslocando-se, podem facilmente voltar a ocupar sensivelmente a mesma porção do nosso campo de visão que já haviam ocupado anteriormente; para outros, pelo contrário, alteram-se significativamente as porções do cenário que ocultam, mesmo voltando a passar em zonas vizinhas. Conseguimos, com um lápis, por exemplo, voltar a tapar diversas vezes a vista da mesma porção exacta de uma paisagem («truque» por vezes utilizado pelos artistas plásticos22 ), mas teremos dificuldade em obter o mesmo resultado com uma bandeira desfraldada ao vento; a acumulação de experiências visuais e tácteis (e de todos os sentidos em geral) permite-nos distinguir, deste modo, objectos que consideramos «rígidos» ou «indeformáveis», embora tenhamos a noção, mais uma vez, de que estes conceitos são «ideais» e que só os limites das nossas capacidades nos impedem de distinguir em muitos casos algumas das alterações que, de facto, ocorrem ao longo do tempo. O espaço ocupado por um objecto «rígido» em movimento corresponde, em cada instante, 22 Notemos que, neste exemplo, podemos tapar sensivelmente a mesma porção de «paisagem xa» utilizando lápis de comprimentos distintos, os quais podemos afastar mais ou menos do nosso olhar de modo a obter esse efeito; assim a característica de «rigidez» ou «indeformabilidade» de um objecto necessitará em geral que se acumulem diversas experiências ou que se faça apelo a experiências passadas, envolvendo também em particular, o conhecimento do comportamento do nosso próprio corpo a este respeito. 107
GEOMETRIA: DA INTUIÇÃO AO RIGOR
a uma figura geométrica; as figuras geométricas assim obtidas têm em comum o que designaremos por «forma e tamanho»23 . Duas figuras com a mesma «forma e tamanho» dir-se-ão congruentes, ou geometricamente iguais, o que poderia ser uma nova noção indefinida da Geometria, mas não necessitaremos de introduzir este conceito de âmbito tão geral como relação primitiva. Retomando a análise das semirectas, que atrás associámos ao conceito de direcção visual, podemos agora considerar objectos rígidos ocupando porções de semirectas; em particular podemos considerar um par de pontos (A, B )24 , que designaremos por segmento de recta e representaremos por AB , e a porção de semi-recta constituída pelos pontos situados entre A e B , a qual designaremos por conjunto dos pontos do segmento de recta (ou simplesmente do segmento) AB ou de extremos A , B . A, B designam-se precisamente por extremos – respec• tivamente esquerdo e direito – do segmento A B 25 e representaremos por AB o conjunto dos pontos de A B ; por abuso de linguagem, também diremos que os • pontos de A B «estão no segmento A B ». Supondo que A se situa entre O e B visualmente (para um olhar situado em O dirigido para A ), por exemplo, tal segmento «ocupará», da porção de espaço ocultada por um objecto pontual situado em A , a parte que sobra quando se exclui a porção de espaço ocultada por um objecto pontual situado em B ; podemos materializar tal objecto utilizando um fio esticado, um arame ou um lápis «muito fino» dos quais «desprezemos» a «espessura» (no sentido em que podemos visualizá-los, em posição adequada, como um objecto considerado pontual). Um teste visual (e eventualmente táctil) simples permite verificar se os pontos do objecto, em determinada posição, estão de facto todos, sensivelmente, «na mesma direcção entre A e B »; tratando-se de objecto considerado «rígido», após qualquer movimento ocupará sempre porções do espaço mutuamente congruentes ou geometricamente iguais («com a mesma 23 Ao utilizarmos os dois termos «forma» e «tamanho», em lugar de apenas referirmos que a forma se mantém inalterada (o que seria mais coerente com o uso corrente da expressão «indeformável», habitualmente considerada sinónima de «rígido»), estamos a abrir caminho a uma futura utilização do termo «forma» que permita considerar guras «com a mesma forma mas tamanhos diferentes», traduzindo, por exemplo, a ideia comum de que uma fotograa e a respectiva amplição têm a mesma «forma», ou de que os quadrados têm todos a mesma «forma». Por enquanto podemos tomar a expressão «forma e tamanho» como um bloco, sem que se faça para já uso separado das duas expressões. ◦
24 Podem ser sempre considerados como pontos de uma semirecta OA (com origem no nosso olhar adequadamente posicionado). 25 Fica ainda por analisar a questão de saber se o conjunto {A, B } dos extremos de cada segmento ca determinado pelo respectivo conjunto de pontos; prova-se que a resposta é positiva, como seria de esperar.
108
ANTÓNIO BIVAR
forma e tamanho»). A experiência que temos de lidar com objectos como estes permite-nos identificar porções de objectos materiais que correspondem a figuras geométricas congruentes com um segmento de recta delimitado numa direcção visual ou com o respectivo conjunto de pontos; podemos assim identificar objectos correspondentes ao conjunto dos pontos de um segmento A B (objectos «rectilíneos»), mesmo que A B não esteja contido numa semirecta determinada pelo nosso olhar. Por outras palavras, a experiência acumulada dos objectos que consideramos indeformáveis permite-nos identificar o carácter rectilíneo, mesmo em objectos cujos pontos não se situam em determinado instante na mesma direcção visual. Note-se que as definições dadas abarcam a situação em que A e B designam o mesmo ponto em lugar de corresponderem a dois pontos; admite-se assim AA como segmento (trata-se do par (A, A)), o qual, como veremos adiante, tem {A} como conjunto de pontos; diremos que se trata de segmento degenerado. Os segmentos de recta constituem objectos geométricos fundamentais, em particular pela relação simples que têm com a noção de «distância relativa»; pelo que acima se viu, dados três pontos P,Q, R tais que P − Q − R podemos agora, por um lado, exprimir esta relação dizendo que «Q está no segmento de extremos P, R » e, por outro, afirmar que «Q está mais próximo de P que R ». Notemos que a primeira afirmação, atendendo à hipótese feita acerca dos pontos, resulta imediatamente da definição de conjunto dos pontos de um segmento, ao passo que a outra é apenas uma tradução do uso que habitualmente fazemos do termo «mais próximo» e da motivação heurística da relação «situado entre». Para que uma afirmação como a segunda atrás considerada possa ser objecto de estudo da Geometria, torna-se neste momento útil admitir como noção primitiva geométrica a relação de congruência de segmentos; ou seja, a linguagem da Geometria admitirá uma nova noção primitiva que se aplica a pares de segmentos de recta. Inspirados no uso que fazemos da noção de proximidade, pelo menos para pontos na mesma direcção visual (um ponto que oculta outro da nossa vista está mais próximo do nosso olhar do que o ponto ocultado. . .), podemos identificar a noção de congruência com a de «equidistância» que se aplica a pares de segmentos quando utilizamos a linguagem dos «pares de pontos»; em lugar de dizermos que o segmento A B é congruente com o segmento C D diremos que os pares de pontos (A, B ) e (C , D) são equidistantes. Deste modo o «tamanho» de um segmento identificar-se-á com a «distância» entre os respectivos extremos; utilizaremos a abreviatura AB ≡ C D para indicar que o segmento A B é congruente com o segmento 109
GEOMETRIA: DA INTUIÇÃO AO RIGOR
C D (ou seja, que o par de pontos (A, B ) é equidistante do par de pontos (C , D)). A
relação de congruência de segmentos conduz assim, naturalmente, às noções de distância e comprimento relativos, pois considerações anteriores sugerem-nos a introdução do conceito de menor e maior distância (para pares de pontos (A, B ) e (C , D)), ou, de modo equivalente, maior e menor comprimento (utilizando a linguagem dos segmentos); para três pontos O, P,Q tais que O − P −Q , diremos que o segmento OP tem comprimento menor que o segmento OQ (e o segmento OQ comprimento maior que o segmento OP 26 ), ou as afirmações correspondentes para distâncias entre pontos, de acordo com a linguagem corrente e no sentido lato (ou seja, incluindo a hipótese de igualdade). Para segmentos A B , C D quaisquer, podemos recorrer à relação de congruência e reduzir-nos à situação anterior, dizendo que A B tem comprimento menor que C D (ou, de modo abreviado, A B é menor que C D ) se existirem pontos O, P,Q nas condições anteriores tais que A B é congruente com OP e C D é congruente com OQ ; a possibilidade de comparar os comprimentos de quaisquer dois segmentes exigirá a adopção de axiomas adequados envolvendo as noções de congruência e «situado entre». Para uso futuro, convém notar que esta noção primitiva de «congruência» ou «equidistância» apenas faz intervir no máximo quatro pontos, o que é mais directamente traduzido pelo termo «equidistância». A expressão «congruência de segmentos» explica-se pelo facto de relacionarmos intuitivamente esta noção com a ideia, ainda não formalizada, de congruência de dois «conjuntos de pontos de segmentos», a qual faria naturalmente intervir não só os extremos mas também os restantes pontos desses conjuntos. Expliquemo-nos: para testar a equidistância de dois pares de pontos que materializem estes conceitos abstractos bastaria deslocar um objecto rígido qualquer no qual identificássemos dois objectos pontuais que se fariam coincidir em momentos diferentes com cada um dos dois pares de pontos; tal objecto não teria de conter partes identificáveis com todos os restantes pontos dos segmentos-conjuntos determinados pelos pares considerados. Por exemplo, tal objecto poderia ser um «compasso» com os braços fixos e as pontas afastadas exactamente de modo a poderem fazer-se coincidir com cada um dos pontos de um dos pares; não precisaria de ser uma «régua» com duas «marcas» «à distância» dos pontos em cada par. No entanto, esperamos vir a concluir que a equidistância dos pares de extremos de dois segmentos A B e C D •
•
26 Prova-se que se O − P − Q então OP ⊂ OQ , pelo que este conceito pode ainda ser considerado como «caso particular» da noção comum de Euclides segundo a qual «o todo é maior que a parte».
110
ANTÓNIO BIVAR
venha a arrastar a possibilidade de estabelecer uma correspondência biunívoca • • entre os pontos de A B e C D de modo que pares de pontos em correspondência também sejam equidistantes; é essa a noção mais directamente associada à expressão «congruência de segmentos». Essa ideia intuitiva não é, no entanto, pressuposta, mas será já um resultado demonstrável no quadro da Geometria; fixemos para já uma definição que generalize naturalmente a que utilizámos nesta • • análise no caso dos conjuntos A B e C D . Duas figuras geométricas (conjuntos de pontos) A e B dizem-se congruentes se existir uma bijecção T de A sobre B (correspondência biunívoca entre A e B ) tal que os pares de pontos (A, A ′ ) e (T (A), T (A ′ )) são equidistantes para quaisquer A, A ′ ∈ A . Esta bijecção relaciona-se de alguma maneira com a ideia intuitiva de podermos deslocar um objecto rígido de modo a que os respectivos «pontos» ocupem sucessivamente as posições descritas pelas figuras A e B e, portanto, com a noção heurística acima sugerida de congruência ou igualdade geométrica. No entanto, não há equivalência entre as duas noções, admitindo já uma matematização adequada do conceito físico de deslocamento rígido, pois a imagem reflectida num espelho plano de uma figura geométrica no espaço tridimensional pode não ser sobreponível por deslocamento com a figura original (basta pensar nas nossas mãos direita e esquerda. . .), embora tal imagem materialize uma bijecção que determina a congruência da figura e da sua imagem reflectida, no sentido preciso acima indicado. Contudo, prova-se que A e B são congruentes sse existir um deslocamento rígido, seguido ou não de uma «reflexão relativamente a um espelho plano pré-fixado», que permita obter A de B ; assim é possível reduzir a congruência de figuras em geral à equidistância de pares de pontos (ou seja, à «congruência de segmentos», mas não identificando à partida um segmento A B • com o respectivo «conjunto de pontos» A B ), desde que alarguemos o conceito de modo a incluir a possibilidade de «reflexão por espelhos planos», para além dos deslocamentos rígidos27 . Analisemos esta noção para o caso de figuras constituídas por um número finito de pontos; a existência da bijecção implica, obviamente, que A e B só poderão ser congruentes se tiverem o mesmo número de elementos. Se esse número for igual a 1, ou seja se, por exemplo, A = {A} e B = {B }, a congruência das duas figuras será equivalente à relação AA ≡ B B , o que, como veremos, resultará 27 Para guras contidas num plano não é necessária a intervenção das reexões, desde que se admitam movimentos rígidos no espaço tridimensional. 111
GEOMETRIA: DA INTUIÇÃO AO RIGOR
da Axiomática a adoptar (portanto, figuras com um só ponto são sempre congruentes); se for igual a 2, A = {A 1 , A 2 } e B = {B 1 , B 2 }, identificando pelo mesmo índice pontos em correspondência pela bijecção definidora da congruência das figuras, teremos esta relação traduzida por A 1 A 1 ≡ B 1 B 1 , A 2 A 2 ≡ B 2 B 2 , A 1 A 2 ≡ B 1 B 2 , A 2 A 1 ≡ B 2 B 1 . Adiantando já a ideia de que as duas primeiras relações serão consequência universal dos axiomas a adoptar e de que as duas últimas serão equivalentes também em virtude desses mesmos axiomas, restaria apenas uma destas duas últimas como relação equivalente à congruência destas figuras com dois pontos (ou seja, tais figuras serão congruentes sse corresponderem a segmentos congruentes, obtidos por uma ordenação arbitrárias dos pontos em cada figura); analogamente, para a congruência de figuras com três pontos («triângulos») A = {A 1 , A 2 , A 3 } e B = {B 1 , B 2 , B 3 } bastaria verificar três relações de equidistância, por exemplo, A 1 A 2 ≡ B 1 B 2 , A 1 A 3 ≡ B 1 B 3 , A 2 A 3 ≡ B 2 B 3 . Por outras palavras, a «rigidez» de um triângulo «material», ou seja, a invariância das distâncias mútuas entre os repectivos pontos, traduz-se na invariância dos «comprimentos» dos respectivos lados; note-se que se pensarmos agora em quatro pontos, ou seja, em «quadriláteros», A = {A 1 , A 2 , A 3 , A 4 } e B = {B 1 , B 2 , B 3 , B 4 }, a definição de con gruência já implicará a verificação de, em geral, 42 = 6 relações de equidistância entre pares de pontos, ou seja, não bastará considerar as «congruências dos quatro lados dos quadriláteros» se designarmos por «lados» os segmentos determinados por pares de pontos com a mesma letra e índices consecutivos ou iguais a 4 e 1. Por outras palavras, dois quadriláteros com lados respectivamente «iguais» podem não corresponder a um mesmo «objecto rígido», ao contrário de dois triângulos28 !
3.3 DA AXIOMÁTICA DE EUCLIDES À AXIOMÁTICA DE TARSKI. AXIOMAS DA GEOMETRIA ABSOLUTA E ADIMENSIONAL ELEMENTAR Neste momento é conveniente fazer o ponto de situação relativamente às noções primitivas introduzidas na linguagem a que chamámos Geometria; a abordagem 28 Mais geralmente para n ≥ 4, dados n pontos P1 , . . . , Pn , a «linha poligonal fechada» determinada por estes pontos assim ordenados pode ser denida como a união dos segmentos Pi Pi +1 (i = 1, . . . , n − 1) e do segmento Pn P1 (lados da linha poligonal); duas linhas poligonais com os n lados correspondentes congruentes podem não ser congruentes, uma vez que podem não ser equidistantes os restantes pares de vértices correspondentes que se podem considerar (os segmentos que esses pares de vértices determinam designam-se por diagonais das respectivas linhas poligonais). 112
ANTÓNIO BIVAR
FIGURA 3.3
heurística que desenvolvemos sugere a adopção de axiomas que traduzam aspectos do comportamento intuitivo dos objectos pontuais que tomámos como inspiração para os termos primitivos da Geometria, designados por pontos. Examinemos a solução encontrada por Euclides, cerca de três séculos antes de Cristo, coligindo e completando trabalhos anteriores desenvolvidos já pelo menos ao longo de dois séculos. A famosa obra «Os Elementos» começa com algumas definições dos termos empregues na formulação dos postulados e «noções comuns» (também designadas por axiomas); como já referimos, algumas dessas definições não desempenham qualquer papel no desenvolvimento lógico da Geometria, mas dão-nos indicações acerca da motivação empírica da construção hipotético-dedutiva que é desenvolvida nessa obra. Outras introduzem abreviaturas de noções construídas a partir de algumas que podem ser tomadas como primitivas; examinemos alguns exemplos. A primeira frase dos elementos de Euclides, como acima foi lembrado, consiste na definição de ponto como aquilo «que não tem partes», o que se coaduna perfeitamente com a motivação que encontrámos para a escolha deste termo como primitivo numa Axiomática da Geometria; outra definição é a de linha recta (o que hoje designaríamos por segmento de recta, como fica claro da utilização que é feita da expressão ao longo da obra) como uma linha «que assenta igualmente nos seus pontos». Alguns autores interpretam «os seus pontos» como sendo os extremos do segmento, podendo então admitir-se que esta definição relativamente obscura possa relacionar-se (alterando a tradução que é habitualmente feita do original grego) com a ideia de identificar a «rectilinearidade» com o «alinhamento» visual dos pontos do segmento com os respectivos extremos, no sentido analisado na secção anterior, ou seja, utilizando uma ideia intuitiva e «experimental» de «ponto situado entre os extremos», no sentido de «ocultar um extremo do olhar de um observador situado no outro extremo»; 113
GEOMETRIA: DA INTUIÇÃO AO RIGOR
desta maneira, «assentar igualmente» deveria significar, mais propriamente, «poder confundir-se visualmente, de determinado ponto de vista», ou seja, «poder ser visto como um ponto, confundido com os extremos do segmento» quando observado de determinado local. Outras definições podem ainda hoje ser adoptadas com utilidade para a formulação das proposições da Geometria; assim acontece com as definições de ângulo, ângulo recto, etc. Quanto aos postulados e «noções comuns», constituindo duas listas com cinco proposições cada, pretendiam ser suficientes para deles se poderem deduzir logicamente todas as Proposições que Euclides considerou relevantes como conhecimentos geométricos fundamentais até então descobertos; até ao século XIX, ou seja, durante mais de dois milénios, embora fossem apontados alguns defeitos na obra de Euclides, foi esta essencialmente aceite como inultrapassável em termos de rigor e mesmo como paradigma do que deveria ser considerado uma construção científica. O famoso quinto postulado, aparentando um grau de evidência inferior aos restantes, foi sendo objecto de diversas tentativas de demonstração a partir dos restantes pressupostos, mas só no século XIX se concluiu que não poderia ser dispensado, no sentido em que podia pressupor-se a sua negação sem se chegar a contradição lógica; mais precisamente, se a Geometria Euclidiana admitisse um modelo consistente, também uma Geometria em que fosse admitida a negação do quinto postulado admitiria um tal modelo, não havendo assim motivos puramente lógicos para optar por uma ou por outra. Esta escolha teria de ser justificada em cada caso pela utilização empírica ou teórica a dar a esses modelos geométricos alternativos. A atenção prestada pela comunidade matemática a estas questões acabou por conduzir a uma análise crítica dos fundamentos da Geometria, levando a reconhecer a insustentabilidade de muitos aspectos da obra de Euclides; nos últimos anos do século XIX Hilbert apresentou uma nova formulação da Axiomática da Geometria expurgando os defeitos de Euclides e abrindo o caminho para outras propostas análogas que se foram desenvolvendo ao longo do século XX. Particularmente sintética e elegante é a proposta de Tarski que, na sua forma final, atingida já na década de 60, reduz a Axiomática a apenas onze proposições, (incluindo duas que delimitam a dimensão do espaço29 ), as quais utilizam apenas, para além das operações lógicas elementares e das relações de igualdade 29 Na apresentração que faremos da Axiomática de Tarski reduziremos a dez o número de axiomas por reunirmos no Axioma 8 as questões relativas à dimensão do espaço; numa primeira fase limitando-a apenas inferiormente por 2 e, mais tarde, xando a dimensão num valor não inferior a 2. 114
ANTÓNIO BIVAR
e de pertença da Teoria dos Conjuntos (esta última apenas num dos Axiomas), um tipo de objectos primitivos designados por pontos e duas relações primitivas, uma delas entre «pares de pares de pontos»30 designada por congruência ou equidistância e outra entre trios ordenados de pontos designada por relação situado entre. Trata-se da formalização dos conceitos heurísticos exactamente com estas designações que fomos levados a introduzir na secção anterior. Seguindo de perto o desenvolvimento da Geometria segundo Tarski (cf. [Schwabhäuser, 1983], [Tarski, 1999]), adoptando as notações atrás introduzidas para as referidas relações primitivas, apresentemos então os Axiomas em que se baseia essa construção, procurando acompanhar esta análise com a interpretação intuitiva que motivou o presente estudo. Recordemos que um par de pontos (A, B ) (designado por segmento) será representado por AB ; de alguma maneira esta definição desempenha o papel do primeiro postulado de Euclides «Traçar uma linha recta de qualquer ponto para qualquer ponto», uma vez que, como já se referiu, as «linhas rectas» de Euclides correspondem aos nossos segmentos. As referidas notações serão, AB ≡ C D para a congruência ou equidistância entre segmentos (pares de pontos) A B e C D e A − B −C (« B está entre A e C ») para a relação situado entre relativa ao trio ordenado de pontos (A, B,C ). Relativamente à noção de congruência ou equidistância, é natural admitir, como axiomas, pelo menos os seguintes31 : Axioma 3.1 (Reflexividade «simétrica» da equidistância) A B ≡ B A . Axioma 3.2 (Transitividade da equidistância) Se A B ≡ C D e A B ≡ E F , então CD ≡ EF. Se interpretarmos estes axiomas em termos dos movimentos dos «corpos rígidos» que associamos à noção de segmento, tornar-se-á evidente que traduzem 30 A noção de «par ordenado» pode ser tomada como primitiva na axiomatização da Teoria dos conjuntos (directamente ou através da introdução de um símbolo primitivo, conduzindo à construção de pares ordenados, a acrescentar aos símbolos = e ∈ e, eventualmente, ao «símbolo de escolha» de Hilbert), mas pode também ser noção derivada, identicando-se o par ordenado (A, B ) com o conjunto {A, {A, B }}. 31 Entender-se-á que se uma letra, A por exemplo, ocorrer num axioma representando um ponto, estará afectada implicitamente da expressão «qualquer que seja A », a menos que, do contexto, seja óbvio que não é assim; deste modo, não será necessário preceder os enunciados de repetidas utilizações da expressão «qualquer que seja» relativa aos diversos pontos «genéricos» acerca dos quais se fazem armações (essas expressões não serão omitidas quando se entender que a explicitação torna o enunciado mais claro).
115
GEOMETRIA: DA INTUIÇÃO AO RIGOR
propriedades incontornáveis desses movimentos, de acordo com a nossa experiência32 . Como exemplo de aplicação do método axiomático, mostremos como, a partir destes dois axiomas, podem demonstrar-se outras propriedades «esperadas» da noção de equidistância: Teorema 3.1 (Reflexividade da equidistância) A B ≡ A B . Demonstração: Aplicando o axioma 3.1 ao par de pontos (B, A) teremos B A ≡ A B ; então a hipótese do axioma 3.2, verifica-se para B A no papel de A B e A B tanto no papel de C D como de E F , pelo que, do mesmo axioma, podemos concluir que A B ≡ A B .33 Teorema 3.2 (Simetria da equidistância) Se A B ≡ C D , então C D ≡ A B . Demonstração: Admitindo a hipótese A B ≡ C D e atendendo ao Teorema anterior, que garante a relação A B ≡ A B , podemos concluir, do Axioma 3.2, que C D ≡ A B , como pretendíamos. Teorema 3.3 (Transitividade da equidistância – 2ª versão) Se A B ≡ C D e C D ≡ E F , então A B ≡ E F . Demonstração: Admitindo a hipótese A B ≡ C D , C D ≡ E F , então, aplicando o teorema anterior à primeira relação, concluímos que C D ≡ A B ; aplicando agora o Axioma 3.2 às relações C D ≡ A B e C D ≡ E F (C D no papel de A B , e A B , E F respectivamente nos papéis de C D , E F ) concluímos que A B ≡ E F . Os Teoremas 3.1 a 3.3 garantem que a relação de equidistância entre pares de pontos, ou de congruência entre segmentos, é o que se chama uma relação de equivalência (reflexiva, simétrica e transitiva). Estas propriedades estão suficientemente próximas da intuição em que se baseou a noção de congruência ou 32 No Axioma 3.2, por exemplo, A B pode representar um par de pontos do espaço geométrico, ou seja, a «posição» ocupada em determinado instante por um par de objectos pontuais xados num objecto rígido em movimento, e C D e E F a posição ocupada pelo mesmo par de objectos pontuais em instantes eventualmente distintos, o que torna imperativo o requisito deste Axioma, enquanto tradução da ideia intuitiva subjacente à relação de equidistância de pontos ou congruência de segmentos. O Axioma 3.1, por seu lado, estabelece a independência da «distância» relativamente ao «sentido» em que é eventualmente «percorrida» ou «avaliada»; assim, admite-se que se um par de objectos pontuais xado num objecto rígido ocupar a posição de um par de pontos do espaço poderemos movê-lo de modo a «trocar» as respectivas posições. 33 Assinalaremos o nal de uma demonstração pelo símbolo . 116
ANTÓNIO BIVAR
equidistância (resultado da acumulação de experiências espaciais) para que pudessem ser tomadas todas como axiomas, mas o que verificámos foi que apenas dos dois axiomas enunciados se podem deduzir logicamente os resultados designados por «Teoremas». Para cada segmento A B podemos considerar o conjunto dos segmentos congruentes com A B , que designaremos por classe de equivalência de A B para a relação de congruência e representaremos por [A B ]; qualquer segmento está na sua própria classe de equivalência (pela reflexividade), pelo que a união de todas as classes de equivalência é igual ao conjunto de todos os segmentos do espaço, e dadas duas classes de equivalência (distintas…), da transitividade e simetria facilmente se conclui que não podem ter elementos comuns (caso contrário coincidiriam). A relação de congruência determina assim no conjunto de todos os segmentos do espaço o que se chama uma partição, constituída pelas classes de equivalência de segmentos atrás definidas; atendendo ao significado intuitivo da congruência (e equidistância), é natural dizer que cada classe de equivalência é constituída por segmentos com o mesmo comprimento ou cujos extremos são todos equidistantes e que classes de equivalência distintas correspondem a diferentes comprimentos (ou diferentes distâncias dos extremos). Note-se, no entanto, que ainda não definimos o que se entende por comprimento de segmento ou distância entre dois pontos, mas apenas como identificar segmentos com o mesmo comprimento ou pares de pontos equidistantes; trata-se, por enquanto, apenas de convenções de linguagem relativas à relação primitiva de congruência e que lembram a origem intuitiva deste conceito. Nada nos impede, no entanto, de definir comprimento de um segmento A B com sendo exactamente a respectiva classe de equivalência [AB ] para a relação de congruência; com esta convenção, deveremos no futuro distinguir o comprimento de um segmento da respectiva medida (fixada uma unidade), a qual será definida apenas depois de suficientemente desenvolvida a Geometria (tratar-se-á de um número real não negativo). Notemos também que o simples requisito de podermos subdividir o conjunto dos segmentos em classes duas a duas disjuntas e não vazias, cada uma delas constituída por segmentos aos quais pretendemos atribuir o mesmo «comprimento», no sentido em que são congruentes, e de modo que classes distintas correspondam a segmentos não congruentes, obriga só por si a admitir que a relação de congruência é de equivalência34 ; se acrescentarmos o requisito de que «a distância entre dois pontos não dependa da ordem em que 34 Estamos apenas a armar que dada uma partição de um conjunto não vazio, esta é sempre a partição associada a determinada relação de equivalência nesse conjunto, resultado fácil de demonstrar. 117
GEOMETRIA: DA INTUIÇÃO AO RIGOR
são tomados», ou seja que a relação de equidistância possa ser bem definida no conjunto dos {A, B } (A e B pontos do espaço), a partir da relação definida para pares ordenados (A, B ), ficaremos obrigados a admitir os Teoremas 3.1, 3.2, 3.2 e o Axioma 3.1, ou seja, de modo equivalente, os Axiomas 3.1 e 3.2, os quais são assim em conjunto equivalentes a este novo par de requisitos. Também é natural exigir que todos os segmentos degenerados AA tenham o mesmo comprimento (corresponde à noção intuitiva de distância nula ou de comprimento igual a zero) e, por outro lado, que dois pontos (distintos…) A e B nunca estejam a distância nula um do outro, não sendo, portanto, A B congruente com nenhum segmento degenerado C C ; adoptaremos, então, o seguinte axioma: Axioma 3.3 (Identidade para a equidistância) Se A B ≡ C C , então A = B . Poderíamos também adoptar a recíproca desta proposição como axioma (AA ≡ C C ), mas vamos ver que se pode deduzir facilmente dos axiomas já enunciados e do que adoptaremos em seguida. Até agora não temos processo de justificar a possibilidade de «mover rigidamente» um segmento e «justapô-lo» a determinada semirecta, a partir de determinado ponto; admitiremos essa possibilidade, com o objectivo de prosseguir a tradução na linguagem da Geometria das experiências que nos têm motivado35 . Ou seja: Axioma 3.4 (Transporte de segmento) Dados P,Q,O, A , existe um ponto X tal que O − A − X e PQ ≡ AX . ◦
Este axioma garante, em particular, que, em qualquer semirecta OA , «podemos construir» (ou seja, existe) um segmento AX congruente com um segmento PQ pré-fixado, qualquer que ele seja; no caso em que A ̸= O traduz-se assim a ideia de que é possível deslocar um objecto rígido representando PQ e justapô-lo ◦ à semirecta OA , «a partir do ponto A », ou ainda, afirma-se que de entre os pontos ocultados por A do nosso olhar situado em O podemos sempre escolher um à distância de A igual a uma distância arbitrariamente pré-fixada. Este axioma pode 35 Nos «Elementos», Euclides não postula uma propriedade tão forte como o Axioma que iremos enunciar em seguida e que traduz esta ideia intuitiva; com efeito, apresenta-a já como proposição demonstrável (trata-se precisamente da Proposição 2 dos Elementos). No entanto, para o fazer, acaba por utilizar propriedades não explicitadas e que se revelam em certo sentido muito mais complexas que a referida proposição; com efeito admite implicitamente a existência de determinados pontos de intersecção de duas circunferências, tal como para a construção da mediatriz de um segmento, como adiante veremos. 118
ANTÓNIO BIVAR
FIGURA 3.4
ser considerado uma «clarificação» do segundo postulado de Euclides, «produzir uma linha recta continuamente numa linha recta»36 . Note-se que os segmentos envolvidos no axioma podem ser degenerados, o que permite obter o resultado seguinte, a partir dos axiomas até agora enunciados: Teorema 3.4 (Congruência dos segmentos degenerados) AA ≡ C C . Demonstração: Pelo Axioma 3.4 (transporte de segmento), existe X tal que A − A −X e C C ≡ AX ; pela simetria da equidistância (Teorema 3.2) teremos então AX ≡ C C , donde, pelo Axioma 3.3 (identidade para a equidistância), X = A . Então, de facto, AA ≡ C C . Na formulação de Euclides surgem pressupostos que, de alguma maneira, cobrem os Axiomas de Tarski até agora enunciados; com efeito, a sua primeira «noção comum», «Entidades iguais a uma mesma entidade são iguais entre si» pretende abarcar, entre outros, o caso da «entidade comprimento» (ainda que esta noção não seja definida à partida), traduzindo, nesse caso a ideia expressa rigorosamente pelo Axioma 3.2 de Tarski; quanto à ideia expressa no Axioma 3.1 de Tarski, não sendo explicitamente enunciada por Euclides, está implícita no facto de se considerar o comprimento como propriedade do «conjunto dos pontos de um segmento», como fica claro da utilização que Euclides faz de expressões como «linhas rectas iguais» ou «lados iguais» de um triângulo. Esse conjunto de pontos não depende, evidentemente, da ordem dos extremos (na construção de Tarski será necessário demonstrar este facto). 36 O segundo postulado de Euclides pode ser considerado como uma versão mais fraca deste Axioma de Tarski, se interpretarmos aquele postulado como referindo apenas a possibilidade de prolongar «indenidamente» um segmento em qualquer dos sentidos, mas sem exigir que o prolongamento deva ser congruente com algum segmento pré-xado. Este «prolongamento indenido» é invocado por Euclides para obter, por exemplo, intersecções com prolongamentos de outros segmentos ou com circunferências. 119
GEOMETRIA: DA INTUIÇÃO AO RIGOR
Para que possamos prosseguir a formalização, na linguagem da Geometria, das nossas intuições espaciais, há que «regular» também o uso da relação situado entre, para além do que até agora se fez. A consideração de segmentos degenerados torna aconselhável que regulemos o uso desta relação quando num trio de pontos ocorrem repetições; do que precede podemos desde já concluir facilmente o seguinte: Teorema 3.5 (Reflexividade à direita para a relação situado entre) A − B − B . Demonstração: Pelo Axioma 3.4, existe X tal que A − B − X e B B ≡ B X ; pela simetria da equidistância (Teorema 3.2) teremos então B X ≡ B B , donde, pelo Axioma 3.3 (identidade para a equidistância), X = B . Então, de facto, A − B − B . Este teorema garante que B está no segmento A B . Em particular, A está no segmento AA ; admitiremos como axioma que não há outro ponto neste segmento: Axioma 3.5 (Identidade para a relação situado entre) Se A − B − A , então A = B . Quanto aos segmentos em geral, tal como no caso dos degenerados, pretendemos que os respectivos extremos sejam pontos do segmento; essa propriedade que, como vimos, para o extremo direito resulta do Teorema 3.5, traduz a ideia de que um ponto A «pode ocultar-se a si próprio do olhar situado em O »37 . Não será necessário enunciar como axioma o resultado idêntico para o extremo esquerdo, uma vez que chegou a altura de introduzir um novo Axioma que permitirá, em conjunto com os anteriores, deduzir este facto, mediante a prévia demonstração da «simetria em relação aos extremos» da relação situado entre (ou seja, A − B − C ⇒ C − B − A ); intuitivamente, «se B oculta C de A , então também oculta A de C », e portanto temos igualdade entre os conjuntos de pontos dos segmentos A B e B A . O enunciado do referido Axioma resulta da análise profunda dos fundamentos da Geometria que, como atrás referimos, foi feita por alguns matemáticos em finais do século XIX; Pasch, um desses autores, apercebeu-se de que havia na obra de Euclides utilização de um pressuposto não explicitado, o qual 37 Corresponde à experiência de conseguirmos ocultar um objecto pontual A interpondo entre o nosso olhar e A um objecto pontual tão próximo de A que as respectivas posições se tornem indistinguíveis, como, por exemplo, ocorre aparentemente num eclipse, considerando os astros como objectos «pontuais» situados todos na superfície da «esfera celeste». 120
ANTÓNIO BIVAR
se pode traduzir pela ideia de que uma recta situada no plano de um triângulo que intersecta um lado deste apenas num ponto distinto dos vértices tem de intersectar forçosamente um dos outros dois lados. Mais tarde verificou-se que alguma forma deste pressuposto, ou pelo menos algum caso particular, teria de ser adoptado como axioma independente, pois é possível construir modelos em que tenham lugar os restantes axiomas da Geometria (numa construção rigorosa deste corpo de conhecimentos) mas em que esta propriedade seja falsa. A formulação do Axioma de Tarski que corresponde a este pressuposto identificado por Pasch admite interpretação sugestiva em termos da motivação heurística que apresentámos para as relações primitivas da Geometria. A situação que se pretende regular envolve um ponto A do qual emanam duas semirectas determinadas por outros dois pontos, B e C ; imaginemos, além disso, um observador cujo olhar situado em D esteja numa situação em que B fique dele ocultado por C (cf. figura 3.5). Então pretendemos garantir que no segmento AC existem «pontos suficientes» para ocultarem de D qualquer ponto P escolhido no segmento A B , por outras palavras, pretendemos garantir que se um dos lados de um triângulo A BC é por nós avistado como um ponto, «confundindo-se visualmente» dois dos vértices B e C , porque C tapa B do nosso olhar, então, dos outros dois lados, o que está mais próximo da nossa vista (ou seja, o de vértices A,C ) «oculta» completamente o outro do nosso olhar («um dos lados tapa outro, quando o terceiro lado se vê como um ponto»).
FIGURA 3.5
O modo como Tarski formula este Axioma leva em conta o facto de ainda não termos «validado» a acima referida «simetria relativamente aos extremos» da relação situado entre; assim, uma escolha criteriosa da ordem dos pontos nas relações que traduzem as ideias intuitivas que acabámos de expor permitirá depois obter como Teorema essa mesma simetria. Outra opção de Tarski é a admissão 121
GEOMETRIA: DA INTUIÇÃO AO RIGOR
de casos «degenerados» na formulação do Axioma, ou seja, não será pressuposto que os pontos envolvidos são distintos dois a dois; esta característica da formulação adoptada para este «Axioma de Pasch» permitirá também dele obter, como casos particulares e consequências simples, outras propriedades básicas, nomeadamente da relação situado entre, cuja formulação independente se torna assim desnecessária. Observemos que, juntamente com o Axioma 3.4 (Transporte de segmento), são estes os únicos axiomas até agora considerados que permitem «construir pontos» ou seja, garantir a existência de um ponto com determinadas características, desde que se admita a existência de determinadas configurações de pontos. Temos assim (cf. figura 3.5): Axioma 3.6 (Axioma de Pasch — forma «interior») Se A−P−B e D−C −B então existe X tal que P − X − D e C − X − A . Resulta agora: Teorema 3.6 (Simetria exterior para a relação situado entre) Se A − B −C , então C − B − A. Demonstração: Admitindo a hipótese do Teorema, ou seja, A − B − C e atendendo ao Teorema 3.5, a partir do qual sabemos que B − C − C , do Axioma 3.6 obtemos, como consequência destas duas relações, que existe X tal que B − X − B e C − X − A ; ora, atendendo ao Axioma 3.5, de B − X − B resulta X = B , pelo que, de C − X − A , obtemos imediatamente C − B − A . Teorema 3.7 (Reflexividade à esquerda para a relação situado entre) A − A − B . Demonstração: É imediato a partir dos Teoremas 3.5 ( B − A − A ) e 3.6.
Teorema 3.8 (Anti-simetria esquerda para a relação situado entre) Se A −B −C e B − A − C então A = B . Demonstração: Aplicando o Axioma de Pasch com as hipóteses do Teorema concluímos que existe X tal que B − X − B e A − X − A , pelo que, do Axioma 3.5, concluímos que X = A e X = B , portanto A = B .
122
ANTÓNIO BIVAR
Dos Teoremas 3.5 e 3.7 resulta imediatamente que, de facto, os extremos de um segmento são pontos do segmento e do Teorema 3.6 resulta que coincidem os • • conjuntos de pontos dos segmentos A B e B A , ou seja, A B = B A . As propriedades básicas das «direcções visuais», resultantes das experiências com ocultação de objectos por interposição relativamente ao nosso olhar, devem traduzir-se em propriedades da relação «situado entre», algumas das quais ainda não demonstrámos. Analisando os Axiomas e Teoremas até agora introduzidos e que envolvem a relação «situado entre» (Axiomas 3.4 a 3.6, Teoremas 3.5 a 3.7) notemos que no Axioma 3.4 estabelecemos a possibilidade de considerar um ponto X na direcção visual de um ponto A , por detrás de A , a qualquer distância pré-fixada deste ponto (sendo a «distância» determinada por um segmento PQ arbitrário). O Axioma 3.6 já foi analisado e o Axioma 3.5 e os Teoremas 3.5 a 3.7 correspondem a uma convenção de linguagem que nos faz admitir situações «degeneradas» na relação «situado entre». Com essa convenção, no Axioma 3.5 traduzimos a ideia intuitiva de que não há possibilidade de interpor outro objecto pontual entre A e ele próprio (embora o próprio A se considere nessa situação, atendendo ao Teorema 3.5). Falta-nos, em particular, garantir que o comportamento dos pontos «alinhados» (satisfazendo a relações «situado entre») é fiel às nossas observações dos objectos pontuais em situações de interposição, no que respeita, por exemplo, a uma ordenação associada às distâncias relativamente ao nosso olhar; se três pontos estiverem alinhados e interpusermos um ponto entre dois deles esperamos que tenham lugar determinadas relações «situado entre», resultantes desta «intercalação». Assim, é de esperar que tenha lugar o seguinte resultado que poderemos demonstrar, graças ao Axioma de Pasch utilizado numa situação «degenerada»: Teorema 3.9 (Intercalação) Se A − B − D e B − C − D , então A − B − C . Demonstração: Se atendermos ao Axioma 3.6 (Pasch), das hipóteses do Teorema 3.9 podemos imediatamente deduzir que existe X tal que B −X −B e C −X −A ; pelo Axioma 3.5 concluímos de B −X − B que B = X , pelo que C − B −A e portanto A − B − C , atendendo ao Teorema 3.6 (simetria da relação situado entre). Notemos que também seria de esperar que, se admitirmos as hipóteses do Teorema 3.9, então A − C − D ; essa conclusão poderá extrair-se se previamente demonstrarmos um resultado, também esperado, que se designa por «concatenação» e que se exprime na implicação «se A − B − C e B − C − D e B ̸= C , então 123
GEOMETRIA: DA INTUIÇÃO AO RIGOR
A − C − D ». Com efeito, admitido este resultado, das conclusões extraídas na de-
monstração anterior, destacando que A − B −C e B −C − D , no caso em que B ̸= C podemos aplicar o resultado de concatenação, obtendo-se a pretendida relação A − C − D ; se B = C é óbvio que A − C − D , uma vez que resulta dessa igualdade e da hipótese A − B − D . Também podemos notar que a concatenação, uma vez admitida, pode ser completada com a conclusão, também esperada, A − B − D , pois esta agora resulta de aplicar a intercalação a partir de A − C − D e A − B − C (começando por inverter as relações situado entre, atendendo à simetria exterior – Teorema 3.6). Poderíamos admitir a concatenação como Axioma, mas este resultado pode ser demonstrado, se entretanto acrescentarmos um sétimo axioma à lista até agora apresentada, o qual será requerido também por outros motivos. Até agora apenas o Axioma 3.4 (transporte de segmento) faz intervir simultaneamente as duas relações primitivas desta Axiomática da Geometria; há, no entanto, questões relativas à noção intuitiva de comprimento com as quais teremos de lidar e que envolvem as duas relações. Assim é de esperar, por exemplo, que na situação A − B − C e A ′ − B ′ − C ′ , se A B ≡ A ′ B ′ e BC ≡ B ′C ′ então AC ≡ A ′C ′ (trata-se de caso particular de uma das «noções gerais» de Euclides — «se iguais forem adicionados a iguais então os totais são iguais»). Não temos ainda meios para deduzir esta propriedade; a exemplo de Euclides não seria despropositado admiti-la como Axioma, mas vamos ver que teremos de postular outro resultado mais geral do qual este será consequência simples. Uma análise crítica da demonstração da quarta proposição dos Elementos (o famoso «caso LAL de igualdade de triângulos») revela que os argumentos utilizados são falaciosos; de facto, é possível mostrar sem grande dificuldade que essa proposição não pode ser deduzida nem no quadro da axiomática de Euclides nem apenas como consequência dos axiomas que já introduzimos (nem mesmo de toda a restante Axiomática de Tarski, excluindo precisamente um axioma exprimindo uma propriedade «próxima» desta), uma vez que a respectiva negação pode ser admitida coerentemente como axioma, ou seja, é possível construir um modelo a partir da própria Geometria euclidiana em que valem todos os restantes axiomas e a negação dessa proposição. Para compreendermos o alcance do Axioma que vamos introduzir para colmatar esta dificuldade podemos abordar a questão da utilização dos ângulos; retomando uma das motivações que foi invocada para o estudo da Geometria, imaginemos que pretendemos comparar as posições relativas de dois pares de estre124
ANTÓNIO BIVAR
las que avistamos no Céu, consideradas como «objectos pontuais». Não faz sentido, evidentemente, pretender comparar, à vista desarmada, as respectivas distâncias reais, ou seja, os comprimentos dos segmentos determinados por cada par de estrelas; no entanto, se, por exemplo, estendermos um braço diante do nosso olhar e conseguirmos, numa situação particular, fazer coincidir visualmente as estrelas de um dos pares, respectivamente, com as extremidades do polegar e dedo mindinho correspondentes a esse braço, com a mão aberta (num «palmo»), podemos depois procurar repetir essa operação com o outro par de estrelas e, se o conseguirmos, poderemos concluir que, em certo sentido, os dois pares de estrelas estão igualmente «afastados». O sentido em que o dizemos é exactamente o que corresponde à noção de amplitude angular; com efeito, o nosso olhar, situado num ponto O , determina uma semirecta com cada uma das extremidades dos dois dedos considerados (situadas em pontos P e Q ) e este par de semirectas com origem comum é exactamente o que designámos por ângulo (neste ◦ ◦ ◦ ◦ caso ∠POQ = {OP, OQ}, de lados OP e OQ ).
FIGURA 3.6
O facto de fazermos coincidir visualmente as extremidades dos dedos com as estrelas do primeiro par significa que cada uma das estrelas está situada num dos lados do ângulo, ou seja, o par de estrelas determina com o nosso olhar o mesmo ângulo ∠POQ ; ao repetirmos a operação com o outro par de estrelas, o esforço de mantermos esticado o braço diante do nosso olhar e aberta a mão de modo a formar «um palmo» pretende garantir que se mantêm as distâncias não só entre o nosso olhar e a extremidade de cada um dos dedos, como entre essas mesmas extremidades. Ou seja, pretendemos que o nosso olhar, braço e mão funcionem como um «objecto rígido» triangular; designando por O ′ , P ′ ,Q ′ as no125
GEOMETRIA: DA INTUIÇÃO AO RIGOR
vas posições, respectivamente, do nosso olhar e das extremidades dos dois dedos considerados garantiremos assim as congruências OP ≡ O ′ P ′ ,OQ ≡ O ′Q ′ e PQ ≡ P ′Q ′ , por outras palavras, as «congruências dos triângulos ordenados OPQ e O ′ P ′Q ′ ». Uma vez que um mesmo ângulo pode ser determinado escolhendo arbitrariamente um ponto em cada um dos lados, para aferirmos o «igual afastamento» de duas estrelas (do nosso «ponto de vista») poderíamos substituir as extremidades dos dedos, ou seja, o «palmo», por quaisquer outros pontos, respectivamente, nas mesmas «direcções visuais»; consideremos, por exemplo, um compasso com braços extensíveis38 . Admitamos que podemos ajustar o compasso de modo a que o ponto de articulação dos braços coincida com o nosso olhar e as pontas com as extremidades do nosso palmo (com o braço estendido) como acima foi pressuposto; se alongarmos um dos braços do compasso (o limitado por O e Q , por exemplo) mantendo as restantes posições, a correspondente ponta continuará alinhada visualmente com a mesma estrela mas passará a ocupar a posição de um novo ponto R tal que O −Q − R . Suponhamos agora que ligamos os dois braços do compasso nos pontos P e Q com uma haste rígida; garantimos assim que, ao movê-lo, se mantêm as distâncias mútuas entre os três pontos inicialmente nas posições O, P e Q , ou seja, estes vão, sucessivamente, ocupando posições de triângulos mutuamente congruentes, no sentido definido no final da secção anterior.
FIGURA 3.7
Deste modo, podemos utilizar o compasso assim «fixado» para aferir a «distância angular» do outro par de estrelas, devendo ajustar-se visualmente como o 38 «Extensível» no sentido em que depois da «extensão» a ponta do braço continuará na direcção determinada pelo ponto de articulação dos braços e pela ponta na posição inicial – ou seja, a extensão far-se-á mantendo o alinhamento. 126
ANTÓNIO BIVAR
tínhamos conseguido com o nosso «palmo esticado»; na nova posição os referidos três pontos do compasso ocuparão os pontos O ′ , P ′ e Q ′ e o ponto incialmente situado em R passará a ocupar a posição de um novo ponto R ′ tal que O ′ −Q ′ − R ′ , sendo QR ≡ Q ′ R ′ (o «comprimento» da extensão efectuada no braço do compasso mantém-se ao longo do movimento, assim como o «alinhamento» dos pontos do braço). O que poderemos então dizer acerca de PR e P ′ R ′ ? Para que se possa atribuir algum significado ao conceito de «ângulos de igual amplitude», utilizando um processo como o que acabámos de descrever para aferir essa igualdade, teremos de supor que PR ≡ P ′ R ′ , pois ∠POQ = ∠POR e ∠P ′O ′Q ′ = ∠P ′O ′ R ′ , atendendo a que se mantiveram os «alinhamentos» com a extensão do braço do compasso e o subsequente movimento. Portanto, para que, coerentemente, ∠POR e ∠P ′O ′ R ′ tenham a mesma amplitude, sendo a aferição efectuada pelo mesmo processo, teremos de obter a citada congruência dos «terceiros lados» dos triângulos POR e P ′O ′ R ′ ; note-se que estamos a pressupor como «óbvio» que ao «estendermos» o braço do compasso, mantendo o alinhamento dos pontos O −Q − R , basta «manter os comprimentos» de OQ e QR para se manter como consequência o comprimento de OR . Tanto esta última propriedade como a anterior traduz-se na conclusão de que para garantir a «rigidez» de uma configuração de um certo número de pontos (três ou quatro) podemos substituir a «manutenção das distâncias» entre algum ou alguns pares de pontos por uma hipótese de «alinhamento»; assim neste último caso, temos três pontos O,Q, R e apenas pressupomos que se mantêm as distâncias nos pares {O,Q} e {Q, R}, resultando a manutenção da distância no terceiro par {O, R} das duas anteriores e do alinhamento O −Q − R . Quanto à situação anterior de «aferição de igualdade de amplitudes de ângulos» utilizando congruência de triângulos, a coerência do processo obriga a supor que num «quadrilátero» {O, P,Q, R}, a manutenção das distâncias nos pares {O, P}, {O,Q}, {P,Q} e {Q, R} é suficiente para garantir a manutenção das distâncias nos dois restantes ({O, R} e {P, R}) e, portanto, a «rigidez da estrutura», desde que se pressuponha O ̸= Q e a manutenção do alinhamento O − Q − R ; quanto a {O, R} temos exactamente a situação anterior e quanto a {P, R}, uma vez garantida a manutenção da distância entre O e R , em conjunto com a já pressuposta entre O e P , trata-se precisamente do que é requerido para podermos continuar a garantir que o ângulo ∠POQ (= ∠POR ) mantém a respectiva «amplitude». Notemos ainda que, se a possibilidade de «extensão» de OQ para OR «mantendo o alinhamento» só faz sentido se O ̸= Q , nada nos impede de no «quadrilátero» {O, P,Q, R} considerar o caso «degenerado» O = P . Nesse caso «manter a 127
GEOMETRIA: DA INTUIÇÃO AO RIGOR
distância entre O e P » significa «manter a igualdade O = P » e este caso degenerado reduz-se, então, ao do «triângulo» {O,Q, R} atrás examinado. Assim, podemos traduzir estas duas situações num único Axioma que pode ser enunciado como se segue: Axioma 3.7 (Axioma da amplitude de ângulo ou «dos cinco segmentos») Se ′ ′ ′ ′ ′ ′ ′ ′ ′ ′ ′ OP ≡ O P ,OQ ≡ O Q , PQ ≡ P Q , O ̸= Q, O − Q − R, O − Q − R e QR ≡ Q R então PR ≡ P ′ R ′ .
FIGURA 3.8
Como anunciámos podemos daqui deduzir o caso particular acima referido: Teorema 3.10 («Aditividade do comprimento») Se A − B − C , A ′ − B ′ − C ′ , A B ≡ A ′ B ′ e BC ≡ B ′ C ′ , então AC ≡ A ′ C ′ . Demonstração: Se A = B , atendendo ao Axioma 3.3 e à simetria da equidistância vem A ′ = B ′ e portanto AC = BC ≡ B ′C ′ = A ′C ′ . Se A ̸= B podemos aplicar o Axioma 3.7 aos «quadriláteros» (A, A, B,C ) e (A ′ , A ′ , B ′ ,C ′ ) e deduzimos imediatamente AC ≡ A ′C ′ . Também podemos obter agora: Teorema 3.11 («Unicidade do transporte de segmento») Se A ̸= B , A − B − X , A − B − Y e B X ≡ B Y , então X = Y . Demonstração: Podemos aplicar o Axioma 3.7 aos «quadriláteros» (A, X , B, Y ) e (A, X , B, X ), deduzindo-se que X Y ≡ X X e, portanto, X = Y (pelo Axioma 3.3). Podemos agora obter a concatenação, como atrás foi anunciado: 128
ANTÓNIO BIVAR
Teorema 3.12 («Concatenação») Se A − B − C e B − C − D e B ̸= C então A − C − D e A − B − D. Demonstração: Pelo Axioma 3.4 («Transporte de segmento») existe X tal que A − C − X e C D ≡ C X ; atendendo à intercalação (Teorema 3.9) e à simetria da relação
situado entre (Teorema 3.6), de A − B − C e A − C − X resulta B − C − X . Então, pela unicidade do transporte de segmento (Teorema 3.11), como, por hipótese, B ̸= C e B −C −D , temos X = D e, portanto, A −C −D . A última relação (A − B −D) resulta agora do raciocínio apresentado acima, depois da demonstração do Teorema 3.9 («Intercalação»). Com este resultado, o Teorema 3.9 (intercalação) e as observações feitas após a respectiva demonstração, ficamos a saber que conclusões se podem tirar, quanto ao respectivo «alinhamento», para quatro pontos A 1 , A 2 , A 3 , A 4 , se forem conhecidas relações situado entre relativas a dois ternos construídos cada um deles com três destes pontos, em algumas situações que podem ser reduzidas a duas se não distinguirmos as que se podem deduzir por aplicação da «simetria exterior» da relação situado entre. Trata-se da chamada «intercalação», «A 1 −A 2 −A 4 e A 2 − A 3 − A 4 » (a partir da qual se poderá depois tirar conclusões, pela referida simetria, acerca da outra intercalação «A 1 −A 2 −A 3 e A 1 −A 3 −A 4 ) e da «concatenação», «A 1 − A 2 − A 3 e A 2 − A 3 − A 4 » (note-se que, neste caso, por hipótese, A 2 ̸= A 3 ). Podemos formar quatro relações situado entre com os quatro pontos considerados tomados três a três e mantendo a ordem crescente dos índices39 e, portanto, seis pares de hipóteses constituídas por duas relações situado entre deste tipo; falta, portanto, examinar três pares, nomeadamente, «A 1 − A 2 − A 3 e A 1 −A 2 −A 4 », «A 2 −A 3 −A 4 e A 1 −A 3 −A 4 » e «A 1 −A 2 −A 4 e A 1 −A 3 −A 4 ». Utilizando mais uma vez a simetria exterior da relação situado entre, podemos facilmente englobar num só os dois primeiros casos (trata-se de pares de relações que têm em comum os dois primeiros ou os dois últimos pontos); a conclusão que esperamos poder extrair, atendendo à experiência que temos de «pontos alinhados» será, por 39 Qualquer relação situado entre envolvendo três dos pontos e que não respeite a ordem (crescente ou decrescente) dos índices será incompatível com uma das relações de entre as que mantêm essa ordem, atendendo a que supomos os pontos distintos dois a dois e à anti-simetria esquerda ou direita para a relação situado entre (Teorema 3.8, conjugado com o Teorema 3.6). Reciprocamente, dados quatro pontos, se tiver lugar o maior número possível de relações «situado entre» envolvendo três dos pontos, resultará facilmente desta análise que podemos sempre numerar os quatro pontos de modo que essas relações situado entre respeitem a ordem dos índices.
129
GEOMETRIA: DA INTUIÇÃO AO RIGOR
exemplo, no primeiro caso (porque também supomos A 1 ̸= A 2 ), que tenha lugar como consequência a alternativa «A 1 − A 3 − A 4 ou A 1 − A 4 − A 3 » (e, portanto, atendendo à intercalação, também «A 2 − A 3 − A 4 ou A 2 − A 4 − A 3 »). Podemos designar esta propriedade por «conectividade», para futura referência. Quanto ao terceiro e último caso esperamos que, como consequência da hipótese «A 1 − A 2 − A 4 e A 1 − A 3 − A 4 », tenha lugar a alternativa «A 1 − A 2 − A 3 ou A 1 −A 3 −A 2 » (equivalente, atendendo à intercalação, a «A 2 −A 3 −A 4 ou A 3 −A 2 −A 4 »); este resultado pode deduzir-se facilmente da conectividade. Com efeito, tal resultado é óbvio se A 1 = A 4 , pois nesse caso, pelo Axioma 3.3, vem imediatamente das hipóteses A 1 = A 2 = A 3 = A 4 . Se A 1 ̸= A 4 , podemos considerar X pelo Axioma 3.4 (transporte de segmento) tal que A 1 − A 4 − X e A 4 X ≡ A 1 A 4 (esta última relação destina-se a garantir que A 4 ̸= X ); então, pela intercalação e as hipóteses feitas vem também A 2 − A 4 − X , A 3 − A 4 − X e agora podemos aplicar a conectividade seguida da intercalação às relações X −A 4 −A 2 , X −A 4 −A 3 , donde «A 4 −A 2 −A 3 ou A 4 − A 3 − A 2 ». Assim, com a conectividade, ficará completa a lista de resultados básicos relativos ao «alinhamento de pontos»; talvez surpreendentemente a demontração deste resultado é bastante mais complexa que as apresentadas até agora e durante décadas esta proposição integrou a lista dos axiomas de Tarski, só vindo a ser demonstrada como teorema por Gupta [Gupta, 1965], em 1965, na sua tese de doutoramento, apenas a partir dos sete axiomas até agora enunciados. Temos assim: Teorema 3.13 («Conectividade») Se A − B − C e A − B − D e A ̸= B então A − C − D ou A − D − C . Demonstração: cf. [Schwabhäuser, 1983], Teorema I–5.1.
A partir destes resultados podemos agora demonstrar as propriedades básicas das semirectas, assim como da relação de ordem entre comprimentos de segmentos. Note-se que até agora nenhum dos axiomas garante a existência de um ponto; ou seja, o conjunto vazio vale como modelo para a Axiomática até agora apresentada; teremos assim de admitir a existência de um número mínimo de pontos para que possamos modelar a nossa percepção do espaço. É fácil concluir que um conjunto unitário (com apenas um elemento) com as relações adequadas também é modelo possível para esse conjunto de pressupostos, mas, desde que admitamos a existência de pelo menos dois pontos A 1 , A 2 ,
130
ANTÓNIO BIVAR
o Axioma 3.4 (transporte de segmento) permite construir sucessivamente pontos alinhados com A 1 e A 2 «nos dois sentidos e sucessivamente à mesma distância determinada por A 1 A 2 »; pelos Axiomas 3 e 5 e os resultados de alinhamento que acabámos de introduzir, é fácil concluir que os pontos assim sucessivamente construídos são todos distintos, e distintos de A 1 e A 2 , pelo que existirá então forçosamente uma infinidade de pontos, pelo menos formando um conjunto numerável. Também é fácil concluir que qualquer conjunto numerável com as relações situado entre e de congruência adequadamente definidas, em particular com os pontos todos três a três «alinhados» (ou seja, como se verá mais adiante, todos pertencentes a uma mesma recta), constitui modelo para os Axiomas de 1 a 7. Como, naturalmente, pretendemos pelo menos ter a possibilidade de definir ângulos «não degenerados» (com «lados não colineares») admitiremos que existem pelo menos três pontos «não colineares», ou seja, em certo sentido, que «a dimensão do espaço é pelo menos igual a 2»: Axioma 3.8 (Axioma inferior da dimensão 2) Existem pontos A, B,C tais que não tem lugar nenhuma das relações A − B − C , B − A − C , B − C − A . Atendendo aos resultados já demonstrados e à simetria exterior da relação situado entre concluímos que A, B,C são três pontos (distintos) e que não tem lugar nenhuma das seis possíveis relações situado entre envolvendo simultaneamente os três pontos; intuitivamente, os três pontos «não pertencem a uma mesma recta», ou seja, «não são colineares». Na secção seguinte apresentaremos resumidamente a construção restante da Geometria de acordo com a Axiomática de Tarski; podemos adiantar que a partir dos oito axiomas até agora apresentados é possível demonstrar um conjunto de resultados do que pode ser designado por Geometria absoluta adimensional elementar (de dimensão superior ou igual a dois). O carácter absoluto resulta de não termos introduzido nem o chamado axioma de Euclides, correspondente ao quinto postulado dos Elementos, nem um axioma equivalente à respectiva negação e que conduziria à chamada Geometria Hiperbólica ou de Lobachewski; quanto à adimensionalidade resulta de apenas termos introduzido a este respeito o Axioma 3.8, o qual estabelece uma limitação inferior para o que podemos designar por dimensão (exige-se que seja superior ou igual a 2), mas não qualquer limitação superior. A fixação da dimensão do espaço obrigará a introduzir um ou mais novos axiomas que substituam o Axioma 3.8 (mas que
131
GEOMETRIA: DA INTUIÇÃO AO RIGOR
impliquem, em particular, o que se exige nesse Axioma). Finalmente, o carácter elementar traduz o facto de não termos introduzido um axioma que permita assegurar a existência de «pontos suficientes» para podermos garantir a chamada «completude» das rectas; esta questão, assim como as anteriormente referidas relativas ao quinto postulado de Euclides e à dimensão, serão analisadas sucintamente mais adiante.
3.4 PRINCIPAIS CARACTERÍSTICAS DA CONSTRUÇÃO DE TARSKI DA GEOMETRIA ABSOLUTA ADIMENSIONAL ELEMENTAR Munidos dos resultados descritos na secção anterior, consequências dos sete primeiros Axiomas de Tarski, podemos demonstrar com rigor algumas propriedades básicas dos conjuntos de pontos que designámos por semirectas, nomeadamente verificando que, para cada ponto O , é de equivalência a relação: A ∼ B ⇔ A, B ̸= O e (O − A − B ou O − B − A ) O
◦
sendo a semirecta OA exactamente a classe de equivalência de A para esta relação (O diz-se origem da semirecta, ponto que se prova ficar unicamente determinado por esta). Prova-se assim que semirectas iguais têm a mesma origem e podemos em seguida introduzir o conceito de semirecta oposta a determinada semirecta ◦ OA , através de: ◦ −OA = {P : P ̸= O e P −O − A}, provando-se que este conjunto está bem definido (não depende de A , mas apenas ◦ da semirecta), e para qualquer B ∈ −OA : ◦
◦
−OA = O B .
A partir deste conceito, para cada par (A, B ) de pontos distintos podemos definir a recta A B através de: ◦ ◦ A B = A B ∪ {A} ∪ −A B ; em seguida podemos proceder à demonstração de propriedades básicas das rectas, em particular do facto de dois pontos pertencerem conjuntamente a uma e uma só recta (que se diz recta «determinada» ou «definida» pelos dois pontos ou «recta de ligação» dos dois pontos) e, portanto, de duas rectas distintas não poderem intersectar-se em mais que um ponto.
132
ANTÓNIO BIVAR
É conveniente (e possível) introduzir desde cedo o conceito de isometria do espaço, ou seja, de bijecção do espaço sobre si próprio que mantém a distância entre os pares de pontos; não é difícil demonstrar que qualquer isometria mantém também as relações situado entre. Em seguida podemos introduzir como poderoso auxiliar da construção da Geometria o conceito de reflexão em relação a um ponto O , isometria do espaço que associa a cada ponto P o único ponto RO (P) tal que P −O − RO (P) e OP ≡ ORO (P). Outro resultado essencial é a construção do ponto médio de um segmento. Nos Elementos de Euclides a existência do ponto médio é a tese da Proposição 10 do livro I; a demonstração é aparentemente muito simples, mas baseia-se num resultado implicitamente admitido por Euclides, que é o facto de duas circunferências num plano, com centros distintos, se intersectarem exactamente em dois pontos situados em cada um dos semiplanos determinados no plano das circunferências pela recta dos raios, desde que os comprimentos dos raios das circunferências e a distância entre os respectivos centros satisfaçam às «desigualdades triangulares», ou seja, desde que nenhum destes valores seja maior ou igual à soma dos outros dois. Este resultado, embora intuitivo, não pode ser demonstrado apenas com recurso aos postulados e noções comuns de Euclides, nem com recurso aos oito Axiomas de Tarski que até agora introduzimos; é, em certo sentido, bastante mais complexo que a construção do ponto médio para a qual Euclides o utiliza. Em algumas construções rigorosas da Geometria, como a de Hilbert, resolve-se a questão introduzindo axiomaticamente algumas propriedades dos ângulos a partir das quais é possível chegar facilmente à construção do ponto médio de qualquer segmento não degenerado A B ; basta construir dois ângulos congruentes com vértices, respectivamente, A e B , um dos lados de cada ângulo contido na recta suporte de A B , com «sentidos opostos» (o lado de origem A contendo B e o de origem B contendo A ) e os restantes dois lados em semi-planos opostos determinados por essa recta. Considerando em cada um dos lados dos dois ângulos não colineares com A B um ponto a determinada distância comum • do respectivo vértice, a recta determinada por esses dois pontos intersectará A B no respectivo ponto médio, como facilmente se prova. Na construção de Tarski, no entanto, as propriedades básicas dos ângulos são obtidas como Teoremas a partir apenas dos oito Axiomas que já introduzimos, mas o preço a pagar passa pela necessidade de demonstrar previamente a existência do ponto médio de um modo inesperadamente laborioso. Para o efeito estudam-se, em primeiro lugar, algumas propriedades simples dos trios de pon133
GEOMETRIA: DA INTUIÇÃO AO RIGOR
tos (A, B,C ) que «definem um ângulo recto», no sentido preciso em que A é equidistante de C e de R B (C ); assim, estabelecem-se algumas proposições básicas acerca da «perpendicularidade» e, a partir destas, é possível executar a construção de Hilbert utilizando precisamente ângulos rectos. Aparece nesta fase a necessidade de admitir o Axioma 3.8, ou seja, a existência de, pelo menos, três pontos não colineares, uma vez que é fácil construir modelos satisfazendo aos sete primeiros axiomas nos quais existem segmentos «sem ponto médio», por exemplo, o acima referido modelo apenas com uma infinidade numerável de pontos colineares sucessivamente «igualmente espaçados» (o conjunto Z do inteiros relativos, com as relações de congruência e situado entre definidas de modo óbvio, por exemplo); é a existência de, pelo menos, uma recta r e um ponto P que a ela não pertence que permite construir uma recta perpendicular a r , em Q ∈ r , «no plano determinado por r e P » (ainda que esta propriedade possa ser formulada antes de se definir formalmente o conceito de semiplano e plano), instrumento essencial para a construção do ponto médio de um segmento. O passo seguinte pode ser a introdução do conceito de semiplano; retomando a motivação acima desenvolvida para os conceitos geométricos, recor◦ demos que uma semirecta OA pode corresponder aos pontos de uma «direcção visual» (pontos ocultados por A ou que ocultam o ponto A do nosso olhar situado ◦ em O). Determinada semirecta A B pode ser avistada como um ponto único se o ◦ nosso olhar se situar num ponto O da semirecta oposta −A B pois, por definição ◦ de semirecta oposta, nesse caso O −A −C , para todos os C de A B , ou seja «A oculta ◦ de O os pontos de A B ». Um semiplano poderá corresponder aos pontos que determinada recta r oculta do nosso olhar, situado num ponto O não pertencente a r ; para formalizar esta definição pode introduzir-se a seguinte relação entre pontos não pertencentes a r , que depois se verifica ser de equivalência: A ∼ B ⇔ A, B ∈ / r e ∃O ∈ / r, A ′ , B ′ ∈ r : O − A ′ − A e O − B ′ − B r
◦
Se A ∈/ r , r recta, o semiplano r A será exactamente a classe de equivalência de A para esta relação; r diz-se aresta do semiplano e prova-se que semiplanos iguais têm a mesma aresta. Para abreviar a linguagem podemos introduzir o conceito de «pontos A e B opostos relativamente a uma recta r » (representado por A − r − B ) através de: A − r − B ⇔ A, B ∈ / r e ∃P ∈ r : A − P − B
134
ANTÓNIO BIVAR
FIGURA 3.9
(«r oculta B do olhar situado em A »). O plano determinado por r e A , por definição, e de acordo com a situação «experimental» que pretendemos formalizar, será o conjunto: ◦
◦
r A = r A ∪ r ∪ −r A, ◦
◦
onde −r A é o semiplano oposto a r A definido analogamente ao de semirecta oposta por: ◦
−r A = {P : P − r − A} ◦
(prova-se que −r A está bem definido, ou seja, não depende de A mas apenas de ◦ ◦ ◦ r A , e −r A = r B para qualquer B tal que B − r − A ). Mais algumas propriedades básicas relativas à «incidência» de pontos, rectas e planos podem ser demonstradas nesta fase, nomeadamente o facto de três pontos não colineares pertencerem conjutamente a um e um só plano, tal como os pontos de duas rectas concorrentes ou como os pontos de uma recta e um ponto a ela exterior; também se conclui que, se dois pontos A e B pertencem a um plano, também a ele pertencem todos os pontos da recta A B . Podemos iterar o processo que conduziu à definição de plano a partir de uma recta e de um ponto a ela exterior e agora construir um «subespaço de dimensão três» a partir de um plano α e de um ponto P que não lhe pertença e, mais geralmente, por recorrência, definir «subespaços afins de dimensão n » para qualquer n ∈ N, identificando os subespaços (afins) de dimensão 0 com os conjutos unitários de pontos. Enquanto não houver qualquer limitação superior para a «dimensão do espaço» mediante a introdução de um axioma adequado a este efeito, é possível 135
GEOMETRIA: DA INTUIÇÃO AO RIGOR
FIGURA 3.10
construir modelos para a Axiomática até agora introduzida contendo subespaços de qualquer dimensão n . Tais subespaços contêm as rectas determinadas por quaisquer dois dos seus pontos; podemos designar mais geralmente por subespaços afins quaisquer conjuntos não vazios de pontos com esta propriedade. Os subespaços afins «de dimensão finita», ou seja, de dimensão n para algum n ∈ N, caracterizam-se por serem «gerados» por um número finito de pontos, ou seja, para cada um deles existe um conjunto finito de pontos (em número igual a mais um que a dimensão do espaço) tais que o subespaço em questão é igual à intersecção de todos os subespaços afins contendo esses pontos. Neste quadro geral podem estudar-se questões relativas às dimensões das intersecções de subespaços, pode mostrar-se que para «atingir» um ponto P fixado arbitrariamente num subespaço α de dimensão n basta «construir» no máximo n rectas a partir de um sistema de geradores de α, começando por «ligar» dois desses geradores adequadamente escolhidos e, em seguida, considerando sucessivamente rectas de ligação de pontos pertencentes apenas ao sistema de geradores ou a alguma recta de ligação previamente construída, etc. Com o objectivo de preparar o estudo dos ângulos podemos agora introduzir uma nova isometria auxiliar, a reflexão em relação a uma recta; depois de estabelecidas algumas propriedades básicas, podemos utilizá-las para obter um resultado de congruência de «triângulos rectângulos com catetos iguais», e, em seguida, justificar a possibilidade do chamado «transporte de triângulo» para determinado semiplano, com um dos lados «colocado na respectiva aresta onde for requerido».
136
ANTÓNIO BIVAR
O estudo dos ângulos pode então ser finalmente abordado, com a definição de ângulo e a noção de congruência esboçadas na secção anterior; a partir deste ponto, e estudadas algumas propriedades elementares destas novas noções, torna-se possível demonstrar os clássicos «casos de igualdade de triângulos», para além de outros resultados simples relativos a lados e ângulos destas figuras geométricas. Conceito essencial a introduzir será evidentemente o de «ordenação» das amplitudes dos ângulos, entendidas como classes de congruência destes objectos geométricos; para este efeito convém definir o «conjunto dos pontos» de um ◦ ◦ ângulo ∠AO B = {OA, O B } (supondo que o ângulo não é «raso», ou seja, que não se tem A − O − B ) como o conjunto representado por ∠AO B e igual à união das • ◦ semirectas OP tais que A − P − B : ∠AO B= •
∪
◦
OP
A−P−B
FIGURA 3.11 •
Tal conjunto representa intuitivamente os pontos ocultados por A B ou susceptíveis de ocultar pontos de A B do nosso olhar situado em O ; constitui assim o chamado «ângulo de visão» determinado por A B a partir de O e prova-se que determina o ângulo, ou seja, se forem iguais os conjuntos de pontos de «dois» ângulos, estes coincidem (têm o mesmo vértice e os mesmos lados). É natural ′O B ′ (de vértice comum O ) forem dizer que se dois «ângulos de visão» ∠AO B ∠A • • ′ ′ tais que ∠AO B ⊂ ∠A O B , então o segundo corresponde a um ângulo de «maior • • amplitude», no sentido lato. A partir daqui é fácil definir uma relação ≤ entre ângulos arbitrários, obrigando a que seja invariante por substituição de um dos ângulos por outro com ele congruente, ou seja, obrigando a que possa servir para definir uma relação de ordem entre amplitudes de ângulos. Note-se que também 137
GEOMETRIA: DA INTUIÇÃO AO RIGOR
no caso dos comprimentos de segmentos ou distâncias entre pontos é possível construir a ordem a partir do caso particular da inclusão dos conjuntos de pontos de dois segmentos, respeitando-se assim a ideia geral inicialmente proposta (e já explicitada por Euclides) segundo a qual «uma parte de um objecto é menor que o todo», pelo menos no sentido lato. Podemos também alargar o conceito de ângulo a dois semiplanos com aresta comum e tratar, em particular, o caso de planos ortogonais e, em seguida, de rectas perpendiculares a subespaços afins. A este propósito é possível estudar o conceito de «mediatriz» ou «hiperplano mediador» de dois pontos distintos (no quadro de determinado subespaço afim), o que permite depois abordar a questão da axiomatização da dimensão, mostrando-se como é possível impor determinada dimensão ao espaço (ou seja, que os pontos pertençam todos a determinado espaço de dimensão pré-fixada e que existam pontos suficientes para garantir a existência de pelo menos um subespaço dessa dimensão) mediante a introdução de um axioma formulável apenas em termos das relações primitivas da Geometria e que, no caso da dimensão dois, por exemplo, utiliza as propriedades da referida mediatriz. Se pretendermos estudar a Geometria em determinada dimensão não inferior a 2, devemos então substituir o Axioma 3.8, como acima foi anunciado, por uma proposição que fixe a dimensão n do espaço, mas implicando em particular o próprio Axioma 3.8 («a dimensão do espaço é, pelo menos, igual a 2»); assim todas as proposições até agora obtidas poderão ser demonstradas mesmo depois de efectuada essa substituição.
3.5 PARALELISMO E O AXIOMA DE EUCLIDES O conjunto de resultados referidos na secção anterior permite avançar para um estudo adequado do paralelismo, introduzindo-se, para a obtenção de algumas proposições, um «axioma de Euclides», desempenhando o papel do famoso quinto postulado dos Elementos. Uma das versões propostas por Tarski pode ser formulada no quadro das noções associadas à de ângulo; se ∠AO B for «não degenerado», ou seja, se para além de não ser «raso» também não for «nulo» (OA ̸= O B ), os resultados entretanto demonstrados permitem concluir que ∠AO B , para • além de conter os pontos dos lados do ângulo, é constituído pela intersecção de dois semiplanos, nomeadamente: ◦
◦
◦
◦
∠AO B = (OA B ∩ O B A) ∪ OA ∪ O B . •
138
ANTÓNIO BIVAR
FIGURA 3.12
Se pensarmos agora num ponto arbitrário P de ∠AO B (ângulo não degene• • • rado), se P estiver num segmento OX com X ∈ A B a «versão exterior do Axioma de Pasch», que é um teorema demonstrável apenas com recurso aos oito axiomas até agora admitidos, permite concluir que P está situado entre A (que é, evidente◦ ◦ • mente, ponto de OA ) e um ponto B ′ de O B ( B ′ pode mesmo ser escolhido em O B ). No entanto, se O − X − P (para P ̸= X , X como atrás) os axiomas que introduzimos • não permitem, em geral, mostrar que P está num segmento A ′ B ′ de extremos, respectivamente, em cada um dos lados do ângulo ∠AO B , ou seja, ao contrário • do que parece intuitivo, ∠AO B pode não ser igual à união dos segmentos A ′ B ′ • ◦ ◦ com A ′ ∈ OA, B ′ ∈ O B . Na interpretação heurística que temos utilizado para os conceitos geométricos básicos, significaria esta situação que o «ângulo de visão» determinado por um segmento A B não degenerado e não alinhado com o nosso olhar situado em O abarcaria pontos que não estão em nenhum segmento de extremos em ambos os lados do ângulo; como vimos, esses pontos não poderiam • estar em posição de ocultar da nossa vista pontos de A B , ou seja, só poderiam ser • dos pontos do espaço que o segmento A B oculta do nosso olhar situado em O . Uma das versões de Tarski para o Axioma de Euclides estabelece precisamente que esta situação nunca ocorre; a negação desta proposição é o chamado Axioma hiperbólico, válido na Geometria de Lobachewski ou hiperbólica, em que se admite, portanto, que existe pelo menos um ângulo ∠AO B e um ponto P de ∠AO B que não está em nenhum segmento «ligando» os lados do ângulo, ou • seja, que não é «visível» do ponto O se ligarmos os lados de ∠AO B por um seg139
GEOMETRIA: DA INTUIÇÃO AO RIGOR
FIGURA 3.13
mento «opaco», mas que, apesar disso, não está em nenhum destes «segmentos de ligação» entre os referidos lados (cf. figura 3.13). Em Geometria Euclidiana (não hiperbólica) podemos então enunciar como novo Axioma a seguinte proposição: Axioma 3.9 (Axioma de Euclides) Se A − X − B , O ̸= X e O − X − P então existem A ′ , B ′ tais que O − A − A ′ ,O − B − B ′ e A ′ − P − B ′ . Este enunciado não exclui alguns casos degenerados que poderiam ser demonstrados como teoremas; ou seja, poderíamos alterar o axioma tornando-o menos «exigente» («mais fraco»), mas, em contrapartida, menos sintético. Assim, por exemplo, se A,O, B forem colineares (em particular se um ou ambos os pontos A, B coincidirem com O ), as hipóteses garantem que A e B estarão na recta OX 40 , onde também está P e, portanto, podemos concluir que O, X , P, A, B são colineares. Das hipóteses também se conclui que A e B estão em semirectas opostas de origem X , um deles do lado de O e o outro do lado oposto (o lado de P , se P ̸= X ), a menos que um deles ou ambos coincidam com X ; podemos assim supor, sem perda de generalidade, que B está do lado de O (ou B = X ) e A do lado oposto (ou A = X ). Então podemos tomar B ′ = B e, se X − P − A , A ′ = A ; caso contrário, X − A − P e A ̸= P , pelo que, por intercalação, O − A − P e podemos tomar A ′ = P . Numa forma mais fraca, mas equivalente, do Axioma 3.9 poderíamos portanto acrescentar a hipótese «A,O, B não colineares» tratando-se assim apenas do caso acima analisado em que A,O, B formam um ângulo não degenerado de vértice O . Também bastaria considerar os casos em que X ̸= A, B (como é fácil con◦ ◦ cluir) e poderíamos substituir a conclusão pela mais fraca «. . . A ′ ∈ OA , B ′ ∈ O B e 40 Se A ̸= B porque nesse caso tanto O como X estarão na recta A B que será então igual a OX e se A = B porque, nesse caso, de A − X − B conclui-se que A = X = B . 140
ANTÓNIO BIVAR
A ′ , P, B ′ colineares», pois daqui seria possível depois concluir que existem pontos
nas condições da conclusão do Axioma, aplicando o «Teorema de Pasch exterior» acima referido e outros resultados básicos acerca de semirectas e semiplanos. Assim, essencialmente, podemos dizer que o Axioma de Euclides garante que se encararmos um ângulo não degenerado ∠AO B como «união de segmentos A ′ B ′ » nomeadamente dos segmentos (entendidos como pares de pontos) de ◦ ◦ ligação entre os seus lados OA e O B , o que corresponde a substituir o conjunto ◦ ◦ ◦ ◦ ◦ ◦ {OA, O B } por (OA × O B ) ∪ (O B × OA), então ∠AO B será igual à união «dos mesmos • segmentos», mas «encarados como conjuntos de pontos», ou seja, será união dos • A ′ B ′ . Ou seja, podemos, «sem perigo» cometer aqui o abuso de linguagem que consiste em identificar simultaneamente os ângulos e os segmentos de ligação entre lados de ângulos com os respectivos conjuntos de pontos.
FIGURA 3.14
Acrescentando então o Axioma de Euclides à Axiomática até agora admitida, podemos depois demonstrar resultados clássicos especificamente «euclidianos», como o facto de por um ponto exterior a uma recta r não passar mais que uma recta r ′ paralela a r (ou seja, tal que r ∩ r ′ = ; e r, r ′ complanares)41 , o facto de ser igual à amplitude de um ângulo raso a soma das amplitudes42 dos ângulos internos de um triângulo ou a equivalência entre o paralelismo de rectas e a 41 A existência de r ′ nestas condições é um teorema da Geometria absoluta, podendo ser facilmente demonstrada com recurso ao estudo previamente feito da perpendicularidade. 42 Não denimos «soma de amplitudes» de ângulos nem «soma de comprimentos» de segmentos, mas poderíamos fazê-lo facilmente de modo a traduzir as ideias intuitivas subjacentes; assim, quanto a segmentos, podemos dizer que, se A − B − C , então interessa-nos denir [A B ] + [BC ] como sendo igual a [AC ] e o Teorema 3.10 acima garante que esta denição não depende dos pontos A, B,C , mas apenas dos respectivos comprimentos, sendo sempre possível, para quaisquer segmentos A B,C D , determinar A ′ , B ′ ,C ′ tais que A ′ − B ′ −C ′ e A B ≡ A ′ B ′ , C D ≡ B ′ C ′ e, deste modo, denir a soma dos respectivos compri141
GEOMETRIA: DA INTUIÇÃO AO RIGOR
igualdade de ângulos correspondentes ou alternos internos por elas determinados. Também é possível abordar resultados mais elaborados, como os Teoremas de Pappus–Pascal e de Desargues, a partir dos quais se podem obter os resultados básicos acerca da construção de um corpo ordenado43 , incluindo elementos identificáveis com os números racionais, com a motivação geométrica que está na base da construção desta extensão do conceito de número.
3.6 MEDIDA DO COMPRIMENTO DE SEGMENTOS E CONSTRUÇÃO DO CORPO ORDENADO DA RECTA NUMÉRICA; AXIOMA DE COMPLETUDE, CORPO DOS NÚMEROS REAIS E TEOREMA DE REPRESENTAÇÃO PARA A GEOMETRIA EUCLIDIANA N-DIMENSIONAL O corpo referido no final da secção anterior pode ser constituído pelos pontos de uma recta arbitrária (doravante designada por recta numérica) em que se fixou um ponto O como «origem» e um ponto U ̸= O , de tal modo que [OU ] (comprimento do segmento OU ) será a unidade de comprimento; as operações de soma e produto são definidas através de construções geométricas (figura 3.1544 ) que mentos. Analogamente, para amplitudes de ângulos, ou seja, classes de congruência [∠POQ], podemos denir a soma na situação em que R ∈ ∠POQ (ou R ̸= O se [∠POQ] for a classe dos ângulos rasos), pondo • [∠POR]+[∠ROQ] = [∠POQ], e vericar que a soma das amplitudes de dois ângulos não degenerados ∠A BC ′ ′ ′ e ∠A B C ca bem denida, podendo ser reduzida a esta situação, considerando um ângulo ∠A BC ′′ con◦
gruente com ∠A ′ B ′ C ′ tal que C ′′ está no semiplano − B AC ; neste caso apenas nos interessa denir a soma ◦ de amplitudes se ∠C BC ′′ for raso ou se ∠C BC ′′ contiver B A , ou seja, se «ao justapormos os ângulos-par• celas não ultrapassarmos um ângulo raso», para que se mantenham algumas propriedades elementares que pretendemos atribuir à adição, como por exemplo a lei do corte. Podemos também denir ad hoc a soma com a amplitude dos ângulos nulos de maneira a que esta amplitude seja o «elemento neutro» para esta «operação». 43 Sistema algébrico dotado de duas operações binárias designadas por «adição» e «produto», denidas em determinado conjunto, e de uma relação de ordem total nesse mesmo conjunto, existindo elementos neutros distintos para ambas as operações, simétrico (inverso para a soma) para qualquer elemento e inverso (relativamente ao produto) para qualquer elemento diferente de 0 (elemento neutro para a soma). Além disso, devem valer as propriedades «habituais» das operações assim designadas (associativas, comutativas, distributivas) e ainda a «monotonia» relativamente à ordem, no sentido em que podemos adicionar o mesmo elemento a ambos os membros de determinada «desigualdade» sem a alterar, assim como multiplicar ambos os membros por um elemento maior que 0. Fixar uma relação de ordem com estas propriedades num corpo (estrutura apenas com as operações de adição e multiplicação com as propriedades acima referidas) é equivalente a xar uma parte do conjunto de base como «conjunto dos elementos positivos», o qual se supõe fechado para a soma e o produto, e acrescentar a hipótese de que tal conjunto, o conjunto reduzido ao elemento nulo e o conjunto dos simétricos dos elementos positivos constituem uma partição do corpo (cf. [Campos Ferreira, 1967], [Guerreiro, 2008]). 44 cf. [Schwabhäuser, 1983], cap. I.14 e, para outra construção do corpo, [Hartshorne, 2000], cap. 4. 142
ANTÓNIO BIVAR
◦
garantem em particular que a soma de elementos A, B de OU é compatível com a soma dos comprimentos dos segmentos OA e O B , ou seja: [O(A + B )] = [OA] + [O B ], ◦
que U é a unidade relativamente ao produto e O o elemento neutro da adição. OU é o conjunto dos elementos positivos do corpo ordenado.
FIGURA 3.15
Assim, uma vez definidas as operações e a ordem, para cada n ∈ N podemos identificar n com o elemento nU do corpo («a soma de U consigo próprio n vezes», se n ≥ 1, e igual a O se n = 0); n ou nU será, por definição, a medida do comprimento de qualquer segmento congruente com O(nU ) e este segmento é ◦ tal que existem U1 , . . . ,Un ∈ OU tais que O − U1 − U2 − · · · − Un (no sentido óbvio), sendo U1 = U e Ui Ui +1 ≡ OU , ∀i = 1, . . . , n − 1. Ou seja, esta medida traduz precisamente a ideia intuitiva de «segmento ao qual se pode justapor exactamente n vezes o segmento unidade». Tratando-se de corpo também podemos facilmente definir «submúltiplos da unidade»; fixado n ∈ N1 seja: 1 U = (nU )−1 . n
Por definição, e pelas propriedades algébricas do corpo, teremos: n
1 U n
= n(nU )−1 = n(U (nU )−1 ) = (nU )(nU )−1 = U ,
ou seja, um segmento com medida (1/n)U é congruente com OU ′ tal que «justapondo n segmentos congruentes com OU ′ extremo a extremo a partir de O na ◦ semirecta OU obtém-se OU »; trata-se assim da ideia intuitiva de segmento «com medida igual a 1/n ». Agora, se p ∈ N,q ∈ N1 podemos definir: p U =p q
1 U q
= p (qU )−1 , 143
GEOMETRIA: DA INTUIÇÃO AO RIGOR
pelo que o corpo contém elementos suficientes para traduzir a ideia intuitiva de «medida racional de um segmento», ou, seja, contém, em particular, o que pretendemos definir como os «números racionais positivos» (e portanto também, evidentemente, os negativos). Podemos agora, mais geralmente, designar por medida do comprimento [A B ] de um segmento A B , ou simplesmente medida de AB o único elemento ◦ P = |AB | de OU ∪ {O} tal que OP ≡ A B ; com esta definição todo o segmento (e portanto todo o comprimento) passa a ter medida igual a determinado elemento não negativo do corpo ordenado OU , seja esse elemento racional ou não, e é possível agora demonstrar o Teorema de Pitágoras relativo às medidas dos comprimentos dos lados de um triângulo rectângulo. Repetindo o raciocínio dos pitagóricos, que prova a incomensurabilidade da diagonal de um quadrado relativamente ao lado, é fácil concluir que este corpo contém elementos que fornecem algumas «medidas irracionais» de segmentos; com efeito, basta considerar na parte positiva da recta numérica a extremidade de um segmento de origem O congruente com a hipotenusa de um triângulo rectângulo isósceles de cateto OU , o qual pode facilmente ser construído apenas com os axiomas até agora introduzidos. A extremidade P desse segmento, atendendo ao Teorema de Pitágoras, satisfaz a P 2 = 2U , pelo que, atendendo ao referido raciocínio dos pitagóricos, P não pode ser da forma (p /q )U , com p ∈ N,q ∈ N1 ; por outras palavras, a medida do comprimento da hipotenusa do referido triângulo não é um «número racional». O corpo acima construído, apenas com recurso aos Axiomas 1 a 9 da axiomática de Tarski, é sempre aquilo que se designa por «corpo pitagórico» por conter a «raiz quadrada» dos elementos da forma A 2 + B 2 . Pelo que acabámos de referir há segmentos cujo comprimento não tem medida racional, ou seja, com a interpretação heurística acima referida, tal segmento não pode ser medido dividindo a unidade em número finito de partes iguais de tal maneira que uma delas nele «caiba exactamente um número finito de vezes». Assim, aparentemente, nem sempre podemos reduzir a medida de um segmento a um número finito de operações de contagem efectuadas com base na unidade fixada; no exemplo atrás examinado da medida da diagonal de um quadrado tomando o lado para unidade, uma vez que se obtém o único ponto P da parte positiva da recta numérica tal que P 2 = 2U , podemos utilizar a notação clássica e designar P por «raiz quadrada p p de dois» representando-o por 2U , ou simplesmente por 2 mas, só por si, esta definição não tornaria muito útil a informação de que o comprimento de deterp minado segmento «mede 2». Habitualmente pretende-se conhecer a medida 144
ANTÓNIO BIVAR
de um segmento para que se possa comparar tal segmento com outros que sejam construtíveis a partir da unidade, subdividindo-a e replicando o resultado um certo número de vezes, ou seja, com segmentos cujo comprimento tenha medida racional; neste caso sabemos a priori como obter um segmento com este comprimento a partir da unidade, efectuando uma construção geométrica simples mas o que poderíamos fazer com o conhecimento de que determinado segmento mede p 2U se só dispuséssemos de meios para construir e deslocar cópias de múltiplos e submúltiplos da unidade?45 Poderíamos utilizar propriedades algébricas elementares dos corpos ordenados para concluir, por exemplo, que: U
x . 47 Trata-se de uma adaptação do famoso Axioma de separação de Dedekind para os números reais. 146
ANTÓNIO BIVAR
axiomas; neste caso, para além de situações triviais para as quais não seria necessário o axioma de continuidade, podemos supor que A , B ̸= ;, A ∩ B = ;48 . Mesmo nesta situação, se existir P ∈ A tal que OP tem comprimento máximo relativamente aos OA com A ∈ A , ou P ∈ B tal que OP tem comprimento mínimo relativamente aos O B com B ∈ B , tal ponto P também satisfaz à condição da conclusão do axioma, como é fácil verificar (no primeiro caso, por exemplo, por definição teremos O − A − P para todo o A ∈ A , e como, por hipótese, porque P ∈ A , B ∈ B ⇒ O − P − B , virá também A − P − B ). Deste modo, o axioma apenas impõe uma nova condição quando A , B ̸= ;, A ∩B = ; e não existe P que realize o máximo dos comprimentos dos OA com A ∈ A , nem Q que realize o mínimo dos comprimentos dos O B com B ∈ B ; nesse caso o axioma impede, por exem• • plo, que, para algum A ∈ A , B ∈ B , {A ∩ A B , B ∩ A B } possa constituir uma parti• • ção de A B (o ponto P cuja existência é garantida pelo Teorema estará em A B , não podendo estar nem em A nem em B , senão realizaria respectivamente o máximo ou o mínimo atrás referidos). Interpretando este resultado em termos das «direcções visuais» que temos invocado para atribuir significado físico aos con• ceitos geométricos, A B pode representar os pontos que simultaneamente ocultam B e são ocultados por A do olhar situado em O ; assim, um objecto pontual • «opaco» que ocupasse a posição de um ponto de A ∩ A B , de acordo com as hipóteses feitas acerca de A , B , poderia ser sempre colocado numa posição mais afastada de O sem sair de A e continuando a «ocultar B e a ser ocultado por A » (uma vez que não existe o «máximo» referido). Analogamente, se o objecto pon• tual estivesse situado num ponto de B ∩ A B , poderíamos sempre aproximá-lo de • O sem sair de B ∩ A B . Nestas condições o axioma de continuidade garante que há uma posição P em que poderíamos colocar o objecto pontual, de modo que ocultasse todos os pontos de B e fosse ocultado por todos os pontos de A (mantendo o olhar em O ); a «continuidade» significa então que, se pudermos afastar indefinidamente o objecto pontual do nosso olhar situado em O sem sair de A e aproximá-lo indefinidamente sem sair de B , então podemos sempre colocar o 48 Se algum dos conjuntos for vazio, uma análise lógica da hipótese e da conclusão do Axioma permite concluir que tanto uma como outra são sempre verdadeiras, podendo O e P ser escolhidos arbitrariamente, já que as implicações que integram a hipótese e a conclusão são sempre verdadeiras, por terem antecedente sempre falso. No caso A , B ̸= ;,se A ∩ B ̸= ;, qualquer ponto P nessa intersecção satisfaz à conclusão do axioma, admitindo a respectiva hipótese (com efeito, dessa hipótese resulta que O −P − B e O − A − P , donde A − P − B , para quaisquer A ∈ A , B ∈ B ); aliás, é fácil concluir que não pode existir mais que um ponto na intersecção pois se P, P ′ ∈ A ∩B virá simultaneamente O −P −P ′ e O −P ′ −P , donde P ′ = P , pela anti-simetria da relação situado entre (Teorema 3.8, atendendo à «simetria exterior» – Teorema 3.6). 147
GEOMETRIA: DA INTUIÇÃO AO RIGOR
objecto pontual numa posição «intermédia» que, de alguma maneira, «preenche» a «descontinuidade» entre A e B .
FIGURA 3.16
Prova-se, utilizando este novo axioma, que o corpo ordenado acima referido, construído com base numa «recta numérica» é o que se chama «completo»; em particular, são positivas agora as respostas às duas questões acima postas. Demonstremos, por exemplo, que para qualquer elemento positivo A existe sempre n ∈ N1 tal que (1/n)U < A , ou seja, tal que O − (1/n )U − A ; este resultado é consequência imediata das propriedades do corpo construído sobre a recta numérica e da chamada propriedade arquimediana, ou seja: Teorema 3.14 (propriedade arquimediana) Se O ̸= U e O − U −Q então existe n ∈ N1 e U1 , . . . ,Un tal que U = U1 ,Ui Ui +1 ≡ OU , ∀i = 1, . . . , n − 1, O − U1 − U2 − · · · − Un e O −Q − Un . Demonstração: Podemos facilmente construir por recorrência (até de maneira única) uma sucessão de pontos Un satisfazendo, para todo o n , às propriedades consideradas no enunciado do Teorema, excluindo a última (O − Q − Un ); basta, para tal, utilizar o axioma de transporte de segmento. Suponhamos que para todo o n ∈ N1 não se tinha O −Q −Un ; como O −U −Q e O −U −Un , então, necessariamente, O −Un −Q, ∀n ∈ N1 . Seja, então, A = {Un : n ∈ N1 }, B = {X : O −Un −X , ∀n ∈ N1 }; A e B satisfazem obviamente às hipóteses do Axioma 3.10, pelo que existirá P tal que Un −P −X , ∀n ∈ N1 , X ∈ B . Em particular, se P ′ ̸= P e O −P ′ −P vem certamente P ′ ∈/ B (caso contrário seria também O − P − P ′ , consequência imediata de O −U −P ′ e U −P −P ′ , por exemplo, e, portanto, P ′ = P ) e como B ̸= ; (porque pelo menos Q ∈ B ) temos evidentemente P ∈ B (resulta, por exemplo, de O − Un −Q 148
ANTÓNIO BIVAR
e Un − P −Q que O − Un − P , para qualquer n ∈ N1 ); ou seja, em termos da ordem da recta numérica determinada por O e U , P é o mínimo de B . Tomando então P ′ tal que O − P ′ − P e P ′ P < OU , P ′ ̸= P , como P ′ ∈ / B existirá n ∈ N1 tal que não se tem O −Un −P ′ e como O −Un −P e O −P ′ −P terá de ser forçosamente O −P ′ −Un . Agora é fácil concluir que não se poderia ter Un −Un+1 − P (já que P ′ −Un −Un +1 e P ′ P < OU = Un Un +1 ), donde também não pode ser O −Un +1 − P (pois juntamente com O −Un −Un+1 daria Un −Un+1 −P ), o que contraria as propriedades de P . Esta contradição prova que existe n ∈ N1 tal que O −Q − Un . Na linguagem do corpo construído na recta numérica determinada por O,U a propriedade arquimediana significa que qualquer elemento positivo é «ultrapassado» por um elemento nU para n suficientemente grande; ora: P < nU ⇔ (nU )−1 < P −1 ⇔
1 U < P −1 , n
pelo que do Teorema 3.14 deduzimos imediatamente que qualquer elemento positivo é minorado por um elemento (1/n)U para n suficientemente grande49 , o que permite demonstrar a resposta positiva à questão 1) acima sem qualquer dificuldade. Do Axioma de Continuidade também se deduz facilmente que é positiva a resposta a 2); estes resultados permitem concluir, em particular, que qualquer medida de segmento pode ser aproximada tanto quanto o desejarmos por uma medida «racional», ou seja, podemos «medir» aproximadamente qualquer segmento por um processo como o acima descrito (dividir a unidade em número finito de partes iguais e contar quantas vezes a sub-unidade assim construída «cabe» no segmento a medir). Também se prova que quaisquer dois corpos ordenados completos são isomorfos, ou seja, existe entre eles uma bijecção que respeita as operações e a ordem; podem todos assim identificar-se e constituem modelos do que se chama o corpo R dos números reais. Assim, qualquer modelo da Geometria Euclidiana permite a construção de uma infinidade de modelos para o corpo dos números reais, com suporte em qualquer «recta numérica» (basta fixar uma recta e dois dos seus pontos O,U ); reciprocamente RN com as relações de equidistância e situado entre habituais da «Geometria analítica» constitui modelo para esta Axiomática, fixada adequadamente a dimensão do espaço (um número natural N ≥ 2) 49 Embora no Teorema apenas se garanta que Q ≤ Un (desigualdade lata), como é óbvio teremos como consequência imediata Q < Un+1 . 149
GEOMETRIA: DA INTUIÇÃO AO RIGOR
através de um axioma que substitua o Axioma 3.8 acima. Prova-se além disso que, neste caso, todos os modelos são isomorfos, ou seja, a Axiomática de Tarski para a Geometria Euclidiana N -dimensional é categórica. Uma vez que os modelos até agora apresentados para R (todos isomorfos) se baseiam numa axiomática da Geometria e o modelo (também único a menos de isomorfismo) referido para a Geometria tem por base R, há que desfazer o «círculo vicioso» para que possamos garantir a existência de modelos para as duas referidas entidades. Ora é possível construir um corpo ordenado completo a partir de uma axiomática da Teoria dos Conjuntos, com base numa teoria de cardinais que inclui os números naturais, a partir dos quais se podem construir sucessivamente os inteiros relativos, os racionais e, finalmente, o conjunto R dos reais, com operações e uma relação de ordem que lhe conferem estrutura de corpo ordenado completo, apenas utilizando os termos primitivos e axiomas da Teoria dos Conjuntos (cf. [Bourbaki, 1967], [Guerreiro, 2008]).
150
ANTÓNIO BIVAR
BIBLIOGRAFIA COMENTADA [Bivar Weinholtz, 2004] Bivar Weinholtz, A., 2004: Da Contagem ao Contínuo: Uso e Construção dos Números Reais – http://www.math.ist.utl.pt/ talentos/Apresentacoes/04_notas_bivar.pdf –notas do curso leccionado na Escola de Verão do Programa Gulbenkian Novos Talentos em Matemática, Lisboa, 6–10 de Setembro de 2004, Fundação Calouste Gulbenkian. [Abordagem da teoria dos números reais partindo dos conceitos intuitivos e do respectivo uso concreto e informal, até se chegar a uma construção rigorosa no quadro da Teoria dos Conjuntos «à la Bourbaki». Pensado para os «Novos Talentos», ou seja, para alunos especialmente motivados, nalistas do ensino secundário ou frequentando o 1º ciclo universitário] [Bourbaki, 1967] Bourbaki, N., 1967: Elements of Mathematics, Theory of Sets, Hermann, Paris. [A versão «bourbakista» dos fundamentos da Matemática, na tradição da escola formalista.] [Campos Ferreira, 1967] Campos Ferreira, J., 1987: Introdução à Análise Matemática, Fundação Calouste Gulbenkian, Lisboa. [Contém a teoria dos números reais pela via axiomática.] [Dionísio, 2004] Dionísio, J. J., 2004: Fundamentos da Geometria, Textos de Matemática, nº 18, Departamento de Matemática, FCUL. [Abordagem da Geometria baseada essencialmente na Axiomática de Hilbert, embora o tratamento da medida de segmento e ângulo pressuponha já os números reais. Adequado a um curso universitário introdutório.] [Guerreiro, 2008] Guerreiro, J. S., 2008: Curso de Análise Matemática, Escolar Editora, Lisboa. [Contém uma abordagem da teoria construtiva dos números reais a partir da teoria dos conjuntos e dos cardinais.] [Gupta, 1965] Gupta, H. N., 1965: Contributions to the Axiomatic Foundations of Geometry, Doctoral Dissertation, University of California,
Berkeley. [Tese de doutoramento em que se apresentam resultados novos relativos à axiomatização da Geometria, nomeadamente efectuando-se a última redução conhecida do número de axiomas inicialmente propostos por Tarski.] [Hartshorne, 2000] Hartshorne, R., 2000: Geometry: Euclid and Beyond, Springer, New York. [Abordagem da Geometria Euclidiana e Hiperbólica baseada numa análise pormenorizada dos «Elementos» de Euclides e da Axiomática de Hilbert; exposição com grande preocupação pedagógica, que conduz o leitor dos estádios mais elementares da Geometria até desenvolvimentos sosticados e actuais.] [Hilbert, 1952] Hilbert, D., 1952: Fundamentos da Geometria, Instituto para a Alta Cultura. [Tradução portuguesa da conhecida obra de Hilbert.] [Schwabhäuser, 1983] Schwabhäuser, W., Szmielew, W., Tarski, A., 1983: Metamathematische Methoden in der Geometrie, Springer-Verlag, Berlin, Heidelberg, New York, Tokyo. [Parece ser o único livro de texto contendo uma exposição «completa» da Geometria Euclidiana segundo a Axiomática de Tarski, o que constitui a primeira parte da obra; na segunda parte abordam-se questões lógicas e metamatemáticas relativas aos fundamentos das Geometrias euclidiana e não-euclidianas. É escrito em alemão, não se conhecendo qualquer tradução.] [Tarski, 1999] Tarski, A., Givant, S., 1999: «Tarski’s System of Geometry», The Bulletin of Symbolic Logic, 5 (2), pp. 175–204. [Análise da Axiomática de Tarski, relatando a respectiva evolução e comparando-a com abordagens alternativas da Geometria.] [Ventura Araújo, 1998] Curso de Geometria, Gradiva. [Abordagem da Geometria baseada essencialmente na Axiomática de Birkhoff; dirigido a estudantes universitários.]
151
4 CENTROS DE GRAVIDADE João Filipe Queiró
4.1 INTRODUÇÃO A noção de centro de gravidade de uma figura no plano ou no espaço presta-se a várias aplicações geométricas e físicas, bem como a possíveis actividades escolares interessantes. Neste texto apresentaremos a definição de centro de gravidade para vários tipos de figuras e conjuntos de pontos, provaremos algumas propriedades e faremos referência a algumas aplicações sugestivas. A definição intuitiva de centro de gravidade (ou centro de massa, ou baricentro, ou centróide) de uma figura no plano ou no espaço — figura que pode ser apenas um conjunto finito de pontos, e que se supõe dotada de massa — é a de que se trata do ponto em que, para efeitos de equilíbrio, podemos supor concentrada toda a massa da figura.
4.2 CENTRO DE GRAVIDADE DE UM CONJUNTO FINITO DE PONTOS MATERAIS Começamos pela situação mais simples de todas: a figura constituída apenas por dois pontos P1 e P2 , estando em cada um colocada uma massa. Chamemos m 1 e m 2 , respectivamente, a essas massas.
FIGURA 4.1
Pelo chamado «princípio do equilíbrio de Arquimedes», que é simples ilustrar experimentalmente, o centro de gravidade deste sistema de dois pontos é o ponto C do segmento [P1 , P2 ] que satisfaz o seguinte: sendo d 1 e d 2 as distâncias de C a P1 e P2 , respectivamente, deverá ter-se m1d 1 = m2d 2. 153
CENTROS DE GRAVIDADE
Se considerarmos um eixo que contenha o segmento [P1 , P2 ] e nesse eixo introduzirmos coordenadas, de forma que a de P1 seja x 1 , a de P2 seja x 2 e a de C seja x C , a condição fica m 1 (x C − x 1 ) = m 2 (x 2 − x C ).
Resolvendo esta equação, obtemos xC =
m 1x 1 + m 2x 2 , m1 + m2
coordenada que nos permite localizar o ponto C . Uma outra forma de caracterizar o ponto C obtém-se utilizando a linguagem vectorial. Usando vectores, a penúltima igualdade pode escrever-se assim: −→ −→ − → m 1C P 1 + m 2C P 2 = 0 .
Podemos usar a generalização desta condição para definir o centro de gravidade um número qualquer de pontos com massas, ou pontos materiais, no plano −→ ou no espaço, em que se supôs fixado um referencial. A notação A B significa simplesmente B − A . Teorema 4.1 Sejam P1 , P2 , …, Pk pontos em que estão colocadas massas m 1 , m 2 , …, m k . Então, existe um e um só ponto C tal que k ∑
−→ − → mi C Pi = 0 .
i =1
Demonstração. Da igualdade k ∑
− → m i (Pi − C ) = 0
i =1
sai que C =
m 1 P1 + m 2 P2 + · · · + m k Pk m1 + m2 + · · · + mk
o que prova a existência e a unicidade.
Definição 4.1 Ao ponto C referido no teorema anterior chamamos centro de gravidade do conjunto de pontos materiais P1 , P2 , . . . , Pk .
154
JOÃO FILIPE QUEIRÓ
É simples ver que o ponto em causa não depende do referencial escolhido, sendo portanto uma entidade intrinsecamente ligada ao conjunto de pontos materiais dados. Note-se como esta definição concretiza a ideia intuitiva do centro de gravidade como a «média ponderada» dos pontos materiais em causa. Se os k pontos P1 , P2 , . . . , Pk pertencerem a um plano e tiverem coordenadas (x 1 , y 1 ), (x 2 , y 2 ), . . . , (x k , y k ) em relação a um referencial fixado nesse plano, temos as seguintes fórmulas para as coordenadas do centro de gravidade desse sistema de pontos: xC =
m 1x 1 + m 2x 2 + · · · + m k x k m1 + m2 + · · · + mk
e yC =
m 1 y1 + m 2 y2 + · · · + m k yk . m1 + m2 + · · · + mk
Se as massas m 1 , m 2 , . . . , m k forem todas iguais, estas fórmulas simplificam-se para xC =
x1 + x2 + · · · + xk k
e yC =
y1 + y2 + · · · + yk . k
Ou seja, no caso de as massas serem todas iguais, a localização do centro de gravidade não depende das massas mas apenas das posições dos pontos: C=
1 (P1 + P2 + · · · + Pk ). k
E as coordenadas do centro nesse caso são simplesmente as médias aritméticas das coordenadas dos pontos. As fórmulas das coordenadas do centro são exactamente análogas no caso de os pontos estarem no espaço, com a única diferença de que nesse caso temos três coordenadas em vez de duas. Uma actividade escolar possível é calcular o centro de gravidade de vários sistemas de pontos. Uma propriedade muito importante do centro de gravidade de um conjunto de pontos materiais é a sua «associatividade»: se agruparmos os pontos nuns tantos subconjuntos, o centro de gravidade do conjunto total é o centro do conjunto dos centros dos subconjuntos, cada um ponderado pela massa total dos pontos do respectivo subconjunto. Para não sobrecarregar a escrita, vamos provar esta propriedade apenas no caso em que dividimos o conjunto de k pontos P1 , P2 , . . . , Pk em dois subconjuntos: P1 , . . . , Pj e Pj +1 , . . . , Pk . Designemos por C ′ o centro de gravidade dos primeiros j 155
CENTROS DE GRAVIDADE
pontos e por C ′′ o dos restantes. Ponhamos também m ′ = m 1 + · · · + m j e m ′′ = m j +1 + · · · + m k . Temos então C=
m 1 P1 + m 2 P2 + · · · + m k Pk m1 + m2 + · · · + mk (m 1 P1 + · · · + m j Pj ) + (m j +1 Pj +1 + · · · + m k Pk ) = (m 1 + · · · + m j ) + (m j +1 + · · · + m k ) m m j +1 Pj +1 + · · · + m k Pk 1 P1 + · · · + m j Pj m′ + m ′′ m1 + · · · + m j m j +1 + · · · + m k = ′ ′′ m +m m ′ C ′ + m ′′ C ′′ = m ′ + m ′′
que é o centro de gravidade dos pontos C ′ , com massa m ′ , e C ′′ , com massa m ′′ .
4.3 CENTRO DE GRAVIDADE DE UMA FIGURA PLANA QUALQUER Passamos agora à noção de centro de gravidade para figuras quaisquer, não necessariamente constituídas por um número finito de pontos. Começamos pelo caso plano. Aqui é mais difícil apresentar uma definição formal. Intuitivamente, o centro de gravidade de uma figura plana é o ponto onde a figura se equilibra se a pousarmos no bico de um lápis. Como definir este ponto de forma matematicamente rigorosa? Como encontrar o centro de gravidade de uma figura como a figura 4.2? Pensamos nesta figura como uma placa plana R feita de um material cuja densidade pode variar de ponto para ponto. Uma ideia para determinar o centro é aproximar a figura dada usando rectângulos. Fixando um sistema de eixos no plano da figura, a densidade é uma função real de duas variáveis reais δ(x , y ). Aproximamos então a figura R pela reunião de um número finito de rectângulos R i e em cada um destes escolhemos um ponto qualquer (x i , y i ). Claramente, uma aproximação para a massa do rectângulo R i é dada por δ(x i , y i )· área de R i .
Colocando, para cada i, esta massa aproximada no ponto (x i , y i ), obtemos um número finito de pontos com massas. O centro deste sistema de pontos é uma aproximação natural para o centro de gravidade C da figura R . Recordando as 156
JOÃO FILIPE QUEIRÓ
FIGURA 4.2
FIGURA 4.3
fórmulas vistas anteriormente, as coordenadas de C podem, portanto, ser aproximadas da seguinte forma: ∑ xC t
i x i · δ(x i , y i ) · área de R i ∑ i δ(x i , y i ) · área de R i
∑
e
yC t
i y i · δ(x i , y i ) · área de R i ∑ i δ(x i , y i ) · área de R i
Se agora tomarmos rectângulos cada vez mais pequenos na aproximação da figura, vamos obtendo aproximações cada vez melhores para x C e yC . Fazendo o tamanho dos rectângulos tender para zero, com aproximações cada vez melhores 157
CENTROS DE GRAVIDADE
da figura, obtemos, no limite, expressões exactas para as coordenadas do centro de gravidade de R : ∫∫ x C = ∫∫
R
x δ(x , y ) d x d y
R
δ(x , y ) d x d y
∫∫
e
yC = ∫∫R
y δ(x , y ) d x d y
R
δ(x , y ) d x d y
.
∫∫
Note-se que o denominador de ambas as expressões, R δ(x , y ) d x d y , é a massa total da figura. Em bom rigor, o que estamos a fazer é a definir o centro de gravidade de R através destas expressões. No caso de a densidade δ(x , y ) ser constante — isto é, de a placa ser homogénea — as expressões simplificam-se para: ∫∫
x dx dy x C = ∫∫R dx dy R
∫∫
e
yC = ∫∫R
y dx dy
R
dx dy
.
Ou seja, no caso homogéneo, a localização do centro de gravidade não depende da densidade mas apenas da forma da figura. O centro, neste caso, é portanto um ponto com uma caracterização apenas geométrica. Podemos notar que ∫∫ o denominador de ambas as expressões, R d x d y , é simplesmente a área da figura (que é a massa total no caso da densidade constante 1). Da definição deduz-se com facilidade a associatividade do centro de gravidade neste outro caso: se dividirmos uma figura R em partes, o centro de gravidade da figura total é o centro do conjunto dos centros das partes, supondo colocada em cada um desses pontos a massa da respectiva parte. A definição do centro de gravidade usando integrais duplos não é adequada para estudantes do Ensino Secundário, pelo que vamos abordar o assunto de uma forma mais elementar.
4.4 CENTRO DE GRAVIDADE DE UMA FIGURA PLANA HOMOGÉNEA POLIGONAL A partir de agora consideramos só figuras homogéneas, isto é, que supomos de densidade constante (igual a 1, sem perda de generalidade). A questão do centro de gravidade é, então, um assunto puramente geométrico. Para figuras muito simétricas — um círculo, um rectângulo, um losango — o centro de gravidade coincide com o centro de simetria.
158
JOÃO FILIPE QUEIRÓ
FIGURA 4.4
Passemos agora a figuras planas de outro tipo, sem simetrias, começando por um vulgar triângulo.
FIGURA 4.5
Um raciocínio muito bonito de Arquimedes permite encontrar facilmente o centro de gravidade desta figura. Suponhamos o triângulo dividido em tiras muito finas conforme a ilustração 4.6. Sendo cada tira tão fina que podemos pensar nela como um rectângulo, o seu centro de gravidade é fácil de achar e, obviamente, todos esses centros estão alinhados sobre a mediana [A 1 ,Q] indicada na figura. Pela propriedade associativa atrás referida, o centro de gravidade do triângulo tem também de estar sobre essa mediana.
159
CENTROS DE GRAVIDADE
FIGURA 4.6
Repetindo o raciocínio com tiras paralelas aos outros lados do triângulo, concluímos que o centro de gravidade do triângulo tem de estar sobre as outras duas medianas e, portanto, é o ponto de intersecção das três medianas do triângulo.
FIGURA 4.7
Note-se que, de passagem, este raciocínio prova que as três medianas do triângulo de facto se intersectam num ponto. É simples mostrar que o centro divide cada mediana na proporção de um
160
JOÃO FILIPE QUEIRÓ
para dois.1 Esta observação permite tirar uma conclusão interessante. Suponhamos que temos três pontos com três massas iguais. O centro do sistema formado por dois deles é obviamente o ponto médio do segmento que os une. Colocando aí as duas massas desses pontos, vemos que o centro do sistema formado por esse ponto médio e pelo terceiro dos pontos iniciais, além de estar sobre o segmento que os une — que é uma mediana do triangulo cujos vértices são os três pontos dados — tem, pelo princípio do equilíbrio de Arquimedes, de dividir esse segmento na proporção um para dois.
FIGURA 4.8
Ou seja, o centro de gravidade de um triângulo, suposto homogéneo, coincide com o centro do sistema formado pelos três vértices do triângulo, supondo lá colocadas três massas iguais e, portanto, as suas coordenadas são as médias aritméticas das coordenadas dos vértices. Designando os vértices por A 1 , A 2 , A 3 e o centro de gravidade por C , temos então 1 C = (A 1 + A 2 + A 3 ). 3
Vemos assim que a determinação dos centros de triângulos é muito fácil, seja geometricamente — é o ponto de intersecção das medianas — seja algebricamente — é a média aritmética dos três vértices. Para polígonos com mais de três lados não é verdade, em geral, que as coordenadas do centro de gravidade sejam as médias aritméticas das coordenadas dos vértices. 1 A demonstração, que é um bom exercício de Geometria, pode ser vista, por exemplo, em (Araújo, 1998). 161
CENTROS DE GRAVIDADE
Como exemplo, consideremos o seguinte quadrilátero:
FIGURA 4.9
Nesta figura, C é o centro de gravidade do quadrilátero e M é o ponto cujas coordenadas são as médias aritméticas das coordenadas dos quatro vértices (ou seja M é o centro de gravidade do sistema formado pelos quatro vértices, com massas iguais). Por um teorema devido a Varignon, sabe-se que os pontos médios dos lados de qualquer quadrilátero são os vértices de um paralelogramo. Prova-se que o centro de gravidade dos quatro vértices do quadrilátero é exactamente o centro desse paralelogramo. Quanto ao centro de gravidade do quadrilátero, pode obter-se dividindo-o em dois triângulos e usando a associatividade. Ou, então, pode recorrer-se a um teorema devido a Wittenbauer, que afirma o seguinte: se dividirmos cada lado do quadrilátero em três partes iguais e prolongarmos os segmentos de recta que unem os pontos de trisecção mais próximos de cada vértice, obtemos um paralelogramo. Prova-se que o centro de gravidade do quadrilátero é o centro desse paralelogramo. Uma actividade escolar possível é ilustrar os Teoremas de Varignon e Wittenbauer em vários quadriláteros e estudar as respectivas demonstrações2 . Voltando a polígonos arbitrários, é simples ver que qualquer polígono pode ser dividido em triângulos e, portanto, pela «associatividade», a determinação do centro de gravidade de um polígono homogéneo é também fácil: basta colocar no 2 Ver por exemplo (Coxeter, 1961).
162
JOÃO FILIPE QUEIRÓ
centro de cada um dos triângulos uma massa igual à sua área e encontrar o centro de gravidade do conjunto de pontos com massas assim obtido.
FIGURA 4.10
A área de cada triângulo pode ser calculada, usando as coordenadas dos vértices, recorrendo ao bem conhecido Teorema de Herão: Teorema 4.2 Dado um triângulo cujos lados medem a , b e c , a sua área é igual a s (s − a )(s − b )(s − c ) , onde s = a +b2 +c .
p
Uma actividade escolar que se pode propor a este respeito é procurar e expor demonstrações do Teorema de Herão3 . Dado um polígono, é um bom exercício prático usar uma folha de cálculo para determinar o seu centro de gravidade: registam-se os vértices do polígono (através das suas coordenadas); escolhe-se uma triangulação; em seguida, para cada triângulo, calculam-se as medidas dos lados, a área e o centro; finalmente, com os dados já obtidos, encontra-se o centro do polígono.
4.5 TRIANGULAÇÃO APROXIMADA DE UMA FIGURA PLANA HOMOGÉNEA NÃO POLIGONAL Para uma figura plana não poligonal podemos fazer algo de parecido. Retomemos o exemplo de há pouco (no caso homogéneo); veja-se a figura 4.11. Uma ideia simples e prática é aproximar a figura dada por uma figura poligonal e calcular o centro desta última. 3 Ver por exemplo (Araújo, 1998). 163
CENTROS DE GRAVIDADE
FIGURA 4.11
FIGURA 4.12
Com esta técnica da «triangulação» conseguimos boas aproximações para o centro de gravidade de figuras planas (homogéneas).
4.6 CENTRO GEOGRÁFICO DE PORTUGAL CONTINENTAL Um exemplo de aplicação é o cálculo do centro de gravidade de Portugal (entendido, para este efeito, apenas como o território continental, sem incluir as ilhas portuguesas no Atlântico). Como o país é muito pequeno relativamente ao perímetro da Terra, não há erro sensível em desprezar a esfericidade do globo terrestre e considerar o território como plano. Temos, portanto, uma figura plana e homogénea. O problema é puramente geométrico e o ponto que procuramos poderá chamar-se «centro geométrico» ou «centro geográfico» de Portugal. 164
JOÃO FILIPE QUEIRÓ
O resultado deste trabalho está descrito no artigo (Queiró, 2009). Aí usei integrais duplos, mas o resultado foi confirmado por triangulação. O ponto obtido (a vermelho no mapa seguinte) está a cerca de 11 km a leste e 3 km a sul do Pico da Melriça, o centro da rede geodésica portuguesa (a preto no mapa).
FIGURA 4.13
O centro geográfico de Portugal encontra-se entre as povoações de Arganil e Amêndoa, no concelho de Mação, distrito de Santarém.
FIGURA 4.14
É possível conceber várias actividades escolares em torno de ideias deste 165
CENTROS DE GRAVIDADE
tipo. Um exemplo é calcular o centro geométrico do recreio de uma escola ou de um terreno próximo, se se tratar de figuras irregulares. Outra possibilidade é calcular o centro da freguesia ou do concelho em que se situa a escola. Será necessário dispor de mapas aos quais se aplicará a triangulação.
4.7 O CENTRO DEMOGRÁFICO DE PORTUGAL CONTINENTAL Outro possível «centro» de Portugal é o que se pode chamar centro de gravidade demográfico do país. A definição rigorosa seria o centro de gravidade do sistema de pontos constituído por todos os habitantes do território, cada um na sua posição (e todos com a mesma massa, o que torna a questão puramente geométrica). Como calcular tal ponto em cada momento seria obviamente impraticável, simplifiquei o problema olhando para os duzentos e setenta e oito concelhos do continente e, para cada um deles, supondo a respectiva população concentrada na sede do concelho.
FIGURA 4.15
Note-se que, ao contrário do centro geográfico, o centro demográfico de Portugal não é fixo, porque a distribuição da população pelo território vai mudando com o tempo.
166
JOÃO FILIPE QUEIRÓ
Podemos utilizar as fórmulas vistas no início para um conjunto finito de pontos com massas. Os pontos são as sedes dos concelhos, cujas coordenadas geográficas foi necessário registar. As massas são as populações dos concelhos, apuradas pelos recenseamentos oficiais. Fiz o cálculo do centro demográfico para os catorze recenseamentos realizados em Portugal desde o século XIX, nos anos de 1864, 1878, 1890, 1900, 1911, 1920, 1930, 1940, 1950, 1960, 1970, 1981, 1991 e 2001. O número de concelhos desde 1864 manteve-se bastante estável, o que facilitou as coisas. Os únicos novos concelhos desde então foram o Entroncamento (que aparece pela primeira vez no recenseamento de 1930), Amadora e Vendas Novas (1970), Odivelas, Trofa e Vizela (2001).
FIGURA 4.16
O centro demográfico de Portugal encontrava-se, em 1864, perto de S. Miguel de Poiares, cerca de 17 km a leste de Coimbra. Depois moveu-se lentamente para sul e um pouco para oeste, até 1930, altura em que o movimento passou a ser para oeste. O salto mais pronunciado deu-se entre 1960 e 1970, o que corresponde sem dúvida à forte emigração que se verificou nessa década a partir dos meios rurais, nomeadamente do interior. Em 2001, o centro demográfico encon-
167
CENTROS DE GRAVIDADE
trava-se cerca de 30 km a su-sudoeste de Coimbra, na fronteira entre os concelhos de Soure e Pombal.
FIGURA 4.17
Podemos surpreender-nos, à primeira vista, com esta localização do centro demográfico de Portugal. Mas ela explica-se pelo facto de a população de Portugal continental estar muito concentrada na faixa litoral entre Setúbal e Braga. Também a este propósito é possível conceber actividades escolares. Por exemplo, calcular o centro demográfico de um concelho, usando freguesias ou povoações, supondo as respectivas populações concentradas em certos pontos (cujas coordenadas geográficas será necessário recolher).
4.8 CENTRO DE GRAVIDADE DE UMA FIGURA NO ESPAÇO Consideremos agora figuras quaisquer, não necessariamente constituídas por um número finito de pontos, mas no espaço. Tal como no caso plano, a definição rigorosa de centro de gravidade de uma figura R no espaço usa integrais. Pensamos em R como um sólido feito de um material cuja densidade pode variar de ponto para ponto, e aproximamos R usando paralelepípedos. Fixando um sistema de eixos no espaço, a densidade é uma função real de três variáveis reais δ(x , y , z ). Adaptando o raciocínio feito atrás, definimos o centro de gravidade de R como sendo o ponto de coordenadas ∫∫∫ x C = ∫∫∫R
x δ(x , y , z )d x d y d z
R
168
δ(x , y , z )d x d y d z
,
JOÃO FILIPE QUEIRÓ
∫∫∫ yC = ∫∫∫R ∫∫∫
y δ(x , y , z )d x d y d z
R
z C = ∫∫∫R
δ(x , y , z )d x d y d z
z δ(x , y , z )d x d y d z
R
δ(x , y , z )d x d y d z
,
.
No caso de a densidade δ(x , y , z ) ser constante – isto é, de o sólido ser homogéneo — as expressões simplificam-se para: ∫∫∫ x C = ∫∫∫
R
x dxd y d z
R
dxd y d z
∫∫∫ , yC = ∫∫∫
R
y dxd y d z
R
dxd y d z
∫∫∫ , z C = ∫∫∫R
z dxd y d z
R
dxd y d z
.
Ou seja, no caso homogéneo, a localização do centro de gravidade não depende da densidade mas apenas da forma do sólido. O centro, neste caso, é portanto um ponto com uma caracterização apenas geométrica. Podemos notar que ∫∫∫ o denominador das três expressões, d x d y d z , é simplesmente o volume do R sólido (que é a massa total no caso da densidade constante 1). Também aqui se prova, como consequência da definição, a associatividade do centro de gravidade. Esta propriedade é util se for conveniente dividir o sólido em partes e calcular separadamente os centros de gravidade das várias partes. Tal como no caso plano, não é adequado usar estas expressões com integrais triplos para estudantes do ensino secundário. Intuitivamente, o centro de gravidade de uma figura sólida pode visualizar-se do seguinte modo: se pendurarmos o sólido com um fio, o centro de gravidade está necessariamente sobre a recta que contém o fio. Pendurando o sólido de dois pontos diferentes, a intersecção das duas rectas assim obtidas dá-nos o centro de gravidade. Para sólidos homogéneos muito simétricos — por exemplo, esferas ou paralelepípedos — o centro de gravidade coincide com o centro de simetria. Um tipo de sólidos homogéneos não simétricos para os quais é fácil achar o centro de gravidade são os tetraedros (ou pirâmides triangulares). A situação é muito parecida com a dos triângulos homogéneos e, por isso, apresentamos o raciocínio sem pormenores. Suponhamos o tetraedro dividido em placas muito finas, paralelas a uma das faces. Sendo cada placa tão fina que podemos pensar nela como uma placa triangular, os centros de gravidade destas placas são fáceis de achar, e todos esses centros estão alinhados sobre o segmento que une o centro da face paralela às placas ao vértice do tetraedro oposto a essa face. Pela propriedade associativa 169
CENTROS DE GRAVIDADE
FIGURA 4.18
atrás referida, o centro de gravidade do tetraedro tem também de estar sobre essa mediana. Repetindo o raciocínio com placas paralelas às outras faces do tetraedro, concluímos que o centro de gravidade do tetraedro tem de estar sobre os outros três segmentos correspondentes e, portanto, é o ponto de intersecção dos quatro segmentos obtidos unindo os vértices do tetraedro aos centros das faces opostas. Prova-se que o centro divide cada um desses quatro segmentos na proporção de um para três. Daqui concluímos, adaptando o raciocínio feito para triângulos, que o centro de gravidade de um tetraedro, suposto homogéneo, coincide com o centro do sistema formado pelos quatro vértices do tetraedro, supondo lá colocadas quatro massas iguais. Portanto, as suas coordenadas são as médias aritméticas das coordenadas dos vértices. Designando os vértices por A 1 , A 2 , A 3 , A 4 e o centro de gravidade por C , temos então 1 C = (A 1 + A 2 + A3 + A 4 ). 4
Para outros poliedros, não é verdade, em geral, que as coordenadas do centro de gravidade sejam as médias aritméticas das coordenadas dos vértices.
4.9 UMA APLICAÇÃO AO ATLETISMO: O SALTO EM ALTURA No exemplo de aplicação que vamos ver, a ideia não é dividir o sólido em tetraedros, mas sim em partes simples cujo centro de gravidade é de cálculo imediato. A aplicação é à modalidade de salto em altura no atletismo. Até quase ao fim da década de 60 do século XX, os saltadores em altura usavam uma técnica chamada «rolamento ventral», em que o corpo do atleta passa sobre a fasquia de barriga para baixo, tal como é representado na figura 4.19. 170
JOÃO FILIPE QUEIRÓ
FIGURA 4.19
Na fotografia seguinte vemos o russo Valery Brumel na fase final do salto que lhe deu a vitória, usando essa técnica, nos Jogos Olímpicos de Tóquio, em 1964.
FIGURA 4.20
Quatro anos depois, nos Jogos Olímpicos da Cidade do México, um norte-americano, Dick Fosbury, ganhou a medalha de ouro no salto em altura usando uma técnica completamente diferente: depois da corrida de balanço, virava-se e saltava de costas, passando a fasquia de barriga para cima.
FIGURA 4.21
Na fotografia seguinte vemo-lo no salto vitorioso de 1968. 171
CENTROS DE GRAVIDADE
FIGURA 4.22
Nos anos seguintes, cada vez mais saltadores começaram a usar a técnica de Dick Fosbury, que ficou conhecida por «Fosbury flop». Hoje em dia, todos os saltadores em altura usam esta técnica. Porquê? Será ela intrinsecamente mais eficaz que o rolamento ventral? Este assunto é estudado no artigo (Trowbridge, 1979/80). Para conseguir analisar a questão, o autor começa por substituir o corpo humano por um modelo simplificado, constituído por nove eixos articulados, representando os braços, as pernas e o tronco, e um círculo representando a cabeça. A massa do atleta é m e a sua altura é l. Note-se que o centro de gravidade deste modelo não é fixo, pois depende das posições relativas das várias partes. Uma actividade escolar interessante é construir um modelo articulado do corpo humano e calcular o seu centro de gravidade em várias posições. Mediante cálculos simples de mecânica, o autor mostra que a altura máxima atingida pelo centro de gravidade do atleta é dada por y max =
1 2 v g +h 2
onde v é a velocidade vertical e h é a altura do centro de gravidade, ambas no momento do impulso ( g é a aceleração da gravidade). Esta fórmula mostra duas coisas. Em primeiro lugar, que y max aumenta linearmente com h , pelo que há vantagem em, no momento do impulso, levantar os dois braços e uma das pernas. Supondo, por exemplo, que a posição do atleta no 172
JOÃO FILIPE QUEIRÓ
FIGURA 4.23
momento do impulso é a que vem representada na figura 4.24, é um bom exercício mostrar — partindo do cálculo separado dos centros de gravidade das várias partes do corpo — que a altura do centro de gravidade nesse momento é dada por 0,667 × l . Além do mais, isto mostra que os saltadores mais altos têm uma vantagem natural, pois, para uma mesma velocidade vertical inicial, atingem uma altura maior.
FIGURA 4.24
173
CENTROS DE GRAVIDADE
Uma segunda consequência da fórmula é que a altura máxima y max atingida pelo centro de gravidade aumenta com o quadrado da velocidade vertical inicial. Aumentando esta, aumenta-se a altura máxima atingida pelo centro de gravidade do atleta. No rolamento ventral, cuja posição no momento de passagem da fasquia está idealizada na figura 4.25, é óbvio que, para o salto ser bem sucedido, o centro de gravidade do atleta tem de passar por cima da fasquia.
FIGURA 4.25
Mas com o «Fosbury flop» não é necessariamente assim. Na figura 4.26 está representada a posição mais alta de um atleta usando essa técnica.
FIGURA 4.26
Novamente, é um bom exercício calcular a localização do centro de gravidade, que virá em função de l , ϕ e θ (aqui o cálculo separado dos centros de gravidade das várias partes do corpo é um pouco mais complicado). Tomando ϕ = θ = 20◦ e um atleta com 1,80 m, na posição da figura o centro de gravidade 174
JOÃO FILIPE QUEIRÓ
está 16 cm à direita e 15 cm abaixo do ponto mais alto do corpo, que são as ancas. Para o atleta conseguir passar a barra, as ancas deverão estar 6 cm acima dela no momento de maior altura do centro de gravidade, em que este estará cerca de 9 cm abaixo da barra.
FIGURA 4.27
Portanto, para ultrapassar uma mesma altura, um saltador que utilize o «Fosbury flop» necessita de um menor impulso que um atleta que use o rolamento ventral.
4.10 OUTRA APLICAÇÃO AO ATLETISMO: O TRIPLO SALTO Há um outro exemplo mais recente, ainda no atletismo, que ilustra a importância da consideração do centro de gravidade. Trata-se da modalidade do triplo salto.
FIGURA 4.28
Um artigo da revista New Scientist (Melville, 1995) descreve um trabalho de um grupo de investigadores suecos e dinamarqueses sobre o saltador britânico 175
CENTROS DE GRAVIDADE
Jonathan Edwards. Este é, ainda hoje, o recordista mundial do triplo salto, com grande vantagem sobre todos os competidores. A sua melhor marca, de 18,29 m, foi obtida nos campeonatos mundiais de 1995 realizados na Suécia, e o trabalho descrito na New Scientist foi realizado precisamente durante esses campeonatos.
FIGURA 4.29
Os investigadores filmaram os saltos de Edwards, bem como os dos seus adversários, com câmaras de alta velocidade, que lhes permitiram decompor o movimento dos atletas com grande precisão. E notaram grandes diferenças entre a técnica de Edwards e a dos seus adversários. Em primeiro lugar, o centro de gravidade dos outros saltadores subia e descia muito durante os dois primeiros saltos, e o ângulo de partida para o terceiro salto era em média de 22,5◦ . Em segundo lugar, no final dos dois primeiros saltos, os outros saltadores tocavam com o pé no chão ligeiramente à frente do seu centro de gravidade. O objectivo era evitar uma rotação incontrolável para a frente,
176
JOÃO FILIPE QUEIRÓ
que provocaria uma queda. Mas a técnica provocava também um travão ao movimento. Quanto a Edwards, a trajectória do seu centro de gravidade era muito mais suave e o seu ângulo de partida para o terceiro salto era muito mais pequeno: cerca de 17,5◦ . Em segundo lugar, e mais surpreendente, ao terminar os dois primeiros saltos, o pé de contacto estava exactamente por baixo do centro de gravidade do corpo do saltador. Como é que Edwards evitava cair? Os investigadores conjecturaram que a extrema rapidez com que ele levantava os joelhos nos saltos compensava a rotação para a frente.
FIGURA 4.30
O resultado da técnica de Edwards era que ele partia para o terceiro salto com uma velocidade muito maior do que os seus competidores, o que lhe permitia chegar muito mais longe. Nos referidos campeonatos, o atleta que ganhou a medalha de prata, Brian Wellman, das Bermudas, partiu para o terceiro salto com uma velocidade de 6,49 m por segundo. Quanto a Edwards, que partiu para o terceiro salto mais ou menos do mesmo ponto que Wellman, a sua velocidade era nesse momento de 7,27 m por segundo, o que lhe permitiu um terceiro salto meio metro mais longo!
177
CENTROS DE GRAVIDADE
BIBLIOGRAFIA [1] Paulo Ventura Araújo, 1998: Curso de Geometria, Gradiva. [2] H. S. M. Coxeter, 1961: Introduction to geometry, John Wiley. [3] Bill Melville, 1995: «Can he jump 19 metres?», New Scientist 1996, 28. [4] João Filipe Queiró, 2009: «A demanda do centro de Portugal», Gazeta de Matemática 157, 7–12. [5] E. A. Trowbridge, 1979/80: «Is the Fosbury Flop a mechanical success?», Mathematical Spectrum 12, 44–50. As guras 4.19, 4.21, 4.23, 4.24, 4.25 e 4.26 foram publicadas originalmente neste artigo e são reproduzidas com autorização do Applied Probability Trust. Copyright © Applied Probability Trust 1979
178
5 POLIEDROS Luís António Teixeira de Oliveira
Neste capítulo vamos debruçar-nos sobre poliedros. Começaremos por abordar a noção de poliedro e daremos uma definição formal para estes objectos. Em particular, definiremos poliedros convexos. Estudaremos depois a questão da existência de poliedros convexos verificando determinadas condições. O restante capítulo é dedicado aos poliedros convexos com faces regulares. Estudaremos as três classes mais conhecidas destes poliedros: os sólidos platónicos, os deltaedros e os sólidos arquimedianos; e terminaremos com uma abordagem geral aos poliedros convexos com faces regulares. Para mais informação relativa a este tópico e assuntos relacionados recomendamos [Coxeter, 1973] e [Cromwell, 1997]. No estudo dos sólidos platónicos, dos deltaedros e dos sólidos arquimedianos será apresentada uma listagem destes poliedros. Contudo, a prova que estas listas estão completas não será apresentada na sua totalidade. O que faremos será provar que condições devem satisfazer os vértices para existir um poliedro pertencente a uma destas classes. Efectivamente, a demonstração só ficaria completa se provássemos quantos poliedros existem para cada uma das condições que indicarmos. Embora isto possa ser feito recorrendo a cálculos matemáticos, estes cálculos seriam demasiado complexos e longos, não se adequando ao espírito deste livro. Esta parte fica assim ao cuidado do leitor, pois a melhor forma de o fazer é tentar construir efectivamente os poliedros. Hoje em dia, há no mercado material manipulável (por exemplo polidrons) que permite fazer estas construções de uma forma relativamente simples.
5.1 O QUE É UM POLIEDRO? Para definir poliedro é necessário começar por definir polígono. Do ponto de vista formal, um polígono é um circuito (fechado) finito de segmentos de recta A 1 A 2 , A 2 A 3 , · · · , A n A 1 , unindo pares consecutivos de pontos A 1 , A 2 , · · · , A n distintos dois a dois. Os segmentos de recta que formam o polígono são os lados do polígono e os pontos são os vértices do polígono. Note-se que na definição de polígono pouco é assumido acerca dos vértices. Em particular, nada é dito sobre os pontos pertencerem todos ao mesmo 179
POLIEDROS
plano ou não. Se os vértices estiverem todos num mesmo plano, o polígono diz-se plano; caso contrário, diz-se que é um polígono enviesado. No entanto, o termo polígono é usado habitualmente como sinónimo de polígono plano. Neste capítulo assumiremos o mesmo, ou seja, usaremos o termo polígono como sinónimo de polígono plano. Qualquer polígono divide o plano que o contém em duas regiões, uma ilimitada, a que se chama exterior, e outra limitada, a que se chama interior. Neste capítulo vamos seguir também a convenção habitual de considerar que um polígono é constituído, para além dos vértices e dos lados, pelo seu interior. Um polígono diz-se convexo se as rectas que prolongam os lados do polígono não atravessam o interior deste. Outra forma comum, mas equivalente, de definir convexidade de um polígono é através da condição «qualquer segmento de recta definido por dois pontos do polígono está contido nesse polígono».
(a) pentágono regular (convexo)
(b) pentagrama regular (não convexo) FIGURA 5.1
Como num polígono convexo p , uma recta r que prolongue um dos lados de p não intersecta o seu interior, p tem que estar contido num dos semiplanos definidos por r .1 Assim, qualquer polígono convexo é a intersecção de semiplanos definidos pelas rectas que prolongam os lados do polígono. No plano cartesiano, qualquer recta r é descrita por uma equação da forma a x +b y = c com a ,b, c ∈ R. Logo, os dois semiplanos definidos por r são descritos pelas inequações a x + b y ≤ c e a x + b y ≥ c , sendo esta última inequação equivalente a (−a )x +(−b )y ≤ (−c ). Deste modo, qualquer polígono convexo p no plano cartesiano é a solução de um sistema de inequações da forma a k x + b k y ≤ c k . Mais concretamente, cada inequação deste sistema define um dos semiplanos 1 Para sermos absolutamente correctos era necessário argumentar também que um polígono é uma região conexa. 180
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
determinado por uma das rectas que prolonga um dos lados de p e, por isso, são necessárias tantas inequações no sistema quantos os lados de p . Por exemplo, o triângulo A BC da figura 5.2 é a solução do sistema de inequações
y −x ≤ 0 −y ≤ 0 y +x ≤ 3
FIGURA 5.2
Um polígono diz-se equilátero se tiver todos os lados com o mesmo comprimento e diz-se equiangular se tiver todos os ângulos (internos) iguais. Um polígono regular é um polígono que é, simultaneamente, equilátero e equiangular. Há polígonos regulares convexos e não convexos. Na figura 5.1 estão representados um polígono regular convexo, o pentágono regular, e um polígono regular não convexo, o pentagrama regular. Intuitivamente, um poliedro pode ser considerado um sólido com as faces planas. Contudo, do ponto de vista matemático, esta definição deixa muito a desejar e levanta muitos problemas, a começar pela noção de faces planas. Por exemplo, dados os pontos A n = (cos θn , sen θn )
com
n ∈N
e
θn =
2n − 2 π, 2n −1
podemos definir a figura 5.3.(a) de lados os segmentos A n A n +1 (não se trata de um polígono visto ter uma infinidade de lados). Se considerarmos agora um objecto do tipo prisma mas com bases semelhantes à figura 5.3.(a), obtemos um objecto tridimensional com uma infinidade de faces todas planas (as faces laterais são uma infinidade de rectângulos de espessura cada vez mais reduzida). Outra situação que poderá ocorrer com um número infinito de faces é a exemplificada na figura 5.3.(b). Neste caso, as faces laterais do objecto são rectângulos todos semelhantes com razão de semelhança 1/2 entre os rectângulos de um patamar e os rectângulos do patamar imediatamente abaixo. Situações semelhantes às agora descritas são de evitar numa definição de poliedro por forma a manter a noção de poliedro como um objecto tridimensional relativamente simples. É também importante que um poliedro seja um objecto coeso. Por isso, convém eliminar situações em que o poliedro fica dividido 181
POLIEDROS
(b)
(a)
FIGURA 5.3 Problemas com a noção de faces planas
em dois se o cortarmos por um vértice (figura 5.4.(a)) ou por uma aresta (figura 5.4.(b)). Um outro factor que convém evitar é a existência de faces com lados só parcialmente em comum. Por exemplo, não convém considerar casos que contenham dois quadrados como indicado na figura 5.4.(c).
(c) (a)
(b) FIGURA 5.4 Casos a evitar numa denição de poliedro
Assim, um poliedro é definido como sendo uma colecção finita de polígonos (planos) nas seguintes condições: (i) Esta colecção forma um objecto conexo, ou seja, dois quaisquer polígonos estão unidos por uma cadeia de polígonos da colecção. (ii) Cada lado de um polígono é o lado de somente um outro polígono. (iii) Os polígonos que rodeiam um vértice formam um circuito simples, ou seja, se começarmos num dos polígonos e passarmos de polígono em polígono 182
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
desde que eles tenham um lado com esse vértice em comum, então conseguimos percorrer todos os polígonos que rodeiam o vértice antes de voltarmos ao polígono inicial. Das condições acabadas de indicar, a condição (iii) é talvez a de mais difícil compreensão. A figura 5.4.(a) pode ajudar a esclarecer esta condição. Se considerarmos o vértice que separa as duas pirâmides, reparamos que, segundo o processo descrito em (iii), os polígonos que rodeiam este vértice formam dois circuitos independentes, os triângulos laterais da pirâmide de baixo e os triângulos laterais da pirâmide de cima, e não um só circuito. Assim, a condição (iii) faz com que o objecto da figura 5.4.(a) não seja considerado um poliedro. O facto de impormos que um poliedro é uma colecção finita de polígonos elimina automaticamente objectos tridimensionais com uma infinidade de faces planas ou com faces com uma infinidade de lados (exemplos da figura 5.3). A condição (i) é adicionada para evitar que, por exemplo, dois cubos totalmente separados sejam consideramos como «um» só poliedro. Finalmente, a condição (ii) elimina objectos semelhantes à figura 5.4.(b). Há ainda uma quarta condição que nem sempre é adicionada à definição de poliedro, mas que nós vamos aqui considerar: (iv) Polígonos com um lado em comum têm que pertencer a planos distintos. Esta condição é adicionada para prevenir, por exemplo, que num poliedro um hexágono regular possa ser considerado como seis triângulos equiláteros. Os polígonos que constituem um poliedro designam-se por faces do poliedro, enquanto que os lados desses polígonos designam-se por arestas do poliedro; os vértices dos polígonos designam-se também por vértices do poliedro. Tal como um polígono divide um plano em duas regiões, um poliedro divide o espaço em duas regiões, a exterior (ilimitada) e a interior (limitada). É também comum considerar um poliedro como sendo constituído, para além da colecção de polígonos, pelo seu interior, deixando neste caso de ser considerado uma superfície, para passar a ser considerado um sólido. Um poliedro diz-se convexo se os planos que contêm as faces do poliedro não cortarem o interior deste ou, equivalentemente, se qualquer segmento que une dois pontos do poliedro está contido no próprio poliedro (sólido). Esta noção é em tudo análoga à noção de convexidade para polígonos. Tal como no caso dos polígonos convexos, podemos agora descrever qualquer poliedro convexo p 183
POLIEDROS
como a solução de um sistema de inequações em três incógnitas. Os semi-espaços definidos pelos planos que contêm as faces de p podem ser descritos por inequações da forma a k x + bk y + ck z ≤ d k
com
a k , b k , c k , d k ∈ R.
Como p é a intersecção de semi-espaços definidos pelos planos que contêm as suas faces, então p é a solução de um sistema de inequações em três incógnitas com tantas inequações quantas as faces de p . Se a soma das amplitudes dos ângulos que rodeiam um vértice for 2π radianos ou um valor superior, então as faces têm que se «contorcer» em volta do vértice fazendo com que pelo menos um plano que prolonga uma das faces atravesse o interior do poliedro. Deste modo, num poliedro convexo, a soma das amplitudes dos ângulos que rodeiam um vértice é sempre inferior a 2π. Este facto vai ser muito útil mais tarde quando necessitarmos de contar os poliedros convexos com determinadas características.
5.2 ALGUMAS FÓRMULAS VÁLIDAS EM POLIEDROS Neste capítulo assumimos que as noções de grafo e de grafo planar são familiares. De qualquer modo, uma definição formal destes conceitos pode ser encontrada nas Secções 6.3 e 6.4, respectivamente, do capítulo «Grafos: No Sítio e A Cores». Os vértices e as arestas de qualquer poliedro formam um grafo. Na Secção 6.5, do Capítulo «Grafos: No Sítio e A Cores», é mostrado que um grafo associado a um poliedro convexo é planar. Nessa mesma secção é provada a Fórmula de Euler para poliedros convexos. Esta fórmula diz-nos que se V , A e F designarem os conjuntos dos vértices, arestas e faces, respectivamente, de um poliedro convexo, então |V | − |A| + |F | = 2 (5.1) onde as barras verticais significam o cardinal do respectivo conjunto. Para além da Fórmula de Euler, há também duas desigualdades importantes que são válidas em qualquer poliedro, convexo ou não:
184
2|A| ≥ 3|V | ,
(5.2)
2|A| ≥ 3|F | .
(5.3)
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
Vejamos porquê. Representamos por d (v ) o grau do vértice v (ou seja, o número de arestas que saem de v ) e por d ( f ) o número de lados da face f . Como cada aresta sai de dois vértices e pertence a duas faces, quer a soma dos graus dos vértices de um poliedro, quer a soma do número de lados das faces desse poliedro, dão sempre o dobro das arestas do poliedro. Em notação matemática esta conclusão traduz-se nas equações seguintes ∑
d (v ) = 2|A|
e
v ∈V
∑
d ( f ) = 2|A| .
f ∈F
Mas num poliedro, cada vértice tem pelo menos grau 3 e cada face tem pelo menos três lados. Logo, ∑ v ∈V
d (v ) ≥
∑
3 = 3|V |
∑
e
v ∈V
d (f ) ≥
f ∈F
∑
3 = 3|F |.
f ∈F
Destas duas desigualdades e das duas equações acima resultam facilmente as desigualdades (5.2) e (5.3).
5.3 EXISTÊNCIA DE DETERMINADOS POLIEDROS CONVEXOS É evidente que um objecto a três dimensões nas condições semelhantes às de um poliedro tem que ter pelo menos quatro vértices (|V | ≥ 4) e quatro faces (|F | ≥ 4). Logo, tem que ter também pelo menos seis arestas: 2|A| ≥ 3|V | ≥ 12
=⇒
|A| ≥ 6 .
Note-se que o tetraedro (ou qualquer pirâmide triangular) fornece-nos o terno (|V |, |A|, |F |) = (4, 6, 4). Concluímos assim que o terno (|V |, |A|, |F |) mais pequeno que podemos obter a partir de um poliedro convexo é (4, 6, 4). Apesar de a Fórmula de Euler impor imediatamente muitas restrições ao tipo de ternos (|V |, |A|, |F |) que podemos obter (duas entradas determinam automaticamente a outra entrada), há outras restrições que são mais subtis. Por exemplo, não existe nenhum poliedro convexo com sete arestas. Se existisse tal poliedro convexo, obtínhamos que 3|V | ≤ 14 por (5.2); mas como |V | ≥ 4, teríamos necessariamente |V | = 4. De modo análogo, teríamos também |F | = 4, usando (5.3). Mas estes valores contrariam a Fórmula de Euler: 4 − 7 + 4 ̸= 2. Logo, não pode existir um poliedro convexo com sete arestas. Como |V | e |F | determinam |A| pela Fórmula de Euler, vamos procurar determinar o conjunto S dos pares (|V |, |F |) que podem ser obtidos a partir de poliedros 185
POLIEDROS
convexos. De (5.1), (5.2) e (5.3) obtemos 2|V | + 2|F | = 2|A| + 4 ≥ 3|V | + 4
e
2|V | + 2|F | ≥ 3|F | + 4 .
Daí que 12 |V | + 2 ≤ |F | ≤ 2|V | − 4, ou seja, S ⊆ {(n, m ) ∈ N × N :
1 n + 2 ≤ m ≤ 2n − 4}. 2
Vejamos que estes dois conjuntos são efectivamente iguais, ou seja, que os pares (|V |, |F |) que se obtêm a partir de poliedros convexos são os representados na figura 5.5.
FIGURA 5.5 Pares (|V |, |F |) obtidos de poliedros convexos
Começamos por observar que uma pirâmide de base um polígono com n − 1 lados origina o par (|V |, |F |) = (n, n). Por isso, todos os pares (n, n), com n ≥ 4, pertencem a S . Para mostrarmos a igualdade entre os dois conjuntos acima, vamos definir dois processos construtivos. Um desses processos, a truncatura, vai permitir obter os pares (n, m ) com n > m . O outro processo, a ampliação, vai permitir obter os pares (n, m ) com n < m . Seja v um vértice de um poliedro convexo p e seja s um plano que intersecta todas as arestas de p com vértice v em pontos que não pertençam a Vp , onde Vp denota o conjunto dos vértices de p . O plano s divide p em duas partes (ver figura 5.6). Se chamarmos q ao poliedro correspondente à parte que não contém v , então q continua a ser convexo e ganha uma face em relação a p , nomeadamente a 186
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
porção do plano s que está no interior de p . O poliedro q ganha também d (v ) novas arestas e d (v )−1 vértices (há d (v ) novos vértices, mas perde-se v ). O processo que acabámos de descrever e que consiste em cortar um vértice v a um poliedro p de modo a preservar parte de todas as arestas que saem de v designa-se por truncatura. Assim, dizemos que q é obtido de p por truncatura do vértice v .
FIGURA 5.6 Truncatura do vértice v
Quando q é obtido de p por truncatura de um vértice de grau 3, então |Vq | = |Vp | + 2
e
|Fq | = |Fp | + 1 ,
onde Vq e Vp são os conjuntos dos vértices de q e p , respectivamente, e Fq e Fp são os conjuntos das faces de q e p , respectivamente. Como os vértices que surgem por truncatura têm sempre grau 3, o processo de truncar vértices de grau 3 de um poliedro pode prolongar-se indefinidamente. Em particular, se aplicarmos k truncaturas seguidas de vértices de grau 3 a uma pirâmide (os vértices da base têm grau 3) com base com i − 1 lados, obtemos um poliedro com i + 2k vértices e i + k faces. Suponhamos agora que queremos um poliedro com (|V |, |F |) = (n , m ) e 12 n + 2 ≤ m < n . Se k = n − m e i = m − k , então i − 1 = m − k − 1 = 2m − n − 1 ≥ n + 4 − n − 1 = 3 .
e podemos considerar a pirâmide p com base com i − 1 lados. Se aplicarmos k truncaturas seguidas de vértices de grau 3 a p , obtemos um poliedro convexo com i + 2k = m + k = n vértices e i + k = m faces.
187
POLIEDROS
Um outro processo que se pode aplicar a um poliedro p é o processo de ampliação e que consiste em substituir uma face f de p por uma pirâmide de base igual a f (figura 5.7). Observe-se que se p for convexo e a pirâmide a adicionar tiver altura suficientemente pequena, o poliedro q que obtemos continua a ser convexo. Neste processo ganha-se um vértice, d ( f ) arestas e d ( f ) − 1 faces (há d ( f ) novas faces, mas elimina-se f ). Logo, se d ( f ) = 3, |Vq | = |Vp |+1 e |Fq | = |Fp |+2; além disso, as novas faces são triangulares e o processo de ampliação de faces triangulares pode ser implementado indefinidamente. Em particular, se considerarmos uma pirâmide (as faces laterais são triângulos) com base com i − 1 lados e aplicarmos k ampliações seguidas de faces triangulares, obtemos um poliedro com i + k vértices e i + 2k faces. Suponhamos agora que queremos um poliedro com (|V |, |F |) = (n, m ) e n ≤ m ≤ 2n − 4. Se k = m − n e i = n − k , então i − 1 = n − k − 1 = 2n − m − 1 ≥ 2n − 2n + 4 − 1 = 3
e podemos considerar a pirâmide p com base com i − 1 lados. Se aplicarmos k ampliações seguidas sobre faces triangulares a p , obtemos um poliedro (que será convexo se escolhermos as pirâmides com uma altura conveniente) com i +k = n vértices e i + 2k = m faces. Em conclusão, aplicando truncaturas (n > m ) ou ampliações (n < m ) a pirâmides conseguimos obter poliedros com (|V |, |F |) = (n, m ) para qualquer par (n , m ) com 12 n + 2 ≤ m ≤ 2n − 4 (note-se que para n = m consideramos as próprias pirâmides). No entanto, devemos observar que os processos de truncatura
FIGURA 5.7 Ampliação da face f
188
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
e ampliação resultam em teoria. Na prática eles são muito difíceis de executar se for necessário um número elevado destas operações: torna-se difícil definir os planos para a truncatura e as pirâmides para a ampliação têm que ter altura muito pequena.
5.4 TEOREMA DE DESCARTES Um resultado bem conhecido sobre polígonos convexos com n lados (n vértices) diz-nos que a soma s i (das amplitudes) dos ângulos internos do polígono é (n −2)π radianos. Este resultado mostra-se facilmente unindo um ponto v no interior do polígono aos vértices do polígono, dividindo assim o polígono em n triângulos (figura 5.8.(a)). Deste modo, concluímos que s i = nπ−2π, onde n π corresponde à soma dos ângulos internos dos n triângulos ao qual é necessário retirar o ângulo giro (2π) em volta de v . Para polígonos não convexos esta fórmula nem sempre é válida. Um exemplo clássico onde falha é o pentagrama regular (figura 5.1.(b)): a soma dos ângulos internos é π e não 3π.
(a)
(b) FIGURA 5.8
Um ângulo externo de um polígono convexo é um ângulo formado por um lados do polígono e pelo prolongamento de um lado adjacente (figura 5.8.(b)). Cada vértice dá origem a dois ângulos externos. Se escolhermos um ângulo externo por vértice e designarmos por s e a soma dos ângulos escolhidos, então s e = 2π. Com efeito, a soma de um ângulo interno com um dos ângulos externos adjacentes é sempre π. Daí que s i +s e = n π onde n é o número de vértices do polígono, ou seja, s e = nπ − s i = nπ − (n − 2)π = 2π .
Os resultados sobre ângulos internos e ângulos externos de um polígono convexo têm o seu equivalente em termos de poliedros convexos. A fórmula cor189
POLIEDROS
respondente aos ângulos externos é o que se chama Teorema de Descartes. Para enunciar este teorema precisamos, primeiro, de definir a noção de deficiência de um vértice de um poliedro convexo. A amplitude de um ângulo externo de um polígono pode ser vista como o valor que falta para o ângulo interno adjacente se transformar num ângulo raso, ou seja, num ângulo de amplitude π. Nos vértices de um poliedro (objecto tridimensional) convexo podemos definir uma noção semelhante, a noção de deficiência do vértice, e que consiste no valor que falta para que a soma dos ângulos que rodeiam esse vértice seja 2π, ou seja, a amplitude de um ângulo giro. A deficiência de um vértice é sempre um valor positivo pois a soma dos ângulos que circundam um vértice de um poliedro convexo é sempre inferior a 2π. Vamos denotar a deficiência de um vértice v por δv . Estamos agora em condições de enunciar o Teorema de Descartes: Teorema de Descartes: Num poliedro convexo qualquer temos sempre ∑
δv = 4π .
v ∈V
Apesar de o Teorema de Descartes ser dado em termos de amplitude de ângulos e de a Fórmula de Euler se referir ao número de vértices, arestas e faces de um poliedro, o curioso é que estes dois resultados são equivalentes como mostraremos de seguida. Consideremos um poliedro p . Para cada face f de p , representamos por n f o número de lados (e de vértices) de f . Se S designar a soma dos ângulos internos de todas as faces de p , então S=
∑
(n f − 2)π = π ·
f ∈F
∑ f ∈F
nf −
∑ 2π . f ∈F
Contudo, como cada aresta pertence a exactamente duas faces, o primeiro somatório dá-nos o dobro das arestas de p , ou seja, 2|A|; e o segundo somatório vale 2π|F |. Portanto, S = 2π|A| − 2π|F | . (5.4) No entanto, o valor de S pode ser calculado a partir das deficiências dos vértices: como a soma dos ângulos que rodeiam um vértice v é 2π−δv , obtemos que S=
∑ v ∈V
190
(2π − δv ) =
∑ v ∈V
2π −
∑ v ∈V
δv = 2π|V | −
∑ v ∈V
δv .
(5.5)
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
De (5.4) e (5.5) resulta agora que ∑
δv = 2π(|V | − |A| + |F |)
v ∈V
e daí que a soma das deficiências dos vértices do poliedro p valha 4π se e só se |V | − |A| + |F | = 2, ou seja, o Teorema de Descartes e a Fórmula de Euler são equi-
valentes. Como a Fórmula de Euler é válida para poliedros convexos, então o Teorema de Descartes também é válido nestes poliedros. Já vimos acima que a soma dos ângulos internos de um polígono convexo com n lados é s i = (n − 2)π. Mas num polígono, o número de lados é igual ao número de vértices e, por isso, podemos interpretar esta equação em termos do número de vértices do polígono. Para poliedros convexos há um resultado semelhante que relaciona a soma dos ângulos internos de todas as faces de um poliedro com o número de vértices desse poliedro. A partir da equação (5.4) e da Fórmula de Euler resulta que S = 2π(|A| − |F |) = 2π(|V | − 2) .
Gostaríamos de terminar esta secção realçando novamente o paralelismo que existe entre Teorema de Descartes e a equação anterior (ambos válidos para poliedros convexos) e os correspondentes resultados para polígonos convexos. No caso dos poliedros surge 2π em vez de π, como acontecia nos polígonos. Gostaríamos também de referir que o Teorema de Descartes é generalizável para superfícies em geral (Teorema de Gauss-Bonnet). Contudo, esta generalização envolve conceitos (como o de curvatura de uma superfície) e técnicas (como a integração) que estão fora do âmbito deste capítulo.
5.5 OS SÓLIDOS PLATÓNICOS Nesta secção e nas seguintes vamos falar sobre classes especiais de poliedros convexos em que as faces são polígonos regulares. Note-se que a amplitude de um ângulo interno de um polígono regular com n lados é n −2 π. n
Daí que num poliedro convexo com faces regulares existam, no máximo, cinco polígonos em torno de um vértice. Com efeito, o caso mais favorável com seis ou mais polígonos em torno de um vértice v seria ter seis triângulos equiláteros 191
POLIEDROS
em torno de v ; mas neste caso, a soma dos ângulos que contornam v já perfaz 2π, o que não pode acontecer num poliedro convexo. Concluímos, assim, que num poliedro convexo com faces regulares, cada vértice é rodeado por três, quatro ou cinco faces (são necessárias pelo menos três faces para formar um vértice). Num poliedro convexo p com faces regulares podemos representar completamente um vértice v por um vector. Se considerarmos um circuito simples formado pelas faces que rodeiam v tal como descrito na condição (iii) da definição de poliedro, à medida que percorremos esse circuito podemos ir construindo um vector em que as entradas são o número de lados das faces que vamos percorrendo. Por exemplo, na figura 5.9 encontram-se dois vértices com a respectiva descrição vectorial por baixo. Nessa figura, o vector (3, 4, 3, 4) indica que temos dois triângulos equiláteros e dois quadrados dispostos alternadamente; enquanto que o vector (3, 3, 4, 4) também indica que temos dois triângulos equiláteros e dois quadrados, mas neste caso os triângulos são adjacentes assim como os quadrados. Note-se que um vértice pode ser descrito por vectores diferentes dependendo do circuito escolhido. No entanto, é normal começar por uma das faces com o menor número de lados.
(3, 4, 3, 4)
(3, 3, 4, 4)
FIGURA 5.9 Representação vectorial de vértices
Um poliedro regular (não confundir com poliedro com faces regulares) é um poliedro constituído por faces regulares todas iguais de tal forma que o número de polígonos que rodeiam um vértice é sempre o mesmo. Um sólido platónico é um poliedro regular convexo. Num sólido platónico todos os vértices são descritos pelo mesmo vector e este vector tem que ter todas as entradas iguais. Como a soma dos ângulos que rodeiam cada vértice de um sólido platónico tem que ser inferior a 2π, só há 5 vectores possíveis: (3, 3, 3) , (3, 3, 3, 3) , (3, 3, 3, 3, 3) , (4, 4, 4) , (5, 5, 5)
192
(5.6)
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
(a soma dos ângulos correspondentes aos vectores (3, 3, 3, 3, 3, 3), (4, 4, 4, 4) e (6, 6, 6) perfazem todos 2π). Cada um destes vectores dá origem a um dos cinco sólidos platónicos (figura 5.10).
Tetraedro
Cubo
Octaedro
Dodecaedro
Icosaedro
FIGURA 5.10 Sólidos Platónicos
Frequentemente, um sólido platónico p é denotado por {a ,b }, onde a é o número de lados das faces de p e b é o número de faces que rodeiam cada vértice.2 Por exemplo, {4, 3} denota o cubo. Temos assim os cinco sólidos platónicos {3, 3}, {3, 4}, {3, 5}, {4, 3} e {5, 3}. O dual de um poliedro p (ver Secção 6.6, do Capítulo «Grafos: No Sítio e A Cores») é o poliedro que se obtém de p considerando um vértice em cada uma das faces e unindo dois destes vértices por uma aresta se eles pertencerem a faces adjacentes. Na notação que acabámos de introduzir é muito fácil reconhecer o dual de um sólido platónico: o dual de {a ,b } é {b, a }. Assim, o dual do cubo ({4, 3}) é o octaedro ({3, 4}); o dual do dodecaedro ({5, 3}) é o icosaedro ({3, 5}); e o tetraedro ({3, 3}) é o único que é dual de si mesmo. Gostaríamos agora de mencionar brevemente os poliedros regulares não convexos. Também os há e são designados por sólidos de Kepler-Poinsot em honra destes dois matemáticos que, de forma independente, descobriram estes poliedros. Os sólidos de Kepler-Poinsot são exactamente quatro (figura 5.11). Dois deles, o grande dodecaedro e o grande icosaedro, podem ser obtidos a partir do dodecaedro e do icosaedro, respectivamente, fazendo com que as faces se aproximem um pouco do centro do poliedro. Estes poliedros têm, por isso, o mesmo número de vértices, arestas e faces que o dodecaedro e o icosaedro, respectivamente. Nos outros dois, o pequeno dodecaedro estrelado e o grande dodecaedro estrelado, as faces são polígonos regulares não convexos; mais concretamente, são doze pentagramas regulares (figura 5.1.(b)) em ambos os casos. Terminamos esta secção fazendo uma breve referência à origem do termo sólidos platónicos. Os sólidos platónicos foram dos primeiros exemplos de clas2 Neste contexto, {a ,b } é somente uma notação. Os símbolos { e } não têm o sentido habitual de conjunto. 193
POLIEDROS
(a) Grande dodecaedro
(b) Pequeno dodecaedro estrelado
(c) Grande icosaedro
(d) Grande dodecaedro estrelado
FIGURA 5.11 Sólidos de Kepler-Poinsot
sificação de objectos do ponto de vista matemático. Este nome deve-se ao filósofo grego Platão (427 a.C. – 347 a.C.) que escreveu sobre estes poliedros na sua obra Timeu. Nesta obra, de cariz filosófico, Platão tenta descrever a natureza do cosmos associando um sólido a cada um dos quatro elementos primordiais (ar, água, terra e fogo), a partir dos quais toda a matéria seria formada. O quinto sólido platónico, o dodecaedro, era associado a um quinto elemento invisível, o éter ou quinta-essência, que representava de alguma forma o próprio universo. Contudo, a descoberta e prova da existência destes cinco poliedros é atribuída a Teeteto (417 a.C. – 369 a.C.), um matemático grego contemporâneo, e supõem-se que amigo, de Platão. Aliás, uma das obras de Platão tem o nome deste matemático e relata uma suposta discussão filosófica entre Teeteto e Sócrates sobre o que é o pensamento.
5.6 OS DELTAEDROS Na definição de sólidos platónicos, para além da condição de serem convexos com faces regulares, há duas outras condições que podem ser enfraquecidas:
194
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
(a ) as faces serem todas iguais; (b ) o mesmo número de faces em volta de cada vértice.
Nesta secção vamos estudar o caso dos poliedros que satisfazem as condições anteriores excepto (b ), ou seja, os poliedros convexos com faces regulares todas iguais. Como as faces são todas regulares e iguais, cada vértice do poliedro é representado por um dos vectores de (5.6), embora vértices diferentes possam ter representações diferentes. Além disso, os vectores (4, 4, 4) e (5, 5, 5) contribuem somente com o cubo e com o dodecaedro, respectivamente. No entanto, os outros três vectores dão origem a mais poliedros como, por exemplo, o caso de dois tetraedros unidos por uma face (dipirâmide triangular — figura 5.13.(a)) que tem dois vértices do tipo (3, 3, 3) e três vértices do tipo (3, 3, 3, 3). Temos, portanto, que descobrir os poliedros convexos formados por triângulos equiláteros. Um deltaedro é um poliedro em que as faces são todas triângulos equiláteros. A origem do termo deriva da letra grega delta cuja maiúscula é um triângulo equilátero (∆). Deltaedros não convexos há em número infinito. Contudo, os convexos são só oito, como veremos. Como só vamos estudar os deltaedros convexos, usaremos o termo deltaedro como sinónimo de deltaedro convexo. Três dos deltaedros são sólidos platónicos: o tetraedro, o octaedro e o icosaedro. O octaedro é uma dipirâmide quadrangular, ou seja, a junção pela base de duas pirâmides quadrangulares. Já referimos acima a dipirâmide triangular, mas temos ainda a dipirâmide pentagonal (a dipirâmide hexagonal já não é possível de realizar com triângulos equiláteros pois temos vértices de grau 6). O icosaedro pode ser decomposto em duas pirâmides pentagonais unidas por um anel de triângulos (figura 5.12). Podemos também considerar o deltaedro obtido de forma semelhante unindo duas pirâmides quadrangulares com um anel de triângulos. O poliedro assim obtido designa-se por dipirâmide quadrangular giro-alongada (figura 5.13.(c)). A nomenclatura usada é a standard para poliedros. Sempre que se adiciona um anel de triângulos a um poliedro acrescenta-se o adjectivo giro-alongado ao nome do poliedro. Aliás, se for adicionado antes um anel de quadrados (ou rectângulos), em vez de um anel de triângulos, acrescenta-se o adjectivo alongado ao nome do poliedro. Não se menciona aqui o mesmo tipo de construção para o tetraedro (em vez da pirâmide quadrangular) porque, neste caso, o poliedro obtido tem triângulos adjacentes complanares (ver figura 5.14.(b)). 195
POLIEDROS
FIGURA 5.12 Ilustração de Kepler
Um outro poliedro pode ser construído a partir de um prisma triangular com faces laterais quadradas, colocando uma pirâmide quadrangular em cada uma dessas faces laterais (figura 5.13.(d)). O poliedro assim obtido tem o nome sugestivo de prisma triangular tri-aumentado numa referência clara à junção de três pirâmides ao prisma triangular. Finalmente, o último deltaedro, o dodecaedro siamês (figura 5.13.(e)), é o mais difícil de visualizar. A melhor forma de obter este poliedro é fazendo uma incisão por duas arestas consecutivas das bases de uma dipirâmide pentagonal, abrir e colar dois triângulos equiláteros adjacentes.
(a) Dipirâmide triangular
(b) Dipirâmide pentagonal
(d) Prisma triangular tri-aumentado
(c) Dipirâmide quadrangular giro-alongada
(e) Dodecaedro siamês
FIGURA 5.13 Deltaedros convexos não platónicos
196
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
Os deltaedros convexos não platónicos que vimos até agora estão representados na figura 5.13. Vejamos que esta lista está completa. Se p for um deltaedro e v for um vértice de grau 3 de p , designamos por v 1 , v 2 e v 3 os três vértices adjacentes a v ordenados de forma a satisfazerem as desigualdades 3 ≤ d (v 1 ) ≤ d (v 2 ) ≤ d (v 3 ) ≤ 5 ,
onde d (v ) representa o grau do vértice v . Se d (v 1 ) = 3, a terceira face que rodeia v 1 fecha o poliedro e obtemos o tetraedro. Note-se também que se d (v 1 ) = d (v 2 ) = 4, então o objecto torna a fechar e obtemos a dipirâmide triangular (figura 5.13.(a)). Ao construirmos o caso d (v 1 ) = 4 e d (v 2 ) = d (v 3 ) = 5 imediatamente nos apercebemos que vamos obter um poliedro não convexo (figura 5.14.(a)). Finalmente, se d (v 1 ) = d (v 2 ) = d (v 3 ) = 5 obtemos o objecto representado na figura 5.14.(b). Neste caso, dois triângulos com uma das arestas v 1 v 2 , v 2 v 3 ou v 1 v 3 em comum são sempre complanares.
(a)
(b)
(c)
FIGURA 5.14
No parágrafo anterior verificámos que o tetraedro e a dipirâmide triangular são os únicos deltaedros com vértices de grau 3. Vejamos agora os deltaedros sem vértices de grau 3, ou seja, só com vértices de grau 4 e 5. Representamos por n 4 e n 5 o número de vértices de grau 4 e 5, respectivamente. Observe-se que a deficiência de um vértice de grau 4 é 2π/3, enquanto que a deficiência de um vértice de grau 5 é π/3. Pelo Teorema de Descartes deduzimos então que 4π =
∑
2 1 δv = πn 4 + πn 5 , 3 3 v ∈V
ou seja, 2n 4 + n 5 = 12. Obtemos assim só sete hipóteses para o par (n 4 , n 5 ): (n 4 , n 5 ) ∈ {(6, 0), (5, 2), (4, 4), (3, 6), (2, 8), (1, 10), (0, 12)} . 197
POLIEDROS
Os pares (6, 0) e (0, 12) representam sólidos platónico; mais concretamente, o octaedro e o icosaedro, respectivamente. A partir de cada um dos pares (5, 2), (4, 4), (3, 6) e (2, 8) obtemos um só deltaedro. Pela ordem indicada, essas soluções são a dipirâmide pentagonal, o dodecaedro siamês, o prisma triangular tri-aumentado e a dipirâmide quadrangular giro-alongada (figura 5.13). Porém, não há nenhum deltaedro que corresponda ao par (1, 10). Se considerarmos o vértice de grau 4 e formos completando de forma a que todos os outros tenham grau 5, reparamos que a determinada altura (figura 5.14.(c)) temos uma pirâmide quadrangular unida pela base a um anel de oito triângulos, sobrando ainda dois vértices. Note-se que estes dois últimos vértices para terem grau 5 têm que estar ligados entre si e a cada um dos quatro vértices da parte superior do anel de triângulos. Ora, isto faz com que estes últimos quatro vértices tenham que ter grau 6.
5.7 OS SÓLIDOS ARQUIMEDIANOS Na secção anterior enfraquecemos a noção de sólido platónico mantendo a condição de todas as faces serem iguais, mas retirando a condição da existência de um único vector que descreve todos os vértices (ou seja, como as faces são todas iguais, isto significa ter vértices de grau diferente). Nesta secção vamos inverter estas condições e abordar os poliedros convexos de faces regulares de, pelo menos, dois tipos distintos mas com todos os vértices descritos pelo mesmo vector. Por outras palavras, vamos estudar os poliedros convexos de faces regulares com vértices descritos por um vector (n 1 , · · · , n k ) (3 ≤ k ≤ 5 e n i ≥ 3 para 1 ≤ i ≤ k ) com as entradas não todas iguais. Ao contrário dos dois casos considerados anteriormente, há uma infinidade de poliedros nas condições que pretendemos agora estudar. Por exemplo, os prismas (de bases regulares) constituem uma família infinita nestas condições desde que se imponha que as faces laterais sejam quadrados (exceptuando o prisma quadrangular que, neste caso, é o cubo). Os vértices de um prisma com base de n lados são descritos pelo vector (4, 4, n). Um antiprisma é um poliedro que consiste de duas faces de n lados (bases do antiprisma) unidas entre si por um anel de triângulos (figura 5.15), ou seja, cada vértice de uma base é unido a dois vértices adjacentes da outra base. Se as bases forem polígonos regulares e os triângulos laterais forem equiláteros, obtemos outra família infinita nas condições pretendidas, com excepção do antiprisma 198
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
triangular (ou seja, do antiprisma de base triangular), que é o octaedro. Os vértices de um antiprisma são descritos pelo vector (3, 3, 3, n ), onde n é o número de lados da base.
(a) Prisma
(b) Antiprisma
FIGURA 5.15 Prisma e antiprisma
Apesar de os antiprismas poderem ser considerados uma classe infinita de poliedros tão natural como os prismas e as pirâmides, geralmente não se houve falar muito deles. Na verdade, este relegar para segundo plano dos antiprismas é algo histórico. Embora existam referências a pirâmides e a prismas desde a Grécia Antiga, a primeira referência conhecida aos antiprismas surge com Kepler, na obra Harmonices Mundi [Kepler, 1619], quando decompõe o icosaedro em duas pirâmides e um antiprisma (figura 5.12). Consideremos um poliedro convexo p de faces regulares com todos os vértices descritos por um vector (n 1 , · · · , n k ) (3 ≤ k ≤ 5) com as entradas não todas iguais. Somando os ângulos em torno de um vértice, obtemos k k k ∑ ∑ ∑ ni − 2 2 2 2π > π=π· 1− =π· k − ni ni ni i =1 i =1 i =1
! ,
ou seja, 2>k −
k ∑ 2 n i i =1
⇐⇒
k ∑ 1 k −2 k > = −1. n 2 2 i i =1
(5.7)
Vejamos primeiro o caso k = 3. Neste caso, podemos escolher convenientemente o início e a direcção do circuito de faces em torno dos vértices por forma a que as entradas do vector (n 1 , n 2 , n 3 ) estejam por ordem crescente. Imaginemos que uma das entradas deste vector é ímpar, digamos r , e que as outras duas são s e t . Obviamente, as faces com s e t lados vão alternar-se ao longo dos lados da face com r lados, pois todos os vértices são descritos pelo 199
POLIEDROS
mesmo vector (figura 5.16). Como r é ímpar, um dos lados do polígono com r lados terá que pertencer também a polígonos com s e com t lados; logo, s = t . Mas se s também fosse ímpar, obteríamos r = t de forma análoga e o poliedro seria platónico (r = s = t ). Concluímos assim que, se um dos polígonos tiver um número ímpar de lados, então os outros dois têm um número par e igual de lados.
FIGURA 5.16
Em face do exposto acima, para k = 3 procuramos vectores (n 1 , n 2 , n 3 ) nas condições: (i) 3 ≤ n 1 ≤ n 2 ≤ n 3 , em que pelo menos uma das duas últimas desigualdades é estrita para garantir dois tipos diferentes de faces; (ii) n11 + n12 + n13 > 12 (por (5.7)); (iii) se uma das entradas é ímpar, então as outras duas são pares e iguais. Em particular, n 2 é par devido a (i) e (iii). Uma análise metódica a estas condições permite-nos concluir que as possíveis soluções são os vectores indicados na figura 5.17. Para cada um destes vectores há um único poliedro convexo de faces regulares cujos vértices são todos descritos por esse vector. Dos sete poliedros da figura 5.17 que não são prismas, cinco deles obtêm-se dos platónicos por truncaturas adequadas de todos os vértices. Este facto está bem expresso nos próprios nomes destes poliedros. Quanto aos outros dois poliedros, o grande cuboctaedro rômbico e o grande icosidodecaedro rômbico, falaremos melhor sobre eles depois de tratarmos o caso k = 4. Passando agora ao caso k = 4, a equação (5.7) transforma-se na equação 1 1 1 1 + + + >1. n1 n2 n3 n4
200
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
(3, 6, 6)
(3, 8, 8)
(3, 10, 10)
(4, 4, n 3 )
Tetraedro truncado
Cubo truncado
Dodecaedro truncado
Prismas
(4, 6, 6)
(4, 6, 8)
(4, 6, 10)
(5, 5, 6)
Octaedro truncado
Grande cuboctaedro rômbico
Grande icosidodecaedro rômbico
Icosaedro truncado
FIGURA 5.17 Soluções com três faces em torno dos vértices
Logo, pelo menos um dos n i tem que ser 3; assumiremos, por isso, que n 1 = 3. Se existirem dois triângulos adjacentes, tal como descrito na figura 5.18.(a), então há dois triângulos adjacentes em torno de v 3 , ou seja, v 1 v 3 ou v 2 v 3 é o lado de dois triângulos. Se v 1 v 3 for o lado de dois triângulos, então há três triângulos em torno de v 1 ; se v 2 v 3 for o lado de dois triângulos, então é o vértice v 2 que tem três triângulos em seu redor. Em qualquer dos casos concluímos que há três triângulos em torno de cada vértice e, por isso, os vértices são descritos por um vector da forma (3, 3, 3, n 4 ). Estamos assim na presença de antiprismas. Se não houver triângulos adjacentes, então n 2 ̸= 3 e n 4 ̸= 3 (n 3 poderá ser 3). Temos, portanto, a situação descrita pela figura 5.18.(b). Logo, a face por definir nessa figura terá que ter, simultaneamente, n 2 e n 4 lados, ou seja, n 2 = n 4 . Nestas condições temos somente os quatro vectores descritos na figura 5.19 diferentes de (3, 3, 3, n 4 ). Os vectores (3, 4, 3, 4), (3, 4, 5, 4) e (3, 5, 3, 5) originam um poliedro cada. Contudo, o caso (3, 4, 4, 4) é diferente, tem duas soluções: o cuboctaedro rômbico e a giro-bicúpula quadrangular alongada. Uma forma simples de verificar que estes dois poliedros não são iguais é contando o número de anéis formados por quadrados
201
POLIEDROS
(a) Com triângulos adjacentes
(b) Sem triângulos adjacentes
FIGURA 5.18 Caso k = 4
(3, 3, 3, n 4 )
(3, 4, 3, 4)
(3, 4, 5, 4)
(3, 5, 3, 5)
Antiprismas
Cuboctaedro
Icosidodecaedro rômbico
Icosidodecaedro
(3, 4, 4, 4)
Cuboctaedro rômbico
Giro-bicúpula quadrangular alongada
FIGURA 5.19 Soluções com quatro faces em torno dos vértices
que cada poliedro possui. O cuboctaedro rômbico tem três, enquanto que a giro-bicúpula quadrangular alongada tem somente um. O cuboctaedro pode ser realizado, considerando os pontos médios das arestas do cubo e unindo estes pontos por uma aresta, se eles pertencerem a arestas adjacentes de uma face do cubo; mas também pode ser obtido a partir do octaedro, o dual do cubo, considerando como arestas os segmentos que unem os pontos médios dos lados das faces triangulares do octaedro. Por outras palavras, o cuboctaedro é a intersecção do cubo e do octaedro da figura 5.20.(a); daí o nome
202
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
(a) Cuboctaedro
(d) Dodecaedro rômbico
(b) Icosidodecaedro
(e) Tricontaedro rômbico
(c) Cuboctaedro rômbico
(f) Pontos médios da figura 5.20.(a)
(g) Cuboctaedro truncado
FIGURA 5.20 Origem de alguns poliedros com quatro faces em torno dos vértices
cuboctaedro. De forma análoga, considerando o dodecaedro e o icosaedro, em vez do cubo e do octaedro, obtemos o icosidodecaedro (figura 5.20.(b)). Os duais dos sólidos arquimedianos formam uma classe de poliedros designada por sólidos de Catalan. Nos casos particulares do cuboctaedro e do icosidodecaedro obtemos, respectivamente, o dodecaedro rômbico (figura 5.20.(d)) e o triacontaedro rômbico (figura 5.20.(e)). As faces destes dois últimos poliedros são losangos, doze no primeiro caso e trinta no segundo. Embora em cada um destes poliedros os losangos sejam todos iguais, os losangos usados num deles são diferentes dos usados no outro: as diagonais dos losangos do dodecaedro rômbico p estão na proporção 1 : 2, enquanto que as diagonais dos losangos do triacontap p edro rômbico estão na proporção 1 : 1+2 5 . Note-se que 1+2 5 é o chamado número de ouro. Se unirmos os pontos médios de arestas adjacentes de faces do dodecaedro rômbico, o poliedro que obtemos é o cuboctaedro rômbico (figura 5.20.(c)). No entanto, o mesmo tipo de construção a partir do cuboctaedro já não dá o cuboctaedro rômbico. Obtemos antes o poliedro da figura 5.20.(f) que tem faces rectan203
POLIEDROS
gulares não quadradas. Na verdade, qualquer cuboctaedro rômbico obtém-se intersectando um cubo, um octaedro e um dodecaedro rômbico de tamanhos adequados (daí a designação cuboctaedro rômbico), mas nunca se pode obter intersectando um cuboctaedro com um dodecaedro rômbico. A intersecção de um cuboctaedro com um dodecaedro rômbico dá sempre origem a poliedros similares aos descritos nas figuras 5.20.(f)–(g) e que contêm faces que são rectângulos não quadrados. Se truncarmos todos os vértices do cuboctaedro de forma adequada, obtemos o poliedro da figura 5.20.(g), em que os octógonos são regulares. Este poliedro pode também obter-se intersectando o cuboctaedro com um dodecaedro rômbico de tamanho adequado. O poliedro em causa não tem as faces todas regulares, mas se permitirmos distorcer as faces, afastando um pouco os octógonos, podemos transformá-lo num poliedro com as faces todas regulares; mais concretamente, podemos transformá-lo no grande cuboctaedro rômbico que surgiu no caso k = 3. Se considerarmos agora o dodecaedro, o icosaedro e o triacontaedro rômbico e fizermos o mesmo tipo de análise, vamos obter o icosidodecaedro rômbico e o grande icosidodecaedro rômbico, este último pertencente ao caso k = 3. Finalmente, vejamos a estrutura da giro-bicúpula quadrangular alongada. Uma cúpula é um poliedro com duas bases, uma com n lados e outra com 2n lados, que estão ligadas uma à outra por uma sequência alternada de rectângulos e triângulos. As cúpulas formam assim uma outra família infinita de poliedros, mas tal como as pirâmides, cúpulas com faces regulares só há três (figura 5.21.(a)–(c)): a triangular (n = 3), a quadrangular (n = 4) e a pentagonal (n = 5). De facto, se a cúpula tivesse as faces todas regulares e n ≥ 6, então a soma dos ângulos em torno dos vértices da base com menor número de lados seria igual ou superior a 2π. Uma bicúpula é o poliedro obtido por junção de duas cúpulas do mesmo tipo pela base com maior número de lados. Se repararmos, é possível juntar duas cúpulas pelas bases com maior número de lados de duas formas distintas: quadrado com quadrado e triângulo com triângulo (figura 5.21.(d)), ou sempre quadrado com triângulo (figura 5.21.(e)). Os poliedros do primeiro caso designam-se por bicúpulas, enquanto que os do segundo caso designam-se por giro-bicúpulas. Assim, uma giro-bicúpula quadrangular alongada é composta por duas cúpulas quadrangulares, uma ligeiramente rodada em relação à outra (giro), a que é adicionado um anel de quadrados (ou rectângulos) entre as cúpulas. Segundo esta 204
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
(a) Cúpula triangular
(b) Cúpula quadrangular
(d) Bicúpula quadrangular
(c) Cúpula pentagonal
(e) Giro-bicúpula quadrangular
FIGURA 5.21 Cúpulas, bicúpulas e giro-bicúpulas
terminologia, o cuboctaedro rômbico também se poderia chamar bicúpula quadrangular alongada. Finalmente o caso k = 5. Este caso é o mais simples de tratar pois rapidamente se observa que só há três soluções para (5.7): (3, 3, 3, 3, 3), (3, 3, 3, 3, 4) e (3, 3, 3, 3, 5). O primeiro vector corresponde a um sólido platónico, o icosaedro. Os outros dois dão origem a um novo poliedro cada: o cubo snub e o dodecaedro snub (figura 5.22), respectivamente. Estes dois poliedros têm uma característica que não surge nos outros poliedros vistos até agora. Tal como as nossas mãos, estes poliedros têm duas formas diferentes, ou seja, não é possível sobrepô-los sobre os seus reflexos.
(a) Cubo snub
(b) Dodecaedro snub
FIGURA 5.22 Soluções com cinco faces em torno dos vértices
O processo para obter estes dois poliedros a partir dos sólidos platónicos é também diferente daqueles que usámos até agora. Se imaginarmos as faces de um cubo a afastarem-se umas das outras à mesma velocidade e com um ligeiro 205
POLIEDROS
movimento rotatório, a determinada altura é possível preencher os espaços entre as faces do cubo com triângulos equiláteros, obtendo assim o cubo snub. O dodecaedro snub pode ser obtido da mesma forma considerando as faces do dodecaedro em vez das faces do cubo. Em resumo, se exceptuarmos os prismas e os antiprismas, há exactamente catorze poliedros convexos com faces regulares de, pelo menos, dois tipos e cujos vértices são todos descritos pelo mesmo vector. Os sólidos arquimedianos são uma lista de treze destes catorze poliedros (exceptua-se a giro-bicúpula quadrangular alongada) descrita por Arquimedes. A obra original de Arquimedes perdeu-se e, por isso, não se sabe ao certo como é que ele chegou até estes poliedros, nem que propriedades reconhecia neles. Com base em comentários feitos por matemáticos posteriores a Arquimedes, é globalmente aceite que ele chegou a estes poliedros a partir dos sólidos platónicos, provavelmente por processos semelhantes aos que descrevemos acima. Nesta secção seguimos de perto os resultados obtidos por Kepler na sua obra Harmonices Mundi. Kepler mostrou que existiam somente treze configurações de vértices possíveis e comentou que cada uma destas configurações dava origem a um dos sólidos arquimediamos. Julga-se que Kepler estava ciente da existência de um décimo quarto poliedro, a giro-bicúpula quadrangular alongada, visto haver registos de cartas de Kepler em que ele se referia aos catorze sólidos arquimedianos. As características que temos vindo a estudar nesta secção não são obviamente suficientes para caracterizar os treze sólidos arquimedianos. Para isso, precisamos da noção de vértices transitivos. Dizemos que um poliedro tem vértices transitivos se existirem isometrias (espaciais) que enviem um vértice em qualquer outro vértice do poliedro. Dos catorze poliedros que estamos a considerar, só os treze arquimedianos é que têm vértices transitivos. Na giro-bicúpula quadrangular alongada alguns vértices pertencem ao único anel de quadrados, enquanto que outros não. Daí que não haja nenhuma isometria que envie um vértice pertence a este anel num vértice não pertencente ao anel (a propriedade de pertencer ao anel de quadrados é preservada por isometrias). Assim, um sólido arquimediano pode ser definido como um poliedro convexo com faces regulares de, pelo menos, dois tipos, com vértices transitivos e que não é um prisma nem um antiprisma.
206
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
5.8 POLIEDROS CONVEXOS COM FACES REGULARES Chegamos finalmente ao caso geral dos poliedros convexos com faces regulares. Para além das famílias infinitas dos prismas e dos antiprismas, existem somente mais cento e dez poliedros (incluindo o cubo e o octaedro). Estes poliedros foram enumerados por Norman Johnson [Johnson, 1966], mas foi Victor Zalgaller [Zalgaller, 1969] quem provou que a lista publicada por Norman Johnson estava completa. Para isso teve de recorrer a cálculos complexos feitos por computador. Um sólido de Johnson é um poliedro convexo de faces regulares que não é prisma, antiprisma, platónico ou arquimediano. As imagens dos noventa e dois sólidos de Johnson podem-se encontrar em [wp1] ou [wp2] pesquisando por Johnson solids. Vimos anteriormente (figura 5.12) que o icosaedro se divide em três poliedros convexos com faces regulares: duas pirâmides e um antiprisma. Um poliedro convexo de faces regulares que não se possa dividir em dois ou mais poliedros convexos de faces regulares diz-se elementar. Conhecidos os poliedros elementares, determinar os poliedros convexos de faces regulares consiste em encontrar todas as combinações possíveis de vários poliedros elementares que preservem a convexidade.
(a) Rotunda pentagonal
(c) Icosidodecaedro rômbico tridiminuído
(b) Icosaedro tridiminuído
(d) Icosidodecaedro rômbico para-bidiminuído
FIGURA 5.23 Outras componentes elementares de sólidos platónicos e arquimedianos
Analisando os poliedros descritos nas secções anteriores e decompondo-os, se possível, nas suas partes elementares, obtemos a seguinte lista de poliedros elementares: 207
POLIEDROS
a) Prismas e antiprismas, excepto o antiprisma triangular (octaedro). b) três sólidos platónicos (tetraedro, cubo e dodecaedro), o dodecaedro siamês e nove sólidos arquimedianos (aqueles com vértices de grau 3 e 5). c) Pirâmide quadrangular e pentagonal (a triangular é o tetraedro). d) Cúpula triangular, quadrangular e pentagonal (figuras 5.21.(a)–(c)). e) Rotunda pentagonal (figura 5.23.(a)): um hemisfério do icosidodecaedro. Em geral, rotundas são poliedros com duas bases de n e 2n lados, respectivamente, que são unidas por um anel de pentágonos e triângulos tal como descrito na figura 5.23.(a). Rotundas com as faces todas regulares só há uma, a pentagonal. f) Icosaedro tridiminuído (figura 5.23.(b)): retirar três pirâmides pentagonais ao icosaedro. g) Icosidodecaedro rômbico tridiminuído (figura 5.23.(c)): retirar três cúpulas pentagonais ao icosidodecaedro rômbico. h) Icosidodecaedro rômbico para-bidiminuído (figura 5.23.(d)): retirar duas cúpulas pentagonais ao icosidodecaedro rômbico com bases em planos paralelos. É possível retirar duas cúpulas com bases pertencentes a planos não paralelos; mas neste caso é sempre possível retirar mais outra e obter o icosidodecaedro rômbico tridiminuído. Para além dos poliedros elementares acabados de descrever, há ainda mais sete (figura 5.24) que não se conseguem obter decompondo os poliedros descritos em secções anteriores. No total há vinte e nove poliedros elementares se excluirmos os prismas (excepto o cubo) e os antiprismas.
(a)
(d)
(b)
(e)
(c)
(f)
FIGURA 5.24 Últimos sete poliedros elementares
208
(g)
LUÍS ANTÓNIO TEIXEIRA DE OLIVEIRA
BIBLIOGRAFIA COMENTADA [Coxeter, 1973] H. S. M. Coxeter, 1973: Regular Polytopes (3ª edição), Dover Publications, New York. Livro sobre poliedros e politopos em geral com conteúdo Matemático de grau elevado. [Cromwell, 1997] P. R. Cromwell, 1997: Polyhedra, Cambridge University Press. Livro sobre poliedros com várias referências históricas e curiosidades interessantes. [Johnson, 1966] N. W. Johnson, 1966: “Convex polyhedra with regular faces”, Canadian J. Math. 18, 169–200. Artigo sobre os sólidos de Johnson. [Kepler, 1619] J. Kepler, 1619: Harmonices Mundi Libri V, Linz. Livro de cariz losóco escrito por Kepler, mas com referências a poliedros. [Zalgaller, 1969] V. A. Zalgaller, 1969: “Convex polyhedra with regular faces”, Seminars in Mathematics 2, Steklov Institute, Leningrad, Nauka. Tradução inglesa publicada por Consultants Bureau, New York. Artigo sobre os sólidos de Johnson. [wp1] http://www.wikipedia.org. Webpage da Wikipedia. [wp2] http://mathworld.wolfram.com. Webpage da Wolfram Math World.
209
6 GRAFOS: NO SÍTIO E A CORES Maria Leonor Moreira
6.1 INTRODUÇÃO A teoria de grafos é um ramo recente da matemática, desenvolvido já no século XX, cuja importância se tem imposto, nomeadamente a partir das suas ligações e aplicações a outras ciências, bem como a outras áreas da matemática. De uma maneira informal, um grafo pode ser visto como um conjunto de pontos, ditos «vértices», e outro de pares desses pontos, ditos «arestas»; cada aresta «liga» o par de pontos que a determina, as suas extremidades. A representação usual é feita por linhas (as arestas) a ligar pontos do plano (os vértices). A simplicidade de um tal conceito torna claro que ele permite modelar situações concretas muito variadas de que são exemplo as redes de transportes, de comunicações, ou a Web, exemplos óbvios pela sua estrutura de ligação física entre os nós da rede (seja ela feita por ruas, cabos ou ondas). Mas é claro que esta ligação física não é necessária; também pode ser associado um grafo a um qualquer conjunto no qual esteja definida uma relação binária, como a relação «a é primo com b » que determina um grafo num conjunto fixado de inteiros, ou a relação «a é filho de b » que permite associar a uma dada família um grafo, a sua árvore genealógica. Apesar da sua simplicidade, do ponto de vista das aplicações o grafo é um modelo interessante porque pode transportar informação suficiente para permitir esclarecer ou resolver a situação modelada utilizando resultados e algoritmos da teoria de grafos. Alguns desses resultados são existenciais, permitindo somente dizer se e sob que condições existe alguma solução, como no caso dos problemas de percurso: saber se existe um trajecto que percorra todas as ruas de uma povoação, sem repetição, o problema do carteiro ou o problema do caixeiro viajante, saber se a rede viária lhe permite visitar todas as cidades de uma região, voltando a casa sem passar duas vezes na mesma cidade.
211
GRAFOS: NO SÍTIO E A CORES
Nos casos em que há uma ou mais soluções pode ser importante: • Saber quantas soluções há. Os primeiros resultados publicados sobre grafos são obtidos por Cayley, em 1875 ([Biggs et al., 1998]), ele próprio mostra que podem ser aplicados à enumeração de uma família de isómeros químicos, de fórmula C n H 2n +2 . À data, a notação «gráfica» para os compostos químicos era recente e mostrou-se particularmente útil para explicar os isómeros. Os grafos que representam esses compostos são ditos árvores. No exemplo da figura 6.1 estão representadas as moléculas do butano e do isobutano, dois isómeros C 4 H 10 . A fórmula geral de contagem de árvores etiquetadas estabelecida por Cayley permitia, por exemplo, saber se para uma dada fórmula estavam identificados todos os isómeros (ver Teorema de Cayley em [Aigner e Ziegler, 1999]).
FIGURA 6.1
• Determinar as melhores soluções, as suas características e as condições que permitem obtê-las (ditos problemas de optimização). Determinar, por exemplo, as condições que permitem garantir o maior fluxo de chamadas entre utentes de uma certa rede de telemóveis; desenhar uma ligação por cabo de fibra óptica de custo mínimo que cubra todos os utentes de uma certa malha urbana; atribuir tarefas aos trabalhadores de uma empresa escolhendo a atribuição que melhor aproveita as competências de cada um. • Construir algoritmos executáveis em tempo útil, que permitam obter as soluções para cada problema dado. Estes algoritmos estão presentes no quotidiano de qualquer utilizador de um computador quando, por exemplo, faz uma busca na rede, pois a web não é mais do que um gigantesco grafo do qual se pretende «visitar» todos os vértices que têm etiquetas correspondentes à busca desejada; ou quando se envia um e-mail que terá de procurar numa 212
MARIA LEONOR MOREIRA
rede o «melhor caminho» entre dois vértices, onde «melhor» pode ser uma combinação de condições, como ser curto, não passar por vértices saturados, ser rápido, etc. Estes algoritmos são indirectamente utilizados por qualquer cidadão. Por exemplo, a colocação dos estudantes nas universidades de acordo com as preferências por eles manifestadas e também com o numerus clausus e os critérios de seriação das escolas é um problema de construção de uma atribuição estável num grafo. O termo grafo foi usado pela primeira vez por Sylvester num artigo publicado em 1877, na Nature (ver [Biggs et al., 1998]), associado aos diagramas de Kekulé, os diagramas, já referidos, de representação de compostos químicos por pontos e linhas, para os elementos e as suas ligações, respectivamente. O título do artigo, Chemistry and Algebra, traduz a ideia de Sylvester de estabelecer uma relação entre as duas; essa relação seria feita através da noção de grafo. Apesar da data desta primeira referência ao termo grafo e da sua definição formal surgir só no século XX, a resolução de Euler do problema das pontes de Königsberg, publicada em 1736 ([Euler, 1741]), é usualmente referida como a primeira publicação da teoria. No seu artigo, Euler refere que para o problema, aparentemente geométrico, só é relevante aquilo que pode ser determinado a partir do estudo das propriedades da «posição», sem envolver medida de distâncias, nem cálculos com quantidades. Por isso, ele considera que se trata de um problema de um ramo da geometria pouco conhecido, mencionado pela primeira vez por Leibniz como «geometria de posição». O filósofo e matemático do século XVII, numa carta escrita a Huygens, declarava ([Biggs et al., 1998]): A álgebra não me satisfaz porquanto não fornece as provas mais breves nem as mais belas construções da geometria. Por conseguinte, perante isto, considero que precisamos ainda de outro tipo de análise, geométrica ou linear, que trate directamente a posição, como a álgebra trata as quantidades. Se esta falta de «cálculos» causa estranheza ao recém-chegado a esta área, uma boa surpresa é a força de alguns resultados de enunciado simples como, por exemplo, o chamado Lema dos Apertos de Mão, que surge na secção 6.3.1. Este resultado, muitas vezes aplicado (várias neste capítulo), é a ideia-chave de uma prova linda do Teorema do Ponto Fixo (ver [Aigner e Ziegler, 1999]). Note-se que esta simplicidade de enunciado nem sempre se traduz em facilidade de resolução e um bom exemplo disso é o problema das 4 cores.
213
GRAFOS: NO SÍTIO E A CORES
A formulação do problema é elementar, como pode ser comprovado pelo número de não-especialistas que «descobrem» hipotéticas soluções, bem como o desprezo a que foi inicialmente votado pela generalidade dos matemáticos. São conhecidas a resposta de Hamilton à carta em que De Morgan lho expõe – Não tenho vontade de tentar resolver o seu problema do quaternião de cores tão cedo – bem como as palavras de Minkowski numa sua aula de Geometria na Universidade de Göttingen, em que menciona o problema aos alunos dizendo: Este teorema ainda não foi provado pela simples razão de unicamente matemáticos de terceira se terem ocupado dele, e anuncia: Eu acho que o posso provar! ([Wilson, 2005]). Minkowski, honra lhe seja feita, viria a admitir junto desses mesmos alunos que tinha tentado e também não o conseguira. Na verdade, o problema resistiu cerca de cem anos aos ataques feitos por muitos e bons matemáticos e é consensual que o trabalho desenvolvido em torno da sua resolução foi a grande razão para o desenvolvimento da teoria de grafos durante a primeira metade do século XX. O enunciado simples e a sua ligação com diferentes temas motivaram a escolha deste problema para fio condutor deste curto passeio pelos grafos. Como admitimos que o leitor possa estar a ser-lhes apresentado, fomos dando definições sucintas dos conceitos, mas não deixámos de apresentar algumas justificações com o detalhe que nos pareceu suficiente para ilustrar alguns dos métodos usuais da área. Também as referências foram escolhidas com critério, mas alguma parcimónia, como se explica na nota que antecede a bibliografia.
6.2 O PROBLEMA E O SEU MODELO A origem deste problema é bem conhecida, pois é referida numa carta escrita em 1852 por De Morgan a Hamilton ([Wilson, 2005]): Um aluno perguntou-me hoje qual seria a razão para (…) independentemente do modo como uma figura é subdividida em regiões, ao colori-las usando cores diferentes para as que têm alguma porção de fronteira comum, quatro cores poderem ser necessárias mas não mais (…) ele percebeu isto ao colorir um mapa dos condados britânicos (…). O aluno em questão era Frederick Guthrie que mais tarde atribuiu a conjectura ao seu irmão mais velho, Francis Guthrie, ex-aluno de De Morgan no mesmo University College de Londres. Tinha sido ele a transmitir-lhe a convicção de que o resultado era verdadeiro, apesar de não conseguir obter uma prova que o satisfizesse ([Wilson, 2005]).
214
MARIA LEONOR MOREIRA
FIGURA 6.2
Este problema não se pôs aos cartógrafos, nem a sua solução é aplicada em cartografia, já que usar um número mínimo de cores não é uma sua preocupação. Foi visto por muitos como um desafio e despertou a curiosidade, dita matemática, de alguns. De acordo com o narrado pelo sobrinho de Lewis Carrol ([Wilson, 2005]), Stuart Colingwood, na biografia que escreveu do autor de Alice no País das Maravilhas, este era um dos seus jogos favoritos: A is to draw a fictitious map divided into counties. B is to color it using as few colours as possible. Two adjacent counties must have different colours. A’s object is to force B to use as many colours as possible. How many can he force B to use? Se o leitor aceitar o desafio e colorir o mapa dos condados britânicos desenhado na figura 6.2, passando depois ao jogo de criar mapas «difíceis» para o seu
215
GRAFOS: NO SÍTIO E A CORES
adversário pintar, desde logo se aperceberá de que, para colorir, não é importante o tamanho ou as particularidades do desenho dos países. Na verdade, basta-lhe ter uma lista dos países e saber quais os pares de países que têm fronteira em comum. Ou seja, estamos na presença de um conjunto: P = {p : p é país do mapa}
no qual está definida uma relação binária: p Rq ⇐⇒ p faz fronteira com q.
Assim, um grafo é um bom modelo abstracto para esta situação: fazemos corresponder a cada país um vértice e ligamos por uma aresta os pares de vértices correspondentes a países que fazem fronteira. Colorindo agora os vértices do grafo de acordo com o que era feito no mapa, isto é, atribuindo cores distintas a vértices que estão ligados, pretendemos concluir que não iremos necessitar de mais do que quatro cores. Observe-se que, para dizer que dois países do mapa fazem fronteira, se exige que essa fronteira não se reduza a um ponto, caso contrário seria fácil obter um exemplo de um mapa que precisasse de mais de quatro cores: bastaria dividir um círculo em m partes, como as fatias de um bolo, ficando o centro como ponto comum entre todas – qualquer país faria fronteira com todos os outros, exigindo o mapa m cores para ser bem colorido. Também não são considerados principados por serem desinteressantes do ponto de vista da coloração: na sua condição de países incluídos num outro país, para os poder pintar basta dispor de duas cores. Mais: para além da condição imposta aos países que fazem fronteira, não são admitidas outras restrições à coloração. Se, eventualmente, elas existissem, seria simples obter um contra-exemplo para a conjectura de Guthrie desviando-nos do âmago da questão; se, por exemplo, admitíssemos que um país pudesse ser desconexo, um império, obrigando todos os seus territórios a serem coloridos da mesma cor, seria fácil obter exemplos de mapas (e de grafos) que precisassem de mais de quatro cores. Na figura 6.3, impondo a existência do império amarelo, qualquer coloração exige mais de quatro cores. O problema com países desconexos é tratado separadamente e conhecido por problema dos impérios. No entanto, conseguir um contra-exemplo não trivial seria uma maneira de resolver o problema pela negativa, e muito do que se avançou matematicamente foi conseguido procurando as características de um tal exemplo. É claro que esse 216
MARIA LEONOR MOREIRA
FIGURA 6.3
mapa precisaria de ter mais de quatro países; por outro lado, já com quatro se pode desenhar «um» mapa que precisa de quatro cores – basta considerar um mapa com quatro países em que cada país faz fronteira com todos os outros. Na figura 6.4 está o desenho feito por De Morgan, na carta escrita a Hamilton, para evidenciar a necessidade de, pelo menos, quatro cores; juntamos-lhe o grafo correspondente.
FIGURA 6.4
O passo seguinte seria desenhar um mapa análogo, mas com cinco países, cada um a fazer fronteira com todos os outros. É claro que um tal mapa precisa de cinco cores! Longe de Londres e das preocupações com a coloração de mapas, mas aproximadamente na mesma data, o matemático August Möbius colocava aos seus alunos de uma turma de Geometria da Universidade de Leipzig o seguinte problema ([Wilson, 2005]): O problema dos cinco príncipes: Em tempos remotos, um marajá indiano, senhor de um grande território, escreve no seu testamento que aquele deveria ser dividido
217
GRAFOS: NO SÍTIO E A CORES
pelos seus cinco filhos, de tal modo que cada principado fizesse fronteira com o de todos os outros irmãos. Poderia a vontade do pai ser cumprida? Na verdade, não podia! Na aula seguinte, quando os alunos lhe dizem que não tinham conseguido uma solução, Möbius diz-lhes que é impossível dividir o território de acordo com a vontade do marajá. E De Morgan, numa publicação de 1860, em que a conjectura das quatro cores é referida pela primeira vez na imprensa [Wilson, 2005], observa que, nos mapas com quatro países mutuamente adjacentes, um dos países é completamente rodeado pelos outros três, o que torna impossível a existência de cinco países mutuamente adjacentes. Usando como modelo para o problema o grafo associado ao mapa, o que De Morgan pretendia concluir era que o grafo definido por cinco vértices, ligados dois a dois por arestas, não pode ser grafo de um mapa. Para que se possa encontrar utilidade neste modelo, comece-se por formalizar o conceito de grafo, introduzir alguma notação e nomenclatura, e perceber de que grafos se está a falar.
6.3 CARACTERIZAÇÃO DO MODELO 6.3.1 O QUE É UM GRAFO A nomenclatura para grafos pode dizer-se «natural», mas não está completamente estabelecida, menos ainda em português, tornando-se aconselhável, na leitura de qualquer texto, conferir definições. Mesmo a definição de grafo pode variar. Escolhemos a mais adequada ao contexto. Definição 6.1 Um grafo G é um par de conjuntos finitos, V e E (escreve-se G = (V, E )):
• V ̸= ; e os seus elementos dizem-se vértices de G (escreve-se V = V (G )). • E ⊆ P2 (V ) = {{x , y } : x , y ∈ V (G ), x ̸= y } e os seus elementos são ditos arestas de G (escreve-se E = E (G )). Notação e terminologia: se G é um grafo, x , y ∈ V (G ) e e = {x , y } ∈ E (G ), então: • x e y dizem-se adjacentes (ou ligados pela aresta e , ou extremidades de e ) e usa-se a notação x y (ou y x ) para e . e = x y diz-se incidente em x e em y (x e y dizem-se incidentes em e ). 218
MARIA LEONOR MOREIRA
• O número de vértices de um grafo, |V |, diz-se a ordem do grafo e usaremos a mesma notação, |X |, para referir o cardinal de um conjunto X . • O número de arestas incidentes num vértice v ∈ V diz-se o grau do vértice e nota-se d (v ). Os vértices de grau zero dizem-se isolados. Observe-se que as arestas são definidas como conjuntos, isto é, não são orientadas (não distinguimos x y de y x ). Para obter grafos orientados, ou digrafos, ter-se-ia que as definir como pares ordenados. Para além disso, sendo as arestas conjuntos com dois elementos de V , não cabem nesta definição de grafo lacetes, que são arestas a ligar um vértice a si próprio, nem arestas paralelas, que são arestas distintas e e f com as mesmas extremidades. Para obter multigrafos explicitar-se-ia a função de incidência que associa a cada aresta as suas extremidades. Quando se utiliza o termo grafo deste modo, os objectos correspondentes à definição dada são ditos grafos simples. Podemos já observar que, somando o grau de todos os vértices de um grafo, contamos cada aresta duas vezes: ∑
d (v ) = 2|E (G )|, para qualquer grafo G = (V, E ).
v ∈V (G )
Este resultado utilizado por Euler em [Euler, 1741] é conhecido como Lema dos Apertos de Mão: cada aperto de mão, como uma aresta, é um cumprimento entre duas pessoas. Já podemos concluir que estamos a ser enganados se nos disserem que numa reunião de quinze pessoas, onde cada uma cumprimentou exactamente cinco, todos viram um OVNI! Podem existir OVNIs (?!), mas não uma tal reunião já que não há grafos com um número ímpar de vértices de grau ímpar, como seria o grafo de quinze vértices todos de grau cinco. O lema garante que a soma dos graus dos vértices de um grafo é par e, assim, também o é o número de vértices de grau ímpar. Os grafos que só diferem no nome dos vértices (e das arestas) dizem-se isomorfos, isto é, G = (V, E ) e G ′ = (V ′ , E ′ ) são isomorfos , G ≃ G ′ , se existir uma bijecção f : V → V ′ que preserva a adjacência, isto é, tal que (x , y ) ∈ E (G ) ⇐⇒ ( f (x ), f (y )) ∈ E (G ′ ). Ao estudar a estrutura de um grafo consideramos um certo conjunto de vértices, mas as nossas conclusões aplicam-se a todos os que lhe são isomorfos 219
GRAFOS: NO SÍTIO E A CORES
(quando é relevante para o estudo a fazer distinguir grafos isomorfos mas com diferentes conjuntos de vértices, dizemos que estamos a tratar grafos etiquetados). Em geral, não se distingue um grafo de todos os que lhe são isomorfos; neste sentido, alguns dos grafos mais utilizados são: • o grafo completo K n = (V, E ), onde V = {1, 2, · · · , n } e E = {{i , j } : i , j ∈ V, i ̸= j } • o ciclo C n = (V, E ), n ≥ 3, onde V = {1, 2, · · · , n} e E = {{j , j + 1}. j = 1, 2, · · · , n − 1} ∪ {{1, n}}
• o caminho Pn = (V, E ), onde V = {0, 1, 2, · · · , n } e E = {{j , j + 1}. j = 0, 1, 2, · · · , n} • o grafo completo bipartido K m ,n = (V, E ), onde V = A ∪ B , com A = {1, 2, · · · , n} e B = {n + 1, n + 2, · · · , n + m }, e E = {{a ,b } : a ∈ A,b ∈ B } Usualmente, representa-se um grafo por uma figura no plano, representando os vértices por pontos e as arestas por linhas ligando os pontos que são as suas extremidades. Estas figuras simplesmente traduzem de forma concisa as relações de incidência entre vértices e arestas, sem qualquer imposição sobre a forma ou o tamanho e, portanto, há diferentes representações do mesmo grafo. Usualmente, a linha que representa uma aresta é contínua e sem auto-intersecções, dita curva simples, ou seja, a imagem de um intervalo por uma função contínua e injectiva. Por vezes, procura-se uma representação que saliente alguma das propriedades do grafo. Na figura 6.5 é feita uma representação de K 5 , de P6 , K 1,3 e K 3,3 e duas representações de C 5 cuja diferença veremos mais à frente ser relevante.
FIGURA 6.5
Sempre que um grafo G ′ = (V ′ , E ′ ) está contido noutro grafo G = (V, E ), isto é, se tem V ′ ⊆ V e E ′ ⊆ E , diz-se que G ′ é um subgrafo de G ; quando G ′ transporta toda a estrutura de G em V ′ , isto é, E ′ tem todas as arestas que em G ligavam vértices de V ′ , diz-se que G ′ é o subgrafo induzido por G em V ′ e escreve-se G ′ = G [V ′ ].
220
MARIA LEONOR MOREIRA
Assim, todos os grafos com cinco vértices ou menos são subgrafos de K 5 , já que todos os pares de vértices distintos são arestas de K 5 . Por exemplo, fazendo V ′ = {x , y , z }, para quaisquer x , y , z ∈ V , podem obter-se, a menos de isomorfismo, todos os grafos com três vértices, desde o grafo com três vértices isolados, G 1 = (V ′ , ;), ao grafo completo com três vértices que é isomorfo ao 3 ciclo, G 2 = K 3 ≃ C 3 . No entanto, o subgrafo induzido sobre um certo conjunto de vértices é único. No caso de K 5 e do conjunto de três vértices, seria K 3 . Observe-se, a propósito destes exemplos, que em certos grafos, para dois quaiquer vértices há (pelo menos) um caminho contido em G que os liga: é o caso de qualquer um dos grafos da figura 6.5. Estes grafos dizem-se conexos. Quando tal não acontece o grafo G diz-se desconexo: é o caso dos grafo G 1 , por exemplo. Neste segundo caso, os subgrafos maximais conexos dizem-se as componentes conexas do grafo, onde subgrafo maximal conexo quer dizer que é um subgrafo conexo, elemento maximal para a relação de inclusão, isto é, qualquer subgrafo que o contenha estritamente não é conexo. Por exemplo, G 1 tem três componentes conexas e o grafo da figura 6.6 tem quatro.
FIGURA 6.6
6.3.2 GRAFOS VERSUS MAPAS Para tentar resolver um problema é necessário tornar precisas as suas condições e garantir que elas estão traduzidas no modelo matemático que se está a utilizar. Neste caso, o modelo foi assim construído:
221
GRAFOS: NO SÍTIO E A CORES
mapa M países {p 1 , · · · , p n } p i faz fronteira com p j
←→
grafo G = G (M )
←→
V (G ) = {v 1 , · · · , v n }
←→
v i v j ∈ E (G )
FIGURA 6.7
Um grafo diz-se bem colorido se os seus vértices estão coloridos de tal modo que a vértices adjacentes são atribuídas cores distintas. Assim, é claro que, se o grafo G (M ) for bem colorido, se pode obter uma boa coloração dos países do mapa M atribuindo-lhes as cores dos vértices correspondentes. É necessário agora saber quais os grafos a colorir, isto é, quais as características do grafo G (M ), quando M é um mapa. Já referimos que De Morgan observou que não poderia existir um mapa com cinco países mutuamente adjacentes, o que pode ser traduzido no nosso modelo dizendo: M é mapa =⇒ G (M ) ̸= K 5
Esta observação é, como veremos, consequência de M ser um mapa no plano ou na esfera, o que, apesar de não ser explícito, era com certeza subentendido por Guthrie e por De Morgan. Vamos traduzi-lo no modelo, isto é, ver como se podem caracterizar os grafos G (M ).
222
MARIA LEONOR MOREIRA
6.4 NO PLANO Observámos já que um grafo pode ter várias representações e demos duas representações para o mesmo grafo, o ciclo com cinco vértices. Na figura 6.8 também estão duas representações do mesmo grafo; do lado esquerdo, o grafo foi desenhado sem intersectar arestas fora dos vértices, mostrando que o grafo é planar.
A
B
B
A
D G
F
F E D G
C
E
C
FIGURA 6.8
Um grafo diz-se planar se pode ser bem desenhado no plano, isto é, se é possível associar pontos do plano aos vértices e às arestas curvas simples ligando esses pontos, de tal modo que essas curvas só se intersectem nas extremidades (os pontos correspondentes aos vértices). Este desenho diz-se uma representação planar do grafo. Claro que duas representações do mesmo grafo, como na figura 6.8, podem sempre ser vistas como dois grafos isomorfos; nesta figura, esse isomorfismo é descrito pelas etiquetas dos vértices. Assim, por vezes, diz-se grafo plano para falar de uma representação planar de um grafo (obviamente planar). Procurando planarity na página de endereço [3], pode ser descarregada uma aplicação que permite procurar uma representação planar para um grafo; são geradas representações aleatórias de grafos planares e o utilizador pode, movimentando as arestas, descruzá-las até conseguir uma representação planar do mesmo grafo, qualquer coisa como desenriçar um fio que se sabe não ter nós. Esta aplicação é interessante porque sugere o tipo de propriedades do plano envolvidas
223
GRAFOS: NO SÍTIO E A CORES
nesta possibilidade de aí desenhar um grafo sem cruzar as arestas, propriedades essas que vamos tratar em seguida.
6.4.1 SEM CICLOS É FÁCIL Comecemos por observar que no estudo da planaridade basta considerar grafos conexos. Se um grafo for desconexo ele será planar se cada uma das suas componentes o for; como não há arestas entre as diferentes componentes, a representação de cada uma delas é independente das restantes. Passando a olhar só para os grafos conexos já vistos, é fácil referir uma família infinita de grafos planares, os caminhos Pn , com n ∈ N; na verdade, podem ser representados numa recta. Os caminhos fazem parte de uma família mais alargada de grafos planares, os grafos acíclicos, ou seja, que não têm ciclos como subgrafos. Estes grafos sem ciclos, quando conexos, são chamados árvores e formam uma família de grafos das mais reconhecidas pelas suas aplicações. Como quando não são conexos cada uma das suas componentes conexas é uma árvore, os grafos acíclicos também podem ser chamados florestas. Qualquer grafo acíclico, com 2 ou mais vértices, tem, pelo menos, um vértice de grau 1: Considere-se um grafo G , cujos vértices têm todos grau ≥ 2, e seja P := v 0 e 1 v 1 e 2 · · · e n v n , com v i ̸= v j se i ̸= j , um caminho de comprimento máximo em G . Como o grau de v n é ≥ 2, tem de existir em G uma aresta, f , diferente de e n e incidente em v n ; a outra extremidade v de f terá de ser um dos vértices do caminho, senão P ′ := v 0 e 1 v 1 e 2 · · · e n v n f v seria um caminho de comprimento maior que P . Logo, v = v j , para algum j ∈ {0, 1, · · · , n − 2} e v j e j +1 · · · e n v n f v é um ciclo de G . Assim, se G é uma árvore não reduzida a um só vértice, isto é, G ̸= K 1 , é possível escolher em V (G ) um vértice de grau 1. O grafo G \ v , que se obtém de G retirando o vértice v e todas as arestas incidentes em v (neste caso só uma), continua a ser acíclico (ao retirar vértices a um grafo não se podem criar ciclos!) e conexo (foi-lhe retirada uma aresta que só era usada nos caminhos para v , o vértice que também foi retirado), isto é, G \ v ainda é uma árvore. Portanto, é sempre possível «desfazer» uma árvore, retirando a cada passo um vértice de grau 1 e a aresta que lhe é incidente; o processo terminará quando 224
MARIA LEONOR MOREIRA
for esvaziado o conjunto das arestas, isto é, quando se chegar a K 1 . Portanto também é possível «construí-la» usando o processo inverso, isto é, começando com um vértice e acrescentando a cada passo uma aresta a ligar um novo vértice, v j , a outro já existente v i , i < j . Este processo recursivo deixa claro que se pode obter uma representação no plano de uma qualquer árvore, bastando para tal notar que a nova aresta pode sempre ser desenhada no plano sem cruzar nenhuma das já existentes (o grau do vértice que já estava desenhado pode ser grande, mas é finito!).
6.4.2 OS CICLOS NO PLANO SÃO DE JORDAN Como já sabemos que só podem ser não-planares grafos com ciclos, é a sua representação que temos de estudar. Comecemos por observar que, como as arestas da representação planar de um grafo são curvas simples que ligam os vértices, a representação planar de um ciclo é sempre uma curva simples e fechada do plano, quer isto dizer, uma linha contínua, sem auto-intersecções e com ponto inicial igual ao final, isto é, a imagem no plano de uma circunferência por uma função contínua e injectiva. Uma tal curva C é usualmente referida como uma curva de Jordan por ter sido Camille Jordan o primeiro a publicar a prova de que ela decompõe o resto do plano em duas regiões conexas disjuntas, uma limitada, int(C), e outra não-limitada, ext(C); a curva C é a fronteira das duas regiões. Por estas serem conexas, dois pontos da mesma região podem sempre ser ligados por uma linha (eventualmente sinuosa) contida na região. Na verdade, como estas duas regiões são subconjuntos maximais conexos do Plano\C, ao ligar um ponto de int(C) com outro de ext(C), obrigatoriamente se intersecta a curva C. Assim, mesmo em curvas sinuosas como a da figura 6.9, é possível localizar um ponto numa das regiões, determinando a paridade do número de intersecções de um segmento que ligue o ponto a um outro que saibamos localizar. À primeira vista, talvez por o plano ser o nosso primeiro modelo de representação geométrica, o Teorema da Curva de Jordan parece óbvio. Pensando um pouco mais, tem de se admitir que a prova deste resultado terá de usar propriedades do plano que não são válidas noutras superfícies. Apesar de, com as devidas adaptações, o teorema poder ser generalizável para a esfera, por exemplo, num toro ele «está longe» de ser verdadeiro; ao retirar a um toro uma circunferência
225
GRAFOS: NO SÍTIO E A CORES
FIGURA 6.9
traçada transversalmente (como tirar uma fatia «muito fininha» de um doughnut) obtém-se um «cilindro curvo» que é conexo. No livro [Mohar e Thomassen, 2001] é feito um tratamento claro e rigoroso da prova do teorema. Uma prova, no caso mais simples de a curva de Jordan ser poligonal, pode ser consultada em [4].
6.4.3 HÁ GRAFOS PEQUENOS QUE NÃO SÃO DO PLANO Usando o Teorema da Curva de Jordan, já podemos mostrar que K 5 não pode ser representado no plano. Mais à frente vamos chegar a esta conclusão, usando um argumento combinatório simples. Esta primeira prova é dada por traduzir directamente a dificuldade com que deparamos ao tentar desenhá-lo no plano e a segunda por salientar a força da fórmula de Euler. Admitamos que K 5 tem uma representação planar; sejam p i os pontos do plano que representam os vértices v i de K 5 , para i = 1, · · · , 5 nessa representação. Como, em K 5 , todos os vértices estão ligados por arestas, v 1 v 2 v 3 v 1 é um ciclo de K 5 ; assim, p 1 p 2 p 3 p 1 seria uma curva de Jordan, C , e p 4 teria de estar numa das regiões por ela determinadas; admitamos que p 4 ∈ int(C ). Assim, também as arestas p 1 p 4 , p 2 p 4 e p 3 p 4 estariam contidas no int(C ), dando origem a três novas curvas que passam por p 4 , C 1 : p 2 p 3 p 4 p 2 , C 2 : p 1 p 3 p 4 p 1 e C 3 : p 1 p 2 p 4 p 1 , associadas aos correspondentes ciclos do grafo.
226
MARIA LEONOR MOREIRA
p
1
p
2
p
p
4
3
FIGURA 6.10
Como p i p 4 ⊆ int C), cada p i tem de pertencer ao ext(Ci ), para i = 1, 2, 3 e, assim, como p 5 está ligado por uma aresta a cada um destes p i , as arestas p i p 5 e o próprio p 5 terão de estar no ext(Ci ), para i = 1, 2, 3.. Assim, p 5 terá de estar no ext(C), obrigando qualquer linha que represente a aresta v 4 v 5 a ligar um ponto do interior a outro do exterior da curva de Jordan C e, portanto, a intersectá-la, contrariando o facto de a representação ser planar. De forma análoga obtém-se uma contradição no caso em que p 4 ∈ ext(C), permitindo concluir que uma tal representação de K 5 não existe. Decorre desta prova que K 5 é um grafo não-planar minimal pois, retirando-lhe uma qualquer das suas arestas, obtém-se um grafo planar, isto é, o grafo K 5 \ e = (V (K 5 ), E (K 5 ) \ e ) é planar para qualquer e ∈ E (K 5 ). Além disso, é claro que qualquer subgrafo de um grafo planar também é planar. Como qualquer grafo com cinco ou menos vértices ou é K 5 ou é subgrafo de K 5 \ e para algum e , K 5 é o menor grafo não-planar.
6.4.4 COM POUCAS ARESTAS TAMBÉM É FÁCIL Observe-se ainda que aquela última aresta foi a «má da fita», permitindo adivinhar que, fixado o número de vértices, deverá haver um número máximo de arestas que não estraga a planaridade. Nos grafos planares mais simples, as árvores, esse número de arestas é determinado pelo número de vértices:
227
GRAFOS: NO SÍTIO E A CORES
Se G = (V, E ) é uma árvore então |E | = |V | − 1. Este resultado decorre do que foi observado na secção 6.4.1 para mostrar que as árvores são planares. Na menor árvore G = ({v }, ;) = K 1 a igualdade é verificada; ao acrescentar uma aresta e um vértice a uma qualquer árvore, soma-se uma unidade a ambos os membros da equação e a igualdade mantém-se. Na verdade, esta relação entre o cardinal das arestas e o dos vértices, juntamente com a conexão, caracteriza estes grafos, isto é: G = (V, E ) é árvore ⇐⇒ G é conexo e |E (G )| = |V (G )| − 1.
Basta notar que, dado um qualquer grafo conexo G = (V, E ), se G não for uma árvore, tem pelo menos um ciclo, e retirando uma aresta de um ciclo a G obtém-se um grafo G \ {e } que ainda é conexo. Repetindo este processo de «destruição» dos ciclos de G , chegar-se-á a um grafo sem ciclos e que continua a ser conexo, ou seja, a uma árvore com o mesmo conjunto de vértices que G (diz-se uma árvore geradora de G ) e com menos arestas que G : uma contradição. Assim, as árvores podem ser caracterizadas como os grafos conexos minimais, isto é, retirando a uma árvore uma qualquer das suas arestas, o grafo obtido é desconexo. Esta caracterização está na base de uma das suas aplicações mais comuns, que é o desenho de redes de custo mínimo já referido na introdução. Vamos ver que esta relação puramente combinatória entre o número de vértices e de arestas de uma árvore pode ser estendida a quaisquer grafos planares conexos, traduzindo características geométricas destes grafos.
6.5 FÓRMULA DE EULER Comecemos por observar que, da mesma maneira que definimos grafo planar, podemos definir grafo esférico, tórico e, em geral, grafo representável numa superfície S como um grafo que se pode desenhar em S sem intersectar as arestas fora dos vértices, isto é, tal que existe uma aplicação injectiva de G em S , um mergulho que associa, aos vértices de G , pontos da superfície e às arestas de G curvas simples na superfície, que ligam os pontos correspondentes às extremidades das arestas e que não se intersectam excepto nesses pontos. Vamos ver que os grafos esféricos e os planares são exctamente os mesmos. 228
MARIA LEONOR MOREIRA
6.5.1 NO PLANO = NA ESFERA
FIGURA 6.11
Para chegar a esta conclusão pode-se usar a chamada projecção estereográfica, uma aplicação definida da esfera-menos-um-ponto no plano. Considere-se G um grafo esférico, na figura 6.11 o grafo K 4 . Escolha-se um ponto qualquer da esfera S 0 que não pertença ao desenho de G , |G |, para definir a projecção e designe-se esse ponto por PN , o polo norte, na figura o ponto representado a amarelo. Sendo Π o plano tangente à esfera no ponto PS , diametralmente oposto a PN , projecte-se, ponto a ponto, o desenho de G neste plano, a partir de PN , definindo-se a função: π : S 0 \ PN
−→
Π
z
7→
π(z ) = p
p = π(z ) é o ponto de intersecção com o plano da recta determinada por z e PN ,
para todo z ∈ S 0 \ PN . Esta função é claramente bijectiva (leva os pontos da esfera próximos de PN em pontos «longínquos» do plano já que para estes pontos a recta de projecção é «quase» horizontal); assim, π(|G |) é uma realização do grafo G no plano. Reciprocamente, se tivéssemos começado pela realização de G no plano, poderíamos obter uma realização esférica, usando a função inversa de π.
229
GRAFOS: NO SÍTIO E A CORES
6.5.2 OS GRAFOS DOS POLIEDROS SÃO DO PLANO De repente, ganhámos muitos exemplos de grafos planares bem conhecidos! Ganhámos todos os grafos ditos esqueleto dos poliedros convexos, cujos conjuntos de vértices e arestas coincidem com os vértices e as arestas de algum poliedro convexo. Estes grafos são realizáveis na esfera: basta usar um ponto do interior do poliedro como centro de uma projecção radial numa esfera de raio suficientemente grande para conter o poliedro; como o poliedro é convexo, as projecções das arestas não se intersectam senão nos vértices. Na figura 6.12 está representado o esqueleto do cubo, a sua projecção radial na esfera e a projecção no plano dessa representação na esfera que mostra que o grafo do cubo é planar.
FIGURA 6.12
Observe-se que a representação planar do grafo do poliedro, obtida usando a projecção estereográfica, decompõe o plano em regiões conexas disjuntas, correspondentes às faces do cubo. Uma só destas regiões é não-limitada: corresponde à região da esfera que continha o ponto PN usado para projectar. A fronteira de cada região é um ciclo do grafo plano, correspondente ao polígono que limita a face do poliedro.
6.5.3 FACES PARA OS GRAFOS Esta ideia pode ser generalizada a qualquer representação planar de um grafo, chamando-se faces de um grafo plano às regiões maximais conexas em que o plano se decompõe quando retirados os vértices e as arestas do grafo. 230
MARIA LEONOR MOREIRA
As observações que se seguem pretendem fazer perceber em que medida esta noção de face de um grafo plano se aproxima da mesma noção para grafos de poliedros. • Qualquer grafo plano tem uma só face não-limitada. Se o grafo for uma árvore ou uma floresta, esta é a sua única face. Como, pelo Teorema de Jordan, qualquer realização planar de um ciclo tem duas faces, a realização planar de um grafo tem uma única face se e só se o grafo é acíclico. • A fronteira de uma face de um grafo plano G é sempre um subgrafo H de G , mas pode não ser um ciclo. No grafo plano da figura 6.13, quatro das suas faces são limitadas por ciclos, duas são triangulares, isto é, limitadas por um 3-ciclo, e duas quadrangulares, isto é, limitadas por um 4-ciclo. A fronteira da face ilimitada não é um ciclo, é um subgrafo formado por um 4-ciclo ligado a um 3-ciclo por uma aresta. A face limitada mais à direita também tem como fronteira um subgrafo que não é ciclo.
FIGURA 6.13
• A definição de face é dada para a representação planar e não para o grafo «abstracto». Na figura 6.14 estão duas representações planares do mesmo grafo, cujas faces são limitadas por ciclos diferentes do grafo; por exemplo, na do lado esquerdo há uma face limitada por um pentágono (um ciclo de comprimento cinco) e na da direita não há.
231
GRAFOS: NO SÍTIO E A CORES
FIGURA 6.14
• Se H é a fronteira de uma face limitada, F , de uma representação planar do grafo G , existe uma outra representação planar de G , em que o grafo H é a fronteira da face ilimitada (e vice-versa). Basta pensar que os grafos planares são esféricos, ou seja, usar a inversa da projecção estereográfica para levar G para a esfera e projectar de novo no plano usando para PN um ponto no interior da face F . • Se o grafo plano for um pouco mais do que conexo, mais precisamente, se for conexo e não tiver vértices de corte, todas as suas faces são limitadas por um ciclo, desde que tenha pelo menos três vértices. Um vértice de corte v de um grafo G conexo é um vértice que, quando retirado, desconecta o grafo, isto é, tal que G \{v } é desconexo. Estes grafos sem vértices de corte dizem-se 2-conexos e o referido resultado foi provado por Whitney (ver [Bondy e Murty, 2008]). • Há grafos planos 2-conexos, tendo portanto todas as faces limitadas por um ciclo, mas que não são grafos de poliedros.
FIGURA 6.15
232
MARIA LEONOR MOREIRA
O grafo da figura 6.15 não tem vértices de corte; tem seis faces, quatro triangulares e duas quadrangulares; tem ainda todos os vértices com grau ≥ 3, o que acontece com todos os grafos de poliedros (cada vértice é intersecção de pelo menos três faces), mas não com todos os grafos 2-conexos. Contudo, este grafo não pode ser esqueleto de um poliedro, porque tem duas faces (as quadrangulares, uma delas é a ilimitada) que têm dois vértices em comum mas não têm qualquer aresta em comum. • Na verdade, o esqueleto de um poliedro convexo é sempre um grafo 3conexo, isto é, para desconectar o grafo é preciso retirar pelo menos três vértices (observe que, sendo v um vértice do grafo de um poliedro, os seus vizinhos estão num ciclo que separa v dos outros vértices do grafo). Surpreendentemente, esta condição é suficiente para que um grafo planar seja poliédrico, ou seja: Teorema de Steinitz: G é o esqueleto de algum poliedro convexo se e só se G é planar e 3-conexo. A prova da suficiência desta condição, obtida por Steinitz em 1922, não cabe no âmbito deste livro. As provas conhecidas não são simples: mostram como construir o poliedro cujo esqueleto é um grafo 3-conexo dado, G , começando pelo grafo K 4 = G 0 , ao qual corresponde o tetraedro, realizando operações sucessivas nos grafos intermédios, G i , até obter G , e mostrando que essas operações são realizáveis, isto é, que para cada passo i há um poliedro cujo esqueleto é G i . A exposição desta prova feita em [Ziegler, 1994] é muito clara e completa. Em [Barnette, 1983] ela é feita para o caso particular dos grafos 3-regulares, isto é, cujos vértices têm todos grau 3; a hipótese simplifica a prova sem esconder o essencial do seu método.
6.5.4 QUANTAS SÃO AS FACES? O Teorema de Steinitz mostra que não é grande a distância entre os grafos planares e os poliédricos. Já estendemos o conceito de face para grafos planos. Vamos agora ver que o número de faces de um tal grafo pode ser calculado usando a fórmula de Euler para poliedros convexos. Fórmula de Euler: Se G = (V, E ) é um grafo plano e conexo, e |F | é o número de faces de G , então |V | − |E | + |F | = 2.
233
GRAFOS: NO SÍTIO E A CORES
• Como G é conexo, se tiver só uma face então é uma realização planar de uma árvore e, nesse caso, já vimos que |E | = |V |−1; assim, o teorema é verdadeiro se |F | = 1. • Consideremos então G um grafo plano e conexo com n ≥ 2 faces; neste caso, o grafo tem algum ciclo C . Uma aresta e = x y ∈ E (C ) separa duas faces de G ; portanto; se retirarmos essa aresta a G , obtemos um grafo G \{e } com menos uma face: G \{e } é conexo porque qualquer caminho de G que usa a aresta e = x y pode
ser substituído por um caminho em G \{e } que percorre o resto do ciclo para ir de x a y , isto é, as arestas de um ciclo não são arestas de corte; É claro que G \{e } continua a ser plano e, assim, podemos usar a hipótese de indução e concluir: |V (G )| − |E (G )| + |F (G )| = = |V (G \ {e })| − (|E (G \ {e })| + 1) + (|F (G \ {e }|) + 1) = (|V (G \ {e })| − |E (G \ {e })| + |F (G \ {e })|) − 1 + 1 =2−1+1 = 2.
A figura 6.16 é um facsimile do parágrafo de uma edição da carta escrita em 1750 por Euler a Goldbach em que a fórmula é referida e onde é antecedida pela frase Mas não consigo demonstrar com o devido rigor a proposição seguinte:
FIGURA 6.16
Um ano mais tarde, Euler apresentou uma prova à Academia das Ciências de S. Petesburgo e publicou-a, em 1756, num extenso artigo sobre poliedros ([Wilson, 2005]). O resultado suscitou a atenção de muitos matemáticos e no 234
MARIA LEONOR MOREIRA
virar do século são sucessivamente publicadas as provas obtidas por Legendre em 1794, L’Huilier em 1812 e Cauchy em 1813 (ver [Biggs et al., 1998]). Desde aí têm sido poblicadas inúmeras provas, em [5], por exemplo, estão descritas dezanove provas diferentes desta fórmula que evidenciam as suas ligações com outras áreas da matemática. Em [1] o leitor pode encontrar uma aplicação que permite manipular um grafo na esfera, dando uma clara sugestão de prova do resultado que complementa a «secura» da prova por indução. A beleza do resultado de Euler também se manifesta na força e na diversidade das suas aplicações e aconselhamos o leitor a consultar em [Aigner e Ziegler, 1999] o capítulo que lhes é dedicado. Como aqui o rumo já está traçado iremos, indelicadamente, utilizar a fórmula em proveito próprio, ou seja, para avançar no problema que estamos a tratar.
6.5.5 APROVEITANDO A FÓRMULA 1. Todas as representações no plano de um grafo planar conexo, G , têm o mesmo número de faces, |F (G )| = 2−(|V (G )|−|E (G )|), podendo assim falar-se do número de faces de um grafo planar . 2. Observe-se que se G é um grafo planar com mais de duas arestas, a fronteira de uma face de uma realização do grafo no plano G tem, no mínimo, três arestas. Assim, chamando ε f ao número de arestas da fronteira de uma face f , ∑ f ∈F (G ) ε f ≥ 3|F (G )|. Por outro lado, cada aresta de G é fronteira de, no máximo, duas faces de G ∑ e, assim: 2|E (G )| ≥ f ∈F (G ) ε f . Podemos assim concluir que 2|E (G )| ≥ 3|F (G )|. 3. Um grafo com muitas arestas não pode ser planar! Mais precisamente, se G é planar e |V (G )| ≥ 3, então |E (G )| ≤ 3|V (G )| − 6. Se o grafo for conexo, 3|F (G )| = 3(2 − (|V (G )| − |E (G )|) e, assim, usando o parágrafo anterior, concluímos que 2|E (G )| ≥ 3(2 − (|V (G )| − |E (G )|), provando o resultado. Para grafos desconexos a desigualdade é válida por ser verificada em cada componente conexa do grafo. 4. As triangulações são os grafos planares maximais. Na verdade, em (2) verifica-se a igualdade se e só se todas as faces de G são triangulares, isto é, 235
GRAFOS: NO SÍTIO E A CORES
todas tiverem 3-ciclos como fronteira, como acontece com K 4 , por exemplo. Assim, a um grafo com uma realização planar G nestas condições não é possível acrescentar qualquer aresta mantendo a planaridade. 5. A condição em (3) pode permitir mostrar com uma simples contagem de vértices e de arestas que um grafo não é planar. Podemos reduzir a prova de que K 5 não é planar a notar que |E (K 5 )| = 52 = 10 e 3|V (K 5 )| − 6 = 15 − 6 = 9. 6. Se G é planar então ∃v ∈ V (G ) : d (V ) ≤ 5. Basta provar o resultado para G conexo (claro!) e assim |E (G )| ≤ 3|V (G )| − 6; ∑ ∑ como em qualquer grafo v ∈V (G ) d (v ) = 2|E (G )|, deduz-se que v ∈V (G ) d (v ) ≤ 6|V (G )| − 12 < 6|V (G )|, mostrando que nem todos os vértices podem ter grau maior ou igual a 6. Estas conclusões são condições necessárias, mas não caracterizam a planaridade. Na figura 6.17 está representado o chamado grafo de Petersen.
FIGURA 6.17
Este grafo é «bem comportado»: todos os seus vértices têm grau 3, como os grafos poliédricos e, como |E | = 15 e 3|V | − 6 = 24, verifica a desigualdade |E | < 3|V | − 6, e, no entanto, veremos mais à frente que este grafo não é planar.
6.6 VOLTANDO AO PROBLEMA DAS CORES Podemos agora voltar a pensar nos mapas. A um mapa M associámos em 6.3.2 um grafo, G (M ), mas há um outro grafo que lhe pode ser associado mais «literalmente»: o grafo, L(M ), cujas arestas são as linhas de fronteira e cujos vértices são as intersecções dessas linhas, isto é, são os pontos de fronteira comum a três ou mais países. O desenho dos contornos do mapa é uma representação planar deste grafo, L(M ), onde os países são limitados por «polígonos» cujas arestas podem ser
236
MARIA LEONOR MOREIRA
curvas, os ciclos de L(M ). As regiões limitadas pelos ciclos, os «países», são as faces de L(M ). Na figura 6.18 está representado o mesmo mapa que na figura 6.7 com as fronteiras dos países «alisadas» de modo a evidenciar os dois grafos que lhe estão associados, G (M ) e L(M ).
FIGURA 6.18
O grafo G (M ) pode ser obtido do grafo plano L(M ); a cada face de L(M ) corresponde um vértice de G (M ); como cada aresta e de L(M ) está na fronteira entre duas faces, corresponde-lhe em G (M ) uma aresta e ∗ que liga os vértices correspondentes a essas faces. Do ponto de vista combinatório, os dois grafos estão relacionados do mesmo modo que o grafo de um cubo e o de um octaedro e, em geral, um poliedro com o seu dual. Também aqui se diz que G (M ) é o grafo dual de L(M ), escreve-se G (M ) = (L(M ))∗ .
6.6.1 DUAL DE UM GRAFO Na figura 6.19 está representado o grafo do cubo e, a vermelho, o seu dual, o grafo do octaedro. Em geral, se G é um grafo plano, o grafo dual de G é o grafo G ∗ tal que: v f ∈ V (G ∗ ) v f vg ∈
E (G ∗ )
⇐⇒
f ∈ F (G )
⇐⇒
e ∈ E (G ), e ∈ fronteira( f ) ∩ fronteira(g )
Observe-se que, para tratar a dualidade em geral, temos de admitir que um grafo pode ter lacetes ou arestas paralelas, já que eles podem surgir em G ∗ , como no exemplo da figura 6.20, mesmo sendo G um grafo (grafo simples, no contexto 237
GRAFOS: NO SÍTIO E A CORES
FIGURA 6.19
geral de multigrafos). No problema que estamos a tratar esta questão é irrelevante, porque o dual de um mapa não tem lacetes nem arestas paralelas e, além disso, em qualquer problema de coloração, as arestas paralelas não impõem mais restrições que uma só e um vértice adjacente a si próprio (um lacete) nunca pode ser colorido, mas é um «egoísta» desinteressante. A propósito da noção de dual gostaríamos ainda de observar que: • A definição de dual é dada para grafo plano e não para planar, porque ela depende da representação; pode haver duas representações planares do mesmo grafo cujos duais são grafos não isomorfos, como na figura 6.20. • Por outro lado, apesar de o dual ser definido como um grafo «abstracto», é fácil ver que o dual de um grafo plano é um grafo planar já que a própria definição fornece a representação. Um mergulho do dual no plano sem cruzamentos de arestas pode sempre ser obtida de modo análogo ao que foi feito para desenhar G (M ) a partir do grafo do mapa M . • O dual G ∗ de um grafo plano G é um grafo conexo. Esta observação também é clara se pensarmos na representação de G (M ) a partir do grafo do mapa: a dois vértices de G ∗ correspondem duas faces de G (dois países); escolhendo dois pontos do interior dessas faces (as capitais, por exemplo) podemos ligá-los por uma curva no plano que não passa nos vértices de G , obtendo uma sequência de arestas e faces de G , portanto, uma sequência de arestas e vértices de G ∗ que determina um caminho em G ∗ en-
238
MARIA LEONOR MOREIRA
FIGURA 6.20
tre os vértices (percurso traçado no mapa para uma viagem entre os dois países ) Isto acontece mesmo que G seja desconexo; se, por exemplo, as suas componentes forem desenhadas de modo a só se intersectarem as respectivas faces ilimitadas, no dual, o vértice correspondente a essa face vai estar ligado a faces de cada uma das componentes (uma espécie de vértice correspondente ao «mar» dos mapas). • Quando partimos já de um grafo G plano conexo, dualizando duas vezes recuperamos G , ou seja G é isomorfo a (G ∗ )∗ se e só se G é conexo.
6.6.2 MAIS DE CINCO É DESPERDÍCIO! Podemos, finalmente, traduzir o problema de Guthrie porque sabemos que, sendo M um mapa no plano, L(M ) é um grafo plano e G (M ) é o seu dual, portanto, é um grafo planar; assim, a conjectura das quatro cores é equivalente a: Todo o grafo planar pode ser bem colorido com não mais de quatro cores. Ou, usando a nomenclatura usual em grafos, G planar =⇒ χ(G ) ≤ 4
onde χ(G ), dito o número cromático de G , é definido como o número mínimo de
239
GRAFOS: NO SÍTIO E A CORES
cores necessárias para bem colorir os vértices de G , isto é, de tal modo que a vértices adjacentes sejam atribuídas cores distintas. O facto de K 5 não ser um grafo planar confirma a ideia de De Morgan, de que ele não pode ser um contra-exemplo para a conjectura, mas claro que não a prova, apesar de inúmeras vezes terem surgido hipotéticas «provas» que recorriam exclusivamente a esse argumento! Tal como o mapa planar na figura 6.21 precisa de quatro cores e não é K 4 , o mesmo podia acontecer para cinco cores: a necessidade de uma quinta cor ser proveniente de uma configuração global.
FIGURA 6.21
Depois da morte de De Morgan, foi Cayley o matemático que manifestou publicamente interesse neste problema. Para além de, em 1878, no Encontro da London Mathematical Society, ter enunciado o problema desafiando os seus pares a resolvê-lo (e esse desafio é publicado na Nature), publica pouco depois um artigo no qual, além de referir o interesse de De Morgan no problema, expõe algumas das suas ideias sobre como tentar resolvê-lo e quais os obstáculos à sua resolução. A primeira ideia é a de usar a coloração de um mapa com n países para colorir um outro com n +1 países. Só com esta ideia, usar indução em |V (G )|, podemos mostrar que: Teorema das Seis Cores: Todo o grafo planar, G , pode ser bem colorido com não mais de meia dúzia de cores. 240
MARIA LEONOR MOREIRA
É claro que o resultado é válido para n = |V (G )| ≤ 6. Seja n = |V (G )| > 6; como G é planar, vimos que há sempre um vértice v 0 ∈ V (G ) com grau ≤ 5. O grafo G \ {v 0 } é planar (claro!) e tem n − 1 vértices, usando a hipótese de indução pode ser colorido com seis cores. Como v 0 tem, no máximo, cinco vizinhos, os vértices vizinhos de v 0 usam, no máximo, cinco dessas cores, sobrando sempre uma cor para pintar v 0 . Neste caso, corre tudo o melhor possível: não só temos prova como ela dá uma maneira recursiva de pintar, retirando sucessivamente vértices de grau ≤ 5 ao grafo até chegar a um grafo de seis vértices e colorindo a partir daí. Para avançar é preciso recorrer a algo mais do que a indução e chegar à primeira «prova» publicada do Teorema das Quatro Cores. Esta «prova» (ver [Biggs et al., 1998]), da autoria de Alfred Kempe e publicada pela primeira vez em 1880, no volume 2 do American Mathematical Journal, foi responsável pela expansão do interesse da comunidade matemática pelo problema. A argumentação de Kempe não estava correcta, mas incluía diferentes observações novas e relevantes acerca do problema, que alargaram o seu «raio de acção» e motivaram matemáticos que até aí o encaravam como um desafio menor. Para além disso, as suas ideias principais foram retomadas em posteriores tentativas de resolução da conjectura de Guthrie, inclusive na sua prova, cerca de cem anos depois. Uma das ideias subjacentes à prova é a de que, ao acrescentar mais um vértice ao grafo, ou um país ao mapa, para o colorir pode ser necessário recolorir uma grande parte dos vértices. Se o leitor, depois de colorir o mapa inicial dos condados britânicos, tentar agora pintar o mar, para não exceder as quatro cores terá, provavelmente, de recolorir uma parte do mapa. Apesar de a «prova» de Kempe ter sido amplamente divulgada e discutida, o seu erro só é detectado dez anos depois por Heawood. Melhor que qualquer outro matemático da época, Heawood compreendeu as ideias de Kempe e o artigo em que relata o erro no método da prova (ver [Biggs et al., 1998]) recupera essas ideias para conseguir resultados, menos fortes, mas suficientemente interessantes. Em particular, usa um dos seus principais argumentos, agora chamado método das cadeias de Kempe, para provar que cinco cores bastam: Teorema das Cinco Cores: Todo o grafo planar pode ser bem colorido com não mais de cinco cores.
241
GRAFOS: NO SÍTIO E A CORES
Comecemos por lembrar que podemos, sem perda de generalidade, admitir que o grafo é conexo. • Para provar o teorema vamos usar um argumento inicial sugerido por Cayley e Kempe e utilizado frequentemente em teoria de grafos: o contra-exemplo minimal. Admitindo, por redução ao absurdo, que o teorema é falso, teria de existir um contra-exemplo; de entre todos os contra-exemplos escolhemos um minimal, isto é, tal que qualquer grafo com menos vértices verifica o teorema. • Seja G esse contra-exemplo minimal, |V (G )| ≥ 6 e, como G é planar e conexo, tem um vértice v de grau ≤ 5. Na verdade, basta fazer a prova para o caso de o vértice v 0 de menor grau de G ter grau 5 (se existisse v ∈ V (G ) tal que d (v ) ≤ 4 poderíamos usar o argumento do Teorema das Seis Cores para chegar a uma contradição). • Assim, G é planar, v 0 ∈ V (G ), d (v 0 ) = 5 e G \ {v 0 } pode ser colorido com cinco cores. Admitamos ainda que qualquer boa coloração de G \ {v 0 } com cinco cores usa cores todas diferentes nos vértices adjacentes a v 0 , caso contrário poderíamos obter uma boa coloração de G usando a cor de sobra para v 0 . Na figura 6.22 está representada esta hipótese: vamos ver que, mesmo neste caso, é possível recolorir G \ {v 0 } de modo a usar não mais de quatro cores nos vizinhos de v 0 .
FIGURA 6.22
• Escolhamos dois vizinhos não consecutivos de v 0 , chamemos-lhes v a e v b por estarem coloridos de amarelo e de branco, respectivamente. 242
MARIA LEONOR MOREIRA
Pode ou não haver em G \ {v 0 } um caminho, Pa b , que liga v a a vb e cujos vértices são só amarelos ou brancos, aquilo que Kempe chamou «cadeia». • Se não houver um tal caminho, poderemos recolorir G \ {v 0 } trocando as cores, branca por amarela e vice-versa, em todos os vértices que estiverem ligados a v a por um caminho de vértices brancos e amarelos em G \ {v 0 }. Na figura 6.23, está representada esta hipótese antes e depois da recoloração dos vértices. O grafo G \ {v 0 } continuará a estar bem colorido (claro!) e os cinco vértices vizinhos de v 0 passarão a estar coloridos só com quatro cores, sobrando neste caso o amarelo para colorir v 0 .
FIGURA 6.23
• No caso de existir um tal caminho Pa b , existe então no grafo G um ciclo resultante de ligar as extremidades de Pa b a v 0 , C =: v a v 0 vb Pa b . Como G é planar, a representação de C é uma curva de Jordan e como v a e v b foram escolhidos não consecutivos, há um vizinho de v 0 no interior e o outro no exterior dessa curva. Na figura 6.24 v c , o vértice castanho, é interior à curva e, por exemplo, v e , o vértice encarnado é exterior. Repetindo agora o argumento anterior com estes dois novos vértices, v c e v e , pode colorir-se o vértice v 0 com uma das cores, castanho ou encarnado, se não existir um caminho Pc e que ligue v c e v e em G \ {v 0 }, usando só vértices castanhos e encarnados. Se existir um tal caminho Pc e , então, na representação planar do grafo G , esse caminho teria de intersectar a curva de Jordan C e, assim, pela definição de representação planar, a intersecção teria de ser um vértice x que pertenceria a Pc e ∩ C . Chegaríamos assim a uma contradição: por x pertencer ao ciclo C teria de 243
GRAFOS: NO SÍTIO E A CORES
estar colorido de branco ou de amarelo, por pertencer ao caminho Pc e teria de estar colorido de castanho ou de encarnado.
FIGURA 6.24
Numa nota publicada em 1891 nos Proceedings of the London Mathematical Society, em que relata que tentou em vão compor o erro detectado por Heawood, Kempe salienta que o erro afecta, eventualmente, o seu método de prova, mas não a conjectura. Kempe subestimou-se: apesar do muito que foi preciso avançar no estudo dos grafos até Appel e Haken conseguirem uma prova do Teorema das Quatro Cores, a verdade é que as ideias de Kempe estão presentes nessa prova.
6.7 GRAFOS PLANARES PARA ALÉM DAS QUATRO CORES O estudo da planaridade era prioritário para quem quisesse dar mais uma achega à resolução da conjectura e foi-se autonomizando dela. Um dos resultados mais importantes, uma caracterização dos grafos planares, foi obtido em 1930 por Kuratowski. É frequentemente divulgado o desafio de tentar fazer as ligações de três casas a três abastecimentos, gás, água e luz, por exemplo. É claro que o problema só existe se se impuser que as ligações se façam todas no mesmo plano; aí ele não tem solução e a fórmula de Euler pode prová-lo. O desafio é equivalente a tentar obter uma representação no plano do grafo completo bipartido, K 3,3 . Bipartido porque o seu conjunto de vértices, V , pode ser 244
MARIA LEONOR MOREIRA
«partido» em dois conjuntos disjuntos (correspondentes às casas e aos abastecimentos), sem arestas a ligar vértices do mesmo conjunto; completo porque entre os vértices que podem ser ligados são feitas todas as ligações, neste caso 3 × 3.
FIGURA 6.25
Assim, se e = x y é uma aresta de um grafo bipartido, então x ∈ V1 ⇐⇒ y ∈ V2 , obrigando os ciclos do grafo a ter comprimento par; na verdade, não é difícil ver que esta propriedade caracteriza os grafos bipartidos. Portanto, se um grafo bipartido tiver uma representação no plano, as faces dessa representação têm um número par de lados, no mínimo quatro, e assim 4|F | ≤ 2|E |. Usando a fórmula de Euler como atrás, podemos garantir que num grafo bipartido planar |E | ≤ 2|V | − 4 e concluir que K 3,3 não é planar, porque |E (K 3,3 )| = 9, que é maior do que 2|V (K 3,3 )| − 4 = 8. Observe-se ainda que este grafo, como K 5 , é minimal não planar. Kuratowski mostrou que estes dois grafos são a raiz do problema, mais precisamente: Teorema de Kuratowski: Um grafo G é planar se e só se não tem qualquer subgrafo homeomorfo a K 5 ou a K 3,3 . No teorema, com homeomorfo a um grafo quer-se dizer um grafo que é um deles ou pode ser deles obtido fazendo subdivisão de arestas, isto é, substituindo algumas arestas por um caminho a ligar as suas extremidades. A ideia pode ficar clara na figura 6.26: do lado esquerdo está representado o grafo de Petersen, G , e do lado direito um grafo H homeomorfo a K 3,3 . É fácil ver que H é subgrafo de G , H = G \ {C D,b e }, o que garante que G não é planar. Uma prova deste teorema pode ser consultada em [Bondy e Murty, 2008], bem como um algoritmo que dela se pode deduzir para testar a planaridade de um grafo dado. Este algoritmo, para além de ser rápido (corre em tempo polinomial) no caso de o grafo ser planar, dá uma representação do grafo no plano. 245
GRAFOS: NO SÍTIO E A CORES
FIGURA 6.26
Algoritmos deste tipo são utilizados no desenho de circuitos integrados. A ideia é obter um desenho de uma rede eléctrica para ser construída numa placa plana sem cruzamentos, ou seja, pretende-se saber se o grafo associado à rede é planar e, no caso de o ser, saber como o desenhar.
6.8 GRAFOS NOUTRAS SUPERFÍCIES 6.8.1 OS CINCO PRÍNCIPES, OS SEUS PALÁCIOS E O FEITICEIRO Para além de ser agora fácil obter muitos exemplos de grafos planares, o leitor também já pode construir muitos que o não são começando com um dos «maus», K 5 ou K 3,3 , e acrescentando-lhe vértices e arestas. No seu livro Famous Problems in Mathematics (ver [Wilson, 2005]), Tietze retoma o problema dos cinco príncipes posto por Möbius e acrescenta-lhe um ponto que conduz naturalmente à descoberta do bom sítio para K 5 : O problema dos cinco palácios: E se, no seu testamento, o marajá indiano, pai dos cinco príncipes, acrescentasse que cada príncipe deveria construir um palácio dentro dos seus domínios e os palácios deveriam estar todos ligados entre si por estradas que não se poderiam cruzar? É claro que o modelo do problema dos palácios é K 5 . De acordo com o conto de Tietze, quando os príncipes começavam a desesperar por não conseguirem cumprir a vontade do pai, um feiticeiro ambulante que por ali passava anunciou que tinha uma solução. Ela é fácil de sugerir: Basta colocar uma ponte na estrada que liga dois dos palácios, ou seja, não podendo desenhar convenientemente K 5 no plano ou na esfera, desenhamos
246
MARIA LEONOR MOREIRA
FIGURA 6.27
todo o grafo menos uma aresta (já vimos que ∀ e , K 5 \ e é planar) e fazemos a aresta restante passar por uma «ponte». Está encontrado o sítio para K 5 ! Ele pode ser representado na «esfera com uma ponte», diz-se na esfera com uma ansa. É fácil admitir que essa superfície é topologicamente equivalente a um toro: basta pensar num pneu, um toro, feito com uma borracha suficientemente fina que permita empurrar quase todo o ar para uma das suas metades, a esfera, sobrando uma espécie de alça, a ansa. O mesmo «feiticeiro» pode resolver o problema dos abastecimentos das três casas: basta desnivelar uma das condutas para uma das casas, isto é, K 3,3 também pode ser representado no toro. E a ideia pode ser usada para qualquer grafo. Associamos aos vértices pontos da esfera e ligamos por curvas da esfera os pontos que correspondem a vértices ligados por arestas, enquanto for possível fazê-lo sem cruzar quaisquer duas curvas. Para cada aresta x y que não for possível desenhar «cola-se» uma ansa no local apropriado, isto é, começando «suficientemente próximo» do ponto P da esfera correspondente ao vértice x e acabando «suficientemente próximo» do ponto Q correspondente ao vértice y . É sempre possível fazê-lo porque o número de arestas adjacentes a cada vértice é finito; se quisermos uma imagem, podemos pensar que, se necessário, a esfera é «grande» e as ansas são «estreitas».
247
GRAFOS: NO SÍTIO E A CORES
FIGURA 6.28
6.8.2 CADA GRAFO NO SEU SÍTIO Assim, qualquer grafo pode ser representado numa esfera com um número k conveniente de ansas, ou seja, e de acordo com o Teorema de Representação de Superfícies, numa superfície fechada e orientável de género k , S k . E aquilo que informalmente referimos como sítio de um grafo é chamado o género do grafo G e notado γ(G ): γ(G ) = min{k : G é representável em S k }
Na verdade, uma esfera com duas ansas é topologicamente o mesmo que um duplo toro, a superfície de um biscoito com o formato de um 8 e, mais geralmente, a esfera com k ansas, um k -toro. E o género de um grafo é o menor número de «buracos» (eventualmente zero) de um toro em que pode ser desenhado sem cruzar arestas. Muito do que foi visto para grafos planares, ou seja, grafos de género zero, pode ser generalizado para grafos noutras superfícies, sabendo que se pode ge-
248
MARIA LEONOR MOREIRA
FIGURA 6.29
FIGURA 6.30
neralizar a fórmula de Euler se a representação do grafo na superfície for suficientemente boa para se poder falar de faces. Na figura 6.31 estão três representações de K 4 em S 1 e só a da direita é um bom mergulho. Para essa representação, depois de retirado o desenho do grafo ao toro, ele fica decomposto em duas regiões, o «losango» que aparece de topo e o seu complementar, ambas conexas e homeomorfas ao interior de um disco. Ou seja, essa representação no toro do grafo K 4 tem duas faces. Mais precisamente, se f : G = (V, E ) → S k é um mergulho de um grafo G em 249
GRAFOS: NO SÍTIO E A CORES
FIGURA 6.31
S k , ele diz-se celular se as componentes conexas de S k \ f (G ) forem homeomorfas
a discos abertos. Estas componentes dizem-se as faces dessa representação de G . Para que se possa melhor perceber que os dois mergulhos da esquerda da figura 6.31 não são «bons», incluímos as figuras da segunda linha. Elas ilustram outra maneira de obter um toro, identificando dois a dois os lados opostos de um rectângulo; com a primeira identificação, os dois lados amarelos, obtém-se um cilindro oco e com a segunda, os dois lados azuis, «colam-se» as circunferências das bases. Assim, por exemplo na mergulho de K 4 representado ao meio, ao retirar o desenho de K 4 sobram três componentes conexas, duas «boas», o interior dos triângulos, e uma «má», um «cilindro». L’Huilier provou, em 1812 (ver [Biggs et al., 1998]), que cada superfície tem a sua fórmula de Euler; o segundo membro dessa fórmula é chamado a característica de Euler da superfície, ε(S k ). Como consequência desse resultado podemos afirmar que: Se F é o conjunto das faces de uma representação celular de um grafo conexo G = (V, E ) numa superfície S k , então: |V | − |E | + |F | = 2 − 2k = ε(S k ).
Usando esta fórmula como na secção 6.5.5, isto é, notando que as faces de um grafo G = (V, E ) de género γ(G ) têm pelo menos três lados, obtém-se a desi-
250
MARIA LEONOR MOREIRA
gualdade: |E | ≤ 3(|V | − ε(S γ(G ) )) = 3 |V | − (2 − 2γ(G )) = 3|V | − 6 + 6γ(G ),
(6.1)
ou seja, um minorante para o género do grafo: 1 γ(G ) ≥ (|E | − 3|V | + 6). 6
Esta relação confirma a ideia de que o sítio de um grafo depende da relação entre o número de arestas e de vértices desse grafo, isto é, fixado um número de vértices, quanto mais arestas maior o número de buracos para o seu toro! Observe-se que a desigualdade foi obtida à custa de uma representação celular de G mas não depende dela. Na verdade, König provou que se um grafo G é representável numa superfície de género k , S k , então existe uma representação celular de G numa superfície de género menor ou igual a k (ver [Saaty e Kainen, 1986]). Assim, a desigualdade |E | ≤ 3(|V | − ε(S)) é verificada em qualquer superfície S na qual o grafo G = (V, E ) seja representável. Aplicando-a para K n (n ≥ 3) obtém-se: 1 γ(K n ) ≥ 6
n (n − 3)(n − 4) − 3n + 6 = . 2 12
Em particular, γ(K 5 ) ≥ 16 > 0 confirmando que K 5 não é planar, pois tem género estritamente positivo. Como conhecemos uma representação de K 5 no toro, ela garante que o género é igual a 1, o menor inteiro maior que 1/6. Para os valores de n seguintes obtém-se γ(K 6 ) ≥
10 1 > 0, γ(K 7 ) ≥ 1 e γ(K 8 ) ≥ > 1. 2 6
A última desigualdade permite concluir que K 8 tem género maior ou igual a 2, portanto já não é representável no toro. Observe-se que a desigualdade só dá respostas pela negativa. Por exemplo, só garante que K 6 e K 7 não são planares; para mostrar que são tóricos seria preciso desenhá-los num toro como está feito na secção 6.8.3 para K 7 . Apesar de haver vários resultados parciais anteriores, em 1968 Ringel concluiu a prova de que, para todo o n , o menor inteiro maior ou igual ao valor dado pela fórmula dá o género de K n : 251
GRAFOS: NO SÍTIO E A CORES
γ(K n ) =
(n − 3)(n − 4) (n − 3)(n − 4) = min k : k ≥ . 12 12
Este resultado é conhecido como Teorema da Coloração de Mapas por razões que ficarão claras já em seguida. Observe-se que os valores de γ(K n ) crescem rapidamente (ver [6], introduzindo a sequência A000933), por exemplo, o grafo completo de treze vértices já precisa de um 10-toro. Apesar de não existir um resultado semelhante ao Teorema de Steinitz para superfícies de género positivo, é fácil dar exemplos de grafos de género k que são o esqueleto de poliedros. Na figura 6.32está representado um poliedro tórico que pode ser uma maneira de determinar a característica de Euler do toro: contar o número de vértices, arestas e faces de um exemplo. Neste caso, |V | − |E | + |F | = 16 − 32 + 16 = 0.
FIGURA 6.32
Também não há análogos ao Teorema de Kuratowski para outras superfícies. Há, no entanto, um resultado de Robertson e Seymour, de 1984, que garante a existência de uma família finita de «grafos minimais proibidos» para cada superfície. Esta família, que desempenha o mesmo papel que K 5 e K 3,3 desempenhavam no Teorema de Kuratowski, só é conhecida no caso de uma superfície não-orientável, o plano projectivo, e tem cento e três grafos… São muitos «maus» para excluir! Os resultados referidos até agora fazem parecer os grafos planares mais fáceis de tratar; vamos voltar ao problema de coloração e usar a história da sua resolução para desmitificar essa ideia. 252
MARIA LEONOR MOREIRA
6.8.3 HÁ SÍTIOS PARA MUITAS CORES! Já referimos que Heawood recuperou as ideias de Kempe com sucesso. Para além da ideia das cadeias, outra sugestão de Kempe, no seu artigo [Kempe, 1879], a ser retomada por Heawood foi a de generalizar o problema de coloração para mapas noutras superfícies. Na verdade, não é raro em matemática conseguir-se resolver um problema formulando-o num contexto mais geral. A questão que se pôs a Heawood, e à qual respondeu parcialmente, foi a determinação do número mínimo de cores necessárias para fazer uma boa corolação de um mapa desenhado numa superfície, com a definição de boa coloração análoga à do plano. Também aqui se pode dualizar o problema e utilizar o grafo dual do mapa na superfície, passando a pretender determinar o número máximo de cores que podem ser necessárias para bem colorir um grafo que pode ser representado numa certa superfície. Esse número é habitualmente designado por número cromático da superfície e notado χ(S): χ(S) = max{χ(G ) : G é representável em S}.
Claro que em 1890 Heawood não conhecia (!) o Teorema de Coloração de Mapas, de Ringel, mas percebia que, ao aumentar o género da superfície, podia nela representar grafos com maior número cromático. Em particular, sabia ser possível representar K 7 no toro. Na figura 6.33, do lado esquerdo está representado o grafo K 7 e do lado direito um mergulho desse grafo no toro quando se olha para esta superfície como um rectângulo com as identificações descritas na secção anterior; algumas arestas estão contidas nos lados do rectângulo e, portanto, ficaram na cor correspondente. O mais surpreendente é que Heawood conseguiu encontrar um majorante para χ(S) para todas as superfícies fechadas diferentes da esfera e esse valor é, naturalmente, chamado o número de Heawood da superfície: $ H (S) =
7+
p % 49 − 24ε(S) 2
( = max k : k ≤
7+
p ) 49 − 24ε(S) 2
.
Teorema de Heawood: Para toda a superfície S fechada e diferente da esfera χ(S) ≤ H (S). Apesar do aspecto feioso de H (S), o resultado pode ser visto como mais uma consequência da fórmula de Euler (para qualquer superfície) e só deixa de fora 253
GRAFOS: NO SÍTIO E A CORES
1
2
3
4
1
4 6
7
5
5
1
2
3
1
FIGURA 6.33
uma única superfície fechada orientável, a esfera, por ter característica de Euler estritamente positiva. A sua prova repete o argumento usado para o Teorema das Seis Cores: 7+
p
49−24ε(S)
1. Comecemos por notar que α(S) = não é assim tão feio, se obser2 varmos que é uma (a maior) das duas raízes da equação x 2 − 7x + 6ε(S) = 0. 2. Considere-se G um qualquer grafo representável em S , onde ε(S) ≤ 0. Vamos ver que G tem um vértide de grau ≤ α(S) − 1 . Para isso, designemos por grau médio de G , d med (G ), a média dos graus dos vértices de G : ∑ d med (G ) =
v ∈V (G ) d (v )
|V |
.
∑
| Logo, d med (G ) = 2|E , lembrando que v ∈V (G ) d (v ) = 2|E | (Lema dos Apertos |V | de Mão). | 3. Assim, basta mostrar que d med (G ) ≤ α(S) − 1, ou que 2|E ≤ α(S) − 1, para ga|V | rantir que, pelo menos um vértice tem grau ≤ α(S) − 1, já que nem todos os vértices podem ter grau maior que a média.
• Se |V | ≤ α(S) − 1, então d (v ) ≤ α(S) − 2 para todo v ∈ V (G ) e claro que d med (G ) ≤ α(S) − 1. • Suponhamos, então, |V | > α(S) − 1, ou seja: |V | ≥ α(S).
254
(6.2)
MARIA LEONOR MOREIRA
Usando |E | ≤ 3(|V | − ε(S γ(G ) )) = 3|V | − 3ε(S) (ver desigualdade 6.1 em 6.8.2), podemos concluir que: d med (G ) =
2|E | 6ε(S) ≤6− . |V | |V |
Usando a desigualdade 6.2 e a hipótese ε(S) ≤ 0 obtém-se: 6−
6ε(S) 6ε(S) ≤6− |V | α(S)
d med (G ) ≤ 6 −
6ε(S) . α(S)
• Assim, a igualdade 6− 6ε(S) = α(S) − 1 é equivalente à igualdade (α(S))2 − α(S) 7α(S)+6ε(S) = 0 e esta última é verdadeira porque α(S) é raiz da equação x 2 − 7x + 6ε(S) = 0. 4. Repetindo, então, o argumento recursivo usado para o Teorema das Seis Cores, escolhe-se em G um vértice v 0 de grau ≤ ⌊α(S) − 1⌋. Pinta-se G \ {v 0 } com ⌊α(S)⌋ cores, usando a hipótese de indução, e sobra uma dessas cores para pintar v 0 . Pode agora perceber-se porque é chamado Teorema de Coloração o resultado de Ringel que determina o género dos grafos completos: aquele resultado mostra que para toda a superfície orientável S , diferente da esfera, χ(S k ) ≥ H (S k ) o que, juntamente com o Teorema de Heawood, determina o número cromático de todas estas superfícies: k > 0,S = S k =⇒ χ(S) = H (S).
Para percebê-lo basta ver que o Teorema de Ringel mostra que o grafo completo com tantos vértices como o número de Heawood da esfera com k ansas tem género, no máximo, k : sendo x = α(S k ) =
7+
p
(x − 3)(x − 4) ( = 12
49 − 24ε(S k ) 2
p
=
p 7 + 1 + 48k 2
p 1+48k +1 ( 1+48k −1 )( ) 2 2
12
= k.
Assim, fazendo n = H (S k ) = ⌊x ⌋ = x − δ, com 0 ≤ δ < 1, é fácil ver que: 255
GRAFOS: NO SÍTIO E A CORES
γ(K n ) =
(n − 3)(n − 4) = ⌈k + ε⌉, com ε ≤ 0. 12
Portanto, o grafo K n é representável na superfície S k garantindo que o seu número cromático é, no mínimo n = H (S k ), o número de cores necessárias para colorir K n . Observe-se que este resultado não permite saber, para um grafo G , exactamente o seu número cromático, mesmo sabendo o seu sítio, isto é, o seu género! Veja-se, por exemplo, K 3,3 , o grafo dos abastecimentos das casinhas: já vimos que ele tem género 1, isto é, não é planar mas é representável no toro e χ(K 3,3 ) = 2 ≪ 7 = χ(toro). Lembrando a sua definição, é claro que todos os grafos bipartidos podem ser pintados só com duas cores e podem ter género arbitrariamente grande: £ γ(K m ,n ) = (m −2)(n−2) (ver [Saaty e Kainen, 1986]). 4 A aplicação da página [2] permite colorir mapas em diferentes superfícies e grafos de diferentes géneros. A coloração de exemplos variados é um instrumento particularmente útil para uma boa compreensão da noção de número cromático de um grafo e de uma superfície. Na página [7] está representado o poliedro de Császár. O esqueleto deste estranho poliedro é o grafo K 7 , tem sete vértices de grau 6 (portanto, 72 = 21 arestas) e catorze faces triangulares, como a realização de K 7 no toro aqui representada. O dual deste poliedro é chamado poliedro de Szilassi. Tem sete faces, todas hexagonais e, portanto, é um modelo de um mapa no toro, dual de K 7 , que precisa de sete cores para ser bem colorido. Em [8] podem ser apreciadas diferentes realizações materiais desse mapa, algumas surpreendentemente bem conseguidas.
6.9 CHEGADOS AO COMEÇO Ao cabo de mais de cem anos a conjectura de Guthrie foi, enfim, provada em 1976, por K. Appel e W. Haken [Appel e Haken, 1977], passando a ser um teorema que podemos enunciar assim: Teorema das Quatro Cores: χ(plano) = χ(esferaS 0 ) = H (S 0 ) = 4.
256
MARIA LEONOR MOREIRA
Como é usual, e sem retirar qualquer mérito aos seus autores, a solução do problema foi antecedida por inúmeros resultados, importantes por si só e que contribuíram para a resolução encontrada. Nos livros [Wilson, 2005] e [Saaty e Kainen, 1986] é feita uma descrição detalhada da prova do teorema, bem como de alguns destes resultados anteriores. O primeiro tem uma perspectiva um pouco mais histórica; no segundo, as diferentes contribuições matemáticas são mais pormenorizadas, em particular, são referidas diferentes formulações equivalentes do teorema. Como já tínhamos referido na secção 6.6.2, algumas das ideias da «prova» errada de Kempe estão presentes nesta resolução: • Admitir a existência de um contra-exemplo minimal para chegar a uma contradição. As características de um eventual contra-exemplo são o objecto de diversos resultados. Sabia-se, por exemplo, quando a prova foi conseguida, que se ele existisse teria pelo menos noventa e seis vértices. [Saaty e Kainen, 1986] • Encontrar características obrigatoriamente presentes num tal contra-exemplo, ditas inevitáveis, que permitissem reduzi-lo, isto é, colori-lo com quatro cores usando a 4-coloração dos seus subgrafos (o papel cumprido pelo vértice de grau ≤ 5 no Teorema das Cinco Cores). Na sua coluna da revista Scientific American, no número de 1 de Abril de 1975, Martin Gardner escreve um artigo intitulado: Seis descobertas sensacionais que, de uma maneira ou outra, escaparam à atenção do público, a «partida» de 1 de Abril da revista. Nestas descobertas inclui um pretenso contra-exemplo da conjectura, o mapa com cento e dez países representado na figura 6.34. O interesse que a conjectura despertava na altura é traduzido pelas centenas de cartas recebidas por Gardner com o mapa colorido com 4 cores. (ver [Wilson, 2005]) Provada a conjectura, não persiste qualquer dúvida sobre a existência de uma coloração com não mais de quatro cores para este mapa; no entanto, outros problemas relacionados com ela podem ser levantados. Um deles surgirá imediatamente ao leitor se tentar colorir o mapa de Gardner. Como fazê-lo usando somente quatro cores? Referimo-nos, claro, à construção de bons algoritmos de coloração para grafos. Por outro lado, sendo claro que, fixado o número k de cores, pode haver mais do que uma coloração, também lhe poderá interessar saber se a solução 257
GRAFOS: NO SÍTIO E A CORES
FIGURA 6.34
que encontrou era «difícil», ou seja, a menos de permutação das cores, quantas k -colorações pode um grafo ter? Estes e outros exemplos, alguns deles perguntas ainda em aberto, ficam aqui sem resposta. Para, finalmente, chegarmos ao começo, uma deixa contra os cépticos quanto às aplicações da matemática. Para além das aplicações dentro da disciplina, não é difícil dar exemplos de diversas situações comuns para as quais a coloração de grafos é um bom modelo: • Para fazer o calendário das reuniões de turma numa escola, podemos definir um grafo cujos vértices correspondem às turmas e cujas arestas ligam os vértices das turmas que têm algum professor em comum. 258
MARIA LEONOR MOREIRA
Assim, a reunião de duas turmas pode ser simultânea se e só se os vértices que lhes correspondem não são adjacentes, isto é, podem ser coloridos com a mesma cor. Fazer uma boa coloração deste grafo corresponde a dar um calendário possível para as reuniões. Fazê-lo com o número mínimo de cores dá as «melhores» soluções, isto é, aquelas que correspondem a um calendário ocupando um número mínimo de «tempos». • De maneira análoga, ao colorir com o número mínimo de cores o grafo cujos vértices correspondem a um certo número de produtos químicos e cujas arestas ligam químicos «incompatíveis», pode ser optimizada a armazenagem desses produtos, minimizando o número de contentores estanques a serem utilizados. • Ou ainda, para regular os semáforos de um cruzamento de modo a minimizar os «tempos de espera», podemos colorir com o número mínimo de cores um grafo cujos vértices correspondem aos diferentes percursos dos veículos, ligando aqueles que correspondem a percursos incompatíveis. Autores das Figuras: A mais linda Esfera com ansa e K 5 bem como as figuras 6.11, 6.12 e 6.29 foram feitas pelo António Alves. Todas as restantes figuras, incluindo a mais linda Curva de Jordan, foram feitas pela Rebeca Pereira. A ambos agradeço a paciência, a disponibilidade e o gosto com que entederam e superaram os meus desejos.
259
GRAFOS: NO SÍTIO E A CORES
BIBLIOGRAFIA Para evitar uma lista de artigos originais demasiadamente extensa e de díficil acesso para a maioria dos leitores, só fazem parte da bibliografia os artigos onde é feita a conjectura e a resolução do problema das quatro cores. [Guthrie, 1880] e [Appel e Haken, 1977], bem como [Euler, 1741] e [Kempe, 1879] pela sua importância histórica. Nos outros casos, o leitor é remetido para um livro onde o resultado surja e o artigo original seja citado; sempre que possível, para o livro [Biggs et al., 1998] que contém transcrições de muitos dos artigos anteriores a 1936, ou para [Wilson, 2005], uma deliciosa história da resolução do problema das quatro cores, cuja bibliografa é vasta e bem comentada. O livro [Bondy e Murty, 1976] é uma referência básica, de consulta «obrigatória» para quem começa a interessar-se por teoria de grafos; o livro mais recente dos mesmos autores, [Bondy e Murty, 2008], é mais profundo e abrangente. Os livros [Saaty e Kainen, 1986] e [Mohar e Thomassen, 2001] são uma boa opção para o leitor interessado em aprofundar os seus conhecimentos acerca dos métodos de prova do Teorema das Quatro Cores e das questões topológicas em teoria de grafos, respectivamente. O texto descarregável da página [IREM] é especialmente dirigido a professores do ensino secundário e pode ser particularmente útil a quem domine melhor a lingua francesa do que a inglesa. Os comentários às restantes páginas e livros foram já feitos aquando da citação. [Aigner e Ziegler, 1999] M. Aigner e G. Ziegler, 1999: Proofs from The Book, Springer.
[Bondy e Murty, 2008] J. Bondy e U. Murty, 2008: Graph Theory, Springer.
[Appel e Haken, 1977] K. Appel e W. Haken, 1977: “Every planar map is four colorable. Part I. Discharging. Part II. Reducibility”, Illinois J. Math. 21, 429–567.
[Euler, 1741] L. Euler, 1741: “Solutio Problematis ad Geometriam Situs Pertinentis”, Commentarii academiae scientiarum Petropolitanae 8, 128-140, contido em: Opera Omnia: Series 1, Volume 7, pp. 1–10. Traduzido para língua inglesa em [Biggs et al., 1998]. Digitalização do original em: http://www.math.dartmouth.edu/~euler/docs/ originals/E053.pdf
[Barnette, 1983] D. Barnette, 1983: Map Coloring, Polyhedra and The Four-Color Problem, Dolciani Mathematical Expositions, M.A.A. [Biggs et al., 1998] Biggs, Lloyd e Wilson, 1998: Graph Theory 1736–1936, Oxford University Press. [Bondy e Murty, 1976] J. Bondy e U. Murty, 1976: Graph Theory with Applications, North Holand. Descarregável da página: http://www.ecp6. jussieu.fr/pageperso/bondy/books/gtwa/gtwa. html 260
[Guthrie, 1880] F. Guthrie, 1880: “Note on the colouring of maps”, Proceedings of the Royal Society of Edinburgh 10, 727–728. [Kempe, 1879] A. Kempe, 1879: “On the geographical problem of the four colors”, Amer. J.
MARIA LEONOR MOREIRA
Math. 2, 193–200.
[Wilson, 2005] R. Wilson, 2005: Four Colors Sufce – How the four color problem was solved, Princeton University Press.
[Mohar e Thomassen, 2001] B. Mohar e C. Thomassen, 2001: Graphs on Surfaces, The Johns Hopkins University Press.
[Ziegler, 1994] G. Ziegler, 1994 Lectures on Polytopes Springer.
[Saaty e Kainen, 1986] T. Saaty e P. Kainen, 1986: The four-color problem. Assaults and conquest, Dover Publications.
[IREM] Groupe IREM Luminy, Graphes pour la terminale ES (2002). Descarregável da página: http://www.irem. univ-mrs.fr/productions/nouveautes.php
PÁGINAS DA INTERNET [1] http://cmup.fc.up.pt/agoliv/Sigma/ bola-euler-nova.html [2] http://www.atractor.pt/mat/colorirmapas [3] http://demonstrations.wolfram.com/ [4] http://cgm.cs.mcgill.ca/~godfried/teaching/ cg-projects/97/Octavian/compgeom.html [5] http://www.ics.uci.edu/~eppstein/junkyard/ euler/ [6] http://www.research.att.com/~njas/ sequences/ [7] http://mathworld.wolfram.com/ CsaszarPolyhedron.html [8] http://faculty.smcm.edu/sgoldstine/torus. html
261
7 ESPELHOS MEUS Samuel António Lopes
The sun was shining, the lake was hard and full of reflections, the Norman tower presented to her one golden face and one receding into shadow. […] There was no way of breaking into this scene, for it was all imaginary. Iris Murdoch, “The Bell”
A simetria de um problema é decerto um dos pilares da sua harmonia, mas esta simetria, e outras que se revelem no decorrer do seu estudo, deverá destacar-se também como agente privilegiado na sua resolução. É este princípio que nos propomos ilustrar no presente capítulo: a construção e uso de simetrias na resolução de problemas. Não abordaremos temas como a classificação de padrões no plano ou noutras superfícies, sobre o qual existe abundante bibliografia, embora chamemos a atenção do leitor interessado para o recente livro de J. Conway [Conway et al., 2008]. A primeira secção trata de três problemas de geometria que podem ser resolvidos recorrendo ao uso de simetria (reflexões e rotações). Na secção seguinte o leitor encontrará vários projectos, a maioria dos quais podem ser explorados usando um programa de geometria dinâmica, como por exemplo o Geogebra [GeoG]. Apesar de apresentarem níveis de dificuldade variáveis, pensamos que estes projectos, com as adaptações que o docente achar convenientes, são adequados ao uso na sala de aula de Matemática. Terminamos o capítulo com uma secção mais breve constituída por outros problemas em que a simetria tem um papel preponderante, especialmente na natureza da sua resolução.
7.1 TRÊS PROBLEMAS GEOMÉTRICOS Nos exemplos que estudaremos adiante, por vezes a simetria que conduz à solução é auto-evidente e intuitiva, podendo mesmo estar implícita na formulação do problema; outras vezes é necessário um estudo mais profundo do problema e uma prática apurada para a detectar.
263
ESPELHOS MEUS
7.1.1 O PROBLEMA DE HERON Começamos com um problema simples, cuja solução é atribuída a Heron de Alexandria (século I). Problema de Heron No plano, considerem-se uma recta r e dois pontos A e B no mesmo semi-plano determinado por r . Pretende-se encontrar o ponto X de r para o qual AX + X B é mínimo. Podemos pensar em r como representando a margem de um rio e nos pontos A e B como as posições de uma pessoa e de um local onde há um pequeno fogo para apagar, respectivamente. O objectivo é encontrar o caminho mais curto de A para B , passando por r para encher um balde com água. A figura 7.1 ilustra alguns caminhos, não necessariamente optimais.
FIGURA 7.1
Neste problema é natural considerar uma reflexão relativamente a r . Mais especificamente, seja A ′ a reflexão do ponto A na recta r . Dado um ponto X em r , sejam a = a (X ) = AX , b = b (X ) = X B e c = A ′ B . Então a + b = A′X + b ≥ c
(7.1)
uma vez que A ′ X = a e A ′ X , b , c são os comprimentos dos lados de um triângulo. Note-se que o comprimento c não depende da escolha do ponto X em r e, portanto, a desigualdade (7.1) verifica-se para todo o ponto X de r . Além disso, a desigualdade (7.1) é uma igualdade precisamente quando X é um ponto do segmento de recta A ′ B . Logo, o valor mínimo de AX + X B é c = A ′ B e este valor é 264
SAMUEL ANTÓNIO LOPES
FIGURA 7.2
atingido exactamente quando X é o ponto de intersecção da recta r com o segmento de recta A ′ B , sendo A ′ a reflexão do ponto A na recta r . Seja C esse ponto de intersecção.
FIGURA 7.3
Exploremos melhor a solução deste problema, procurando algumas propriedades que a caracterizem. Sejam P e Q os pés das perpendiculares a r passando pelos pontos A e B , respectivamente. Os triângulos rectângulos AC P e A ′C P são congruentes, já que se obtêm um do outro por reflexão na recta r . Além disso, o triângulo rectângulo BCQ é semelhante a ambos, pois ∠BCQ = ∠A ′C P . É então fácil de concluir que C é o único ponto do segmento de recta PQ tal que ∠AC P = ∠BCQ . Se r representar a superfície de um espelho, o ponto C é aquele ponto de r ao qual, apontando um raio de luz com origem em A , o reflexo do mesmo passa por B .
265
ESPELHOS MEUS
FIGURA 7.4
Em termos dos comprimentos p = AP , q = BQ e l = PQ , a semelhança de triângulos já referida conduz à relação PC p = l p +q
(7.2)
que permite determinar o ponto C no segmento de recta PQ . Exercício 7.1 De todos os triângulos com área e um dos lados dados, determine aquele que tem perímetro mínimo. Exercício 7.2 De todos os triângulos com o perímetro e um dos lados dados, determine aquele que tem área máxima. Podemos agora generalizar o problema, introduzindo mais rectas. Por exemplo, considerem-se duas rectas r e s e dois pontos A e B , como na figura 7.5. O problema consiste em encontrar um percurso de comprimento mínimo de A para B , passando primeiro por r e depois por s . À semelhança do que foi feito para resolver o Problema de Heron, sejam A ′ e ′ B os pontos obtidos por reflexão de A em r e de B em s , respectivamente. Dados pontos X em r e Y em s , AX + X Y + Y B = A ′ X + X Y + Y B ′ ≥ A ′ B ′ .
(7.3)
Logo, qualquer percurso tem comprimento não inferior ao comprimento do segmento A ′ B ′ . Resta agora encontrar um percurso de comprimento exactamente igual ao comprimento deste segmento. Para tal basta observar que o segmento 266
SAMUEL ANTÓNIO LOPES
FIGURA 7.5
A ′ B ′ intersecta r e s (porquê?), digamos nos pontos X e Y , respectivamente. Então
a linha poligonal formada pelos segmentos AX , X Y e Y B tem comprimento A ′ B ′ , por (7.3), uma vez que X e Y são pontos de A ′ B ′ e X está entre A ′ e Y . Este percurso é, portanto, a solução do problema (por que é que é única?).
FIGURA 7.6
Exercício 7.3 Sejam r , s , A , B , A ′ , B ′ , X e Y como acima. (a) Mostre que os ângulos que os segmentos AX e Y X fazem com r (em X ) são iguais e observe uma propriedade análoga para a recta s no ponto Y .
267
ESPELHOS MEUS
(b) Seja A ′′ a reflexão de A ′ na recta s . Mostre que Y pode ainda ser determinado como o ponto de intersecção do segmento A ′′ B com a recta s e, de seguida X obtém-se como ponto de intersecção de A ′ Y com r .
7.1.2 O PROBLEMA DE FAGNANO Prosseguimos com um problema um pouco mais complexo, resolvido por Fagnano (século XVIII). Problema de Fagnano Inscrever num triângulo acutângulo A BC um triângulo X Y Z de perímetro mínimo. Como acabámos de referir, este problema foi resolvido no século XVIII por Fagnano, usando métodos analíticos. Cerca de um século mais tarde, H. Schwarz (século XIX–XX) encontrou uma solução recorrendo ao uso sucessivo de reflexões. A sua solução é bastante mais simples e elegante, e será apresentada mais à frente. Por agora, começamos por estudar um problema relacionado, mais simples, que nos permitirá também chegar à solução. Dado um triângulo acutângulo A BC e um ponto X no interior do segmento A B , determinar pontos Y e Z no interior dos segmentos BC e AC , respectivamente, tais que o perímetro do triângulo X Y Z seja mínimo. Consideremos, então, um triângulo acutângulo A BC e um ponto X no interior de A B . Sejam Y e Z pontos quaisquer no interior dos segmentos BC e AC , respectivamente. Como no Problema de Heron, vamos tentar encontrar um segmento de recta que dependa apenas dos dados iniciais (isto é, do triângulo A BC e de X ), que possa servir de referência para o perímetro do triângulo X Y Z , para as várias escolhas de Y e Z . Um candidato natural, dado o que já vimos, é o segmento de recta determinado pelas reflexões de X nas rectas AC e BC . De facto, sejam X ′ e X ′′ as reflexões de X em AC e BC , respectivamente, e L , M os correspondentes pés das perpendiculares. 268
SAMUEL ANTÓNIO LOPES
FIGURA 7.7
FIGURA 7.8
Então, como o triângulo LZ X ′ é imagem de LZ X por uma reflexão, os segmentos XZ e X ′Z têm o mesmo comprimento, o mesmo acontecendo com os segmentos X Y e X ′′ Y . Logo, sendo p (Y,Z ) o perímetro do triângulo X Y Z , temos p (Y,Z ) = XZ + Z Y + Y X = X ′Z + Z Y + Y X ′′ ≥ X ′ X ′′ .
(7.4)
Além disso, (7.4) é uma igualdade precisamente quando X ′ , Z , Y e X ′′ forem colineares. Desta forma, se tomarmos Y e Z como sendo os pontos de intersecção do segmento X ′ X ′′ com os lados BC e AC , respectivamente, obtemos um triângulo inscrito com vértice em X e perímetro mínimo. Qualquer outra escolha para os pontos Y e Z conduz a um triângulo de perímetro superior a este último, por (7.4). Note-se mais uma vez que, para a escolha óptima, os ângulos que o triângulo X Y Z faz em Z com o lado AC são iguais, já que ∠XZ L = ∠X ′Z L = ∠Y ZC . Analogamente, são também iguais os ângulos determinados por este triângulo, em Y , no lado BC . 269
ESPELHOS MEUS
FIGURA 7.9
Quanto aos ângulos determinados em X por X Y Z no segmento A B , nada podemos afirmar, uma vez que estes dependem da posição de X inicialmente fixada. No entanto, é de conjecturar que o triângulo inscrito em A BC de perímetro mínimo é obtido por esta construção quando ∠Z X A = ∠Y X B . Exercício 7.4 Nas condições do problema acima, seja α = ∠C X A . (a) Observe que ∠A BC < α < π − ∠B AC . (b) Mostre que ∠Z X A = ∠AC B + (α − π/2) e que ∠Y X B = ∠AC B − (α − π/2). (c) Conclua que ∠Z X A = ∠Y X B se e só se X for o pé da altura de A BC relativamente ao vértice C . Observe-se, finalmente, que o segmento de recta X ′ X ′′ intersecta de facto os lados AC e BC do triângulo dado, por este ser acutângulo. Exercício 7.5 Ainda nas condições do problema estudado acima, considere o quadrilátero X X ′C X ′′ . (a) (b) (c) (d)
Mostre que ∠X ′ X X ′′ = ∠B AC + ∠A BC . Mostre que ∠X ′C X ′′ = 2∠AC B . Observe que os ângulos ∠X X ′C e ∠X X ′′C são agudos. Conclua que o quadrilátero X X ′C X ′′ é convexo e que os pontos Y e Z são pontos dos segmentos M C e LC , respectivamente.
Resolvido este problema, podemos tentar resolver o Problema de Fagnano determinando a posição de X no segmento de recta A B que torna o perímetro
270
SAMUEL ANTÓNIO LOPES
do triângulo X Y Z , construído a partir de X pelo processo acima encontrado, mínimo. Para tal, vamos primeiro determinar o perímetro p X do triângulo X Y Z . Já foi visto que p X = X ′ X ′′ . Como os triângulos C LX e C LX ′ são congruentes, por um ser a reflexão do outro na recta AC , deduz-se que C X ′ = C X e ∠X ′C L = ∠XC L . Analogamente, C X ′′ = C X e ∠X ′′C M = ∠XC M . Logo, ∠X ′ C X ′′ = 2(∠XC L + ∠XC M ) = 2∠AC B.
Resulta assim que o triângulo X ′C X ′′ é isósceles e portanto ∠C X ′ X ′′ = ∠X ′ X ′′ C = π/2 − ∠AC B.
Seja P o pé da altura do triângulo X ′C X ′′ relativamente a C . Então, p X = 2X ′ P = 2C X ′ cos(π/2 − ∠AC B ) = 2C X sen(∠AC B ).
(7.5)
Como 2 sen(∠AC B ) é independente de X , o perímetro de X Y Z atinge o valor mínimo quando C X atingir o valor mínimo. Claramente, este último valor é mínimo quando X for o pé da altura de A BC relativamente ao vértice C . Assim, podemos concluir que a solução do Problema de Fagnano é obtida tomando para X o pé da altura de A BC relativamente ao vértice C e depois construindo Y e Z como fizemos anteriormente. No entanto, podemos (e devemos!) valer-nos da simetria do problema: se tivéssemos começado por indagar qual a posição de Y no segmento BC que conduz a um triângulo inscrito X Y Z de perímetro mínimo, teríamos da mesma forma chegado à conclusão de que Y deveria ser o pé da altura de A BC relativamente ao vértice A , e que os pontos X e Z deveriam ser construídos a partir de Y por um procedimento análogo ao estudado anteriormente, reflectindo Y em A B e em AC . Teríamos também concluído que o triângulo X Y Z faz ângulos iguais com os segmentos A B e AC , nos pontos X e Z , respectivamente. Mas como provámos que a solução obtida é única e, portanto, não depende do processo usado para a ela chegar, podemos facilmente concluir o seguinte.
271
ESPELHOS MEUS
Solução do Problema de Fagnano Dado um triângulo acutângulo A BC , o triângulo inscrito neste de perímetro mínimo é o triângulo cujos vértices são os pés das alturas de A BC . Além disso, em cada vértice do triângulo inscrito, os seus dois lados determinam ângulos iguais no respectivo lado do triângulo A BC . Tais ângulos são iguais ao ângulo do vértice oposto de A BC .
FIGURA 7.10
Exercício 7.6 Sejam A BC um triângulo acutângulo e U V W um triângulo inscrito neste com a propriedade de, em cada vértice de U V W , os seus dois lados determinarem ângulos iguais no lado correspondente do triângulo A BC . Mostre então que cada um desses ângulos é igual ao ângulo do vértice oposto de A BC e que U , V e W são os pés das alturas de A BC . Exercício 7.7 Mostre que o perímetro do triângulo X Y Z que é solução do Problema de Fagnano relativamente ao triângulo acutângulo A BC é p = 4R sen(∠B AC ) sen(∠C B A) sen(∠AC B ),
onde R é o raio da circunferência circunscrita a A BC . Exercício 7.8 Sejam A BC um triângulo acutângulo e X Y Z o triângulo inscrito em A BC cujos vértices são os pés das alturas de A BC . Seja ainda O o ortocentro de A BC . O objectivo deste exercício é mostrar directamente que cada vértice de X Y Z determina ângulos iguais no lado do triângulo A BC onde se encontra, e que a amplitude deste ângulo é igual à do ângulo do vértice oposto de A BC . 272
SAMUEL ANTÓNIO LOPES
FIGURA 7.11
(a) Observe que o quadrilátero X B Y O pode ser inscrito numa circunferência e use este facto para concluir que ∠Y BO = ∠Y XO . (b) Observe que os ângulos ∠Y BO e ∠AC B são complementares, e que o mesmo acontece com os ângulos ∠Y XO e ∠B X Y . (c) Conclua que ∠B X Y = ∠AC B e termine a prova. Há uma forma bastante simples de resolver o Problema de Fagnano usando a solução do Problema de Heron. Esboçamos esse método de seguida. Consideremos então o triângulo acutângulo A BC e suponhamos que existe algum triângulo inscrito X Y Z de perímetro mínimo, digamos com X em A B . Então, o ponto X do segmento A B é tal que a distância Z X + X Y é mínima. Resulta então, pelo Problema de Heron, que os ângulos ∠AXZ e ∠B X Y são iguais.
FIGURA 7.12
273
ESPELHOS MEUS
Analogamente, ∠X Y B = ∠Z Y C e ∠XZ A = ∠Y ZC . Pelo exercício 7.6, existe um e um só triângulo inscrito em A BC com esta propriedade, logo X Y Z é o triângulo formado pelos pés das alturas de A BC . O problema deste argumento é que não garante que haja de facto um triângulo inscrito de perímetro mínimo. A existir, sabemos exactamente qual é, mas não temos a garantia da sua existência. Recorrendo a um resultado básico da topologia de espaços euclideanos, podemos garantir a existência de um triângulo inscrito de perímetro mínimo, embora para tal tenhamos de admitir que vértices desse triângulo possam coincidir com vértices do triângulo inicial A BC e que o triângulo possa ser degenerado (no sentido de dois dos seus vértices coincidirem). Mas o perímetro de um triângulo nestas condições é superior ou igual ao dobro de alguma das alturas de A BC . A figura 7.13 ilustra o caso X = A .
FIGURA 7.13
Aqui temos p = AZ + Z Y + AY ≥ 2AY ≥ 2AP.
Logo, para concluir esta prova basta mostrarmos que o triângulo formado pelos pés das alturas de A BC tem perímetro inferior ao dobro de qualquer uma das suas alturas. Deixamos esta etapa como exercício. Exercício 7.9 Sejam A BC um triângulo acutângulo e X Y Z o triângulo inscrito formado pelos pés das alturas de A BC . Sejam Q , R e S os pés das perpendiculares de A a X Y , XZ e Y Z , respectivamente. (a) Observe que YQ + Y S < 2AY . (b) Mostre que ∠AXQ = ∠RX A e deduza que X R = XQ .
274
SAMUEL ANTÓNIO LOPES
FIGURA 7.14
(c) Conclua que o perímetro de X Y Z é igual a YQ + Y S e, portanto, é inferior ao dobro da altura relativamente ao vértice A . Exercício 7.10 Dado um triângulo A BC qualquer, estude a existência de um triângulo inscrito de perímetro máximo. Vamos, finalmente, apresentar a solução de Schwarz para o Problema de Fagnano. Dado um triângulo acutângulo A BC , seja X Y Z o triângulo cujos vértices são os pés das suas alturas e seja ainda U V W um qualquer triângulo inscrito em A BC , distinto de X Y Z . Pelos exercícios 7.6 e 7.8, cada vértice de X Y Z determina ângulos iguais no lado do triângulo A BC a que pertence, e esta propriedade não é válida para o triângulo U V W . Começemos por reflectir A BC (e os respectivos triângulos inscritos) no seu lado A B . Sejam V ′ e Y ′ as imagens de V e Y , respectivamente, por esta reflexão. Então, X Y ′ = X Y e os pontos Z , X e Y ′ são colineares, já que ∠Z X Y ′ = ∠Z X Y + 2∠Y X B = ∠AXZ + ∠Z X Y + ∠Y X B = π.
Em particular, Z X + X Y = Z Y ′ . Prosseguimos, reflectindo o novo triângulo em BC ′ , este em C ′ A ′ , este outro em B ′ A ′ e, por fim, este último em B ′C ′′ , como ilustra a figura 7.16. Os pontos C ′ e A ′ , são as imagens de C e A pelas reflexões em A B e em BC ′ , respectivamente. 275
ESPELHOS MEUS
FIGURA 7.15
Finalmente, os pontos A ′′ , B ′ , C ′′ , W ′ e Z ′ são as imagens de A , B , C , W e Z , respectivamente, por esta sequência de cinco reflexões. O argumento anterior mostra ainda que os sucessivos pontos Z , X , Y ′ , etc., até Z ′ , são colineares (ver figura 7.16), pela propriedade dos ângulos do triângulo inscrito determinado pelas alturas de um triângulo acutângulo dado. Logo, resulta facilmente que ZZ ′ é igual ao dobro do perímetro de X Y Z . Observe-se agora que os segmentos AC e A ′′C ′′ são paralelos: na primeira reflexão AC sofreu uma rotação de amplitude 2∠C A B no sentido dos ponteiros do relógio; depois sofreu uma rotação de 2∠AC B , também no sentido dos ponteiros do relógio; de seguida manteve-se invariante; depois foi rodado 2∠C A B no sentido contrário ao dos ponteiros do relógio; e, por fim, foi rodado 2∠AC B no sentido contrário ao dos ponteiros do relógio. Logo, o ângulo total de rotação foi 0. Assim sendo, ZZ ′ = W W ′ , pois W Z = W ′Z ′ . Relativamente ao triângulo U V W , a sequência contínua de segmentos de recta entre W e W ′ tem, por um lado, comprimento igual ao dobro do perímetro de U V W , por outro tem comprimento estritamente superior a W W ′ , uma vez que os pontos dessa sequência de
276
SAMUEL ANTÓNIO LOPES
FIGURA 7.16
segmentos não são colineares (se o fossem, o triângulo U V W teria a propriedade, várias vezes referida, dos ângulos, que X Y Z possui mas, por hipótese, U V W não possui). Podemos, então, concluir que o perímetro do triângulo X Y Z é estritamente menor do que o perímetro de qualquer outro triângulo inscrito e, portanto, X Y Z é o triângulo inscrito de perímetro mínimo.
277
ESPELHOS MEUS
7.1.3 O PROBLEMA DE FERMAT Terminamos esta secção com o seguinte problema, proposto por Fermat (século XVII) a Torricelli (idem). O problema também é conhecido por Problema de Steiner (século XVIII–XIX), especialmente quando está a ser considerada a sua generalização a um número arbitrário de pontos. Problema de Fermat Dados três pontos A , B e C no plano, determinar um ponto P para o qual AP + B P + C P seja mínimo. Para simplificar a notação, sejam a (P) = AP , b (P) = B P e c (P) = C P . Seja ainda S(P) = a (P) + b (P) + c (P). Deste modo, pretendemos determinar P tal que S(P) seja mínimo. Para começar, é fácil de argumentar a existência de mínimo, já que podemos, sem perder generalidade, restringir P à região determinada por um círculo com centro num dos pontos A , B ou C e raio suficientemente grande (por exemplo, centro em A e raio igual a A B + AC ). No entanto, pode acontecer que o valor mínimo de S ocorra para P = A , B ou C . Por exemplo, se A , B e C forem colineares, digamos com B entre A e C , é fácil de ver que o mínimo de S ocorre quando P = B.
FIGURA 7.17
Se A , B e C não forem colineares, então formam um triângulo. Vejamos em primeiro lugar que, se S(P) é mínimo, então P é necessariamente um ponto deste triângulo (isto é, pertence ao seu interior ou à sua fronteira). As rectas determinadas pelos lados do triângulo A BC decompõem o exterior deste em seis regiões. Tomemos P ′ numa destas regiões. Por exemplo, como na figura 7.19. Seja D o ponto de intersecção do segmento AP ′ com a recta BC .
278
SAMUEL ANTÓNIO LOPES
FIGURA 7.18
FIGURA 7.19
Temos, então, S(C ) < S(P ′ ); logo, o mínimo de S não é atingido em P ′ . De facto,
S(P ′ ) = a (P ′ ) + b (P ′ ) + c (P ′ ) > a (P ′ ) + b (P ′ ) 279
ESPELHOS MEUS
= AD + DP ′ + b (P ′ ) ≥ AD + D B ≥ AC + C B = S(C ).
Exercício 7.11 Mostre que o mínimo de S não é atingido em nenhuma das restantes cinco regiões exteriores ao triângulo A BC , concluindo assim que esse mínimo é atingido nalgum(s) ponto(s) do seu interior ou da sua fronteira. Apresentamos de seguida uma construção, atribuída a Torricelli, que permite resolver o Problema de Fermat, fazendo uso de uma rotação apropriada. Dado o triângulo A BC , tome-se um ponto P no seu interior ou na sua fronteira. De seguida, aplicamos uma rotação no triângulo (eventualmente degenerado) APC , com centro em A e de ângulo π/3. Sejam C ′ e P ′ as imagens de C e P , respectivamente, por esta rotação. Como AP ′ = AP e ∠PAP ′ = π/3, o triângulo APP ′ é equilátero e AP = PP ′ . Além disso, PC = P ′C ′ uma vez que P ′C ′ é imagem de PC por uma rotação.
FIGURA 7.20
Logo, S(P) = B P + AP + C P = B P + PP ′ + P ′ C ′ ≥ BC ′ . 280
(7.6)
SAMUEL ANTÓNIO LOPES
Temos assim um minorante para S(P): o comprimento do segmento BC ′ . A questão que se põe é se existe algum ponto P para o qual se tenha S(P) = BC ′ e, em caso afirmativo, como determinar esse(s) ponto(s). Observemos que o segmento BC ′ intersecta o interior do segmento AC se e só se cada um dos ângulos ∠B AC ′ e ∠C ′C B for inferior a π, o que equivale a dizer que os ângulos internos do triângulo A BC em A e em C são inferiores a 2π/3, pois o triângulo AC C ′ é equilátero. Motivados por esta observação, começemos por analisar o caso em que todos os ângulos internos do triângulo A BC são inferiores a 2π/3. Ora, para se ter S(P) = BC ′ é necessário e suficiente que os pontos P e P ′ pertençam ao segmento BC ′ , por (7.6). Tal acontecerá precisamente quando as seguintes condições se verificarem: ∠C ′ P ′ A + ∠AP ′ P = π ∠P ′ PA + ∠AP B = π
Atendendo a que o triângulo APP ′ é equilátero e ∠C ′ P ′ A = ∠APC , o sistema de equações acima é equivalente a:
∠APC = 2π/3 ∠AP B = 2π/3
Note-se que, se estas duas condições se verificarem, verifica-se também ∠B PC = 2π/3. (O caso degenerado P = A, B ou C não pode ocorrer, pois implicaria que algum dos ângulos internos de A BC tivesse amplitude 2π/3.) Podemos, então, concluir que, neste caso, S(P) ≥ BC ′ e que se obtém igualdade exactamente quando o ponto P é tal que cada um dos lados A B , BC e AC subtende ângulos com vértice P iguais, necessariamente de amplitude 2π/3. Exercício 7.12 Dado um triângulo A BC , mostre que existe no máximo um ponto F relativamente ao qual cada um dos lados A B , BC e AC subtende um ângulo de 2π/3. Um tal ponto, a existir, está necessariamente no interior do triângulo e é designado por ponto de Fermat. Mostre ainda que se o ponto de Fermat existir, então todos os ângulos do triângulo A BC são inferiores a 2π/3. Estudemos agora a questão da existência do ponto de Fermat F . Recordando a construção de Torricelli, observamos mais uma vez que o triângulo AC C ′ é equi⌢ látero e que o segmento BC ′ intersecta o segmento AC no seu interior. Seja AC 281
ESPELHOS MEUS
o arco menor entre A e C do circuncírculo do triângulo AC C ′ . O segmento AC subtende um ângulo de 2π/3 de qualquer um dos pontos deste arco. Como, por hipótese, o ângulo ∠A BC é inferior a 2π/3, B está no exterior da região do plano ⌢ limitada por AC e pela sua corda AC (ver figura 7.21). Em particular, BC ′ inter⌢ secta AC nalgum ponto, que denotaremos por F . Por construção, ∠C FA = 2π/3. Como os ângulos ∠C ′ FA e ∠C ′C A estão inscritos na mesma circunferência e determinam nesta o mesmo arco, podemos concluir que ∠C ′ FA = π/3. Logo, ∠AF B = π − ∠C ′ FA = 2π/3 e, consequentemente, também ∠B F C = 2π/3. Está assim provada a existência do ponto de Fermat em triângulos cujos ângulos internos são inferiores a 2π/3. Fica também provado, neste caso, que F é a única solução do Problema de Fermat.
FIGURA 7.21
Resta agora considerar o caso de um dos ângulos do triângulo A BC ter amplitude igual ou superior a 2π/3. Sem perda de generalidade, supomos que ∠AC B ≥ 2π/3. Seja P um ponto qualquer do interior ou da fronteira do triângulo A BC , mas distinto de C . Vamos mostrar que S(P) > S(C ), de onde poderemos concluir que, neste caso, S(C ) é o mínimo de S e que C é a única solução do Problema de Fermat. Consideramos a recta determinada pelos pontos C e C ′ , onde C ′ é, como no caso anterior, a imagem de C por uma rotação de ângulo π/3 com centro em A .
282
SAMUEL ANTÓNIO LOPES
Há duas possibilidades, consoante esta recta intersecte ou não o segmento P B . Começemos pelo primeiro destes casos, sendo E o ponto de intersecção.
FIGURA 7.22
Então:
S(P) = C ′ P ′ + P ′ P + PE + E B > C ′E + E B
(porque P ̸= C )
= C ′C + C E + E B ≥ C ′C + C B = S(C ).
Vejamos agora o caso em que a recta C C ′ não intersecta o segmento P B . A extensão de C ′C no sentido de C ′ para C faz com o segmento AC um ângulo igual a 2π/3. Em particular, ∠AC P > 2π/3 e, consequentemente, ∠C PA < π/3 < ∠AC P . Logo, a (P) > C A e
S(P) = a (P) + b (P) + c (P) >CA +C B = S(C ). 283
ESPELHOS MEUS
FIGURA 7.23
Resumindo, temos os seguintes três casos: I. Se A , B e C forem colineares, com B entre A e C , então a solução do Problema de Fermat é P = B ; II. Se todos os ângulos do triângulo A BC forem inferiores a 2π/3, então a solução do Problema de Fermat é o ponto de Fermat F de A BC , o ponto do qual cada um dos lados do triângulo subtende um ângulo de 2π/3; III. Se algum dos ângulos do triângulo A BC for superior ou igual a 2π/3, então a solução do Problema de Fermat é o vértice do triângulo onde esse ângulo ocorre. Exercício 7.13 Seja A BC um triângulo cujos ângulos são todos inferiores a 2π/3. Construa-se sobre cada lado desse triângulo um triângulo equilátero, como na figura 7.24. Mostre que: (a) os segmentos AA ′ , B B ′ e C C ′ se intersectam num único ponto; (b) AA ′ = B B ′ = C C ′ .
284
SAMUEL ANTÓNIO LOPES
FIGURA 7.24
Exercício 7.14 Seja X Y Z um triângulo equilátero. Dado um ponto P no seu interior ou na sua fronteira, sejam A , B e C os pés das perpendiculares de P a cada um dos lados de X Y Z . (a) Mostre que PA + P B + PC é igual à altura de X Y Z ; em particular, este comprimento é independente da escolha de P . (b) Supondo que P está no interior de X Y Z , mostre que P é o ponto de Fermat do triângulo A BC . (c) Use as alíneas anteriores para deduzir uma resolução do Problema de Fermat.
7.2 PROJECTOS Como foi já referido na introdução deste capítulo, esta secção é constituída por vários projectos que podem ser usados, ou adaptados para uso, na sala de aula. Sugere-se que sejam acompanhados de actividades desenvolvidas com algum programa de geometria dinâmica (ver, por exemplo, [GeoG]) e que seja estimulada a pesquisa independente, sujeita a supervisão e com atitude crítica.
285
ESPELHOS MEUS
O nível de dificuldade é variável, quer entre os projectos, quer dentro de cada projecto, e alguns objectivos e actividades foram deixados propositadamente em aberto, no sentido de não estar definido completamente o resultado pretendido. O primeiro projecto é, de todos, o mais detalhado e pretende ilustrar como adaptar este texto, construindo um guião para uma sequência orientada de actividades para a sala de aula. Também a linguagem deste projecto é especificamente dirigida aos alunos, ao contrário do que acontece com os projectos subsequentes. Projecto 7.1 Apresentamos o Problema de Heron em formato de projecto, pronto para ser trabalhado em sala de aula. Recordamos a sua formulação. Problema de Heron No plano, considerem-se uma recta r e dois pontos A e B no mesmo semi-plano determinado por r . Pretende-se encontrar o ponto X de r para o qual AX + X B é mínimo. Podemos pensar em r como representando a margem de um rio e nos pontos A e B como as posições de uma pessoa e de um local onde há um pequeno fogo
para apagar, respectivamente. O objectivo é encontrar o caminho mais curto de A para B , passando por r para encher um balde com água. Actividade 7.1 Utilizando o programa Geogebra: (a) Traça uma recta r e dois pontos A e B no mesmo semi-plano determinado por r (ver figura 7.25). (b) Marca um ponto X na recta r e de seguida marca os segmentos AX e B X (ver figura 7.26). (c) Mede os comprimentos AX e B X e calcula AX + X B (ver figura 7.27). (d) Faz variar o ponto X e constroi uma tabela com os diferentes valores de AX , B X e AX + X B . (e) Apresenta uma conjectura para a posição do ponto X onde consideras que AX + X B é mínimo. Discute essa conjectura com os teus colegas. (f) Podes garantir que a solução que encontraste é a que minimiza o percurso de A para B , passando por r ? 286
SAMUEL ANTÓNIO LOPES
FIGURA 7.25
FIGURA 7.26
FIGURA 7.27
Vamos agora tentar determinar exactamente (sem sombra de dúvida!) qual é o ponto X que minimiza AX + X B . Actividade 7.2 Voltando à construção anterior no Geogebra: (a) Marca o ponto A ′ , reflectindo A na recta r . Une A ′ a B (ver figura 7.28). (b) Marca o ponto de intersecção de A ′ B com a recta r e chama-lhe X ′ (ver figura 7.29). (c) Mede os comprimentos A ′ B e A ′ X (ver figura 7.30). 287
ESPELHOS MEUS
FIGURA 7.28
FIGURA 7.29
FIGURA 7.30
(d) Mostra que para qualquer ponto X na recta r , A ′ B ≤ A ′ X + X B e conclui que AX + X B é mínimo quando X coincide com X ′ . Agora o professor pode propor aos alunos como projecto a generalização do Problema de Heron para mais do que uma recta. Actividade 7.3 Grupo 1. Toma duas rectas r e s e dois pontos A e B , como na figura 7.31. O pro-
288
SAMUEL ANTÓNIO LOPES
blema consiste em encontrar um percurso de comprimento mínimo entre A e B , passando primeiro por r e depois por s .
FIGURA 7.31
Grupo 2. Toma duas rectas r e s e dois pontos A e B , como na figura 7.32. O problema consiste em encontrar um percurso de comprimento mínimo entre A e B , passando primeiro por s e depois por r .
FIGURA 7.32
Actividade 7.4 Sejam X e Y os pontos de r e s , respectivamente, que tornam o comprimento p = AX + X Y + Y B mínimo. Sejam ainda X ′ e Y ′ os pontos de s e r , respectivamente, que tornam o comprimento q = AX ′ + X ′ Y ′ + Y ′ B mínimo. Explora as relações entre p e q . Em particular, quando é que podes garantir que p = q ? Quando é que podes garantir que p < q ? Quando é que podes garantir que p > q?
289
ESPELHOS MEUS
Projecto 7.2 Uma generalização de grande interesse do Problema de Fermat é a seguinte (ver [Graham]). Problema de Steiner Dados pontos A 1 , A 2 , . . . , A n no plano (n ≥ 3), determinar um sistema de segmentos de recta de comprimento total mínimo de tal forma que dois quaisquer dos pontos dados estejam ligados por uma linha poligonal formada por segmentos do sistema. Por exemplo, dados quatro pontos, podemos considerar várias configurações, como exemplificamos nas figuras 7.33.
FIGURA 7.33
Na primeira das figuras 7.33, não foi acrescentado qualquer ponto adicional. Esta configuração está relacionada com o conceito de árvore geradora minimal (relativamente à distância euclideana) de um grafo. Na segunda figura 7.33, tomaram-se as diagonais do quadrilátero A BC D e foi introduzido assim o seu ponto de intersecção P . Na terceira e quarta figuras 7.33 acrescentaram-se dois pontos, formando ângulos iguais com os segmentos de que cada um deles é extremidade e tais que AX = DX e AZ = BZ , respectivamente. Esta última construção é, claro, análoga à do ponto de Fermat, e não deverá ser surpreendente que esteja relacionada com o Problema de Steiner. P2-1. Admitindo que A BC D é um quadrado: (a) Calcule, para cada uma das figuras 7.33, a soma dos comprimentos dos segmentos de recta que a compõem.
290
SAMUEL ANTÓNIO LOPES
(b) Mostre que as configurações apresentadas na terceira e quarta figuras 7.33 são as únicas soluções do Problema de Steiner para os pontos A , B , C e D . (Sugestão: Pode usar o que já sabe acerca do Problema de Fermat.) P2-2. Estude o Problema de Steiner para os vértices de um rectângulo de lados a e b . Em particular, averigue qual das configurações representadas abaixo tem comprimento total menor.
FIGURA 7.34
Nem sempre é necessário acrescentar dois pontos para um problema inicial com quatro pontos. Na figura 7.35, apresenta-se uma solução do Problema de Steiner para os pontos A , B , C e D . Apenas foi necessário acrescentar o ponto P .
FIGURA 7.35
Como já acontece para apenas três ou quatro pontos, a solução do Problema de Steiner depende muito da configuração dos pontos dados. Quanto maior for o número de pontos, mais difícil é, em geral, determinar uma solução do problema. 291
ESPELHOS MEUS
P2-3. Faça uma pesquisa sobre este tópico (palavras chave em inglês: Steiner problem e Steiner tree), nomeadamente quanto aos seguintes aspectos: (a) aplicações do problema; (b) propriedades gerais das soluções do problema; (c) uso de bolas de sabão para obter uma aproximação da solução; (d) relação com árvores geradoras minimais; (e) razão entre o comprimento total de uma árvore geradora minimal e o de uma árvore de Steiner; (f) variações do problema (por exemplo, restringindo os pontos iniciais a terem coordenadas inteiras e os segmentos a serem paralelos aos eixos de coordenadas; versões do problema a três dimensões e noutras superfícies, como a esfera ou o toro; etc.). Projecto 7.3 Tomemos uma elipse e de focos A e B . Sejam T um dos seus pontos e d a soma das distâncias de T a cada um dos focos. Recordamos que e consiste nos pontos do plano cuja soma das distâncias a A e a B é d . Seja r a tangente a e no ponto T . Como r não intersecta o interior de e , a soma das distâncias de A e B a qualquer ponto de r é sempre não inferior a d . Logo, T é a solução do Problema de Heron relativamente aos pontos A e B e à recta r . Podemos então concluir, da análise que fizemos desse problema, o seguinte: Os segmentos de recta que unem os focos a um ponto de uma elipse determinam ângulos iguais com a tangente à elipse nesse ponto. Considere a seguinte variação do Problema de Heron: Dados uma circunferência c de centro C e dois pontos A e B , ambos no interior ou ambos no exterior de c , determinar o (um) ponto P de c cuja soma das distâncias a A e a B seja mínima (ou máxima).
292
SAMUEL ANTÓNIO LOPES
FIGURA 7.36
FIGURA 7.37
P3-1. Seja P uma solução deste problema. Usando a propriedade das elipses que acabámos de deduzir, mostre que ∠APC = ∠B PC . P3-2. Usando o exercício anterior, apresente outra resolução do Problema de Fermat. (Sugestão: Começe por considerar o caso em que a solução não é
293
ESPELHOS MEUS
nenhum dos vértices do triângulo. Nesse caso, observe que se P é solução então A e B estão no exterior da circunferência de centro C e raio C P .) Podemos considerar ainda outra variação do Problema de Heron: Dada uma recta r e dois pontos A e B em lados opostos de r , determinar o (um) ponto P em r cuja diferença das distâncias a A e a B (em valor absoluto) seja máxima.
FIGURA 7.38
P3-3. Resolva esta variação do Problema de Heron e estude algumas propriedades da solução. P3-4. Em analogia ao que foi feito no início para a elipse, deduza uma propriedade adequada da tangente a uma hipérbole num dos seus pontos. P3-5. Formule e resolva um problema análogo ao problema 7.3 acima (supondo que um dos pontos A ou B está no interior da circunferência e que o outro está no exterior).
294
SAMUEL ANTÓNIO LOPES
FIGURA 7.39
Projecto 7.4 Seja A BC um triângulo acutângulo e X Y Z o seu triângulo inscrito de perímetro mínimo. Denotem-se por α, β , γ, a , b , c e l os ângulos, os comprimentos dos lados e o perímetro, respectivamente, de A BC e por α′ , β ′ , γ′ , a ′ , b ′ , c ′ e p os ângulos, os comprimentos dos lados e o perímetro, respectivamente, de X Y Z . P4-1. Determine α′ , β ′ , γ′ e a ′ , b ′ , c ′ em função de α, β , γ e a , b , c . P4-2. Verifique que p /l pode tomar valores arbitrariamente próximos de 0. P4-3. Qual é o valor de p /l quando A BC é equilátero? P4-4. Mostre que p /l < 2/3 (cf. [Zirakzadeh, 1966]). P4-5. Mostre que p /l ≤ 1/2 e que se tem igualdade precisamente quando A BC é um triângulo equilátero (cf. [Zirakzadeh, 1966]). Mesmo que o triângulo A BC não seja acutângulo, podemos tomar para X Y Z o triângulo cujos vértices são os pés das alturas de A BC . Se A BC for acutângulo, então X Y Z é o triângulo inscrito em A BC de perímetro mínimo. Se A BC for rectângulo, então X Y Z é um triângulo degenerado (reduz-se a um segmento de recta). Se A BC for obtusângulo, então X Y Z é um triângulo que não está inscrito em A BC . Mantemos a notação introduzida acima para os ângulos, comprimentos dos lados e perímetro do triângulo X Y Z . 295
ESPELHOS MEUS
P4-6. Determine α′ , β ′ , γ′ e a ′ , b ′ , c ′ em função de α, β , γ e a , b , c , no caso em que A BC não é acutângulo. Sejam x = α/π, y = β /π e z = γ/π. Como 0 ≤ x , y , z ≤ 1 e x + y + z = 1, podemos identificar (x , y , z ) com as coordenadas baricêntricas de um ponto de um triângulo ∆ previamente fixado. Podemos, então, considerar a transformação (x , y , z ) 7→ (α′ /π, β ′ /π, γ′ /π)
como uma aplicação δ : ∆ → ∆. P4-7. Estude algumas propriedades da aplicação δ. Por exemplo, quando é que δ é injectiva, sobrejectiva, periódica, etc. (cf. [Kingston et al., 1988, Lax, 1990, Ungar, 1990, Gutkin, 1997])? Projecto 7.5 Resolva os Problemas de Heron, de Fagnano e de Fermat usando técnicas do cálculo infinitesimal.
7.3 A SIMETRIA IMPÕE-SE! Muitas das aplicações da matemática, nomeadamente à física, envolvem a análise das simetrias dos dados de um problema e o estudo de como essa simetria se pode reflectir na solução do mesmo. Um dos conceitos mais importantes e ubíquos em matemática, que permite lidar com a noção de simetria, é o de grupo, munido ainda do conceito de acção, ou representação. No entanto, esta soalheira e frondosa avenida levar-nos-ia precocemente para longe dos limites deste texto. Assim, no que resta do capítulo, daremos mais alguns exemplos elementares do uso de simetria na resolução de problemas. Queremos destacar o papel da simetria, tanto como auxílio, por vezes meramente heurístico, na procura de uma solução, como na resolução propriamente dita do problema.
7.3.1 SIMETRIA EM PROBLEMAS DE ÁLGEBRA, ARITMÉTICA E COMBINATÓRIA Leite e café. Temos duas chávenas, uma com café e a outra com leite. Com uma colher, retiramos uma colherada de leite da chávena com leite, a qual despejamos
296
SAMUEL ANTÓNIO LOPES
na chávena que contém o café. De seguida retiramos, com a mesma colher, uma colherada da mistura que se encontra na chávena de café, a qual adicionamos à chávena de leite. No final destas duas operações, haverá mais café na chávena de leite do que leite na chávena de café ou vice-versa? Note-se que não é dito se as duas chávenas contêm ou não a mesma quantidade de líquido nem se, ao fim da primeira operação, o leite e o café ficaram misturados de forma homogénea. O que se sabe é que as quantidades de líquido que foram deslocadas em cada uma das operações são iguais. Este problema resolve-se sem grande dificuldade por meio de uma equação, e fazê-lo pode inclusivamente ser um bom exercício de manipulação. Resolva-o desta forma! Na verdade, tudo neste exercício aponta para a falta de simetria dos dados e das operações. Não é de supor que se executarmos as duas operações pela ordem inversa o resultado seja análogo. No entanto, o que permite resolver o problema de uma forma muito simples é, em vez de pensar nas quantidades de leite na chávena de café e de café na chávena de leite, pensar nas quantidades de leite que falta na chávena de leite e de café que falta na chávena de café. De facto, o leite que falta na chávena de leite é precisamente o leite que se encontra na chávena de café e o café que falta na chávena de café é o café que se encontra na chávena de leite. Como os volumes inicial e final de líquido em cada uma das chávenas são iguais, resulta que o leite na chávena de café tem o mesmo volume que o café na chávena de leite.
Coeficientes binomiais. É bem conhecida a fórmula nk = n n−k , que expressa a simetria das linhas do triângulo de Pascal. Em vez de usar a popular expressão dos coeficientes binomiais em termos de factoriais, podemos provar esta fórmula recorrendo apenas à definição de nk como o número de maneiras de escolher k objectos de n objectos disponíveis e a um argumento simples de simetria: escolher k de n objectos é o mesmo que escolher os n − k objectos que foram preteridos. Raízes complexas da unidade. Mostrar que, para n ≥ 2, a soma das n raízes (complexas) n -ésimas da unidade é 0: ∑
z = 0.
z ∈C zn = 1
297
ESPELHOS MEUS
Este problema pode ser resolvido recorrendo à fórmula para a soma dos termos de uma progressão geométrica. Mas basta uma pequena observação para o resolver, recorrendo à disposição simétrica destas raízes quando representadas no plano complexo, como ilustra a figura 7.40 (para n = 12):
FIGURA 7.40
De facto, o conjunto destas raízes é invariante por uma rotação de ângulo 2π/n e, portanto, a sua soma também será. Como 0 é o único número complexo
invariante por uma rotação destas (pois n > 1), fica provada a igualdade pretendida. Sistema de equações lineares. Considere-se o sistema:
x − 2y + 3z = 18 3x + y − 2z = 18 −2x + 3y + z = 18
Notando que este sistema não é alterado por uma permutação circular das variáveis x , y e z , concluímos que, se (a ,b, c ) for uma solução deste sistema, então também o são (b, c , a ) e (c , a ,b ). Sabendo que o sistema tem solução única (o que se pode concluir sem ter de o resolver), deduzimos então que a solução tem de ser da forma (a , a , a ), de onde decorre que a − 2a + 3a = 18 ⇐⇒ a = 9. Assim, o sistema tem solução (9, 9, 9). Raízes de uma equação polinomial. Pretende-se encontrar as raízes (complexas) da equação x 4 − x 3 + x 2 − x + 1 = 0.
298
SAMUEL ANTÓNIO LOPES
Neste caso, podemos impor simetria à equação ao dividir todos os termos por x 2 (note-se que 0 não é solução), obtendo a equação equivalente: x 2 − x + 1 − 1/x + 1/x 2 = 0.
Levando esta ideia um pouco mais longe, fazemos a substituição y = x + 1/x . Como y 2 = x 2 + 2 + 1/x 2 , obtemos ainda a equação equivalente: y 2 − y − 1 = 0.
Sejam ϕ e ϕ as soluções desta equação. (Estes números são eles próprios uma expressão de simetria, mas a um nível diferente daquele que tratamos aqui.) Resta agora determinar as soluções das equações x + 1/x = ϕ
e x + 1/x = ϕ,
ou seja, x 2 − ϕx + 1 = 0
e x 2 − ϕx + 1 = 0.
Os quatro números complexos encontrados são as soluções da equação original. Expressão com simetria. Tomemos o seguinte produto: (x 2 y + y 2 z + z 2 x )(x y 2 + y z 2 + z x 2 ).
(7.7)
Cada um dos factores é invariante por permutação cíclica dos símbolos x , y e z , e se fixarmos um destes símbolos e permutarmos os outros dois os factores
permutam entre si. Logo, o mesmo acontecerá com o produto, isto é, o produto é simétrico em x , y e z . Por exemplo, x y z 4 ocorrerá na expansão do produto tantas vezes como x 4 y z e x y 4 z . Logo, observando ainda que cada termo do produto tem grau total em x , y e z igual a 6, podemos deduzir que o produto (7.7) tem a forma: α(x y z 4 + x 4 y z + x y 4 z ) + β (x y 2 z 3 + x 3 y z 2 + x 2 y 3 z + x y 3 z 2 + x 2 y z 3 + x 3 y 2 z ) +γx 2 y 2 z 2 + δ(x 3 y 3 + x 3 z 3 + y 3 z 3 )
Agora facilmente se conclui que α = 1, β = 0, γ = 3 e δ = 1. Uma propriedade das progressões aritméticas. O produto de quatro termos consecutivos de uma progressão aritmética, acrescido da quarta potência da diferença comum entre termos consecutivos, é sempre um quadrado perfeito. 299
ESPELHOS MEUS
Se r representar o incremento de um termo para o seguinte da progressão, os quatro termos consecutivos têm a forma α, α+r , α+2r e α+3r , e o seu produto, acrescido de r 4 , é: α4 + 6r α3 + 11r 2 α2 + 6αr 3 + r 4 (7.8) Não é imediato concluir que (7.8) seja um quadrado perfeito. Tentemos então trabalhar o problema de forma simétrica. Seja ε = r /2. Então, quatro termos consecutivos da progressão aritmética têm a forma, agora bem mais simétrica, β − 3ε, β − ε, β + ε e β + 3ε, e o seu produto, acrescido de r 4 , é β 4 − 10ε2 β 2 + 25ε4 ,
(7.9)
que facilmente se reconhece como (β 2 − 5ε2 )2 . Optimização. Determinar o valor máximo de x y , com as variáveis sujeitas à restrição x + y = 1. Pelo papel simétrico de x e y nas condições do problema, é de supor que, havendo máximo, ele seja atingido num ponto com x = y , ou seja, no ponto (1/2, 1/2), correspondendo ao valor 1/4 da função. Este argumento, conquanto plausível, não constitui uma prova, mas pode servir para a delinear. Escrevemos x = 1/2 + a e y = 1/2 + b . A condição x + y = 1 determina que b = −a . Agora, x y = (1/2 + a )(1/2 − a ) = 1/4 − a 2 ≤ 1/4,
com igualdade se e só se a = 0, ou seja, x = y = 1/2. Exercício 7.15 Determine: (a) o ponto da recta de equação x + y = 1 que está mais próximo da origem; (b) o ponto do plano de equação x + y + z = 1 que está mais próximo da origem; (c) o mínimo da expressão x 12 + x 22 + · · · + x n2 , onde as variáveis x 1 , . . . , x n estão sujeitas à restrição x 1 + x 2 + · · · + x n = 1. Ângulo de uma recta com uma elipse. Mostrar que a recta de equação y = x determina ângulos rectos com a elipse de equação x 2 + x y + y 2 = 12. A equação da elipse é invariante por permutação das variáveis x e y , o que significa que a elipse é simétrica em relação à recta y = x . Assim, a reflexão nesta 300
SAMUEL ANTÓNIO LOPES
recta transforma rectas tangentes à elipse em rectas tangentes à elipse. Como os pontos de intersecção da recta com a elipse são invariantes por esta reflexão (e a elipse tem tangente em todos os seus pontos), resulta que em cada ponto de intersecção a tangente é perpendicular à recta de reflexão y = x , o que significa que os ângulos de intersecção da elipse com a recta y = x são rectos. Exercício 7.16 Mostre que a recta de equação y = −x determina ângulos rectos com a elipse de equação x 2 + x y + y 2 = 12.
7.3.2 ARGUMENTOS DE SIMETRIA EM PROVAS Problema de Fagnano revisitado. Reforçamos um dos argumentos usados no estudo do Problema de Fagnano (ver parágrafo que antecede a caixa de texto «Solução do Problema de Fagnano», na secção 7.1.2). Foi visto que o ponto pertencente ao lado A B do triângulo A BC para o qual é possível obter um triângulo inscrito de perímetro mínimo é o pé da altura de A BC relativamente a C . Neste instante podemos imediatamente inferir que os pontos Y e Z , obtidos pela construção discutida no que antecede aquele parágrafo, têm forçosamente que ser os pés das outras duas alturas de A BC . (Se, por exemplo, Y ′ for um ponto de BC diferente do pé Yb da altura correspondente de A BC , então qualquer triângulo inscrito com vértice em Y ′ terá perímetro estritamente superior ao perímetro do triângulo inscrito com vértice em Yb e determinado pelo método desenvolvido anteriormente, pela prova já apresentada para o vértice X .) O exemplo seguinte, por ser mais simples do que o Problema de Fagnano, transmite de uma forma mais clara a ideia do exemplo anterior. Triângulo de área máxima inscrito numa circunferência. De entre todos os triângulos inscritos numa circunferência dada, determinar o(s) de maior área. Começamos por fixar uma corda na circunferência dada, de extremidades A e B , e determinar para que pontos C da circunferência é que a área de A BC é máxima. Não é difícil de concluir que C tem de ser tal que a tangente à circunferência em C é paralela a A B . Em particular, A BC é isósceles. Podemos agora concluir imediatamente que o triângulo de área máxima inscrito na circunferência é equilátero! A razão é simplesmente a simetria de argumentação: se A BC for um triângulo de área máxima e se, por exemplo, tivéssemos A B ̸= AC , então, pela conclusão a que chegámos no parágrafo anterior, 301
ESPELHOS MEUS
FIGURA 7.41
seria possível inscrever na circunferência um triângulo A ′ BC de base BC com A ′ B = A ′ C e área superior à de A BC . O facto de a solução ser um triângulo equilátero não deveria surpreender, mais uma vez pela simetria dos dados do problema. Como será um triângulo de área mínima? Simetria da cúbica. Mostrar que o gráfico de uma função polinomial cúbica, digamos f (x ) = a x 3 + b x 2 + c x + d , com a ̸= 0, é simétrico relativamente ao seu ponto de inflexão. Começamos por notar que substituições do tipo: i) y = x + θ (θ ∈ R), ii) h(y ) = f (y ) + M (M ∈ R), não alteram a propriedade que queremos provar, já que correspondem a translações do gráfico. Escolhendo θ e M adequados, obtemos h(y ) = αy 3 + β y , com α ̸= 0, cujo ponto de inflexão é (0, 0). Agora, a simetria de h relativamente a (0, 0) é óbvia, já que corresponde à verificação da propriedade: h(−y ) = −h(y ),
para todo o y ∈ R.
Exercício 7.17 Cada uma de quinze moedas é pintada de azul ou de verde, e as moedas são dispostas como mostra a figura 7.42. Usando argumentos de simetria para reduzir o número de casos a considerar, mostre que existem três moedas da mesma cor cujos centros formam um triângulo equilátero. 302
SAMUEL ANTÓNIO LOPES
FIGURA 7.42
Cobertura de um tabuleiro de xadrez por dominós. É muito simples cobrir completamente um tabuleiro de xadrez de formato 8×8 com trinta e duas peças de dominó, cada peça cobrindo exactamente dois quadrados adjacentes do tabuleiro, sem que haja sobreposição de peças. Tomemos pois um tabuleiro de xadrez 8×8 e retiremos-lhe os quadrados de dois cantos diametralmente opostos, como ilustra a figura 7.43:
FIGURA 7.43
Será ainda possível cobrir adequadamente este tabuleiro com dominós? Após algumas tentativas podemos começar a intuir que a reposta a esta última pergunta é negativa, mas poderemos estar seguros desta resposta sem analizarmos exaustivamente todas as possibilidades? É, de facto, impossível cobrir com peças de dominó o tabuleiro recortado acima, e podemos prová-lo de uma forma muito simples e clara, recorrendo a um padrão de simetria do tabuleiro, que é completamente irrelevante para a formulação do problema: o facto de os quadrados do tabuleiro (original) estarem coloridos alternadamente de duas cores. Como os cantos diametralmente opostos retirados têm a mesma cor, há no tabuleiro recortado trinta quadrados de uma das cores e trinta e dois da outra. Observando que cada peça de dominó tem de cobrir exactamente um quadrado de cada cor, podemos concluir imediatamente 303
ESPELHOS MEUS
que uma tal cobertura é impossível, pois para o fazer teriam de existir no tabuleiro tantos quadrados de uma cor como da outra. O argumento da prova de impossibilidade que acabámos de ver baseou-se na imposição de um padrão (simetria) a um dos objectos, o que permitiu deduzir uma propriedade de invariância (cada dominó cobre simultaneamente um quadrado de cada cor). O último problema que apresentamos é precisamente deste tipo, embora a simetria a impor não seja desta vez oferecida pelo próprio problema, como aconteceu (por feliz coincidência, claro) com o problema anterior. Cobertura de um tabuleiro de xadrez por tetraminós. Tomemos agora um tabuleiro de xadrez de formato 10×10 e tentemos cobri-lo com tetraminós, isto é, peças rectangulares como um dominó, mas de formato 1×4. A cobertura deve ser feita de forma a que cada peça cubra exactamente quatro quadrados adjacentes do tabuleiro, sem que haja sobreposição de peças e de forma a que todos os quadrados do tabuleiro fiquem cobertos. A figura 7.44 mostra uma cobertura de um tabuleiro 4×6 com seis tetraminós.
FIGURA 7.44
É claro que uma tal cobertura só pode existir se o número de quadrados do tabuleiro for divisível por 4, o que se verifica no caso de um tabuleiro 10×10. A questão é se tal condição garante a existência de uma cobertura. Vamos ver que não. Neste caso, colorir alternadamente os quadrados do tabuleiro de preto e branco não permite provar a impossibilidade de uma cobertura (cada tetraminó cobre duas casas de cada cor e o tabuleiro tem tantas casas de uma cor como da outra, o que não é uma contradição). Mas podemos re-interpretar uma coloração de outra forma. Se associarmos a um quadrado branco o número −1 e a um 304
SAMUEL ANTÓNIO LOPES
quadrado preto o número 1, podemos argumentar que a soma dos números correspondentes aos quadrados cobertos por um dominó é sempre igual a zero e, portanto, se for possível cobrir um tabuleiro com dominós, então a soma dos números de todos os quadrados do tabuleiro tem de ser zero. Ora, no caso do tabuleiro recortado do exemplo acima essa soma é 2, confirmando assim a impossibilidade de uma cobertura. Voltemos ao caso dos tetraminós, tentando encontrar um raciocínio análogo ao que acabámos de expor para o problema dos dominós. Associamos aos quadrados do tabuleiro os números −2, −1, 1, 2, de forma cíclica, como se ilustra na tabela 7.1: −2
−1
1
2
−2
−1
1
2
−2
−1
−1
1
2
−2
−1
1
2
−2
−1
1
1
2
−2
−1
1
2
−2
−1
1
2
2
−2
−1
1
2
−2
−1
1
2
−2
−2
−1
1
2
−2
−1
1
2
−2
−1
−1
1
2
−2
−1
1
2
−2
−1
1
1
2
−2
−1
1
2
−2
−1
1
2
2
−2
−1
1
2
−2
−1
1
2
−2
−2
−1
1
2
−2
−1
1
2
−2
−1
−1
1
2
−2
−1
1
2
−2
−1
1
TABELA 7.1
(Se numerarmos as linhas e as colunas do tabuleiro de 1 a 10 da forma usual, então o quadrado da linha i e coluna j tem o número −2, −1, 1 ou 2, consoante o resto da divisão de i + j por 4 seja 2, 3, 0 ou 1, respectivamente.) Então, a soma dos números associados aos quadrados cobertos por cada tetraminó é sempre 0. Logo, se fosse possível cobrir o tabuleiro 10×10 com tetraminós, então a soma dos números de todos os quadrados desse tabuleiro teria de ser nula, o que não acontece. Essa soma é −3, a soma dos números assinalados a vermelho na figura 7.1. Fica assim provada a impossibilidade de cobrir um tabuleiro 10×10 com te305
ESPELHOS MEUS
traminós, apesar de o número de quadrados desse tabuleiro ser divisível pelo número de quadrados de um tetraminó. Exercício 7.18 Generalizando a ideia do problema anterior e o conceito de dominó, mostre que é possível cobrir um tabuleiro m × n por l -minós se e só se algum dos inteiros m ou n for múltiplo de l . Estude também o caso de coberturas por peças rectangulares mais gerais. Agradecimento. Gostaria de agradecer à Patrícia Ribeiro a sua colaboração, nomeadamente na concepção do Projecto 7.1 e na disponibilidade que sempre teve para trocar ideias acerca do conteúdo deste texto. Agradeço-lhe ainda, bem como aos revisores, a leitura cuidadosa de várias versões do manuscrito.
306
SAMUEL ANTÓNIO LOPES
BIBLIOGRAFIA COMENTADA [Cieslik, 1998] D. Cieslik, 1998: Steiner Minimal Trees, Kluwer Academic Publishers. Livro relacionado com o Problema de Steiner. [Conway et al., 2008] J.H. Conway, H. Burgiel e C. Goodman-Strauss, 2008: The Symmetries of Things, A K Peters Ltd. Este livro aborda a simetria de um ponto de vista distinto daquele que foi aqui tomado. [Courant et al., 1996] R. Courant e H. Robbins, 1996: What is Mathematics?, Second Ed., Oxford University Press, New York. Livro que cobre variados temas e problemas de interesse geral para alunos e professores de matemática. [Court, 1951] N.A. Court, 1951: “Fagnano’s problem”, Scripta Math. 17, 147–150. Artigo relacionado com o Problema de Fagnano. [Court, 1952] N.A. Court, 1952: “Fagnano’s problem”, Scripta Math. 18, 95–96. Artigo relacionado com o Problema de Fagnano. [Coxeter et al., 1967] H.S.M. Coxeter e S.L. Greitzer, 1967: Geometry Revisited, The Mathematical Association of America. Uma boa referência para problemas de geometria. [Epp, 2004] S.S. Epp, 2004: Discrete Mathematics with Applications, Third Ed., Brooks/Cole Publishing Company, Belmont, CA. Livro que cobre variados temas e problemas de interesse geral para alunos e professores de matemática. [Gutkin, 1997] E. Gutkin, 1997: “Two applications of calculus to triangular billiards”, The American Mathematical Monthly 104, no. 7, 618–622. Artigo relacionado com o Problema de Fagnano. [Harding, 1923] P.J. Harding, 1923: “Fagnano’s theorem on arcs of an ellipse”, The Mathematical Gazette 11, no. 165, 337–338. Artigo relacionado com o Problema de Fagnano.
American Mathematical Monthly 95, 7, 609–620. Artigo relacionado com o Problema de Fagnano. [Larson, 1983] L.C. Larson, 1983: Problem-Solving through Problems, Springer-Verlag, New York. Livro que cobre variados temas e problemas de interesse geral para alunos e professores de matemática. [Lax, 1990] P. Lax, 1990: “The ergodic character of sequences of pedal triangles”, The American Mathematical Monthly 97, no. 5, 377–381. Artigo relacionado com o Problema de Fagnano. [Leikin, 2003] R. Leikin, 2003: “Problem-solving preferences of mathematics teachers: focusing on symmetry”, Journal of Mathematics Teacher Education 6, 297–329. Neste artigo é investigado o uso da simetria na resolução de problemas entre professores de matemática. [Tannenbaum, 2007] P. Tannenbaum, 2007: Excursions In Modern Mathematics, Sixth Ed., Prentice Hall, New Jersey. Livro que cobre variados temas e problemas de interesse geral para alunos e professores de matemática. [Ungar, 1990] P. Ungar, 1990: “Mixing property of the pedal mapping”, The American Mathematical Monthly 97, 10, 898–900. Artigo relacionado com o Problema de Fagnano. [Zirakzadeh, 1966] A. Zirakzadeh, 1966: “An exact perimeter inequality for the pedal triangle”, Mathematics Magazine 39, no. 2, 96–99. Artigo relacionado com o Problema de Fagnano. [GeoG] http://www.geogebra.org/. Software de matemática dinâmica. [Graham] http://www.archive.org/details/ RonaldLG1988. Vídeo relacionado com o Problema de Steiner.
[Kingston et al., 1988] J.G. Kingston e J.L. Synge, 1988: “The sequence of pedal triangles”, The 307
8 DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS António Guedes de Oliveira
Puisque tu fais de la géométrie et de la trigonométrie, je vais te donner un problème: Un navire est en mer, il est parti de Boston chargé de coton, il jauge 200 tonneaux; il fait voile vers le Havre, le grand mât est cassé, il y a un mousse sur le gaillard d’avant, les passagers sont au nombre de douze, le vent souffle N-E-E, l’horloge marque 3 heures un quart d’après-midi, on est au mois de mai… On demande l’âge du capitaine. Gustave Flaubert, numa carta de 1843 dirigida à irmã Caroline
Têm aparecido recentemente nalguns livros escolares, em exercícios de resolução de equações lineares, figuras do tipo da figura 8.1, onde se vê uma decomposição de um rectângulo em quadrados com a seguinte propriedade: todos os quadrados são geometricamente distintos1 . Diz-se por isso que a decomposição é perfeita. Como se podem produzir estas figuras?
15
18 7
4
14
10
1
8
9
FIGURA 8.1 Exemplo de decomposição perfeita
Note-se que a decomposição da figura é simples, isto é, nenhum subconjunto de quadrados forma um rectângulo menor (ver figura 8.2), e que tem ordem 9, ou seja, o rectângulo decompõe-se em nove quadrados. 1 Em geral, é claro que não é difícil construir rectângulos decompostos em quadrados quaisquer: por exemplo, bastam dois quadrados congruentes, lado a lado, para construir um tal rectângulo…
309
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
Note-se ainda que os elementos da decomposição são quadrados, mas que, todos juntos, eles formam um rectângulo — e não um novo quadrado, maior! Pode-se até perguntar se existe, realmente, alguma decomposição perfeita de um quadrado. Naturalmente, para saber responder a esta nova pergunta era útil saber responder à primeira, isto é, saber como se produzem todas as decomposições de rectângulos. Foi isto que fizeram quatro estudantes universitários, que publicaram os seus resultados em [Brooks et al., 1940] (ver [Tutte, 1987] para uma descrição muito interessante do processo de descoberta). O objectivo dos autores, no início, era provar que a resposta à última pergunta era negativa, isto é, que não se podia decompor um quadrado em quadrados todos distintos, conforme tinha sido conjecturado por um grande matemático russo, Nikolai Luzin2 , bastantes anos antes. De facto, no início do trabalho dos quatro estudantes não se conheciam ainda decomposições perfeitas de quadrados. Nem sequer se conheciam muitas decomposições perfeitas de rectângulos, embora a decomposição da figura 8.1, por exemplo, apareça num artigo de 1925 ([Moro´ n, 1925]). Em [Brooks et al., 1940], no entanto, os autores mostraram que realmente existem decomposições perfeitas de quadrados, contrariando assim a conjectura de Luzin. Mas não se limitaram a exibir tais decomposições3 . Pelo contrário, introduziram uma técnica nova, válida para o caso geral das decomposições de rectângulos em quadrados, que depois especializaram para a decomposição de quadrados. Mas esta técnica faz mais: mostra a estrutura que há por detrás das decomposições, permitindo assim que se saiba, por exemplo, que não há nenhuma decomposição de um rectângulo em menos do que os nove quadrados da figura de cima, e que há só uma outra com a mesma ordem, isto é, com os mesmos nove quadrados, que é representada na figura 8.10. São os próprios autores que, no artigo, constroem trinta decomposições perfeitas de rectângulos de ordem não superior a 11, simples, e que explicam as razões por que não existem outras decomposições simples e perfeitas com estas ordens. Na verdade, conhecem-se, graças a este trabalho e a outros que em geral se basearam nele, todas as decomposições perfeitas (incluindo as decomposições dos quadrados), simples e compostas, que existem até a uma ordem bastante su2 Segundo é armado num livro sobre a Matemática dos Jogos ([Kraitchik, 1930, p. 272]). 3 De facto, em [Brooks et al., 1940] mostra-se que mesmo a ordem destas decomposições é ilimitada e que há, portanto, um número innito de decomposições diferentes de quadrados. 310
ANTÓNIO GUEDES DE OLIVEIRA
perior — e, o que é talvez ainda mais importante, ainda hoje surgem novas técnicas e novos resultados que são baseados neste mesmo trabalho. Podem ser consultadas, por exemplo, em http://www.squaring.net. Neste «sítio» da internet pode-se ver que o quadrado perfeito simples de menor ordem tem vinte e um quadrados e é único com esta ordem. Está representado na figura 8.2, onde também se representa o quadrado perfeito composto — isto é, que não é simples — de menor ordem, 24.
50 29 4 25
33
27
35
81
8 19 152 17 11 6 9 7 24
37
16
18
51
42
55
5
1
56
38
29 31 2
43
39
16 9 14 3 18 20
30 8
4
35
64 33
FIGURA 8.2 Os quadrados «perfeitos» simples e composto de menores ordens
Este capítulo é dedicado ao método geral de construção de decomposições perfeitas de rectângulos atrás referido. Vamos mesmo ver como construir as trinta decomposições simples e perfeitas de ordem não superior a 11, que são referidas em [Brooks et al., 1940], com base no que é explicado no mesmo artigo, essencialmente — mas introduzindo uma novidade relativamente ao artigo, o uso de poliedros. Escolhi este tema, em primeiro lugar, porque este método pode constituir uma proposta de trabalho para alunos do ensino secundário, directa, isto é, sem requerer estudos prévios, clara, e complexa no sentido de envolver vários passos, mas simples no que diz respeito à dificuldade em executar cada passo. É minha convicção que o trabalho com alguma complexidade (no sentido anterior do termo) e alguma intensidade levanta em muitos estudantes as questões, o interesse e a vontade de bem perceber que a teoria muitas vezes não consegue levantar, mesmo quando acompanhada de exercícios sem aquelas características. Tem ainda este projecto a qualidade, que eu acho fascinante, de começar num ponto e
311
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
acabar noutro surpreendentemente diferente, sendo o percurso sempre percorrido em passos curtos, seguros e, digamos, transparentes. Também pretendo com este trabalho dar exemplo de uma aplicação interessante e pouco conhecida de alguns conceitos básicos de grafos, que foram abordados neste livro no capítulo «Grafos: No Sítio e A Cores». E pretendo também dar um exemplo diferente da ligação feliz que existe entre a Matemática e a Física: aqui é a Física que encontra aplicação na Matemática, através das Leis de Kirchhoff. De facto, se a teoria que está por detrás destas leis se pode e deve considerar matemática, ela nasceu claramente no seio da Física e é certamente mais relevante para esta ciência do que para a Matemática. Finalmente, uma vez que vinha a propósito, introduzo como parte do método uma certa construção em poliedros. Esta construção é baseada em pequenos movimentos dos vértices, cujas consequências, ao nível do grafo do poliedro, se estudam brevemente. É com esta construção que se obtêm todos os poliedros com que, por sua vez, se obtêm todas as decomposições simples com onze quadrados ou menos. Estas preocupações ditaram um esquema próprio: o trabalho está dividido em três partes bem distintas, que correspondem a outras tantas secções, numeradas de 8.1 a 8.3. Na primeira secção, o método de construção das decomposições é introduzido indutivamente, isto é, partindo das propriedades das decomposições realizadas para a procura de modos de as realizar, em avanços curtos essencialmente focados sobre um tópico de cada vez. Note-se que à medida que o texto prossegue o método se vai simplificando. Redigi-o a pensar na proposta de trabalho de que falei atrás, destinada a alunos no final do ensino básico ou talvez já no Secundário. Devo até dizer que a introdução da construção de poliedros referida está aqui menos por uma questão de completar este trabalho do que como forma de elevar a um outro patamar a qualidade do exercício de visualização que é para os alunos, em geral, trabalhar com poliedros, uma vez que se pretende aqui que, de um modo simples, estes não só entendam a estrutura dos poliedros, mas também que intervenham nela. Na segunda secção, pretendo antecipar e responder às perguntas que naturalmente vão surgir no espírito do leitor, numa linguagem já mais rigorosa — e contida. Embora tenha referências a alguns resultados não demonstrados e a outros que só são provados na terceira secção, à parte essas referências, que são claras, creio, o texto pode-se considerar completo. 312
ANTÓNIO GUEDES DE OLIVEIRA
Acrescentei ainda uma terceira parte, numa última secção, com as provas de alguns resultados utilizados um pouco mais profundos, incluindo as Leis de Kirchhoff. Inevitavelmente, utilizo nesta parte técnicas matematicamente mais sofisticadas e uma linguagem mais académica. É destinada a responder às perguntas que muitos leitores não farão, pelo que me permiti escrevê-la com a habitual crueza de um texto matemático para iniciados. Mas não exige de facto essa iniciação, em termos de conteúdo. Oxalá queira o leitor defrontar essa mesma crueza, porque não lhe escondo que acho que é nesta parte, pela relativa profundidade dos assuntos que toca e pela unidade essencial que têm, conforme transparece do texto, que se pode verdadeiramente perceber o que liga o ponto de partida do método ao seu ponto de chegada. Resumidamente, eis aqui o método: 1. Tomar um poliedro qualquer. Aqui partimos inicialmente de um prisma triangular recto, que modificamos ligeira e sucessivamente, por exemplo alongando um pouco uma única aresta do poliedro (que deixa de ser um prisma). 2. Seleccionar dois vértices, chamados pólos, unidos por uma aresta, a aresta polar. A cada uma das outras arestas associar uma incógnita, que pode ser vista como uma corrente num dado circuito. 3. Nesse circuito, onde a aresta polar representa a ligação à fonte eléctrica, aplicando as leis de Kirchhoff: • A cada vértice diferente dos pólos associar uma equação linear nas incógnitas referidas, associadas por sua vez às arestas não-polares. Associar também a um dos dois pólos, dito o pólo de entrada, uma nova equação linear, dependente de um parâmetro (a corrente total do circuito). • Finalmente, a cada face que não contenha a aresta polar associar uma nova equação linear. Note-se que, como todas as outras, esta aresta está contida em exactamente duas faces. 4. Escolher o valor do referido parâmetro de modo a que cada incógnita tenha um valor inteiro na solução, que é única para cada valor do parâmetro (e tem todas as componentes múltiplas por um número racional deste parâmetro). Na verdade, o valor de cada incógnita é o comprimento da aresta de um quadrado na decomposição de um dado rectângulo. 5. Construir a decomposição
313
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
Poderia acontecer que uma decomposição assim obtida não fosse perfeita, por haver mais do que um quadrado com determinadas dimensões, ou que, resolvidas as equações, se verificasse que havia soluções com componentes nulas, que, portanto, não corresponderiam ao lado de um «verdadeiro» quadrado. Mas isto não acontece nos exemplos que consideramos.
8.1 À PROCURA DAS DECOMPOSIÇÕES Antes de abordar o método propriamente dito, procuremos abordagens mais imediatas. A primeira, com certeza a mais ingénua e a menos poderosa, consiste em pretender encontrar uma decomposição partindo de um quadrado inicial e tentando juntar-lhe outros quadrados, todos de diferentes dimensões, de forma a preencher os espaços interiores e a conseguir ao mesmo tempo que os quadrados juntos constituam um rectângulo. Assim posto, este problema é certamente difícil de resolver.
l1 =x
l9
l7 l8
l3 l2 =y l4
l6 l5
FIGURA 8.3 Esquema de decomposição
Mais fácil seria (se o conhecêssemos!) partirmos do esquema da figura que queremos obter: na figura 8.3, um conjunto de segmentos horizontais e verticais decompõe um rectângulo em rectângulos menores, «encaixados» de uma certa maneira. Vamos supor que os rectângulos são quadrados com os lados indicados e vejamos como determinar esses lados. Por exemplo, o quadrado à esquerda do que tem lado y tem lado x −y , já que, juntos, têm o comprimento (x ) do lado do quadrado que encima ambos. Isto é, temos a equação l 3 = l 1 − l 2 . Note-se que há um segmento horizontal, assinalado a vermelho, cujo comprimento será, por um lado, igual a l 1 = x e, por outro, igual à soma das arestas dos quadrados inferiores, l 2 = y e l 3 .
314
ANTÓNIO GUEDES DE OLIVEIRA
Do mesmo modo, l 4 + l 3 = y . O valor dos membros desta equação será o comprimento do segmento assinalado a azul. Podemos assim associar a equação ao segmento. Prosseguindo, obtemos que l 5 = y + l 4 , l 6 = l 4 + l 5 e l 6 + l 4 = (x − y ) + l 7 , l 8 = l 6 + l 7 e l 9 = l 8 + l 7 , podendo ser cada equação associada a um novo segmento, alternadamente horizontal e vertical. Se resolvermos estas equações, obtemos que os lados l 4 , . . . , l 9 são, sucessivamente, −x + 2 y , −x + 3 y , −2 x + 5 y , −4 x +8 y , −6 x +13 y e −10 x +21 y . Finalmente, podemos resolver estas equações em ordem a x , por exemplo, notando que l 9 + l 7 = x + (x − y ), que corresponde ao único segmento (vertical) não utilizado atrás. Tomando y = 8, por exemplo, vemos que os lados têm medidas inteiras e que a solução é… a que corresponde à decomposição do rectângulo da figura 8.1, na primeira página deste capítulo. Para outros valores de y temos uma decomposição equivalente, mas com dimensões múltiplas das desta. Suponho que é esta a base das figuras que aparecem nos exercícios de resolução de equações lineares atrás referidos. É uma solução, no entanto, a muitos títulos insatisfatória, em especial porque não é claro como se constroem os esquemas de partida. E, uma vez construída uma lista de esquemas com determinado número de rectângulos menores, como se pode saber se a lista é completa? Por exemplo, conforme afirmei, sabe-se que com menos do que nove quadrados não se podem construir esquemas destes, conducentes a decomposições em quadrados distintos, e que há, a menos da posição, exactamente dois com nove quadrados4 . Sabe-se, como? O problema é que, embora possamos usar este expediente para produzir rectângulos decompostos em quadrados de dimensões diferentes, falta à solução a estrutura que permita o estudo dessas mesmas soluções, de forma, por exemplo, a calcular o seu número. Assim, ao primeiro método para encontrar estas decomposições, por simples tentativa/erro, e ao segundo, ainda difícil de utilizar e pouco mais estruturado do que o primeiro, vamos acrescentar o terceiro método atrás descrito. Agora, as questões como a anterior podem ter resposta, porque este método é baseado numa estrutura clara, e suficientemente rica matematicamente para poder ser estudada.
4 O de cima e o seguinte esquema:
315
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
8.1.1 AS DECOMPOSIÇÕES DE RECTÂNGULOS EM QUADRADOS E OS CIRCUITOS ELÉCTRICOS Vejamos como surge o método, partindo já de uma decomposição de um rectângulo em quadrados, a da figura 8.1, a que podemos considerar que ajustamos os dois eixos de um referencial. Portanto, dois dos lados do rectângulo maior são horizontais e os outros dois são verticais. Conforme vimos atrás, obtínhamos os lados dos quadrados da decomposição resolvendo determinadas equações que se podem construir sobre o «esquema» dos segmentos horizontais e verticais que determinam a decomposição. Vamos repetir o processo, mas de modo ligeiramente diferente: Suponhamos que sobre a figura 8.1 construímos um grafo orientado ou digrafo, do seguinte modo: consideremos os segmentos horizontais que determinam a decomposição, a que juntamos os lados horizontais do rectângulo. Neste exemplo, são seis estas linhas, a que são sempre adjacentes de dois a quatro quadrados. Em cada linha tomamos um vértice e para cada quadrado tomamos uma aresta, que liga os vértices correspondentes às duas linhas horizontais que delimitam esse quadrado. Os vértices correspondentes aos lados do rectângulo chamam-se pólos. Temos assim um grafo. Finalmente, este grafo é orientado dirigindo cada aresta de cima para baixo5 . Por essa razão, chamamos ao vértice que corresponde ao lado de cima do rectângulo pólo de entrada e ao outro pólo de saída. Cada aresta tem um peso, igual ao lado do quadrado correspondente. Obtemos então a figura 8.4. Note-se que, tal como o grafo está desenhado, podemos ver os pesos como as diferenças entre as ordenadas dos pontos dos respectivos segmentos horizontais.
15
18 7
4
14
10
1
8
9
FIGURA 8.4 Grafo associado a uma decomposição
5 Quando uma aresta é orientada chama-se-lhe, em geral, um arco, mas nesta secção em geral não uso este termo. 316
ANTÓNIO GUEDES DE OLIVEIRA
Vejamos o significado no digrafo das equações de trás, tendo em mente duas figuras, a figura 8.3 e a figura 8.4. Começamos de novo por considerar unicamente as equações que correspondem aos segmentos horizontais (note-se que as equações só estão definidas para os segmentos internos, isto é, segmentos correspondentes a vértices que não são pólos). A primeira, que pode ser reescrita na forma l 1 = l 2 + l 3 , indica que a largura do quadrado do canto superior direito, o único que é adjacente superiormente ao segmento a vermelho da figura 8.3, é a soma das larguras dos rectângulos adjacentes inferiormente. Na figura 8.4, 15 = 8 + 7. Como vimos, as outras equações são obtidas de modo semelhante. Suponhamos que no digrafo o segmento é representado por um dado vértice. Então cada quadrado adjacente ao segmento é representado por uma aresta incidente com o vértice, orientada de cima para baixo. Mais precisamente, o quadrado adjacente ao segmento por cima corresponde à aresta orientada para o vértice e os dois quadrados adjacentes ao segmento por baixo correspondem às arestas orientadas a partir do vértice. Como os pesos das arestas correspondem aos comprimentos dos lados dos quadrados que lhes estão associados, o peso da primeira aresta deve ser igual à soma dos pesos das segundas. É este o significado, no digrafo, da equação l 1 = l 2 + l 3 . Juntando as equações obtidas do mesmo modo para os outros vértices não-polares, isto é, igualando a soma dos pesos das arestas dirigidas para cada um destes vértices com a soma dos pesos das arestas dirigidas a partir dele, obtemos as equações que correspondiam aos segmentos horizontais:
l2 + l4 − l5 = 0 l1 − l2 − l3 = 0 l3 − l4 − l6 + l7 = 0 −l 7 − l 8 + l 9 = 0
(8.1)
De forma semelhante, os segmentos verticais decompõem-se nas somas dos lados dos quadrados adjacentes quer à sua direita quer à sua esquerda, dando origem a novas equações nas mesmas incógnitas, como vimos. Do ponto de vista do grafo, de novo, cada equação pode ser associada a uma face6 , delimitada à esquerda e à direita, respectivamente, pela sequência das arestas associadas aos 6 Na gura 8.4 tomaram-se para vértices os pontos médios dos segmentos e para arestas os segmentos de recta que unem os vértices-extremidade. Poderia acontecer assim que duas arestas se encontrassem fora de um vértice. Mas é fácil ver que o grafo pode ser sempre representado sem esse tipo de intersecções, com arestas compostas por três segmentos unidos, sendo o do meio vertical e colocado a meio 317
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
quadrados adjacentes do mesmo lado. Fixando um sentido rotativo de circulação nestas arestas, se as que estão em determinado lado estão orientadas de acordo com esse sentido, as do outro estão orientadas de forma oposta. Portanto, somando os pesos das arestas cujos sentidos se conformam ao que foi fixado e subtraindo os outros, devemos obter zero. Dito de outro modo, em cada face deste grafo plano, a soma dos pesos das arestas cuja orientação se conforma com uma dada orientação circular da malha iguala a soma dos pesos das que não se conformam. Temos assim aqui mais quatro equações, que são as que atrás correspondiam aos segmentos verticais.
l4 + l5 − l6 = 0 l6 + l7 − l8 = 0 l2 − l3 − l4 = 0 l1 + l3 − l7 − l9 = 0
(8.2)
Aos leitores com maiores conhecimentos de Física, estas equações devem lembrar as Leis de Kirchhoff ; foi exactamente desta observação que nasceu o método que estamos a estudar. Mais precisamente, vejamos de novo o grafo como um esquema de um circuito eléctrico simples, isto é, onde se ligam resistências através de condutores ideais, e se liga o sistema a uma fonte eléctrica, conforme representado. Do ponto de vista do grafo, esta ligação representa uma nova aresta. Imaginamos que em cada aresta das anteriores está colocada uma resistência de um conjunto de resistências todas iguais, que supomos unitárias; a nova aresta, que representa a ligação à fonte de tensão, é a aresta polar porque liga os dois pólos. As setas indicam o sentido da corrente e os pesos a intensidade dessas correntes na resistência relativa. Com consideramos as resistências unitárias, a diferença de potencial ou a tensão entre dois vértices é a soma das correntes (forma abreviada de referir as intensidades das correntes) nas resistências que os ligam7 . Ora, as «Leis de Kirchhoff» dizem precisamente: • Lei dos nós ou das correntes. A soma das correntes que entram em cada vértice é igual à soma das que saem. do quadrado que representa, com um comprimento quase igual ao do lado desse quadrado. Isto é, em particular, este grafo é sempre planar, no sentido da secção 6.4. 7 Pela Lei de Ohm, que diz que V = R I , onde V é a diferença de potencial, I é a corrente e R a resistência, tomando para unidade o Volt, o Ampere e o Ohm, respectivamente. Consideramos aqui que R = 1 Ohm.
318
ANTÓNIO GUEDES DE OLIVEIRA
l l1
l9
l7
l3 l4
l2
l8 l6
l5
FIGURA 8.5 Circuito eléctrico associado ao grafo
• Lei das malhas ou das tensões. É nula a soma algébrica das quedas e elevações de tensão ao longo de um caminho fechado de um circuito eléctrico.8 A lei dos nós define neste caso seis equações, as quatro equações 8.1, precisamente, para os vértices não-polares, e uma para cada pólo. Pode-se ver que destas duas equações polares basta tomar uma, para o pólo de entrada, que relaciona as correntes que passam pelas resistências com a corrente total do circuito, I , no circuito eléctrico, ou, correspondentemente, com a largura do rectângulo. Temos, então, uma equação extra, l1 + l9 = I .
(8.3)
A razão para considerarmos o grafo como esquema eléctrico é que generaliza aquilo que vimos neste exemplo, a saber: em geral, como aqui, num circuito elementar, definida a intensidade total do circuito I , todas as outras intensidades de correntes consideradas ficam determinadas matematicamente pelas Leis de Kirchhoff. Portanto, se juntarmos a equação 8.3 com as equações 8.2 e com as equações 8.1, obtemos um sistema de equações lineares nas incógnitas l 1 , l 2 , etc., que, como vimos atrás9 , tem exactamente uma solução para cada valor do parâmetro I . No caso, tomando I = 33 (a largura do rectângulo), obtemos l 1 = 15, l 2 = 8, l 3 = 7, e assim consecutivamente. A partir deste grafo (conforme está representado no plano e conforme está orientado) e destes números, é fácil reconstruir a decomposição, ou seja, seria fácil re8 Há outros caminhos fechados, para além dos que delimitam as faces interiores do grafo. Pode-se provar, no entanto, que, se esta lei se verica para cada face interior de um grafo plano convexo, também se verica para os outros caminhos fechados. 9 Atrás, havia menos uma equação e menos um parâmetro, I , mas obtínhamos em compensação as soluções em função do valor de y = I 2 . 319
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
construir os quadrados da figura 8.4 a partir do digrafo e do peso das suas arestas ali representados, sabendo que as arestas representam os quadrados e os pesos os comprimentos dos lados. O grafo de que podemos partir para encontrar a decomposição reflecte o esquema da decomposição, no sentido da figura 8.4. Mas, sendo uma estrutura em si mais simples, é mais fácil estudá-la. Por exemplo, já referimos que os grafos que nos interessam, os grafos associados de facto a alguma decomposição, são planares. Neste caso, em geral, o número de equações lineares do sistema é igual ao número de vértices do grafo, menos um (o vértice inferior, a que não associamos qualquer equação) acrescentado do número de faces, menos uma também, a face exterior ou ilimitada da representação do grafo. Pela fórmula de Euler, já abordada na secção 6.5.4 do capítulo «Grafos: No Sítio e A Cores», o número de equações é igual ao número de arestas do grafo e, portanto, ao número de incógnitas, já que (|F |−1)+(|V |−1) = |F |+|V |−2 = |E |. Isto explica em parte porque é que a solução é única10 . O mesmo se passa com os grafos que são esqueletos dos poliedros, no sentido do capítulo «Grafos: No Sítio e A Cores», secção 6.5.2. Também se pode ver que os grafos das decomposições simples são «3-conexos», isto é, que são conexos — podemos ir de um vértice qualquer a um outro através de uma sequência de arestas consecutivamente adjacentes — e que não ficam desconexos por se lhes retirar unicamente dois vértices, com todas as arestas que incidem neles. Numa palavra, pelo Teorema de Steinitz que é mencionado na mesma secção do livro, os grafos das decomposições são todos esqueletos de poliedros. Por exemplo, o circuito eléctrico da figura 8.5 tem como grafo o esqueleto do poliedro da figura 8.6, também representado num plano à direita da figura, mas sem uma aresta, a que liga os vértices A e D . É então nisto que se baseia o método. Resumindo, partindo de um poliedro e do seu esqueleto, que vemos como um circuito com dois pólos dados, pelas Leis de Kirchhoff podemos obter, fixando convenientemente a corrente total do circuito, as correntes que passam nele. Estas representam os lados dos quadrados da decomposição, sendo que o grafo também indica a posição relativa desses quadrados. Nós afirmamos que a situação é geral, isto é, que se podem obter 10 No entanto, as Leis de Kirchhoff não se aplicam só no caso de o grafo ser planar. O modo de as aplicar é que é em geral diferente, o que era inevitável, uma vez que a noção de face aqui usada não pode ser também usada em geral.
320
ANTÓNIO GUEDES DE OLIVEIRA
todas as decomposições desta maneira, e consideramos uma série de exemplos onde isto seguramente acontece. O primeiro é o que já foi visto, o que nos vai servir para ir ilustrando umas partes do método e para tornar mais precisas outras.
8.1.2 DOS POLIEDROS À DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS Seja P o poliedro que resulta de deslocarmos um dos seis vértices de um prisma triangular sobre uma aresta de uma das duas faces triangulares, de forma a alongar (ligeiramente) esta aresta, conforme a figura 8.6, em baixo, onde se deslocou o vértice A sobre a aresta A D . Dizemos que o ponto foi perturbado11 . Este movimento não alterou as duas faces que não continham o ponto A , uma triangular, △B C E , na figura 8.6, e outra rectangular, D C E F ; deformou (ligeiramente) um triângulo, △A D F , e um quadrilátero, A B C D , que se mantêm faces do poliedro; finalmente, onde existia uma outra face quadrangular, A B E F , existem agora duas, triangulares, △A B E e △A E F .
8.1.3 PRIMEIRO EXEMPLO DE APLICAÇÃO DO MÉTODO A estrutura facial do poliedro é a subjacente ao esquema da figura 8.5. Para refazermos a decomposição seguindo o método anunciado, vamos tomar A e D como pólos; estes pontos estão contidos nas faces △A D E e A B C D (que é a face exterior). Podíamos imaginar um circuito construído sobre o poliedro aplicando a fonte de tensão às extremidades desta aresta e uma resistência unitária a cada par de vértices correspondente às outras arestas. Mas é mais fácil e mais conveniente para o que se segue fazer a representação no plano. De facto, por exemplo, a estrutura facial do poliedro P é também a do grafo subjacente à figura 8.7, construído de um modo que serve para qualquer par poliedro/aresta. Primeiro, retirou-se ao poliedro a aresta que contém os pólos escolhidos, A e D , com as (duas) faces que a contêm. A figura assim obtida pode-se «abrir», deformando algumas faces, mas sem «romper» a figura (ver figura 8.6, à direita12 ). Depois acrescentou-se de novo a aresta retirada, pelo exterior do grafo; com ela, surgem as faces 11 Mais tarde (secção 8.1.5) voltaremos a esta operação. 12 Para um processo descrito com mais precisão, ver secção 8.1.5, à frente.
321
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
correspondentes às faces retiradas do poliedro, sendo uma ilimitada e outra limitada, neste caso △A D F e A B C D , reconstruindo-se assim a estrutura facial do poliedro. D F
C
E
D
F D
E
C
C A
B
A
B
B
FIGURA 8.6 Poliedro e construção do grafo
Para calcularmos as «correntes» segundo as Leis de Kirchhoff, orientamos cada aresta da maneira que entendermos, construímos as equações e resolvemo-las. É isto que pode ser feito a partir da figura 8.7, por exemplo. Note-se que as equações só diferem das do caso anterior porque algumas arestas têm a orientação oposta. Por exemplo, onde a terceira equação era l 1 − l 2 − l 3 = 0, agora, como as arestas associadas a l 1 e a I 1 , respectivamente, nos esquema da figura 8.5 e no esquema da figura 8.7, se opõem, assim como as associadas respectivamente a l 2 e I 2 , temos − I 1 + I 2 − I 3 = 0. D
C
I
I1 I9
I3
F
E
I2
I7 I8
I4
I6 I5
B
A
FIGURA 8.7 Circuito associado ao par poliedro/aresta
Mas podemos, mesmo assim, não as resolver, já que o valor de I 1 na solução do novo sistema será −l 1 na solução do sistema anterior, etc. O mesmo se passa 322
ANTÓNIO GUEDES DE OLIVEIRA
em geral: podemos orientar o grafo do circuito de um modo qualquer, porque a troca de orientação de uma aresta se traduz na mudança do sinal do valor que lhe está atribuído na solução. Para fixar ideias, consideremos associado a um vértice v do grafo, onde se supõe que há uma «derivação» no circuito, o valor do seu potencial eléctrico, o v . A intensidade da corrente que liga dois vértices é a diferença dos potenciais desses vértices (já que a resistência é unitária); se a aresta for orientada do vértice de maior potencial para o outro, é positiva, se não, é negativa. Note-se que no caso do grafo de uma decomposição, o v é a ordenada dos pontos do segmento horizontal correspondente ao vértice v . Temos então:
I 1 = −l 1 = −15 = o C − o D I 2 = −l 2 = −8 = o B − o C I 3 = l 3 = 7 = oC − o E I = −l 4 = −1 = o B − o E 4 I 5 = −l 5 = −9 = o A − o B I = −l = −10 = o − o 6 6 A E I = −l = −4 = o − o 7 7 E F I 8 = −l 8 = −14 = o A − o F I 9 = l 9 = 18 = o D − o F
(8.4)
Obtemos, finalmente, tomando o A = 0, por exemplo, o B = 9, o C = 17, o D = 32, o E = 10 e, finalmente, o F = 14. Lembremos que a largura de cada segmento horizontal é a soma «das correntes que entram», que é igual à soma «das correntes que saem». Para desenhar a decomposição de novo, basta seguir as informações do grafo, aqui com as direcções «corrigidas» de modo a termos diferenças de ordenada positivas: da figura 8.8 passamos para a figura 8.5, com as ordenadas dos pontos, e daqui para a decomposição.
8.1.4 SEGUNDO EXEMPLO E SIMPLIFICAÇÃO DO MÉTODO Vamos rever o método com o mesmo poliedro e outra aresta, B C , que dá outra decomposição perfeita. Antes, porém, vejamos que podemos simplificar um pouco os cálculos. Substituindo I 1 por o C −o D , I 2 por o B −o C , etc., de acordo com o grafo e com as equações 8.4, nas últimas quatro equações (as que correspondem às faces do grafo), podemos ver que elas são trivialmente satisfeitas por quaisquer valores 323
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
15
D
C
33 18
7 4
F
E
8 1
14
10 B 9
A
FIGURA 8.8 Circuito «corrigido»
de o A , o B , etc. Na verdade, elas resultam exactamente do facto de as diferenças de potencial entre dois vértices serem as somas das diferenças de potenciais ao longo de qualquer caminho entre os vértices através de arestas consecutivas. O modo como orientamos as arestas é irrelevante. De facto, partindo do potencial de um vértice A , o A , tanto faz termos uma aresta orientada do vértice A para o vértice B , em que subtraímos o A −o B , ou termos uma aresta com a orientação contrária, em que somamos o B −o A . No fim, obtemos sempre o B . Ou seja, como, à medida que percorremos o contorno de uma face, partimos de um vértice com determinado potencial e chegamos ao mesmo vértice, vemos que a diferença nula entre estes potenciais é a soma algébrica das diferenças de potencial obtidas em cada aresta orientada. Por exemplo, l 4 + l 5 − l 6 = 0 significa que (o E − o B ) + (o B − o A ) − (o E − o A ) = 0, o que é trivialmente verdadeiro. Assim se, em vez de incógnitas associadas às correntes, considerarmos incógnitas que representam os potenciais dos vértices, com as devidas substituições, as equações correspondentes às faces do grafo são trivialmente satisfeitas. As equações correspondentes aos vértices também ficam mais simples com esta substituição: o primeiro membro de cada uma delas pode ser escrito como a soma das diferenças de potencial entre esse vértice e os que lhe são adjacentes. O outro membro ou é zero, no caso dos vértices em geral, ou é o parâmetro I , no caso do pólo de entrada (lembro que não está associada nenhuma equação ao pólo de saída). De facto, se antes considerávamos num membro a soma das diferenças do potencial de um vértice V pelo potencial de W , para todas as arestas V W orientadas de V para W , e no outro somávamos as diferenças do potencial de W pelo de V , nas arestas orientadas de W para V , agora tomamos sem-
324
ANTÓNIO GUEDES DE OLIVEIRA
pre a soma das primeiras diferenças, do potencial de um vértice V pelo potencial de W , mas todas no primeiro membro. Note-se que se houver k vértices adjacentes com V , o primeiro membro da equação correspondente a este vértice consiste em k o V , subtraído do potencial de cada um dos k vértices. Chamo à equação referida a equação de Kirchhoff do vértice V . De um número de equações igual ao número de arestas passamos para um número de equações igual ao número de vértices menos um. Isto significa que, agora, o número de equações não é igual ao número de incógnitas, que estão em correspondência com os vértices todos. No entanto, fixado o potencial de um vértice (fixamos sempre o potencial do pólo de saída em zero), já temos tantas equações quantas as incógnitas. Tudo isto pode ser esclarecido (e verificado) no exemplo à frente, onde, em vez de construir um novo grafo, recorro de novo à figura 8.7 (ou à figura 8.5), trocando única e simplesmente a aresta que «electrifico», a aresta polar, agora B C , já que esta aresta também é exterior ao grafo nesta representação. Com esta troca, retiro a equação referente à face △B C E e acrescento uma equação referente à face △A F D . Note-se que, em rigor, com as equações de Kirchhoff as orientações das arestas já não são necessárias, como vamos ver. D
C
I1 I9
I3 I
F
E
I7
I2 I8
I4
I6 I5
B
A
FIGURA 8.9 Circuito para nova aresta
Seguindo o procedimento proposto, obtemos:
(I 1 + I 3 =) (−I 1 − I 2 + I 9 =) (−I 3 − I4 − I6 + I7 = (I 2 + I 5 + I 6 + I 8 =) (−I 7 − I 8 − I 9 =)
(o C − o D ) + (o C − o E ) = I (o D − o C ) + (o D − o A ) + (o D − o F ) = 0 (o E − o C ) + (o E − o B ) + (o E − o A ) + (o E − o F ) = 0
(8.5)
(o A − o D ) + (o A − o B ) + (o A − o E ) + (o A − o F ) = 0 (o F − o E ) + (o F − o A ) + (o F − o D ) = 0 325
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
Note-se que o valor mínimo é o do pólo de saída, B , e o máximo é o do pólo de entrada, C 13 . Tomando o B = 0, obtém-se que, por ordem decrescente, o C = 69, o D = 44, o F = 35, o E = 33, o A = 28. Segue-se que I 1 = o C − o D = 69 − 44 = 25, por exemplo. Mas, em rigor, não precisamos de calcular estes valores, já que os potenciais dos vértices são agora as suas ordenadas. É fácil redesenhar agora o grafo sem a aresta B C , mantendo a estrutura e colocando os vértices com estas ordenadas (ver figura 8.10, à esquerda). Também não é difícil obter a decomposição associada a este grafo. Começamos por desenhar um segmento horizontal, correspondente ao vértice C , de comprimento 61 = 25 + 36, a soma das correntes que saem deste vértice. Sob ele desenhamos dois quadrados, de lado 25 e 36, respectivamente. As bases desses quadrados constituem os segmentos correspondentes a D e a E , respectivamente; desenhamos o primeiro à esquerda e o segundo à direita, seguindo a representação do grafo. Sob a base do primeiro quadrado, por exemplo, há outros dois, de lado 9 e 16, cujas bases, por sua vez, correspondem aos segmentos de A e F . No fim, obtemos a figura 8.1014 . C
69
25 44 35 33 28
36
D
9 F 16 7 5 2 E 33
36
16 792
5
A
28 0
25
28
33
B
FIGURA 8.10 Segunda decomposição de ordem 9
As outras arestas do mesmo poliedro dão origem ou a decomposições iguais (possivelmente noutras posições), ou a decomposições imperfeitas. De facto, pode-se provar (a partir das propriedades características destes grafos, como dizíamos atrás) que só existem estas duas decomposições perfeitas com nove quadrados, a menos de reflexões nos eixos ou de rotações de 900 . 13 Ver, à frente, o Lema 8.1. 14 Comparar com o «esquema» da primeira nota de rodapé da secção 8.1. 326
ANTÓNIO GUEDES DE OLIVEIRA
Não tornamos a aplicar aqui o método noutra decomposição, porque iríamos essencialmente repetir o mesmo caminho. Vamos, isso sim, considerar outros dois poliedros com mais uma aresta (com dez, portanto) e daí seguiremos para considerar outros cinco poliedros com onze arestas. Com os oito poliedros podem-se obter todas as trinta decomposições possíveis com onze ou menos quadrados distintos, como vamos ver.
8.1.5 PERTURBAÇÃO DE UM VÉRTICE DE UM POLIEDRO Os poliedros que vamos considerar são apresentados em anexo, incluindo uma planificação. Colorimos certas arestas com a mesma cor que o rectângulo cuja decomposição se obtém, tomando a aresta como polar (ver as última páginas do capítulo). Mas não é verdadeiramente necessário conhecer a planificação de um poliedro para conhecer o seu grafo e já vimos que basta o grafo e a aresta para construir a respectiva decomposição (assumindo que existe). O primeiro exemplo é o poliedro representado na figura 8.6, obtido, como disse, por perturbação de um vértice numa aresta. Vejamos em que consiste esta operação e como altera a estrutura facial do poliedro inicial. Vamos fazê-lo com algum detalhe, justificando passo a passo o que, geometricamente, pode parecer absolutamente evidente. Sejam A , B , C , D , E e F os vértices de um prisma triangular recto, A B C D , A B E F e C E F D as suas faces quadrangulares e △A D F e △B C E as faces triangulares. Se movermos A sobre a aresta A D , afastando ligeiramente A de D , o menor poliedro que contém estes seis pontos15 continua a ter como faces C E F D e △B C E . De facto, por exemplo, se o movimento de A for suficientemente pequeno, A , D e F continuam do mesmo lado do plano definido por B , C e E . Na perturbação de um ponto, supomos, por definição, que o movimento do ponto perturbado é suficientemente pequeno para não alterar a sua posição relativamente a todos os planos das faces a que não pertencia anteriormente. Como A se moveu sobre a recta A D e, portanto, se manteve no plano antes definido por A , D e F , por 15 Chama-se fecho convexo do conjunto constituído pelos seis pontos, e é a intersecção de todos os poliedros que os contêm a todos. É ainda a intersecção de todos os semi-espaços, isto é, dos conjuntos de pontos de um mesmo lado de um plano qualquer, incluindo o próprio plano, que contêm os seis pontos. É fácil ver que os vértices deste poliedro ou são os seis elementos do conjunto inicial ou uma parte destes.
327
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
um lado, e no plano antes definido por A , B , C e D , por outro, △A D F e A B C D mantêm-se faces do poliedro16 . Como A deixou de estar no plano definido por B , E e F , não existe uma quinta face quadrangular. Na verdade, se de um mesmo lado deste plano estavam os dois pontos C e D , agora o ponto A está do outro lado, já que se moveu sobre a aresta A D afastando-se de D . Portanto, não existe nenhuma face com estes três vértices, B , E e F . Mas os segmentos A B , B E , E F e A F continuam a ser arestas, como vimos, estando então contidas exactamente em duas faces. Estas faces não contêm nenhum dos outros pontos. Ou são △A B F e △B E F , o que vimos que não acontece, ou são △A B E e △A E F , forçosamente17 . Ou seja, ao deixar de existir a face A B E F , surgiu uma nova aresta, A E . Se A fosse recuado, em relação a D , na recta A D , já seria B F a nova aresta. No próximo exemplo ver-se-á uma situação semelhante a esta. Entretanto, vou utilizar esta operação de perturbação para explicar como podemos construir o grafo plano de um poliedro de forma formalmente mais rigorosa do que a que utilizei atrás. Seja P o poliedro, e F uma face de P . A construção que vou descrever toma F para face exterior do grafo plano. Consiste em tomar um ponto P no interior da face F e perturbá-lo numa recta que passe por P e que não esteja contida no plano da face; a recta pode ser, por exemplo, perpendicular a esse plano. Depois, cada vértice não pertencente a F é substituído pela intersecção com F da recta definida por esse vértice e por P (na sua nova posição). Este processo é em tudo semelhante à projecção estereográfica, abordada no capítulo «Grafos: No Sítio e A Cores», secção 6.5.1, constituindo uma alternativa a ele. Na figura 8.11 representa-se o processo descrito, relativamente ao poliedro que estudámos e às duas faces que contêm a aresta A D . O primeiro assemelha-se ao da figura 8.5, e o segundo ao da figura 8.7. Estas duas representações diferem essencialmente na posição da aresta acrescentada, A D . Vejamos agora o segundo poliedro, representado e planificado à frente. De novo, obtivemos este poliedro do anterior perturbando o ponto A , agora numa recta perpendicular ao plano da face A B C D (que deixa de ser uma face), desta vez movendo-o para o interior do semi-espaço (ver nota-de-rodapé 15, na pá16 Mas A B C D deixou de ser um rectângulo para ser um trapézio, sendo a aresta A D (e A B também) agora maior. 17 Podemos ver isto directamente: por denição de perturbação, o ângulo denido pelos semiplanos com origem na recta B E que passam por A e por C (ou por D ), respectivamente, ainda é menor que um ângulo raso e contém F . Portanto, △A B E é uma face. 328
ANTÓNIO GUEDES DE OLIVEIRA
F
F E
E
D
D
C
A
C
A B
B
FIGURA 8.11 Construção do grafo de um poliedro
gina 327) relativo ao plano que contém o poliedro. Isto significa que △B C D é uma nova face, que cria uma nova aresta, B D , sendo então a outra face △A B D . Note-se que este poliedro tem mais uma aresta (tem onze), pelo que as decomposições que gera têm dez quadrados. O terceiro poliedro é obtido de maneira diferente, «cortando uma parte» do poliedro inicial, o prisma triangular recto. O que fazemos é substituir um dado vértice por dois vértices, os pontos médios de duas arestas que ligavam o vértice retirado a outros vértices. Suponhamos que, na notação anterior, E é o vértice retirado e que criamos dois novos vértices, os pontos médios de B E , E 1 , e de E F , E 2 . O fecho convexo destes sete pontos mantém inalteradas as faces A B C D e △A D F , transforma a face △B C E na nova face △B C E 1 , a face rectangular A B E F na face pentagonal A B E 1 E 2 F , a face quadrangular C D F E na face trapezoidal C D F E 2 e cria uma face, △E 1 C E 2 . Tem, portanto, onze arestas, de novo, e origina quatro novas decomposições. Todas as decomposições simples, perfeitas, de rectângulos em dez ou menos quadrados aparecem associadas a estes três poliedros: com o primeiro poliedro podem-se construir as duas decomposições em nove quadrados e com os outros dois poliedros podem-se construir as seis decomposições em dez quadrados. Para criar os próximos quatro poliedros, do quarto ao sétimo, perturbou-se um ponto do terceiro poliedro. No quarto e quinto poliedros, perturbou-se uma vez mais o ponto que temos designado por A . No sexto e sétimo, perturbou-se B . No quarto, o ponto A move-se na aresta A D , para o interior desta, isto é, 329
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
aproximando-se de D . Passamos a ter uma nova aresta, B F , e uma face a mais, que resultam da substituição de uma face pentagonal por uma quadrangular e por uma triangular, simultaneamente. Isto acontece porque A deixa de estar no plano definido por B , E 1 , E 2 e F (ver a página correspondente, no fim), passando a estar do lado deste plano onde estão os restantes pontos, C e D . Aparecem com este poliedro as primeiras três decomposições em onze quadrados. No quinto, o ponto A move-se sobre a recta A F , afastando-se de F e passando para o lado do plano definido por B , C e D oposto ao que contém os restantes três pontos, E 1 , E 2 e F . Em consequência, também aparece uma nova aresta, A C , e há uma face que se divide em duas, mantendo-se as outras (pelo menos, formalmente). No sexto poliedro, B move-se na aresta que o liga a C , aproximando-o deste. Como antes, passamos a ter uma nova aresta, A E 1 . No sétimo, move-se na aresta B E 1 , afastando-se de E 1 e criando uma nova aresta, B D . Finalmente, no oitavo e último poliedro, voltamos ao prisma triangular e perturbamos D sobre a recta que liga o ponto a A , afastando-o desse ponto; depois, perturbamos B numa recta contida no plano definido por B , C e E , movendo-o para o interior do triângulo. O resultado (ver página correspondente) é um poliedro com seis vértices, oito faces triangulares e (consequentemente) doze arestas.
8.2 ALGUMAS PERGUNTAS E ALGUMAS RESPOSTAS Nesta secção vamos dar resposta a algumas perguntas que já foram colocadas na primeira secção, e a outras que vamos colocando. É natural que a primeira pergunta tenha ocorrido já ao espírito do leitor: quando construímos o grafo, considerámos os segmentos horizontais que dividem a figura; o que acontecia se tivéssemos considerado antes os segmentos verticais, prosseguindo depois de modo análogo? Naturalmente, se o nosso método funciona, iríamos obter a decomposição do mesmo rectângulo, mas rodado de 900 . Como é que isto se enquadra neste mesmo método? A ideia, simples, que vamos usar depois, é a seguinte: considerados os dois grafos, G , o grafo da decomposição original, obtido tomando um vértice em cada segmento horizontal, e G ∗ , o grafo obtido tomando um vértice em cada segmento 330
ANTÓNIO GUEDES DE OLIVEIRA
vertical, eles são duais, no sentido da secção 6.6.1 do capítulo «Grafos: No Sítio e A Cores». A razão disto está bem presente na secção 8.1.1, onde se explica que as faces de G correspondem aos segmentos verticais, os vértices de G ∗ , pelo que, naturalmente, as faces de G ∗ correspondem aos vértices de G e as arestas de G , como as de G ∗ , correspondem aos quadrados da decomposição. Na figura 8.12 apresento em simultâneo os dois grafos correspondentes à primeira decomposição que estudámos.
FIGURA 8.12 Os grafos duais de uma decomposição
É importante notar que as arestas polares dos dois grafos são duais, e que têm o mesmo peso duas arestas duais que não sejam polares, já que os pesos destas arestas correspondem a lados de um mesmo quadrado. Podemos ver que, orientadas as arestas de G de cima para baixo e as de G ∗ da esquerda para a direita, e considerada uma face de G , se duas arestas de G no contorno da face estão orientadas circularmente no mesmo sentido, então ambas as respectivas arestas duais de G ∗ entram ou saem do vértice de G ∗ correspondente. Além disso, com estas orientações, as equações 8.1, conjuntamente com a Equação 8.3, que correspondem aos vértices de G (excluindo o pólo de saída), são as que correspondem a faces que não contêm a aresta polar de G ∗ e o oposto se passa com as equações 8.2. A segunda pergunta, talvez a mais importante, é a seguinte, a que demos já resposta — negativa — de certo modo, ao não associar a certas arestas uma decomposição.
8.2.1 O PROCESSO DESCRITO FUNCIONA SEMPRE? Partindo de um grafo (o grafo de um poliedro), escolhidos os pólos ou a aresta polar, podemos resolver as equações de Kirchhoff associadas, redesenhar o grafo 331
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
de acordo com a solução e, finalmente, obter sempre uma decomposição perfeita e simples? É claro que a resposta é negativa se partirmos de um grafo conexo qualquer, uma vez que o grafo associado a uma decomposição é necessariamente plano e tem a mesma estrutura que o grafo de partida. Do mesmo modo, o grafo é verdadeiramente um grafo, e não um multigrafo (ver capítulo «Grafos: No Sítio e A Cores», secção 6.3.1), uma vez que as arestas correspondem a quadrados da decomposição e esta não contém quadrados congruentes: nem uma aresta pode ligar um vértice a si próprio nem pode haver duas arestas a ligar os mesmos dois vértices. Se a decomposição de um rectângulo R for composta, isto é, se existir um rectângulo R ′ , contido em R , decomposto por parte dos quadrados que decompõem R , então o grafo associado à decomposição de R tem uma característica especial, que os grafos dos poliedros não têm. Por exemplo, a decomposição à direita na figura 8.2 é composta, porque os treze quadrados ao cimo, à direita, da decomposição, formam um rectângulo R ′ (de dimensões 94 × 111). Imaginando o grafo da decomposição de R , G (excluindo a aresta polar) e o da decomposição de R ′ , G ′ , subgrafo de G , podemos notar que se uma aresta de G ′ e uma aresta de G que não está em G ′ partilham um vértice, esse vértice é ou o pólo de entrada de G ′ (e de G , neste caso particular) ou o pólo de saída de G ′ . É isto que se passa em geral. Então, retirados estes vértices de G , ele fica desconectado18 . Ora, sabe-se que, pelo Teorema de Steinitz referido na secção 6.5.3 do capítulo «Grafos: No Sítio e A Cores», os grafo dos poliedros são exactamente os grafos planares 3-conexos, isto é, os grafos planares conexos que não podem ser desconectados se se lhes retirar somente um ou dois vértices. Da pergunta recíproca, isto é, se, através do processo descrito, a partir de um poliedro qualquer e de pólos (adjacentes) quaisquer, se pode construir sempre uma decomposição simples e perfeita de um rectângulo, já sabemos a resposta: não! Mas ainda não se viu verdadeiramente um exemplo. O exemplo mais simples é provavelmente o do poliedro mais simples, também, o tetraedro, que tem o número mínimo de faces (quatro), com o número mínimo de lados (três). O seu grafo está representado na figura 8.13, à esquerda. É claramente indiferente que aresta se escolhe para colocar os pólos. Sendo A D 18 Ou seja, se a decomposição é composta existem dois vértices que desconectam o grafo ao serem retirados. Em [Kazarinoff & Weitzenkamp, 1973], pode-se ver que só no caso da decomposição ser composta é que existem dois vértices nestas condições. 332
ANTÓNIO GUEDES DE OLIVEIRA
A
A
I
I2
D
B
0 I2
x
I2 C
B
C
I2
x-y y
D
FIGURA 8.13 Decomposição associada a um tetraedro
como na figura, as equações de Kirchhoff são19 :
2o A − o B − o C = I 3o B − o A − o C − o D = 0 3o C − o A − o B − o D = 0
e fazendo o D = 0 obtém-se que o A = I e que o B = o C = 2I , o que permite redesenhar o grafo como se representa a seguir. Note-se que a corrente na aresta que liga os vértices B e C é nula, pelo que não vai haver nenhum quadrado a separar os segmentos horizontais que correspondem a estes vértices. A decomposição imperfeita está desenhada ao lado: consiste na divisão de um quadrado em quatro quadrados iguais e o seu grafo não tem a estrutura do grafo inicial. À direita, faz-se notar que o mesmo resultado se obteria partindo do esquema ali representado: os lados dos quadrados em falta seriam, utilizando um segmento vertical, y − (x − y ) = 2 y − x e, utilizando o segundo segmento horizontal, 2 y − x − (x − y ) = 3 y − 2 x , para os quadrados à esquerda, de baixo e de cima, respectivamente. Finalmente, utilizando o segundo segmento vertical, viria que: 3 y − 2 x = x + (x − y ) ⇐⇒ 4 y = 4 x ⇐⇒ x = y .
Portanto, o quadrado interior não existe e o esquema não se pode concretizar. Agora, a questão «natural» é a de saber se, antes e depois deste primeiro «teste», o processo funciona. Isto é, primeiro, se, partindo do grafo de um poliedro, é sempre verdade que, como até aqui, o sistema de equações que se obtém (com uma equação para cada vértice, com excepção do pólo de saída), conduz sempre a uma única solução, fixado um dos valores dos potenciais. A resposta é positiva, mas deixamos esta questão para o fim da exposição. 19 É fácil ver que a simetria, em termos da estrutura, do grafo (sem a aresta «polar») se traduz em simetria das equações, e esta em soluções simétricas, isto é, com componentes repetidas. 333
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
A outra questão, de que vamos tratar agora, consiste em saber se, depois de se obter a solução do sistema de equações e de se verificar que na solução ou as componentes são todos diferentes ou que componentes iguais correspondem a vértices desligados, podemos sempre obter uma decomposição simples e perfeita de um rectângulo. Também aqui a resposta é afirmativa.
8.2.2 PODEMOS SEMPRE REDESENHAR O GRAFO DE MODO A OBTER UMA DECOMPOSIÇÃO? Sejam G um grafo plano, sem lacetes nem arestas duplas, Pe e Ps dois vértices ligados por uma aresta a P da fronteira da face exterior e o uma função que toma valores reais nos vértices de G tal que o(V ) ̸= o(W ) quaisquer que sejam os vértices adjacentes V e W 20 . Supomos que o é o potencial associado ao grafo G , à aresta polar a f e ao parâmetro I pelo procedimento descrito na secção 8.1.2, isto é, através das equações de Kirchhoff. Seja D o digrafo obtido de G orientando cada aresta do vértice de maior potencial para o vértice de menor potencial, com um peso, positivo, dado pela diferença destes potenciais. Vamos ver cada aresta orientada ou arco como um par (v, w ) de vértices, em que a v se chama origem do arco e a w extremidade. Lema 8.1 Na situação acima descrita, 1. O primeiro vértice (o de maior potencial) é o vértice de entrada. 2. O último, de menor potencial, é o vértice de saída. 3. Todo o vértice V está ligado por um caminho dirigido de Pe a V e por um caminho dirigido de V a Ps , isto é, por uma sequência de arcos (Pe , V1 ), (V1 , V2 ), . . . , (Vk −1 , Vk ), (Vk , V ) e por outra (V, W1 ), (W1 , W2 ), . . . , (Wl , Ps ) . 4. Em nenhum vértice, considerada uma ordem circular dos arcos incidentes, existe um arco de saída entre dois arcos de entrada ou um arco de entrada entre dois arcos de saída. Demonstração: Como em cada vértice intermédio (um vértice que não é um pólo) a soma dos pesos dos arcos que entram é a soma dos que saem, todos os pesos são positivos e o grafo é conexo, todo o vértice intermédio tem um vértice adjacente com maior potencial e outro com menor potencial. Portanto, não pode ter nem o potencial máximo nem o mínimo. Finalmente, o pólo de entrada não 20 Em rigor, também deve ser o(V ) ̸= o(W ) se V e W forem adjacentes como faces do grafo dual de G . 334
ANTÓNIO GUEDES DE OLIVEIRA
pode ter o potencial mínimo, já que dele, por definição, só saem arcos. Isto prova as duas primeiras afirmações. Para a terceira afirmação, note-se que, por exemplo, há um arco a sair de V ou V já é o pólo de saída. Esse arco liga a um vértice W1 , seja. De novo, ou W1 = Ps ou existe um arco (W1 , W2 ). Como o número de arestas é finito e os vértices são todos diferentes (têm cada vez menor potencial), o processo termina, com um dado Wl +1 = Ps . Finalmente, vamos imaginar que, por exemplo, no vértice V há um arco de entrada, (X , V ), entre dois arcos de saída, que ligam V aos vértices Y e Z (ver figura em baixo). Consideremos as sequências que ligam Y e Z ao pólo de saída, que formam com os arcos (V, Y ) e (V,Z ) uma curva fechada no plano (com eventuais auto-intersecções), se esquecermos por um momento as orientações das arestas. Pe Y V
X
Ps
Z FIGURA 8.14 Ilustração da última parte da prova do Lema 8.1
Como o grafo é plano e Pe e Ps estão ligados por um arco exterior ao grafo, o caminho que liga Pe a X encontra forçosamente a curva, e só a pode encontrar num vértice. Ora o potencial desse vértice é maior que o de V , porque está na sequência que liga Pe a X , e menor do que esse mesmo valor, porque está numa das sequências que ligam V a Ps , através de Y ou de Z . Isto é impossível, naturalmente. No caso que nos interessa, admitimos que G é o grafo de um poliedro, P . Pode-se provar que, escolhendo um ponto no interior de cada face deste poliedro e tomando o menor poliedro que contém estes pontos, se obtém um novo poliedro (dito o poliedro dual de P ) que tem estes pontos como vértices e que tem como grafo o dual de G , G ∗ , conexo, portanto (na secção 5.5 do capítulo «Poliedros» e na secção 6.4 do capítulo seguinte considera-se esta construção). Dos dois vértices de G ∗ correspondentes às faces adjacentes à aresta a f , seja Pe∗ o que está na face exterior e Ps∗ o que está na face interior de G (que é incidente com a aresta polar, 335
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
portanto). Naturalmente que há uma aresta a ∗f que os liga, que é, por definição, a aresta dual de a f , que é exterior a G ∗ . Podemos proceder de novo como na secção 8.1.2. Chamamos o ∗ ao novo potencial. Suponhamos que o segundo membro da equação de Kirchhoff associada a Pe∗ é o (Pe ). Pode-se provar21 que, orientando cada aresta do grafo dual do vértice de menor potencial para o de maior potencial, e associando a cada arco assim obtido a diferença positiva dos potenciais, obtemos o seguinte digrafo D ∗ : Suponhamos que fixamos coerentemente um sentido de circulação das faces interiores de G , por exemplo, o sentido de rotação dos ponteiros de um relógio22 . Cada arco de D pertence exactamente às fronteiras de duas faces. Suponhamos que estas duas faces são interiores. É claro que o seu sentido concorda com o sentido de uma destas faces e discorda do outro. Então a aresta dual, que liga os vértices que estão um em cada uma destas faces, está orientada da face com cujo sentido concorda para a face com que discorda. As arestas, incluindo a aresta polar, que ligam faces interiores à face exterior são orientados da primeira face para a segunda. Além disso, o peso de cada aresta é o peso da sua aresta dual. Em particular, é válido para este grafo, com este potencial, o Lema 8.1. Isto significa que temos, traduzindo de volta a G a propriedade 4, uma vez que é também válida para G ∗ : Lema 8.2 Na fronteira de cada face de G existem dois vértices, X e Y , de tal modo que todos os arcos da fronteira da face pertencem a um de dois caminhos sem arcos em comum, dirigidos de X para Y . Agora, é fácil ver que com estes dados se pode construir sempre uma decomposição de um rectângulo: se o potencial o nos dá a ordenada dos pontos de cada segmento horizontal, o ∗ dá-nos a abcissa dos pontos de cada segmento vertical. Conjugando esta informação com o grafo, podemos desenhar estes segmentos, que determinam a decomposição. Os dois lemas desta secção garantem isto. Em geral, é fácil recompor a decomposição sem utilizar o grafo dual, como fizemos atrás. No entanto, por si, a verificação das Leis de Kirchhoff não assegura a existência de uma decomposição com um grafo dado, naturalmente. Por exemplo, na figura 8.15, temos um grafo que é plano, se considerarmos excluída a 21 Na verdade, a armação constitui o Lema 8.4, que demonstramos na próxima secção, utilizando alguns conceitos de Álgebra Linear. 22 Naturalmente, a armação seguinte é válida para um dos dois sentidos de circulação. 336
ANTÓNIO GUEDES DE OLIVEIRA
1 1
2
3 4
2
5
6 4
5
6
3
FIGURA 8.15 Grafo não associado a qualquer decomposição
aresta polar (incluindo-a, temos o grafo designado no capítulo «Grafos: No Sítio e A Cores» por K 3,3 ). Podemos resolver as equações de Kirchhoff para todos os vértices diferentes do sexto. Tomando para I o valor 4, obtemos a função potencial o tal que o(1) = 5,o(4) = o(5) = 3,o(2) = o(3) = 2, sendo o(6) = 0. Orientando as arestas do vértice de maior potencial para o outro e tomando como peso a diferença positiva dos potenciais, como de costume, pode-se ver que são válidas as Leis de Kirchhoff. No entanto, é claro que este grafo não é o grafo associado a nenhuma decomposição.
8.2.3 O PROBLEMA NO ESPAÇO Este problema pode ser considerado noutros contextos. Por exemplo: • Podemos decompor um paralelipípedo em cubos de dimensões distintas? • Podemos decompor um triângulo equilátero em triângulos equiláteros de dimensões distintas? Em ambos os casos, a resposta é negativa. Na verdade, pode-se provar que nenhum polígono convexo pode ser decomposto em triângulos equiláteros, se não houver pelo menos dois congruentes. Já um triângulo escaleno pode sempre ser decomposto em triângulos semelhantes entre si e semelhantes ao triângulo inicial. Estas duas afirmações são provadas em [Buchman, 1981]. Vou aqui abordar muito brevemente estas primeiras duas questões, também referidas em [Brooks et al., 1940]. Em relação ao primeiro problema, vamos supor que há um número finito de cubos, todos geometricamente distintos, que, juntos, constituem um paralelipípedo, e vamos considerar, por exemplo, a face inferior do paralelipípedo, um rectângulo, e a decomposição em quadrados que os cubos determinam nesta face. Vou supor que o menor quadrado, Q 1 , está no interior da face. Se estivesse na fronteira, na verdade, o raciocínio seria semelhante. Por hipótese, o cubo que lhe 337
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
corresponde tem aresta menor do que quatro cubos que o rodeiam e, portanto, há uma região sobre este cubo que não pode ser preenchida, por hipótese, com mais outro cubo igual. Mas não pode ser preenchida com cubos maiores, porque as faces laterais dos tais cubos vizinhos não permitem. Portanto, terá que ser preenchida com cubos mais pequenos, que determinam uma nova decomposição na face superior do cubo, cujos quadrados, portanto, são todos mais pequenos do que Q 1 . Mas o mesmo raciocínio pode ser feito sobre o quadrado Q 2 mais pequeno desta decomposição, determinando um sequência de quadrados cada vez mais pequenos que não pode ser infinita, porque o número de cubos iniciais é finita, nem pode acabar. Na figura 8.16 ilustra-se esta situação.
15
18
7 4
8 1
14 10
9
FIGURA 8.16 Decomposição a três dimensões
8.2.4 O PROBLEMA COM OS TRIÂNGULOS No segundo problema vamos seguir (embora ainda mais reduzidamente) as ideias apresentadas em http://www.math.niu.edu/~rusin/known-math/ 99/equilateral por David G. Radcliffe para a prova do seguinte teorema. Esta prova, segundo o seu autor, é baseada num artigo de Tutte, [Tutte, 1998] Teorema 8.1 Se um triângulo equilátero for dividido em triângulos equiláteros mais pequenos, então pelo menos dois desses triângulos são congruentes. Esboço de demonstração: Vamos considerar decomposições de um triângulo equilátero T em triângulos do mesmo tipo, mais pequenos. Comecemos por ajustar a T um triângulo congruente, em posição invertida, de modo a formar com ele um paralelogramo. Naturalmente, pode-se considerar que o paralelogramo ficou também decomposto em triângulos equiláteros, uma vez que juntá338
ANTÓNIO GUEDES DE OLIVEIRA
mos à decomposição inicial de T um outro triângulo equilátero que não é congruente com nenhum dos triângulos desta decomposição, o triângulo congruente a T. Note-se que as arestas de todos estes triângulos têm uma de três direcções fixas. Consideramos que uma delas é a direcção horizontal. Como na decomposição de um rectângulo em quadrados, consideramos um grafo (na verdade um multigrafo), em que para cada segmento horizontal maximal formado pelas arestas há um vértice, e em que, para cada triângulo com vértices em dois segmentos tomamos uma aresta a ligar os dois vértices associados aos segmentos. A prova consiste em mostrar que, ao contrário do que se passava no caso da decomposição em quadrados, o multigrafo tem que ter arestas múltiplas. Os dois lados do paralelogramo, que supomos horizontais, constituem os dois pólos do grafo. Aos outros vértices chamamos intermédios. Por redução ao absurdo, supomos que o multigrafo é um grafo, planar, de conjunto de vértices V e de arestas E . Conforme foi visto no capítulo «Grafos: No Sítio e A Cores», na secção 6.5.5, mais precisamente, temos então que: |E | ≤ 3 |V | − 6
(8.6)
Examinando as situações possíveis, pode-se ver que o número de arestas incidentes com cada vértice intermédio, que, se não houver triângulos congruentes, é o número de triângulos com algum vértice no segmento correspondente, é par e maior que 4. Assim sendo, uma vez que os pólos (do paralelogramo) têm pelo menos duas arestas incidentes com cada um deles, a soma dos graus dos vértices é, pelo menos, 6(|V |−2)+4 = 6 |V |−8, por um lado, e é igual a 2 |E |, por outro. Portanto, |E | ≥ 3 |V | − 4, o que contradiz 8.6.
8.3 GRAFOS COM ÁLGEBRA LINEAR Para estudarmos as questões que ficaram por resolver, convém definirmos com maior rigor alguns conceitos. Nesta parte, vou utilizar alguns conceitos e resultados básicos de Álgebra Linear. Consideremos um grafo orientado ou digrafo D , conexo enquanto grafo23 , com conjunto de vértices V . Represento o conjunto dos arcos por A , designo por n o número de vértices e por α o de arcos. Escolho de novo dois vértices como pólos, 23 Isto é, tal que é conexo o grafo dito subjacente, com o mesmo conjunto de vértices e onde se coloca uma aresta a ligar dois vértices se existir no digrafo um arco a ligá-los, num sentido ou noutro. 339
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
e suponho que os vértices estão ordenados de tal maneira que o primeiro vértice é o pólo de entrada e o último vértice é o pólo de saída. Designo ainda por Vb o conjunto de vértices diferentes do pólo de saída. A matriz de incidência diminuída de G , M I , é uma matriz com n −1 linhas e α colunas, onde a entrada na linha i , correspondente ao vértice V , e na coluna j , correspondente ao arco a , é zero se a não for incidente com V , é 1 se V for a origem de a e é −1 se V for a extremidade. Note-se que as linhas de M I correspondem aos vértices de Vb . Por exemplo, a matriz de incidência diminuída M I do digrafo representado na figura 8.10 (omitindo os zeros) é, considerando a ordem dos vértices C , D, F , E , A, B :
C
CE
1 D F E −1 A
CD
DF
DA
1
1
FE
FA
EA
AB
1 −1
−1
1 −1
1 −1
−1
1
1
−1
EB
1
Note-se que se também existisse uma linha correspondente ao pólo de saída24 , a soma de cada coluna seria zero. Portanto, a linha que corresponderia a este vértice é a simétrica da soma das outras e o digrafo fica bem determinado por esta matriz. Vemos cada linha da matriz como um vector de Rα , da maneira óbvia. Vamos ver que estes vectores são linearmente independentes. Para podermos utilizar plenamente alguns resultados básicos de Álgebra Linear, convém notar que uma função f que toma valores reais nos vértices do digrafo D , com excepção do pólo de saída25 , f : Vb → R, e uma função g : A → R, na mesma notação, podem (e vão!) ser vistas como vectores de R n−1 e R α , respectivamente, ou como matrizes-coluna com n −1 ou α componentes. Identificamos estes dois conceitos, de vector e de matriz-coluna, por uma questão de simplicidade de notação. A ideia, naturalmente, é que a componente de ordem i do vector f , por exemplo, seja o valor da função f no vértice de ordem i . Com esta identificação, note-se que, no exemplo que estávamos a examinar, multiplicando a transposta de M I à direita pela matriz-coluna o = (69 , 44 , 35 , 33 , 28), a função potencial, se obtém a função intensidade, i , que ao 24 Em geral, é assim que se dene a matriz de incidência. 25 Retiramos um vértice porque só tomamos funções que se anulam nesse vértice.
340
ANTÓNIO GUEDES DE OLIVEIRA
arco (C , E ) associa 36, a (C , D), 25, etc. Ou seja, M I T · o = i , ou ainda:
1
0
0
−1
1
−1
0
0
0
1
−1
0
0
1
0
0
0
0
1
−1
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0 0 −1 0 · −1 −1 1 0
69 44 35 33 28
=
36
25 9 16 2 . 7 5 28 33
O produto M K = M I ·M I T já foi implicitamente considerado neste capítulo. Chama-se a matriz de Laplace do digrafo. De facto, é fácil ver que M K é a matriz (n − 1) × (n − 1) cuja entrada na linha i e na coluna da mesma ordem é o número de vértices ligados por arcos ao i .ésimo vértice, e cuja entrada na linha i e coluna j é −1 ou 0, conforme exista ou não um arco a ligar o vértice de ordem i ao vértice de ordem j , ou vice-versa. Por exemplo, a entrada correspondente a C e a D no exemplo anterior, que é como que o «produto interno» das duas linhas correspondentes, é a soma de produtos de 0 por 0, de 0 por ±1 ou, num único caso onde o arco respectivo liga os dois vértices, de 1 por −1. Ora, as equações que nos permitem obter o potencial em cada vértice de um circuito são construídas precisamente da mesma maneira. Por exemplo, as equações 8.5 têm esta forma. Mais precisamente, a equação de Kirchhoff de um vértice é o produto da linha de M K correspondente pelo vector das incógnitas, no exemplo o vector (o C ,o D ,o F ,o E ,o A ). Portanto, sendo S = (I , 0, . . . , 0) ∈ Rα , o , a função potencial, é a solução da equação matricial M K · o = S ⇐⇒ M I · M I T · o = S.
(8.7)
Pelo Teorema de Kirchhoff, o Teorema 8.2, à frente, o determinante de M K , ∆, é o número de árvores geradoras de D , número que é maior que zero porque D é conexo enquanto grafo. Então, a equação 8.7 tem solução, que é única. Supo-
nhamos que λ1 vezes a primeira coluna de M I T , mais λ2 vezes a segunda, etc. é o vector nulo. Então, sendo Λ = (λ1 , λ2 , . . . , λn −1 ) e 0 a matriz-coluna nula com α entradas, temos que M I t · Λ = 0, 341
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
o que implica que M I · M I t · Λ = M I · 0,
o que significa, por sua vez, que M K · Λ é um vector nulo e, portanto, como o determinante de M K é diferente de zero, que Λ também o é. Então as linhas de M I são linearmente independentes. Para resolvermos a equação matricial 8.7 ou o sistema de equações lineares correspondente, podemos utilizar a regra de Cramer, que diz que a i .ésima componente de o é o quociente de δi por ∆, sendo δi o determinante da matriz que se obtém substituindo a i .ésima coluna pela coluna S . Portanto, se I = ∆, então o tem as componentes todas inteiras, o que faz com que as intensidades, iguais aos lados dos quadrados, sejam inteiras também. De facto, S é múltiplo por I de uma coluna com coordenadas todas inteiras, a saber, um 1 na primeira entrada e zero nas outras. Portanto, δi é I vezes o determinante de uma certa matriz com entradas todas inteiras, pelo que é um inteiro múltiplo de I . O que vamos ver a seguir pressupõe que o grafo inicial seja plano, como é o caso que nos interessa. Suponhamos que orientamos o grafo dual conforme foi indicado atrás. Portanto, começamos por fixar coerentemente um sentido de circulação das faces interiores de G , por exemplo, o sentido de rotação oposta à dos ponteiros de um relógio, admitindo que o vértice do grafo dual correspondente à face exterior é colocado à esquerda do resto do grafo original. Uma aresta a ∗ do grafo dual liga duas faces interiores do grafo original, que partilham por sua vez uma aresta, a , do mesmo grafo. Esta aresta está orientada de determinada maneira; a aresta dual é orientada com origem na face onde a orientação de a concorda com o sentido de circulação da face e com extremidade na face onde não concorda. Uma aresta do grafo dual que ligue uma face interior do grafo original à face exterior é orientada da face exterior para a interior. Chamo ao digrafo assim obtido digrafo dual de D , que represento por D ∗ . O vector i ∈ Rα é uma diferença de potencial do primeiro digrafo, precisamente porque há um vector, o ∈ Rn −1 , tal que M I T ·o = i . Também é uma diferença de potencial do segundo digrafo, D ∗ , como vamos ver. Note-se que as diferenças de potencial constituem um espaço vectorial. Na verdade, como uma diferença de potencial é o produto i = M I T · o para um certo o = (o 1 ,o 2 , . . . ,o n−1 ), se em vez de a vermos como coluna a víssemos como linha, o seu valor seria exactamente o 1 vezes a primeira linha, somado com o 2 vezes a segunda, o 3 com a terceira, etc. 342
ANTÓNIO GUEDES DE OLIVEIRA
Portanto, e uma vez que as linhas da matriz de incidência diminuída são linearmente independentes, as colunas correspondentes formam portanto uma base do espaço das diferenças de potencial, que tem então dimensão n − 1. Vejamos o seguinte lema: Lema 8.3 Num digrafo plano D com α arcos e n vértices, uma função i ∈ Rα é uma diferença de potencial se e só se, para cada face interna de D , considerando o conjunto dos arcos da fronteira da face orientados segundo um dos sentidos de circulação da face e o conjunto dos arcos da mesma fronteira orientados no sentido oposto, são iguais as somas dos valores de i nos arcos de cada um dos conjuntos. Demonstração: Seja [V1 , V2 , . . . , Vk , Vk +1 = V1 ] a sequência circular dos vértices da fronteira de uma face. Um arco nessa fronteira ou tem a forma (Vi , Vi +1 ) ou a forma (Vi +1 , Vi ). Então, o valor de i no arco ou contribui para a soma com o(Vi +1 ) − o(Vi ) ou para a diferença com o(Vi ) − o(Vi +1 ), ou vice-versa. No fim, vamos ter sempre, a menos de mudança de todos os sinais — irrelevante, portanto: 0=
k ∑
o(Vi ) − o(Vi +1 ) = o(V1 ) − o(Vk +1 ) = o(V1 ) − o(V1 ).
i =1
Isto prova que uma diferença de potencial verifica a propriedade enunciada. Para ver que, reciprocamente, uma função que verifica esta propriedade é uma diferença de potencial, comecemos por notar que podemos ver a propriedade anterior com uma relação de ortogonalidade em Rα . De facto, fixado uma face interior F e um sentido de circulação, definimos a função X F como valendo 0 nas arestas que não são incidentes com F , 1 se estiverem orientadas segundo o sentido de circulação e −1 no caso contrário. O que diz o lema é que uma função i é uma diferença de potencial se e só se, como vectores de Rα , i e X F forem ortogonais26 , e já provámos a parte do «só se»: provámos que toda a diferença de potencial é ortogonal a todo o vector da forma X F , para uma face interior F . Para vermos o recíproco, basta notarmos que estes vectores são linearmente independentes — porque são, sob a forma de coluna, iguais às linhas da matriz de incidência diminuída do digrafo dual, de acordo com a definição de orientação que demos e ao facto de o pólo de saída ser a face exterior. Isto acontece porque o número de faces internas é, pela fórmula de Euler, (α + 2 − n ) − 1 = α − (n − 1). Sendo linearmente independentes, geram um espaço 26 Isto é, o produto interno usual de Rα dos dois vectores dá zero. 343
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
com essa dimensão. Então, a dimensão do espaço dos vectores que lhes são ortogonais é α (dimensão de Rα ) subtraído desse número, α − (n − 1): é n − 1. Este espaço contém o espaço das diferenças de potencial e tem a mesma dimensão que este. Então são iguais os dois espaços. Agora é fácil provar o seguinte: Lema 8.4 Seja D um digrafo conexo plano com pólo de entrada Pe e pólo de saída Ps e sejam o a solução da equação 8.7, onde M I é a matriz de incidência diminuída do digrafo D e I é um parâmetro positivo, e o ∗ a solução de uma equação correspondente para o digrafo polar D ∗ , com parâmetro igual a o(Pe ) . Então a diferença de potencial correspondente a o , i , é também a diferença de potencial correspondente a o ∗ . Demonstração: Pelo lema anterior, i é a diferença de potencial de uma função o˜, definida nos vértices de D ∗ , com excepção do pólo de saída. De facto, para cada vértice de D correspondente a uma face interna de D ∗ , isto é, para cada vértice não polar de D , a soma das diferenças de potencial que entram num vértice é a soma das que saem, pela equação 8.7, e, portanto, o mesmo se passa com as somas dos pesos dos arcos de D ∗ orientados segundo um ou outro dos sentidos circulares. Para vermos que o˜ = o ∗ , basta ver que
M K ∗ · o˜ = M I ∗
(P ) o s 0 T ∗ ∗ MI · o˜ = .. = MI ·i, . 0
uma vez que a equação tem solução única e que (M I ∗ )T · o˜ = i , por definição de diferença de potencial de uma função. Ora, o pólo de entrada de D ∗ está na face de D interior incidente com a aresta polar. Os arcos incidentes com este pólo saem todos dele, e têm como valor total a soma das «intensidades das correntes» das arestas que ligam os dois pólos de D ao longo da face não exterior incidente com a aresta polar. Essa soma é o potencial de Pe . Para os outros vértices, basta ver que i é ortogonal a X F quando F é a face interior de D correspondente a cada vértice de D ∗ . Concluímos este capítulo com um resultado várias vezes anunciado, cuja importância no contexto já não se pode pôr em causa. 344
ANTÓNIO GUEDES DE OLIVEIRA
Teorema 8.2 (Teorema de Kirchhoff) Se M I é a matriz de incidência diminuída de um digrafo D conexo e tomarmos o produto à direita desta matriz pela sua transposta, M K = M I · M I T , então o determinante de M K é positivo, porque é igual ao número de árvores geradoras de G . Demonstração: É consequência imediata de um resultado clássico da Álgebra Linear (um caso particular da Fórmula de Cauchy-Binet) que o determinante do produto de uma matriz M , com m linhas e n colunas (n > m ), à direita, pela sua transposta, é a soma dos quadrados dos determinantes das submatrizes de M quadradas de ordem m . Então, o teorema resulta directamente deste facto e do Lema 8.5, em baixo. Lema 8.5 A matriz de incidência diminuída de um digrafo D com n vértices e n − 1 arestas tem determinante 0, 1 ou −1. O determinante é 1 ou −1 se e só se o grafo subjacente a D for uma árvore. Demonstração: Note-se que uma matriz de incidência de um digrafo pode ser caracterizada por ter colunas que têm as entradas todas nulas, ou todas nulas excepto uma entrada igual a 1 ou a −1, ou todas nulas excepto duas entradas, uma igual a 1 e outra a −1. Se a coluna de um dado arco só tem uma entrada não nula, correspondente a um vértice V , o que se passa é que há um arco a ligar V ao pólo de saída, por esta ordem se a entrada for 1, ou orientada do pólo de saída para V , se for −1. Também é óbvio que a matriz tem determinante zero se o grafo não for uma árvore, porque nesse caso não é conexo, e há um conjunto com k vértices que não estão ligados por caminhos ao pólo de saída. Então a soma das linhas correspondentes a estes vértices é nula, o que prova que estas linhas, e portanto as linhas todas, em conjunto, são linearmente dependentes. Para ver que no caso das árvores o determinante é 1 ou −1, podemos proceder por indução, conforme explico: escolhido um arco, a ligar V a W , por hipótese, e fazendo a expansão de Laplace ao longo da coluna correspondente ao arco, temos, a menos dos sinais, a soma dos determinantes de duas matrizes de incidência de grafos com menos um vértice. Vou mostrar que um deles é uma árvore, e então podemos usar a indução, e o outro não é, e o determinante correspondente é nulo, como vimos. Como o grafo de partida é uma árvore, só há um caminho no grafo subjacente a ligar W ao pólo de saída. Ou esse caminho passa por V (e pela aresta a retirada), e não pode haver um caminho a ligar V ao pólo através de W , ou não passa, e
345
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
há um caminho que começa em V , segue para W e daí para o pólo de saída. No primeiro caso, ao eliminarmos, para além da coluna correspondente ao arco, a linha correspondente a V , obtemos a matriz de um grafo desconexo. De facto, apagar a coluna é como que retirar a aresta. Mas retirar a linha significa que, em termos do grafo, estamos a ligar ao pólo de saída os vértices que estavam ligados a V . Em particular, deixa de haver caminho de W a este pólo. No segundo caso, pelo contrário, retiramos uma aresta que ligava W a V , e através deste vértice ligava a outros vértices. Agora, esses vértices ligam a Ps e V está ligado a Ps por um caminho que não foi interrompido com o retirar da aresta.
346
ANTÓNIO GUEDES DE OLIVEIRA
Primeiro poliedro
Coordenadas dos vértices: (0, − 14 , 0), (1, 0, 0), (1, 1, 0), (0, 1, 0), (1, 12 , 54 ), (0, 12 , 45 )
15
18 7
4
14
8
1
10
9
33
36 2
5
9
25
7
28 16
347
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
Segundo poliedro Coordenadas dos vértices:
(0, − 14 , 14 ), (1, 0, 0), (1, 1, 0), (0, 1, 0), (1, 12 , 54 ), (0, 12 , 45 )
27
30 3
11
8
25
17
17
25 3
22
348
11
19
2
13
15
23 6 5
24
ANTÓNIO GUEDES DE OLIVEIRA
Terceiro poliedro
Coordenadas dos vértices:
(0, 0, 0), (1, 0, 0), (1, 1, 0), (0, 1, 0), (1, 14 , 52 ), ( 12 , 21 , 45 ), (0, 12 , 45 )
45
60 19 16
44
7
26
12
33
28
54
57 7 43
15 11
44
41
26
55
60 4 16 15 11
34 19
39
23
41
44
45
3
11 12
34
23
35
38
349
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
Quarto poliedro
Coordenadas dos vértices:
1 (0, 4 , 0), (1, 0, 0), (1, 1, 0), (0, 1, 0), (1, 14 , 25 ), ( 12 , 21 , 54 ), (0, 12 , 45 )
92
102 31
21
823
38
15
81
60
53
97
102 11 4
76
15 16 19 23
81
42
64
92
44
11
31
53 42
16
76
350
60
73
ANTÓNIO GUEDES DE OLIVEIRA
Quinto poliedro Coordenadas dos vértices:
(0, − 18 , − 15 ), (1, 0, 0), (1, 1, 0), (0, 1, 0), (1, 14 , 25 ), ( 21 , 12 , 45 ), (0, 12 , 45 )
78
99 21
57 43
9
77
16
34
41
25
85
100
42
43
32
4
1
68
41
40
36
88
99 10 89 1
25 17
67
78
42
94
97 9
26
32
8
65
17
33
68
25
94
100 97
25 16 29
59
65 34
57
85 26
59
36
33
7
10
67
47
77 40
351
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
Sexto poliedro Coordenadas dos vértices:
(0, 0, 0), (1, 14 , 0), (1, 1, 0), (0, 1, 0), (1, 14 , 25 ), ( 12 , 12 , 45 ), (0, 12 , 45 ) 29
43 5
38
40 101 9
19
41
33
90
105
13
15
31
34
44
18
86
57
52
100
105 13 7 6 1
28 20
76
81 48
56
57
96
1
55
58
15
4
81
66
62
41
56 7 2
14
40
17
24
12
31
26
48
50 7 5
12
45
352
19
28
3
22
25
ANTÓNIO GUEDES DE OLIVEIRA
Sétimo poliedro Coordenadas dos vértices:
(0, 0, 0), (1, − 18 , − 15 ), (1, 1, 0), (0, 1, 0), (1, 14 , 25 ), ( 12 , 12 , 45 ), (0, 12 , 54 )
80
105 33
78
47
5 19 14
27
56
51
89
102 40
27
75
10
49
19
48
39
29
94
105 8
19
33
64
27
2
31
75
29
49
89
71
27 522 19 32
88
70
51
47
51 5
6 1
11
35
24
8 7
39
353
DECOMPOSIÇÃO DE RECTÂNGULOS EM QUADRADOS
Oitavo poliedro Coordenadas dos vértices:
(0, 0, 0), (1, 14 , 14 ), (1, 1, 0), (0, 45 , 0), (1, 12 , 54 ), (0, 12 , 45 )
90
95 5
25 619 24
56
31
72
61
37
66
71 5 1
18 19
55
354
37
56
61
ANTÓNIO GUEDES DE OLIVEIRA
BIBLIOGRAFIA [Bondy & Murty, 1976] Bondy, J.A. and Murty, U.S.R.: Graph Theory with Applications, Elsevier North-Holland, 1976. [Buchman, 1981] Buchman, E.; The impossibility of tiling a convex region with unequal equilateral triangles, Amer. Math. Mon. 88, 748–753 (1981). [Brooks et al., 1940] Brooks, R.L.; Smith, C.A.B.; Stone, A.H.; Tutte, W.T.: The dissection of rectangles into squares, Duke Math. J. 7, 312–340 (1940). [Kazarinoff & Weitzenkamp, 1973] Kazarinoff, N.D.; Weitzenkamp, R.: Squaring rectangles and squares, Amer. Math. Mon. 80, 877–888 (1973). [Kraitchik, 1930] Kraitchik, M.: La Mathématique des Jeux ou Récréations Mathématiques, Bruxelles, Imp. Stevens Frères (1930). [Moron, ´ 1925] Moron, ´ Z.: O rozkładach prostokatów na kwadraty. Przeglad matematyczno-zyczny 3, 152–153 (1925) (citado em [Brooks et al., 1940]). [Tutte, 1998] Tutte, W.; “Dissections into equilateral triangles”, in Mathematical Recreations: a collection in honor of Martin Gardner, ed. Klarner, D.A. New York: Dover, 1998 (citado em http://www.math.niu.edu/~rusin/ known-math/99/equilateral). [Tutte, 1987] Tutte, W.T.: Squaring the square; in Martin Gardner, Second Scientic American Book of Mathematical Puzzles and Diversions, Univ. of Chicago Press (1987). [Ziegler, 1994] Ziegler, G.M.: Lectures on Polytopes, Graduate Texts in Mathematics, vol. 152, Springer, New York (1994)
355
9 LÓGICA MATEMÁTICA Lucinda Lima
INTRODUÇÃO A Lógica, enquanto ciência autónoma cujo objecto é, no essencial, o estudo das leis do pensamento, a análise e classificação das formas de raciocínio e sua validade, teve as suas origens no século IV a.C., sendo Aristóteles considerado o seu fundador. Não obstante alguns posteriores desenvolvimentos, durante mais de dois milénios a obra de Aristóteles dominou o estudo da Lógica, determinando o seu chamado Período Clássico. Foi a partir do século XIX que a introdução do método matemático veio revolucionar completamente esta disciplina1 . Tal como na abordagem que a Matemática proporciona às questões da Física e de outras ciências, produziram-se modelos matemáticos para os raciocínios que formamos, criando uma linguagem simbólica adequada para os exprimir, e estipulando leis e regras exactas para a sua validade. Neste tratamento, a Lógica torna-se um objecto matemático e a Lógica Matemática desenvolve-se de forma análoga a qualquer outra teoria matemática, com o estabelecimento de conceitos bem definidos que conduzem a teoremas demonstrados com os métodos dedutivos e o rigor que caracterizam esta ciência. O enorme desenvolvimento da Lógica Matemática no século XX, levado a cabo por notáveis matemáticos, decorreu a par com o estabelecimento de fundamentos rigorosos da Matemática, como resultado de um grande movimento de profunda reflexão sobre esta ciência e os seus métodos. Neste processo, a Lógica Matemática desempenhou um papel central e forneceu as bases e a linguagem que se impunham para sustentar a grande estrutura da Matemática. Os resultados obtidos pelos matemáticos tiveram, por sua vez, um forte impacto na Lógica em todas as suas vertentes e contribuíram para a análise da própria actividade matemática e dos seus limites. Nesta perspectiva de «auto-reflexão», a Lógica Matemática abandona e transcende o seu estatuto de objecto matemático, assumindo então uma posição já enriquecida na Filosofia (e, mais par1 De facto, a abordagem matemática da Lógica foi preconizada por Leibniz, no século XVII. 357
LÓGICA MATEMÁTICA
ticularmente, na Filosofia da Lógica e na Filosofia da Matemática), onde teve a sua origem. Por outro lado, a Lógica Matemática, talvez a mais «pura» e formal de todas as áreas da Matemática, teve (e tem) aplicações muito concretas com influência decisiva na vida moderna e de utilidade inquestionável. De facto, assentam na Lógica Matemática os fundamentos teóricos das Ciências da Computação e estas duas teorias estão em conexão desde as suas origens, tendo evoluído a partir das ideias e inspiração dos mesmos pensadores. As aplicações directas da Lógica Matemática à Computação vão desde a utilização das Álgebras de Boole no estudo de circuitos, à própria concepção lógica das máquinas de computação, às linguagens de programação que têm como base as linguagens lógicas; e a Lógica proporciona também os modelos teóricos para o estudo dos limites da computabilidade, da complexidade computacional ou da Inteligência Artificial. Mas a interacção é nos dois sentidos e a Lógica Matemática actual tem sido constantemente revitalizada pelos desafios da Computação, estando uma parte importante do desenvolvimento destas duas áreas científicas em grande ligação. Neste pequeno texto, vão ser abordados alguns tópicos fundamentais de Lógica Matemática, de uma forma necessariamente superficial, parcial e bastante ligeira. Começando por uma breve passagem pela Lógica Aristotélica, foi feita a opção de tentar respeitar, dentro do possível, um certo alinhamento histórico dos assuntos, não só por se considerar que a perspectiva histórica tem interesse intrínseco e permite uma (humilde) homenagem aos seus principais protagonistas, mas também porque poderá ajudar a compreender e apreciar as ideias subjacentes e a sua evolução, podendo ser apropriada para o ensino/aprendizagem desta disciplina. Globalmente, foi assumida a tentativa de transmitir perspectivas e tratamentos diversificados deste tema, variando o estilo e o nível de formalismo da apresentação, mas sem nunca ser muito técnico. Daqui resulta alguma falta de uniformidade ao longo do texto, correndo-se os riscos no produto final resultante de se misturarem «vários sabores no mesmo prato». A escolha dos temas e a extensão e detalhe com que são abordados, teve também em mente (proporcionalmente) a viabilidade da sua utilização didáctica a nível do ensino não-superior, procedendo-se obviamente aos ajustes no tratamento das questões que se considerem adequados ao nível de maturidade científica dos alunos. Desnecessário seria talvez dizer, por ser evidente, e também 358
LUCINDA LIMA
porque nunca foi o objectivo, que não há a menor pretensão de que este trabalho esteja pronto para ser usado directamente nesse sentido.
9.1 ARISTÓTELES E O INÍCIO DA LÓGICA FORMAL Aristóteles (384 a.C. – 322 a.C.) percebeu que a validade de certos tipos de raciocínios, usados no pensamento comum e, em particular, na actividade científica, decorre unicamente da sua estrutura ou forma e não dos seus conteúdos particulares, dando assim início à chamada Lógica Formal. O conjunto dos trabalhos sobre Lógica de Aristóteles foram agrupados na obra Organon. Aristóteles analisou a validade de argumentos deduFigura 9.12 tivos em que, partindo de um determinado número de pressupostos ou premissas, se inferem conclusões. Um exemplo clássico, de um tipo de inferência designado por silogismo, é a dedução: Sócrates é um Homem; todos os Homens são mortais; (logo,) Sócrates é mortal.
o
2 premissas conclusão
Partindo da percepção de que o raciocínio é correcto independentemente dos termos particulares (Sócrates, Homem, Mortal) a que é aplicado, Aristóteles usou letras para representar os termos, que são expressões genéricas que têm como extensão a classe (ou conjunto) de objectos abrangidos por um determinado conceito. Nessa forma, um dado argumento pode admitir diferentes interpretações, conforme as classes associadas a cada um dos seus termos, mas numa mesma interpretação essas classes devem ser coerentemente fixadas. Isto permitiu-lhe classificar as inferências num certo número de tipos restritos e analisar cada caso, tendo sempre o silogismo como referência central. As premissas e as conclusões das inferências estudadas na Lógica aristotélica eram constituídas como enunciados ou proposições com dois termos (do tipo sujeito-predicado) de uma das seguintes formas: 2 Ficheiro com a imagem de Aristóteles da Wikimedia Commons, de domínio público.
359
LÓGICA MATEMÁTICA
Todos os S são P
(Universal afirmativa)
Alguns S são P
(Particular afirmativa)
Nenhum S é P
(Universal negativa)
Alguns S não são P
(Particular negativa)
Mesmo os enunciados singulares como «Sócrates é um homem» ou «Sócrates não é um homem» eram encarados como casos do tipo universal, «Todos os S são H» e «Nenhum S é H», respectivamente, considerando a interpretação em que o termo S tem como extensão o conjunto singular cujo único elemento é o indivíduo Sócrates e H tem como extensão o conjunto de todos os Homens. Assim, o silogismo apresentado acima seria visto como uma instância do tipo «Todos os S são H; todos os H são M; logo, todos os S são M». Em geral, é bem claro que a validade de uma inferência não implica a validade da respectiva conclusão: o argumento permanece correcto mesmo que, assentando em premissas falsas, permita inferir uma conclusão falsa (ou verdadeira); apenas garante que se as premissas são válidas, então a conclusão também o é. Tal não é o caso quando se considera a validade de uma proposição isolada, que pode ser vista como uma conclusão inferida a partir de um conjunto vazio de premissas. Os aristotélicos chamaram tautologias às proposições que são válidas independentemente da interpretação dada aos termos que as constituem (ou seja, que constituem inferências válidas no sentido considerado acima, sem quaisquer pressupostos) e contradições às proposições que nunca são válidas, quaisquer que sejam as extensões dos seus termos. Por exemplo, analisando os enunciados correspondentes às quatro formas aristotélicas quando se consideram dois termos iguais, Todos os A são A; Alguns A são A; Nenhum A é A; Alguns A não são A; facilmente se constata que o primeiro é uma tautologia e o quarto é uma contradição. É curioso notar que os aristotélicos classificavam também o segundo enunciado como uma tautologia, uma vez que não consideravam a hipótese de
360
LUCINDA LIMA
um conjunto ser vazio. De facto, pode dizer-se que essa proposição é válida exactamente quando o conjunto A , extensão do termo A, é não vazio, uma vez que, para ser verdadeira, é necessário que exista algum elemento em A e, nesse caso, é claro que ele é elemento de A . De forma análoga, o terceiro enunciado é falso se e só se A ̸= ;. A validade da primeira proposição acima e da negação da quarta correspondem aos dois primeiros dos três grandes princípios, consagrados na Lógica Aristotélica, a que deve obedecer um raciocínio válido: Princípio da Identidade (Todo o A é A) Princípio da Não Contradição (Nenhum A é não A) Princípio do Terceiro Excluído (Todo é A ou não A) O legado de Aristóteles nesta área é imenso e perdura até aos nossos dias: ele foi o primeiro a distinguir a validade formal do pensamento do seu conteúdo material, o que lhe permitiu empreender uma verdadeira classificação e análise de (certos) tipos de raciocínios; concretizou esta percepção usando letras (ou variáveis) para representar termos que poderiam ter diferentes interpretações; e estabeleceu princípios básicos para a validade do discurso, procurando uma metodologia para alcançar a «Verdade», em particular na actividade científica. Contudo, depois de Aristóteles, a Lógica Formal permaneceu relativamente estagnada durante mais de dois mil anos, muito limitada ao estudo de alguns tipos de inferências e de certa forma comprometida, na sua essência, pelo uso da linguagem natural que, sujeita às mais diversas interpretações e formulações, não se presta à expressão de um pensamento que se pretende preciso.
361
LÓGICA MATEMÁTICA
9.2 LEIBNIZ E A SUA VISÃO DE UMA LÓGICA MATEMÁTICA « … quão melhor seria subordinar às leis matemáticas o raciocínio humano, que é a coisa mais excelente que nós temos.»
3
Figura 9.24
O grande matemático alemão Gottfried Wilhelm Leibniz (1646–1716), fascinado desde a infância com o sistema lógico de Aristóteles, foi o precursor da introdução do método matemático na Lógica, que viria a transformar completamente esta disciplina. Leibniz, que atribuía grande importância à simbologia e notação na eficiência do pensamento dedutivo — recorde-se a notação por ele desenvolvida e ainda em uso para o Cálculo Diferencial e Integral — idealizou uma linguagem simbólica universal que podia exprimir todo o raciocínio, formada a partir de um «alfabeto do pensamento» que compreendia os conceitos elementares a partir dos quais todos os outros são formados. Esta linguagem seria ainda capaz de representar perfeitamente as relações lógicas entre os conceitos e seria possível estabelecer regras de dedução, reduzidas a meras manipulações «algébricas» dos símbolos, que permitiriam julgar decisivamente sobre a validade das afirmações aí produzidas. Identificou assim o raciocínio lógico a uma espécie de cálculo, a que chamou calculus ratiotinator, e sonhou até com uma máquina capaz de o desempenhar, da mesma forma que a calculadora que ele próprio concebeu era capaz de realizar as quatro operações aritméticas básicas.5 Apesar de nunca ter abandonado este projecto ao longo de toda a sua vida, Leibniz não chegou a completar uma obra consistente nesse sentido e o trabalho que efectivamente realizou para a concepção do calculus ratiotinator, publicado 3 Excerto de citação de Leibniz traduzida em [Davis, 2004], pág. 35. Ficheiro com a assinatura de Leibniz da Wikimedia Commons, de domínio público. 4 Ficheiro com a imagem de Leibniz da Wikimedia Commons, de domínio público. 5 Blaise Pascal, alguns anos antes, tinha já inventado uma máquina capaz de somar e subtrair. 362
LUCINDA LIMA
só muito depois da sua morte, não viria a ser prosseguido até mais de um século depois.
9.3 BOOLE E A ALGEBRIZAÇÃO DA LÓGICA Foi George Boole (1815–1864), considerado, em certa medida, o fundador da Lógica Matemática, quem produziu uma lógica simbólica útil, no sentido das ideias de Leibniz, mas aparentemente sem conhecimento delas. O seu trabalho nesta área, que ele próprio considerou ser o seu maior contributo para a Ciência e aquele pelo qual gostaria de ser lembrado, incorporou definitivamente a Lógica na Matemática e, a partir dele, a Lógica Matemática tem tido extraordinários e contínuos desenvolvimentos.
Figura 9.36
Na sua obra An Investigation of The Laws of Thought, on Which are Founded the Mathematical Theories of Logic and Probabilities [Boole,1959], amadurecida e desenvolvida a partir de um primeiro trabalho [Boole,1947] nesta área, ele propõe-se a «investigar as leis fundamentais das operações da mente através das quais o raciocínio é formado; dar-lhes expressão na linguagem simbólica de um Calculus e nestes fundamentos estabelecer a ciência da Lógica e construir o seu método…». Nesse tratado, abundantemente ilustrado com exemplos, Boole tem a preocupação permanente de justificar a filosofia subjacente à teoria que está a criar. Assume o princípio de que a linguagem é um instrumento da razão e não meramente um meio de comunicação, pelo que deve ser adaptada a um fim ou propósito. Considerando que as leis da Lógica são matemáticas na sua essência, a linguagem adequada para as exprimir e desenvolver deve também ter uma forma matemática. Tal como na Matemática, onde uma infinidade de possíveis teoremas são dedutíveis a partir de uns poucos e simples axiomas, Boole defende que também na Lógica há as verdades fundamentais, «confirmadas através do próprio testemunho da mente», a partir das quais todas as outras são dedutíveis usando métodos formais; e que esses métodos podem ser traduzidos em leis da linguagem escolhida para desenvolver o sistema da Lógica, não dependentes da natureza da interpretação dos seus símbolos. 6 Ficheiro com a imagem de Boole da Wikimedia Commons, de domínio público.
363
LÓGICA MATEMÁTICA
Boole descreve raciocínios lógicos em termos de uma álgebra de conjuntos, usando as operações, actualmente chamadas booleanas, entre conjuntos: união, intersecção e complementar. A descrição que se segue de alguns elementos do seu trabalho poderia ser feita usando as notações agora habituais para estas operações e até ilustradas recorrendo a diagramas de Venn, o que pode ser considerado para efeitos de ensino do tema, por exemplo. Mas opta-se aqui pela notação efectivamente usada por Boole (embora usando também a terminologia actual), que é emprestada da Álgebra comum, precisamente com o propósito de estabelecer a analogia entre as leis lógicas e as algébricas, que ele tanto enfatizou. Por outro lado, o uso da notação algébrica evidencia também o grande contributo de Boole, desta vez do ponto de vista da Álgebra, de mostrar que os processos algébricos são aplicáveis a contextos muito mais gerais do que o das operações numéricas; e, do ponto de vista didáctico, pode proporcionar um excelente exercício mental de preparação para o estudo da Álgebra Abstracta moderna. A linguagem utilizada, como já foi dito semelhante à algébrica, contém símbolos literais x , y , z . . . que são usados para representar conjuntos arbitrários (definidos como classes dos sujeitos aos quais é aplicável um certo nome ou descrição), sinais de operação +, − e ×, que representam as operações da mente pelas quais os conceitos são combinados para formar novos conceitos e o símbolo de igualdade, =, que permitirá a escrita de equações. Os símbolos literais podem representar conjuntos variáveis mas, dentro de cada discurso, devem ter uma interpretação fixa. Foi admitida a possibilidade de conjuntos singulares, do conjunto vazio, ou «nada», que compreende «ninguém», e do conjunto constituído por «todos» os objectos passíveis de consideração num dado discurso, a que chamou o universo do discurso. Nada e o Universo seriam então os dois limites para a extensão das classes a considerar. Quanto aos sinais de operação, têm uma interpretação constante, sendo que x + y corresponde à união, x − y ao complementar de y em x e x × y , ou simplesmente x y , à intersecção dos conjuntos representados por x e y . Assim, como exemplifica Boole, se x representa a classe das coisas brancas e y representa a classe das ovelhas, então x y representa a classe dos objectos aos quais são aplicáveis simultaneamente as características que definem x e y , ou seja, corresponde ao conjunto das ovelhas brancas. Analisando as propriedades destas operações, Boole estabelece a validade de leis, expressas por equações, que têm uma notável concordância formal com
364
LUCINDA LIMA
as leis algébricas correspondentes, como por exemplo x y = y x , z (x +y ) = z x +z y ou z (x − y ) = z x − z y . No entanto, deixa completamente claro que a evidência destas leis deve ser determinada de forma independente, na Álgebra e na Lógica. De facto, constata que na Lógica é verificada uma lei fundamental especial, xx = x
ou
x2 = x
que considera ser a característica que a distingue completamente da Álgebra. Notando que este princípio só tem uma contrapartida algébrica se se restringir os valores de x aos números 0 e 1, Boole conclui que a álgebra da Lógica será análoga a uma tal álgebra: como «(...) o processo formal de raciocínio depende apenas das leis dos símbolos e não da natureza das suas interpretações, (...) podemos de facto ignorar a interpretação lógica dos símbolos numa dada equação; convertê-los em símbolos quantitativos, susceptíveis apenas dos valores 0 e 1; manipulá-los de forma a obter uma solução; e finalmente recuperar a sua interpretação lógica». Para dar um significado lógico aos símbolos 0 e 1, recorre à leis algébricas 0x = 0
e
1x = x
(para qualquer x ),
que, depois de interpretadas na Lógica, conduzem a que 0 tem de representar o conjunto vazio e 1 tem de representar o universo. Assim, por exemplo, 1 − x denota o «contrário» de x , isto é, a classe dos objectos (do universo) que não estão no conjunto correspondente à letra x . Estabelecidas as equações que traduzem os princípios básicos desta Lógica, todas as outras verdades desta ciência deveriam ser obtidas destas. Boole exemplifica demonstrando como se pode deduzir o Princípio da Não Contradição, um dos consagrados por Aristóteles: a lei x 2 = x pode ser escrita na forma x − x 2 = 0, donde resulta que x (1 − x ) = 0, o que exprime exactamente que não há objectos que possuam e simultaneamente não possuam a mesma qualidade. Nas suas próprias palavras, «aquele que tem sido considerado como o axioma fundamental da metafísica, não é mais do que a consequência de uma lei do pensamento, matemática na sua forma.»! De forma análoga, os silogismos que constituíram a referência central da Lógica de Aristóteles, podem ser expressos na Álgebra de Boole. Por exemplo, se x representa o conjunto singular constituído apenas por Sócrates, y representa a classe dos homens e z corresponde à classe dos mortais, num universo 365
LÓGICA MATEMÁTICA
constituído por todos os seres, então as premissas do silogismo clássico de Aristóteles podem traduzir-se por x (1 − y ) = 0 e y (1 − z ) = 0, enquanto a conclusão, x (1 − z ) = 0, pode ser deduzida das equações das premissas: decorre de x (1 − y ) = 0 que x (1 − y )(1 − z ) = 0, logo x (1 − z )(1 − y ) = 0 e, usando a distributividade, x (1 − z ) − x (1 − z )y = 0, donde se conclui que x (1 − z ) = 0, na hipótese de que 0 = y (1 − z ) = (1 − z )y e, portanto, que x (1 − z )y = x 0 = 0. Boole percebe que o seu sistema de Lógica representa um grande contributo para o avanço desta ciência que, ele próprio afirma, até à altura permanecia «... quase exclusivamente ligada ao grande nome de Aristóteles». De facto, a sua teoria abrange a de Aristóteles e vai muito para além dela: permite deduzir uma infinidade de leis válidas, e não apenas um número finito de tipos de inferências redutíveis a silogismos, e ultrapassa os problemas resultantes do carácter vago da linguagem natural usada para as exprimir e analisar. No entanto, enquanto esta linguagem é capaz de exprimir relações lógicas entre proposições, não consegue captar a estrutura lógica intrínseca de cada proposição, mostrando-se incapaz de analisar muitos dos processos dedutivos usados em Matemática. Boole faz um esforço nesse sentido, tentando uma classificação das proposições entre primárias (as que expressam relações entre coisas) e secundárias (as que expressam relações entre proposições), mas a questão só será completamente resolvida por outros matemáticos, décadas mais tarde. A linguagem de Boole, reinterpretada numa linguagem de proposições, através da correspondência entre as operações de união, intersecção e complementar entre conjuntos e as operações de disjunção, conjunção e negação entre proposições, respectivamente, está em estreita ligação com a linguagem mais elementar da Lógica moderna — o Cálculo Proposicional. Este assunto será abordado mais à frente, já na forma e com o sistema dedutivo desenvolvido pelos sucessores de Boole. Por fim, referiram-se apenas de passagem as contribuições de Boole para os fundamentos teóricos da Teoria das Probabilidades [Boole,1959] e as aplicações da sua álgebra ao desenho de circuitos e à electrónica dos computadores digitais. Do ponto de vista da Matemática em geral, o conceito de Álgebra de Boole adquiriu actualmente um alcance muito mais geral, podendo ser visto no contexto da Álgebra abstracta como um anel ou como um conjunto ordenado satisfazendo determinadas propriedades e tendo também um equivalente topológico.
366
LUCINDA LIMA
9.4 FREGE E A LÓGICA DA MATEMÁTICA A obra de Gottlob Frege (1849–1925), juntamente com trabalhos independentes de Giuseppe Peano (1858–1932) e Charles Peirce (1839–1914) e desenvolvimentos de Bertrand Russel (1872–1970) e Alfred North Whitehead (1861–1947), publicados por estes últimos nos Principia Mathematica, constituiu a base da Lógica Matemática moderna. Figura 9.47
Na sua monografia Begriffsschrift (Notação conceptual, a Linguagem Formal do Pensamento Puro como o da Aritmética8 ), que tem sido considerada a maior obra de Lógica escrita depois de Aristóteles, Frege proporcionou o primeiro sistema lógico completamente desenvolvido, capaz de exprimir, pelo menos em princípio, todos os raciocínios dedutivos e, em particular, os usados na Matemática comum. Numa época em que se levantavam sérios problemas de justificação de alguns métodos usados na Matemática, o projecto de Frege, também partilhado por Peano, era bem diferente do de Boole. Enquanto Boole usou o método matemático para exprimir e estudar os processos lógicos, Frege concebeu um sistema de Lógica «puro» no qual pretendia fundamentar toda a Matemática. Criou uma linguagem simbólica completamente nova, com uma sintaxe precisa, na qual todas as deduções podem ser efectuadas de acordo com regras exactas a partir de um conjunto de axiomas. A notação de Peano (altamente valorizada por Russel, que nela se baseou para elaborar os Principia) viria a revelar-se muito adequada ao desenvolvimento desta linguagem, que evoluiu no que vieram a tornar-se as linguagens lógicas modernas e que também são as usadas actualmente, numa vertente mais ou menos informal, para exprimir a Matemática comum. No entanto, para Frege, era muito importante distinguir os dois níveis de linguagem: o da Lógica (mesmo quando usada para exprimir conceitos e deduções matemáticas) e o da Matemática (mesmo quando usada para obter resultados sobre a Lógica). Esta distinção, essencial para quem estuda Lógica a um nível relativamente avançado, pode em certos contextos ser bastante subtil e requer uma maturidade matemática consi7 Ficheiro com a imagem de Frege da Wikimedia Commons, de domínio público. 8 Tradução do título completo a partir da versão em inglês apresentada em http://en.wikipedia.org/wiki/ Gottlob_Frege. 367
LÓGICA MATEMÁTICA
derável. Mais importante numa formação inicial, será certamente usufruir dos méritos desta linguagem, também como «instrumento do pensamento», para exprimir de forma clara e rigorosa os conceitos e processos dedutivos em Matemática. A linguagem lógica de Frege, para além de ser capaz de representar relações lógicas entre proposições, inclui símbolos (variáveis) que podem representar objectos, símbolos que permitem representar propriedades desses objectos ou relações entre eles e, de extrema importância, os quantificadores universal e existencial, que permitem distinguir a validade de propriedades para todos ou apenas para alguns dos objectos. Esta estrutura fornece-lhe um poder expressivo muito maior do que o da Álgebra de Boole, possibilitando a representação completa da informação essencial de cada proposição e, nomeadamente, a definição de conceitos, o que seria essencial para os seus propósitos. Frege desenvolve também um sistema dedutivo puramente simbólico, estabelecendo axiomas e regras de inferência expressos na sua linguagem, destinado a realizar todas as demonstrações da Matemática, que assim ficariam completamente fundamentadas e livres de qualquer ambiguidade ou suspeita. Completado o sistema lógico, o programa de Frege consistia em nele fundamentar toda a estrutura da Matemática, começando pela Aritmética, tarefa a que dedicou a obra em dois volumes Grundgesetze der Arithmetik (Os Fundamentos da Aritmética: Investigação Lógico-matemática do conceito de número9 ). Um dos passos a cumprir seria a definição de número em termos puramente lógicos. Frege consegue definir na sua linguagem o conceito geral de «ser um número inteiro» e consegue definir a propriedade de um conjunto ter um certo número (natural, fixo) de elementos sem recorrer a uma definição prévia desse número (isto será exemplificado na Lógica de Primeira Ordem, mais à frente). Depois, definia um dado número natural, n , como o conjunto (ou classe) de todos os conjuntos com n elementos. Mas foi precisamente esta hipótese, central na sua tentativa de fundamentação da Aritmética, que Russel viria a mostrar ser inconsistente, precisamente quando o segundo volume dos Fundamentos da Aritmética estava em impressão! Para explicitar um pouco melhor esta questão, importa agora referir que Frege considerava (ao contrário de Pierce e do que é a prática actual) que as va9 Tradução do título completo a partir da versão em inglês apresentada em http://en.wikipedia.org/wiki/ Gottlob_Frege. 368
LUCINDA LIMA
riáveis que ocorriam nas suas fórmulas seriam interpretadas, não como elementos de um universo (conjunto) variável mas pré-definido em cada interpretação — o equivalente ao universo do discurso de Boole — mas sim que poderiam representar «qualquer» objecto, incluindo qualquer objecto matemático. Assumia assim implicitamente a existência de uma «totalidade» ou conjunto de «todas as coisas», e em particular de todos os conjuntos, e consequentemente que toda a propriedade exprimível na sua linguagem definiria implicitamente um conjunto constituído pelos objectos que a verificam. Isto permitia-lhe adoptar a definição explicada atrás de um número natural: por exemplo, dois seria o conjunto de todos os conjuntos que verificam a propriedade de possuírem exactamente dois elementos. Ora, para desespero de Frege, Russel mostrou, com um argumento desconcertantemente simples, que esta ideia é paradoxal. É o célebre Paradoxo de Russel, que é comummente divulgado sob diversas formas, algumas até divertidas: Suponhamos que existia o conjunto A de todos os conjuntos. A propriedade de um conjunto não pertencer a si próprio define, então, o conjunto B constituído pelos objectos x (de A ) que a verificam. Coloca-se a questão de B ser ou não um elemento de si próprio e facilmente se constata que qualquer uma das hipóteses é contraditória: se B é elemento de B , então verifica a propriedade de não ser elemento de si próprio; e se B não pertence a B , então verifica a propriedade que define precisamente os elementos de B . Esta descoberta foi devastadora para Frege, que escreve a Russel: «A sua descoberta da contradição provocou em mim a maior surpresa e, quase diria, consternação, na medida em que abalou as bases sobre as quais eu entendia construir a aritmética. (. . .) Em todo o caso, a sua descoberta é da maior importância e dela resultará provavelmente um grande progresso para a lógica, apesar de à primeira vista ser inoportuna.»10 Russel reconhece a grande integridade intelectual da reacção de Frege e escreve a respeito: 10 Excerto de citação traduzida em [Putnam, 1988], pág. 41 e 42.
369
LÓGICA MATEMÁTICA
«Foi quase sobre-humano e uma indicação que dá conta daquilo de que são capazes os homens que se dedicam ao trabalho criativo e ao conhecimento e não a esforços grosseiros para dominarem e serem conhecidos».11 Este problema no trabalho de Frege veio a ser corrigido em termos lógicos, nomeadamente pelo próprio Russel, auxiliado por Whitehead, nos Principia Mathematica. Aí Russel desenvolveu uma teoria — que numa versão simplificada veio a ser conhecida por Teoria dos Tipos — que postulava uma hierarquia de universos do discurso, com vista a eliminar a possibilidade de auto-referências, que causavam incompatibilidades como a do paradoxo que ele descreveu. Este sistema, que não será aqui tratado, tornou-se bastante complicado e não isento de inconvenientes. De qualquer forma, posteriores grandes teoremas de Gödel vieram a clarificar limitações deste sistema e outras opções foram tomadas relativamente aos fundamentos da Matemática. Actualmente, é praticamente consensual que Frege não chegou a fornecer a fundamentação da Matemática na Lógica que pretendia (embora o seu programa esteja actualmente a ser revisitado!). Isto em nada obscurece a importância e o alcance da sua obra, que influenciou decisivamente a linguagem usada na Matemática em geral, conduzindo a uma maior exactidão e rigor de conceitos, deu um enorme contributo para o estabelecimento de fundamentos seguros desta ciência e impulsionou todo o desenvolvimento posterior da Lógica Matemática (e da Lógica em geral), fornecendo os instrumentos formais necessários à obtenção de grandes resultados no século XX.
9.5 AS LINGUAGENS DA LÓGICA MATEMÁTICA MODERNA Nesta secção serão abordadas, já com a formulação e notação actuais, as linguagens básicas da Lógica moderna que resultaram do trabalho dos matemáticos atrás referidos — o Cálculo Proposicional e as Linguagens de Primeira Ordem. De facto, o Cálculo Proposicional é um «sub-sistema» da Lógica de Primeira Ordem e estes dois sistemas não foram desenvolvidos separadamente; mas pode ser feita uma construção independente do primeiro, de concepção muito mais elementar, o que em geral é considerado conveniente do ponto de vista de sistematização e de aprendizagem. 11 Excerto de citação traduzida em [Davis, 2004], pág. 62. 370
LUCINDA LIMA
Embora de uma maneira relativamente informal e sem possibilidade de se incluir qualquer demonstração dos resultados referidos, será aqui desenvolvido com mais algum detalhe o Cálculo Proposicional do que as Linguagens de Primeira Ordem, bastante mais sofisticadas, em que os aspectos técnicos se tornam demasiado pesados para este texto.
9.5.1 O CÁLCULO PROPOSICIONAL O Cálculo Proposicional é uma linguagem formal que constitui um modelo matemático adequado para exprimir certos tipos simples de raciocínios, que envolvem apenas relações entre proposições. Entende-se aqui por proposição um enunciado ou frase declarativa, ao qual pode ser associado um valor lógico — verdadeiro (v ) ou falso ( f ).12 O alfabeto desta linguagem inclui símbolos A, B,C , . . . ou A 1 , A 2 , A 3 , . . ., chamados variáveis, que intuitivamente representam proposições elementares, independentes entre si no que respeita ao seu valor de verdade, e a partir das quais é possível formar proposições mais complexas por aplicação de operadores lógicos chamados conectivos: a negação (∼), a conjunção (∧), a disjunção (∨), a implicação (→) e a equivalência (↔).13 Para além destes símbolos, consideram-se ainda os parênteses, ( e ), que permitem eliminar ambiguidades na aplicação dos conectivos. Este processo é realizado formalmente através da construção das palavras ou fórmulas desta linguagem, representadas aqui por letras gregas do tipo φ , ψ, θ , …, que são sequências de símbolos do alfabeto formadas por regras gramaticais (sintaxe) precisas: i) Qualquer variável é uma fórmula; ii) se φ e ψ são fórmulas, então (∼φ), (φ∧ψ), (φ∨ψ), (φ → ψ) e (φ ↔ ψ) também são fórmulas; iii) qualquer fórmula é obtida usando apenas as regras anteriores. Para simplificar a notação, na prática usam-se algumas convenções na escrita de fórmulas: omitem-se parênteses em casos em que daí não resultem am12 Por vezes, usam-se também os símbolos 0 e 1, em vez de f e v , respectivamente. 13 São também habituais as notações ¬ para a negação, ⊃ ou ⇒ para a implicação e ⇔ para a equivalência. Outros conectivos podem ser considerados, como por exemplo, a disjunção exclusiva, mas podem ser obtidos por combinação destes. Na verdade, bastaria considerar uma lista menor, como será visto mais à frente, mas optou-se por incluir aqui os mais usados na Matemática comum. 371
LÓGICA MATEMÁTICA
biguidades e assume-se que o conectivo ∼ tem prioridade sobre os restantes. Assim, por exemplo, não se escrevem os parênteses exteriores de uma fórmula isolada e escreve-se ∼φ → ψ em vez de (∼φ) → ψ. Com estas regras, ∼(A → (B ∧C )) ↔ ∼∼B é uma fórmula do Cálculo Proposicional, enquanto as sequências A → B ∧C e C ∼A não são fórmulas. Nesta definição, as fórmulas do Cálculo Proposicional são sequências puramente formais de símbolos. A atribuição de um significado lógico às fórmulas e todos os conceitos relacionados constituem o que se chama a semântica desta linguagem e serão esses aspectos que passamos a abordar de seguida. Uma vez que as fórmulas são obtidas das variáveis por aplicação sucessiva dos conectivos, a atribuição de valores lógicos (v ou f ) às variáveis determina um valor lógico para uma qualquer fórmula, uma vez definido qual o efeito lógico destes conectivos sobre as fórmulas às quais são aplicados. Tal pode ser feito usando as chamadas tabelas de verdade, que fornecem as regras de cálculo exactas para essa determinação. φ
ψ
∼φ
φ ∧ψ
φ ∨ψ
φ→ψ
φ↔ψ
v
v
f
v
v
v
v
v
f
f
f
v
f
f
f
v
v
f
v
v
f
f
f
v
f
f
v
v
Como seria de esperar, o significado atribuído aos conectivos nestas tabelas está de acordo com a interpretação usual, quer em Matemática, quer na linguagem natural. No entanto, por vezes surgem algumas dúvidas nesta relação, resultantes do carácter muitas vezes ambíguo e dependente do contexto da linguagem comum, em contraste com o carácter exacto desta linguagem formal. O caso mais flagrante é o da implicação. Em geral, quando fazemos uma afirmação do tipo «Se A então B», pretendemos transmitir uma relação de causalidade directa entre a verificação das proposições A e B; em princípio, não é comum dizer-se algo como «Se o meu nome é João então amanhã vai chover» (com ou sem intenção de mentir), quando aparentemente não há nenhuma relação entre o nome de uma pessoa e a evolução do clima. Mas o facto é que, por mais disparatada ou irrelevante que possa parecer uma frase deste tipo, só podemos acusar uma pessoa que a proferiu de faltar ao prometido se, de facto, essa pessoa se chamar João e no dia seguinte não chover. Qualquer outra análise sobre a aparente ausência 372
LUCINDA LIMA
de relação entre os dois factos pode ser considerada especulativa e dependente de crenças individuais, carecendo de confirmação. É de referir também que a disjunção aqui considerada não é exclusiva, ou seja, a disjunção de duas proposições será verdadeira sempre que pelo menos uma, eventualmente ambas, o for; enquanto na linguagem corrente a palavra «ou» é usada tanto no sentido inclusivo («pelo menos um dos casos») como no sentido exclusivo («apenas um dos casos»), dependendo do contexto. A lógica básica subjacente ao Cálculo Proposicional é suficiente para traduzir e resolver a validade de vários tipos de inferências, quando o que está em causa é apenas uma relação entre a validade de proposições. Isso é usado frequentemente em narrativas ou «puzzles» lógicos, muitos dos quais são bem conhecidos e já fazem parte do folclore. Exemplifica-se aqui esse uso ao longo de uma pequena história, em que se pedem emprestadas as personagens de Alice no País das Maravilhas e Alice através do Espelho, da autoria de Lewis Carrol14 , à medida que vão sendo introduzidas algumas terminologia e notação relativas à semântica do Cálculo Proposicional. Todas as ilustrações dos livros de Alice aqui utilizadas são da autoria de John Tenniel.15 Alice acabava de cair no País das Maravilhas e ainda estava um pouco atordoada e sem saber por onde ir. Passa por ela o Coelho Branco que, apesar de muito apressado, tenta ajudá-la e aconselha-a a perguntar o caminho ao Gato Risonho, que tudo sabe. — Mas — alerta o Coelho — deves ter muito cuidado! É que há dias em que o Gato diz sempre a verdade, mas também há dias em que mente sempre.
Figura 9.5
Mais à frente, Alice encontra o Gato empoleirado numa árvore, muito risonho, que, entre dois possíveis caminhos opostos, lhe aponta o da direita.
— Como é que eu sei que não me estás a enganar? — pergunta, desconfiada, Alice. — Bom — responde o Gato, com um sorriso enigmático — se o melhor caminho é o da direita então é o da esquerda e se o melhor caminho é o da esquerda então é o da direita! 14 Nome literário do matemático e lógico Charles Lutwidge Dodgson (1832–1898). 15 Os cheiros com as ilustrações de John Tenniel são de domínio público e disponibilizados em várias páginas da Internet. A cor foi aqui modicada (de acordo com as especicações da licença). 373
LÓGICA MATEMÁTICA
Alice pensa um pouco, agradece, e segue o caminho da esquerda, enquanto o Gato vai desaparecendo aos poucos, até ficar apenas a sua cauda a balançar no cimo da árvore. O que Alice concluiu é que o Gato Risonho lhe mentiu na sua resposta. Portanto, a acreditar no que disse o Coelho Branco (que até parecia um bom coelho), o Gato estava em dia de mentiras e teria indicado inicialmente o caminho errado. De facto, fazendo atribuir à proposição «O melhor caminho é o da direita» uma variável A do Cálculo Proposicional, a resposta do gato traduz-se pela fórmula (A → ∼A)∧(∼A → A) que é sempre falsa, independentemente do valor lógico de A : A
∼A
A → ∼A
∼A → A
(A → ∼A) ∧ (∼A → A)
v
f
f
v
f
f
v
v
f
f
Uma fórmula do Cálculo Proposicional que toma sempre o valor f independentemente da atribuição de valores lógicos às variáveis diz-se uma contradição, de que é um exemplo a analisada acima. De acordo com a nomenclatura aristotélica, uma fórmula cuja negação é uma contradição, isto é, que toma sempre o valor v , diz-se uma tautologia. Usa-se a notação |=φ para exprimir que φ é uma tautologia e ̸|=φ para exprimir que não o é. São exemplos de tautologias quaisquer fórmulas dos tipos φ → φ , ∼(φ ∧ ∼φ) e φ ∨ ∼φ que exprimem os três princípios fundamentais de Aristóteles. A fórmula A → B não é uma tautologia nem uma contradição, uma vez que pode ser verdadeira ou falsa, dependendo dos valores lógicos de A e de B . Prosseguindo no seu caminho, Alice depara-se com um lindo jardim, repleto de roseiras vermelhas. Mas fica intrigada quando repara que das rosas pinga uma espécie de tinta e aproxima-se para ver melhor. De repente, assusta-se com a ruidosa chegada dos reis de Copas e da sua grande comitiva de soldados, que não são mais do que cartas de jogar. — Cortem-lhe a cabeça! — grita a Rainha. — É ela que anda a roubar as minhas preciosas rosas, que eu bem vejo que têm desaparecido! — Eu não roubei nada! Só estava a ver! — defende-se Figura 9.6 Alice, já a tremer. — Se ela não admite a culpa, tem de haver um julgamento! — decide então o Rei, que tinha a fama de ser muito justo. — Eu serei o Juiz e os soldados serão as testemunhas. 374
LUCINDA LIMA
Durante o julgamento, os depoimentos dividem-se: — O Gato Risonho comeu as rosas e, se não, então foi a Alice que as roubou! — afirmam os soldados vermelhos; — A Alice não roubou as rosas só se o Gato risonho não as comeu ou o Coelho Branco passou por aqui — dizem unanimemente os pretos. Após cuidadosa consideração, o Rei delibera que a ré deve ser ilibada por falta de provas, para grande decepção da Rainha, que ia resmungando que também nunca a deixavam divertir-se nem um pouco. Tratava-se aqui, na decisão do Rei, de saber se poderia inferir, com toda a certeza, a culpa de Alice a partir dos testemunhos. Para traduzir a ideia da inferência de uma proposição a partir de um certo conjunto de premissas, introduz-se no Cálculo Proposicional o conceito de consequência semântica: se Σ é um conjunto qualquer de fórmulas, diz-se que uma fórmula ψ é consequência semântica de Σ, e escreve-se Σ|=ψ, se e só se, sempre que todas as fórmulas de Σ tomam simultaneamente o valor v , também ψ tem esse valor. A notação Σ̸|=ψ significa naturalmente que ψ não é consequência semântica de Σ. Por exemplo, {A, A → B } |= B , pois para que A e A → B sejam ambas verdadeiras, então necessariamente B toma o valor v . Esta consequência semântica corresponde a uma regra de inferência conhecida por Modus Ponens, que terá um papel especial mais à frente. No caso do julgamento em análise, os testemunhos dos soldados podem exprimir-se por duas fórmulas, φ = A ∧ (∼A → B ), no caso dos vermelhos e ψ = ∼B → (∼A ∨ C ), no caso dos pretos, se as variáveis A , B e C forem interpretadas, respectivamente, como as proposições «O Gato comeu as rosas», «Alice roubou as rosas» e «O Coelho passou por ali». E o que o Rei teve de decidir era se {φ, ψ} |= B . Ora, facilmente verificou que não, uma vez que seria possível estas duas fórmulas tomarem ambas o valor v e, simultaneamente, B tomar o valor f : bastaria para isso que a A e a C fosse atribuído o valor v e a B o valor f . Note-se que uma fórmula φ é uma tautologia se e só se ; |= φ ; ou, equivalentemente, se e só se, para qualquer conjunto de fórmulas Σ, Σ |= φ : tal como já foi referido na Lógica de Aristóteles, a validade de uma tautologia não depende de quaisquer pressupostos.
375
LÓGICA MATEMÁTICA
Aliviada, Alice foge do jardim de copas a toda a pressa. Avista então uma acolhedora casinha de onde vinham sons animados de festa. Desanimada e já com fome, Alice decide bater à porta. Quem abre é o Chapeleiro Louco, que diz: — Entra, entra! É sempre bem-vindo mais um à nossa festa! Até podes, se quiseres, tomar um chá e comer uma fatia deste delicioso bolo! Alice agradece e preparava-se já para se servir quando o Chapeleiro, dirigindo-se a todos os presentes, acrescenta: — Vejam pessoal, já temos uma convidada de honra para as festas dos próximos 364 desaniversários! Assustada com essa perspectiva, Alice apressa-se a esclarecer que, embora aceite de bom grado o chá e o bolo, pretende depois disso ir embora, porque já está a ficar com saudades de casa. — Ó menina, não sejas ingrata! — diz o Chapeleiro com um ar a princípio um pouco zangado. Aceitaste a nossa hospitalidade e agora tens de contribuir para a festa! Mas, vá lá, proponho-te jogar um jogo e pode ser que até ganhes, quem sabe, a tua liberdade. Nós aqui gostamos muito de jogos! Até te dou dois jogos à escolha — continua. No primeiro jogo, deves dizer uma frase; se ela for verdadeira, ganhas uma chávena de chá; se ela for falsa, não ganhas nada Figura 9.7 ou pedes o prémio que quiseres, mas não ganhas exactamente uma chávena de chá. No segundo jogo, também deves dizer uma frase; e, quer seja verdadeira ou falsa, o teu prémio será sempre mais do que a chávena de chá. Então, qual decides jogar e o que vais dizer? À primeira vista, Alice acha que vai escolher o segundo jogo. Afinal, garante-lhe pelo menos a chávena de chá e algo mais, talvez uma fatia daquele bolo. Mas não está satisfeita porque na verdade, para além do lanche, ela quer mesmo a sua liberdade. Pensa um pouco melhor até que percebe o que pode fazer. — Já sei! — diz Alice. — Vou jogar o primeiro jogo e a frase que eu digo é: «Não vou ganhar exactamente a chávena de chá nem o prémio que eu quero».
376
LUCINDA LIMA
O Chapeleiro reconhece que, segundo as regras do jogo, Alice pode escolher o prémio que quiser. E Alice pede uma chávena de chá, uma fatia de bolo e, depois, a sua liberdade. Alice percebeu como poderia usar as regras do primeiro jogo16 para assegurar tudo aquilo que queria. De facto, a primeira regra não permitia que a sua afirmação fosse considerada verdadeira, uma vez que, para tal, ela não poderia ganhar exactamente o chá. Assim, a sua frase teria de ser falsa, ou seja ela teria de ganhar exactamente a chávena de chá ou o prémio à escolha; mas então a segunda regra garantia-lhe o segundo caso. Para exprimir a situação no Cálculo Proposicional, considere-se que φ , ψ e θ são fórmulas que correspondem respectivamente às proposições «Alice ganha exactamente uma chávena de chá», «Alice não ganha nada» e «Alice ganha o que quiser» (não será muito apropriado considerar aqui variáveis, porque estas proposições não são verdadeiramente independentes; mas isso em nada compromete o raciocínio em causa). A frase declarada por Alice toma então a forma ∼φ ∧ ∼θ e as regras do jogo, aplicadas a esta frase, correspondem às fórmulas σ1 = (∼φ ∧ ∼θ ) → φ e σ2 = ∼(∼φ ∧ ∼θ ) → ((ψ ∨ θ ) ∧ ∼φ). Ora, facilmente se verifica que o cumprimento das duas regras do jogo com esta frase da Alice, é precisamente equivalente à condição de a Alice não ganhar exactamente a chávena de chá e ganhar o prémio que quiser. Por outras palavras, as fórmulas σ1 ∧ σ2 e θ ∧ ∼ φ tomam o valor v exactamente nos mesmos casos (e, portanto, também o valor f ). Duas fórmulas φ e ψ são consequência semântica uma da outra se e só se, para cada atribuição de valores lógicos às variáveis, φ e ψ têm sempre o mesmo valor. Diz-se então que φ e ψ são semanticamente equivalentes, e escreve-se φ|==| ψ. Por exemplo, A → B |==| ∼A ∨ B , uma vez que o valor lógico de A → B é falso exactamente quando A toma o valor v e B toma o f , ou seja, nos mesmos casos em que ∼A ∨ B é falso. Já as fórmulas ∼(A → B ) → C e (∼A → B ) ∨ C não são semanticamente equivalentes pois, por exemplo, atribuindo o valor f a todas as variáveis, obtém-se para ∼(A → B ) → C o valor v e para (∼A → B ) ∨ C o valor f . Nesta altura Alice já só queria sair daquele país maluco! Foi com agradável surpresa que deparou com uma tabuleta onde estava escrita em letras grandes a palavra SAÍDA e, mais abaixo, se davam algumas indicações. Preparava-se para as ler, quando ouve umas vozes. Eram os irmãos Twedledee e Twedledum, que decidem avisá-la: 16 O jogo que aqui é narrado é uma adaptação a esta história do apresentado em [Smullyan, 1987].
377
LÓGICA MATEMÁTICA
— Quem seguir essas indicações, nunca conseguirá sair daqui! — diz o Twedledee. — Eu cá afirmo que quem cumprir as instruções, conseguirá certamente sair! — acrescenta o Twedledum. — E agora, como é que eu sei quem tem razão? E será possível estarem ambos certos? Eles parecem os dois tão seguros e eu já espero tudo neste país! — pensa para si própria Alice, que já está confusa. Percebe que, para poder responder a isto, tem primeiro de saber o que dizem as indicações. Se se chamar Σ a um conjunto de fórmulas do Cálculo Proposicional que represente o total das indicações e representando por A a proposição «Consegue sair do País» (referindo-se genericamente a alguém), então as afirmações dos dois irmãos correspondem, respectivamente, a Σ |= ∼A e Σ |= A . Facilmente se percebe que só podem estar ambos certos se não for possível tornar todas as fórmulas de Σ simultaneamente verdadeiras, ou seja, se não for possível cumprir todas as indicações. Um conjunto Σ de fórmulas do Cálculo Proposicional diz-se realizável ou semanticamente consistente quando as fórmulas de Σ não são contraditórias entre si; ou seja, se e só se é possível atribuir valores lógicos às variáveis que tornam simultaneamente verdadeiras todas as fórmulas de Σ. Nesse caso, diz-se que uma tal atribuição realiza Σ. Por exemplo, o conjunto vazio de fórmulas é trivialmente realizável: o contrário seria dizer que, para toda a atribuição de valores lógicos às variáveis, existia uma fórmula no conjunto vazio que tomava o valor f ; mais informalmente, se não se afirma nada, certamente não se entra em contradição. O conjunto Σ = {A, ∼B, ∼A → B } também é realizável, pois atribuição de valores lógicos v e f , respectivamente, a A e a B realiza Σ. Mas {A, ∼B, A ↔ B } não é realizável, uma vez que, para que A e ∼B sejam ambas verdadeiras, os valores lógicos de A e B são diferentes e, portanto, A ↔ B é falsa. Note-se que se um conjunto de fórmulas Σ não é realizável, então Σ |= φ , para qualquer fórmula φ : de um conjunto de premissas contraditórias pode inferir-se qualquer conclusão, verdadeira ou falsa.
378
LUCINDA LIMA
Alice passa a ler as três indicações escritas na tabuleta: — Para conseguir sair deste país, não pode seguir o Coelho Branco ou não encontre o Chapeleiro Louco; — Se seguir o Coelho Branco, então tome um chá e conseguirá sair daqui; — Consegue sair do País das Maravilhas e encontra-se com o Chapeleiro, se e só se tomar chá ou não seguir o Coelho. Atribuindo variáveis B , C e D às proposições «Segue o Coelho», «Encontra o Chapeleiro» e «Toma chá», respectivamente, as indicações podem exprimir-se pelas fórmulas φ1 = A → (∼B ∨ ∼C ), φ2 = B → (D ∧ A) e φ3 = (A ∧ C ) ↔ (D ∨ ∼B ). Facilmente se percebe que, considerando por exemplo a atribuição de valores lógicos v, f , v e v , respectivamente, às variáveis A, B,C e D , obtém-se o valor lógico verdadeiro para φ1 , φ2 e para φ3 . Isto assegura imediatamente que Σ = {φ1 , φ2 , φ3 } é realizável e também que Σ ̸|= ∼A , uma vez que foi encontrada uma realização de Σ com o valor lógico f para ∼A . Mas isto não significa necessariamente que Σ |= A . Para concluir isso, será necessário verificar que todas as realizações de Σ correspondem a um valor v para A . Ora isto é de facto verdade, pois se A toma o valor f , então, para que φ2 seja verdadeira tem-se necessariamente B falsa; mas isto torna φ3 falsa, uma vez que, então, A ∧ C é falsa e D ∨ ∼B é verdadeira. Portanto, o Twedledum tem mesmo razão, e o seu irmão, não. Figura 9.8
Percebendo que vai conseguir sair do País das Maravilhas, bastando para isso seguir as indicações, Alice resolve que vai tentar fazê-lo de imediato. Mas é então que acorda, sobressaltada, e percebe que tudo foi, afinal, um estranho sonho. Mas parecia tão real, era mesmo como se tivesse estado no livro errado! Para finalizar esta parte dedicada à semântica Figura 9.9 do Cálculo Proposicional, refira-se ainda que esta linguagem é suficiente para exprimir todas as relações possíveis entre o valor lógico de uma proposição e os valores lógicos das proposições elementares que a constituem ou, por outras palavras, que estes conectivos traduzem todas as possíveis conexões lógicas entre proposições. Neste modelo, isto significa que para qualquer número (finito) de variáveis e qualquer tabela de verdade nestas variáveis (entenda-se, uma tabela onde se determina um valor lógico para qualquer 379
LÓGICA MATEMÁTICA
combinação possível dos valores das variáveis), existe uma fórmula do Cálculo Proposicional que tem precisamente essa tabela. Na verdade, não seriam sequer necessários todos os conectivos aqui considerados e frequentemente é definido um conjunto mais restrito de conectivos ditos primitivos, sendo os restantes obtidos por combinação desses. Por exemplo, Russel e Whitehead usaram apenas os conectivos primitivos ∼ e ∨ e consideravam a fórmula φ ∧ ψ como abreviatura de ∼(∼φ ∨∼ψ). De facto, do ponto de vista semântico pode ser feita esta convenção, uma vez que estas duas fórmulas são semanticamente equivalentes. Um conjunto de conectivos suficiente para exprimir todos os outros diz-se completo. Existem conjuntos completos até com um único conectivo, mas que são de uso pouco intuitivo e, portanto, em geral não são utilizados. Mais útil é o facto de que o conjunto {∼, ∨, ∧} é completo e a prova é bastante simples e construtiva, fornecendo um algoritmo para, dada uma tabela de verdade, encontrar explicitamente uma fórmula escrita apenas com estes conectivos que lhe corresponda. A prova pode ser bem ilustrada com um caso particular, A B φ ficando evidente o algoritmo geral. Considere-se, por exemv v f plo, a tabela ao lado, que diz respeito a duas variáveis A e v f v B . Para encontrar uma fórmula φ nas condições pretendidas, f v f proceda-se da seguinte forma: f
f
v
— Começa-se por seleccionar as combinações de valores lógicos de A e B que produzem o resultado v e que neste caso são v, f e f , f (se não existissem, a fórmula poderia ser a contradição A ∧ ∼A , por exemplo). — Depois, para cada uma destas combinações, define-se uma fórmula com os conectivos em causa que toma o valor v exactamente nesse caso. Isso é feito facilmente considerando a conjunção das variáveis ou das suas negações, conforme os seus valores lógicos nessa combinação particular forem v ou f . Assim, neste caso, a fórmula φ1 = A ∧ ∼B tem o valor v exactamente na primeira combinação v, f e φ2 = ∼A ∧ ∼B tem o valor v em f , f . — Finalmente, basta tomar para φ a disjunção das várias fórmulas construídas no ponto anterior: φ = φ1 ∨ φ2 assume o valor v se e só se φ1 tem o valor v ou φ2 tem o valor v , ou seja, exactamente nas combinações inicialmente consideradas. Obtém-se assim a fórmula φ = (A ∧ ∼B ) ∨ (∼A ∧ ∼B ), que tem a tabela de verdade dada. 380
LUCINDA LIMA
Uma fórmula assim escrita, como disjunção de fórmulas as quais são conjunções das variáveis ou das suas negações, diz-se na forma disjuntiva normal. O resultado atrás referido afirma, então, que qualquer fórmula do Cálculo Proposicional pode ser escrita na forma disjuntiva normal, e esse facto é utilizado, por exemplo, para a representação de fórmulas numa maneira apropriada à programação em PROLOG (Programação em Lógica) e na concepção de circuitos. Passando agora à abordagem da axiomática e do sistema dedutivo do Cálculo Proposicional, a atitude a adoptar deve ser completamente diferente e dos processos para a realização de inferências dedutivas estarão ausentes todas as considerações de carácter semântico. Uma vez definidos os axiomas e estabelecidas as regras de inferência do sistema, todas as deduções devem ser puramente formais. Antes de mais detalhes, inclui-se, com uma narração livre, um quebra-cabeças apresentado em [Hofstadter, 1979], que ilustra bem a ideia de um sistema dedutivo formal e que pode servir como uma introdução divertida a este tópico. Num certo planeta distante, o alfabeto da linguagem usada pelos seus habitantes tem apenas três letras: M, I e U. As palavras e frases dessa linguagem são sequências destes símbolos, como por exemplo MIU, UIIIUUU e MUIIM. Entre os matemáticos locais, a proposição matemática elementar MI é considerada uma verdade fundamental, particularmente intuitiva e evidente, e é aceite como o único axioma da sua Matemática. Para deduzirem os seus teoremas, estes matemáticos admitem certas regras de inferência, que permitem obter novas proposições a partir de outras: 1 – Pode-se acrescentar um U no final de uma proposição que termina em I; 2 – Se uma proposição começa com a letra M pode-se duplicar toda a sequência de letras a partir desta; 3 – Uma sequência de três I’s consecutivos numa proposição pode ser substituída por um U; 4 – Uma sequência de dois U’s consecutivos numa proposição pode ser suprimida. Os teoremas desta Matemática são exactamente as palavras que podem ser obtidas num número finito de passos, usando apenas o axioma MI e a aplicação das regras de inferência a proposições dos passos anteriores. E uma demonstração de um teorema é uma tal sequência de proposições que termina no teorema. Por exemplo, a proposição MIU é um teorema e a simples sequência MI, MIU é uma demonstração de MIU, pois no
381
LÓGICA MATEMÁTICA
primeiro passo considera-se o axioma e no segundo aplica-se a regra 1 ao axioma. Mas a sequência MI, MII, MIIII, MIU também constitui outra demonstração de MIU, onde se aplica a regra 2 ao axioma, depois novamente a regra 2 à segunda proposição e, finalmente, obtém-se MIU por aplicação da regra 3 à proposição anterior. Um teorema clássico desta Matemática é MUIIU. Como poderá ser uma demonstração deste teorema? Enquanto o leitor se entretém a encontrar uma demonstração deste teorema da «Matemática MIU», o que consistirá num jogo puramente formal, uma vez que certamente não domina a semântica dessa linguagem, vai preparando o espírito para o que segue no Cálculo Proposicional. Neste sistema, os axiomas adoptados17 são, não apenas um, mas todas as fórmulas dos três tipos seguintes: (A1 ) φ → (ψ → φ) (A2 ) (φ → (ψ → θ )) → ((φ → ψ) → (φ → θ )) (A3 ) (∼ ψ →∼ φ) → ((∼ ψ → φ) → ψ) Na verdade, trata-se de um conjunto infinito de axiomas, uma vez que qualquer instância particular de um dos esquemas considerados é um axioma. Por exemplo, (A → C ) → ((C ↔ B ) → (A → C )) é um axioma do tipo A1 . Mas a fórmula (A → ∼B ) → ((A → B ) → ∼A) não é um axioma do tipo A3 , embora seja semanticamente equivalente a um axioma desse tipo. Enquanto do ponto de vista semântico é indiferente considerar a fórmula A ou a fórmula ∼∼A , elas são formalmente diferentes e devem aqui ser encaradas como duas fórmulas distintas. Por outro lado, admite-se uma única regra de inferência, designada por Modus Ponens (abreviadamente, MP), que permite obter uma fórmula ψ a partir das fórmulas φ e φ → ψ. Um teorema do Cálculo Proposicional é uma fórmula φ que pode ser obtida como resultado final de uma sequência finita (φ1 , . . . , φn −1 , φn = φ) de fórmulas, em que cada φi é um axioma ou é obtida por MP de duas fórmulas anteriores. Escreve-se ⊢ φ para denotar que φ é um teorema. A uma sequência (φ1 , . . . , φn ) nestas condições chama-se uma demonstração do teorema φ . 17 Outros conjuntos de axiomas têm sido considerados, com resultados nais equivalentes no sistema. Por exemplo, Russel e Whitehead adoptaram nos Principia Mathematica axiomas de cinco tipos distintos, que não incluem nenhum dos aqui xados. 382
LUCINDA LIMA
Exemplifique-se este processo, apresentando uma demonstração do teorema φ → φ : φ1 = (φ → ((φ → φ) → φ)) → ((φ → (φ → φ)) → (φ → φ)) φ2 = φ → ((φ → φ) → φ) φ3 = (φ → (φ → φ)) → (φ → φ) φ4 = φ → (φ → φ) φ5 = φ → φ
Esta sequência (φ1 , φ2 , φ3 , φ4 , φ5 ) é uma demonstração de φ → φ , uma vez que φ1 é um axioma do tipo A2 , φ2 é um axioma do tipo A1 , φ3 é obtida de φ1 e φ2 por MP, φ4 é um axioma do tipo A1 e φ5 = φ → φ é obtida de φ3 e φ4 por MP. Portanto, ⊢ φ → φ . A elaboração de demonstrações formais como esta pode parecer inicialmente um pouco complicada para um principiante, mas na verdade (a experiência mostra que), com alguma prática, a mecânica básica do processo rapidamente é interiorizada. Tal como num jogo, será necessária a experiência para desenvolver algumas estratégias para um desempenho minimamente competente destas regras. Nesse processo, é de referir que os aspectos semânticos não deixam de representar um papel importante, funcionando como um guia intuitivo para a sequência a seguir numa demonstração (embora estejam ausentes na sua concretização). Uma demonstração de MUIIU na Matemática MIU pode ser a seguinte sequência: φ1 = M I
(axioma)
φ2 = M I I
(regra 2 aplicada a φ1 )
φ3 = M I I I I
(regra 2 aplicada a φ2 )
φ4 = M I I I I U
(regra 1 aplicada a φ3 )
φ5 = MU I U
(regra 3 aplicada a φ4 )
φ6 = MU I UU I U
(regra 2 aplicada a φ5 )
φ7 = MU I I U
(regra 4 aplicada a φ6 )
Portanto, MUIIU é de facto um teorema deste sistema e é já bem conhecido dos matemáticos deste planeta. 383
LÓGICA MATEMÁTICA
Actualmente, um dos problemas em aberto nesta Matemática é se a proposição MU é um teorema. Alguns matemáticos conjecturam que sim, outros que não e, enquanto não conseguem resolver a questão, vão tirando ilações da hipótese da sua conjectura se verificar, ou não, na esperança de reduzir o problema a outro mais simples ou que já esteja resolvido. Por exemplo, notaram que aplicando a regra 2 a MU se obtém MUU e depois, aplicando a regra 4 a MUU se obtém apenas M. Assim, na hipótese de MU ser um teorema, então M também será: para obter uma demonstração de M a partir de uma hipotética demonstração de MU, bastaria acrescentar a essa sequência estes dois passos. Por outras palavras, conseguem deduzir M da hipótese MU. Por outro lado, se MU não é um teorema, então MIIIIII também não será, uma vez que se pode deduzir MU de MIIIIII, aplicando sucessivamente as regras 1, 3, 3 e 4 a MIIIIII para obter a sequência MIIIIII, MIIIIIIU, MIIIUU, MUUU, MU. Constatado isto, para provar que MU não é um teorema basta provar que M não o é; e, se se mostrar que MIIIIII é teorema, então MU também será. Mas, para já, a questão está por decidir e é este o quebra-cabeças MU. No Cálculo Proposicional, uma dedução de uma fórmula φ a partir de um conjunto de fórmulas Σ, a que, neste contexto, se pode chamar o conjunto de hipóteses, é uma sequência finita de fórmulas (φ1 , . . . , φn ) que termina em φn = φ e tal que cada φi é um axioma, ou uma hipótese, ou é obtida de duas fórmulas anteriores por MP. No caso de existir uma tal dedução, diz-se que φ é dedutível de Σ e escreve-se Σ ⊢ φ . Note-se que, em particular, uma dedução de φ a partir de ; não é mais do que uma demonstração de φ , pelo que ; ⊢ φ se e só se ⊢ φ . Evidentemente, qualquer elemento de um conjunto de hipóteses Σ é dedutível a partir de Σ, num único passo. Considere-se, por exemplo, o conjunto {φ, ∼φ} do qual são imediatamente dedutíveis a fórmula φ e a sua negação. Pode verificar-se que deste conjunto de hipóteses é dedutível qualquer fórmula ψ, sendo a seguinte sequência uma dedução de ψ a partir de {φ, ∼φ}:
384
φ1 = (∼ψ → ∼φ) → ((∼ψ → φ) → ψ)
(axioma do tipo A3 )
φ2 = ∼φ → (∼ψ → ∼φ)
(axioma do tipo A1 )
φ3 = ∼φ
(hipótese)
φ4 = ∼ψ → ∼φ
(obtida de φ2 e φ3 por MP)
φ5 = (∼ψ → φ) → ψ
(obtida de φ1 e φ4 por MP)
φ6 = φ → (∼ψ → φ)
(axioma do tipo A1 )
LUCINDA LIMA
φ7 = φ
(hipótese)
φ8 = ∼ψ → φ
(obtida de φ6 e φ7 por MP)
φ9 = ψ
(obtida de φ5 e φ8 por MP)
Um conjunto como este, a partir do qual é possível deduzir uma fórmula e a sua negação, ou equivalentemente (pelo que acabamos de mostrar), a partir do qual é dedutível qualquer fórmula, diz-se inconsistente. Caso contrário, diz-se que o conjunto é consistente. Ao fim de uns poucos exemplos, rapidamente se constata que as demonstrações e deduções neste sistema formal podem tornar-se bastante longas, mesmo quando se trate de teoremas muito simples. Provam-se, no entanto, resultados que auxiliam muito este processo. Estes resultados não são teoremas do Cálculo Proposicional, tal como definidos acima. São sim teoremas de Matemática sobre o Cálculo Proposicional, pelo que neste contexto se podem chamar metateoremas. Assim se, por um lado, esta linguagem formal modela processos dedutivos usados na Matemática comum, por outro lado, a Matemática pode ser usada para tirar conclusões sobre este sistema. O mais fundamental destes metateoremas é o Teorema da Dedução, que afirma que, para se mostrar um teorema da forma φ → ψ, basta mostrar que ψ é dedutível da hipótese φ , o que em geral é significativamente mais simples. Por exemplo, para provar o teorema φ → φ de que foi dada uma demonstração acima, bastaria provar que φ ⊢ φ , o que é imediato. Outros metateoremas traduzem também para o Cálculo Proposicional métodos de prova vulgarmente usados em Matemática. Refiram-se o Teorema da Contraposição, que numa formulação informal afirma que provar uma proposição do tipo φ → ψ é equivalente a mostrar ∼ψ → ∼φ ; e o Teorema da Redução ao Absurdo, que afirma que para se mostrar uma proposição φ a partir de um certo conjunto de hipóteses basta mostrar que, acrescentado a negação de φ às hipóteses, se obtém um conjunto inconsistente. Por exemplo, para se mostrar o teorema ∼∼φ → φ , basta, pelo Teorema da Dedução, mostrar que ∼∼φ ⊢ φ ; pelo Teorema da Redução ao Absurdo, isso reduz-se à verificação de que {∼∼φ, ∼φ} é inconsistente, o que é trivial. E o teorema «recíproco», φ → ∼∼φ , resulta, pelo Teorema da Contraposição, de ∼∼∼φ → ∼φ , que é uma instância do primeiro. Foi finalmente resolvida, negativamente, a conjectura MU da Matemática MIU. E a sua resolução passou, não apenas por tentativas puramente mecânicas de tentar apli385
LÓGICA MATEMÁTICA
car as regras de inferência ao axioma na esperança de obter MU, mas também, paralelamente, por uma reflexão sobre o que é que essas regras poderiam produzir; por outras palavras, passou pela obtenção de resultados, exteriores ao sistema (até usam um pouco da nossa Matemática humana!), mas sobre o sistema. Na verdade, por mais tentativas directas mal sucedidas que se possam fazer para obter MU, nunca se poderá concluir desse facto que não é possível fazê-lo com sucesso. Pensando um pouco sobre as regras do seu sistema MIU, há algumas conclusões que os matemáticos do planeta foram retirando. Por exemplo, facilmente observaram que todos os teoremas têm de começar pela letra M pois o axioma MI começa por M e nenhuma das regras de inferência altera esta propriedade. Isto ainda não resolvia a conjectura MU, mas apontava uma abordagem que poderiam tentar seguir. E de facto, perceberam que a forma do axioma e as regras de inferência condicionam o número de I’s que podem ocorrer num teorema. Observaram que o axioma tem um I, as regras 1 e 4 não alteram o número destes símbolos, a regra 2 duplica o seu número e cada aplicação da regra 3 diminui esse número em três; daqui resulta facilmente que o número de I’s de um teorema nunca será múltiplo de três (podendo-se provar isso mais formalmente usando indução sobre o número de passos usados numa demonstração do teorema). Portanto, a proposição MU, bem como M ou MIII, não pode ser um teorema desta Matemática! No sentido de descrever os teoremas do Cálculo Proposicional, uma primeira observação relativamente simples é que se tratam necessariamente de tautologias. Com efeito (como não deveria deixar de ser), todos os axiomas são tautologias e a regra de inferência MP aplicada a tautologias ainda produz tautologias. Portanto, todos os passos de uma demonstração, incluindo o teorema final, são também tautologias. Por outras palavras, o sistema dedutivo formal do Cálculo Proposicional só produz teoremas que são fórmulas verdadeiras, do ponto de vista semântico. Mas será que consegue produzir todas essas fórmulas? Prova-se que a resposta é afirmativa, embora muito menos óbvia do que a observação anterior, e esta propriedade é conhecida como a completude do Cálculo Proposicional. Estabelece-se assim uma relação total entre os conceitos semânticos e os processos formais do Cálculo Proposicional. Usando a terminologia introduzida, tem-se então que, para toda a fórmula φ , ⊢ φ se e só se |= φ e, mais geralmente, para qualquer conjunto de fórmulas Σ ∪ {φ}, Σ⊢φ
386
se e só se Σ |= φ.
LUCINDA LIMA
Este Teorema fornece, em particular, acesso a um processo de decisão ou algoritmo que permite concluir definitivamente, num número finito de passos, se uma dada fórmula do Cálculo Proposicional é ou não um teorema: isso pode ser feito simplesmente analisando a tabela de verdade da fórmula (que é completamente determinada da forma já explicada e tem sempre um número finito de entradas) para verificar se é ou não uma tautologia. Diz-se, portanto, que o sistema dedutivo do Cálculo Proposicional é decidível. Esta propriedade, importante, vai perder-se nas linguagens que abordaremos a seguir. Noutro sentido, há certas propriedades que são muito mais simples de provar no sistema formal do que na abordagem semântica e o (meta)Teorema da Completude (na formulação mais geral apresentada acima) permite fazer essa ponte. Por exemplo, prova-se facilmente que um conjunto de fórmulas é consistente se e só se qualquer dos seus subconjuntos finitos o é; como do Teorema da Completude resulta também uma equivalência entre o conceito semântico de conjunto realizável e o conceito de conjunto consistente, atrás introduzidos, esta propriedade para conjuntos realizáveis (Teorema da Compacidade) é automaticamente verificada, mas muito mais difícil de provar directamente.
9.5.2 LÓGICA DE PRIMEIRA ORDEM As Linguagens de Primeira Ordem, que no essencial são o resultado do trabalho de Frege, Pierce e Peano, serão abordadas nesta secção, embora de uma forma ainda menos completa do que o Cálculo Proposicional. São linguagens com poder expressivo muito superior, que permitem não apenas representar relações lógicas entre proposições, mas também exprimir propriedades e relações entre objectos, bem como distinguir entre enunciados universais, existenciais ou particulares, mostrando-se adequadas para modelar a maior parte dos processos dedutivos usados em Matemática. Em particular, estas linguagens podem ser usadas para traduzir conceitos, o que, como já foi dito atrás, era essencial para os objectivos de Frege. Na verdade, é uma versão informal emprestada desta a linguagem usada actualmente para escrever a Matemática corrente e, portanto, são já familiares muitos dos seus símbolos. Assim, o domínio dos aspectos básicos da sintaxe e semântica desta linguagem, mesmo que não necessariamente a um nível muito técnico ou formal, tornou-se indispensável para a compreensão e comunicação da Matemática.
387
LÓGICA MATEMÁTICA
As Linguagens de Primeira Ordem são bastante mais sofisticadas do que o Cálculo Proposicional. Trata-se, não de uma única linguagem, mas de uma família infinita de linguagens, havendo símbolos comuns a todas e outros específicos de cada uma, apropriada a ser usada para um dado fim. Por exemplo, não se usa a mesma linguagem para falar de Teoria de Números ou de Teoria de Grupos. Os alfabetos de todas estas linguagens contêm os conectivos do Cálculo Proposicional, bem como os parênteses, símbolos chamados variáveis x , y , z , . . . ou x 1 , x 2 , x 3 , . . . que representam, já não proposições, mas objectos, e os quantificadores ∀ e ∃ que possibilitam a quantificação das variáveis. Para além disso, e dependendo da linguagem, podem conter símbolos ditos relacionais que permitem exprimir propriedades dos objectos ou relações entre eles, símbolos ditos funcionais que pretendem representar funções (aplicadas a objectos) e símbolos chamados constantes que permitem distinguir objectos com significado estrutural especial. Finalmente, pode existir no alfabeto um símbolo de igualdade, que deve ser sempre interpretado como a relação de igualdade (e não como outra qualquer relação binária). As fórmulas são, tal como no Cálculo Proposicional, sequências de símbolos do alfabeto que obedecem a (novas) regras de sintaxe precisas. Mas estas regras são agora bastante mais elaboradas e não serão examinadas aqui, contando-se com o controle do bom-senso para a boa escrita de fórmulas que, depois de interpretadas, devem corresponder a proposições com sentido e sem ambiguidades. Enquanto objectos formais, as fórmulas de uma linguagem são desprovidas de qualquer significado lógico; mas pode ser-lhes atribuído um significado, interpretando-as numa chamada estrutura dessa linguagem, que consiste (de uma forma um pouco vaga) num conjunto não vazio, chamado o universo, onde são interpretadas as variáveis, munido de um certo número de elementos estruturais, relações ou funções, compatíveis com os símbolos da linguagem em causa. Diz-se que uma estrutura satisfaz ou não uma fórmula, para uma dada interpretação, conforme essa interpretação conduza a uma proposição verdadeira ou falsa, respectivamente, sobre os elementos da estrutura. Uma fórmula que é satisfeita em qualquer estrutura e para qualquer interpretação diz-se válida. Voltando ao exemplo já recorrente do silogismo de Aristóteles — «Sócrates é um homem; todos os homens são mortais; logo, Sócrates é mortal.» — uma Linguagem de Primeira Ordem apropriada para o exprimir terá no seu alfabeto, para além dos símbolos comuns a todas as linguagens, dois símbolos relacionais, diga388
LUCINDA LIMA
mos, P e Q . Pode-se então escrever a fórmula φ = (P(x ) ∧ ∀y (P(y ) → Q(y ))) → Q(x ). Uma possível estrutura (que interessa, para o pretendido) pode consistir no conjunto de todos os seres vivos, no presente ou passado, onde vamos interpretar as variáveis x e y , e de duas propriedades «ser homem» e «ser mortal», correspondentes à interpretação dos símbolos P e Q . Quando a fórmula é interpretada nesta estrutura, os conectivos ∧, → e o quantificador universal ∀ devem assumir o seu significado habitual, entendendo-se que a variável quantificada y pode representar qualquer ser vivo; a variável não quantificada (dita livre) x , deve ser interpretada como um ser vivo particular, por exemplo, Sócrates; e cada símbolo relacional deve ser interpretado como uma das relações presentes na estrutura, por exemplo, P como a relação «ser homem» e Q como a relação «ser mortal», sendo que P(x ) significará que o ser vivo correpondente a x , Sócrates, tem o atributo de ser homem. Com esta interpretação, a fórmula φ exprime exactamente o silogismo e é certamente satisfeita na estrutura considerada. Mas a mesma linguagem admite outras estruturas e outras interpretações, completamente distintas. Por exemplo, podemos considerar como universo o conjunto dos números reais e interpretar P como a relação «ser um número natural», Q como a relação «ser um número racional» e x como o número 1. Isto conduz-nos à proposição sobre números reais «1 é um número natural e qualquer número natural é um número racional, logo 1 é um número racional», que também é verdadeira. De facto, esta é uma fórmula válida. Outras fórmulas poderão ser satisfeitas em certas estruturas e noutras não. Considere-se, por exemplo, uma Linguagem de Primeira Ordem que contém um símbolo relacional binário (isto significa que deve ser interpretado sempre como uma relação binária) P e na qual se pode escrever a fórmula ∀y ∃x P(x , y ). Interpretada na estrutura cujo universo é o conjunto {1, 2, 3} e em que ao símbolo P se faz corresponder a relação binária «maior que» (no sentido estrito), esta fórmula traduz que, para qualquer um dos elementos de {1, 2, 3}, existe outro elemento do mesmo conjunto que é estritamente maior do que ele, o que é obviamente falso. Já na estrutura cujo universo é o conjunto dos seres humanos (do presente ou do passado) e em que P se traduz pela relação «ser pai de»18 , a mesma fórmula significa que todos os seres humanos têm (ou tiveram) um pai, o que, tanto 18 Em lembrança do Professor José Morgado, da Faculdade de Ciências da Universidade do Porto, que sempre dava este exemplo aos seus alunos, para alertar para a importância na ordem dos quanticadores.
389
LÓGICA MATEMÁTICA
quanto se sabe, ainda é verdade. Mas a fórmula ∃x ∀y P(x , y ), em idêntica interpretação, afirma que todos os seres humanos têm um mesmo pai e, portanto, não é satisfeita nesta estrutura. Para interpretar na mesma estrutura a fórmula ∃y P(x , y ), onde ocorre livre a variável x , deve ainda ser atribuída uma interpretação a esta variável como um elemento específico do universo, por exemplo, Genghis Khan; nesse caso, a fórmula exprime que Genghis Khan teve (pelo menos!) um(a) filho(a). A semântica da Lógica de Primeira Ordem consiste no estabelecimento de regras para a satisfação de uma fórmula numa estrutura, e não será também aqui detalhada. Mas estas regras traduzem o significado que habitualmente é dado aos símbolos, como foi feito nos exemplos acima, e a noção intuitiva de validade que é usada em Matemática. Voltando ao exemplo da linguagem anterior, a satisfação da fórmula ∀x ∀y (P(x , y ) → P(y , x )) numa estrutura em que o universo é o conjunto dos números reais e o símbolo P é interpretado como uma certa relação binária ≈, corresponde à validade da proposição matemática ∀a ∈ R, ∀b ∈ R, (a ≈ b ⇒ b ≈ a ), e que significa que a relação ≈ é simétrica. Note-se que esta última proposição, escrita na linguagem matemática corrente, já não é uma fórmula da Linguagem de Primeira Ordem em causa, apesar da sobreposição da simbologia utilizada. A partir daqui definem-se conceitos como os de consequência e equivalência semânticas e conjunto realizável, correspondentes aos definidos no Cálculo Proposicional. Diz-se que uma fórmula φ é consequência semântica de um conjunto de fórmulas Σ se e só se, sempre que uma estrutura satisfaz todas as fórmulas de Σ numa dada interpretação, então também satisfaz φ ; escreve-se então Σ |= φ . Em particular, uma fórmula é válida se e só se ; |= φ , o que se representa apenas por |= φ . Um conjunto de fórmulas Σ é realizável quando existe pelo menos uma estrutura e uma interpretação que satisfazem, simultaneamente, todas as fórmulas de Σ. Exemplifique-se na Linguagem de Primeira Ordem da Teoria de Grupos, que tem o símbolo de igualdade, um símbolo funcional binário ·, um símbolo funcional unário −1 e uma constante 1. Este alfabeto inclui assim a simbologia necessária para exprimir conceitos relativos a grupos — estruturas algébricas consistindo num conjunto não vazio e numa operação binária associativa que tem elemento neutro e relativamente à qual todos os elementos têm inverso — e, por isso, se escolheram os símbolos de acordo com a notação usada em geral para grupos, 390
LUCINDA LIMA
embora essa coincidência possa resultar em alguma ambiguidade. Uma estrutura desta linguagem consiste num universo não vazio munido de uma operação binária (correspondente ao símbolo ·), de uma operação unária (correspondente ao símbolo −1 ) e de um elemento distinguido (para interpretar a constante 1), mas não é necessariamente um grupo. Pode ser, por exemplo, o conjunto N = {0, 1, 2, . . .}, com a operação de adição +, a função identidade e o elemento 0. Esta estrutura não é um grupo, porque nem sempre o simétrico (relativamente a +) de um número natural é o próprio número, mas é possível exprimir isso mesmo nesta linguagem, através da fórmula ∃x ∼(x · x −1 = 1). De facto, uma estrutura desta linguagem é um grupo se e só se satisfaz o seguinte conjunto de fórmulas, que exprimem os axiomas da definição de grupo: Σ = {∀x ∀y ∀z (x · (y · z ) = (x · y ) · z ), ∀x (x · 1 = x ∧ 1 · x = x ), ∀x (x · x −1 = 1 ∧ x −1 · x = 1}.
Diz-se por isso que os grupos são os modelos de Σ. E as propriedades válidas em qualquer grupo são as que correspondem a fórmulas que são consequência semântica de Σ. A Linguagem de Primeira Ordem da Teoria Elementar dos Números tem igualdade, um símbolo relacional binário r }). (Em rigor também determina o corte ({x ∈ Q | x < r }, {x ∈ Q | x ≥ r }), mas iremos identificar estes dois cortes.) Mas existem outros cortes de racionais que não são p produzidos por um número racional. O caso de 2 sugere isso mesmo e, mais geralmente, podemos provar o seguinte. Teorema 10.2 Se d ∈ N não é um quadrado perfeito (ou seja, não é da forma k 2 , para algum k ∈ N) então, α = (A 0 , A 1 ) onde A 0 = {r ∈ Q | (r ≥ 0 e r 2 < d ) ou r < 0} A 1 = {r ∈ Q | r ≥ 0 e r 2 > d },
é um corte nos racionais. Demonstração: Dado um racional r ∈ Q, ou r é negativo ou sendo positivo seu quadrado é menor que d , caso em que r ∈ A 0 , ou r é positivo e r 2 = d ou, finalmente, r é positivo e o seu quadrado excede d , caso em que r é elemento de A 1 . Deste modo, A 0 ∪ A 1 = Q, se e só se não existe nenhum racional r cujo quadrado 420
ANTÓNIO M. FERNANDES
coincida com d . Como as restantes propriedades para que (A 0 , A 1 ) seja um corte se verificam facilmente, resta-nos verificar que não existe nenhum racional positivo r tal que r 2 = d . Começamos por observar que existe um natural λ tal que λ2 < d < (λ + 1)2 ;
(10.1)
basta para isso que consideremos λ + 1 como sendo o menor natural cujo quadrado excede d . (Note-se que qualquer conjunto não vazio de números naturais tem um elemento mínimo, facto este que é equivalente ao denominado princípio de indução finita.) Posto isto, admitamos que existem naturais m , n ∈ N tais que (n/m )2 = d . Desta igualdade concluímos que, n 2 − m 2 d = 0.
(10.2)
Suponhamos, sem perda de generalidade, que m é o mínimo natural para o qual existe um n de modo que o par (n, m ) satisfaça 10.2. Multiplicando 10.1 por m 2 obtemos λ2 m 2 < d m 2 = n 2 < (λ + 1)2 m 2 e, uma vez que estamos a considerar apenas números positivos, decorre daqui imediatamente que λm < n < (λ+1)m . Subtraindo membro-a-membro a quantidade λm , resulta que 0 < n − λm < m . Seja então m ′ = n − λm (observe-se que m ′ é um natural menor que m ). Vamos mostrar que existe um natural n ′ tal que (n ′ )2 −(m ′ )2 d = 0, contradizendo assim a minimalidade de m e estabelecendo o resultado. Calculemos estão (m ′ )2 d . Tem-se, (m ′ )2 d = (n − λm )2 d = n 2 d − 2λm nd + λ2 m 2 d = = n 2 d − 2(λn )(m d ) + λ2 n 2 = (d m − λn)2 .
Podemos então considerar n ′ = d m − λn , desde que asseguremos que se trata de um número positivo. O que efectivamente acontece pois, se multiplicarmos d m − λn por m (que é positivo), obtemos: m (d m − λn) = m 2 d − λm n = n 2 − λm n = n(n − λm ).
Temos que n é positivo e já vimos anteriormente que n − λm é também positivo. Assim, somos forçados a concluir que d m −λn é positivo, concluindo a demonstração. Designamos por números reais os cortes de racionais, denotando por R o respectivo conjunto. Apesar da forte analogia entre estes «números» e os pontos de 421
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
uma recta, ainda não descrevemos nem uma estrutura de ordem nem uma estrutura aritmética. Dedekind seria bem sucedido na definição de ambas. Usando a mesma analogia a que aludimos acima, e observando que dados dois pontos numa recta, A e B , se tem que A está à esquerda de B (usaremos a terminologia «à esquerda» em sentido lato) se e só se todos os pontos à esquerda de A estão também à esquerda de B , definimos (A 0 , A 1 ) ≤R (B 0 , B 1 ) se A 0 ⊂ B 0 .
No que diz respeito à estrutura aritmética, a adição de números reais é definida de acordo com o seguinte: (A 0 , A 1 ) +R (B 0 , B 1 ) := (C 0 ,C 1 ),
onde C 0 consiste de todos os racionais r que verificam: r ≤ a +b para certos a ∈ A 0 e b ∈ B 0 , e C 1 é simplesmente o complementar de C 0 em Q. Pode verificar-se que (C 0 ,C 1 ) é um corte de racionais, pelo que +R é uma operação binária em R que se designa por adição de números reais. Antes de definirmos a operação de multiplicação de reais, importa fazer algumas considerações acerca da relação entre Q e R. Cada número racional r ∈ Q produz, como já vimos antes, um corte que denotamos por [r ] e que é, [r ] := ({p ∈ Q | p ≤ r }, {p ∈ Q | r < p }).
É fácil constatar que, dados dois racionais r, s ∈ Q, se tem r ≤ s sse [r ] ≤R [s ]. Torna-se, pois, natural identificar r ∈ Q com [r ] ∈ R e, nesse sentido, dizer que os racionais são também reais, ou seja, Q ⊂ R. A naturalidade do acto é reforçada por um outro facto: dados dois racionais r, s ∈ Q, tem-se [r + s ] = [r ] +R [s ]. Ou seja, a adição de reais é uma extensão da adição racional, se procedermos à identificação que referimos antes. É fácil verificar que [0] é o elemento neutro de +R . Deixamos ao cuidado do leitor a verificação de que cada real α ∈ R possui um simétrico, que denotamos por (−α), e que satisfaz, portanto, a relação α +R (−α) = [0]. (No que segue, vamos passar a simplificar a notação e «r » designará indistintamente o racional r ∈ Q e o corte correspondente [r ].) Pode também demonstrar-se que +R é comutativa e associativa. Para completar a definição da estrutura aritmética dos reais, importa definir uma operação de multiplicação de números reais que estenda a correspondente operação nos racionais. 422
ANTÓNIO M. FERNANDES
Começamos por definir a operação para os reais não negativos, ou seja, reais α, β tais que α ≥ 0 e β ≥ 0. Neste caso, se α = (A 0 , A 1 ) e β = (B 0 , B 1 ), então α ×R β é o corte (C 0 ,C 1 ), onde C 1 consiste dos racionais maiores ou iguais que algum produto do tipo a × b onde a ∈ A 1 e b ∈ B 1 e C 0 é o complementar de C 1 em Q. Esta multiplicação de reais não negativos generaliza-se aos outros casos de acordo com (se α ≥ 0 e β < 0) α ×R (−β ) α ×R β =
(−α) ×R β (−α) ×R (−β )
(se β ≥ 0 e α < 0) (se α, β < 0).
Pode demonstrar-se que esta multiplicação é comutativa, associativa, distributiva relativamente a +R , qualquer real não nulo possui um inverso e 1 é o elemento neutro de ×R . Tem-se ainda que ×R estende a multiplicação dos racionais, no seguinte sentido: [r × s ] = [r ] ×R [s ]. Ou seja, a construção de Dedekind proporciona-nos um novo sistema numérico ordenado, que estende a estrutura dos racionais. Ao contrário dos números racionais, os números reais parecem, tal como o continuum de uma recta, não possuir lacunas. Isso deve-se ao facto de os reais possuírem uma propriedade particular denominada propriedade do supremo. Essa propriedade consiste no seguinte: dado um conjunto não vazio de reais X ⊂ R, se existe um número a ∈ R maior ou igual que qualquer elemento de X (um tal a diz-se um majorante de X ), então existe o menor dos números com esta propriedade (que se diz o supremo de X ). p Se considerarmos a sucessão de racionais que aproxima 2 por defeito: x 0 = 1;
x 1 = 1.4;
x 2 = 1.41;
x 3 = 1.414; · · ·
constatamos que essa sucessão estabiliza progressivamente, no sentido em que, a partir de certo momento, os seus termos não diferem mais que uma décima, a partir de outra não diferem mais que uma centésima, etc. Trata-se de uma sucessão que satisfaz a seguinte propriedade geral: «para qualquer ε > 0 podemos considerar p ∈ N de tal modo que dados m , n > p se tem |x n −x m | < ε». Tais sucessões, que se denominam sucessões de Cauchy, comportam-se como se se aproximassem continuamente de um certo valor, ou seja, como se convergissem. Mas isso não é geral verdade, por exemplo não é verdade nos racionais, e neste facto reside a natureza lacunar de Q e a sua incapacidade de descrever o continuum. No entanto, como consequência da propriedade do supremo, é verdade nos reais, o 423
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
que confirma a completude de R e a sua potencialidade para representar o continuum.
10.2 QUANTOS «INFINITOS» EXISTEM? A possibilidade de caracterizar aritmeticamente o continuum teve como propósito original permitir uma fundamentação mais rigorosa da análise. Mas a natureza particular da «construção» de Dedekind veio a ser decisiva para dar sentido à questão que dá título a este capítulo. Os reais obtêm-se como conjuntos de números racionais. Embora não o façamos aqui, pode mostrar-se que os racionais se podem «construir» a partir dos naturais usando apenas operações da teoria de conjuntos. Basicamente, um racional pode ser interpretado como um triplo ordenado de naturais (m , n, k ) que representa (m − n)/k . Por sua vez, os triplos ordenados podem ser definidos a partir dos pares ordenados da seguinte forma: (m , n , k ) = ((m , n), k ) e, um par ordenado é um conjunto, mais precisamente (m , n ) = {{m }, {m , n }} (de acordo com a definição de Wiener-Kuratowski). Como já vimos antes, os números naturais podem ser identificados com certos conjuntos. Desta forma tudo o que está envolvido na caracterização aritmética do continuum parece poder reduzir-se a uma única noção fundamental — a noção de conjunto. Foi precisamente usando esta noção que Georg Cantor (1845–1918) abordou a noção de infinito numa perspectiva matemática. Este tipo de procedimento já havia sido preconizado por Bernard Bolzano (1781–1848). Ele afirmou que a noção de infinito «só se pode conceber como uma propriedade dos conjuntos». Mas, se Bolzano não foi muito além da simples proclamação, já Cantor empreendeu o estudo sistemático da noção de infinito, vista desta perspectiva. É neste contexto que acaba por fundar a disciplina que viria a ser denominada teoria de conjuntos, que se revelaria uma teoria de alto valor fundacional. (Não é apenas a noção de continuum que se pode descrever em termos da noção de conjunto, mas sim a generalidade da matemática.) Cantor empreendeu então o estudo da noção de infinito, como já se disse, em termos da «quantidade» de elementos que cada conjunto possui. Trata-se de uma característica (a de serem infinitos) que certos conjuntos, como o conjunto dos números naturais, possuem. A abordagem de Cantor foi inteiramente livre, ou melhor, tanto quanto podia sê-lo, apenas condicionada pelo rigor lógico. Ao con-
424
ANTÓNIO M. FERNANDES
trário de Galileu, não hesitou comparar cardinalidades infinitas, porque soube distinguir contra-intuição de contradição. Para Cantor, dois conjuntos A, B têm a mesma cardinalidade (escrevemos |A| = |B |) se existe uma função bijectiva f : A → B . (Note-se que aquilo que a Galileu havia parecido o testemunho da incongruência da noção de infinito e uma evidência da sua inacessibilidade ao intelecto humano é agora usada por Cantor como uma ferramenta matemática.) A definição anterior pode ser ainda mais elaborada. Dizemos que a cardinalidade de um conjunto A é inferior ou igual à cardinalidade de um conjunto B (escrevemos |A| ≤ |B |) se existe uma aplicação injectiva f : A → B . (Admitindo o axioma da escolha4 , como acontece modernamente, a existência de uma função injectiva f : A → B é equivalente à existência de uma função sobrejectiva g : B → A .) Finalmente, dizemos que a cardinalidade de A é menor que a cardinalidade de B (escrevemos |A| < |B ) se se tiver que |A| ≤ |B | mas não se tiver |A| = |B |. Uma vez mais, se admitirmos o axioma da escolha, podemos mostrar que a cardinalidade de quaisquer dois conjuntos A e B é sempre comparável, ou seja, tem-se o resultado seguinte. Teorema 10.3 Dados dois conjuntos A e B , tem-se sempre, |A| = |B |
ou
|A| < |B |
ou
|B | < |A|.
Não requerendo o axioma da escolha, mas interessante em si mesmo, uma vez que estabelece que a relação |A| ≤ |B | corresponde ao que em matemática se designa por relação de ordem parcial, é o resultado seguinte. Teorema 10.4 Consideremos conjuntos A, B e C . Temos, 1. |A| ≤ |A|; 2. se |A| ≤ |B | e |B | ≤ |C | então, |A| ≤ |C |; 3. [Teorema de Cantor-Schröder-Bernstein].—se |A| ≤ |B | e |B | ≤ |A| então, |A| = |B |. Consideremos alguns exemplos concretos. Decorre das considerações de Galileu que |N| = |{n ∈ N | n é um quadrado perfeito}|. 4 O axioma da escolha é o princípio segundo o qual, dada uma família U de conjuntos não vazios, existe um função f com domínio U e tal que, para cada X ∈ U , se tem que f (X ) é um elemento de X (dizemos que f é uma função escolha para U ).
425
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
FIGURA 10.2 Equipotência de dois intervalos
Por outro lado, dois quaisquer segmentos de recta têm o mesmo número de pontos. Claro que um segmento de recta corresponde a um intervalo no conjunto dos números reais. Uma bijecção entre dois intervalos (não degenerados) ]a ,b [ e ]c , d [ pode ser dada através da recta que une os pontos de coordenadas (a , c ) e (b, d ) (ver figura 10.2) descrita analiticamente pela bijecção f :]a ,b [→]c , d [ definida pela expressão f (x ) =
d −c (x − a ) + c . b −a
De forma surpreendente existem tantos pontos num segmento de recta, por mais pequeno que seja, como em toda a recta. De facto, a restrição da função «tangente» a ] − π/2, π/2[ é uma bijecção, tg :] − π/2, π/2[→ R (figura 10.3). Deste e do resultado anterior podemos concluir que, dados dois números reais α < β , se tem |]α, β [| = |R|. Se nos perguntarem se existem mais números racionais que números naturais, a resposta parece clara: há mais racionais! Mesmo que se imponha naturalmente, esta resposta é falsa. Vejamos porquê. É, por um lado, óbvio que |N| ≤ |Q|; basta considerar a função injectiva f : N → Q definida por f (n) = n . Por outro lado, também se tem |Q| ≤ |N3 |, onde N3 representa o conjunto de todos os triplos
426
ANTÓNIO M. FERNANDES
−
FIGURA 10.3 Equipotência entre um intervalo e a recta
ordenados de números naturais. (A aplicação h : N3 → Q definida por
m −n k h(m , n, k ) = 0
(se k ̸= 0) (caso contrário)
é sobrejectiva (deixamos ao cuidado do leitor a verificação deste facto). Assim, para estabelecer a equicardinalidade de N e Q, basta estabelecer a equicardinalidade de N e N3 e, para isso, basta verificar que |N3 | ≤ |N|. Usando o teorema fundamental da aritmética (que estabelece a unicidade da decomposição de qualquer natural em factores primos), constata-se facilmente que a função f : N3 → N dada por (m , n, k ) 7→ 2m +1 3n+1 5k +1
é injectiva, o que permite estabelecer o resultado. (Deve-se observar que um argumento análogo permite mostrar que Nn , o conjunto de todos os n -úplos ordenados de naturais, tem a mesma cardinalidade do conjunto dos números naturais.) Se abandonarmos os naturais e considerarmos os reais, o fenómeno repete-se, ou seja, existem tantos pontos numa recta como num plano! 427
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
Depois de estabelecer que existem tantos pontos no interior do quadrado unitário ]0, 1[×]0, 1[ constituído pelos pares de reais (α, β ) satisfazendo 0 < α, β < 1 quanto em ]0, 1[, pode usar-se o facto de os intervalos terem todos o mesmo número de elementos em conjunção com a função (x , y ) 7→ (tg(x ), tg(y )) para demonstrar que o plano e a recta têm o mesmo número de pontos. Mostremos então que |]0, 1[×]0, 1[| = |]0, 1[|. Cada número real no intervalo ]0, 1[ possui aquilo que se designa por representação diádica, ou seja, tem-se: α0 α1 αn + 2 + · · · + n +1 + · · · 2 2 2
α=
(10.3)
onde αi ∈ {0, 1}, para cada i ∈ N. A igualdade 10.3 merece uma explicação adicional, na medida em que o seu lado direito consiste numa «soma» com um número infinito de parcelas. A partir de uma sucessão de números reais (βn ) podemos descrever uma ou∑n tra sucessão que denotamos por (s n ) e se define através do seguinte: s n = j =0 β j , ou seja, s 0 = β0 s 1 = β0 + β1 s 2 = β0 + β1 + β2
.. . s n = β0 + β1 + · · · + βn
.. . Muito naturalmente diremos que (s n ) é a sucessão das somas parciais da sucessão (βn ). Se (s n ) for convergente, ou seja, se existir um real β tal que β = lim s n , dizemos que β é a soma dos termos da sucessão (βn ) e escrevemos β = β0 + β1 + · · · + βn + · · · .
Nem toda a sucessão possui uma soma mas, em muitos casos de interesse, ela existe. Um desses casos envolve as denominadas progressões geométricas. Uma progressão geométrica é uma sucessão do tipo βn = β0 r n (β0 é o primeiro termo da sucessão e r é a razão da progressão). Neste caso tem-se: sn = =
428
β0 + β0 r + · · · + β0 r n = β0 (1 + r + · · · + r n ) = 1 − r n +1 β0 . 1−r
(10.4)
ANTÓNIO M. FERNANDES
FIGURA 10.4 Representação diádica
(O leitor deve observar que 1 + r + · · · + r n é o resultado de dividir o polinómio 1 − r n+1 por 1 − r , usando o algoritmo euclidiano de divisão de polinómios [ou a regra de Ruffini].) No caso de se ter |r | < 1, resulta facilmente que se tem lim s n = β0 /(1 − r ), que é um número real. Conclui-se assim que β0 + β0 r + β0 r 2 + · · · =
β0 . 1−r
No caso particular das representações diádicas, está em causa a progressão geométrica de primeiro termo e razão iguais a 1/2. Pelo que acabámos de expor, tem-se: 1 1 1 + + + ··· = 2 22 23
1 2
= 1. 1 2 Daqui decorre que, se para cada i ∈ N se tem αi ∈ {0, 1}, então αn α0 α1 + 2 + · · · + n+1 + · · · ≤ 1. 0≤ 2 2 2 1−
Pode agora verificar-se que qualquer α ∈]0, 1[ pode ser escrito naquela forma. Fornecemos alguma heurística, mas não iremos aqui produzir um argumento rigoroso. Observe-se a figura 10.4. Consideramos o primeiro elemento da progressão que mencionámos anteriormente, ou seja, consideramos o valor 1/2. Se α = 1/2, então α0 = 1 e todos os αi com i > 0 são nulos. Caso contrário, definimos
α1 =
1 0
(se α > 1/2) (se α < 1/2).
Supondo que α0 , . . . , αn já se encontram definidos, então se α coincidir com Kn =
α0 α1 αn + 2 + · · · + n+1 2 2 2 429
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
definem-se todos os αi com i > n como sendo nulos. Caso contrário, define-se αn +1 como sendo 0 se α < K n +1/2n +2 e 1 se α > K n +1/2n+2 . Como é fácil constatar, a diferença entre K n e α tende para zero, pelo que α=
α0 α1 αn + 2 + · · · + n +1 + · · · . 2 2 2
(As representações anteriores são essencialmente únicas. Em rigor certos números possuem duas representações, mas procederemos como se isso não acontecesse pois isso liberta a exposição de detalhes técnicos que tendem a mascarar a essência do argumento.) Estamos finalmente em condições de poder estabelecer que os conjuntos ]0, 1[×]0, 1[ e ]0, 1[ têm a mesma cardinalidade. Basta mostrar que |]0, 1[×]0, 1[| ≤ |]0, 1[|. Consideremos a aplicação θ :]0, 1[→]0, 1[×]0, 1[ definida de acordo com o seguinte: se α0 α1 α2n α2n +1 + 2 + · · · + 2n+1 + 2n+2 + · · · 2 2 2 2
é a representação diádica de α ∈]0, 1[, então θ (α) é o par (γ, δ) = (
α2n α1 α3 α2n +1 α0 α2 + 2 + · · · + n +1 + · · · , + 2 + · · · + n+1 + · · · ). 2 2 2 2 2 2
É fácil verificar que θ é sobrejectiva, estabelecendo o resultado. A teoria até aqui descrita poderia, como os exemplos mencionados sugerem, ser trivial no sentido em que, embora comparáveis todas as cardinalidades dos conjuntos infinitos, elas fossem iguais. Nada do que foi exposto contradiz esta ideia. Isso não sucede e a teoria de Cantor é, de facto, uma teoria substancial, estabelecendo a existência de infinitos sucessivamente maiores. Vimos atrás que existem tantos números naturais quantos os racionais. Iremos agora ver que existem mais números reais que números naturais. Suponhamos que existe uma aplicação sobrejectiva θ : N →]0, 1[. Como existe uma bijecção entre ]0, 1[ e o conjunto D das representações diádicas dos α∈]0, 1[, basta mostrar que não existe nenhuma função sobrejectiva θ : N → D. Note-se que uma representação diádica é essencialmente uma sucessão (αn ) em que, para cada n ∈ N, se tem αn ∈ {0, 1}. Tendo estas considerações em mente, supondo que θ como acima existe, os elementos de D podem dispor-se numa matriz (infinita) como a
430
ANTÓNIO M. FERNANDES
seguinte (onde a linha n representa θ (n)), α00
α01
α02
α10
α11
α12
.. .
.. .
.. .
αn0
αn1
αn2
.. .
.. .
.. .
···
α0n
···
···
α1n
···
αnn
···
.. .
···
.. .
Consideremos agora a sucessão (βn ) definida do seguinte modo: βn = 1 − αnn ,
para cada n ∈ N. É claro que, por construção, se tem (βn ) ∈ D e que (βn ) é diferente de todos as linhas da matriz acima que, supostamente deveriam esgotar todos os elementos de D, originando assim uma contradição. Uma função sobrejectiva θ : N → D não pode, pois, existir. O argumento anterior é conhecido como argumento de diagonalização de Cantor e pode aplicar-se de modo a produzir um resultado mais geral. Teorema 10.5 Para qualquer conjunto A , tem-se |A| < |P (A)|. No enunciado anterior, P (A) denota o conjunto das partes de A . Um conjunto B é uma parte, ou um subconjunto, de A (escreve-se B ⊂ A ) se todo o elemento de B for elemento de A . Assim P (A) = {B | B ⊂ A}. Observe-se que o teorema 10.5 determina a existência de uma sequência de cardinalidades sucessivamente maiores: |A| < |P (A)| < |P (P (A))| < · · ·
Como se mencionou, a demonstração do teorema 10.5 envolve um argumento de diagonalização. Suponhamos que |P (A)| ≤ |A|, ao contrário do que diz o enunciado do teorema. Neste caso existe uma aplicação sobrejectiva θ : A → P (A). (Note-se que θ (a ) é um subconjunto de A , para cada a ∈ A .) Consideremos então o seguinte subconjunto de A , Γ = {a ∈ A | a ∈ / θ (a )}.
Como Γ ⊂ A e θ é sobrejectiva podemos considerar b ∈ A tal que θ (b ) = Γ. Daqui resulta, b ∈Γ⇔b ∈ / θ (b ) ⇔ b ∈ / Γ, 431
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
uma vez que θ (b ) e Γ são o mesmo conjunto. Obtemos assim uma contradição, pelo que o enunciado do teorema 10.5 tem de ser verdadeiro.
10.3 CONTANDO OS PONTOS DE UMA RECTA O leitor reconhecerá sem dificuldade que, com o trabalho de Cantor descrito na secção precedente, se produziu um avanço conceptual importante. Mas comparar cardinalidades não é ainda «contar» os elementos dos conjuntos infinitos. Em todo o caso, se considerarmos o caso finito, constatamos que «contar» é comparar com um padrão. O número natural n não é mais que um conjunto que é o representante canónico de todos os conjuntos com n elementos. Assim sendo, para que possamos «contar» os elementos de um conjunto infinito, apenas necessitamos de um análogo transfinito dos números naturais. Cantor desenvolveu as suas ideias ao ponto de fornecer esses representantes canónicos para cada cardinalidade. Trata-se de um tipo especial de conjuntos denominados cardinais. Estes, por sua vez, são casos particulares de um tipo de objecto que desempenha um papel estrutural relevante na teoria de conjuntos — os ordinais. Os ordinais podem ordenar-se totalmente através da relação de pertença, ou seja, dados dois ordinais α e β tem-se sempre: α ∈ β ou β ∈ α ou α = β .
Os números naturais, que são ordinais, constituem um segmento inicial dessa ordem total (são os ordinais finitos). O conjunto N é igualmente um ordinal e é o primeiro ordinal infinito (neste contexto denota-se por ω). A sequência dos ordinais não termina em ω. Definindo S(A) = A ∪ {A} (S(A) é o sucessor do conjunto A ), obtemos a partir de cada ordinal um ordinal diferente (o seu sucessor). Deste modo, podemos continuar transfinitamente a sequência de ordinais, obtendo-se uma sequência cuja parte inicial se descreve abaixo, 0 < 1 < 2 < · · · < ω < S(ω) < S(S(ω)) < · · · .
Como já se disse, os cardinais são casos particulares de ordinais: são aqueles ordinais que não podem ser colocados em correspondência bijectiva com outros que os precedem na ordem que acabámos de descrever. Todos os ordinais finitos são cardinais e o mesmo sucede com ω. No entanto, S(ω) não é um cardinal — uma bijecção entre S(ω) = ω∪{ω} e ω pode ser descrita fazendo ω 7→ 0 e n 7→ n +1 (para cada n ∈ ω). 432
ANTÓNIO M. FERNANDES
Pode demonstrar-se (usando o axioma da escolha) que, dado um qualquer conjunto A , existem sempre um cardinal κ e uma bijecção θ : A → κ. Neste sentido, e por analogia com o caso finito, dizemos que A tem κ elementos e escrevemos |A| = κ (se κ é um cardinal, tem-se que |κ| = κ). É neste preciso sentido que podemos perguntar «quantos pontos tem uma recta?» ou, se se quiser, «qual é a cardinalidade do conjunto dos números reais?»
10.4 EPÍLOGO (OU QUASE) Os cardinais, que, como se referiu anteriormente, são casos particulares de ordinais, formam uma sequência transfinita iniciada pelos números naturais (que são cardinais) e por ω. O primeiro cardinal infinito ω também se denota ℵ0 . A sequência constituída pelos primeiros cardinais tem então o seguinte aspecto: 0 < 1 < 2 < · · · < ℵ0 .
Mas a «sequência» dos cardinais nunca termina, ℵ1 denota o menor cardinal que é maior que ℵ0 , depois, ℵ2 denota o menor dos cardinais que é maior que ℵ1 , e assim sucesivamente, permitindo avançar mais na sequência acima, para obter 0 < 1 < 2 < · · · < ℵ0 < ℵ1 < ℵ2 < · · · < ℵn < · · · .
O menor cardinal que é maior que todos os ℵn com n < ω denota-se por ℵω . E, usando a operação de sucessor, podemos continuar ainda mais a sequência, obtendo sucessivamente ℵS(ω) < ℵS(S(ω)) < ℵS(S(S(ω))) < · · · . A parte inicial da estrutura dos cardinais pode então ser descrita de acordo com 0 < 1 < · · · < ℵ0 < ℵ1 < · · · < ℵω < ℵω+1 < · · · < ℵω+ω < · · · ,
(10.5)
onde ω + 1 denota S(ω), ω + 2 denota S(S(ω)), etc. e ℵω+ω denota o menor cardinal que é maior que todos os ℵω+n com n ∈ ω. Pelas considerações anteriores existe um cardinal c tal que |R| = c, pelo que a questão que motiva este artigo pode ser traduzida em: c = ℵ? . A matemática é hoje um domínio do conhecimento altamente sofisticado onde se descrevem estruturas extremamente complexas. O conjunto dos números reais não é, à primeira vista, um representante dessa extrema complexidade. Seria pois de esperar que uma teoria como a teoria de conjuntos, que é suficientemente poderosa para formalizar a matemática, pudesse decidir a questão c = ℵ? . 433
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
Já vimos que |R| > ℵ0 = |N|. Cantor acreditou que se poderia demonstrar que não existem cardinalidades intermédias entre c e ℵ0 , o que corresponde a considerar c = ℵ1 . É claro que 2ℵ0 que é o cardinal do conjunto das funções f : N → 2 = {0, 1} (que pode ser visto como o conjunto das representações diádicas dos reais no intervalo ]0, 1[), coincide com c. Mas isto não resolve a questão original, apenas permite escrevê-la de outra forma, ou seja: 2ℵ0 = ℵ? . A convicção de Cantor consubstancia a denominada hipótese do contínuo (HC), ou seja, 2ℵ0 = ℵ1 . Ele dedicou enormes esforços tentando demonstrar ou refutar esta conjectura. Por várias vezes chegou a anunciar tê-la demonstrado mas, invariavelmente, descobria algum erro nas suas deduções. Em 1884, numa carta enviada a Mittag Leffler(1846–1927)5 , ele refere ter encontrado «uma demonstração rigorosa» de que o continuum não tem a cardinalidade ℵ1 (ou seja HC seria falsa). Contudo, passado um dia depois desta declaração, Cantor voltou a escrever a Mittag-Leffler dando conta da descoberta de um erro na sua «prova» e da sua intenção de voltar a estabelecer a veracidade da hipótese do contínuo. A ideia de Cantor consistia em demonstrar que, dado um subconjunto X ⊂ R, se tem |X | ≤ |N| ou |X | = |R|, ou seja, que não existem cardinalidades intermédias entre |N| e |R|. Deste modo |R| teria que ser o primeiro cardinal maior que ℵ0 . Cantor foi assim conduzido a uma tentativa de caracterizar a estrutura dos conjuntos de reais. A sua abordagem levou-o a considerar caracterizações topológicas. Uma noção básica, neste contexto, é a de conjunto aberto. Um subconjunto X ⊂ R é aberto se, dado um elemento a ∈ X , podemos considerar um real ε > 0 tal que ]a −ε, a +ε[⊂ X . O intervalo aberto ]a −ε, a +ε[ também se designa vizinhança aberta de a com raio ε e denota-se por Vε (a ). Um subconjunto X ⊂ R diz-se fechado se o seu complementar em R for aberto. 5 Gösta Mittag-Lefer fez inúmeras contribuições para a análise matemática. O seu trabalho mais conhecido, que culminou no denominado «Teorema de Mittag-Lefer», diz respeito à representação analítica de funções de uma variável. Num artigo que publicou em 1884 na revista Acta Mathematica, Mittag-Lefer propõe várias noções topológicas associadas a conjuntos innitos, baseadas no trabalho de Cantor em teoria de conjuntos. A este propósito deve referir-se que Mittag-Lefer foi dos primeiros matemáticos a dar crédito ao trabalho de Cantor (juntamente com Dedekind e Hilbert), não sem consequências, uma vez que as ideias cantorianas acerca do transnito eram controversas e, devido ao apoio de Mittag-Lefer a Cantor, publicando os seus trabalhos na revista Acta Mathematica, importantes matemáticos como Leopold Kronecker recusaram-se a publicar nessa revista. A revista Acta Mathematica foi fundada em 1882 por Mittag-Lefer, que possuía recursos nanceiros sucientes para a manter. Mas o sucesso da revista não se deveu apenas à sua saúde nanceira, o facto é que importantes matemáticos contribuíram, com os seus artigos, para o seu grande sucesso. 434
ANTÓNIO M. FERNANDES
∅
FIGURA 10.5 Embebendo as sucessões binárias num conjunto perfeito
Por outro lado, um ponto de acumulação de um conjunto X ⊂ R é um real a tal que, para qualquer ε > 0, a vizinhança Vε (a ) contém pontos de X diferentes de a . Se a ∈ X não for um ponto de acumulação de X , diz-se um ponto isolado de X . Definição 10.2 Um subconjunto P ⊂ R diz-se perfeito se é fechado e não tem pontos isolados. Nem todo o conjunto fechado é perfeito (por exemplo, {0} é fechado e não é perfeito, uma vez que 0 é um ponto isolado). Mas todo o conjunto fechado de cardinalidade superior a ℵ0 é da forma P ∪S onde P é perfeito e |S| ≤ ℵ0 (Teorema de Cantor-Bendixon). Teorema 10.6 Se P é um conjunto perfeito, então |P| = |R|. De modo a estabelecer este resultado, descrevemos uma aplicação injectiva entre o conjunto das sucessões binárias (u n ) (ou seja, tais que para todo o n ∈ N se tem u n ∈ {0, 1}) que, como vimos antes, tem a cardinalidade do continuum, e o conjunto P . Daremos apenas uma ideia da demonstração, omitindo detalhes e aspectos técnicos, concentrando-nos na ideia fundamental. De um modo geral, dado um conjunto perfeito P , podemos associar a cada sequência binária finita σ um conjunto perfeito I σ de tal modo que (1) I σ0 ∪I σ1 ⊂ I σ ; (2) I σ0 ∩I σ1 = ; e; (3) para quaisquer x , y ∈ I σ , se ∥σ∥ ≥ 1 tem-se |x −y | < 1/∥σ∥ (figura 10.5). (Aqui estamos a denotar por σ0 e σ1 as sequências binárias que prolongam σ pela junção de um «0» ou um «1», respectivamente.) A função injectiva pode então definir-se através de: (u n ) 7→ x u , onde x u é o único elemento da intersecção ∩k ∈N I 〈u o ,u 1 ,...,u k 〉 . (Pode demonstrar-se que a intersecção anterior só tem um elemento, pois a «distância» dos elementos em I σ tende para zero à medida que o comprimento da sequência σ aumenta.) 435
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
Estas considerações permitem-nos explicar por que razão a hipótese do contínuo se impôs tão fortemente a Cantor. Não é difícil observar que a maior parte dos conjuntos considerados na prática da análise matemática ou são contáveis, isto é possuem cardinalidade não superior à dos naturais, ou são intervalos, ou se obtêm de um destes dois tipos usando as operações comuns na teoria de conjuntos, como são as uniões, as intersecções ou a passagem ao complementar. Assim, se procuramos conjuntos de algum modo «relevantes» na prática dessa análise, temos de procurar conjuntos que fazem parte de um certo «universo» de subconjuntos de R que é fechado para a realização daquelas operações e contém os objectos básicos mencionados. Em termos abstractos, esse «universo» possui a estrutura daquilo que se designa por σ-álgebra de conjuntos. Definição 10.3 Uma família A de subconjuntos de R diz-se uma σ-álgebra se A ̸= ; e, (1) se A, B ∈ A então, A ∩ B ∈ A ; (2) se A, B ∈ A então, A ∪ B ∈ A e; (3) se A ∈ A então, R \ A ∈ A ;6 além disso, (4) se {A n | n ∈ N} ⊂ A então ∩ n ∈N
An ∈ A
e
∪
An ∈ A .
n∈N
Recorrendo a esta noção podemos caracterizar mais precisamente o «universo» a que anteriormente aludimos — trata-se da menor σ-álgebra de subconjuntos de R que contém o conjuntos abertos. Essa σ-álgebra é conhecida como álgebra dos conjuntos borelianos. Podemos também agora ter uma noção mais exacta da razão que levou Cantor a considerar a hipótese do contínuo como um teorema que podia ser demonstrado. A razão é que entre os borelianos não se pode encontrar nenhum contra-exemplo para a hipótese do contínuo, porque qualquer destes conjuntos ou é contável ou contém um subconjunto perfeito. Isto mostra que um eventual contra-exemplo escaparia à prática matemática corrente e seria, de certa forma, «pouco natural». Os borelianos são conjuntos «simples», no sentido em que cada um possui uma espécie de história, que é neste caso uma sequência de operações que descreve como cada boreliano se obtém a partir dos conjuntos abertos. Em 1939, Kurt Gödel (1906–1978) demonstrou que HC é consistente relativamente aos axiomas da teoria de conjuntos. Este resultado é do mesmo tipo daqueles que estabelecem a consistência da negação do axioma das paralelas atra6 Denotamos por R \ A o complementar de A em R, isto é, o conjuntos dos reais que não são elementos de A . 436
ANTÓNIO M. FERNANDES
vés da exibição de geometrias não-euclidianas. Como é que sabemos que o axioma das paralelas não se pode demonstrar a partir dos restantes axiomas da geometria euclidiana? Uma demonstração pode ser vista como uma sequência finita de sentenças, digamos σ1 , σ2 , . . . , σn , onde cada σi ou é um axioma, ou uma asserção logicamente válida (isto é, verdadeira em quaisquer circunstâncias), ou então que se obtém a partir das sentenças anteriores — σ1 , . . . , σi −1 — usando algum tipo de inferência logicamente válida, por exemplo, a regra de modus ponens que corresponde a inferir a sentença θ a partir das sentenças φ e «se φ então θ ». A sequência anterior diz-se uma demonstração de qualquer uma das sentenças σi que nela ocorrem. Dizemos que σ é demonstrável a partir de um certo conjunto de axiomas, se existe uma demonstração onde ela ocorre. Embora as demonstrações propaguem a verdade, ou seja, a verdade dos axiomas se transmita às sentenças demonstradas, a noção de verdade não tem qualquer intervenção na demonstração, que é uma operação essencialmente sintáctica. Paralelamente, podemos associar a conjuntos de axiomas estruturas que os interpretam, ou seja, no qual os axiomas são verdadeiros. Tais estruturas dizem-se modelos da axiomática. (Os axiomas da geometria euclidiana plana são verdadeiros se interpretarmos «ponto» como um par ordenado (x , y ) de números reais e «recta» como um conjunto de tais pares que satisfaçam equações da forma a x + b y + c = 0 (onde a e b não são simultaneamente nulos). Por outro lado, os números naturais, com a ordem usual e as operações de adição e multiplicação usuais, constituem um modelo dos axiomas de Peano para a aritmética.) A relação entre demonstrações e modelos é a seguinte: se θ se demonstra a partir de um conjunto de axiomas σ1 , . . . , σn , então θ é verdadeira em qualquer modelo de σ1 , . . . , σn . Reciprocamente, graças ao Metateorema da Completude Semântica, demonstrado por Gödel, sabemos também que se uma sentença é verdadeira em todos os modelos de uma dada axiomática, então é demonstrável nessa axiomática. Se Γ é um conjunto de sentenças (uma axiomática) e se θ é uma sentença, escrevemos Γ ⊢ θ para indicar que existe uma demonstração de θ com hipóteses em Γ (isto é, usando os axiomas de Γ). Se, por outro lado, M é uma estrutura onde, uma vez interpretada, a sentença θ se revela verdadeira, escrevemos M |= θ para indicar esse facto. (Se para qualquer sentença θ em Γ se tem M |= θ , escrevemos M |= Γ.) Finalmente, se σ é uma sentença e Γ é uma axiomática e se para qualquer
437
QUANTOS PONTOS EXISTEM NUMA LINHA RECTA?
FIGURA 10.6 O disco de Beltrami-Klein
estrutura M se tiver que M |= Γ implica M |= σ, então escrevemos Γ |= σ e dizemos que σ é consequência semântica de Γ. Metateorema da Completude Semântica (Gödel) Se Γ é uma axiomática e σ é uma sentença, tem-se Γ ⊢ σ sse Γ |= σ. (10.6) Este resultado fornece um método para estabelecer a não-demonstrabilidade de certos princípios relativamente a uma axiomática, procedendo de forma indirecta, através da exibição de interpretações (ou, como também se diz, de «modelos») convenientes. Fixando uma vez mais uma axiomática Γ e uma sentença σ, se pudermos exibir um modelo M para o qual se tenha M |= Γ mas M ̸|= σ então, tendo em conta as considerações anteriores, não se tem Γ |= σ pelo que, em consequência do metateorema, também não se tem Γ ⊢ σ, estabelecendo assim a não-demonstrabilidade de σ na axiomática Γ. Tendo em conta que dados um modelo M e uma sentença σ se tem que ou M |= σ ou M |= ¬σ, então constata-se facilmente o seguinte: se existem modelos M 1 e M 2 , tais que M 1 , M 2 |= Γ, M 1 |= σ e M 2 |= ¬σ, então podemos concluir que σ é independente de Γ. No caso do axioma das paralelas podem considerar-se certos modelos que permitem mostrar que o axioma em causa não pode ser demonstrado a partir dos restantes. Um desses modelos é, por exemplo, o disco de Beltrami-Klein (figura 10.6). Nesse modelo, interpretamos «ponto», como ponto interior ao cír-
438
ANTÓNIO M. FERNANDES
culo e «recta» como corda da circunferência que limita o circulo. Pode verificar-se que, com esta interpretação, são verdadeiros os axiomas da geometria euclidiana plana, excepto o axioma das paralelas que é (obviamente) falso neste modelo. De facto, por um ponto exterior a uma recta, podemos fazer passar inúmeras outras rectas que não a intersectam. De modo a ilustrar o fenómeno da independência, recorremos a um exemplo não-geométrico. Denotamos por AR o conjunto de sentenças que descrevemos abaixo e que designaremos por Aritmética de Robinson. Os axiomas descrevem-se numa linguagem (formal) que contém, para além do símbolo de igualdade, os seguintes símbolos 0, 3 × 10 .. .
9 , logo S 999...9 > m × 10
ou seja, a subsucessão (S 999...9 )m ∈N , em que o índice de S tem m dígitos iguais a 9, não é majorada e, portanto, a sucessão (S n )n ∈N também não é. (II) Outro argumento:
S2 = 1 + 452
1 2
MARIA PIRES DE CARVALHO
1 1 1 1 1 1 1 3 + + > + + + = 2 3 4 2 2 4 4 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 4 S8 = 1 + + + + + + + > + + + + + + + = 2 3 4 5 6 7 8 2 2 4 4 8 8 8 8 2 S4 = 1 +
.. . 1 1 1 1 + + + ··· + k > 2 3 4 2 1 1 k +1 1 1 1 1 1 1 1 1 1 > + + + + ··· + + + · · · + = + + + + 2 2 4 4 8 8 8 8 2 2k 2k 2k
S 2k = 1 +
de onde resulta que a subsucessão (S 2k )k ∈N não é majorada.
Esta série diverge lentamente e o carácter simples do seu termo geral permite-nos ter uma estimativa desta baixa velocidade. Por exemplo, é preciso somar mais de 1043 termos para que a soma parcial ultrapasse 100. E, se k n designa, para cada natural n , o mínimo do conjunto {j ∈ N : S j ≥ n}, então lim
n →+∞
k n +1 =e kn
o que, sendo o limite maior que 1, indica que a sucessão (k n )n∈N cresce exponencialmente. De facto, (i) lim k n = +∞ pela divergência da série. n→+∞ (ii) S k n − n ≥ 0 por definição de k n . (iii) S k n − n < k1n , caso contrário, teríamos S k n − k1n ≥ n , ou seja, S k n −1 ≥ n , contrariando a minimalidade de k n . (iv) E, portanto, lim S k n − n = 0.
n →+∞
(v) Como a sucessão S k n − ln(k n )
n ∈N
é monótona decrescente e minorada (e
convergente para o número de Euler γ), a sucessão n − ln(k n ) converge para γ uma vez que
n ∈N
também
n − ln(k n ) = (n − S k n ) + [S k n − ln(k n )].
(vi) Logo, a sucessão de termo geral [n + 1 − ln(k n+1 )] − [n − ln(k n )] = 1 − ln
k n +1 kn
453
QUADRATURA ARITMÉTICA DO CÍRCULO
converge para 0, isto é, ln
k n+1 kn
n ∈N
k n +1 kn
n ∈N
tende para 1, o que significa que
tende para e .
Nada disto, contudo, impede a série harmónica de ter até certa robustez no seu carácter divergente. Por exemplo, fixado m ≥ 2, a série ∑
=1+
x
1 1 x 1 1 x + ··· + + + + ··· + + + ··· 2 m −1 m m +1 2m − 1 2m
não pode convergir para mais do que um valor real de x . Porque se Tn (x ) designa ∑ a soma parcial de x de ordem n m , com n ≥ m , Tn (x ) = 1 +
1 1 x 1 1 x x + ··· + + + + ··· + + + ··· + 2 m −1 m m +1 2m − 1 2m nm ∑ ∑
e se, sendo a ̸= b , as séries
a
e
b
convergissem, então, como a −b ∑ 1 × , m k 1 n
Tn (a ) − Tn (b ) =
a série harmónica convergiria.
11.3.2 VANTAGENS DA DIVERGÊNCIA A divergência da série harmónica tem outros usos para além de ser uma armadilha instrutiva para quem se inicia neste assunto confiando demasiado na intuição, que naturalmente se alimenta de cenários finitos. Os próximos parágrafos exploram esta propriedade desta série especial.
11.3.3 ESCRITA EGÍPCIA DE FRACÇÕES O papiro egípcio de Rhind (nome do escocês que, em 1858, comprou parte dele em Luxor) é um documento fragmentado de 1700 a.C., que está em exposição no British Museum desde que foi completado com os pedaços na posse de um coleccionador americano. É bastante extenso, está escrito em linguagem cursiva e é apresentado pelo escriba como cópia de um documento anterior, mas, segundo [Wilson, 1995], não é claro a que público se dirigia, se era um manual ou uma lição para meninos da escola. Contém problemas matemáticos elementares resolvidos habilmente com fracções. A aritmética do texto é essencialmente aditiva e o que primeiro chama a atenção é uma tabela com a divisão de 2 pelos naturais ímpares de 3 a 101. Cada fracção aparece escrita como soma de um número 454
MARIA PIRES DE CARVALHO
finito de termos distintos da série harmónica, com excepção de 2/3 a que é atribuído símbolo especial (embora seja também uma soma deste tipo, 1/2 + 1/6): 2 1 1 = + 5 3 15 2 1 1 = + 7 4 28 2 1 1 = + 9 5 45
.. . 2 1 1 = + 101 51 5151
Podemos hoje dizer mais. Nenhuma soma 1 + 1/2 + 1/3 + · · · + 1/k , com k ≥ 2, dá um número natural (caro leitor: não tente provar isto por indução; use um argumento directo, reduzindo esta soma a uma fracção com um mesmo denominador e verificando, em cada parcela do numerador, qual a potência do primo 2; ou consulte [Larson, 1983]). Porém, todo o número racional positivo se pode exprimir como soma finita de fracções unitárias (isto é, de elementos da sucessão 1/k k ∈N ) distintas, d11 + · · · + d1n , onde 1 ≤ d 1 < d 2 < · · · < d n e n dependem do racional. Comecemos por verificar esta propriedade para, por exemplo, o racional 27/31. Este número é maior que 1/2, e 1/2 é o primeiro termo da sucessão (1/k ) k ∈N que 27/31 ultrapassa. A diferença 27/31 − 1/2 é igual a 23/62, que é maior que 1/3, sendo este o primeiro termo da sucessão (1/k )k ∈N que 23/62 ultrapassa. A diferença 23/62 − 1/3 é igual a 7/186, que é maior que 1/27 e difere deste por 1/1674. Deste modo, 27/31 = 1/2 + 1/3 + 1/27 + 1/1674. Note-se que os numeradores das diferenças sucessivas que efectuámos diminuíram estritamente (23 > 7 > 1), o que obriga o processo anterior a parar ao fim de um número finito de etapas. Em geral, se 0 < r ≤ 1 é um racional, dado por fracção irredutível p/q (p e q são naturais primos entre si), então: (i) Ou existe natural n tal que r = 1/n , e está encontrada uma escrita com uma «fracção egípcia». Por exemplo, o racional 1 tem esta escrita óbvia, mas tem pelo menos mais uma, pois 1 = 1/2 + 1/3 + 1/6. (ii) Ou não existe um tal n , e então (porque a sucessão (1/k )k ∈N tem limite zero quando k tende para +∞) existe natural m (único de facto, igual ao maior inteiro menor ou igual a 1/r que, como r < 1, é maior ou igual a 1) tal que 1 < r < m1 . Como no exemplo, calculemos r − m1+1 . Obtemos m +1 455
QUADRATURA ARITMÉTICA DO CÍRCULO
r−
1 p 1 (m + 1) p − q = − = , m +1 q m +1 q (m + 1)
sendo (m + 1) p − q < p , uma vez que pq < m1 ; e 1 ≤ (m + 1) p − q já que (m + 1) p − q > 0 e é um inteiro. Além disso, se (m + 1) p − q ̸= 1, então a fracção (m +1) p −q não está em ] m1+1 , m1 [, porque q (m +1) m ≥1⇒
2 1 ≥ m +1 m
e r
1. Como a série harmónica diverge, existe um natural k tal que a soma parcial desta série de ordem k Sk = 1 +
1 1 1 + + ··· + 2 3 k
é maior que r . Seja N o menor valor que um tal k pode tomar. Note-se que, como r > 1, k é pelo menos 2; além disso, pela minimalidade de N , S N −1 = 1 +
456
1 1 1 1 1 1 + + ··· + ≤ r < SN = 1 + + + · · · + . 2 3 N −1 2 3 N
MARIA PIRES DE CARVALHO
Ora, se 1 + 1/2 + 1/3 + · · · + 1/(N − 1) = r , está encontrada uma escrita como queríamos em fracções unitárias distintas. Caso contrário, se S N −1 < r < S N , consideremos T = r − S N −1 , que está no intervalo ]0, 1[. Como já vimos, T admite escrita como soma finita de fracções unitárias distintas, digamos T = a11 +· · ·+ a1m ; e, portanto, r = S N −1 + T = 1 +
1 1 1 1 1 + + ··· + + + ··· + 2 3 N −1 a1 am
sendo que, como T = r − S N −1 < S N − S N −1 = ser maiores ou iguais a N + 1.
1 N
, os naturais a 1 , a 2 , . . ., a m têm de
Dado racional r , o número de fracções egípcias distintas necessário para o exprimir depende de r de um modo não trivial. Em particular, dado n , não é verdade que todo o racional tenha representação como soma finita de n fracções egípcias distintas (por exemplo, com uma conta elementar pode confirmar-se que 1 não é soma de exactamente duas fracções egípcias distintas). Mais: para cada n , existe um real c n < 1 tal que nenhuma soma de n fracções egípcias distintas está no intervalo ]c n , 1[. Sigamos o argumento de P. Erdös para provar esta afirmação, lido em [Andreescu, Savchev, 2003]. Procuremos saber quão perto de 1 podemos chegar, somando exactamente n fracções egípcias. Consideremos a sucessão definida por recorrência pelas condições u1 = 2 u n = u 1 u 2 . . . u n−1 + 1, para n = 2, 3, . . . .
Provemos que, para cada natural n , a soma das n fracções 1 1 1 + + ··· + u1 u2 un
é a que chega mais perto de 1. Mais precisamente, se x 1 , x 2 , . . ., x n são naturais tais que x11 + x12 + · · · + x1n < 1, então 1 1 1 1 1 1 + + ··· + ≤ + + ··· + . x1 x2 xn u1 u2 un
1 x2
Simplifiquemos a notação: para i = 1, 2, . . . , n , designemos por X i a soma x11 + + · · · + x1 e por Ui a soma u1 + u1 + · · · + u1 . Prossigamos por indução em n . Para i 1 2 i 457
QUADRATURA ARITMÉTICA DO CÍRCULO
n = 1 esta afirmação é óbvia: se
1 x1
< 1, então x 1 ≥ 2 e, portanto, x 1 ≥ u 1 , daí que ≤ Suponhamos agora que, para um natural n fixado, esta afirmação é válida para k = 1, 2, . . . , n − 1 e consideremos n naturais x 1 , x 2 , . . ., x n tais que X n = x1 + x1 + · · · + x1 < 1. Queremos provar que X n ≤ Un . 1 2 n Podemos supor que x 1 ≤ x 2 ≤ · · · ≤ x n , reordenando as parcelas da soma se necessário. Como x 1 x 2 . . . x n X n é um inteiro e menor que x 1 x 2 . . . x n , temos 1 x1
1 . u1
x 1x 2 . . . x n X n ≤ x 1x 2 . . . x n − 1
ou seja, Xn ≤ 1 −
1 . x 1x 2 . . . x n
Suponhamos, por absurdo, que X n > Un . Esta hipótese, combinada com a desigualdade anterior e o facto de que Un =
1 1 1 1 + + ··· + =1− , u1 u2 un u 1u 2 . . . u n
permite-nos concluir que x 1x 2 . . . x n > u 1u 2 . . . u n .
Por outro lado, sendo X i < 1 para todo o i = 1, 2, . . . , n −1 (uma vez que cada X i é menor que X n e este é menor que 1), podemos aplicar a cada um a hipótese de indução e concluir que X 1 ≤ U1 , X 2 ≤ U2 ,. . ., X n−1 ≤ Un −1 . Então, reunindo a informação já obtida, deduzimos que n n −1 ∑ xi ∑ = Ui (x i − x i +1 ) + Un x n ui i =1 i =1
≤
n −1 ∑
X i (x i − x i +1 ) + Un x n
i =1
< =
n −1 ∑ i =1 n ∑ i =1
X i (x i − x i +1 ) + X n x n xi = n. xi
Além disso, pela desigualdade entre as médias aritmética e geométrica dos n números positivos ux ii , temos 458
MARIA PIRES DE CARVALHO
Ç n ∑ xi x 1x 2 . . . x n ≥n n u u i 1u 2 . . . u n i =1
e, portanto, n>
Ç n ∑ xi x 1x 2 . . . x n ≥n n u u i 1u 2 . . . u n i =1
o que permite deduzir que, contrariamente ao que provámos admitindo como verdadeira a desigualdade X n > Un , se tem afinal x 1 x 2 . . . x n < u 1 u 2 . . . u n .
11.3.4 DISTINÇÃO ENTRE SUBCONJUNTOS INFINITOS A palavra classificação é especialmente acarinhada em matemática. A necessidade de arrumar os objectos com que lida, e etiquetar os caminhos que podem seguir em ciência, tornam a leitura matemática da realidade mais trabalhosa e abstracta, mas também mais útil e criativa. A segunda vantagem que aqui analisaremos da divergência da série harmónica é a possibilidade que oferece de compararmos, através dela, famílias infinitas de números naturais, idênticas aos olhos da maioria dos critérios disponíveis, como o cardinal, o tipo de distribuição entre os reais, a categoria, a dimensão, a medida de Lebesgue, entre outros. Definição 11.1 Um subconjunto S de N é pequeno se contrário, diz-se grande.
∑ n ∈S
/ converge. Caso
1 n
Note-se que, dado S ⊂ N, S é grande ou pequeno uma vez que, como é sé∑ rie de termos positivos, a soma n∈S 1/n é limite de sucessão monótona crescente que, por isso, ou é limitada e converge (para o supremo do conjunto de valores da sucessão), e nesse caso S é pequeno, ou não é limitada e tem limite +∞, caso em que S é grande. Além disso, como convém, se S é pequeno, então N − S é grande porque a série harmónica diverge — e também porque numa soma de duas séries absolutamente convergentes podemos alterar a ordem dos termos sem mudar o carácter convergente da soma, nem o valor dela. Mas, como acontece com outras etiquetas de tamanho de conjuntos, o recíproco desta afirmação é falso: S e N − S podem ser simultaneamente grandes, como quando S = {naturais pares}. Vejamos mais alguns exemplos. (i) N é grande, uma vez que
∑+∞ k =1
/ diverge.
1 k
459
QUADRATURA ARITMÉTICA DO CÍRCULO
(ii) S = {1, 2, 22 , . . . , 2k , . . .} é pequeno, porque +∞ ∑ 1 k =1
2k −1
= lim
n →+∞
1+
1 1 1 + + ··· + n 2 22 2
1 − (1/2)n +1 = 2. n →+∞ 1 − 1/2
= lim
(iii) S = {1, 2!, 3!, . . . , k !, . . .} é pequeno, uma vez que (iv) S = {1, 22 , 32 , . . . , k 2 , . . .} é pequeno, pois (v) S = {naturais primos} é grande.
+∞ ∑ 1 = e − 1. k! k =1
+∞ ∑ 1 π2 = . 2 k 6 k =1
Recorde-se (e há na referência [Aigner, Ziegler, 2002] várias demonstrações disso) que o conjunto de números primos é infinito. A conclusão (primeiro de ∑ Euler) de que a série p primo 1/p diverge é notável sobretudo porque não conhecemos todos os primos, nem a sua distribuição em N. Vejamos como argumentou Erdös para o justificar. Designemos por p 1 , p 2 , . . . , p n , . . . a sucessão de primos, que supomos escrita por ordem crescente. Suponhamos que a série dos seus inversos converge. Existe ∑ então um natural K tal que i ≥ K +1 p1i < 12 . E, portanto, para qualquer natural N , ∑ N N i ≥ K +1 p i < 2 . Seja N ω o número de naturais n ≤ N que são divisíveis por, pelo menos, um dos primos da lista {p K +1 , p K +2 , . . .} e N α o número de naturais n ≤ N que só têm factores primos do subconjunto {p 1 , p 2 , . . . , p K }. Mostraremos a partir da existência de K que, para uma escolha apropriada de N , se tem N α +N ω < N , o que é uma contradição uma vez que, por definição, devemos ter N = N α + N ω . Para calcular N ω , note-se que a característica de pNi (isto é, o maior inteiro menor ou igual a pNi ), que designaremos por [ pNi ], conta o número de naturais n ≤ N que são múltiplos de p i . Assim, para todo o N , Nω ≤
∑ N N < . pi 2 i ≥K +1
Quanto a N α , podemos escrever cada natural n ≤ N contabilizado em N α como produto n = a n b n2 , onde a n é um natural livre de quadrados e, portanto, ou é 1 ou um produto de primos distintos da lista {p 1 , p 2 , . . . , p K }. Ora, para construir
460
MARIA PIRES DE CARVALHO
a n ̸= 1 com primos deste conjunto, podemos escolher 1, 2, …, ou K primos dife rentes; o que significa que há K0 + K1 + · · · + KK = 2K valores possíveis para a n . p p p Além disso, devemos ter b n ≤ n ≤ N . E portanto N α ≤ 2K × N .
Finalmente, se escolhermos N = 22K +2 , temos p N N α + N ω < 2K × N + = 2K × 2K +1 + 22K +1 = 2 × 22K +1 = N . 2
11.3.5 NÚMEROS NORMAIS Resulta da estrutura axiomática que cria o conjunto de números reais — e que garante, em particular, que cada subconjunto não vazio e majorado de R tem um menor majorante — que cada número real x tem uma representação na base 10 (uma dízima1 ), ou noutra base b ∈ N, b ≥ 2, qualquer (embora desconhecida para muitos deles) x = c k c k −1 . . . c 1 c 0 .d 1 d 2 . . . d n . . .(b )
em que os c i ’s e os d j ’s são elementos do conjunto {0, 1, . . . ,b − 1}, entendendo-se por esta escrita que x é, na base 10, a soma dada por x = c k × b k + c k −1 × b k −1 + · · · + c 1 × b + c 0 + d 1 × b −1 + d 2 × b −2 + · · · .
Ao construir uma dízima, o alfabeto é o conjunto de algarismos {0, 1, 2, . . . , 9}, não havendo razão, matemática ou outra, para que nesta tarefa de escrita um algarismo seja preferido a outro. É claro que podemos exibir dízimas em que a frequência, por exemplo, do dígito 0 é superior às de outros algarismos (como em 0.20202020 . . .), mas esperamos que, em geral (embora não seja ainda óbvio o que significa em geral), a proporção de cada um dos dez dígitos numa dízima infinita seja próxima de 1/10. Ou seja, que para um real x ∈ ]0, 1[ não demasiado especial, se o dígito d ocorre na dízima infinita de x (todos têm uma e uma só tal dízima) d n vezes nos primeiros n lugares, então tem-se lim
n →+∞
dn 1 = . n 10
Este limite é conhecido como a frequência com que o dígito d ocorre na dízima infinita. [Niven, 1967] tem um capítulo primorosamente escrito onde se prova 1 Mais detalhes em [Rademacher, Toeplitz, 1970]. 461
QUADRATURA ARITMÉTICA DO CÍRCULO
que, fixados d ∈ {0, 1, 2, . . . , 9} e um real ε > 0 arbitrário, o conjunto Nd = {x ∈ R : 1 limn→+∞ dnn ̸= 10 } está contido numa união de intervalos cuja soma de comprimentos não ultrapassa ε. Por outras palavras, Nd tem medida de Lebesgue zero. ∪ A união finita N = d ∈{0,1,...,9} Nd herda essa propriedade, o que implica, em particular, que o seu complementar em R é denso — daí que os seus elementos sejam conhecidos como números quasi-normais na base 10. A definição de número normal (em qualquer base) é mais exigente, mas as excepções são igualmente escassas no sentido de formarem ainda um conjunto com medida de Lebesgue zero: para qualquer base b , na representação infinita de um número normal cada bloco de k dígitos, k natural qualquer, ocorre à direita da vírgula com frequência b −k . Como cada número racional tem representação infinita periódica, qualquer que seja a base, os números normais são irracionais. Em particular, os números naturais, que têm uma representação finita na base 10 e outra infinita periódica de período 9 (e mais nenhuma) não são normais na base 10 (nem noutra base b ): numa e noutra escritas, um dígito (0 ou 9 — ou, na base b , 0 ou b − 1) ocorre em proporção muito maior que os restantes. Mas se ajustarmos a definição de frequência às representações finitas — as menos artificiais para os inteiros e facilmente obtidas através de um número finito de divisões do número pela base — podemos, com o critério estabelecido acima para detectar subconjuntos pequenos de N, estimar a prevalência dos naturais em cuja dízima finita um dígito d fixado ocorre com proporção 1/10. Comecemos por considerar, por exemplo, o dígito d = 0 e o conjunto S 0 = {n ∈ N : 0 não aparece na dízima finita de n }. Vejamos que S 0 é pequeno, o que significa que a maioria (neste contexto) dos naturais tem algum 0 na sua dízima finita (argumento análogo para qualquer outra base ou dígito permitido). Etapa 1. Convençamo-nos primeiro que é de esperar encontrar poucos naturais em cuja dízima não ocorra o dígito 0. Os naturais com N algarismos na sua dízima finita n = a N a N −1 . . . a 2 a 1
a N ̸= 0, a i ∈ {0, 1, . . . , 9}
formam um conjunto com 9×10N −1 elementos (o 9 inicial é consequência da restrição a N ̸= 0). Destes, 9N não têm nenhum 0 na sua dízima finita; e, portanto, a proporção dos naturais cuja dízima tem N dígitos e não usa o 0 é
462
MARIA PIRES DE CARVALHO
9N = 9 × 10N −1
9 10
N −1 .
N −1
9 Ora, se N ≥ 8, então 10 < 12 , o que indica que a probabilidade de encontrar um natural com um 0 na sua dízima finita entre os que têm 8 ou mais casas decimais é maior que 1/2.
Etapa 2. Provemos agora que a série
∑ n∈S 0
/ converge.
1 n
Como tem apenas termos positivos, este carácter convergente e a soma não se alteram se agruparmos as parcelas como mais nos convém. Em particular, a convergência da série acima é equivalente à da que se obtém se associarmos os naturais que tenham o mesmo número N de casas decimais na sua dízima finita (conjunto que designaremos por DN ) +∞ ∑
∑
N =1 n ∈S 0 ∩DN
1 . n
A tabela seguinte resume informação sobre estas fatias.
N
1
Majorante da soma
∑
1 n ∈S 0 ∩DN n
9
2 92 10
3 93 102
...
.. .
N 9N 10N −1
De facto: (i) Há nove naturais com uma casa decimal e sem zeros na dízima finita, nomeadamente 1, 2, . . . , 9. E, portanto, ∑ n∈S 0 ∩D1
1 1 1 = 1 + + · · · + < 9. n 2 9
(ii) ∑ n ∈S 0 ∩D2
1 1 1 1 1 81 = + ··· + + + ··· + < . n 11 19 21 99 10
(iii) Analogamente, há 9N naturais com N casas decimais e sem zeros na dízima finita, e cada um deles não ultrapassa 10N −1 . Logo, ∑ n ∈S 0 ∩DN
1 9N < N −1 . n 10 463
QUADRATURA ARITMÉTICA DO CÍRCULO
Concluímos deste modo que +∞ ∑ 1 ∑ ∑ 1 92 9N = ≤ lim 9 + + · · · + N −1 = 90 N →+∞ n N =1 n∈S ∩D n 10 10 n∈S 0 0 N ∑ e, portanto, que n∈S 0 1/n converge e S 0 é pequeno.
O majorante anterior poderia ser substancialmente diminuído fazendo-se uma estimativa mais cuidada (e trabalhosa porque a convergência desta série é muito lenta) da soma correspondente a cada S 0 ∩DN ; de facto, é até surpreendente que se consiga ([Baille, 1979]) garantir que, com três casas decimais correctas, se tem:
Dígito excluído d
Valor aproximado de
1
16.2
2
19.3
3
20.6
4
21.3
5
21.8
6
22.2
7
22.5
8
22.8
9
22.9
0
23.1
∑ n∈S d
/
1 n
Já provámos que é pequeno o conjunto de naturais em cuja dízima finita um dígito d fixado não ocorre. Provemos agora que é também pequeno o conjunto de naturais em cuja dízima finita d aparece poucas ou demasiadas vezes. Mas comecemos por esclarecer o que deve ser considerado, neste contexto, pouco ou demasiado. Definição 11.2 Fixados dígito d e natural n cuja dízima finita tem N dígitos dos quais d N são iguais a d , diremos que d ocorre na dízima com proporção dNN . E, fixado λ ∈ ]0, 1[, o dígito d tem na dízima frequência λ se d N = [λN ]. Talvez pareça estranho que o valor de λ seja fixado previamente na definição anterior de frequência. O problema é que, como a função característica (recorde-se que é aqui representada pelo par de parênteses [ ]) não é injectiva, λ não fica 464
MARIA PIRES DE CARVALHO
determinado por N e d . Por exemplo, se um natural tem N = 80 dígitos dos quais 11 são iguais ao algarismo 6, então podemos afirmar que 1/7 dos 80 dígitos é igual a 6 uma vez que 1/7 × 80 ≃ 11.43 e [11.43] = 11. Mas também 4/29 × 80 ≃ 11.03 e 5/36 × 80 ≃ 11.11, logo 4/29 e 5/36 são valores para λ igualmente aceitáveis. Provaremos de seguida que, dado dígito d ∈ {0, 1, . . . , 9}, é pequeno o conjunto de naturais em cuja dízima finita d ocorre com frequência menor que λ, onde 0 < λ < 1/10 (a representar o « pouco») ou maior que µ, onde 1/10 < µ < 1 (significando «demasiado»). E que, pelo contrário, é grande o conjunto de naturais em cuja dízima finita d ocorre com frequência exactamente 1/10. Consideremos 0 < λ < 1/10 e fixemos um dígito d . Seja Dd ,λ o conjunto dos naturais em cuja dízima finita d ocorre com frequência menor ou igual a λ e, dado natural N , designe-se por Dd ,λ,N o subconjunto de Dd ,λ dos naturais cuja dízima finita tem N dígitos. Cada elemento de Dd ,λ,N é maior ou igual a 10N −1 e, portanto, o seu recíproco não excede 10N1 −1 . Além disso, se m = [λN ], há não mais do que N modos de distribuir o dígito d de modo a ocupar m das N casas decimais m disponíveis (não esquecendo que o dígito 0 não pode figurar na primeira casa decimal) e 9N −m modos de preencher as restantes N − m casas decimais. Assim, o conjunto dos naturais cujas dízimas finitas têm N casas, das quais m ou menos estão ocupadas com o dígito d , tem cardinal que não excede a soma
N N N N N −m 9 . 9N −m +1 + · · · + 9 + 0 m −1 m
E, portanto, ∑ n ∈Dd ,λ,N
i 1 h N N −m N N 1 N N −m +1 9 9 + ··· + 9 + ≤ 0 m −1 m n 10N −1 m N −m +1 m −1 h N 9 1 N 9 1 N −m = 10 ( ) + + m 10 10 m −1 10 10 N 0 i 9 1 N . + ··· + 0 10 10
Simplifiquemos um pouco a notação: denotemos 1/10 e 9/10, respectivamente, por p e q . Então p + q = 1 e a soma anterior é 10
m ∑ N j =0
j
p j q N −j ,
que naturalmente associamos à expansão binomial de (p +q )N . Representa neste outro contexto a probabilidade de, em N lançamentos de uma moeda, em que 465
QUADRATURA ARITMÉTICA DO CÍRCULO
cara sai com probabilidade p e coroa sai com probabilidade q , se obterem m ou menos vezes cara. Ora, é sabido ([Feller, 1968]) que os coeficientes Nj p j q N −j da expansão de (p + q )N são tão maiores quanto mais perto j estiver de N p (ou seja, quando j = [N p ] ou j = [N p + 1/2]) , decrescendo nos dois sentidos (para j perto de 0 ou de N ) à medida que nos afastamos deste valor. Como m = [λN ] e λ < 1/10 = p , temos λN < N p e, portanto, m ≤ [N p ] (e, para uso futuro, m + 1 ≤ N ). Logo, as parcelas da soma anterior, de termos até m , não ultrapassam o maior coeficiente de (p + q )N . O que implica que os termos desta soma crescem com j e que N N p j q N −j ≤ p m q N −m . j m
Daqui resulta que 10
m ∑ N j =0
j
N N p m q N −m ≤ 10N p m q N −m . m m
p j q N −j ≤ 10(m + 1)
O que queremos é confirmar, finalmente, que a série
+∞ ∑
N p m q N −m m
10 N N =1
converge. A fórmula de Stirling ([Young, 1992]), m! = 1, lim p 2π m ( me )m
m →+∞
permite deduzir que, para valores suficientemente grandes de k , k! ∼
p
1
2π k k + 2 e −k ,
e, de cálculos um pouco tediosos, concluímos que existe θ ∈ ]0, 1[ tal que, com excepção de um número finito de valores de N , N
N! m !(N − m )!
1 10
m
9 10
N −m
não excede θ N . E, portanto, a série correspondente converge e Dd ,λ é conjunto pequeno. Por argumento inteiramente análogo se conclui que é pequeno o conjunto Ed ,µ dos naturais em cuja dízima finita d ocorre com frequência maior ou igual a µ, onde 1/10 < µ < 1. 466
MARIA PIRES DE CARVALHO
Designemos agora por Td o conjunto dos naturais n tais que o dígito d ∑ ocorre na dízima finita de n com frequência 1/10. Consideremos a série n ∈Td n1 e verifiquemos que ela diverge - o que não resulta do que provámos anteriormente uma vez que o complementar de Dd ,λ ∪ Ed ,µ , para valores fixados de 0 < λ < 1/10 e 1/10 < µ < 1, é grande mas contém estritamente T . d ∑ Para mostrarmos que n ∈Td 1/n diverge, bastará mostrar que é divergente a ∑ soma n∈Td ,N 1/n , onde N é múltiplo de 10 e Td ,N é o conjunto dos n ∈ Td tais que a dízima finita de n tem N casas decimais. Seja n ∈ Td ,N . Por definição, n é menor que 10N e a frequência do dígito d 1 N na dízima finita de n é 1/10. O dígito d ocorre em n exactamente d N = 10 N = 10 vezes e, além de n , há pelo menos N −1 N 10
N
× 9N −1− 10
elementos em Td ,N . De facto, N /−1 × 9N − 10 −1 conta os naturais com N − 1 dígitos na sua dízima finita dos quais N /10 são iguais a d ; se agora encabeçarmos cada uma destas dízimas por um dígito não nulo e diferente de d (e há 8 ou 9 opções, sendo exactamente 9 se d = 0), obtemos um elemento de Td ,N . Daqui concluímos que N
N 10
∑ 1 N − 1 1 N > × 9N −1− 10 × N N n 10 10 n ∈T d ,N
Para simplificar a notação, designemos por k o inteiro N /10. Então, ∑ 1 ∑ ∑ 1 > n n n∈Td N n∈Td ,N ∑ N − 1 1 > × 9N −1−k × N k 10 N N −k k 9 1 1 ∑ N −k N × = × k 9 N N 10 10
e, como
N −k N
=
N N − 10
N
=
9 , 10
N −k k ∑ 1 1 ∑ N 9 1 > × × . n 10 N k 10 10 n∈T d
Ora o termo geral desta série, Nk × (9/10)N −k × (1/10)k , é da ordem de 1/pN , estimativa que é de novo consequência da fórmula de Stirling. Como a série 467
QUADRATURA ARITMÉTICA DO CÍRCULO
∑
1 pN
/ não converge, por comparação com a restrição da série harmónica aos termos múltiplos de 10, concluímos que Td (que, recordemos, é o conjunto dos naturais em cuja dízima finita o dígito d ocorre com frequência perfeita, 1/10) é grande. N
Usando estimativas idênticas às anteriores, poderíamos concluir que, fixados j dígitos, digamos d 1 , d 2 , . . ., d j , o termo geral da série que se obtém restringindo a série harmónica ao conjunto Td 1 , d 2 ,...,d j , dos n ∈ N tais que d 1 , d 2 , . . ., d j ocorrem na dízima finita de n com frequência 1/10, é da ordem de N − / . O que indica que esta série não converge se j = 1 ou j = 2 (e, portanto, Td e Td 1 ,d 2 são grandes), mas converge se j > 2, logo Td 1 , d 2 ,...,d j é pequeno para uma escolha de 3 ou mais dígitos. O que significa que quase todos os naturais, no sentido de «conjunto grande» que temos usado, têm na sua dízima finita 1/10 de zeros (ou de 1’s, ou de 2’s, . . ., ou de 9’s); quase todos os naturais têm na sua dízima finita 1/10 de zeros e 1/10 de 1’s (ou outro par de dígitos); mas poucos têm 1/10 de zeros, 1/10 de 1’s e 1/10 de 2’s (ou outro terno de dígitos). j 2
Note-se que, ao contrário do que sucede com a intersecção de família finita ou numerável de conjuntos cujos complementares têm medida de Lebesgue zero, a noção de conjunto «grande» estabelecida pela série harmónica não resiste a esta operação entre conjuntos: a restrição da série à intersecção de três conjuntos distintos Td , cada um grande, converge. Paul Erdös conjecturou ([Erdös, 1964]) o que é, tanto quanto sabemos, ainda uma pergunta cuja resposta vale milhões: se A é um subconjunto grande de N, então contém progressões aritméticas arbitrariamente longas.
11.4 SÉRIE ALTERNADA DOS INVERSOS DOS ÍMPARES O número real usualmente designado por π é definido como o quociente entre o perímetro e o diâmetro de uma qualquer circunferência no plano. E, quando se deduz que um círculo é um conjunto com área (detalhes em [Moise, 1990]), π volta a surgir como o valor da área de uma tal figura de raio 1. Esta origem geométrica é fonte das dificuldades, e do interesse, em lidar com este número, a mais antiga das quais alude a um problema há muito colocado, e resolvido, o da construção com régua não-graduada e compasso de um quadrado com área π. A solução é um capítulo famoso da teoria analítica dos números, sendo consequên468
MARIA PIRES DE CARVALHO
cia do facto de π não ser algébrico (isto é, não ser zero de nenhum polinómio não identicamente nulo com coeficientes inteiros). Rever π no contexto da teoria elementar dos números é tarefa demorada, mas que vale a pena encetar. É o que ∑+∞ n faremos de seguida, usando a série n=0 (−1) . 2n +1
11.4.1 CONVERGÊNCIA Esta é uma soma com termo geral simples, ainda que alternada. A ela aplica-se sem hesitações o critério de convergência de Leibniz ([Spivak, 1994]), que garante que ela converge. O valor da soma exige mais trabalho, e a prioridade da sua descoberta é hoje atribuída a Nilakantha (do século XV; [Wilson, 1995]): +∞ ∑ (−1)n π = . 2n + 1 4 n =0
A convergência é lenta, não servindo para o cálculo expedito de aproximações racionais de π. Mas tem um aspecto curioso: relaciona π unicamente com os naturais ímpares. Infelizmente a dedução que é usual apresentar, em cursos introdutórios de análise, da igualdade anterior não ilumina esta preferência, embora seja curta e simples. Reproduzimo-la a seguir para que se compare com a que a virá substituir, de natureza distinta. Por construção da função inversa da restrição da função tangente ao intervalo ] − π2 , π2 [, sabemos que ∫
1
arctg(1) = 0
1 dx 1+x2
e que arctg(1) =
π . 4
1 Note-se que a função G : x ∈ [0, 1] 7→ 1+x 2 é monótona e por isso integrável segundo Riemann; e que, pela fórmula usual da soma de uma progressão geométrica (neste caso de razão −x 2 ), se tem, para x ∈]0, 1[,
1 = 1 − x 2 + x 4 − x 6 + · · · + (−1)n x 2n + · · · . 1+x2
A integração termo a termo desta série, de que se obtém π = 4
∫
1
0
1 dx 1+x2 469
QUADRATURA ARITMÉTICA DO CÍRCULO
∫
∫
1
=
1d x − 0
1
x d x + ··· +
(−1)n x 2n d x + · · ·
2
0
=1−
∫
1
0
1 1 (−1)n + − ··· + + ··· , 3 5 2n + 1
exige um pouco de atenção quanto à sua validade, porque sabemos de antemão que a série 1 − x 2 + x 4 − x 6 + · · · + (−1)n x 2n + · · ·
não converge quando x = 1. O integral de Riemann é, contudo, indiferente a este percalço num só ponto; e repare-se que, ao contrário da série, a função G está definida, e até é contínua, em R. Assim, para cada natural n , 1 − x 2 + x 4 − x 6 + · · · + (−1)n x 2n =
1 − ( − x 2 )n +1 1+x2
logo, ∫
1
0
1 1 (−1)n 1 − x 2 + x 4 − x 6 + · · · + (−1)n x 2n d x = 1 − + − · · · + 3 5 2n + 1 ∫1 2 n+1 1 − (−x ) = dx 1+x2 0 ∫1 ∫1 1 (−1)n +1 x 2n +2 = d x − dx 2 1+x 1+x2 0 0 ∫1 (−1)n +1 x 2n +2 π dx = − 4 1+x2 0
e, portanto, ∫ 1 n n +1 x 2n +2 π 1 1 (−1) (−1) − 1 − + − ··· + = dx 4 2 0 3 5 2n + 1 1+x ∫1 x 2n +2 dx ≤ 1+x2 0 ∫1 1 ≤ x 2n +2 d x = , 2n + 3 0
o que confirma que a série alternada dos inversos dos naturais ímpares converge e que π 1 1 (−1)n = lim 1 − + − · · · + . 4 n→+∞ 3 5 2n + 1 470
MARIA PIRES DE CARVALHO
Este é um daqueles argumentos que, apesar de airoso, não explica a intervenção excepcional neste contexto dos naturais ímpares. Para resolvermos o mistério da relação de π (que é o mesmo que dizer de um círculo de raio 1) com este subconjunto especial de números, faremos outra demonstração da igualdade anterior, menos rápida mas, esperemos, mais elucidativa. E partimos em vantagem agora, porque já sabemos aonde chegar.
11.5 NATURAIS QUE SÃO SOMA DE DOIS QUADRADOS Para cada natural n , seja r (n) o número de modos distintos de escrever n como soma de dois quadrados, n = a 2 + b 2 , onde a e b são inteiros. Se entendermos esta escrita como correspondente ao par ordenado (a ,b ) de Z × Z, a distinção entre duas escritas corresponde à que diferencia um par ordenado de outro. Por exemplo: 1 = 02 + 12 = 02 + (−1)2 = (−1)2 + 02 = 12 + 02 ,
logo, r (1) = 4; 10 = 12 + 32 = 32 + 12 = (−1)2 + 32 = 32 + (−1)2 = 12 + (−3)2 = (−3)2 + 12 = = (−1)2 + (−3)2 = (−3)2 + (−1)2
e cálculo simples confirma que entre os inteiros no intervalo onde, neste caso, p p a e b devem morar (isto é, ] − 10, 10[) mais nenhum par serve; e, portanto, r (10) = 8; 221 = 102 + 112 = 52 + 142 ; 5 22
+ 1 = (216 )2 + 12
= 622642 + 204492 ;
845 = 292 + 22 = 262 + 132 = 222 + 192 ;
r (221) = 16; r (22 + 1) = 16; 5
r (845) = 24.
Deste modo, para cada n , o número r (n ) conta quantos pares de Z × Z estão p na circunferência centrada em (0, 0) e de raio n . E há valores de n que justificam análise mais detalhada.
11.5.1 QUADRADOS PERFEITOS Um caso particular interessante desta representação de naturais como soma de dois quadrados é aquele em que n é um quadrado perfeito e nos restringimos a pares de N×N. Ou seja, quando procuramos ternos (a ,b, c ) ∈ N3 tais que a 2 +b 2 = 471
QUADRATURA ARITMÉTICA DO CÍRCULO
c 2 , designados pitagóricos porque esta igualdade significa que a , b são os catetos e c é a hipotenusa de um triângulo rectângulo. Por exemplo, a = 3, b = 4, c = 5; ou a = 6, b = 8, c = 10; ou a = 7, b = 24, c = 25. A sua intervenção no Último Teorema
de Fermat (porque a área destes triângulos não pode ser um quadrado perfeito, de onde resulta que a equação x 4 + y 4 = z 4 não tem soluções em N; pormenores em [Young, 1992]) é uma razão pequena da sua importância. Até Euclides intervir, para encontrar ternos pitagóricos eram conhecidos o método de Pitágoras n ∈ N ímpar ⇒ a = n, b =
n2 − 1 n2 + 1 , c= é terno pitagórico 2 2
e o de Platão n ∈ N par ⇒ a = n, b =
2 2 n n − 1, c = + 1 é terno pitagórico. 2 2
Euclides fecha o assunto, provando que «os ternos pitagóricos (a ,b, c ) tais que m d c (a ,b ) = 1 são dados por a = m 2 − n 2 , b = 2m n , c = n 2 + m 2 , onde n e m são naturais primos entre si, de paridade oposta e n < m ; os outros são múltiplos destes.» Esta máquina de gerar tais triângulos pode ser explicada pelo método das cordas, que descreveremos em seguida. Dada uma curva plana, o método das cordas detecta pontos como um radar: fixado um ponto da curva, consideramos o feixe de rectas que passam nesse ponto e as outras intersecções das rectas com a curva. É especialmente útil se a curva tem um ponto, digamos P , com ambas as coordenadas racionais. Nesse caso, cada recta que passe em P com declive racional e intersecte a curva noutro ponto, pode detectar aí outro elemento de Q × Q. O que permite construir, nesse caso, uma parametrização da curva por funções racionais. Vejamos um exemplo, que se relaciona com os ternos pitagóricos. Consideremos a circunferência plana centrada em (0, 0) de raio 1, digamos D, e P = (−1, 0). Para cada real t , a recta de declive t que passa em P tem equação cartesiana y = t (x + 1), e as suas intersecções com D são as soluções do sistema (
y = t (x + 1) x 2 + y 2 = 1.
Ou seja, as abcissas dessas intersecções verificam a equação, quadrática em x , x 2 (1 + t 2 ) + 2t 2 x + (t 2 − 1) = 0, 472
MARIA PIRES DE CARVALHO
de que x = −1 é uma solução. E, se t ∈ Q, esta equação tem coeficientes racionais, logo a outra solução é também racional: xt =
−2t 2 ±
p
4t 4 − 4(t 2 − 1)(t 2 + 1) 2(t 2 + 1)
( p −1 −2t 2 ± 4 = = 1−t 2 2 2(t + 1) , 1+t 2
valores que correspondem a (
y =0 y=
2t . t 2 +1
E, portanto, deduzimos que: 2t ∈ Q. t2 +1 (2) Se (x t , y t ) ∈ Q × Q e x t ̸= −1 ⇒ t =
(1) t ∈ Q ⇒
1−t 2 1+t 2
e
yt ∈ Q. xt + 1
Significa isto que o outro ponto de intersecção da recta de declive t tem ambas as coordenadas racionais se e só se t ∈ Q. Logo, D contém infinitos pontos de Q × Q, que formam subconjunto denso em D; e D é parametrizável por funções racionais uma vez que as rectas y = t (x + 1) descrevem todos os seus pontos. Note-se entretanto que esta propriedade notável não é partilhada por todas as circunferências do plano. De facto, uma circunferência pode ter: p
(i) 0 pontos em comum com Q × Q, como a de equação cartesiana x 2 + y 2 = 2; p 2 p 2 (ii) 1 ponto de Q × Q, como x − 2 + y − 2 = 4;
p 2
(iii) 2 pontos de Q × Q, como x 2 + y − 2 = 3; (iv) ou infinitos, isto é, se uma circunferência tem três pontos de Q × Q, então tem infinitos. (Para o confirmar, deduza que, nestas condições, o centro da circunferência tem ambas as coordenadas racionais; depois translade-a até estar centrada em (0, 0) e repita a aplicação do método das cordas que apresentámos acima — tendo em conta que os três pontos de Q×Q, quando transladados de um vector de Q×Q, não saem deste domínio.) Desta projecção estereográfica da circunferência a partir do ponto (−1, 0) deduz-se a mudança de variável, útil no cálculo de primitivas, dada por
473
QUADRATURA ARITMÉTICA DO CÍRCULO
cos(θ ) =
1−t 2 1+t 2
sen(θ ) = t 22t+1 d θ = t 22+1 d t .
E ainda a descrição de Euclides de todos os ternos pitagóricos primitivos. Confirmemos isso. Dados naturais m , n e l verificando n 2 + m 2 = l 2 , e tais que n e m têm paridade oposta, mdc(n, m ) = 1 e n > m , o ponto de coordenadas (n/l , m /l ) pertence a D ∩ (Q+ × Q+ ), justamente o conjunto que acabámos de descrever com o parâmetro t ∈ Q. Ora, se t ∈]0, 1[ é o declive da recta que detecta o ponto (n/l , m /l ), então t é fracção racional irredutível a /b , e
n m , l l
=
1 − t 2 2t , 1+t2 1+t2
=
b 2 − a 2 2a b , a2 +b2 a2 +b2
.
Face a esta igualdade, somos tentados a afirmar que n = b 2 − a 2 , m = 2a b e l = a 2 + b 2 . Contudo, esta escrita pode não corresponder a um terno primitivo (por exemplo, se λ = 1/3, então a = 1, b = 3 e b 2 − a 2 = 8, 2a b = 6 e a 2 + b 2 = 10). Se a e b têm paridade oposta, este problema não se coloca porque, nesse caso, os três números b 2 − a 2 , 2a b e a 2 +b 2 são primos entre si — repare que, por isso, são também primos dois a dois, uma vez que vale a igualdade (b 2 − a 2 )2 + (2a b )2 = (a 2 + b 2 )2 .
Com efeito: (i) se d é um natural que divide b 2 − a 2 , 2a b e a 2 +b 2 , então d tem de ser ímpar, pois b 2 − a 2 é; (ii) se d é primo e divide b 2 − a 2 e a 2 +b 2 , então também é divisor da soma (b 2 − a 2 ) + (a 2 + b 2 ) = 2b 2 e da diferença (a 2 + b 2 ) − (b 2 − a 2 ) = 2a 2 ; logo divide a e b , o que contraria a hipótese destes dois naturais serem primos entre si. E, portanto, neste caso é legítimo tomar n = b 2 − a 2 , m = 2a b e l = a 2 + b 2 . Se a e b são ambos ímpares, livramo-nos desta dificuldade considerando p = a +b e q = b −a que são primos entre si (de novo: se d é natural que divide p 2 2 e q , então também é divisor da soma e da diferença deles, isto é, de a e de b ) e
474
MARIA PIRES DE CARVALHO
de paridade oposta, uma vez que p + q = b é ímpar. De seguida, reescrevendo a igualdade
n m , l l
=
b2 − a2 2ab , a2 + b2 a2 + b2
em termos de p e q , obtemos
n m , l l
=
2pq p2 −q2 , p2 + q2 p2 + q2
de onde se deduz, agora sim, que n = 2pq , m = p 2 − q 2 e l = p 2 + q 2 .
11.5.2 PRIMOS Uma verificação simples permite calcular r (2) = 4. Se n é primo e maior que 2 (logo ímpar) e tem uma escrita como soma de dois quadrados, n = a 2 +b 2 , então, (i) a ̸= b (caso contrário n = 2a 2 e n não seria ímpar); (ii) a e b não são nulos (caso contrário, n = a 2 e n não seria primo); (iii) como n é ímpar, a e b não podem ter a mesma paridade. Suponhamos que a é ímpar e que b é par. Então a 2 , quando dividido por 4, dá resto 1; e, na divisão inteira por 4, b 2 dá resto 0. Logo, n está na sucessão (4k + 1)k ∈N ; (iv) r (n) = 8. Da existência de tais a ̸= b não nulos, resulta que r (n) ≥ 8. Além disso, não pode existir par (c , d ) tal que n = c 2 + d 2 e que esteja fora do conjunto {(a ,b ), (−a ,b ), (−a , −b ), (a , −b )}. Vejamos porquê. Como foi visto em (iii), a igualdade n = a 2 + b 2 = c 2 + d 2 obriga a e b (e c e d ) a terem paridade oposta. Suponhamos que a e c são ímpares, enquanto que b e d são pares. De a 2 + b 2 = c 2 + d 2 resulta que a 2 − c 2 = d 2 − b 2 , isto é, (a − c )(a + c ) = (d −b )(d +b ), onde, note-se, a − c e d −b são pares. Assim, se D = mdc(a − c ,b − d ), E = mdc(a + c ,b + d ), a − c = l D e d −b = m D , então D e E são pares, mdc(l , m ) = 1 e a + c = m E , d + b = l E . De onde concluímos, E somando a + c com a − c , e analogamente b + d com b − d , que a = l D+m , 2 l E −m D b= e, portanto, que 2 n = a2 +b2 l D +mE 2 l E −mD 2 = + 2 2
475
QUADRATURA ARITMÉTICA DO CÍRCULO
=
D 2
2
+
E 2
2
l 2 +m2 .
E, neste produto, cada factor é natural maior que 1 porque D e E são pares, e l e m são números naturais. Logo n é composto. Corolário 11.1 n primo ⇒ r (n) = 0 ou r (n ) = 4 ou r (n) = 8. Por exemplo, r (2) = 4, r (3) = 0, r (5) = 8. Resta-nos identificar os primos (que já sabemos serem ou 2 ou da progressão (4k + 1)k ∈N ) que admitem uma escrita como soma de dois quadrados.
11.5.3 PRIMOS CONGRUENTES COM 3 MÓDULO 4 Há infinitos primos na sucessão (4k +3)k ∈N0 , e o argumento de Euclides para provar a infinidade de primos pode aqui reproduzir-se bastando para isso alguma cautela. Se 3, 7, 11, . . ., p formam uma lista finita de primos deste tipo, então o número N = 4 (3 × 7 × · · · × p ) − 1 é desta progressão aritmética e maior que 1. Seja q um primo que divide N e desta progressão aritmética. Existe um tal q uma vez que: (a) N > 1 ⇒ o conjunto dos divisores naturais maiores que 1 de N é não vazio ⇒ (pelo Princípio da Boa Ordem ou, equivalentemente, pelo Princípio de Indução Finita) tal conjunto tem mínimo e, por ser mínimo, tem de ser primo ⇒ N é produto de primos (ímpares porque N o é); (b) os primos ímpares estão nas progressões (4k + 1)k ∈N e (4k + 3)k ∈N0 ; (c) o produto de dois (ou de uma quantidade finita de) números da progressão (4m + 1)m ∈N0 é ainda desta progressão. Ora, um tal q não pode pertencer à lista {3, 7, 11, . . . , p }, caso contrário, dividindo N e 3 × 7 × · · · × p , teria de dividir 1. Como vimos linhas acima, estes primos não têm escrita como soma de dois quadrados. Isto é, para eles r (n ) = 0.
11.5.4 PRIMOS CONGRUENTES COM 1 MÓDULO 4 Há também infinitos primos na progressão aritmética (4k +1)k ∈N0 (como de resto, por um resultado com prova não elementar de Dirichlet, em todas as do tipo (αk + 476
MARIA PIRES DE CARVALHO
β )k ∈N , se α e β são inteiros primos entre si), mas para o provar precisamos de
melhor estratégia do que a que delineámos na secção anterior. O problema é que, ao contrário dos números da sucessão (4k +3)k ∈N0 , um natural da progressão (4k + 1)k ∈N pode não ter um divisor primo nesta sucessão (veja-se o caso do 9). O que precisamos é de encontrar uma família rica em primos da sucessão (4k + 1)k ∈N . É isso, precisamente, o que descreve o resultado seguinte. Proposição 11.1 Todo o número da forma α2 +1, com α natural maior que 1, tem divisor primo da progressão (4k + 1)k ∈N . E não pode ter divisores primos da sucessão (4m + 3)m ∈N0 . Prova: Um tal número α2 +1 não é potência de 2 porque ou α é par, e então α2 +1 é ímpar; ou α é ímpar, digamos α = 2m +1, e α2 +1 = 4m 2 +4m +2 dá resto 2 quando dividido por 4, o que não é compatível com uma escrita como potência (de expoente pelo menos 4, uma vez que 10 ≤ α2 + 1) de 2. Logo, existe primo ímpar q que divide α2 + 1. Se q = 4m − 1 para algum natural m , temos α2 ≡ −1 (mod q ) e, por isso, α2
q −1 2
≡ (−1) = (−1)
q −1 2
(mod q ) = (−1)
2m −1
4m −2 2
(mod q )
(mod q ) ≡ −1 (mod q );
isto é, q divide αq −1 + 1 e, portanto, é divisor de αq + α. Contudo, pelo Pequeno Teorema de Fermat, que provaremos de seguida, q também divide αq − α. Logo, q é divisor da diferença, 2α. Daqui resulta que, como q é primo ímpar, q tem de dividir α. Mas então divide α2 e (α2 + 1) − α2 , o que é impossível. Concluímos assim que q tem de estar na progressão (4k + 1)k ∈N . Temos agora tudo (não é bem assim, ainda falta uma prova do Pequeno Teorema de Fermat, mas já lá iremos) para deduzir a infinidade de primos na progressão (4k + 1)k ∈N . Sigamos de novo o argumento de Euclides. Sejam 5, 13,. . ., p os primeiros primos desta progressão e consideremos o natural N = (5 × 13 × · · · × p )2 + 1. Pelo que vimos, existe primo q que divide N e é da lista (4k + 1)k ∈N . Mas q não pode ser 5, 13, . . . ou p . Façamos agora, como prometido, uma pequena digressão para demonstrar o resultado de Fermat que usámos. O argumento que apresentaremos foi adaptado do de [Frame, Johnson, Sauerberg, 2000]. 477
QUADRATURA ARITMÉTICA DO CÍRCULO
Teorema 11.1 (Pequeno Teorema de Fermat) Se q é primo e α ∈ N, então q divide αq − α. Prova: Sejam X um conjunto não vazio e f : X → X uma função. Como a imagem de f está contida no seu domínio, podemos compor f com f , e de facto quantas vezes quisermos. Designaremos por f n a composta de f consigo mesma n vezes. A cada ponto x de [0, 1] está associada uma sucessão, ( f n (x ))n ∈N0 , ou, por outras palavras, um conjunto de iterados de x por acção de f {x , f (x ), . . . , f n (x ), . . .}
a que chamaremos órbita de x . Se a ∈ X é tal que f (a ) = a , diremos que a é um ponto fixo de f . A sua órbita é do tipo mais simples, corresponde à sucessão constante e igual a a . Mais geralmente, um ponto periódico de período exactamente P de f é um elemento a ∈ [0, 1] fixo por f P e tal que f k (a ) ̸= a se 0 < k < P . A sua órbita é um conjunto finito de P elementos (distintos). Pelo modo como são geradas, duas órbitas de pontos periódicos ou são iguais (como conjuntos) ou disjuntas. Consequentemente, se PP ( f ) designa o número de pontos periódicos de período exactamente P de f (cada um criando um conjunto com P elementos), então P divide PP ( f ). Considere-se agora α ∈ N. Se α = 1, a afirmação do teorema é óbvia. Suponhamos, portanto, que α > 1 e analisemos a função σα , que actua no espaço das sucessões com valores em {0, 1, . . . , α − 1}, definida por σα (a k )k ∈N0 = (a k +1 )k ∈N0 .
Para cada natural n , ∑
Pd (σα ) = αn .
d divide n
Esta contagem é fácil. Os pontos periódicos da união
∪
d divide n
Pd (σα ) são as su-
cessões (a k )k ∈N0 que se constroem repetindo um bloco de n dígitos a 0 a 1 . . . a n −1 a 0 a 1 . . . a n −1 a 0 a 1 . . . a n−1 . . .
escolhidos do alfabeto permitido sem o cuidado de impedir repetições antes de completado o bloco — e, naturalmente, só sub-blocos de comprimento d que seja
478
MARIA PIRES DE CARVALHO
divisor de n é que podem aqui ocorrer. (Porquê?) Por exemplo, se α = 2 e n = 2, o conjunto ∪ Pd (σα ) é formado pelas sucessões (a k )k ∈N0 tais que d divide 2
a 2+j = a j ∀j ∈ N0 ,
isto é, {0000 . . . , 1111 . . . , 010101 . . . , 101010 . . .}. Em geral, para obter todos os elementos de
∪
d divide n
Pd (σα ), basta — e é ne-
cessário — atribuir, de forma independente, a cada uma das n primeiras variáveis a 0 , a 1 , …, a n−1 uma das α possibilidades do alfabeto. O que conduz a αn elementos. Retomemos a prova do Teorema de Fermat. Se q é primo, a igualdade ∑
Pd (σα ) = αq
d divide q
informa que αq = P1 (σα ) + Pq (σα ) = α + Pq (σα ).
E, portanto, αq − α = Pq (σα ), que, como vimos, é divisível por q .
Provaremos de seguida que cada um dos primos da sucessão (4k + 1)k ∈N , ao contrário dos da subsecção anterior, tem representação como soma de dois quadrados. Esse é o conteúdo de um outro teorema de Fermat (Grande, uma vez que já conhecemos um Pequeno, além de nos termos cruzado com o Último): Teorema 11.2 (Grande Teorema de Fermat) Se n é primo e da sucessão (4k +1)k ∈N , então r (n) = 8. Prova: O argumento que se segue, surripiado de [Aigner, Ziegler, 2002], ainda que não construtivo (isto é, não exibe os dois quadrados cuja soma é o primo) tem uma inspiração dinâmica que lhe concede um encanto adicional. (a) Sejam S um conjunto finito e f : S → S uma involução (isto é, uma aplicação tal que f ◦ f = Identidade de S). Uma tal função é injectiva (porque se f (x ) = f (y ), então x = f ( f (x )) = f ( f (y )) = y ) e, como S é finito, também é sobrejectiva — propriedade que também resulta da igualdade f ◦ f = Identidade de S , uma vez que, dado y ∈ S , existe x = f (y ) ∈ S tal que y = f (x ). Além disso, o número de elementos de S e o do conjunto de pontos fixos de f têm igual paridade. De facto, designemos por n o cardinal de S e por Ff o cardinal do conjunto de pontos fixos de f . Assim: 479
QUADRATURA ARITMÉTICA DO CÍRCULO
(i) se n = 1, esse único ponto de S é fixo por f e 1 = n = Ff ; (ii) se n = 2, digamos S = {a 1 , a 2 }, ou f é a Identidade de S , e tem 2 pontos fixos (logo n = Ff ); ou f (a 1 ) = a 2 e f (a 2 ) = a 1 e f não tem pontos fixos e, portanto, n = 2 ≡ 0 = Ff (mod 2); (iii) prossigamos por indução. Suponhamos que a afirmação é válida para um natural n fixado, isto é, que se T é um conjunto com n elementos e g : T → T uma involução, então n ≡ Fg (mod 2), onde Fg designa o número de pontos fixos de g . Consideremos agora S = {a 1 , a 2 , . . . , a n +1 } e f : S → S uma involução de S . Se f (a n +1 ) = a n +1 , então a restrição de f a S −{a n+1 } é ainda uma involução e a ela aplica-se a hipótese de indução: n ≡ Ff |S−{a } (mod 2). Como Ff = Ff |S−{a } + 1, concluímos que n + 1 ≡ n+1 n +1 Ff (mod 2). Se f (a n +1 ) = a j , onde j ≤ n , então f (a j ) = f ( f (a n +1 )) = a n +1 , e, por isso, a restrição de f a S − {a j , a n +1 } é ainda uma involução e a ela aplica-se a hipótese de indução: n − 1 ≡ Ff |S−{a a } (mod 2). Além j , n+1 disso, f não tem outros pontos fixos e, portanto, Ff |S−{a , a } = Ff ; e, j n +1 claro, n − 1 ≡ n + 1 (mod 2). (b) Seja p um primo da sucessão (4k + 1)k ∈N , digamos p = 4k 0 + 1. Consideremos o conjunto S = {(x , y , z ) ∈ N3 : x 2 + 4y z = p }. Como se terá alguém lembrado deste conjunto, estará o leitor a perguntar-se. Que tem ele de especial? Do tipo de primo que está a ser considerado, resulta que S é não-vazio, pois (1, 1, k 0 ) ∈ S . E é finito porque a igualdade que define S restringe x , y e z a valores entre 1 e p . Seja f : S → S a involução dada por
(x + 2z , z , y − x − z ) (x , y , z ) 7→ (2y − x , y , x − y + z ) (x − 2y , x − y + z , y )
se x < y − z se y − z < x < 2y se x > 2y .
Ora bem, mais um mistério nesta fórmula complicada. A verdade é que a relação entre esta função, o primo p e o conjunto S não poderia ser mais profícua. Confirmemos isso mesmo no que se segue. A aplicação f está bem definida porque os planos x = y − z e x = 2y não intersectam S ; isso é consequência de p ser primo, não podendo por isso ser um quadrado ou um múltiplo de 4: 480
MARIA PIRES DE CARVALHO
x 2 + 4y z = p x = y − z
⇒ p = (y + z )2 .
x 2 + 4y z = p x = 2y
⇒ p = 4y (y + z ).
Que mais têm estes planos de útil? Eles decompõem S em três subconjuntos disjuntos, nomeadamente S 1 = {(x , y , z ) ∈ S : x < y − z } S 2 = {(x , y , z ) ∈ S : y − z < x < 2y } S 3 = {(x , y , z ) ∈ S : x > 2y },
relevantes para a dinâmica de f : esta involução deixa S 2 invariante e tem aí ) = (1, 1, k 0 ); e permuta S 1 com S 3 . um único ponto fixo, o terno (1, 1, p −1 4 Por exemplo, se p = 41 = 4 × 10 + 1, então k 0 = 10 e S 1 = {(1, 5, 2), (1, 10, 1), (3, 8, 1)}, S 2 = {(1, 1, 10), (1, 2, 5), (3, 2, 4), (3, 4, 2), (5, 4, 1)}
e S 3 = {(5, 2, 2), (3, 1, 8), (5, 1, 4)}.
(c) Pela alínea (a), concluímos que o conjunto S tem cardinal ímpar. E, portanto, qualquer involução em S tem um ponto fixo. Em particular, g : (x , y , z ) ∈ S 7→ (x , z , y ) ∈ S tem um ponto fixo. E era exactamente isto que queríamos, porque uma solução da equação g (x , y , z ) = (x , y , z ) é um terno (x 0 , y 0 , z 0 ) em S tal que (x 0 , y 0 , z 0 ) = (x 0 , z 0 , y 0 ). Ou seja, existem naturais x 0 , y 0 e z 0 tais que x 02 + 4y 0 z 0 = p e y 0 = z 0 ; isto é, x 02 + 4y 02 = p , o que significa que p é soma dos quadrados x 02 e (2y 0 )2 .
481
QUADRATURA ARITMÉTICA DO CÍRCULO
11.6 QUADRATURA
As secções anteriores mostram que a sucessão r (n) n ∈N é bastante irregular: toma os valores 0 e 8 infinitas vezes e, portanto, não converge. Mas a situação é até um pouco mais complicada: r (n) n ∈N nem sequer é majorada e, portanto, para estudar o seu comportamento assimptótico, não vale a pena recorrer ao limite superior. De facto, fixemos um natural d e consideremos n = α2 , onde α = (32 + 1) × (42 + 1) × · · · × ((d + 2)2 + 1). α α e b k = k2k2 +1 , para 3 ≤ k ≤ d + 2, são inteiros e a Os números k 2α+1 , a k = kk 2 −1 +1 2 2 igualdade n = a k + b k indica que n é soma de dois quadrados. Além disso, para 2 −2 > 0, logo a k ̸= b k , e a k = α − k 2α estes valores de k , temos a k −b k = (k k−1) 2 +1 2 +1 , o que implica que a 3 < · · · < a d +2 . E, portanto, n tem aqui d representações distintas como soma de dois quadrados, sendo por isso r (n) ≥ 8d . 2
11.6.1 MÉDIAS ARITMÉTICAS Nestas condições desesperadas, podemos tentar obter informação das mé dias aritméticas dos valores de r (n ) n∈N . Sabemos que se uma sucessão converge, então a sucessão das suas médias aritméticas também converge e para o mesmo limite ([Spivak, 1994]). Mas o recíproco é falso: por exemplo, a sucessão (−1)n n∈N oscila entre os valores 1 e −1, mas a sucessão das suas médias aritméticas converge para 0. Neste contexto, é uma surpresa agradável descobrir que a sucessão das médias (M (n))n∈N =
r (1) + r (2) + · · · + r (n) n
não só converge como tem um limite famoso.
482
n ∈N
MARIA PIRES DE CARVALHO
n
r (n)
valor aproximado de M (n)
1
4
4
2
4
4
3
0
2,66
4
4
3
5
8
4
6
0
3,33
7
0
2,85
8
4
3
9
4
3,11
10
8
3,6
11
0
3,27
12
0
3
13
8
3,38
14
0
3,14
···
···
···
100
12
3,16
···
···
···
400
12
3,14
···
···
···
1000
16
3,14
Estes primeiros termos fazem-nos suspeitar que a sucessão (M (n))n ∈N se está a aproximar de π, número que assim ganha uma descrição puramente aritmética — processo a que chamamos quadratura aritmética do círculo. Provemos que assim é. Fixado natural n , consideremos o círculo Cn de centro no ponto (0, 0) e raio p n , que pode ser descrito pela inequação cartesiana {(x , y ) ∈ R2 : x 2 + y 2 ≤ n}. Sempre que n tenha escrita como soma de dois quadrados, detectamos um ponto da rede inteira Z × Z que está na circunferência que é bordo deste círculo. Para contabilizarmos neste cenário tanto r (k ), 0 < k ≤ n , como a área do círculo (a estrada até π), consideremos para cada ponto de (Z×Z)∩Cn um quadrado centrado nesse ponto de lados paralelos aos eixos e comprimento do lado igual a 1. Sugerimos que o leitor faça um desenho na margem do texto, uma rodinha e uns quadradinhos é coisa simples de traçar. Reparará então que os quadradinhos 483
QUADRATURA ARITMÉTICA DO CÍRCULO
não se sobrepõem mas, por um lado, nem todo o círculo fica coberto por estes selinhos quadrados e, por outro, alguns deles têm as pontas fora do círculo — o que vai bem com a nossa certeza de que a quadratura geométrica do círculo não é possível. A soma das áreas de todos estes quadradinhos é igual ao número deles, e este conta quantos pontos da rede inteira estão dentro do círculo Cn . Ou seja, ∑
∑
área do quadrado de centro(x , y ) =
1 (x ,y )∈(Z×Z)∩Cn
(x ,y )∈(Z×Z)∩Cn
= 1 + r (1) + · · · + r (n ),
onde o 1 inicial se refere ao quadrado centrado em (0, 0). Percebemos agora melhor por que razão, sendo a ̸= b , se distingue a escrita a 2 + b 2 da b 2 + a 2 , uma vez que, em Z × Z, os pares ordenados (a ,b ) e (b, a ) são diferentes. Sobre a soma das áreas dos quadrados podemos afirmar que: (i) A união dos quadrados considerados acima está contida num disco cenp trado em (0, 0) e de raio n + p12 . Se Q é um ponto da união destes quadrados, então Q dista do centro A de algum quadrado não mais do que metade do comprimento da diagonal, isto é, não mais do que 1/p2. E portanto a distância de Q a (0, 0) não vai além da p soma das distâncias de Q a A e de A a (0, 0), isto é, n + 1/p2. Daqui resulta que 1 + r (1) + · · · + r (n) ≤ área do círculo de centro (0, 0) e raio
1 2 n+p . 2 p (ii) O círculo Dn de centro (0, 0) e raio n − 1/p2 está inteiramente contido na =π
p
p 1 n+p 2
união dos quadrados considerados. Se P = (x , y ) é um ponto de Dn e R = ( x , y ) tem coordenadas dadas por x = inteiro mais próximo de x
(dista de x não mais do que 1/2) y = inteiro mais próximo de y
(dista de y não mais do que 1/2) então: 484
MARIA PIRES DE CARVALHO
1. R ∈ Z × Z; p 2. a distância de P a R é igual a (x − x )2 + (y − y )2 , logo inferior a p (1/2)2 + (1/2)2 = 1/p2; 3. a distância de R a (0, 0) não excede a soma das distâncias de R a P e de P a p p (0, 0), isto é, 1/p2 + ( n − 1/p2) = n , o que significa que R é um ponto de Cn ; 4. P está no quadrado de centro R , raio 1 e lados paralelos aos eixos, o que se deduz da diferença entre as abcissas de P e R , de módulo |x − x | ≤ 1/2, e da diferença entre as ordenadas, que verifica |y − y | ≤ 1/2. Daqui deduzimos que 1 + r (1) + · · · + r (n) ≥ área do círculo de centro (0, 0) e raio =π
p 1 n−p 2
2
p
1 n−p 2
.
Unindo as duas desigualdades, obtemos π
ou seja,
p 1 n−p 2
2 ≤ 1 + r (1) + · · · + r (n) ≤ π
p
1 n+p 2
2
p p 1 2 n 1 r (1) + · · · + r (n) π 1 2 n 1 − p − ≤ ≤π+ + p − 2 n n n 2 n 2 2 que enquadra a sucessão M (n ) n∈N entre duas que convergem para π. π π+ n
11.6.2 UMA GENERALIZAÇÃO DO GRANDE TEOREMA DE FERMAT Da tabela anterior de valores de r (n), notamos que, para além dos valores 0, 4 e 8 já esperados, todas as entradas são múltiplas de 4. Esse detalhe é consequência do Teorema de Jacobi que fornece um modo (expedito para valores pequenos de n ) de calcular r (n). A prova deste resultado é morosa, e não trivial em meios, mas vale a pena espreitá-la pois é ela que retira os naturais pares do palco. Teorema 11.3 (Teorema de Jacobi) Para cada natural n , consideremos os conjuntos Pn ,1 = {d ∈ N : d divide n e d = 4k + 1 para algum k ∈ N0 }
e Pn ,3 = {d ∈ N : d divide n e d = 4k + 3 para algum k ∈ N0 }.
Então r (n ) é igual a quatro vezes a diferença entre o cardinal de Pn ,1 e o cardinal de Pn ,3 . 485
QUADRATURA ARITMÉTICA DO CÍRCULO
Por exemplo: 13 tem dois divisores, 1 e 13, ambos de P13,1 , logo r (13) = 8. O natural 14 tem quatro divisores, 1, 2, 7 e 14, dos quais 1 ∈ P14,1 e 7 ∈ P14,3 , logo r (14) = 4 × (1 − 1) = 0. E 100 = 22 × 52 tem nove divisores, dos quais apenas 1, 5 e 25 são ímpares e todos de P100,1 , logo r (100) = 12. Repare-se que, desta fórmula, resulta que r (n) é múltiplo de 4 para todo o n . E, o que talvez nem desconfiássemos, que nenhum natural n tem mais divisores positivos da forma 4k +3 do que do tipo 4k +1. Além disso, é neste momento que os divisores pares de n , se existirem, saem de cena. Este teorema contém o Grande Teorema de Fermat uma vez que, se p é primo e da sucessão (4k + 1)k ∈N , então tem dois divisores, 1 e p , ambos de Pp,1 e portanto r (p ) = 8; o que, em particular, indica que p tem escrita como soma de dois quadrados. Mas a prova mais elementar, e ainda assim longa, do Teorema de Jacobi que conhecemos usa o Grande Teorema de Fermat. E segue o guião seguinte. (1) Para n = 1, r (n) = 4, como já calculámos. (2) Se n é natural maior que 1, n tem factorização em primos, que escreveremos ordenadamente α
β
β
βm n = 2γ p 1α1 p 2α2 · · · p k k q1 1 q2 2 · · · qm
onde p i é primo da lista (4k + 1)k ∈N e q j é primo da sucessão (4k − 1)k ∈N . A prova da Proposição anterior admite, neste contexto, a seguinte extensão: β
β
β
Proposição 11.2 Dado n = 2γ p 1α1 p 2α2 · · · p kαk q1 1 q2 2 · · · qmm como acima, existem a ,b ∈ Z tais que n = a 2 + b 2 se e só se β j é par para todo o j ∈ {1, 2, . . . , m }. Prova: Como anteriormente, comecemos por verificar que, se p é primo ímpar e divide c 2 +d 2 , onde c e d são inteiros primos entre si, então p pertence à sucessão p −1 (4k + 1)k ∈N . De facto, elevando a congruência c 2 ≡ −d 2 (mod p ) à potência 2 , obtemos c p −1 ≡ (−1)
p −1 2
d p −1 (mod p );
além disso, como c e d são primos entre si, p não divide nenhum deles. Logo, o Pequeno Teorema de Fermat garante que c p −1 ≡ d p −1 ≡ 1 (mod p ) 486
MARIA PIRES DE CARVALHO
e, portanto, devemos ter (−1)
p −1 2
≡ 1 (mod p ),
p −1 2
o que, como p ̸= 2, implica que (−1) = 1, isto é, p −1 é par, ou seja, p = 4k +1 para 2 algum natural k . β β β Suponhamos agora que n = 2γ p 1α1 p 2α2 · · · p kαk q1 1 q2 2 · · · qmm como no enunciado, que existem inteiros a e b tais que n = a 2 + b 2 e que β1 é ímpar (argumento análogo para os outros primos q j ). Seja d = mdc (a ,b ); existem inteiros a 1 e b 1 verificando a = d a 1 , b = d b 1 e mdc (a 1 ,b 1 ) = 1. Como d divide a e b e n = a 2 +b 2 , d 2 divide n , ou seja, existe natural n 1 tal que n = d 2 n 1 . Além disso, como o primo q1 divide n e β1 é ímpar, q1 tem de dividir n 1 = a 12 + b 12 . O que contradiz a primeira parte desta prova, porque, apesar de mdc(a 1 ,b 1 ) = 1, o primo q1 não é da lista (4k + 1)k ∈N . E, portanto, β1 tem de ser par. Reciprocamente, podemos supor desde logo que n > 1, uma vez que 1 = β β β α 12 + 02 . Seja n = 2α p 1α1 p 2α2 · · · p k k q1 1 q2 2 · · · qmm , com β j par para todo o j . Designemos por N o maior natural cujo quadrado divide n (que existe uma vez que 12 p divide n e o conjunto dos naturais cujo quadrado divide n é majorado por n). Então, existe natural d , que é 1 ou produto de primos distintos entre os quais, por hipótese, nenhum é da lista (4k − 1)k ∈N , tal que n = N 2 d . Se d = 1, a prova termina pois n = N 2 = N 2 + 02 e estão encontrados a e b . Se d ̸= 1, como 2 = 12 + 12 e vale o Grande Teorema de Fermat, todos os primos da factorização de d são soma de dois quadrados. Ora a igualdade (a 2 + b 2 ) × (A 2 + B 2 ) = (a B + Ab )2 + (a A − b B )2
mostra que o produto de um número finito de naturais que admitam escrita como soma de quadrados tem também esta propriedade. Logo, existem inteiros u e v tais que d = u 2 + v 2 . E, portanto, n = N 2 d = N 2 × (u 2 + v 2 ) = (u N )2 + (v N )2 . Corolário 11.2 Se um natural n contém na sua factorização um primo da lista (4k + 3)k ∈N0 com potência ímpar, então r (n) = 0. O que falta para completar a prova do Teorema de Jacobi? (1) Confirmar que, quando r (n) = 0, a fórmula 4 × cardinal de Pn ,1 − cardinal de Pn,3
também se anula. 487
QUADRATURA ARITMÉTICA DO CÍRCULO
(2) Analisar o caso dos naturais com valor de r não nulo. Dado natural n ̸= 1, (1) e (2) acima beneficiam da contagem dos divisores de n e da detecção do tipo de primos que o dividem. E isso é, há muito tempo, tarefa
da função f : N → {0, 1, −1} dada por 0 f (n) = 1 −1
se n é par se n é da sucessão (4k + 1)k ∈N0 se n é da progressão (4k + 3)k ∈N0 .
Note-se que nas condições que definem a função f estão abrangidos todos os naturais, uma vez que os restos possíveis da divisão inteira por 4 são 0 ou 2 (para os naturais pares) e 1 ou 3 para os ímpares. Por que nos interessa f ? Porque, para cada natural n , 4×
∑
f (d ) = 4 × cardinal de Pn ,1 − cardinal de Pn,3
d divide n
e isso delimita o que queremos concluir: que, para cada natural n , 4×
∑
f (d ) = r (n).
d divide n
O cálculo de f para um natural n maior que 1 é imediato se for conhecida a factorização de n , uma vez que esta função é multiplicativa, isto é, f (a ×b ) = f (a )× f (b ) para todo o par de naturais a e b . (Deixamos ao leitor a verificação desta afirmação: terá de a confirmar quando a ou b é par (bem, é só notar que, então, a × b também é par e que 0 é o elemento neutro da multiplicação); de verificar que a progressão (4k + 1)k ∈N0 é fechada para o produto (o que se ajusta bem à igualdade 1 × 1 = 1); de mostrar que dois elementos da sucessão (4k + 3)k ∈N0 , quando multiplicados, dão um natural ímpar da outra sucessão (e, convenientemente, (−1)2 = 1); e, finalmente, de comprovar que o produto de dois elementos ímpares, cada um da sua progressão, conduz a um natural de (4k + 3)k ∈N0 , o que f confere calculando (−1) × 1 = −1.) γ γ γ Deste modo, se n está factorizado em primos, digamos n = t 1 1 t 2 2 · · · t k k , ∏k onde os t j são primos distintos, então f (n) = j = 1 [f (t j )]γj . Além disso, como os divisores naturais de n são da forma d = t 1δ1 t 2δ2 · · · t kδk , sendo 0 ≤ δ j ≤ γ j para todo o j , temos
488
MARIA PIRES DE CARVALHO
∑ d divide n
f (d ) =
∑
δ
f (t 1δ1 t 2δ2 · · · t k k ) =
0≤δ j ≤γ j
∑
f (t 1 )δ1 f (t 2 )δ2 · · · f (t k )δk =
0≤δ j ≤γ j
δ = f (1) + f (t 1 ) + · · · + f (t 1δ1 ) × · · · × f (1) + f (t k ) + · · · + f (t k k ) .
Estas somas têm todas o mesmo formato, embora o seu valor dependa do tipo de primo que t j é. Resta-nos, portanto, calcular a sua versão mais geral. Dado primo p , e tendo em conta o tipo de número que p i é para o cálculo de i f (p ), obtemos 1 m ∑ m + 1 f (p i ) = 1 i =0 0
se p = 2 se p pertence à progressão (4k + 1)k ∈N se p pertence à progressão (4k + 3)k ∈N0 e m é par se p pertence à progressão (4k + 3)k ∈N0 e m é ímpar.
E, portanto, podemos deduzir desde já que: ∑
(i) Para todo o natural n , d divide n f (d ) ≥ 0, logo o cardinal de Pn,1 é maior ou igual ao de Pn ,3 , ou seja, nenhum natural tem mais divisores na progressão (4k + 3)k ∈N0 do que na progressão (4k + 1)k ∈N0 . (ii) Se na factorização de n em primos aparecer algum primo da sucessão (4k + ∑ 3)k ∈N0 com potência ímpar, então d divide n f (d ) = 0. Como vimos, neste caso também r (n) = 0. E, portanto, para estes naturais o Teorema de Jacobi está provado. (iii) Se na factorização de n em primos não surgir nenhum primo da sucessão (4k + 3)k ∈N0 com expoente ímpar, então ∑ d divide n
f (d ) =
∏
(γ j + 1).
t j ≡ 1 (mod 4)
Para terminar a prova do Teorema de Jacobi resta mostrar que, para estes ∏ naturais n , se tem r (n ) = 4 × t j ≡1 (mod 4) (γ j + 1). É o que faremos de seguida. Seja n um natural maior que 1 com factorização em primos dada por n = β β β α 2γ p 1α1 p 2α2 · · · p k k q1 1 q2 2 · · ·qmm , onde p i ≡ 1 (mod 4) e q j ≡ 3 (mod 4) para todo o i e j , e tal que r (n) ̸= 0 (logo β j é par para todo o j , digamos igual a 2µ j ). Pelo Grande 489
QUADRATURA ARITMÉTICA DO CÍRCULO
Teorema de Fermat, para cada primo p i existem naturais únicos a i e b i tais que p i = a i2 + b i2 . Isto significa que, no domínio dos inteiros gaussianos, G = {s + i t : s , t ∈ Z}, munido da soma e produto induzidos de C, o número p i não é primo.
Pelo contrário, cada q j é primo em G , pois se existissem α e β em G de normas (em C) N (α) e N (β ) maiores que 1 e tais que q j = αβ , então q j2 seria igual a N (α)N (β ), logo teríamos q j = N (α) = N (β ), contrariando o que vimos numa secção anterior. Consequentemente, em G , podemos reescrever α
β
β
βm n = 2γ p 1α1 p 2α2 · · · p k k q1 1 q2 2 · · ·qm β
β
βm = 2γ (a 12 + b 12 )α1 (a 22 + b 22 )α2 · · · (a k2 + b k2 )αk q1 1 q2 2 · · ·qm i2 h e e × = N i ν (1 + i )γ (a + i b )λ1 (a − i b )λ1 · · · (a k + i b k )λk (a k − i b k )λk 2µ1
× q1
2µm · · ·qm
onde ν = 1, 2, 3 ou 4 e 1 = α1 λ1 + λ e 2 = α2 λ2 + λ
.. . e k = αk . λk + λ
E, reciprocamente: z ∈ G e [N (z )]2 = n se e só se existem ν ∈ {1, 2, 3, 4}, γ, e i , µ j ∈ N0 tais que λi + λ e i = αi , 2 µ j = β j e λi , λ e
e
µ
µ
µm . z = i ν (1 + i )γ (a + i b )λ1 (a − i b )λ1 · · · (a k + i b k )λk (a k − i b k )λk q1 1 q2 2 · · ·qm
E, portanto, r (n), que na nova notação se descreve como o cardinal do conjunto ¦ © z ∈ C : ∃ c , d ∈ Z : z = c + i d e [N (z )]2 = n ,
pode ser estimado se contabilizarmos os valores dos parâmetros envolvidos na construção destes z ’s, que são independentes uns dos outros, com excepção dos λ’s de igual sub-índice, cuja soma é determinada por n . e 1 , α2 + 1 para Ora bem: temos 4 possibilidades para ν ; α1 + 1 para o par λ1 , λ e 2 , etc; e n determina univocamente os valores dos µ’s e de γ. Logo o par λ2 , λ r (n) = 4 × (α1 + 1) (α2 + 1) · · · (αk + 1). 490
MARIA PIRES DE CARVALHO
11.7 SAEM OS NATURAIS PARES
Como prometido, relacionaremos as médias aritméticas da sucessão r (n ) n∈N com a série alternada dos inversos dos naturais ímpares de modo a apresentar argumento, distinto do da secção 4.1, que mostre a igualdade π 1 1 (−1)n = lim 1 − + − · · · + . 4 n→+∞ 3 5 2n + 1
Comecemos por verificar que, para cada natural n , r (1) + r (2) + · · · + r (n) = 4 ×
n 1
−
n n + − ··· , 3 5
soma que é finita já que [ / ] = 0 se k > n . Pelo Teorema de Jacobi, n k
r (1) + r (2) + · · · + r (n) =
n ∑
4×
k =1
∑
f (d ).
d divide k
Além disso, n ∑ k =1
∑
4×
f (d ) = 4
n ∑ d =1
d divide k
f (d ) ×
n , d
uma vez que a parcela f (d ) aparece na soma da esquerda tantas vezes quantos os k ’s de 1 a n que d divide — e o número deles é precisamente [n/d ]. Como f é identicamente nula no subconjunto dos naturais pares, e vale 1 ou −1 nos ímpares conforme a sua classe de congruência módulo 4, temos r (1) + r (2) + · · · + r (n) = 4
n 1
−
n n n . + − ··· ± 3 5 maior ímpar ≤ n
Chegaremos à fórmula π = 4 × lim
n →+∞
1 1 (−1)n 1 − + − ··· + 3 5 2n + 1
se conseguirmos, através do limite, eliminar os parênteses rectos na igualdade acima. Vamos lá. p Para n suficientemente grande, o número 2[ n] − 1 é muito menor que n . p p Escolhamos, então, 2[ n ] − 1 ou 2[ n] + 1, o que tiver sinal menos na soma [ n1 ] − p n [ n3 ] + [ n5 ] − · · · ± [ maior ímpar ], digamos 2[ n] − 1, e dividámo-la nas duas parcelas ≤n S1 =
n n n n − + − ··· − p 1 3 5 2[ n] − 1 491
QUADRATURA ARITMÉTICA DO CÍRCULO
S2 =
n n − ··· ± . p maior ímpar ≤ n 2[ n] + 1
Assim, se na soma S1 retirarmos os parênteses, introduzimos um erro em cada parcela que não excede 1, já que 0 ≤ n/k −[n/k ] < 1, conduzindo a um erro total p que não ultrapassa [ n]; deste modo, S1 =
p n n n n − + − ··· − p + θn ([ n ]), 1 3 5 2[ n] − 1
onde |θn | < 1. Por outro lado, o valor de S2 está entre 0 e 2[pnn ]+1 , uma vez que os termos da soma são alternados e decrescem em valor absoluto. Logo, 0 ≤ S2 ≤
p n n < p = n, p 2[ n ] + 1 n
p
isto é, S2 = ρn ([ n]) com |ρn | < 1. Recapitulemos. Concluímos até agora que n n n n r (1) + r (2) + · · · + r (n) = 4 − + − ··· ± 1 3 5 maior ímpar ≤ n n n n p n − + − ··· − p =4 + 4θn ([ n ]) + 4S2 1 3 5 2[ n] − 1
e, portanto, que 4 θ ([pn]) + 4 S r (1) + r (2) + · · · + r (n) 1 1 1 n 2 = 4 1 − + − ··· − p + n 3 5 n 2[ n ] − 1
sendo, como vimos, p p p n+ n 8 4 θn ([ n])+4 S2 =p . ≤4 n n n
Daqui resulta que r (1) + r (2) + · · · + r (n) n p 1 1 1 4 θn ([ n]) + 4 S2 = 4 × lim 1 − + − · · · − p + n →+∞ 3 5 n 2[ n] − 1 1 1 1 = 4 × lim 1 − + − · · · − p n →+∞ 3 5 2[ n] − 1 1 1 1 1 = 4 × lim 1 − + − + − · · · . n →+∞ 3 5 7 9
π = lim
n →+∞
492
MARIA PIRES DE CARVALHO
BIBLIOGRAFIA A lista que se segue contém livros e artigos em que nos inspirámos ao escrever este texto, e outros com capítulos de leitura enriquecedora — mas que o leitor poderá apreciar na íntegra. São, na sua maioria, documentos introdutórios no melhor estilo de divulgação que conhecemos: primorosamente escritos, de vasto valor formativo, recheados de exemplos, comentários e desafios que lhes conferem um genuíno carácter elementar. Este texto é resultado directo da consulta de [Honsberger, 1979], [Larson, 1983], [Rademacher, Toeplitz, 1970], [Sierpinski, 1988] e [Young, 1992]. São excelentes obras de matemática, onde se gasta vagar sem remorso. Algumas das referências aqui arroladas são clássicas (que é como quem diz «de leitura obrigatória»), como [Spivak, 1994] e [Stillwell, 1989]. A par, em proveito para amadores ou especialistas em matemática, estão [Gardner, 1971], [Moise, 1990] e [Niven, 1967], cuja qualidade pedagógica e científica tentámos aqui copiar. [Aigner, Ziegler, 2002] Proofs from THE BOOK, 3rd ed., Springer-Verlag.
[Larson, 1983] Problem-solving through problems, Springer-Verlag.
[Andreescu, Savchev, 2003] Mathematical miniatures, Anneli Lax New Mathematical Library N.43, MAA.
[Moise, 1990] Elementary geometry from an advanced standpoint, 3rd ed., Addison-Wesley.
[Baille, 1979] “Sums of reciprocals of integers missing a given digit”, Amer. Math. Monthly, 86, 372–374. [Erdös, 1964] “Problems and results on Diophantine approximations”, Comp. Math., 16, 52–65.
[Niven, 1967] Irrational numbers, Carus Mathematical Monographs, N.11, MAA. [Rademacher, Toeplitz, 1970] The enjoyment of mathematics, Princeton University Press. [Sierpinski, 1988] Elementary theory of numbers, North-Holland. [Spivak, 1994] Calculus, Publish or Perish, 3rd ed.
[Feller, 1968] An Introduction to Probability Theory and Its Applications, vol. 1, 3rd ed., John Wiley & Sons. [Frame, Johnson, Sauerberg, 2000] “Fixed points and Fermat”, Amer. Math. Monthly, 107, 422–428. [Gardner, 1971] Sixth Book of Mathematical Games from Scientic American, W.H. Freeman and Company.
[Stillwell, 1989] Mathematics and its history, Springer-Verlag. [Young, 1992] Excursions in Calculus, Dolciani Mathematical Expositions, N.13, MAA. [Wilson, 1995] The innite in the nite, Oxford University Press.
[Honsberger, 1979] Mathematical Plums, Dolciani Mathematical Expositions, N.4, MAA. 493
12 SISTEMAS DE VERIFICAÇÃO DE DÍGITOS Christian Lomp e Sandra Mónica Costa Pires
12.1 INTRODUÇÃO Sempre que se transmite ou se recebe uma mensagem, existe a possibilidade de ocorrerem erros. Por este motivo pretende-se que os sistemas de comunicação sejam o mais fiáveis possível. No dia-a-dia, e nas mais variadas situações, são transmitidas diferentes mensagens, que podem ser músicas, imagens ou textos digitalizados. Existe uma necessidade permanente de desenvolver processos que permitam codificar e que permitam detectar, ou mesmo corrigir, eventuais erros ocorridos durante a transmissão. Nesse sentido, muitas vezes introduzimos dígitos de controlo. Ou seja, introduzem-se símbolos redundantes que são de grande importância no controlo e na correcção de erros. Assim surgem os sistemas de verificação de dígitos, ou check digit systems, que se encontram hoje em diversas situações do nosso dia-a-dia. Estudamos agora alguns exemplos de códigos e a forma com que detectam e/ou corrigem eventuais erros de transmissão. O exemplo mais básico de um código é o código de verificação de paridade: um byte é uma sequência de oito dígitos (bits), tal que cada bit tem o valor 0 ou 1. Para verificar a transmissão correcta de bytes por um canal (um fio de telefone, por exemplo) utiliza-se o último bit. Se a 0 , a 1 , . . . , a 6 são os primeiros sete bits calcula-se: a 7 ≡ a 0 + a 1 + · · · + a 6 (mod 2),
(12.1)
onde a ≡ b (mod n) significa que n é divisor de b −a . O receptor do byte a 0 a 1 . . . a 7 pode verificar se o dígito de verificação a 7 satisfaz a equação (12.1). Se o byte recebido não satisfizer esta equação, o receptor detectou o erro na transmissão e pode pedir uma retransmissão. O código ASCII, American Standard Code for Information Interchange, que associa números entre 0 e 127 às letras do alfabeto, algarismos e sinais de pontuação, utiliza esta ideia. Cada número é representado por sete bits, a 0 a 1 . . . a 6 , aos quais é acrescentado um bit, a 7 , definido por (12.1). Um sistema semelhante é utilizado nos circuitos da memória de um computador. Um outro código detector de erros é o ISBN, International Standard Book Number. Todos os livros publicados no mundo ocidental recebem um número ISBN. 495
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
Um número (ou uma palavra) a 1 a 2 a 3 . . . a 10 , com 0 ≤ a i ≤ 10, é um número de ISBN válido se: 1a 1 + 2a 2 + 3a 3 + . . . 9a 9 + 10a 10 =
10 ∑
i a i ≡ 0 (mod 11)
(12.2)
i =1
Assim sendo, o algarismo a 10 é determinado através dos dígitos a 1 , . . . , a 9 : a 10 ≡
9 ∑
i a i (mod 11)
(12.3)
i =1
Se ocorrer que o dígito de verificação seja 10, neste caso, por convenção a letra1 será X, pois não podemos esquecer que se pretende que os números ISBN sejam formados por apenas dez símbolos. Na prática só se utiliza números de ISBN com a 1 , · · · , a 9 ∈ {0, . . . , 9}. Por exemplo, o livro The theory of groups and quantum mechanics, escrito por Herman Weyl, na edição da Dover, tem o número ISBN 0-486-60269-9. O último dígito (ou letra) é um dígito que irá verificar a validade do número. Verifique-se: 1×0+2×4+3×8+4×6+5×6+6×0+7×2+8×6+9×9 = 229 ≡ 9 (mod 11) (12.4)
Desde a implementação dos números ISBN, em 1969, até 1 de Janeiro de 2007, estes números mantiveram a forma acima. A partir de 2007, o número ISBN passou a ser formado por treze dígitos, divididos em cinco blocos, separados por hífens ou espaços, sendo o primeiro e o último de comprimento fixo.
FIGURA 12.1 Código EAN-13
Neste novo ISBN, o último dígito é o dígito de verificação. Cada um dos primeiros doze dígitos do número ISBN é agora multiplicado alternadamente por 1 e por 3. Este número é, na verdade, idêntico ao código de barras EAN-13 (European Article Numbers) e tem a forma a 1 a 2 . . . a 13 com a i ∈ {0, . . . , 9}, com: a 1 + 3a 2 + a 3 + 3a 4 + a 5 + 3a 6 + a 7 + 3a 8 + a 9 + 3a 10 + a 11 + 3a 12 + a 13 ≡ 0 (mod 10).
(12.5) 1 X é 10 em latim 496
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Repare-se que o EAN-13 é calculado através de congruências módulo 10. O livro Introduction to Coding Theory, de Ron M. Roth, da Cambridge University Press, de 2006, possui o número EAN-13 seguinte: 9780521845045. Verifique-se: 9+3×7+8+3×0+5+3×2+1+3×8+4+3×5+0+3×4+5 = 110 ≡ 0 (mod 10). (12.6)
Um outro exemplo de um sistema de verificação de dígitos encontra-se no Bilhete de Identidade (BI) Português (ver também o artigo de Jorge Picado (Picado, 2001)). Quem é que nunca pensou qual seria o significado do algarismo suplementar que é justaposto ao número do BI? De certo, todos nós já ouvimos a justificação de que este número indicaria o número de pessoas que, em Portugal, têm o mesmo nome que o portador do BI. Mas, se assim fosse, podíamos colocar a seguinte questão: Não poderão existir mais de nove pessoas com o mesmo nome? De facto, facilmente constatamos que este não é o argumento correcto. Na verdade, o algarismo suplementar do BI é determinado da mesma forma que no código ISBN, com uma única diferença: todos os dígitos permitidos pertencem ao conjunto {0, 1, . . . , 9}. Considere-se a 1 a 2 . . . a 8 o número de identificação seguido do dígito de verificação a 9 . O número de verificação do BI é calculado a partir do número de identificação, da seguinte forma: 9a 1 + 8a 2 + 7a 3 + · · · + 2a 8 + a 9 ≡ 0 (mod 11).
(12.7)
Quando um número de identificação tiver menos de oito dígitos, devem ser acrescentados à esquerda do número os zeros necessário até completar os oito algarismos. Então, a 9 será o número que somado a n = 9a 1 + 8a 2 + 7a 3 + · · · + 2a 8 dá origem a um múltiplo de 11. Assim sendo, se n ≡ x (mod 11), então a 9 = 0 se x = 0 ou a 9 = 11−x se x ̸= 0. Ora, se x = 1 o dígito de verificação seria 10, mas uma vez que se pretende que o número de verificação possua apenas um dígito, o sistema, em vez de 10, utiliza o dígito 0. Desta forma, é impossível saber, apenas por observação directa, quais os números de BI em que o dígito de verificação deveria ser 0 ou 10. No Número de Identificação Fiscal (NIF) o dígito de verificação, que neste caso é o último dígito, é determinado exactamente da mesma forma que no BI, o que faz com que exista uma limitação idêntica. No cartão de crédito existe igualmente um processo de verificação de dígitos2 . O número de cada cartão de crédito possui dezasseis algarismos, sendo o último 2 inventado em 1960 por Hans Peter Luhn (patente EUA Nº 2950048) 497
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
o dígito de verificação. O cálculo deste dígito de verificação segue um algoritmo um pouco diferente dos descritos anteriormente. Considere-se a 1 a 2 . . . a 16 com a i ∈ {0, . . . , 9}. Neste caso, cada um dos primeiros quinze dígitos do número do cartão de crédito é agora multiplicado, alternadamente, por 2 e por 1, obtendo-se assim a sequência 2a 1 , a 2 , 2a 3 , a 4 , . . . 2a 15 . Note-se que cada elemento desta sequência possuirá um ou dois algarismos. Posteriormente, determina-se x de modo a que seja congruente módulo 10 com a soma dos dígitos individuais dos números da sequência anterior. O dígito de verificação, a 16 , será determinado fazendo, a 16 = 10 − x . Considere-se, por exemplo, o número de cartão de crédito 5233220040093298. De acordo com a descrição anterior, obtém-se a seguinte sequência: 10, 2, 6, 3, 4, 2, 0, 0, 8, 0, 0, 9, 6, 2, 18. (12.8) Desta forma, x = 1 + 0 + 2 + 6 + 3 + 4 + 2 + 0 + 0 + 8 + 0 + 0 + 9 + 6 + 2 + 1 + 8 = 52.
(12.9)
Uma vez que 52 ≡ 2 (mod 10), neste caso o dígito de verificação é 10−2 = 8, correspondente ao décimo sexto dígito do número do cartão de crédito apresentado. Neste artigo discutimos as propriedades básicas dos sistemas de verificação de dígitos em termos da capacidade de «detectar» erros que podem ocorrer durante uma transmissão. Exemplos de alguns tipos de erros são os erros singulares (na transmissão só um dígito foi alterado), as transposições adjacentes (dois dígitos adjacentes trocaram de posição a i a i +1 → a i +1 a i ) e as transposições intercaladas (ocorre a troca entre dois algarismos que têm apenas um algarismo a intercalá-los a i −1 a i a i +1 → a i +1 a i a i −1 ). A única possibilidade de efectuarmos um estudo sobre estes erros será de forma empírica. Na sua tese Error detecting decimal codes, J. Verhoeff (Verhoeff, 1969) identificou um conjunto de tipos de erros e suas frequências relativas, que é apresentado na tabela 12.1. A tabela mostra que os erros mais comuns são os erros singulares e os erros de transposição adjacentes. Trataremos estes tipos de erros ao longo deste artigo.
12.2 SISTEMAS DE VERIFICAÇÃO DE DÍGITOS Até aqui vimos exemplos de vários códigos. É, então, natural que surjam algumas dúvidas: Em que consiste um código? Como pode ser criado um código? Torna-se assim evidente a necessidade de formalizar este conceito.
498
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Tipo de erro Erros singulares Transposições adjacentes Transposições intercaladas Erros gémeos Erros gémeos intercalados Outros erros
Frequência relativa · · · a · · · → · · ·b · · ·
· · · a b · · · → · · ·b a · · · · · · a b c · · · → · · · cb a · · · · · · a a · · · → · · ·bb · · · · · · a c a · · · → · · ·b cb · · ·
79.0% 10.2% 0.8% 0.6% 0.3% 9.1%
TABELA 12.1 Tipos de erros e as suas frequências relativas
Uma mensagem é composta por símbolos de um conjunto finito fixo, o qual é denominado por alfabeto. Considere-se, então, A um alfabeto3 . Os elementos de um produto cartesiano, A n (n ≥ 1), são chamados palavras de comprimento n sobre A e são representadas por a 1 . . . a n ou (a 1 , . . . , a n ). Um código de bloco definido num alfabeto A é um subconjunto não vazio de A n , isto é, um conjunto de palavras. Relativamente aos sistemas de verificação de dígitos, as palavras de um código representam as palavras válidas. Como o nosso objectivo é definir e estudar sistemas de verificação de dígitos cujas palavras válidas são exactamente as soluções de uma equação, é útil ter um alfabeto que possua uma estrutura algébrica. Uma possibilidade é utilizar a teoria de grupos. Começamos por relembrar alguns conceitos desta teoria. Uma permutação de um conjunto não vazio A é uma função α : A → A que tem uma função inversa, ou seja, existe uma função β : A → A tal que as composições de α e β são iguais à função identidade: α◦β = i d A = β ◦α. A inversa de uma função α denota-se por α−1 . Se A é um conjunto finito, então uma função α : A → A é uma permutação se e só se α é injectiva. O conjunto das permutações de A é denotado S A e denominado grupo das permutações de A e tem as seguintes propriedades: (i) a composição α ◦ β de permutações α, β é uma permutação, (ii) a identidade i d A pertence ao conjunto S A e (iii) a inversa de qualquer permutação é, novamente, uma permutação. Denote-se por S n o grupo das permutações do conjunto {1, . . . , n}. 3 Um alfabeto neste texto será sempre um conjunto nito com, pelo menos, dois elementos diferentes.
499
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
Generalizando o conceito de grupo das permutações chegamos à definição de um grupo: Um grupo é um triplo (A, ·, e ) em que A é um conjunto, · : A ×A → A é uma operação binária e e é um elemento de A tal que são satisfeitas as seguintes propriedades: (i) a operação · é associativa, isto é a · (b · c ) = (a · b ) · c , (ii) para cada elemento a ∈ A tem-se a · e = a = e · a , e (iii) para cada elemento a ∈ A existe um elemento inverso a −1 , isto é, a ·a −1 = e = a −1 · a . Obviamente (S A , ◦, i d ) é um grupo4 para qualquer conjunto não vazio A . Para cada n > 0 o conjunto Zn = {0, 1, . . . , n − 1}, forma um grupo com a operação a · b := a + b (mod n) para a ,b ∈ Zn . Um grupo (A, ·, e ) será designado abeliano se o produto for comutativo, isto é, a · b = b · a para todo a ,b ∈ A . Os grupos (Zn , +, 0) são Abelianos, para todo n , e os grupos (S A , ◦, i d ) não são Abelianos para conjuntos A que tenham mais de dois elementos. Um grupo (A, ·, e ) diz-se finito se A for um conjunto finito. Por sua vez, a ordem de um grupo é o número de elementos que o formam e denota-se usualmente por |A|. Outra noção que será igualmente necessário ter presente é a noção de ordem de um elemento a de um grupo (A, ·, e ). A ordem de um elemento a é o menor inteiro positivo n , tal que a n = e , e denota-se por or d (a ), com a convenção a 0 = e e a k = a · a k −1 . A ordem do elemento a diz-se infinita se tal n não existe. Note-se que o único elemento de ordem 1 é o elemento neutro e . Uma vez que num grupo finito nem todas as potências a n , n ∈ N, de um elemento a podem ser diferentes, qualquer elemento tem ordem finita. Por analogia aos exemplos anteriores de verificação de dígitos, considere-se um elemento c ∈ A qualquer de um grupo A e n permutações σ1 , . . . , σn de A . O código de verificação de dígitos C = C (A, σ1 , . . . , σn , c ) de comprimento n associado às escolhas A, c , σ1 , . . . , σn é o subconjunto de A n definido por: C := {(a 1 , . . . , a n ) ∈ A n | σ1 (a 1 ) · σ2 (a 2 ) · . . . · σn (a n ) = c }.
(12.10)
Como qualquer palavra a 1 . . . a n ∈ C satisfaz σ1 (a 1 ) · . . . · σn (a n ) = c , a n = σn−1 σn −1 (a n−1 )−1 · . . . · σ1 (a 1 )−1 · c
(12.11)
4 É de observar que qualquer grupo (A, ·, e ) pode ser visto como um subconjunto do grupo das permutações (S A , ◦, i d ), onde cada elemento a ∈ A corresponde a permutação σa : A → A dada por σa (b ) = a · b e cuja inversa é σa −1 . 500
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Portanto, a equação (12.11) mostra que a última letra é determinada pelas primeiras n − 1 letras. Mostra também que, para qualquer escolha de letras a 1 , . . . , a n −1 podemos definir a n , para obter uma palavra de código de C . Logo, C consiste em |A n −1 | = q n−1 palavras. Observação 12.2.1 Um código C = C (A, σ1 , . . . , σn , c ) consiste em q n −1 palavras onde q = |A|. Em particular, a última letra de cada palavra código é unicamente determinada pelas n − 1 letras iniciais. Vejamos como os exemplos apresentados anteriormente se encaixam na definição dos códigos de verificação de dígitos. O código ISBN já foi aqui apresentado anteriormente. Vimos que os números ISBN a 1 a 2 . . . a 10 satisfazem: a 1 + 2a 2 + 3a 3 + 4a 4 + 5a 5 + 6a 6 + 7a 7 + 8a 8 + 9a 9 + 10a 10 ≡ 0 (mod 11). (12.12)
Neste caso, temos que A = {0, 1, . . . , 9, X }, onde X é utilizado no lugar de 10 na última posição. Identificamos (A, ·, e ) com o grupo Abeliano (Z11 , +, 0), escolhemos as permutações σi , tais que σi (a ) := i a (mod 11), para 1 ≤ i ≤ 10 e c = 0. Assim, um número a 1 a 2 . . . a 10 será um número válido de ISBN se pertencer ao código C (Z11 , σ1 , . . . , σ10 , 0).5 Note-se que nem todas as palavras de C são números válidos de ISBN, porque a letra X que corresponde ao número 10, só é utilizada na última posição dos números de ISBN. Sobre o código EAN-13 já vimos que para verificar a validade de um número, a 1 a 2 . . . a 13 , se teria de utilizar a equação (12.5). Neste caso, temos A = {0, 1, . . . , 9}.
Identificamos (A, ·, e ) com o grupo Abeliano (Z10 , +, 0) e escolhe-se c = 0. Considere-se a permutação α=
0
1
2
3
4
5
6
7
8
9
0
3
6
9
2
5
8
1
4
7
! .
As permutações σ2i = α, para 1 ≤ i ≤ 6, e σ2i −1 a função identidade, para 1 ≤ i ≤ 7, permitem definir o código EAN-13. Uma palavra a 1 a 2 . . . a 13 será um número válido de EAN-13 se pertencer ao código C (Z10 , σ1 , . . . , σ13 , 0). Um outro código apresentado anteriormente foi o do número do BI. Vimos que um número de BI, a 1 a 2 . . . a 8 , seguido do dígito de verificação a 9 , é válido se 5 Como 11 é um número primo, pelo algoritmo de Euclides existe para qualquer 1 ≤ i ≤ 10 um número 1 ≤ j ≤ 10, tal que i j ≡ 1 (mod 11). Logo, σ j é a função inversa de σi . 501
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
verifica a equação (12.7). Seja A = {0, 1, . . . , 9}. Assim, identificamos (A, ·, e ) com o grupo Abeliano (Z11 , +, 0) e escolhemos as permutações σi , tais que: σi (a ) ≡ (10 − i )a (mod 11), ∀a ∈ A
(12.13)
para 1 ≤ i ≤ 9 e c = 0. Um número de BI, a 1 a 2 . . . a 8 a 9 , será válido se pertencer ao código C (Z11 , σ1 , . . . , σ9 , 0). É de relembrar que nem todos os números de BI utilizados verificam a equação (12.7), uma vez que quando o dígito de verificação é 0 ou 10 o símbolo que é associado, em qualquer um dos casos, é o 0. Vejamos, por último, o caso do número do cartão de crédito. Neste caso, A = {0, 1, . . . , 9}. Identificamos (A, ·, e ) com o grupo Abeliano (Z10 , +, 0) e escolhemos c = 0. Considere-se a permutação α=
0
1
2
3
4
5
6
7
8
9
0
2
4
6
8
1
3
5
7
9
! .
Para cada 1 ≤ i ≤ 8, seja σ2i a função identidade e σ2i −1 = α. Desta forma, uma palavra a 1 a 2 . . . a 16 é um número válido do cartão de crédito se pertencer ao código C (Z10 , σ1 , . . . , σ16 , 0). Vemos agora quais os erros que os sistemas de verificação de dígitos podem detectar. Seja C um código de verificação de dígitos sobre um grupo (A, ·, e ) associado às permutações σ1 , . . . , σn e c ∈ A . Seja (a 1 , . . . , a n ) ∈ C e suponhamos que, por alguma razão, a letra na posição 1 ≤ i ≤ n foi alterada de a i para b ̸= a i . Então (a 1 , . . . , a i −1 ,b, a i +1 , . . . , a n ) já não é uma palavra do código porque b ̸= a i ⇒ σi (b ) ̸= σi (a i ), portanto σ1 (a 1 ) · . . . · σi −1 (a i −1 ) · σi (b ) · σi +1 (a i +1 ) · . . . · σn (a n ) ̸=
σ1 (a 1 ) · . . . · σi −1 (a i −1 ) · σi (a i ) · σi +1 (a i +1 ) · . . . · σn (a n ) = c .
Logo, se na transmissão da palavra uma posição se alterou, esse erro pode ser detectado. Na verdade, o facto de cada σi ser uma permutação assegura que todos os erros singulares são detectados. Acabámos de verificar a observação: Observação 12.2.2 Qualquer código de verificação de dígitos da forma C (A, σ1 , . . . , σn , c ) detecta todos os erros singulares. Portanto, segundo a tabela de Verhoeff (tabela 12.1), os códigos C (A, σ1 , . . . , σn , c ) detectam 79% dos erros. 502
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
O código European Article Number (EAN-13; o código de barras) é, como vimos, um código de verificação de dígitos sobre o grupo A = (Z10 , +, 0) associado a 13 permutações σi tal que σ2i (a ) ≡ 3a (mod 10) e σ2i −1 (a ) = a . O EAN-13 consegue assim detectar um erro. Não consegue, no entanto, detectar a troca de dois dígitos, pois, por exemplo, o número 9780521845045 é um número válido de EAN13, mas o número 9785021845045 também o é. Portanto, se na transmissão do número os dígitos nas posições 4 e 5 forem trocados, isto é, a 4 e a 5 forem transpostos, então o receptor não detectará este erro. Já mencionámos informalmente o tipo de erro da transposição adjacentes (antes da figura 12.1), mas queremos formalizar este conceito agora. Denotamos por τi a transposição que troca os dígitos nas posições i e i + 1 das palavras de A n , isto é, τi : A n → A n com τi (a 1 . . . a n ) = a 1 . . . a i −1 a i +1 a i a i +2 . . . a n . Definição 12.2.3 Um código de bloco C detecta transposições adjacentes se, para qualquer ω ∈ C e 1 ≤ i ≤ n − 1, se τi (ω) ∈ C , então ω = τi (ω). Nem todos os códigos de blocos detectam todas as transposições adjacentes. Por exemplo, o código de verificação de paridade6 Pn (A) = C (A, i d , i d , . . . , i d , e ), so|
{z n
}
bre qualquer grupo não trivial (A, ·, e ) e com n ≥ 2, não detecta transposições adjacentes, porque para qualquer x ̸= e em A : (x , x −1 , e , . . . , e ) e (x , e , x −1 , . . . , e ) ∈ Pn (A). Por outro lado, o sistema de verificação de dígitos C utilizado no BI detecta erros de transposições adjacentes. Para verificar que assim é, note-se que neste caso as permutações utilizadas são as apresentadas em (12.13). Consideremos então a 1 . . . a 9 uma palavra ω de C . Suponhamos que ocorreu uma transposição entre as posições i e i +1, obtendo-se assim a palavra ω′ = a 1 . . . a i −1 a i +1 a i a i +2 . . . a 9 . Como ω ∈ C : σ1 (a 1 ) + σ2 (a 2 ) + · · · + σi −1 (a i −1 ) + σi (a i ) + σi +1 (a i +1 ) + · · · + σ9 (a 9 ) ≡ 0 (mod 11)
(12.14) Por outro lado, se ω′ ∈ C , teríamos: σ1 (a 1 ) + σ2 (a 2 ) + · · · + σi −1 (a i −1 ) + σi (a i +1 ) + σi +1 (a i ) + · · · + σ9 (a 9 ) ≡ 0 (mod 11)
(12.15) Daqui resultaria: σi (a i ) + σi +1 (a i +1 ) ≡ σi (a i +1 ) + σi +1 (a i ) (mod 11) ⇔ 6 Um caso particular é o código ASCII que é o código P8 (Z2 ). 503
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
⇔ (10 − i )a i − (10 − i − 1)a i ≡ (10 − i )a i +1 − (10 − i − 1)a i +1 (mod 11) ⇔ a i ≡ a i +1 (mod 11)
Assim, se a i ̸= a i +1 , então a 1 . . . a i −1 a i +1 a i a i +2 . . . a 9 ∈/ C . Seja C um código de verificação de dígitos associado às permutações σ1 , . . . , σn e a um elemento c ∈ A . Suponhamos que a 1 . . . a n e a 1 . . . a i −1 a i +1 a i a i +2 . . . a n são palavras de C . Então: σ1 (a 1 ) · . . . · σi −1 (a i −1 ) · σi (a i ) · σi +1 (a i +1 ) · σi +2 (a i +2 ) · . . . · σn (a n ) = c
(12.16)
σ1 (a 1 ) · . . . · σi −1 (a i −1 ) · σi (a i +1 ) · σi +1 (a i ) · σi +2 (a i +2 ) · . . . · σn (a n ) = c
(12.17)
Das igualdades anteriores obtém-se: σi (a i ) · σi +1 (a i +1 ) = σi (a i +1 ) · σi +1 (a i ).
(12.18)
Se definirmos x = σi (a i ), y = σi (a i +1 ) e T := σi +1 ◦ σi−1 , então teremos: σi +1 (a i +1 ) = σi +1 (σi−1 (σi (a i +1 ))) = T (y )
(12.19)
e, analogamente, σi +1 (a i ) = T (x ). Logo, a equação (12.18) lê-se: x · T (y ) = y · T (x )
(12.20)
Portanto, se C contém uma palavra ω tal que a palavra ω′ = τi (ω) obtida por transposição de duas letras adjacentes na posição i e i + 1 pertence a C , então a permutação T = σi +1 ◦ σi−1 satisfaz (12.20). Definição 12.2.4 Uma permutação T de um grupo (A, ·, e ) diz-se anti-simétrica se x · T (y ) ̸= y · T (x )
para quaisquer x ̸= y ∈ A . Tendo em conta o que foi discutido antes, conclui-se que C (A, σ1 , . . . , σn , c ) detecta transposições adjacentes se σi +1 σi−1 são permutações anti-simétricas para qualquer 1 ≤ i < n . Teorema 12.2.5 Seja (A, ·, e ) um grupo. Então existe um código C (A, σ1 , . . . , σn , c ), com n ≥ 2, que detecta todas as transposições adjacentes se e só se existe uma permutação anti-simétrica T : A → A . 504
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Demonstração: Suponhamos que C = C (A, σ1 , . . . , σn , c ) detecta transposições adjacentes e seja T = σ2 σ1−1 . Para quaisquer x , y ∈ A defina-se u = σ1−1 (x ) e v = σ1−1 (y ). Então, a palavra (u , v, e , e , . . . , e , w ) ∈ C , onde w é determinado pela equação (12.11). Como (v, u , e , e , . . . , e , w ) ̸∈ C , obtemos: σ1 (u ) · σ2 (v ) ̸= σ1 (v ) · σ2 (u ) ⇔ x · T (y ) ̸= y · T (x ),
(12.21)
o que mostra que T é anti-simétrica. Reciprocamente, suponhamos agora que T é uma permutação anti-simétrica. Para qualquer n ≥ 2 e c ∈ A consideremos o código C = C (A, T, T 2 , T 3 , . . . , T n , c ). Na nossa terminologica anterior temos σi = T i . Como σi +1 ◦ σi−1 = T i +1 ◦ (T i )−1 = T,
(12.22)
para qualquer 1 ≤ i < n , é uma permutação anti-simétrica, obtemos que C detecta transposições adjacentes. A partir do resultado anterior, concluímos que, para procurarmos códigos de verificação de dígitos sobre grupos que detectem transposições adjacentes, devemos procurar grupos finitos que permitam a existência de permutações anti-simétricas. Teorema 12.2.6 Qualquer grupo finito de cardinalidade ímpar admite um sistema de verificação de dígitos que detecta todas as transposições adjacentes. Demonstração: Seja (A, ·, e ) um grupo finito com |A| ímpar. Defina-se T (x ) := x −1 , para x ∈ A . Obviamente T é uma permutação. Sejam x , y ∈ A e suponhamos que x · y −1 = x · T (y ) = y · T (x ) = y · x −1 ; então (x · y −1 )2 = x · y −1 · y · x −1 = e . Logo, a ordem de x · y −1 é menor ou igual a 2. Como a ordem de qualquer elemento de A divide a cardinalidade de A e como |A| é ímpar, podemos concluir que a ordem de x · y −1 é 1, isto é, x = y . Logo, T é anti-simétrica. O próximo exemplo mostra que existem grupos de ordem par sobre as quais não existem sistemas de verificação de dígitos que detectem todas as transposições adjacentes. Consideremos o grupo Abeliano (Z10 , +, 0) e suponhamos que existe uma permutação anti-simétrica T : Z10 → Z10 , isto é, T é uma função que admite uma função inversa, tal que x + T (y ) ̸= y + T (x ), para quaisquer x , y ∈ Z10 ,
505
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
x ̸= y . Isto implica que x −T (x ) ̸= y −T (y ), para x ̸= y . Logo, a função T˜ : Z10 → Z10 com T˜ (x ) = x − T (x ) é injectiva e logo admite inversa. Como: 0 ≡ 1 + 9 ≡ 2 + 8 ≡ 3 + 7 ≡ 4 + 6 (mod 10),
(12.23)
tem-se que 5=
9 ∑ x =0
x=
9 ∑ x =0
T˜ (x ) =
9 ∑
(x − T (x )) =
x =0
!
9 ∑
x
−
x =0
9 ∑
! T (x ) = 0
(12.24)
x =0
o que é absurdo. Portanto, não pode existir uma permutação anti-simétrica do grupo (Z10 , +, 0). Consequentemente, não existe sistema de verificação de dígitos sobre (Z10 , +, 0) que detecte todas as transposições adjacentes. Definição 12.2.7 Sejam A um grupo, T : A → A uma função e T˜ : A → A a função definida por T˜ (x ) := x ·T (x )−1 , para todo x ∈ A . A função T diz-se um ortomorfismo de A se T e T˜ forem ambas permutações. Se A for um grupo abeliano, então T é uma permutação anti-simétrica se e só se é um ortomorfismo, porque x · T (y ) ̸= y · T (x ) é equivalente a T˜ (x ) = x · T (x )−1 ̸= y · T (y )−1 = T˜ (y ) para quaisquer x , y ∈ A , isto é, T˜ é injectiva e, portanto, é uma permutação. O exemplo anterior sugere o seguinte teorema. Teorema 12.2.8 Seja A um grupo abeliano finito com um único elemento de ordem 2. Não existe nenhum sistema de verificação de dígitos sobre A que detecte todas as transposições adjacentes. Demonstração: Seja x o único elemento de ordem 2 do grupo A . Suponhamos que T é um ortomorfismo e seja T˜ (a ) = a · T (a )−1 , para a ∈ A . A ideia é calcular o produto de todos os elementos de A , que deverá, por um lado, ser igual a x , mas aplicando T˜ , igual ao elemento neutro e , o que é absurdo uma vez que x ̸= e . Para formalizar esta ideia, definimos uma relação de equivalência: dois elementos a ,b ∈ A dizem-se equivalentes, se e só se a = b ou a = b −1 . Portanto, juntamos cada elemento com o seu inverso e como A só tem um elemento de ordem dois, x , e um elemento de ordem um, e , todas as outras classes de equivalência consistem em dois elementos. Sejam e , x , a 1 , . . . , a n representantes das classes de equivalência. Então, ∏ a ∈A
506
a = e ·x ·
n ∏ i =1
(a i · a i−1 ) = x
(12.25)
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
e ∏ a ∈A
a=
∏ a ∈A
T˜ (a ) =
∏
−1
(a · T (a ) ) =
a ∈A
!
∏ a a ∈A
·
∏
!−1 T (a )
= x · x −1 = e ,
(12.26)
a ∈A
o que é absurdo, pois x ̸= e . Logo, não pode existir nenhum ortomorfismo e, consequentemente, não existe nenhum sistema de verificação de dígitos sobre A que detecte todas as transposições adjacentes. Em 1947, Lowell Paige mostrou que um grupo abeliano finito admite uma permutação anti-simétrica se e só se não contém nenhum elemento de ordem dois ou possui mais do que um (Paige, 1947). A demonstração do Teorema de Paige é feita abaixo usando um algoritmo que permite, a partir de uma permutação qualquer de um grupo finito A , construir uma permutação T , tal que |T˜ (A)| ≥ |A|−1. A demonstração apresentada é a de Paige de 1947. Outras demonstrações são possíveis. Teorema 12.2.9 Seja A um grupo abeliano de ordem n . Existe uma permutação T de A tal que |T˜ (A)| ≥ n − 1. Demonstração: Basta provar que, para qualquer permutação T de A com |T˜ (A)| < ˜ n − 1, existe uma permutação S tal que |T˜ (A)| < |S(A)| . Sejam m = |T˜ (A)| e B ⊂ A um subconjunto com m elementos, tal que T˜ (B ) = T˜ (A). Como m ≤ n − 2 existem elementos u , v ∈ A \ B com u ̸= v . Seja a 1 ∈ B com T˜ (a 1 ) = T˜ (u ). Se a 1 T (v )−1 ̸∈ T˜ (A), então define-se uma permutação S de A por: S:
→
T (v )
v
→
T (a 1 )
x
→
T (x )
a1
se x ̸= a 1 , v
˜ ) = T˜ (u ) = T˜ (a 1 ) e S(x ˜ ) = T˜ (x ) para x ∈ B \ {a 1 }, tem-se que T˜ (A) ⊆ S(A) ˜ . Como S(u ˜ 1 ) = a 1 T (v )−1 ∈ S(A) ˜ \ T˜ (A), conclui-se que |S(A)| ˜ Como S(a > m. −1 ˜ ˜ Se a 1 T (v ) ∈ T (A), então existe a 2 ∈ B tal que T (a 2 ) = a 1 T (v )−1 . Logo, a 1 ̸= a 2 , caso contrário T (a 2 ) = T (v ), ou seja, a 2 = v , o que é impossível já que v ̸∈ B .
507
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
Se a 2 T (a 1 )−1 ̸∈ T˜ (A) define-se uma permutação S de A tal que:
a1 a 2 S: v x
→
T (v )
→
T (a 1 )
→
T (a 2 )
→
T (x )
˜ ) = S(u T˜ (u ) = T˜ (a 1 ) ˜ 1 ) = a 1 T (v )−1 = T˜ (a 2 ) e observamos que S(a ˜ 2 ) = a 2 T (a 1 )−1 ̸∈ T˜ (A) S(a
se x ̸= a 1 , a 2 , v
˜ , isto é, |S(A)| ˜ Logo T˜ (A) ( S(A) > m. Se existe a 3 ∈ B tal que T˜ (a 3 ) = a 2 T (a 1 )−1 , então a 3 ̸= a 1 , a 2 , caso contrário a 1 = a 2 . Enquanto se tiver a i −1 T (a i −2 )−1 ∈ T˜ (A), podemos continuar do mesmo modo e encontrar elementos a 1 , a 2 , a 3 , . . . , a k ∈ B tais que a i ̸= a j para i ̸= j e T˜ (a 1 ) = T˜ (u ), T˜ (a 2 ) = a 1 T (v )−1 , T˜ (a 3 ) = a 2 T (a 1 )−1 , · · · , T˜ (a k ) = a k −1 T (a k −2 )−1
Note-se que T˜ (a i ) ̸= T˜ (a j ) para i ̸= j . Como B é finito este processo tem de terminar. Obtemos k ≤ |B | tal que a k T (a k −1 )−1 ̸∈ T˜ (A) e definimos uma permutação S de A tal que:
a1 → T (v ) a → T (a 1 ) 2 . . . S: ak → T (a k −1 ) e observamos que v → T (a k ) x → T (x ) se x ̸= a 1 , a 2 , . . . , a k , v
˜ ) S(u ˜ 1) S(a
=
T˜ (u )
=
a1
T (v )−1
= T˜ (a 1 ) = T˜ (a 2 )
˜ 2) S(a
=
a 2 T (a 1 )−1
= T˜ (a 3 )
.. . ˜ k −1 ) = a k −1 T (a k −2 )−1 = T˜ (a k ) S(a ˜ k ) = a k T (a k −1 )−1 ̸∈ T˜ (A) S(a
˜ Logo, |S(A)| > m.
A demonstração do resultado anterior é construtiva7 , fornecendo uma técnica para obter uma permutação que verifique as condições do teorema. Vejamos um pequeno exemplo. Seja A o grupo (Z10 , +, 0) e T a permutação identidade, isto é, T = i d . Teremos assim: x
0
1
2
3
4
5
6
7
8
9
T (x ) T˜ (x )
0
1
2
3
4
5
6
7
8
9
0
0
0
0
0
0
0
0
0
0
7 Um algoritmo na linguagem de programação Python encontra-se no apêndice. 508
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Neste caso, |T˜ (A)| = 1 e considera-se um subconjunto B de A com 1 elemento, seja B = {a 1 }, com a 1 = 0. Consideremos agora dois elementos distintos de A \ B , u = 1 e v = 2 por exemplo. Assim, temos T˜ (0) = T˜ (1). Uma vez que a 1 − T (v ) = 0 − 2 ≡ 8 (mod 10) e 8 ̸∈ T˜ (A), podemos definir uma nova permutação em A , seja S , tal que S(0) := T (2) = 2, S(2) := T (0) = 0 e S(x ) := T (x ) para x ∈ A \ {0, 2}. Desta forma, a permutação S será tal que: x
0
1
2
3
4
5
6
7
8
9
S(x ) ˜ ) S(x
2
1
0
3
4
5
6
7
8
9
8
0
2
0
0
0
0
0
0
0
˜ Observamos que T˜ (A) ⊂ S(A) = {0, 2, 8}. Então considere-se um conjunto B com ˜ ) = S(A) ˜ ; seja B = {0, 1, 2}. Agora, de A \ B consideremos três elementos tal que S(B ˜ = S(u ˜ ), portanto escolhedois elementos distintos, u = 3 e v = 4. Note-se que S(1) ˜ , podemos definir mos a 1 := 1. Uma vez que a 1 −S(v ) = 1−4 ≡ 7 (mod 10) e 7 ̸∈ S(A) uma nova permutação em A , seja S 2 , tal que S 2 (1) := S(4), S 2 (4) := S(1) e S 2 (x ) := S(x ) para x ∈ A \ {1, 4}. Desta forma, a permutação S 2 será tal que: x
0
1
2
3
4
5
6
7
8
9
S 2 (x ) S˜2 (x )
2
4
0
3
1
5
6
7
8
9
8
7
2
0
3
0
0
0
0
0
Analisando a tabela anterior observa-se que T˜ (A) ⊂ S˜2 (A) = {0, 2, 3, 7, 8}. Procedendo de forma análoga às anteriores, consideremos B = {0, 1, 2, 3, 4}, u = 5 e v = 6. Agora, sendo S˜2 (3) = S˜2 (u ), considere-se a 1 := 3. Mas como, a 1 −S 2 (v ) = 3−6 ≡ 7 ˜ , então tomamos a 2 := 1, pois S˜2 (a 2 ) = a 1 −S 2 (v ). Agora, (mod 10) e 7 = S˜2 (1) ∈ S(A) ˜ . Desta forma, considere-se tem-se a 2 −S 2 (a 1 ) = 1−3 ≡ 8 (mod 10) e 8 = S˜2 (0) ∈ S(A) a 3 := 0, já que S˜2 (a 3 ) = a 2 − S 2 (a 1 ). Assim, tem-se a 3 − S 2 (a 2 ) = 0 − 4 ≡ 6 (mod 10) e uma vez que 6 ̸∈ S˜2 (A), podemos definir uma nova permutação em A , seja S 3 tal que S 3 (3) := S 2 (6), S 3 (1) := S 2 (3), S 3 (0) := S 2 (1), S 3 (6) := S 2 (0) e S 3 (x ) := S 2 (x ) para x ∈ A \ {0, 1, 3, 6}. Logo, a permutação S 3 será tal que: x
0
1
2
3
4
5
6
7
8
9
S 3 (x ) S˜3 (x )
4
3
0
6
1
5
2
7
8
9
6
8
2
7
3
0
4
0
0
0
Observando a permutação agora construída, concluímos que T˜ (A) ⊂ S˜3 (A) = {0, 2, 3, 4, 6, 7, 8}. Se se continuar esta construção, obter-se-á a permutação S 5 de A tal que |S˜5 (A)| = 9 = 10 − 1: 509
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
S5 = S˜5 =
0
1
2
3
4
5
6
7
8
9
0
9
6
2
7
1
8
4
3
5
0
1
2
3
4
5
6
7
8
9
0
2
6
1
7
4
8
3
5
4
! !
Com o último resultado estamos em condições de demonstrar o Teorema seguinte, que permitirá resolver o problema de detectar todas as transposições adjacentes, recorrendo a grupos abelianos finitos. Teorema 12.2.10 (Paige, 1946) Seja A um grupo abeliano finito. Existe um sistema de verificação de dígitos sobre A que detecta todas as transposições adjacentes se e só se A não tem nenhum elemento de ordem dois ou tem mais do que um. Demonstração: Seja A um grupo abeliano de ordem n . Se existe um sistema de verificação de dígitos sobre A que detecta todas as transposições adjacentes, então A não pode ter um único elemento de ordem 2 pelo Teorema 12.2.8. Suponhamos pois que A não tem nenhum elemento de ordem dois ou tem mais do que um. Os elementos de ordem menor ou igual a 2 formam um subgrupo U de A e, como na ∏ ∏ prova do Teorema 12.2.8, podemos verificar que a ∈A a = u ∈U u . Como A não tem nenhum elemento de ordem dois ou tem mais do que um, U = {e } ou |U | = 2k , com k ≥ 2, e existem k geradores u 1 , . . . , u k de U , tal que qualquer elemento de U tem uma representação única da forma u = u 1α1 · · · u kαk onde αi ∈ {0, 1}.8 Logo, k −1 como k > 1, 2k −1 é par, u i2 = e e ∏
a=
a ∈A
∏ u ∈U
u=
∏ α∈{0,1}k
α
u 1α1 · · · u k k =
k ∏
u i2
k −1
=e
(12.27)
i =1
Utilizando o algoritmo do Teorema 12.2.9 podemos construir (por exemplo, a partir da identidade) uma permutação T de A , tal que |T˜ (A)| ∈ {n − 1, n}. Seja B ⊆ A tal que |B | = n − 1 e T˜ (x ) ̸= T˜ (x ′ ), para todo x , x ′ ∈ B com x ̸= x ′ . Seja ∏ ∏ y ∈ A \ B . Como e = y x ∈B x tem-se que x ∈B x = y −1 . Analogamente, tem-se ∏ −1 = T (y ). Portanto, para z ∈ A \ T˜ (B ): x ∈B T (x ) e =z
∏ x ∈B
T˜ (x ) = z
∏
x T (x )−1 = z y −1 T (y ) ⇒ T˜ (y ) = y T (y )−1 = z .
(12.28)
x ∈B
8 Repare que, para qualquer elemento u ∈ U , o subgrupo V gerado por u tem exactamente dois elementos e pelo Teorema de Lagrange |U | = |V ||U /V | = 2|U /V |. Aplicando este argumento sucessivamente, podemos vericar que existe um número k , tal que |U | = 2k e elementos u 1 , . . . , u k que geram U . Logo U ≃ Zk2 . 510
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Logo, T˜ (A) = A , isto é, T é uma permutação anti-simétrica e, pelo Teorema 12.2.5, existe um sistema de verificação de dígitos sobre A . O Teorema 12.2.10 confirma que não pode existir um sistema de verificação de dígitos que detecte todas as transposições adjacentes sobre (Z10 , +, 0), porque (Z10 , +, 0) tem um único elemento de ordem 2. Existe porém um grupo não abeliano com dez elementos que detecta todas as transposições adjacentes. Assim, para resolver o problema de determinar grupos onde existam permutações anti-simétricas, somos motivados a procurá-los dentro dos grupos não abelianos. Vejamos o caso dos chamados «grupos diedrais». O grupo diedral D n , com n ≥ 2, é constituído pelas simetrias do plano que fixam um polígono regular com n vértices. Tais simetrias têm de fixar necessariamente o centro geométrico do polígono; assim sendo, terão de ser rotações ou relexões. O grupo diedral D n é gerado por uma rotação de 360/n graus e por uma reflexão, sendo então constituído por 2n elementos.9
(a) D 3
(b) D 4
(c) D 5
FIGURA 12.2 Simetrias de polígonos n = 3, 4, 5
Uma forma de representar este grupo consiste em usar matrizes 10 : Dn =
¦
a b 0 1
© ∈ M 2 (Zn ) | a ∈ {1, −1}
onde a rotação de 360b /n graus, corresponde à matriz 10 b1 , e a reflexão corres 0 ponde à matriz −1 0 1 . D n será assim um grupo com a multiplicação de matrizes. Para simplificar a notação escrevemos (a ,b ) com a = ±1 e b ∈ Zn e, assim, a multiplicação de matrizes corresponderá à operação: (a ,b ) · (a ′ ,b ′ ) = (a a ′ , a b ′ + b ).
(12.29)
O elemento neutro é (1, 0) e o inverso de (a ,b ) é (a , −a b ) — repare que a 2 = 1, para a ∈ {1, −1}. 9 Toda a simetria do polígono é uma composição de uma rotação e uma reexão. 10 M 2 (Zn ) é o conjunto das matrizes 2 × 2 com entradas no anel Zn .
511
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
Teorema 12.2.11 Sobre qualquer grupo D n com n ≥ 2 existem sistemas de verificação de dígitos que detectam todas as transposições adjacentes. Demonstração: Só vamos indicar uma permutação anti-simétrica no caso de n ímpar. No caso de n ser um número par, também é possível definir uma permutação anti-simétrica (Teorema 4.2 em (Schulz, 2000)). Seja n ímpar, então podemos definir uma permutação T por: T (1,b ) := (1, −b ) e T (−1,b ) = (−1,b + 1)
(12.30)
para qualquer b ∈ Zn . Para dois elementos (1,b ), (1, c ) tem-se que (1,b ) · T (1, c ) = (1,b ) · (1, −c ) = (1,b − c ).
(12.31)
Logo, se (1,b ) · T (1, c ) = (1, c ) · T (1,b ), então b − c ≡ c − b (mod n) ⇒ 2b ≡ 2c (mod n) e como 2 não divide n teremos b = c . Analogamente, mostra-se que (−1,b )·T (−1, c ) = (−1, c )T (−1,b ) ⇒ b = c . Para dois elementos (1,b ), (−1, c ) tem-se: (1,b ) · T (−1, c ) = (−1, c + b + 1) e (−1, c ) · T (1,b ) = (−1, c + b )
(12.32)
Logo, (1,b ) · T (−1, c ) ̸= (−1, c ) · T (1,b ) para qualquer b, c . Portanto, T é uma permutação anti-simétrica. Um exemplo da utilização dos grupos diedrais, num sistema de verificação de dígitos, encontra-se nas notas do antigo sistema monetário alemão — o Marco alemão. Para verificar a validade de uma nota utilizou-se um sistema de verificação de dígitos sobre o grupo diedral D 5 . Identificamos os elementos do grupo D 5 com as matrizes {(1, 0), . . . , (1, 4), (−1, 0), . . . , (−1, 4)}, que podemos também codificar pelos dígitos entre 0 e 9 por (1,b ) 7→ b e (−1,b ) 7→ b + 5 para 0 ≤ b ≤ 4, ou seja (a ,b ) 7→ b + 5 |a |−a . Utilizando esta codificação, a multiplicação de D 5 toma a 2 forma apresentada na tabela 12.2. Em cada nota encontrava-se inscrita uma sequência de 11 dígitos a 1 a 2 x 1 x 2 x 3 x 4 x 5 x 6 x 7 a 3 p,
onde a i ∈ {A, D,G , K , L, N ,S,U , Y,Z } e x i , p ∈ {0, 1, 2, . . . , 9}.
512
FIGURA 12.3 Deutsche Mark
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
(1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (−1, 0) (−1, 1) (−1, 2) (−1, 3) (−1, 4) 0
1
2
3
4
5
6
7
8
9
(1, 0) 7→ 0
0
1
2
3
4
5
6
7
8
9
(1, 1) 7→ 1
1
2
3
4
0
9
5
6
7
8
(1, 2) 7→ 2
2
3
4
0
1
8
9
5
6
7
(1, 3) 7→ 3
3
4
0
1
2
7
8
9
5
6
(1, 4) 7→ 4
4
0
1
2
3
6
7
8
9
5
(−1, 0) 7→ 5
5
9
8
7
6
0
4
3
2
1
(−1, 1) 7→ 6
6
5
9
8
7
1
0
4
3
2
(−1, 2) 7→ 7
7
6
5
9
8
2
1
0
4
3
(−1, 3) 7→ 8
8
7
6
5
9
3
2
1
0
1
(−1, 4) 7→ 9
9
8
7
6
5
4
3
2
1
0
TABELA 12.2 Multiplicação de D 5
As letras foram codificadas em dígitos entre 0 e 9, como se ilustra na tabela abaixo. A
D
G
K
L
N
S
U
Y
Z
0
1
2
3
4
5
6
7
8
9
Utilizando a permutação σ =
0
1
1
5
2
3
4
5
6
7
8
9
!
defi-
7 6 2 8 3 0 9 4 ne-se um sistema de verificação de dígitos C = C (D 5 , σ, σ2 , σ3 , . . . , σ10 , i d , 0).
Note-se que σ tem ordem 8, isto é, σ8 = i d . Por exemplo, o número G N 2494664L9 é válido porque: σ(2) · σ2 (5) · σ3 (2) · σ4 (4) · σ5 (9) · σ6 (4) · σ7 (6) · 6 · σ(4) · σ2 (4) · 9 = = (7 · 9) · (1 · 1) · (1 · 8) · (3 · 6) · (2 · 7) · 9 = (3 · 2) · (9 · 9) · (9 · 9) =0·0·0=0
O exemplo da verificação do número de série das notas do antigo sistema monetário alemão conduz a seguinte questão: Qual o sistema de verificação do número de série das notas de Euro? 513
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
Contrariamente ao que talvez se possa esperar, após a análise de um exemplo tão sofisticado, não são necessários grandes conhecimentos matemáticos para entender o sistema de verificação presente neste sistema monetário. Na realidade, o sistema de FIGURA 12.4 Nota de 10 euros verificação aqui presente apenas associa ao primeiro dígito (uma letra) do número de série um valor numérico p (que codifica o país de origem). Posteriormente, e para verificar a validade do número de série, apenas teremos de verificar se a soma dos restantes onze dígitos é congruente com p módulo 9. Vejamos um exemplo. Vamos verificar se o número de série S00212913862 presente na nota de 10 euros da figura (12.4) é, de facto, válido. Uma pequena pesquisa feita na internet sobre este assunto11 e descobrimos que a letra S corresponde ao número 7; e mais, descobrimos também que esta nota que hoje circula no nosso país, foi emitida na Itália. Agora, se fizermos: 0 + 0 + 2 + 1 + 2 + 9 + 1 + 3 + 8 + 6 + 2 = 34 ≡ 7 (mod 9)
E, desta forma tão simples, verificamos que o número de série desta nota é de facto válido. Se o leitor pretende verificar outros números de série das notas de euro, basta descodificar a primeira letra do número de série da nota utilizando a seguinte tabela: Letra Z
Y
X V U
T
S
P
N M
L
H
G
F
E
Valor 0
1
2
6
7
1
3
5
0
1
2
3
País
4
5
4
B GR D E F IRL I NL A PT FIN SLO CY M SK
Voltando à questão da determinação dos grupos onde existem permutações anti-simétricas, é importante referir que este é um problema que ainda não está completamente resolvido. A conjectura de Gallian-Mullin afirma que qualquer grupo finito não abeliano admite uma permutação anti-simétrica (Gallian et al, 1995). Esta conjectura foi parcialmente provada por Stefan Heiss em (Heiss, 1997) para grupos solúveis. Muito semelhante é a conjectura de Hall-Paige que afirma que qualquer grupo A que não tem nenhum elemento de ordem dois ou possui mais 11 Pode obter mais informações na página www.ibiblio.org/theeuro. 514
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
do que um tem uma permutação completa, isto é, uma permutação T : A → A tal que T −1 é um ortomorfismo.
12.3 SISTEMAS DE VERIFICAÇÃO DE DÍGITOS UTILIZANDO QUADRADOS LATINOS Para definir um sistema de verificação de dígitos sobre um grupo finito (A, ·, e ), como por exemplo, C := {(a 1 , . . . , a n ) ∈ A n | a 1 · a 2 · . . . · a n −1 = a n }
a associatividade do produto · não é necessária, podendo-se verificar se uma palavra pertence a C ; por exemplo: (· · · ((a 1 · a 2 ) · a 3 ) · · · ) · a n −1 = a n .12
(12.33)
Um par (A, ·) é um quase-grupo se A é um conjunto não vazio, · : A × A → A é uma operação binária, tal que para todos a ,b ∈ A as equações a · x = b e y · a = b têm ambas uma única solução. Em particular, a operação · satisfaz a lei do corte, isto é, a b = a c ou b a = c a implica b = c . Por exemplo, se Q 3 = {0, 1, 2} e a ·b := b −a (mod 3), para a ,b ∈ Q 3 , então para a · x = b obtemos x = (−a ) · b = b + a (mod 3) e para y · a = b obtemos y = b · a = a − b (mod 3). O par (Q 3 , ·) é um quase-grupo que não é um grupo, porque (1 · 1) · 1 = 1 ̸= 2 = 1 · (1 · 1). Uma outra forma de representar quase-grupos (finitos) é pela sua tabela da multiplicação. A tabela do nosso pequeno exemplo (Q 3 , ·) é a seguinte: ·
0
1
2
0
0
1
2
1
2
0
1
2
1
2
0
Podemos observar que, em toda a linha e em toda a coluna, cada elemento de Q 3 aparece exactamente uma vez, o que está de acordo com a definição de quase-grupo. Na verdade, a existência e unicidade das soluções das equações a · x = b e y · a = b implica que as funções x 7→ a · x e y 7→ y · a sejam permutações. Portanto, um quase-grupo (A, ·) com n elementos é equivalente a um quadrado 12 Repare que a nossa escolha das parênteses é arbitrária. O número de escolhas de parênteses de um (2n−2)! produto de n elementos é igual ao número de Catalan C n−1 = n!(n−1)! . 515
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
n × n cujas linhas e colunas são permutações de A . Estes quadrados chamam-se,
segundo Leonhard Euler, quadrados latinos.13 Um tipo de quadrado latino muito conhecido na actualidade é o jogo Sudoku, em que o jogador tem de completar um tipo particular de um quadrado latino 9 × 9 (ou seja, uma tabela da multiplicação de um quase-grupo). Nesta última secção estudaremos as propriedades de sistemas de verificação de dígitos sobre quase-grupos e analisaremos algumas aplicações de quadrados latinos à teoria de códigos. Um código de verificação de dígitos C = C (A, σ1 , . . . , σn ; c ) sobre um grupo A com permutações σi e c ∈ A foi definido em (12.10) por C = {(a 1 , . . . , a n ) ∈ A n | σ1 (a 1 ) · σ2 (a 2 ) · . . . · σn (a n ) = c }.
Como a operação de um quase-grupo não é necessariamente associativa, uma expressão do tipo σ1 (a 1 ) · σ2 (a 2 ) · . . . · σn (a n ) é ambígua. Para definir uma noção de um código de verificação de dígitos sobre um quase-grupo temos de clarificar esta ambiguidade. Definimos o produto de n ≥ 1 elementos a 1 , . . . , a n de um ∏n ∏1 ∏n+1 quase-grupo A inductivamente por i =1 a i = a 1 e i =1 a i = i =1 a i ·a n+1 , para ∏n n ≥ 1. Designamos i =1 a i também por (· · · ((a 1 · a 2 ) · a 3 ) · · · ) · a n . Definição 12.3.1 Seja (A, ·) um quase-grupo finito. O conjunto Cn = {(a 1 , . . . , a n ) ∈ A n | (· · · ((a 1 · a 2 ) · a 3 ) · · · ) · a n −1 = a n }
diz-se o código de verificação de dígitos de comprimento n sobre o quase-grupo A . Ralph-Hardo Schulz demonstrou o seguinte Teorema em (Schulz, 1991). Teorema 12.3.2 (Schulz) Seja (A, ·) um quase-grupo finito e n > 3. O conjunto Cn = {(a 1 , . . . , a n ) ∈ A n | (· · · ((a 1 · a 2 ) · a 3 ) · · · ) · a n −1 = a n }
é um código de bloco que detecta todos os erros singulares. 1. Cn detecta todos os erros de transposição adjacentes se e só se, para todo a ,b, c , d ∈ A com b ̸= c : 13 Chamam-se «latinos» porque, no seu estudo, Euler utilizou letras do alfabeto latino para designar os elementos de A . 516
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
(i) (a · b ) · c ̸= (a · c ) · b ; (ii) b · c ̸= c · b ; (iii) [a = d · b ∧ b = d · a ] ⇒ a = b . 2. Cn detecta todos os erros de transposição intercalados se e só se, para todo a ,b, c , d ∈ A com b ̸= c : (i) ((a · b ) · c ) · d ̸= ((a · d ) · c ) · b ; (ii) (b · c ) · d ̸= (d · c ) · b ; (iii) [d = (a · b ) · c ∧ b = (a · d ) · c ] ⇒ b = d . Demonstração: Utilizando a lei do corte, podemos provar que Cn detecta todos os erros singulares. Sejam w = (a 1 , . . . , a n ), w ′ = (a 1′ , . . . , a n′ ) duas palavras de Cn que coincidem em, pelo menos, n − 1 posições. Então, existe j ∈ {1, . . . , n} tal que a i = a i′ ∀i ̸= j . Se j = n então: a n = (· · · ((a 1 · a 2 ) · a 3 ) · · · ) · a n−1 = a n′ ,
(12.34)
isto é, w = w ′ . Se 1 < j < n , então para b := (· · · ((a 1 · a 2 ) · a 3 ) · · · ) · a j −1 temos (· · · ((b · a j ) · a j +1 ) · · · ) · a n −1 = a n = (· · · ((b · a ′j ) · a j +1 ) · · · ) · a n−1
(12.35)
e pela lei do corte concluímos que b ·a j = b ·a ′j e, portanto, a j = a ′j , isto é, w = w ′ . Analogamente, concluímos que w = w ′ , se j = 1. (1) Suponhamos que A verifica todas as condições (i), (ii) e (iii). Seja w = (a 1 , . . . , a n −1 , a n ) ∈ Cn e 2 ≤ i ≤ n − 2. Defina-se w ′ = (a 1 , . . . , a i −1 , a i +1 , a i , a i +2 , . . . , a n ) e suponhamos que w ′ ∈ Cn . Seja b = (· · · (a 1 · a 2 ) · · · ) · a i −1 . Então (· · · ((b · a i ) · a i +1 ) · · · ) · a n −1 = a n = (· · · ((b · a i +1 ) · a i · · · ) · a n −1 .
(12.36)
Pela lei do corte obtemos (b · a i ) · a i +1 = (b · a i +1 ) · a i e pela condição (i) obtém-se a i = a i +1 , isto é, w = w ′ . Se a transposição ocorre nas duas primeiras posições, isto é, se i = 1, definimos w ′ = (a 2 , a 1 , a 3 , . . . , a n ). Se w ′ ∈ Cn , então (· · · ((a 1 · a 2 ) · a 3 ) · · · ) · a n −1 = a n = (· · · ((a 2 · a 1 ) · a 3 ) · · · ) · a n−1 .
(12.37) 517
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
Portanto, pela lei do corte, a 1 · a 2 = a 2 · a 1 e pela condição (ii) teremos a 1 = a 2 . Se a transposição ocorre nas duas últimas posições, isto é, se i = n − 1, definimos w ′ = (a 1 , . . . , a n−2 , a n , a n −1 ). Suponhamos que w ′ ∈ Cn . Seja b = (· · · (a 1 · a 2 ) · · · ) · a n −2 . Então, como w ∈ Cn , obtemos b · a n −1 = a n . Como w ′ ∈ Cn , obtemos b · a n = a n −1 . Pela condição (iii), obtemos a n = a n−1 , isto é, w = w ′ . Suponhamos que Cn detecta todas as transposições adjacentes. Sejam a ,b, c ∈ A . Se (a · b ) · c = (a · c ) · b , então podemos construir a palavra w = (a ,b, c , c , . . . , c , x ) tal que x = (· · · ((a ·b )·c )·c ) · · · )·c , que pertence ao código Cn . Como (a · b ) · c = (a · c ) · b , obtém-se w ′ = (a , c ,b, c , . . . , c , x ) ∈ Cn . Como Cn detecta todas as transposições adjacentes, teremos b = c . Ou seja, A satisfaz a condição (i). Analogamente, se b · c = c · b , definem-se as palavras w = (b, c ,b, . . . ,b, x ) e w ′ = (c ,b,b, . . . ,b, x ). Como w, w ′ ∈ Cn teremos b = c , isto é, A satisfaz condição (ii). Se a = d · b e b = d · a , então definimos w = (a , . . . , a , x ,b, a ) e w ′ = (a , . . . , a , x , a ,b ) onde x é a solução da equação14 a n −3 · x = d . Então, w, w ′ ∈ Cn e, consequentemente, b = a , isto é, A satisfaz (iii).
Analogamente se mostraria (2). Exercício 12.3.3 Resolva o seguinte puzzle Sudoku: 9 7
1
4
5
4 8
6
5
2
5 9
3
7
2
4 2
5
9
6
2
3 4
5 4
6
2
1
6
3
6
8
6
1
5
7
Será que os códigos Cn sobre o quase-grupo cuja tabela de multiplicação é dada por este quadrado de Sudoku detectam todas as transposições adjacentes ? As condições 1(i–iii) verificam-se no exemplo do quase-grupo Q 3 . Note-se que nenhum grupo satisfaz a condição 1(i) e nenhum quase-grupo abeliano verifica a condição 1(ii). 14 Dene-se a k = a k −1 · a para k > 1 e a 1 = a . 518
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Podemos utilizar grupos para obter quase-grupos. Sejam (G , ·, e ) um grupo e α, β , γ permutações de G . Defina-se um novo produto em G por a ∗ b := γ(α(a ) · β (b ))
(12.38)
para todo a ,b ∈ G . Verifique-se que x = β −1 α(a )−1 · γ−1 (b ) é a única solução da equação a ∗ x = b e, analogamente, y = α−1 γ−1 (b ) · β (a )−1 é a única solução da equação y ∗ a = b . Designamos este quase-grupo por G α,β ,γ . No caso dos exemplos cíclicos Zm podemos definir as seguintes permutações: α(a ) = ha e β (a ) = k a , onde h e m são dois números primos entre si15 , assim como k e m , e γ(a ) = a + l para qualquer l ∈ Zm . Logo, o novo produto em Zm é a ∗ b ≡ ha + k b + l (mod m ). Este quase-grupo é designado por Zm ,h,k ,l . Teorema 12.3.4 Sejam h, m , k , l ∈ N tais que m > 1, mdc(h, m ) = mdc(k , m ) = 1 e A = Zm ,h,k ,l . 1. Os códigos Cn , n > 3, sobre Zm ,h,k ,l detectam todas as transposições adjacentes se e só se mdc(h − 1, m ) = mdc(h − k , m ) = mdc(k + 1, m ) = 1. 2. Os códigos Cn , n > 3, sobre Zm ,h,k ,l detectam todas as transposições intercaladas se e só se mdc(h 2 − 1, m ) = mdc(h 2 − k , m ) = mdc(hk + 1, m ) = 1. Demonstração: (1) Temos de analisar quando é que as condições 1(i–iii) do Teorema 12.3.2 se verificam. Sejam a ,b, c , d ∈ Zm tais que (a ∗ b ) ∗ c = (a ∗ c ) ∗ b . Isto é equivalente a h 2 a + hk b + hl + k c + l ≡ h 2 a + hk c + hl + k b + l (mod m )
(12.39)
o que por sua vez é equivalente a k (h − 1)(b − c ) ≡ 0 (mod m ).
(12.40)
Como k e m são primos entre si, podemos concluir que m divide (h − 1)(b − c ). Logo, A satisfaz a condição (i) se e só se h − 1 e m são primos entre si. Analogamente, se b ∗ c = c ∗b , então hb + k c + l ≡ hc + k b + l (mod m ) que é equivalente a (h − k )(b − c ) ≡ 0 (mod m ) e A satisfaz (i i ) se e só se h − k e m forem primos entre si. Suponhamos que a = d ∗ b e b = d ∗ a , então a ≡ hd + k b + l (mod m ) e b ≡ hd +k a +l (mod m ). Logo, a −b ≡ k (b −a ) (mod m ) e m divide (k +1)(b −a ). Se 15 Dois números a ,b são primos entre si, se o máximo divisor comum, mdc(a ,b ), de a e b for 1. 519
SISTEMAS DE VERIFICAÇÃO DE DÍGITOS
k +1 e m são primos entre si, então a = b , isto é, A satisfaz (iii). Se k +1 e m não são
primos entre si, então o máximo divisior comum r = mdc(k + 1, m ) é differente de 1 e existe s < m tal que m = r s . Seja a = 0 e b = s . Como mdc(h, m ) = 1, existe u ∈ A tal que u h ≡ 1 (mod m ). Seja d = u (s − l ) (mod m ). Então d ∗ b = hu (s − l ) + k s + l ≡ (k + 1)s ≡ 0 = a (mod m ) e d ∗ a = hu (s − l ) + 0 + l ≡ s = b (mod m ). Como s ̸= 0 em A , teremos a ̸= b , isto é, A não satisfaz a condição (i i i ). (2) De forma analoga ao ponto (1) mostra-se que ((a ∗b )∗c )∗d = ((a ∗d )∗c )∗b é equivalente a k (h 2 − 1)(b − d ) ≡ 0 (mod m ) para a ,b, c , d ∈ A . Logo, a condição 2(i) do Teorema 12.3.2 verifica-se se e só se h 2 − 1 e m forem primos entre si. Por sua vez, mostra-se que (b ∗ c ) ∗ d = (d ∗ c ) ∗ b é equivalente a (h 2 − k )(b − d ) ≡ 0 (mod m ). Logo, a condição 2(ii) do Teorema 12.3.2 verifica-se se e só se h 2 − k e m forem primos entre si. Se d = (a ∗ b ) ∗ c e b = (a ∗ d ) ∗ c , então (hk − 1)(b − d ) ≡ 0 (mod m ). Logo, se hk − 1 e m são primos entre si, então A satisfaz condição 2(iii) do Teorema 12.3.2. Caso contrário, suponhamos que A satisfaz a condição 2(iii) do Teorema 12.3.2 tal que m = s · mdc(hk − 1, m ) com 0 < s < m . Sejam a ,b ∈ A elementos arbitrários e defina-se d = b + s (mod m ). Então, existe c ∈ A tal que b = (a ∗ d ) ∗ c . Logo: d = b + s = (a ∗ d ) ∗ c + s = h 2 a + hk d + hl + k c + l + s = h 2 a + hk b + hl + k c + l + (hk + 1)s = ((a ∗ b ) ∗ c ).
Como s ̸= 0, os elementos b e d são diferentes, logo A não satisfaz a condição 2(iii) do Teorema 12.3.2. Note-se que o produto do quase-grupo Q 3 é definido por a ·b ≡ b − a = 2a + 1b + 0 (mod 3). Portanto, Q 3 = Z3,2,1,0 , com h = 2, k = 1 e l = 0. Como h − 1 = h − k = 1 e k + 1 = 2 e 3 são primos entre si, todo o código Cn sobre Q 3 (com n > 3) detecta transposições adjacentes, mas não detecta transposições intercaladas, já que h 2 − 1 = h 2 − k = hk + 1 = 3. Na verdade, por exemplo, as palavras (0, 0, 1, 1) e (0, 1, 1, 0), pertencem ambas ao código C4 . É fácil observar que, para um quase-grupo Zm ,h,k ,l verificar 12.3.4(1), m terá de ser ímpar, pois se m for par um dos números h ou h − 1 seria par. Analogamente, se um quase-grupo Zm ,h,k ,l satisfaz 12.3.4(2), então nenhum dos elementos h , h − 1 e h + 1 pode ser divisível por um factor de m e, portanto, m tem de ser ímpar e não divisível por 3. O exercício que se segue é deixado como desafio.
520
CHRISTIAN LOMP E SANDRA MÓNICA COSTA PIRES
Exercício 12.3.5 Seja m um número ímpar e A = Zm , m +1 ,1,0 . 2
• Verifique que os códigos Cn , com n > 3, sobre A detectam todas as transposições adjacentes. • Mostre que os códigos Cn detectam todas as transposições intercaladas se e só se m não for um múltiplo de 3. Agradecimento: Os autores gostariam de agradecer aos editores, a António Machiavelo e a Paula Carvalho Lomp pela revisão cuidada.
APÊNDICE: ALGORITMO DO TEOREMA DE PAIGE EM PYTHON A demonstração do Teorema de Paige 12.2.9 sugeriu o seguinte algoritmo (em Python) que permite, a partir de uma permutação T , encontrar uma permutação ˜ S tal que |S(A)| > |T˜ (A)|, se |T˜ (A)| < n − 1. As permutações são consideradas listas em Python. O programa supõe que a lista de listas M contém a tabela de multiplicação do grupo abeliano A , isto é, M [a ][b ] é interpretado por a ∗b , e que a lista I nv faz corresponder cada elemento ao seu elemento inverso, isto é, I nv [x ] é o elemento inverso de x . def Paige(T): n=len(M); # número dos elementos do grupo A=range(0,n); # os elementos do grupo B=[]; # conjunto de geradores CB=[]; # o complemento de B Imagem=[]; # a imagem de T for x in A: if M[x][Inv[T[x]]] not in Imagem: Imagem.append(M[x][Inv[T[x]]]); B.append(x); else: CB.append(x); if len(CB) 0. Podemos, então, definir a probabilidade condicional de A dado B (ou a probabilidade de A condicionada a B ) como µ(A|B ) =
µ(A ∩ B ) . µ(B )
Uma das propriedades fundamentais que a probabilidade condicional possui é, quando encarada como uma função definida em B , ser uma medida de probabilidade em (Ω, B) para a qual o conjunto B tem probabilidade um. Teorema 13.3.2 Sejam (Ω, B, µ) um espaço de medida de probabilidade e B ∈ B tal que µ(B ) > 0. Então, a função µ B : B → R dada por µ B (A) = µ(A|B ), para cada A ∈ B , é uma medida de probabilidade em (Ω, B) com µ B (B ) = 1.
543
QUANTIFICAR O ACASO
Demonstração: Pela Definição 13.3.4 decorre imediatamente que µ B (A) ≥ 0 e µ B (;) = 0. Seja A 1 , A 2 , . . . uma sequência de elementos de B disjuntos dois a dois, ∪+∞ cuja união é A := n=1 A n . Deste modo, ∪+∞ µ(A ∩ B ) µ( n =1 A n ∩ B ) = µ B (A) = µ(B ) µ(B ) ∑+∞ +∞ ∑ µ(A ∩ B ) n = n =1 = µ B (A n ). µ(B ) n =1
Finalmente, µ B (Ω) = µ(B )/µ(B ) = 1 e µ B (B ) = µ(B )/µ(B ) = 1.
Podemos dizer que a probabilidade condicional permite reduzir o universo Ω a B . De facto, B B := {A ∈ B : A ⊂ B } é uma σ-álgebra e, se µ B denotar a restrição de µ B a B B , então podemos considerar o espaço de medida de probabilidade (B, B B , µ B ). O próximo resultado compila algumas propriedades úteis da probabilidade condicional. Teorema 13.3.3 Seja (Ω, B, µ) um espaço de medida de probabilidade. 1. Se A, B ∈ B e µ(B ) > 0, então A ⊂ B ⇒ µ(A|B ) = µ(A)/µ(B ) e A ⊃ B ⇒ µ(A|B ) = 1. 2. Se A, B,C ∈ B e µ(B ∩ C ) > 0, então µ(A|B ∩ C ) = µ(A ∩ B |C )/µ(B |C ). 3. Se D 1 , D 2 , . . . é uma sequência disjunta de elementos de B cuja união é Ω e µ(D n ) > 0, para todo n ∈ N, então para todo A ∈ B , µ(A) =
+∞ ∑
µ(A|D n )µ(D n ),
n=1
e se µ(A) > 0 então µ(D n |A) = µ(A|D n )µ(D n )/µ(A). 4. Se C 1 ,C 2 , . . . é uma sequência monótona de elementos de B , cujo limite é C e µ(C ) > 0, então, para todo A ∈ B , µ(A|C ) = lim µ(A|C n ). n→+∞
13.3.4 INDEPENDÊNCIA Sejam (Ω, B, µ) um espaço de probabilidade, A e B dois acontecimentos mensuráveis com 0 < µ(B ) < 1. Então podemos calcular as duas probabilidades condicionais: α := µ(A|B ), 544
β := µ(A|B C ),
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
em que α representa a probabilidade de A ocorrer dado que B ocorre e β a probabilidade de A ocorrer dado que B não ocorre. Suponhamos que α > β , então A tem mais chances de ocorrer se B acontecer do que se B não acontecer. Conclui-se, assim, que a ocorrência de B influencia a probabilidade de A acontecer, isto é, o facto de B ocorrer ou não dá-nos informação extra relativamente à probabilidade de A ocorrer. O mesmo acontece quando α < β ; simplesmente, desta vez, é menos provável que A ocorra se B aconteceu do que ao contrário. Se α = β a ocorrência do acontecimento B ou do seu complementar não alteram a probabilidade de A ocorrer. Digamos que não ganhamos informação alguma se soubermos de antemão se B ocorreu ou não. Por outras palavras ainda, podemos dizer que A é independente da ocorrência de B . Observemos que neste caso (em que α = β ) temos que: µ(A) = µ(A|B )µ(B ) + µ(A|B C )µ(B C )
por (3) do teorema 13.3.3
= α(µ(B ) + µ(B )) C
= α.
Resulta daqui que µ(A) = µ(A|B ) = µ(A ∩ B )/µ(B ) e, consequentemente, µ(A ∩ B ) = µ(A)µ(B ). Isto motiva a definição de independência estatística que se segue. Definição 13.3.5 Sejam (Ω, B, µ) um espaço de probabilidade, A e B dois acontecimentos mensuráveis. Dizemos que A e B são independentes se µ(A ∩ B ) = µ(A)µ(B ).
Estamos agora em condições de escrever aquelas que são conhecidas como leis aditiva e multiplicativa da probabilidade: µ(A ∪ B ) = µ(A) + µ(B )
se A e B forem disjuntos;
µ(A ∩ B ) = µ(A)µ(B )
se A e B forem independentes.
De seguida, estendemos o conceito de independência a qualquer colecção de acontecimentos. Definição 13.3.6 Se (Ω, B, µ) é um espaço de probabilidade, uma colecção de acontecimentos C é dita independente se para qualquer subcolecção finita {E 1 , E 2 , . . . , E n } ⊂ C valer ∩ ∏ µ Ej = µ(E j ). n
n
j =1
j =1
545
QUANTIFICAR O ACASO
13.3.5 VARIÁVEIS ALEATÓRIAS Até aqui introduzimos um modelo matemático para lidar com uma situação aleatória: o espaço de medida de probabilidade (Ω, B, µ). Os elementos de Ω representam possíveis resultados de uma experiência. Os elementos da σ-álgebra B representam os conjuntos mensuráveis, ou seja, acontecimentos cuja probabilidade de ocorrerem pode ser quantificada pela medida de probabilidade µ. Consideremos um exemplo muito simples: suponhamos que são lançados dois dados equilibrados. Esta experiência tem trinta e seis resultados possíveis que listamos abaixo. Definamos ωi ,j = (i , j ), para i , j ∈ {1, 2, 3, 4, 5, 6}, onde i é o i \j
1
2
3
4
5
6
1
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
(1,6)
2
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
(2,6)
3
(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
(3,6)
4
(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
(4,6)
5
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
(5,6)
6
(6,1)
(6,2)
(6,3)
(6,4)
(6,5)
(6,6)
TABELA 13.2 Espaço de acontecimentos
número representado na face voltada para cima do primeiro dado e j o número representado na face do segundo. O espaço de acontecimentos é então dado por ∪ Ω = i ,j ∈{1,2,3,4,5,6} {ωi ,j }. Cada uma das possíveis realizações da experiência tem probabilidade 1/36 de ocorrer, quando supomos que o dado é equilibrado. Podemos tomar para σ-álgebra B a classe de todos os subconjuntos de Ω. A medida de probabilidade µ atribui a cada acontecimento A um peso igual a n/36 onde n é o número de elementos de Ω contidos em A (n = 0, 1, . . . , 36). Pode acontecer, como é o caso de muitos jogos de tabuleiro, que não estejamos interessados em toda a informação resultante da realização da experiência. Suponhamos, por exemplo, que estamos apenas interessados na soma X dos pontos observados nas faces voltadas para cima dos dados. Esta quantidade pode tomar os valores 2, 3, . . . , 12, dependendo do resultado da realização da experiência. Este é um exemplo do que designamos por variável aleatória. Na realidade, X não é uma variável, mas antes uma função que a cada realização ω ∈ Ω associa o número X (ω), que representa a soma dos pontos observados no lançamento dos dados. Mais precisamente, X : Ω → {2, 3, . . . , 12} é dada por X (ωi ,j ) = i + j . 546
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
Uma característica fundamental de uma variável aleatória genérica X é o facto de ser sempre possível determinar a probabilidade de X tomar certos valores. Por exemplo, no caso anterior: µ({ω ∈ Ω : X (ω) = 5}) = µ({ω1,4 , ω2,3 , ω3,2 , ω4,1 }) = 4/36 = 1/9,
afirmação esta que habitualmente se abrevia escrevendo: µ(X = 5) = 1/9,
que é a probabilidade de obter soma dos pontos igual a 5 no lançamento de dois dados. Um caso mais complicado é, por exemplo, a descrição do estado do tempo num determinado local específico a um dado instante. Claro que descrever em detalhe um acontecimento deste tipo é claramente impossível, devido ao número elevado de factores que o influencia. Indicar, por exemplo, a posição e velocidade de todas as moléculas de ar num determinado local da atmosfera é irrealizável. Podemos, contudo, estar apenas interessados em determinadas quantidades, como a temperatura ou a pressão atmosférica médias, que obviamente estão sujeitas às arbitrariedades do sistema de partículas, por dependerem de todas as possíveis configurações das moléculas do ar nesse determinado local. Na realidade, não interessa conhecer exactamente a configuração do sistema, mas apenas uma quantidade observável tal como a temperatura correspondente a essa configuração, que certamente está sujeita a variação aleatória. À semelhança do que fizemos atrás, podemos definir uma função X de Ω (espaço de todas as configurações possíveis das moléculas de ar num determinado local à face da terra) em R que a cada observação instantânea da configuração ω (realização da experiência) associa a temperatura X (ω). O que pretendemos com esta definição é poder calcular, por exemplo, a probabilidade de X estar enquadrada entre determinados valores. Mais geralmente, podemos definir: Definição 13.3.7 Dado um espaço de medida de probabilidade (Ω, B, µ), uma variável aleatória X é uma função X : Ω → R tal que, para todo o subconjunto B ⊂ R pertencente à σ-álgebra de Borel F , se tem que X −1 (B ) ∈ B . Esta definição implica que, para todo o conjunto B ∈ F , podemos sempre calcular µ({ω ∈ Ω : X (ω) ∈ B }) = µ(X −1 (B )), 547
QUANTIFICAR O ACASO
uma vez que X −1 (B ) é mensurável por definição de variável aleatória. Habitualmente, costumamos omitir a dependência de ω na definição dos acontecimentos e, por exemplo, no caso particular em que B = [a ,b ], com a < b ∈ R, em vez de escrevermos µ({ω ∈ Ω : a ≤ X (ω) ≤ b }), abreviamos escrevendo µ(a ≤ X ≤ b ). Observação 13.3.3 Toda a função contínua f : J → R, onde J ⊂ R é um intervalo equipado com a σ-álgebra de Borel, é uma variável aleatória. Como variáveis aleatórias são funções, há uma série de operações que podemos fazer com elas. Por exemplo, se X e Y são variáveis aleatórias definidas em Ω, podemos definir X + Y e X Y através de (X + Y )(ω) = X (ω) + Y (ω) e X Y (ω) = X (ω)Y (ω). Para além disso, se f : R → R for mensurável, então Z : Ω → R dada por Z (ω) = f (X (ω)) é também uma variável aleatória, se X o for. Definição 13.3.8 Uma sequência de variáveis aleatórias X 1 , X 2 , . . . definidas num espaço de medida de probabilidade (Ω, B, µ) diz-se um processo estocástico. Um caso particular de um processo estocástico é aquele em que as variáveis aleatórias X 1 , X 2 , . . . são independentes. Definição 13.3.9 As variáveis aleatórias X 1 , X 2 , . . . definidas num espaço de medida de probabilidade (Ω, B, µ) dizem-se independentes se para toda a sequência de conjuntos B 1 , B 2 , . . . ∈ F a colecção de acontecimentos {X 1−1 (B 1 ), X 2−1 (B 2 ), . . .} for independente. Exemplo 13.3.5 Consideremos a experiência do lançamento de uma moeda ao ar, como no exemplo 13.3.1, sendo Ω = {F,C } o espaço de acontecimentos. Podemos definir uma variável aleatória: X:
Ω
→
R
F
7→
0
C
7→
1.
(13.4)
Os valores observáveis de X são {0, 1} e, obviamente: µ(X = 0) = µ({F }) = p , µ(X = 1) = µ({C }) = 1 − p , µ(0 < X < 2) = µ(X = 1) = 1 − p , etc. Exemplo 13.3.6 Tal como no exemplo 13.3.3, consideremos a experiência que consiste em três lançamentos consecutivos de uma moeda equilibrada ao ar. Consideramos o espaço de acontecimentos Ω = {F F F, F F C , F C F, F C C ,C F F, 548
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
C F C ,C C F,C C C }, a σ-algebra B dada pela colecção de subconjuntos de Ω e a me-
dida de probabilidade produto µ definida como no exemplo 13.3.3, que a cada acontecimento elementar de Ω atribui probabilidade 1/23 = 1/8. Tal como no exemplo 13.3.3, usaremos a notação ω = ω1 ω2 ω3 , onde ωi ∈ {F,C }, i = 1, 2, 3, para escrever um elemento genérico de Ω. Suponhamos que, da realização da experiência em causa, estamos apenas interessados em contar o número de vezes que sai coroa. A melhor maneira de formalizarmos o problema, de modo a concentrarmo-nos na informação que pretendemos estudar, é introduzir uma variável aleatória que conte o número de coroas cada vez que se realiza a experiência, ou seja, definir: S 3 : Ω → R, de tal forma que S 3 (ω) é o número de ocorrências de C em ω. Os valores possíveis para S 3 são {0, 1, 2, 3}, sendo que: µ(S 3 = 0) = µ({F F F }) = 1/8 µ(S 3 = 1) = µ({F F C , F C F,C F F }) = 3/8 µ(S 3 = 2) = µ({C C F,C F C , F C C }) = 3/8 µ(S 3 = 1) = µ({C C C }) = 1/8.
Uma forma mais elegante de definirmos S 3 é usarmos a variável aleatória X definida em (13.4). Para cada i = 1, 2, 3, definamos a variável aleatória X i : Ω → {0, 1} através de X i (ω) = X i (ω1 ω2 ω3 ) = X (ωi ). Digamos que cada X i é uma variável aleatória de contagem: se o i -ésimo lançamento da moeda corresponder a coroa, conta 1; enquanto que, se o i -ésimo lançamento da moeda corresponder a face, conta 0. Podemos então definir agora S 3 : Ω → R tomando S3 = X1 + X 2 + X 3.
Mais geralmente, no caso da experiência que consiste em lançamentos independentes e indefinidos de uma moeda equilibrada, tomamos, tal como no exemplo 13.3.3, o espaço de acontecimentos Ω = {F,C }N , a σ-algebra B gerada pelos cilindros definidos em (13.2) e a medida de probabilidade produto definida em (13.3). Consideremos a sequência de variáveis aleatórias X 1 , X 2 , X 3 , . . . onde X i : Ω → {0, 1}, para cada i ∈ N, é dada por: X i (ω) = X i (ω1 ω2 ω3 . . .) = X (ωi ).
O processo estocástico X 1 , X 2 , X 3 , . . . assim definido é, de facto, uma sequência de variáveis aleatórias independentes identicamente distribuídas pela estrutura 549
QUANTIFICAR O ACASO
que a medida produto µ impõe. Efectivamente, a título de exemplo, observe-se que µ(X 1 = 0 e X 2 = 1) = µ(C (2, 1, [F,C ]) = 1/4 = µ(C (1, 1, [F ])µ(C (1, 2, [C ]) = µ(X 1 = 0)µ(X 2 = 1).
Se estivermos interessados em contar o número de vezes que ocorrem coroas nos n primeiros lançamentos podemos definir, à semelhança do que fizemos atrás, S n : Ω → {0, 1, . . . , n} dado por: S n (ω) =
n ∑
X i (ω).
i =1
Exemplo 13.3.7 Consideremos a experiência que consiste em lançamentos independentes e consecutivos de uma moeda equilibrada ao ar. Suponhamos que estamos interessados em contar o número de lançamentos necessários até sair coroa. Podemos formalizar considerando o espaço de todas as realizações possíveis que resultam de lançamentos consecutivos e indefinidos, isto é, Ω = {F,C }N , munido com a σ-algebra gerada pelos cilindros definidos em (13.2) e com a medida produto µ definida por (13.3). Definamos agora a variável aleatória Y : Ω → N ∪ {+∞} dada por Y (ω) = i
se ω ∈ C (i , 1, [F, F, . . . , F,C ]), para i ∈ N
Y (ω) = +∞
se ω = F F F . . .
Observemos que a variável aleatória Y induz uma medida de probabilidade µ∗ em Ω∗ = N ∪ {+∞} equipado com a σ-algebra constituída por todos os subconjuntos de Ω∗ . Seja B ⊂ Ω∗ ; definimos µ∗ (B ) = µ(Y ∈ B ) =
∑ j ∈B
µ(Y = j ) =
∑
µ(C (j , 1, [F, F, . . . , F,C ])) = 1/2 j .
j ∈B
Por exemplo, µ∗ ({4}) = µ(Y = 4) = 1/24 , µ∗ ({+∞}) = µ(Y = +∞) = 0 (veja-se secção 13.3.2, exemplo 13.3.3) e µ∗ (Ω∗ ) =
+∞ ∑ j =0
µ(Y = j ) + µ(Y = +∞) =
+∞ ∑
1/2 j = 1.
j =0
Exemplo 13.3.8 Consideremos um arame com um metro de comprimento que parametrizamos usando a distância a uma das extremidades que fixamos para 550
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
origem. Desta forma, podemos identificar os pontos do arame com os pontos de [0, 1]. Nesta identificação, 1/3, por exemplo, é conotado com o ponto do arame que dista 1/3 metro da extremidade fixada. Suponhamos que a temperatura em cada ponto do arame, num determinado momento (medida em ºC), é dada pela função T : [0, 1] → R, tal que T (x ) = (x − 1/2)2 . Tal como no exemplo 13.3.4, consideramos que [0, 1] está equipado com a σ-álgebra de Borel B e a medida de Lebesgue µ. Pela Observação 13.3.3, T é uma variável aleatória. Podemos então escolher aleatoriamente um ponto do intervalo [0, 1], tal como no exemplo 13.3.4, e calcular a probabilidade da sua temperatura se enquadrar entre certos valores. Por exemplo, a probabilidade de a temperatura ser superior a 1/9 é µ(T > 1/9) = µ ({x : T (x ) > 1/9}) = µ ([0, 1/6) ∪ (5/6, 1]) = 2/6.
Já a probabilidade da temperatura ser 0 é µ(T = 0) = µ({1/2}) = 0 (veja-se secção 13.3.2, exemplo 13.3.4).
13.4 CADEIAS DE MARKOV Consideremos uma sequência de variáveis aleatórias X 0 , X 1 , . . . definidas num espaço de medida de probabilidade (Ω, B, P). Nesta secção, o conjunto de valores que as variáveis aleatórias X 0 , X 1 , . . . podem assumir será designado por espaço de estados. Consideraremos apenas o caso em que o espaço de estados é finito. A variável aleatória X n denota o estado do sistema (ou do processo) no instante n . Dizemos que o processo estocástico X 0 , X 1 , . . . é uma cadeia de Markov em tempo discreto se tiver a seguinte propriedade: P (X n = i n |X 0 = i 0 , . . . , X n−1 = i n−1 ) = P (X n = i n |X n −1 = i n −1 ) .
Traduzindo por palavras, estamos perante uma cadeia de Markov se: para determinar probabilidade de, no instante n , o sistema se encontrar no estado i n (X n = i n ), o conhecimento de toda a história anterior, isto é, a sequência de estados pelos quais as variáveis aleatórias X j com j < n passaram, nada mais acrescenta à informação resultante do conhecimento do estado do sistema no momento imediatamente anterior, ou seja, ao conhecimento do estado em que a variável aleatória X n −1 se encontrava. Para ilustrar, imaginemos um jogador que faz apostas relativamente à realização de lançamentos independentes de um dado de seis faces equilibrado e suponhamos que X 0 , X 1 , . . . é um processo estocástico em que X n representa a riqueza do jogador após o n -ésimo lançamento. Pretendendo 551
QUANTIFICAR O ACASO
calcular a probabilidade de a riqueza do jogador ser um determinado valor após o n -ésimo lançamento, é fácil observar que, uma vez que os lançamentos são independentes, o conhecimento da evolução da sua riqueza desde que começou a jogar não acrescenta mais informação ao conhecimento da sua riqueza momentos antes de se realizar o dito lançamento. A probabilidade do sistema estar no instante n no estado j , sabendo que no instante n − 1 esteve no estado i é denotada por p i j ,n := P X n = j |X n−1 = i ,
e é chamada probabilidade de transição de i para j no tempo n . Se ∀k ∈ N p i j ,k = p i j ,1 , isto é, P X k = j |X k −1 = i = P X 1 = j |X 0 = i , então dizemos que a cadeia de Markov tem probabilidades de transição estacionárias e passamos a usar a notação p i j := P X 1 = j |X 0 = i . Nesta secção iremos tratar apenas cadeias de Markov com probabilidades de transição estacionárias. Se uma cadeia de Markov tiver k estados possíveis que enumeramos por {1, 2, . . . , k }, então as probabilidades de transição podem ser apresentadas numa matriz P = [p i j ], dita matriz de transição, e que é tal que (i) p i j ≥ 0, ∀i , j ∈ {1, . . . , k }, ∑k (ii) j =1 p i j = 1, ∀i ∈ {1, . . . , k }. Por exemplo, uma cadeia de Markov de três estados tem matriz de transição da forma p 11 p 21
p 12
p 13
p 22
p 23 ,
p 31 ∑3
p 32
p 33
em que p i j ≥ 0, ∀i , j ∈ {1, 2, 3}, e j =1 p i j = 1, ∀i ∈ {1, 2, 3}. Nesta matriz, p 32 representa a probabilidade do sistema mudar do estado 3 para o estado 2 e p 11 é a probabilidade do sistema permanecer no estado 1, sabendo que no momento anterior já se encontrava no estado 1. No caso geral, observa-se que o processo fica completamente determinado conhecidas a matriz de transição P e a distribuição de X 0 , ou seja, conhecidas P e p i = P(X 0 = i ) para cada i ∈ {1, . . . , k }. De facto, P (X 0 = i 0 , . . . , X n = i n ) = P (X n = i n |X 0 = i 0 , . . . , X n −1 = i n −1 ) .P (X 0 = i 0 , . . . , X n −1 = i n −1 ) 552
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
= p i n−1 i n .P (X 0 = i 0 , . . . , X n −1 = i n −1 ) .
Por indução, concluímos que P (X 0 = i 0 , . . . , X n = i n ) = p i n −1 i n . . . p i 1 i 2 p i 0 i 1 P(X 0 = i 0 ) = p i n −1 i n . . . p i 1 i 2 p i 0 i 1 p i 0
Exemplo 13.4.1 Uma empresa de aluguer de automóveis tem três agências: 1, 2 e 3. Um cliente pode alugar um carro em qualquer uma das agências e devolvê-lo também a qualquer das três agências. Através de um estudo efectuado, estima-se que os clientes devolvam os automóveis às diferentes agências, de acordo com as seguintes probabilidades, que dependem do local onde o automóvel foi alugado: 0,8 0,3 0,2
0,1
0,1
0,2
0,5 .
0,6
0,2
Esta matriz é a matriz de transição da cadeia de Markov considerada. Nesta matriz, o valor 0,5 corresponde à probabilidade de um carro que é alugado na agência 2 ser devolvido à agência 3. Exemplo 13.4.2 Um treinador de futebol verificou que a probabilidade de um jogador marcar golo na cobrança de um penálti depende do seu sucesso na marcação do penálti anterior, da forma que é descrita de seguida. A probabilidade do jogador marcar golo na cobrança de um penálti, sabendo que marcou golo no penálti anterior, é igual a 0,7 e a probabilidade de marcar golo, sabendo que falhou o penálti anterior, é igual a 0,2. A matriz de transição associada é: 0,7
0,3
0,2
0,8
! .
Neste exemplo, a cadeia de Markov tem dois estados. Quando o jogador marca um golo de penálti, podemos dizer que o sistema se encontra no estado 1, e quando falha, o sistema encontra-se no estado 2. Definamos agora probabilidade de transição a n passos de i para j do seguinte modo: (n) p i j := P X n = j |X 0 = i .
553
QUANTIFICAR O ACASO
Usaremos a notação P n para designar o produto matricial de P por si mesma repetido n vezes, isto é, P n = P · . . . · P}. Por exemplo: P 2 = P · P onde · denota o | · P{z n vezes
produto de matrizes. (Veja-se secção 1.3 de (Anton e Rorres, 2005)). Teorema 13.4.1 Seja P = [p i j ] a matriz de transição de uma cadeia de Markov. Então, a probabilidade de transição a n passos de i para j , p i(nj ) , coincide com a entrada i , j da matriz P n . Consideremos uma cadeia de Markov com k estados. Chamamos vector de estados da cadeia no momento n ao vector linha de dimensão k , cuja i -ésima componente é a probabilidade do sistema estar, no momento n , no estado i . Notamos que todas as entradas de um vector de estados são não negativas e que a sua soma é igual a 1. O teorema anterior permite-nos obter os vectores de estados nos momentos 1, …, n , …: x (1) , . . . , x (n ) , . . . ,
a partir do vector de estados no momento inicial x (0) . O teorema anterior pode pois ser reescrito da seguinte forma: Teorema Seja P = [p i j ] a matriz de transição de uma cadeia de Markov. Então, o vector de estados no tempo n , x (n) , pode ser obtido a partir do vector de estados x (0) , da seguinte forma: x (n ) = x (0) P n .
Exemplo 13.4.1 (Continuação) Relembremos que, neste caso, da empresa de aluguer de automóveis, a matriz de transição é: 0,8 P = 0,3 0,2
0,1
0,1
0,2
0,5 .
0,6
0,2
Suponhamos que, num determinado momento, um automóvel se encontra na agência 2. O vector de estados inicial é, então, x (0) = (0 1 0). A probabilidade de, no terceiro aluguer consecutivo, o automóvel ser devolvido à agência 1 é dada por (3) (3) x 1 (ou, equivalentemente, igual a p 21 ), em que x (3) = x (0) P 3
554
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
0,8 = (0 1 0) · 0,3 0,2
0,8 0,3 · 0,5 0,2 0,2
0,1
0,1
0,1
0,2 0,6
0,2 0,6
0,8 0,3 · 0,5 0,2 0,2 0,1
0,1 0,2 0,6
0,1 0,5 0,2
= (0,447 0,252 0,271),
isto é, a probabilidade de, no terceiro aluguer consecutivo, o automóvel ser devolvido à agência 1 é igual a 0,447. Exemplo 13.4.2 (Continuação) A matriz de transição deste exemplo é: P=
0,7
0,3
0,2
0,8
! .
Suponhamos que o jogador começa por marcar golo na cobrança do primeiro penálti. O vector de estados inicial é, então, x (0) = (1 0). A probabilidade de, após mais quatro penáltis, o jogador falhar o último é dada por x 2(4) (ou, equivalente(4) mente, igual a p 12 ), em que x (4) = x (0) P 4 = (1 0) ·
0,7
0,3
0,2
0,8
! ·
0,7
0,3
0,2
0,8
! ·
0,7
0,3
0,2
0,8
! ·
0,7
0,3
0,2
0,8
!
= (0,438 0,562),
isto é, a probabilidade de, após mais quatro penáltis, o jogador falhar o último é igual a 0,562. Uma questão que surge naturalmente é a seguinte: Sob que condições é que x (n ) converge quando n → +∞? A resposta a esta questão é o propósito do Teo-
rema Limite de Cadeias de Markov que enunciamos em seguida. Antes, porém, apresentamos a seguinte definição: Dizemos que uma matriz é regular se alguma potência inteira dela mesma tiver todas as entradas estritamente positivas, isto é, se existir um número inteiro positivo m tal que P m tenha todas as entradas estritamente positivas. As matrizes dos exemplos 13.4.1 e 13.4.2 são regulares. Basta tomar na definição anterior, em ambos os casos, m = 1. Exemplo 13.4.3 A matriz de transição P=
0
1
1
0
!
555
QUANTIFICAR O ACASO
não é regular. De facto, nenhuma potência de P tem todas as entradas estritamente positivas uma vez que, para todo k ímpar, temos P = k
1
1
0
1
! 0
0
1
e, para todo k par, P = k
!
0
.
Notamos que, neste caso, se tomarmos x (0) = (1 0), temos x (0) = (1 0), x (1) = (0 1), x (2) = (1 0), x (3) = (0 1), . . .
e, portanto, x (n ) não converge quando n → +∞. O Teorema Limite para Cadeias de Markov descreve o comportamento de P n quando n → +∞ para matrizes de transição regulares P .
Teorema 13.4.2 Se P for uma matriz de transição regular com k estados, então, quando n → +∞, q1 q1 . Pn → Q = . . q1
q2
...
q2
...
.
...
.
...
.
...
q2
...
qk
qk . , . . qk
onde os qi (i = 1, . . . , k ) são números positivos tais que q1 + q2 + · · · + qk = 1. Com base neste teorema concluímos que, para uma matriz de transição regular, a probabilidade de transição a n passos de i para j , p i(nj ) , tende para q j quando n → +∞. Em particular, observamos que limn →+∞ p i(nj ) não depende de i , isto é, não depende do estado inicial do sistema. Notemos agora que, sendo Q a matriz limite do teorema anterior e x um vector de estados, temos que q1 q1 . xQ = (x 1 x 2 . . . x k ) . . q1 556
q2
...
q2
...
.
...
.
...
.
...
q2
...
qk
qk . . . qk
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
= (x 1 + x 2 + · · · + x k )q1 (x 1 + x 2 + · · · + x k )q2 . . . (x 1 + x 2 + · · · + x k )qk
= (x 1 + x 2 + · · · + x k )(q1 q2 . . . qk ) = q,
onde q = (q1 q2 . . . qk ). Pelo teorema 13.4.2 e observações anteriores obtemos o seguinte: Teorema 13.4.3 Se P for uma matriz de transição regular e x um vector de estados, então, quando n → +∞, x P n → q,
onde q = (q1 q2 . . . qk ) é um vector de probabilidade fixo, que não depende de n nem de x , e cujas entradas são todas estritamente positivas. Ao vector q do teorema anterior chamamos vector de estado de equilíbrio. Este vector pode ser calculado usando o teorema que se segue. Teorema 13.4.4 O vector de estado de equilíbrio q de uma matriz de transição regular P é o único vector de probabilidade que satisfaz q P = q . Este teorema decorre da igualdade P n P = P n +1 e do facto de P n e P n +1 convergirem para Q quando n → +∞. Deste modo, temos QP = Q , donde se conclui que q P = q . Para mostrar que q é o único vector de probabilidade que satisfaz a equação, suponhamos que existe um outro vector de probabilidade r tal que r P = r . Então temos r P n = r para n = 1, 2, . . .. Fazendo n → +∞, pelo teorema 13.4.3 temos que q = r . Exemplo 13.4.1 (Continuação) Vamos determinar o vector de estado de equilíbrio. Determinemos q tal que q P = q , ou, equivalentemente, q (P − I ) = 0, que corresponde a determinar q1 , q2 e q3 tais que −0,2 (q1 q2 q3 ) 0,3 0,2
0,1 −0,8 0,6
0 0 = 0,5 −0,8 0 0,1
−0,2q1 + 0.3q2 + 0,2q3 = 0 ⇔ 0,1q1 − 0,8q2 + 0,6q3 = 0 0,1q1 + 0,5q2 − 0,8q3 = 0. 557
QUANTIFICAR O ACASO
A solução deste sistema é
q1 = q =
34 q 13 3 14 q . 13 3
2
Impondo agora que o vector q seja um
vector de probabilidade e, portanto, q1 + q2 + q3 = 1, obtemos q=
34 14 13 61 61 61
= (0,5573 . . . 0,2295 . . . 0,2131 . . .) .
Concluímos assim que, por exemplo, limn →+∞ p i(n1 ) = 34/61, isto é, a probabilidade de um automóvel ser devolvido à agência 1 a longo prazo é 34/61 (independentemente da agência onde foi alugado da primeira vez). Este tipo de conclusão pode ser deveras relevante para tomar certas decisões. Por exemplo, se a empresa de aluguer tiver uma frota de mil viaturas, as suas instalações devem ser concebidas ou reestruturadas para que existam pelo menos quinhentos e cinquenta e oito lugares de estacionamento na agência 1, duzentos e trinta na agência 2 e duzentos e catorze na agência 3. Exemplo 13.4.2 (Continuação) Vamos calcular, para este exemplo, o vector de estado de equilíbrio. Determinemos, como no exemplo anterior, q tal que q P = q , ou equivalentemente, q (P − I ) = 0, que corresponde a determinar q1 e q2 tais que (q1 q2 )
!
−0,3
0,3
0,2
−0,2
=
! 0 0
⇔
−0,3q1 + 0,2q2 = 0 0,3q − 0,2q = 0. 1
2
A solução deste sistema é q1 = 23 q2 . Impondo agora que o vector q seja um vector de probabilidade e, portanto, q1 + q2 = 1, obtemos q = (0,4 0,6). Temos, por exemplo, que limn →+∞ p i(n2 ) = 0,6, isto é, a probabilidade do jogador não marcar golo de penálti a longo prazo é 0,6 (independentemente de ter marcado golo ou falhado no primeiro penálti).
13.5 TEOREMA DE RECORRÊNCIA DE POINCARÉ Seja (Ω, B, µ) um espaço de probabilidade e T : Ω → Ω uma aplicação mensurável, isto é, uma aplicação tal que, para todo B ∈ B , T −1 (B ) ∈ B .
558
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
Definição 13.5.1 A aplicação T : Ω → Ω diz-se µ-invariante se para todo B ∈ B tivermos que µ(T −1 (B )) = µ(B ). Por outras palavras, se assumirmos que T representa o efeito da passagem do tempo sobre Ω, então T ser µ invariante diz-nos que a maneira de medir a probabilidade de acontecimentos permanece inalterada com a passagem do tempo. Elaborando sobre esta analogia, se assumirmos que T (x ) representa a posição do ponto x após a passagem de um dia, então T é µ-invariante se a probabilidade de amanhã estarmos em B (x ∈ T −1 (B )) for igual à probabilidade de hoje estarmos em B (x ∈ B ). Usaremos a notação T k para designar a composição de T consigo mesma k vezes, isto é, T k = |T ◦ T {z ◦ · · · ◦ T}. Por exemplo, T 2 = T ◦ T , onde ◦ denota a compok vezes
sição de funções. Definição 13.5.2 Seja B ∈ B . Um ponto x ∈ B diz-se recorrente com respeito a B se existir k ∈ N tal que T k (x ) ∈ B . Um ponto de B é recorrente se em algum instante futuro retornar a B . Um dos primeiros e mais simples resultados de Teoria Ergódica afirma que quase todo o ponto é recorrente. Foi provado por Poincaré, que é considerado o percursor do estudo de Sistemas Dinâmicos. Teorema 13.5.1 (Teorema de Recorrência de Poincaré – 1899) Consideremos um espaço de probabilidade (Ω, B, µ) e uma aplicação T : Ω → Ω mensurável e µ-invariante. Para todo B ∈ B , se F denotar o conjunto dos pontos de B não recorrentes, então µ(F ) = 0. Demonstração: Comecemos por escrever F =B−
+∞ ∪
! T
−k
B
= B ∩ T −1 (Ω − B ) ∩ T −2 (Ω − B ) ∩ . . .
k =1
e observemos que, se x ∈ F ⊂ B , então T n (x ) ∈/ B para todo n ∈ N. Em particular, F ∩ T −n (F ) = ;, para todo n ∈ N, uma vez que, se x ∈ F ∩ T −n (F ), então x ∈ F ⊂ B e T n (x ) ∈ F ⊂ B . Aplicando o operador T −k a ambos os conjuntos da última igualdade, concluímos que T −k (F ) ∩ T −(n +k ) (F ) = ;, para todo n ∈ N e k ∈ N. Significa então que os conjuntos F, T −1 (F ), T −2 (F ), T −3 (F ), . . . são disjuntos e, por invariância da medida de probabilidade, para todo n ∈ N, temos µ(T −n (F )) = µ(F ). Se 559
QUANTIFICAR O ACASO
supusermos que p = µ(F ) > 0, então facilmente chegamos a um absurdo, pois ∪+∞ −k (F ) ⊂ Ω e k =0 T ! µ
+∞ ∪
T −k (F ) =
k =0
Consequentemente, p = µ(F ) = 0.
+∞ ∑
p = +∞ > 1.
k =0
Podemos fazer a seguinte interpretação física deste resultado. Consideremos que Ω contém os possíveis estados de um sistema, que a σ-álgebra B representa a colecção de acontecimentos e que µ é a medida de probabilidade definida em B que permite especificar a probabilidade de se observar cada um dos diferentes estados. Suponhamos que o sistema dinâmico evolui em tempo discreto (podemos pensar que fazemos medições uma vez por unidade de tempo) e que T : Ω → Ω é a aplicação que descreve a evolução do sistema, indicando como se processa a transição de um estado para o sucedâneo ao fim de uma unidade de tempo. Numa situação de equilíbrio, T preserva a medida µ o que significa que a probabilidade de observar um dado estado não muda com o tempo. Nestas condições, o Teorema de Recorrência de Poincaré diz-nos que, se no instante inicial o sistema se encontrar num estado observável E ∈ B (com µ(E ) > 0), então, com probabilidade 1, o sistema retorna ao estado inicial E . Consideremos a experiência em que montamos dois recipientes com uma ligação entre os dois, que pode ser aberta ou fechada através de uma válvula. Enchemos um dos recipientes com um gás e deixamos o outro vazio. Abrimos a válvula e deixamos o sistema evoluir. O Teorema de Recorrência permite-nos concluir que, quase certamente (com probabilidade 1), num instante futuro, o sistema voltará ao estado inicial em que todas as moléculas do gás estarão num dos recipientes. O facto de o teorema implicar que um acontecimento tão improvável vai acontecer quase certamente parece desafiar a Segunda Lei da Termodinâmica que pode ser enunciada da seguinte forma: A quantidade de entropia de qualquer sistema isolado termodinamicamente tende a incrementar-se com o tempo, até alcançar um valor máximo. Mais sensivelmente, quando uma parte de um sistema fechado interage com outra parte, a energia tende a dividir-se por igual, até que o sistema alcance um equilíbrio térmico. Observe-se que o Teorema de Recorrência de Poincaré nada afirma acerca do tempo que é necessário esperar até haver um retorno ao estado inicial. Ape560
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
FIGURA 13.4 Experiência dos recipientes
nas assevera que, quase certamente, haverá uma recorrência, sendo que esta poderá ocorrer apenas num instante futuro muito longínquo, o que dissipa a aparente incompatibilidade com a Segunda Lei da Termodinâmica. Para melhor ilustrarmos a aplicação do Teorema de Recorrência de Poincaré a esta experiência dos recipientes e do gás, estudaremos o exemplo sugerido pelos Ehrenfests (1957), que envolve um número muito mais pequeno de partículas, mas que se revela adequado para criar entropia suficiente para entendermos a relação entre os dois princípios que aparentam estar em conflito. Um ingrediente importante, e que será usado no final, é o Teorema de Kac que, em linhas gerais, afirma o seguinte: Se o sistema dinâmico tiver boas propriedades, então o valor esperado do tempo que o sistema demora a retornar a um dado estado observável é o inverso da probabilidade de ocorrer esse estado. Consideremos o jogo (sistema) em que existem duas urnas: a urna 1 que contém cem bolas numeradas de 1 a 100 e a urna 2 que se encontra vazia. Num saco colocam-se cem pedaços de papel numerados de 1 a 100. Em cada unidade de tempo retiramos um papel do saco, lemos o número nele inscrito, recolocamo-lo no saco e movemos a bola que tem esse número da urna onde se encontra para a outra. A Segunda Lei da Termodinâmica, assim como a nossa intuição, indicam-nos que o sistema evoluirá para o estado de equilíbrio que maximiza a 561
QUANTIFICAR O ACASO
entropia, em que existem cinquenta bolas em cada urna. Certamente, haverá flutuações aleatórias em torno da divisão 50–50, mas parece altamente improvável que a flutuação seja tão grande que as cem bolas retornem todas à urna 1. O Teorema de Recorrência afirma que, apesar de parecer muito pouco verosímel, ela acontecerá quase certamente.
FIGURA 13.5 Exemplo dos Ehrenfests
Podemos descrever o estado do sistema no instante k ∈ N0 especificando o número ωk ∈ {0, 1, . . . , 100} de bolas na urna 1 nesse instante. Se no instante k = 0 existirem ω0 bolas na urna 1 (na experiência atrás descrita foi considerado que ω0 = 100), se prosseguirmos com a extracção de papéis do saco e procedermos em conformidade com as regras do jogo, o sistema passará, sucessivamente, pelos estados ω0 , ω1 , ω2 , . . . sujeitos às seguintes condições: ωk ∈ {0, 1, . . . , 100},
|ωk − ωk +1 | = 1,
∀k = 0, 1, 2, . . .
Vamos considerar, mais geralmente, que o jogo começou num instante passado remoto indefinido e se perpetua indefinidamente para o futuro. Tal como no 562
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
exemplo 13.3.3, consideramos o espaço produto Ω = {0, 1, . . . , 100}Z constituído pelas palavras ω = . . . ω−2 ω−1 ω0 ω1 ω2 . . .
compostas por sequências bilaterais infinitas de símbolos do alfabeto {0, 1, . . . 100}. Podemos identificar cada palavra ω com uma função ω : Z → {0, 1, . . . , 100} em que ω(n) = ωn . Seja σ : Ω → Ω a transformação shift que actua em cada palavra, deslocando os símbolos uma casa para a esquerda, (σ(ω))(n) = ω(n + 1) para cada n ∈ Z. Tal como no exemplo 13.3.3, seja B a σ-algebra gerada pelos cilindros compostos por segmentos finitos de história: C (n , k , [i 1 , i 2 , . . . , i n ]) = {ω ∈ Ω : ωk = i 1 , ωk +1 = i 2 , . . . , ωk +n −1 = i n }
Para definirmos uma medida de probabilidade invariante para o shift em B compatível com as transições do jogo, consideremos a cadeia de Markov . . . , X −1 , X 0 , X 1 , . . . onde, para cada l ∈ Z, a variável aleatória X l : Ω → {0, 1, . . . , 100} é tal que X l (ω) = ωl . Se o sistema estiver no estado i , significa que existem i bolas na urna 1; então só há duas transições possíveis: o sistema passa para o estado i − 1 ou para o estado i + 1, consoante o número no papel retirado do saco corresponda a uma bola da urna 1 ou da urna 2, respectivamente. Claro que se o sistema se encontrar no estado i , a probabilidade de se retirar um papel com um i número de uma bola que se encontra na urna 1 é 100 e na urna 2 é 100−i . É assim 100 claro que i /100 P(X 1 = j |X 0 = i ) = (100 − i )/100 0
se j = i − 1 se j = i + 1
caso contrário.
Obtemos desta forma a matriz de transição:
0 1 100 0 0 A = ... . . . 0 0
1
0
0
0
···
···
0
99 100
0
0
···
···
2 100
0
98 100
0
···
···
0
3 100
0
97 100
···
···
..
..
.
..
.
···
.
..
.
..
.. . .. .
.. . .. .
.
.. .
..
0
0
0
0
99 100
0
0
0
0
0
.
0 1
0
0 0 0 .. . . .. . 1 100 0 563
QUANTIFICAR O ACASO
Seja p o vector de dimensão 101, cuja i -ésima componente é dada por p i = C i100
1 , 2100
i ∈ {0, 1, . . . , 100},
(13.5)
100! onde C i100 = i !(100−i , ou seja, em que p i corresponde à probabilidade de calha)! rem exactamente i bolas na urna 1 depois de as distribuirmos aleatoriamente pelas duas urnas, atribuindo peso 1/2 a cada urna. É fácil ver que p é um estado de equilíbrio do processo de Markov, isto é, p A = p . Então, podemos definir uma medida µ nos cilindros da seguinte forma:
µ(C (n, k , [i 1 , i 2 , . . . , i n ]) = p i 1 a i 1 i 2 a i 2 i 3 . . . a i n−1 i n ,
(13.6)
para todo k ∈ Z, n ∈ N e i 1 , . . . , i n ∈ {0, 1, . . . , 100}. Notemos que µ tem que ser em particular σ-aditiva, o que é consequência de p A = p . Para ilustrar este facto, consideremos por exemplo o cilindro C (1, 1, [j ]), ∪100 para algum j ∈ {0, 1, . . . , 100}, e observemos que C (1, 1, [j ]) = i =0 C (2, 0, [i , j ]) e C (2, 0, [i , j ]) ∩ C (2, 0, [ℓ, j ]) = ; para todo ℓ ̸= i . Para termos σ-aditividade temos ∑100 que ter µ(C (1, 1, [j ])) = i =0 µ(C (2, 0, [i , j ])), para todo j ∈ {0, 1, . . . 100}, ou seja, ∑100 p j = i =0 p i a i j . Resulta assim a necessidade de p A = p para definirmos a medida µ. Uma vez definida a medida nos cilindros é possível estendê-la univocamente à σ-álgebra gerada pelos mesmos. Para além disso, a medida de probabilidade é invariante para o shift já que por definição da medida µ nos cilindros temos que (13.6) vale para todo k ∈ Z. Consideremos agora o acontecimento E = {ω ∈ Ω : X 0 (ω) = 100} = C (1, 0, [100]), que consiste nas realizações do jogo em que estamos interessados, pois corresponde às experiências em que a primeira urna se encontra cheia no início da contagem do tempo. A probabilidade de E ocorrer é 1/2100 , uma vez · 1/2100 = 1/2100 > 0. Pelo que, por definição, µ(E ) = µ(C (1, 0, [100])) = p 100 = 100 100 Teorema de Recorrência de Poincaré temos que a probabilidade de um ponto de E ser não recorrente a E é 0. Por outras palavras: µ({ω ∈ E : ∃k ∈ N
σk (ω) ∈ E }) = µ({ω ∈ E : ∃k ∈ N
X k (ω) = 100}) = µ(E ),
o que significa que, com probabilidade 1 (probabilidade condicionada ao facto de sabermos que no instante inicial a urna 1 está cheia), o sistema volta ao estado inicial em que existem cem bolas na urna 1! Esta aparente dissonância com a Segunda Lei da Termodinâmica (e com a nossa intuição de que o sistema tende a evoluir para um «equilíbrio» compreendendo pequenas oscilações em torno do estado 50) dissipa-se à luz do Teorema 564
ANA CRISTINA MOREIRA FREITAS E JORGE MILHAZES FREITAS
de Kac, que afirma que o tempo médio de retorno à posição inicial é 1/µ(E ) = 2100 unidades de tempo. Se supusermos que cada transição ocorre ao fim de um milésimo de segundo, então o tempo médio de retorno ao estado em que a urna 1 está cheia é 2100 milésimo de segundo que, após uma pequena conta, se verifica ser mais que o tempo do Universo, estimado em 13, 8 × 109 ano! Se agora imaginarmos o caso em que, em vez de cem bolas, temos uma mole delas (aproximadamente 6 × 1023 ), então o tempo médio de espera, até se verificar uma recorrência ao estado em que a urna 1 está cheia, seria ainda muito maior. Como é fácil verificar em (13.5), o estado mais provável é o estado 50, isto é, aquele em que as duas urnas têm o mesmo número de bolas. Efectivamente, µ({ω ∈ Ω : X 0 (ω) = 50}) = 7.96 × 10−2 , o que significa que, se o sistema se encontrar no estado 50, então o tempo médio de retorno a esse mesmo estado é aproximadamente treze unidades de tempo. Isto explica a nossa intuição ao acharmos que o sistema entra num equilíbrio aparente em torno do estado em que as duas urnas têm o mesmo número de bolas.
565
QUANTIFICAR O ACASO
BIBLIOGRAFIA [1] Anton, H.; Rorres, C., Elementary Linear Algebra with Applications, John Wiley & Sons, Inc. 9th Edition, 2005. [2] Feller, W., An introduction to Probability Theory and Applications, John Wiley & Sons, Inc., New York and London, 1950. [3] Gonçalves, E.; Lopes, N.M., Probabilidades. Princípios teóricos., Escolar Editora, 2000. [4] Karlin, S., A rst course in stochastic processes, Academic Press, New York and London, 1969. [5] Kingman, J.F.C.; Taylor, S. J., Introduction to measure and probability, Cambridge University Press, London-New York-Ibadan, 1966. [6] Petersen, K., Ergodic Theory, Cambridge Studies in Advanced Mathematics, 2, Cambridge University Press, Cambridge, 1989. [7] Walters, P., An introduction to ergodic theory, Graduate Texts in Mathematics, 79, Springer-Verlag, New York-Berlin, 1982.
566