221 46 30MB
French Pages 288 Year 2017
Le compte y est ! Une histoire des mathématiques, des mesures et de la monnaie
Le compte y est ! Une histoire des mathématiques, des mesures et de la monnaie
NORMAN BIGGS
Traduction : Gérard Tronel
17, avenue du Hoggar – P.A. de Courtabœuf BP 112, 91944 Les Ulis Cedex A
Traduction du livre « Quite Right, The Story of Mathematics, Measurement, and Money » de Norman Biggs, © Oxford University Press.
Mise en pages : Patrick Leleux PAO Couverture : Conception graphique de B. Defretin, Lisieux Imprimé en France ISBN (papier) : 978-2-7598-1967-6 – ISBN (ebook) : 978-2-7598-2028-3
Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d’une part, que les « copies ou reproductions strictement réservées à l’usage privé du copiste et non destinés à une utilisation collective », et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute repré sentation intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (alinéa 1er de l’article 40). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles 425 et suivants du code pénal. © EDP Sciences, 2017
SOMMAIRE
Préface.................................................................................. 9 1. L’histoire non écrite................................................................. 11 L’histoire des mathématiques..................................................... 11 L’équité à l’âge des chasseurs-cueilleurs....................................... 13 Comptage sans nombres............................................................ 15 Les origines de la monnaie........................................................ 19 Mystérieux clair de lune............................................................ 22 2. L’aube de la civilisation............................................................ 27 Écrire et compter..................................................................... 27 Opérations sur les nombres........................................................ 30 Partage équitable à l’âge de l’arithmétique................................... 34 Mesure de longueurs et d’aires................................................... 39 Mesurer des quantités............................................................... 44 L’origine des unités de mesure.................................................... 48 Les éléments de la finance......................................................... 52 3. De la taxe et du commerce aux théorèmes.................................. 57 L’arrivée des pièces de monnaie.................................................. 57 Mathématiques pratiques.......................................................... 60 5
SOMMAIRE
Les nouvelles mathématiques..................................................... 68 Problèmes de mesure................................................................ 73 Démonstration de résultats sur les nombres entiers........................ 79 4. L’âge des algorithmes............................................................... 85 Comment faire de l’arithmétique................................................. 85 Avancées en arithmétique.......................................................... 91 Les utilisations de l’arithmétique................................................ 94 La frontière nord-ouest............................................................. 97 L’art de l’al-jabr....................................................................... 101 Les origines de l’algèbre symbolique............................................ 106 5. La fin du Moyen Âge................................................................ 109 Marchands et mathématiciens.................................................... 109 Intérêt sur intérêt, et plus......................................................... 117 Résolution d’équations.............................................................. 121 Compter et arranger................................................................. 126 Comment garder un secret : la méthode médiévale......................... 132 6. Un nouveau monde en mathématiques........................................ 141 Mesurer et calculer................................................................... 141 Vers la limite........................................................................... 146 Algèbre et géométrie combinées................................................. 149 Retour vers le futur : Archimède................................................. 153 Fermat et la nouvelle algèbre..................................................... 155 Un petit pas............................................................................ 158 Plus sur les séries.................................................................... 162 7. L’ascension des mathématiques.................................................. 167 Calcul, monnaie et controverse................................................... 167 Logarithmes et exponentielles.................................................... 173 Nombres, parfaits et premiers..................................................... 178 Nouveaux types de nombres....................................................... 186 Toutes sortes de choses merveilleuses.......................................... 188 Vers la limite, précisément......................................................... 192
6
LE COMPTE Y EST !
SOMMAIRE
8. Saisir sa chance...................................................................... 197 De grandes espérances.............................................................. 197 Jeux et stratégies.................................................................... 205 La loi des grands nombres......................................................... 210 Statistique.............................................................................. 215 9. Modéliser et mesurer................................................................ 221 Mathématiques en situation....................................................... 221 Mesure de la valeur et utilité..................................................... 223 Les problèmes de la démocratie.................................................. 230 La mesure du monde................................................................ 234 10. Mathématiques et monnaie à l’ère de l’information....................... 241 Spéculation financière............................................................... 241 Un modèle des changements de prix............................................ 245 Les formes de la monnaie.......................................................... 248 Argent, information et incertitude............................................... 252 Mesurer l’information................................................................ 256 11. Les mathématiques peuvent-elles assurer notre sécurité ?............. 263 La recherche de la sécurité........................................................ 263 Certaines choses sont faciles, mais d’autres non............................ 266 Comment garder un secret : la façon moderne............................... 272 Les mathématiques peuvent-elles assurer notre sécurité ?............... 276 Index.................................................................................... 277
7
PRÉFACE
Mon but est d’expliquer comment les idées mathématiques évoluent en réponse aux niveaux croissants de l’organisation des sociétés humaines de la Préhistoire à nos jours. L’approche traditionnelle de l’histoire des mathématiques est concentrée sur les activités courantes de mathématiciens professionnels, avec pour conséquence une restriction du point de vue. Dans les récentes décennies, on a enregistré un mouvement bienvenu vers une histoire d’un point de vue plus large. Combiné avec les nouvelles découvertes de témoignages et de documents, cette approche donne une meilleure compréhension de la part jouée par les mathématiques dans l’histoire humaine et (c’est plutôt surprenant) sur la nature des mathématiques. Dans l’esprit de cette vision élargie, l’ouvrage a pour objectif de montrer la puissance et la beauté des concepts mathématiques, qui démentent souvent leurs origines utilitaires. Le double paradigme de justification logique et de calcul algorithmique se retrouve partout. Un autre thème récurrent est la relation entre les mathématiques et les mesures de toutes sortes, y compris la mesure en termes monétaires. Ainsi, on commence avec la mesure des longueurs et des aires dans les temps anciens, puis on continue avec les problèmes 9
Préface
arithmétiques utilisant la monnaie au Moyen Âge et on termine avec l’idée contemporaine de la mesure de l’information. De nombreux amis et collègues ont apporté leur contribution. Ma plus grande dette est peut-être envers les historiens des mathématiques qui sont des références pour moi : John Fauvel et Jeremy Gray pour leur remarquable création du cours MA 290 de l’Université ouverte, et Jacqueline Stedall pour ses écrits sages et perspicaces. Je remercie spécialement Bob Burn, Leo Rogers, Adam Ostaszewski et Robin Wilson qui ont lu les brouillons des chapitres et apporté des commentaires utiles. Les participants au forum mensuel sur l’histoire des mathématiques à Oxford ont écouté patiemment mes premières tentatives de raconter l’histoire. À Oxford University Press, Keith Mansfield, Dan Taber, Harriet Konishi, Edith McGregor et Victoria Mortimer qui m’ont apporté soutien et avis professionnels. Christine et Juliet m’ont aussi apporté soutien et avis comme une famille peut le faire. Norman Biggs Octobre 2015
10
LE COMPTE Y EST !
1 L’histoire non écrite Imaginez que vous ayez à résoudre vos problèmes quotidiens sans l’aide de l’écriture ni de l’arithmétique. Il n’y a pas si longtemps, les êtres humains étaient dans cette situation. Le fait que l’espèce humaine ait survécu en dépit de cette complète ignorance indique que nos ancêtres préhistoriques étaient capables de faire face aux problèmes de partage de la carcasse d’un animal abattu et de décider quand il fallait se préparer pour l’hiver. De telles activités sont à l’origine de la méthode universelle de résolution de problèmes appelée aujourd’hui les mathématiques.
L’HISTOIRE DES MATHÉMATIQUES Cette histoire n’a pas de commencement très clair et elle est sans fin. Elle nous dit comment se sont développées, raffinées et appliquées quelques idées simples répandues dans presque tous les aspects de la vie du XXIe siècle. Pour rendre cette histoire intelligible, on suivra, en gros, l’ordre chronologique. Mais les idées se propagent au rythme de tambours différents, la force de la logique est souvent en désaccord avec le cours
L’histoire non écrite
du temps. D’autres complications sont engendrées par la dispersion des événements : des idées naissent en des points différents des parties du monde, à différentes époques et sont développées de façons différentes. La mondialisation est un phénomène récent. On doit laisser de côté la presque totalité de l’histoire de notre planète qui, on le sait, existe depuis quatre milliards d’années. Les êtres humains existent depuis seulement deux milliards d’années et, à l’époque, ils s’organisaient pour survivre sans laisser de traces écrites de leurs activités. Les écrits, dont on peut dire qu’ils sont historiques, remontent à près de 5 000 ans et on ne peut pas attacher beaucoup de sens au mot mathématiques avant cette époque. Même si l’on trouve des indices plus anciens, c’est seulement au cours des dernières 30 000 années que l’on peut détecter les plus vagues allusions aux mathématiques ou à des concepts qui leur sont liés, comme la mesure et la naissance de la monnaie. Cela signifie que nous nous intéresserons presque exclusivement aux activités d’une espèce, Homos sapiens. À notre connaissance, il n’y a pas a eu de changements significatifs dans l’évolution de la capacité de notre espèce pendant une période importante en dépit des changements dans l’environnement, et par conséquent dans les améliorations de l’état physique et de la longévité. Pour cette raison, on peut suspecter que certaines idées, que l’on peut supposer aujourd’hui comme liées aux mathématiques, sont apparues même avant que nous en ayons des preuves écrites. Mais nous devons insister sur le fait qu’aux temps préhistoriques, on peut se limiter aux prémathématiques, dont nous allons donner un très bref exposé dans la suite de ce chapitre. Certaines activités préhistoriques, telles que la cuisine et la fabrication d’outils, présentent des aspects qui sont liés de manière inhérente aux idées prémathématiques de dimensions et de formes. Ces activités sont encore les nôtres mais, de nos jours, elles sont sous contrôle numérique. Nos plats cuisinés doivent être cuits pendant un certain nombre de minutes, de même écrous et boulons doivent avoir certaines dimensions pour que l’on puisse les assembler. L’utilisation 12
LE COMPTE Y EST !
L’histoire non écrite
des nombres à de telles fins décrites remonte à la période de l’histoire humaine où les concepts commencent à s’exprimer en langage écrit et parlé. En gros, cette période correspond à l’âge de bronze et c’est à cette époque que les méthodes de base de l’arithmétique et de la géométrie sont données pour la première fois sous une forme précise. La plus grande partie de ce livre sera consacrée à cette catégorie de mathématiques. Il est clair que l’efficacité des méthodes mathématiques conduit à considérer leurs fondements et à établir un corpus de connaissances. Les réponses fournies par les mathématiques sont « vraies » et peuvent être utilisées pour résoudre des questions de manière impartiale, sans reposer sur l’opinion et la force brutale des individus. Quand les mathématiques ont commencé à envahir de nombreux aspects de la vie humaine, sociale et commerciale, des méthodes plus efficaces furent découvertes. En définitive, au cours des 500 dernières années, les mathématiques ont mené leur propre vie, conduisant à des découvertes de nouvelles théories puissantes et à leurs applications à la résolution d’un large éventail de problèmes pratiques.
L’ÉQUITÉ À L’ÂGE DES CHASSEURS-CUEILLEURS Les origines des notions d’équité et d’égalité ne sont pas claires. Si l’on adopte un modèle d’évolution grossier de « survie du plus fort », on peut alors affirmer que le seul concept primitif était l’inégalité. Toutefois, il est improbable qu’une espèce qui règle ses conflits par des combats à mort progresse, surtout si les enfants de cette espèce sont physiquement plus faibles. Ainsi, il n’est pas déraisonnable de supposer que l’idée d’équité est devenue commune à l’âge où nos ancêtres vivaient de la chasse aux animaux et de la cueillette de plantes. Notre connaissance de cette ère provient de témoignages archéologiques dans lesquels on relève quelques remarques soulignant que, dans certaines circonstances, l’équité pourrait avoir posé problème. Par exemple, il semble évident 13
L’histoire non écrite
que les différentes parties d’un mammouth étaient utilisées à des fins différentes. Abattre un mammouth n’est pas facile, et il est probable qu’il devait être courant que les mammouths soient attrapés puis tués par des humains chassant en grands groupes. Pour faire simple, supposons que seulement deux familles de chasseurs soient impliquées dans l’abattage. Comment la carcasse devait-elle être partagée entre elles ? Le problème était que les différents morceaux de la carcasse pouvaient avoir différents usages : les défenses, la peau, la graisse, la viande, les os, etc., et les besoins des familles pouvaient être différents. Le simple partage de l’animal en deux n’était pas nécessairement la bonne réponse. Heureusement, il existait une procédure simple pour s’assurer que les deux familles obtiennent ce qu’elles considéraient comme un partage honnête. Elle est appelée couper et choisir et certains lecteurs reconnaîtront le scénario connu plus familièrement sous le nom de « gâteau au chocolat ». Tout d’abord, une famille partage les morceaux de la carcasse en deux tas, chacun d’égale valeur selon ses besoins. Puis la seconde famille choisit le meilleur tas selon elle. Ainsi les deux sont satisfaites. La première famille a ce qu’elle croit être une demi-part équitable et la seconde famille a ce qu’elle croit être une demi-part au moins. Naturellement, le scénario du mammouth est une pure spéculation, comme la plupart de ce qui a été écrit au sujet des activités des hommes et femmes de l’âge de pierre. Mais il est tout à fait possible que les idées sous-jacentes soient nettement plus anciennes. C’était le point de vue d’Hésiode, écrivain grec (environ 800 ans avant J.-C.) qui décrivait les débuts de l’espèce humaine en termes mythologiques. On pense que ces mythes contiennent des idées trouvées dans des récits populaires contemporains de l’auteur, bien qu’ils soient exprimés dans un langage fantaisiste. L’une des histoires d’Hésiode rapporte une querelle entre Zeus, le dieu des dieux, et Prométhée, un titan. Prométhée avait essayé de tromper Zeus en découpant un bœuf en plusieurs morceaux qu’il avait répartis en 14
LE COMPTE Y EST !
L’histoire non écrite
plusieurs tas et mit au défi Zeus d’en choisir un. Zeus s’aperçut que les tas n’étaient pas de valeurs égales, en dépit des efforts de Prométhée pour lui prouver le contraire, et choisit celui qu’il considérait comme étant le meilleur. Les lecteurs familiers de la mythologie grecque apprendront que Prométhée a été puni par les dieux, qui ont exprimé leur colère en le condamnant à une torture cruelle. Comme ce n’était pas suffisant, ils ont persuadé Épiméthée, le frère de Prométhée, d’accepter comme épouse la fidèle Pandora et un coffre mystérieux. L’ouverture du coffre fut à l’origine de toutes les maladies du monde, y compris la téléréalité. Sous sa forme la plus simple, la méthode « couper et choisir » ne requiert pas l’utilisation des nombres. Néanmoins, elle contient l’essence de nombreuses idées simples fondamentales. Très récemment, la méthode a été étudiée par des mathématiciens et elle est utilisée actuellement dans certains accords internationaux sur les dépôts de minéraux marins. Une version plus complexe a été utilisée dans des règlements de divorce. Le problème sous-jacent à l’évaluation de la valeur d’un ensemble d’objets introduit les concepts de mesure et de monnaie, et une évaluation de la valeur équitable conduit à des procédures que nous appelons arithmétique et géométrie.
COMPTAGE SANS NOMBRES On affirme souvent que les plus anciennes traces des mathématiques sont connues sous le nom de bâtons de comptage. Ces objets présentent des successions d’entailles et il est clair qu’elles ont été faites intentionnellement (figure 1.1). Les seuls qui ont survécu sont en os, mais il est probable que la plupart étaient en bois. Des datations fiables de ces objets se trouvent dans la littérature archéologique, cependant elles sont « mises à jour » régulièrement. Toutefois, on semble s’accorder sur l’âge de certains de ces objets, qui seraient vieux de 10 000 ans. 15
L’histoire non écrite
Figure 1.1 | Un bâton de comptage en bois ou en os.
On peut penser à de nombreuses utilisations possibles des bâtons de comptage, même aux mains des chasseurs-cueilleurs. Bien que l’on ne puisse pas déterminer leur but, on doit éviter des explications qui impliqueraient des niveaux de compréhension mathématique pour lesquels il n’existe aucune preuve quelle qu’elle soit. Les plus simples suggestions sont habituellement les meilleures. Bien qu’il soit assez clair que chaque entaille soit la représentation d’un simple objet ou d’un événement, il est important de souligner que ce type de représentation ne requiert pas la notion des nombres un, deux, trois, quatre, etc. Tout ce dont nous avons besoin, c’est d’établir une correspondance entre les entailles sur le bâton et les objets eux-mêmes. Une possibilité envisageable est que les entailles représentent un ensemble d’outils en pierre, peut-être des hâches. Si chaque entaille correspond à un outil, le bâton de comptage pouvait être utilisé pour vérifier qu’aucun outil n’a été perdu, comme le montre la figure 1.2. La différence entre quinze objets et quatorze n’est pas facile à reconnaître à première vue et, aujourd’hui, on effectuerait la vérification pour compter les objets en utilisant les noms actuels des suites de nombres. Les bâtons de comptage préhistoriques donnent une méthode de vérification qui ne requiert ni noms ni signes pour les nombres. Les noms et les règles pour manipuler les signes, que nous appelons désormais l’arithmétique, appartiennent à une étape bien ultérieure de développement.
16
LE COMPTE Y EST !
L’histoire non écrite
Figure 1.2 | Un ensemble d’outils en pierre et une méthode employant un bâton de comptage qui a peut-être été utilisée pour les vérifier.
Assez récemment, les mathématiciens ont décidé d’analyser les bases logiques du système des nombres. Au fil du temps, il est apparu que le concept de correspondance biunivoque, tel que celui qui avait été mis en évidence par la correspondance entre les outils et les entailles sur les bâtons de comptage, est fondamental. À première vue, ce retour aux notions préhistoriques peut paraître surprenant, mais si l’on y réfléchit, il offre quelques aperçus approfondis sur la relation entre des idées abstraites et l’intelligence humaine. Vers 10 000 avant J.-C., il y eut des changements significatifs dans le climat de l’hémisphère nord, qui correspondent à ce que l’on appelle la fin de l’ère glaciaire. Avant cette période, les hommes et les femmes partout dans le monde avaient à gérer des vies très élémentaires. La plupart des concepts et des pratiques décrits dans ce chapitre semblent leur avoir été familiers, mais seulement sous des formes simples. Ils auraient compris l’idée du partage équitable et utilisé les méthodes des bâtons de comptage pour conserver leurs archives. Le retrait des glaces a été suivi d’une période de transition d’au moins 6 000 ans durant laquelle les façons de vivre des populations de nombreuses parties du monde, pas seulement celles 17
L’histoire non écrite
qui avaient vécu sous les glaces, se sont modifiées considérablement. Nous ne disposons pas d’archives écrites qui révéleraient les causes de ces changements, mais les preuves archéologiques sont claires : les populations sont devenues sédentaires et ont appris à cultiver des plantes et à élever des animaux. Plus tard, dans des documents écrits par des populations qui vivaient en Mésopotamie, le territoire situé entre le Tigre et l’Euphrate, on trouve des récits mythologiques de cette transition, pas très différents des mythes grecs qui nous sont plus familiers, mais écrits 1 000 ans plus tôt. L’un de ces mythes est connu sous le nom de « Le débat entre le grain et le mouton ». Il contient de fantastiques exposés sur les pour et les contre des deux modes de base de l’agriculture avec des aperçus sur des détails pratiques. Quand l’agriculteur interpelle le berger au sujet de sa vie confortable, il dit chaque nuit votre compte est fait et vous pouvez enterrer vos bâtons de comptage, donc votre berger peut dire combien vous avez de brebis, combien il y a de jeunes agneaux, combien il y a de chèvres et combien il y a de cabris. Le choix des mots suggère que les bâtons de comptage avaient acquis à cette époque d’autres fonctions sophistiquées. Comme nous le verrons au chapitre 2, il y a en effet largement assez de preuves que des formes d’arithmétique étaient utilisées en Mésopotamie 3000 avant J.-C., bien avant la publication du mythique débat. Cependant, la transition se mit en place plus lentement en d’autres lieux. Même actuellement, il existe des tribus primitives qui se trouvent dans la période de transition, quelques-unes vivent comme au temps des chasseurs-cueilleurs. Au cours de cette période, des concepts se sont développés progressivement en relation avec les nécessités d’une société plus organisée. Des mots pour des nombres particuliers commencent à être utilisés, tels que leurs deux mains, leurs cinq doigts à chaque main. Mais le langage était parlé, non écrit, et nous n’avons pas d’idées de ce qu’étaient ces mots. 18
LE COMPTE Y EST !
L’histoire non écrite
LES ORIGINES DE LA MONNAIE Un autre aspect de la vie quotidienne à l’époque préhistorique portait sur l’échange de marchandises dans des situations sociales variées. Au temps des chasseurs-cueilleurs, l’approvisionnement en nourriture était incertain et irrégulier. Un groupe pouvait avoir pêché plus de poissons que nécessaire, mais être à court de fruits. Un autre groupe pouvait se trouver dans la situation inverse. Dans ce cas, un échange aurait été une alternative évidente à la situation risquée d’un vainqueur remportant toute la mise. On peut douter que le troc ait été une pratique commune. Toutefois, il y a un problème évident avec le troc comme moyen de satisfaire les exigences de toutes les parties. Un groupe qui a trop de poissons, mais pas suffisamment de fruits, peut n’être pas capable d’interagir directement avec un autre groupe qui dispose de trop de fruits et pas suffisamment de poissons. Plus généralement, tout groupe qui souhaite prendre part à un échange peut être impliqué dans une série de négociations complexes avec plusieurs autres groupes pour satisfaire ses besoins. C’est le problème de « l’incommodité du troc ». Dans la période transitoire, les populations commencèrent à utiliser un moyen commode qui pouvait contribuer à l’échange contre des fruits ou du poisson ou d’autres produits, et elles évitaient ainsi de faire correspondre des groupes de produits à un autre. Ce moyen particulier prit plusieurs formes, mais actuellement nous les désignons toutes sous le nom de monnaie. On peut donc affirmer que l’origine de la monnaie résulte de l’incommodité du troc. En réalité, c’était l’avis du philosophe grec Aristote ; dans Éthique à Nicomaque écrit vers 350 avant J.-C., il affirmait que alors toutes les choses ou les services qui peuvent être échangés doivent être d’une certaine façon réductibles à une mesure commune. C’est dans ce but que la monnaie a été inventée et sert de moyen d’échange : ainsi on peut tout évaluer.
19
L’histoire non écrite
L’opinion d’Aristote résonna fidèlement pendant très longtemps : par exemple chez Nicolas Oresme dans son livre De Moneta (vers 1360 ap. J.-C.) et chez Stanley Jevons dans son livre Money and the Mechanism of Exchange (1872). Elle devint le sens commun accepté chez les économistes. Mais au XXe siècle, une théorie différente a émergé. Elle est due au travail des anthropologistes qui ont étudié des tribus primitives ayant réussi à survivre sans contact avec la c ivilisation. Bien sûr, on ne peut pas associer les pratiques de ces populations à celles des chasseurs-cueilleurs, mais le parallèle est très suggestif. Ce que les anthropologistes ont trouvé, c’était que les objets employés comme monnaie primitive pour le troc et les échanges étaient utilisés pour d’autres activités. De plus, ces autres activités apparaissaient comme plus fondamentales, dans la mesure où elles avaient des fonctions sociales, bien plus que commerciales. Par exemple, l’acquisition d’une fiancée entraînait souvent un versement au père de la fiancée, en reconnaissance de la privation des services d’une fille qui était un moyen d’assurer la survie de l’espèce. Les versements étaient aussi communs dans le cas d’une blessure ou d’une mort, et pour la protection contre des voisins puissants et prédateurs. Il est important d’insister sur le fait que les objets employés comme monnaie primitive n’étaient pas des pièces comme nous les connaissons et (à quelques exceptions près) n’étaient pas fabriqués avec des métaux précieux. L’utilisation de pièces comme forme de monnaie arrive beaucoup plus tard dans notre histoire et avant que de nombreux objets servent de monnaie : certains d’entre eux, tels que les grosses pierres, utilisées encore récemment sur l’île de Yap, étaient particulièrement peu commodes. Dans la progression générale vers un système économique moderne, les formes les plus courantes de monnaie étaient celles qui avaient aussi une valeur intrinsèque, comme les troupeaux et les blés. Au temps des premiers fermiers, ces éléments étaient largement disponibles. Ils pouvaient être utilisés directement comme des parts de troc-échange ou être transmis lors d’une série d’échanges de telle sorte que les besoins de tous soient 20
LE COMPTE Y EST !
L’histoire non écrite
satisfaits. Il est clair que ces transactions ont stimulé le développement de l’arithmétique (combien de bœufs me permettraient d’acheter une fiancée ?) et de la mesure (combien de blé me permettrait d’acheter un bœuf ?). Au chapitre 2, on verra que ces idées avaient été développées à l’époque des premiers textes écrits.
Figure 1.3 | Coquillages de un centimètre de long environ.
Mais nous ne pouvons pas passer à un autre sujet que la monnaie sans citer l’une de ses formes les plus répandues, la coquilles de cauri (figure 1.3). Le cauri est un petit mollusque dont la coquille possède 21
L’histoire non écrite
plusieurs des propriétés requises pour être une monnaie-objet. Il est durable, facile à transporter et peut être obtenu en grandes quantités. En réalité, le cauri est l’ancêtre naturel de l’espèce de monnaie-jeton utilisée aujourd’hui, ayant peu ou pas de valeur intrinsèque. On ne sait si les cauris étaient utilisés à une époque très ancienne avant l’existence de textes écrits, mais on trouve des références dans des textes chinois datant d’au moins 3 000 ans. Plus récemment, aux XIXe et XXe siècles, des milliers de tonnes de cauris avaient été extraits des mers au voisinage des Maldives, pour être utilisés comme monnaie en Afrique et en Inde. En résumé, l’origine de la monnaie remonte aux temps préhistoriques car elle était utile dans toutes sortes de transactions, sociales et commerciales. Quand les chasseurs-cueilleurs sont devenus des fermiers, ils utilisaient des éléments comme le bétail ou le blé pour toutes les marchandises ou les services dont ils avaient besoin. Cette forme primitive de l’économie a conduit inévitablement au développement d’idées avancées, que nous connaissons maintenant sous le nom d’arithmétique.
MYSTÉRIEUX CLAIR DE LUNE Il semble raisonnable de supposer que, au tout début de l’humanité, les premiers humains étaient conscients du rythme annuel des saisons. Pour eux, les saisons se définissaient par des changements observables de l’environnement : au printemps, les arbres et les plantes recommencent une nouvelle croissance ; en automne, les feuilles tombent. Les premiers humains ont sans doute été conscients du lever quotidien du soleil, et du début et de la fin du cycle lunaire. Cependant, ces phénomènes réguliers étaient considérés comme de grands mystères, comme l’activité de forces surnaturelles. Pendant presque toute l’histoire de l’humanité, il n’y a eu aucune compréhension des mouvements relatifs du Soleil, de la Lune et de la Terre, laissant de 22
LE COMPTE Y EST !
L’histoire non écrite
côté les causes physiques de ces mouvements. Des systèmes complexes étaient élaborés pour expliquer, par exemple, pourquoi le lever du soleil est inexorable, et ceux qui pouvaient en tirer une bonne histoire devenaient puissants comme les prêtres et les gourous, qui se targuaient d’être des hommes et des femmes « sages ». C’est probablement ces « sages » qui ont commencé à réfléchir aux relations entre les jours, les mois et les années. Mais le langage numérique pour traduire ces relations n’existait pas encore, donc il n’existait peut-être pas d’équivalent de nos calendriers modernes fondés sur une base numérique, comme les 365 jours d’une année. Avant l’arrivée de l’écriture et de l’arithmétique, un calendrier ne pouvait exister que sous forme d’analogie. Par exemple, certains bâtons de comptage ont pu être utilisés pour vérifier le nombre de jours entre une pleine lune et la suivante. Le fait que la survie de l’espèce dépende du cycle menstruel, à peu près de même durée que le mois d’un cycle lunaire, est un autre facteur qui a pu être enregistré de la même façon. Les sages devaient être très puissants, particulièrement lorsqu’ils découvrirent les relations entre les jours et les saisons. Cette connaissance, même rudimentaire, permettait de faire des prédictions qui suggéraient que ces personnes avisées disposaient de pouvoirs magiques sur l’environnement. Cela est apparu dans le sillage de la période glaciaire, avant l’arrivée de l’écriture. Elles pouvaient avoir utilisé de simples témoignages : une ombre indique non seulement le passage des heures du jour, mais aussi des saisons de l’année, en fonction de sa longueur. Cependant, les instruments primitifs en bois n’étaient pas durables et même avant l’aube de la civilisation, les réalisations en pierre étaient préférées. À l’époque où la civilisation émergea en Égypte, les pierres sont devenues des obélisques imposants sur lesquels toutes sortes de données pouvaient être enregistrées. En Grande-Bretagne, on trouve des pierres dressées en cercles, certaines remplaçant des constructions en bois. L’état de ruine de ces monuments anciens ne permet pas de comprendre 23
L’histoire non écrite
comment ils étaient utilisés, mais il est bien possible qu’ils aient été construits par des personnes avisées pour montrer leurs pouvoirs personnels sur le rythme des saisons. Puisque ces sujets étaient d’importance vitale pour la communauté, les monuments étaient des lieux de cérémonies, telles que des remerciements aux dieux, des offrandes pour s’assurer de leur bonne volonté. Les cérémonies étaient sans doute organisées par des chefs locaux et leurs conseillers, qui pouvaient ainsi profiter de l’occasion pour faire étalage de leurs pouvoirs personnels. L’un des défauts les plus sérieux des écrits du XXe siècle sur l’histoire des idées est la tendance à attribuer des connaissances de concepts sophistiqués aux peuples primitifs. Malheureusement, ces théories ont été mises en avant par des personnes qui étaient, en quelque sorte, les « sages » de notre époque, et elles sont encore reprises de manière irréfléchie par d’autres qui prétendent avoir une meilleure connaissance. Par exemple, il a été remarqué que certains groupes d’entailles sur un os taillé (comme celui montré sur la figure 1.1) représentaient des nombres particuliers que l’on appelle nombres premiers. Cela aboutirait à suggérer que la personne qui a gravé ces entailles sur l’os était familière d’un système complexe d’idées arithmétiques qui n’existaient pas (et ne pouvaient pas exister) à cette époque. Un autre exemple concerne la théorie des cercles de pierre qui auraient été construits en utilisant un « yard mégalithique », dont la mesure avait été standardisée dans une grande partie de l’Europe et de l’Asie (on affirmait que sa valeur était d’environ 83 centimètres, en termes actuels). En réalité, les preuves archéologiques suggèrent que les habitants de Grande-Bretagne, à cette époque (3000–2500 avant J.-C. environ), vivaient dans une culture préhistorique et rien ne permet de dire qu’ils étaient familiers d’un système complexe de mesures. Pour eux, une mesure de longueur évidente pouvait être le pas de l’homme et il est facile d’imaginer qu’il a pu être utilisé par les constructeurs des cercles de pierre. Comme le pas de l’homme correspond à peu près à 83 centimètres, 24
LE COMPTE Y EST !
L’histoire non écrite
il n’est pas étonnant qu’une telle preuve puisse aider à étayer la théorie du yard mégalithique, même si le bon sens la rejette. La suite de ce livre est consacrée à la recherche de traces de notions préhistoriques de mesure et de monnaie développées dans des concepts acceptés aujourd’hui et sans lesquels la vie moderne serait impossible. Le fil conducteur qui donne une cohérence à cette histoire est ce que nous appelons désormais les mathématiques.
25
2 L’aube de la civilisation Il y a environ 4 500 ans, les populations de certaines parties du monde vivaient en colonies sur de grands espaces. Si vous aviez appartenu à une colonie, vous auriez remarqué que certains aspects de la vie étaient réglementés par des signes étranges et des symboles. Les symboles les plus mystérieux étaient ceux qui représentaient des nombres et les quelques personnes qui comprenaient ces symboles étaient des membres importants de la communauté. Si vous aviez été l’un d’eux, vous auriez été capable de résoudre des problèmes pratiques, comme la répartition équitable du blé.
ÉCRIRE ET COMPTER Combien ai-je de moutons ? « La discussion entre le Grain et le Mouton », mentionnée au chapitre 1, nous apprend que les premiers fermiers de Mésopotamie conservaient des traces de leurs troupeaux par l’ancienne méthode des bâtons de comptage. Il existe une preuve archéologique que de meilleures méthodes pourraient avoir été utilisées vers 8 000 ans avant J.-C., mais il n’y a pas d’accord unanime sur les détails. On sait que vers 3000 avant J.-C., à la naissance de 27
L’aube de la civilisation
l’écriture, d’importants développements sont apparus. Lentement, mais inexorablement, les mots et les symboles pour les nombres ont émergé et, pour les populations qui pouvaient les comprendre, il s’agissait d’une part importante de leur vie. Pour replacer cette évolution en perspective, il faut remarquer que les 5 000 ans qui séparent les supposées origines des premiers textes écrits est à peu près de même durée que celle qui sépare les premiers textes écrits du temps présent. Vers 3200 avant J.-C., une importante colonie s’est établie à Uruk, en Mésopotamie. De nombreux habitants n’étaient pas directement impliqués dans l’agriculture et une hiérarchie sociale était en place. Quelques citoyens de haut rang contrôlaient la vie économique de la cité en administrant la répartition des ressources ; ainsi, par exemple, les ouvriers du bâtiment recevaient la nourriture dont ils avaient besoin. Des archéologues ont trouvé de nombreuses petites tablettes d’argile qui étaient utilisées pour enregistrer ces mécanismes administratifs. Les tablettes ont été gravées en faisant des marques sur l’argile humide : certaines de ces marques sont des pictogrammes représentant des marchandises de toutes sortes et d’autres sont des symboles représentant des nombres (figure 2.1). Apparemment, nombre de ces tablettes étaient jetées ou recyclées comme matériaux de construction. Mais lorsqu’elles étaient sèches, elles étaient presque indestructibles, et cela nous fournit (actuellement) le meilleur moyen de savoir comment les nombres étaient utilisés à la fin du IVe millénaire avant J.-C.
Figure 2.1 | Pictogrammes et représentations de nombres utilisés sur des tablettes d’argile à Uruk, vers 3150 avant J.-C.
28
LE COMPTE Y EST !
L’aube de la civilisation
La première révélation fournie par les tablettes d’Uruk est que les nombres étaient représentés sous forme abrégée. Les abréviations différaient suivant ce qui était compté, mais l’idée était assez simple. Par exemple, si le nom pour cinq moutons était un « lot », alors le lot pouvait être représenté par un symbole, et vingt-trois moutons non par vingt-trois entailles, mais plutôt par quatre lots et trois entailles. Un tel système a une conséquence malheureuse : vingt-trois moutons et vingt-trois mesures de blé pouvaient être écrits de manières très différentes, car l’abréviation correspondante pour le blé pouvait être une « pile » de six mesures, si bien que vingt-trois mesures de blé étaient représentées par trois symboles de piles et cinq entailles simples. Nous ne devrions pas mépriser cette diversité, car il n’y a pas si longtemps, on enseignait encore à certains enfants que douze pouces valaient un pied et huit pintes valaient un gallon. Heureusement pour les populations d’Uruk, leur système n’a pas été gravé dans le marbre et des améliorations ont été possibles. À la même époque que les tablettes d’Uruk, il y a des preuves que les signes pour les nombres étaient utilisés en Égypte, en particulier à Naqada, une colonie sur le Nil, à environ 600 kilomètres au sud du Caire. De petits bouts d’ivoire y ont été trouvés, recouverts sur une face de hiéroglyphes et sur l’autre d’un nombre. Ici aussi les nombres sont écrits sous forme abrégée, avec un symbole pour les unités, un symbole pour les dizaines, un symbole pour les centaines, etc. (figure 2.2). La fonction de ces bouts d’ivoire n’est pas totalement comprise. Mais quels que soient leurs objectifs, on dispose d’assez d’exemples pour justifier l’affirmation qu’à cette époque, un système effectif de représentation des nombres était utilisé dans certaines parties de l’Égypte. En résumé, des preuves suggèrent que le développement de l’écriture est clairement lié à l’utilisation de symboles dans la représentation des nombres1. Les textes écrits et les symboles pour les nombres 1. Un bon exposé sur les idées concernant les mathématiques anciennes se trouve dans Mathematics of Egypt, Mesopotamia, China, India, and Islam (Princeton, Princeton University Press, 2007), édité par Victor Katz. Ce livre est référencé par [K] dans les notes suivantes. 29
L’aube de la civilisation
s’imposent face à la nécessité de conserver l’historique des différentes choses importantes dans le cadre des premières économies agraires. Les symboles de nombres ont été les premiers outils des mathématiques, et en tant que tels, ils ont joué un rôle important dans le processus appelé civilisation.
Figure 2.2 | Symboles sur des bouts d’ivoire, Égypte, vers 3150 avant J.-C. On pense qu’ils représentent une centaine, quatre dizaines et trois unités.
OPÉRATIONS SUR LES NOMBRES Les tablettes d’argile d’Uruk à la fin du IVe millénaire avant J.-C. étaient les premières d’une longue série d’archives analogues. Les signes gravés sur les tablettes ont évolué progressivement dans un style d’écriture connu sous le nom de cunéiforme et, comme nous l’expliquerons brièvement, des signes conventionnels étaient utilisés aussi pour les nombres. Vers 2000–1500 avant J.-C., ce système uniforme d’écriture était employé dans une grande partie du Sud de l’Irak actuel. On se réfère à cette période et à sa culture comme étant celles de l’ancienne Babylone (bien que l’association d’ancienne à Babylone soit seulement symbolique)2.
2. Voir le chapitre de [K, 58-–182] sur « Mesopotamian Mathematics » par Eleanor Robson ; on recommande aussi son livre sur Mathematics in Ancient Iraq: A social history (Princeton, Princeton University Press, 2008).
30
LE COMPTE Y EST !
L’aube de la civilisation
À cette époque, l’organisation économique de la société était devenue plus complexe et par conséquent, l’utilisation sophistiquée des nombres s’est développée. Les procédures utilisaient un système de numération à base soixante. Par exemple, comme le nombre 75 s’écrivait une soixantaine et quinze unités, il était représenté par une combinaison des signes pour un et quinze. Pour des nombres plus grands, les unités étaient les soixante soixantaines (nos 60 × 60 = 3 600), les soixante soixante soixantaines (nos 60 × 60 × 60 = 216 000), etc. Ce système porte le nom de système sexagésimal, tiré du mot latin signifiant soixante. Puisque la base du système était soixante, il était nécessaire d’avoir des signes spécifiques pour les nombres de 1 à 59. Ils étaient formés à partir de symboles cunéiformes pour 1 et 10 comme le montre la figure 2.3. Par exemple, notre nombre 17 constitué de : une dizaine et de sept unités était représenté par le symbole de dix et sept symboles unités. Les nombres plus grands que 59 étaient écrits sous forme sexagésimale ; ainsi le nombre 257 était écrit avec quatre symboles de soixantaines (représentant quatre soixantaines) combiné avec le symbole représentant 17.
Figure 2.3 | Symboles pour des nombres écrits sous forme cunéiforme.
Le fait que les nombres sont écrits sur des tablettes d’argile, dont nombre d’entre elles ont survécu, fournit de manière remarquable un témoignage de la façon dont les mathématiques étaient utilisées sous l’ancienne Babylone. Bien que le système sexagésimal ne soit plus systématiquement utilisé, il est étonnant que le nombre 60 joue encore un rôle majeur dans l’organisation de notre vie quotidienne. Si vous vous demandez pourquoi une heure est divisée en 60 minutes, vous pouvez 31
L’aube de la civilisation
accuser les anciens Babyloniens. La raison historique de la réussite du système était qu’il pouvait être utilisé pour effectuer des opérations numériques par l’administration qui contrôlait la vie économique de la région. Ces opérations sont ce que l’on appellera l’arithmétique. Fondamentalement, c’est une forme habile de jonglage avec les signes des nombres, permettant de répondre à certaines questions pratiques. Pour aider à comprendre les méthodes employées en Mésopotamie, les historiens ont mis au point un moyen de traduire les nombres sexagésimaux sous forme moderne, sans détruire les caractères fondamentaux du système. Par exemple, le symbole pour 75 est traduit par [1|15] et le symbole 257 par [4|17]. On appellera cela la « notation mixte ». L’avantage de la notation mixte est qu’elle peut être utilisée pour expliquer clairement comment les procédures arithmétiques élémentaires étaient effectuées. La plus simple est l’addition. Si j’ai un troupeau de [1|15] moutons et que j’acquiers le troupeau de mon voisin de [4|23] moutons, combien de moutons aurai-je ? La méthode évidente consiste à compter les soixantaines et les unités séparément : ainsi, on aura 1 + 2 = 3 soixantaines et 15 + 23 = 38 unités. En notation mixte, la réponse est [3|38] moutons. Si le nombre total d’unités avait dépassé 59, alors le nombre de soixantaines aurait dû être augmenté de 1 et l’excédent reporté dans les unités : par exemple, [1|45] moutons et [2|39] donnent [4|24] moutons. On observe que les opérations avec des nombres sexagésimaux exigent la connaissance de toutes les réponses pour les nombres de 1 à 59, et les scribes devaient apprendre cela d’abord. Par exemple, pour résoudre les problèmes ci-dessus, ils devaient savoir que 45 et 39 font [1|24]. Un autre niveau de complexité apparaît quand on arrive à la multiplication. Supposons que l’on veuille multiplier [5|7] et [3|2] ; soit [5 soixantaines et 7 unités fois 3 soixantaines et 2 unités].
La méthode était basée sur la décomposition des nombres de la manière suivante. D’abord, les 5 soixantaines sont multipliées par les 3 soixantaines, ce qui donne 5 × 3 soixante soixantaines. Puis on 32
LE COMPTE Y EST !
L’aube de la civilisation
a 5 × 2 soixantaines et 7 × 3 soixantaines. Enfin, il y a 7 × 2 unités. On effectue les calculs sur les nombres 5 × 3, etc., et en regroupant les termes, on obtient la réponse 15 soixante soixantaines, 31 soixantaines et 14 unités. Ce qui donne en notation mixte : [5|7] fois [3|2] est égal à [15|31|14].
La procédure pour la multiplication met en jeu implicitement des règles sur la décomposition des nombres et le regroupement des termes semblables. On suppose que les scribes mésopotamiens considéraient ces règles enseignées comme absolument évidentes et fondées sur un sens inné de la manière dont les nombres représentaient la réalité. C’était des milliers d’années avant que les mathématiciens commencent à se poser la question de la réelle universalité des nombres. Un autre point significatif est que les scribes avaient à apprendre nettement plus de « tables » que nous. Parce que notre système moderne est à base 10, et non 60, on doit connaître les tables de 1 à 9, alors que les Mésopotamiens devaient lutter avec les tables de 1 à 59. On a la chance de savoir, avec une certaine certitude, comment étaient formés les scribes à l’époque de l’ancienne Babylone. En 1952, les archéologues ont découvert à Nippur, au sud de l’Irak, un bâtiment qui, de manière évidente, devait avoir servi d’école. Les planchers et les murs de ce bâtiment contenaient au moins 1 000 tablettes d’argile qui avaient été jetées et réutilisées dans un but plus fondamental. En étudiant en détail le style et les attributs de ces tablettes, il est possible de retrouver la façon dont les programmes d’études étaient organisés. Les scribes devaient apprendre beaucoup de choses. Ils devaient maîtriser l’art d’écrire et les règles de la multiplication, ainsi que des listes imposantes de poids et mesures. Il est fort possible qu’ils n’avaient pas à mémoriser toutes ces données car ils disposaient de tables de référence. Mais l’apprentissage de l’utilisation de ces tables devait supposer un haut niveau de compréhension mathématique. Cela n’était pas de l’éducation de masse dans le style moderne, mais 33
L’aube de la civilisation
l’entraînement d’une élite qui voulait s’enrichir et devenir puissante. Et ce qui représentait peut-être la partie la plus difficile de leurs activités devrait encore être précisée.
PARTAGE ÉQUITABLE À L’ÂGE DE L’ARITHMÉTIQUE Le problème qui donnait le plus de soucis aux administrateurs mésopotamiens était le partage des ressources. Le développement de l’arithmétique offrait la perspective d’un partage équitable utilisant des méthodes numériques, mais il y avait des difficultés évidentes. Quand vingt pains devaient être partagés équitablement entre cinq personnes, chacune en obtenait quatre et tout le monde était satisfait. Mais s’il y avait neuf personnes, alors le partage pouvait ne pas être effectué de manière exacte ; chaque personne recevait deux pains, mais il en restait encore deux. Ces derniers devaient être partagés en neuf parties égales d’une certaine façon, ainsi chacune recevait la fraction que l’on appelle deux neuvièmes. Il y a plusieurs manières de considérer ce que l’on appelle une fraction et on doit être prudent et ne pas confondre les règles que l’on nous enseignait enfant avec celles utilisées il y a plus de 4 000 ans. Les anciennes civilisations de Mésopotamie et d’Égypte avaient découvert les fractions, mais de manières différentes, et celles utilisées aujourd’hui sont encore différentes. Pour souligner cette distinction, on emploiera fréquemment l’expression « partie fractionnaire » dans la suite. La méthode mésopotamienne d’utilisation des parties fractionnaires était une extension de leur notation sexagésimale. Pour les nombres entiers, elle employait les soixantaines et les plus grandes unités ; et pour les parties fractionnaires, les soixantièmes et les plus petites unités correspondantes. La même notation était utilisée dans les deux cas ; ainsi le symbole écrit [4|17], soit 257, pouvait aussi s’écrire comme 4 17 257 + = . 60 3600 3600
34
LE COMPTE Y EST !
L’aube de la civilisation
Cela peut paraître confus, mais c’était une idée lumineuse : les parties fractionnaires peuvent être manipulées de la même façon que les nombres. Elles pouvaient donc être utilisées avec une grande efficacité dans les calculs arithmétiques. En réalité, le sens d’un ancien calcul devait être clair en fonction du contexte ; notre difficulté est que 4 000 ans plus tard, le contexte lui-même n’est pas toujours clair. Pour résoudre les problèmes de division avec la notation sexagésimale, la méthode utilisait une autre table. En termes modernes, l’idée était que diviser par neuf (par exemple) est la même chose que multiplier par la fraction un neuvième. Les scribes étaient entraînés à utiliser une table contenant une liste d’entrées comme la suivante : •• la 8e partie est [7|30] ; •• la 9e partie est [6|40] ; •• la 10e partie est [6]. Ici, la notation sexagésimale pour les parties fractionnaires intervient directement car les règles pour la multiplication étaient identiques, que [6|40] représente 6 soixantaines et 40 unités, ou que l’on puisse l’écrire comme 6 40 , + 60 3600
ce qui est égal à notre un neuvième (comme on peut facilement le vérifier). Comme exemple pour montrer la facilité d’application de ces règles, supposons que nous soyons un bureaucrate devant effectuer le partage de deux pains équitablement entre neuf personnes. Tout d’abord, on se réfère à la table pour trouver que la neuvième partie est [6|40]. On en déduit alors par simple addition que deux neuvièmes est égal à [13|20]. Il est remarquable de constater que l’on a la réponse : 13 et 20 sont les deux nombres nécessaires pour partager les pains, comme on le montre sur la figure 2.4. On doit supposer que chaque pain est partagé en 60 parties (tranches). On suppose que 13 tranches sont données à chaque personne. Cela fait 9 × 13 = 117 de 120 tranches, avec 3 tranches restantes. Chacune de ces trois tranches 35
L’aube de la civilisation
est partagée en 60 morceaux, ce qui fait 180 morceaux. Si 20 morceaux sont donnés à chaque personne, l’attribution finale est de 9 × 20, soit 180. En notation moderne, le résultat est 9×
13 20 +9× = 2. 60 3600
On ne peut pas affirmer que cette méthode soit vraiment pratique dans le cas des pains, mais si les objets en question étaient des mesures de blé, les opérations pourraient être nettement plus commodes en utilisant des récipients adaptés. Ce qui signifie qu’il s’agit d’une procédure universelle qui peut s’appliquer à n’importe quel problème de division. Elle requiert un degré modeste de compétence pour l’utiliser correctement, mais elle exige inutilement du temps et des efforts. L’homme ou la femme inconnu(e) qui l’a découverte mérite le titre de génie, car cette division arithmétique a été la première découverte majeure de l’histoire des mathématiques. Elle était non seulement de grande importance pour l’administration des nécessités de la vie, mais elle permettait aux Mésopotamiens de résoudre des problèmes du monde physique, tels que la relation entre les cycles des jours et des années. Avec cette méthode, ils étaient capables d’établir un vrai calendrier.
60 tranches
57 tranches et 3 tranches formant 180 morceaux
Figure 2.4 | Partager deux pains entre 9 personnes, chacune d’elles obtient 13 tranches et 20 morceaux.
Nous avons déjà assez insisté pour justifier l’affirmation selon laquelle la division était la plus complexe des opérations 36
LE COMPTE Y EST !
L’aube de la civilisation
fondamentales de l’arithmétique. La méthode mésopotamienne était simplement une façon de la traiter. Une approche différente était utilisée en Égypte, où l’arithmétique avait aussi atteint un stade avancé au IIe millénaire avant J.-C. Bien que de nombreux écrits existent sur l’arithmétique égyptienne, il est important de se rappeler que les sources documentaires sont rares, et presque toutes de provenance douteuse. À la différence de la situation mésopotamienne, très peu de textes mathématiques égyptiens de cette période ont survécu, le plus célèbre est celui que l’on connaît comme le papyrus de Rhind, qui date approximativement de 1650 avant J.-C. Les historiens ne sont pas d’accord sur le but original de ce document, néanmoins on peut en tirer beaucoup d’informations3. Un point très clair est que les Égyptiens avaient développé des systèmes arithmétiques utilisant des symboles pour les nombres analogues à ceux trouvés sur les bouts d’ivoire de Naqada (figure 2.2). Les procédures pour l’addition et la multiplication étaient bien établies, suggérant que les scribes eux-mêmes avaient une bonne compréhension des principes de base et pouvaient les utiliser quelles que soient les techniques adaptées à chaque cas. Parvenus à la division, ils ont utilisé une technique ingénieuse qui intéresse encore les mathématiciens d’aujourd’hui, bien que cet intérêt soit plus théorique que pratique. D’après le papyrus de Rhind, l’approche égyptienne de la division arithmétique utilisait ce que l’on peut considérer maintenant comme des fractions de type particulier. Mais notre point de vue n’explique pas nécessairement comment les Égyptiens avaient découvert leur méthode et comment ils l’utilisaient. Voici un exemple. Supposons qu’un bureaucrate utilisant le papyrus de Rhind soit face au problème discuté ci-dessus, le partage équitable de 2 pains entre 9 personnes. Il ou elle commençait à consulter l’une des tables 3. Voir le chapitre « Egyptian Mathematics » [K, 7–56] par Annette Imhausen ; il contient un bon exposé sur le papyrus de Rhind. 37
L’aube de la civilisation
du papyrus où l’entrée pertinente serait quelque chose comme ce qui suit : diviser 2 par 9 en utilisant les 6es parties et les 18es parties.
Utilisant cette règle, le bureaucrate commence par partager les pains en 6es et en donne un à chaque personne. Trois 6es restant, et chacun doit être partagé en tiers, ce qui aboutit à neuf 18es d’un pain. Chaque personne a l’un d’eux, complétant l’allocation, comme le montre la figure 2.5.
Figure 2.5 | La méthode égyptienne ancienne de la division de 2 pains entre 9 personnes.
En notation moderne, la règle est équivalente à : 1 2 1 = + , 18 9 6
où deux neuvièmes, la fraction cherchée, est décomposée en somme de deux fractions qui ont le même numérateur 14. Ces fractions sont connues maintenant comme les fractions égyptiennes, une expression plutôt mal choisie, puisque les Égyptiens ne les considéraient pas comme des fractions au sens actuel. En utilisant les méthodes modernes, il est très facile de montrer que toute fraction peut être
4. Une expression alternative de 2/9 est 1/5 + 1/45. La convention était que les fractions de la décomposition devaient décroître en valeur, ainsi l’expression 1/9 + 1/9 n’était pas permise.
38
LE COMPTE Y EST !
L’aube de la civilisation
décomposée en fractions égyptiennes, mais les Égyptiens ne disposaient pas de l’avantage de notre notation et se contentaient d’établir une liste. En réalité, la décomposition n’est pas unique, mais la table de Rhind contient seulement une décomposition pour chaque fraction et personne n’a été capable de donner une explication satisfaisante de la façon dont le choix a été fait. Ceci suggère que la liste a été établie par des mathématiciens très astucieux, utilisant probablement un éventail de méthodes essais et erreurs. Les scribes moins doués se contentaient d’utiliser la table comme une donnée sans essayer de l’améliorer. Notre discussion sur l’arithmétique ancienne doit s’achever par une mise en garde. D’une certaine façon, l’historien des mathématiques a une tâche facile lorsqu’il est face à un problème de traduction de textes arithmétiques anciens. Bien que les méthodes utilisées soient souvent peu familières, la cohérence universelle de l’arithmétique est une grande aide, permettant de décider ce qui est écrit. Toutefois, des difficultés subsistent. La traduction d’un calcul en notation moderne n’aide pas nécessairement à comprendre ses objectifs. Pour cette raison, il est bon de réfléchir avant d’affirmer que les anciens connaissaient certaines parties des mathématiques avancées. Leurs intérêts en arithmétique étaient entièrement pratiques, et il n’y a aucune raison de supposer qu’ils s’intéressaient aux propriétés des nombres, ce que l’on appelle désormais la théorie des nombres. Il faudra attendre une nouvelle catégorie d’approches intellectuelles qui sera décrite au chapitre 3.
MESURE DE LONGUEURS ET D’AIRES Une mesure est l’affectation d’un nombre à un objet pour décrire l’une de ses propriétés caractéristiques. De nos jours, une mesure est exprimée par un nombre d’unités standards : ainsi ma taille est de 185 centimètres, et ce nombre de centimètres est lisible sur un mètre à ruban. Il est raisonnable de supposer que de simples mesures de longueur étaient faites de cette manière bien avant d’avoir des textes écrits. En réalité, cette forme de mesure paraît étroitement liée à la 39
L’aube de la civilisation
notion de comptage lui-même et à l’évolution des mots assignés aux nombres. À l’origine, les unités étaient déterminées par des parties du corps humain ; par exemple, la longueur d’un avant-bras humain (environ 50 centimètres) pourrait avoir été une unité commode pour des activités domestiques, telles que la charpente et la construction des maisons. Lorsque les premiers textes écrits sont apparus, une unité qui avait à peu près cette valeur est mentionnée dans de nombreux textes. Le nom actuel varie d’un lieu à un autre, mais nous le désignerons par le nom latin cubit, introduit bien entendu nettement plus tard. Dans l’ancienne Égypte, le cubit apparaît dans le papyrus de Rhind et il est traduit par un hiéroglyphe représentant un avant-bras. Pour mesurer une longueur plus précisément, de plus petites unités ont été utilisées, comme les paumes et les doigts, toujours fondées sur l’anatomie humaine. Toutefois, certains des premiers textes anciens font référence à de plus grandes unités, pour des mesures de différentes sortes. Elles traitent de la mesure de l’aire d’une parcelle de terrain, un concept qui pourrait remonter à l’âge des chasseurs-cueilleurs, lorsque des groupes tribaux revendiquaient le contrôle d’un territoire particulier défini par des frontières naturelles comme des forêts et des rivières. L’arrivée des fermiers sédentaires était inévitablement associée à la notion d’appartenance de certains morceaux de terre à certains groupes familiaux. Il s’agit d’une forme plus spécifique de propriété et, à l’époque, cela aboutissait à des problèmes qui pouvaient seulement être résolus par des méthodes mathématiques. Combien de terrain ai-je ? Si je souhaite le partager équitablement entre mes deux enfants, comment faire ? Tels étaient les problèmes originaux de géométrie, littéralement la mesure de la terre. On admet couramment que le plus vieux texte au monde traitant de mathématiques est une tablette trouvée à Uruk et datant de 3200 avant J.-C. La tablette est connue sous la référence W.19408.76 et elle est conservée au musée d’Irak5. Son thème est la dimension 5. La tablette W.19408.76 est décrite par Robson [K, 73]. À la suite des bouleversements en Irak, son sort est préoccupant.
40
LE COMPTE Y EST !
L’aube de la civilisation
d’un champ. La tablette elle-même ne contient aucun diagramme, mais d’après son contenu, il semble probable que le champ était limité par quatre lignes droites (figure 2.6). Le texte écrit sur la tablette n’est pas explicite, cependant il semble que le scribe ait essayé d’estimer l’aire du champ en multipliant la moyenne des longueurs des côtés AB et CD par la moyenne des longueurs des côtés AD et BC. Cette méthode était communément employée autrefois, mais bien entendu, ce n’est qu’une approximation, et les nombres utilisés dans le calcul semblent aussi être des approximations grossières. Le fait significatif est que le résultat est obtenu par la multiplication des deux longueurs. Ainsi pour le scribe d’Uruk, et pour nous, l’aire est un concept bidimensionnel. Une mesure d’aire est définie comme le produit de deux mesures longueurs et s’exprime alors en une unité comme le mètre carré. Par exemple, une parcelle de terre rectangulaire dont les côtés sont de longueur 7 et 4 mètres a une aire de 7 × 4 mètres carrés (figure 2.7). Dans un cas aussi simple, les mètres carrés sont presque évidents et on peut donner la réponse simplement en comptant les carrés. A
B
D
C Figure 2.6 | Comment peut-on mesurer la superficie du champ ?
4 mètres
7 mètres Figure 2.7 | L’aire du rectangle est de 7 × 4 mètres carrés.
41
L’aube de la civilisation
Quand l’auteur de la tablette W.19408.76 a trouvé l’aire du champ, l’unité de longueur était une barre dont la longueur était d’environ 6 mètres. Les côtés du champ pouvaient avoir été mesurés avec une corde de cette longueur, une méthode qui est mentionnée dans des documents ultérieurs. Il faut aussi noter que la tablette d’Uruk était écrite à une époque où l’on ne savait faire des multiplications que dans des cas très simples, bien que 1 000 ans plus tard, cette opération deviendra une routine pour les scribes de la période de l’ancienne Babylone. Une difficulté plus fondamentale réside dans le fait que la plupart des champs ont des formes plutôt irrégulières et les unités, qu’elles soient des barres carrées ou des mètres carrés, ne peuvent pas s’inscrire comme dans un rectangle. Quand on essaie de couvrir un champ avec un maillage de carrés, de nombreux carrés pourront être partiellement à l’intérieur et partiellement à l’extérieur du champ, et il ne sera pas facile de les compter. Au IIIe millénaire avant J.-C., cette difficulté a été levée par la découverte de l’un des plus importants résultats de toute la géométrie. Supposons que l’on ait un champ triangulaire, soit (T) comme sur la figure 2.8. Imaginons un autre triangle de même taille et de même forme placé comme l’indique le second dessin. Maintenant, découpons un morceau triangulaire à droite et déplaçons-le vers la gauche comme sur le troisième dessin ; le résultat final est un rectangle (R), dont l’aire est clairement égale à deux fois celle du triangle donné. Le côté horizontal du rectangle est la base du triangle et le côté vertical sa hauteur, la longueur de la perpendiculaire de la base au sommet. Ainsi, il résulte que l’aire du triangle est : la moitié du produit de la base par la hauteur.
Il s’agit de l’un des résultats les plus importants de toutes les mathématiques. La difficulté à diviser notre champ triangulaire en petits carrés a été surmontée par de simples opérations imaginaires. 42
LE COMPTE Y EST !
L’aube de la civilisation
L’importance du résultat est fondamentale lorsque l’on réalise que toute figure dont le contour est formé de lignes droites peut être décomposée en triangles, et donc son aire peut être calculée exactement. Par exemple, l’aire d’un champ quadrangulaire comme celui mentionné ci-dessus peut être calculée précisément en mesurant la longueur d’une diagonale et les hauteurs des triangles en lesquels la diagonale partage le champ. Ce procédé de triangulation est devenu la base de l’arpentage comme illustré (figure 2.9) dans l’ouvrage de John Cullyer, Gentleman’s and Farmer’s Assistant [Le Gentilhomme et l’Assistant fermier] (1813).
T
R
Figure 2.8 | L’aire du triangle (T) est la moitié de l’aire du rectangle (R).
Figure 2.9 | Mesure d’un champ par triangulation, d’après un ouvrage du début du xixe siècle.
43
L’aube de la civilisation
MESURER DES QUANTITÉS Pendant la période de l’ancienne Babylone, l’organisation économique de populations plus grandes dépendait du stockage d’importantes quantités de blé et de sa distribution aux habitants. Des textes sur des tablettes d’argile suggèrent que le blé était emmagasiné dans des fosses de dimension standard, une barre carrée (6 mètres carrés environ) et un cubit (profondeur de 50 centimètres environ) (figure 2.10). La mesure résultante était connue sous le nom de volume-sar.
1 rod
1 rod
1 cubit Figure 2.10 | Le volume-sar : 1 barre × 1 barre × 1 cubit.
Pour la distribution du blé, une sorte différente de mesure-volume était utilisée. Elle est connue sous le nome de sila et était déterminée par la capacité d’un certain récipient. Un sila était approximativement équivalent à un litre en unités modernes, le récipient avait donc une contenance semblable à celle des contenants dans lesquels les boissons sont actuellement vendues. Une tablette d’argile de la période de l’ancienne Babylone traite du problème de la fabrication d’un récipient d’un sila et fournit plusieurs éclairages sur les résultats mathématiques de cette époque6. Supposons que nous voulions
6. La tablette concernant le problème de la mesure-sila cylindrique est Hadad 104 ; elle a été trouvée au cours d’un contrôle de fouilles archéologiques dans la ville de Me-Turan [K, 123–125].
44
LE COMPTE Y EST !
L’aube de la civilisation
fabriquer un récipient de un sila sous forme d’un cylindre à base circulaire d’un diamètre donné, quelle doit être sa hauteur ? La solution requiert plusieurs autres données, incluant le fait qu’un volume-sar contient 21 600 silas et que les relations entre les unités de longueur utilisées à cette époque étaient : 30 doigts = 1 cubit, 12 cubits = 1 barre.
À partir de ces règles, il résulte de l’arithmétique qu’un sila vaut 180 « doigts cubiques »7. Comme 180 = 6 × 6 × 5, un sila devrait avoir été mesuré à l’aide d’un récipient à base carrée de côté 6 doigts et de hauteur 5 doigts (figure 2.11). Le problème consiste à déterminer la hauteur de la mesure d’un récipient à base cylindrique d’une mesure-sila, si le diamètre de la base circulaire est de 6 doigts. Tout d’abord, nous devons trouver l’aire de la base circulaire : compter les petits carrés ne fonctionne pas pour un cercle. Dans la période de l’ancienne Babylone, de tels calculs devaient être effectués à partir de règles approximatives et nous devons être vigilants et ne pas confondre ces règles avec les règles actuelles impliquant le nombre dénoté π (la lettre grecque pi). La règle trouvée sur cette tablette consiste à multiplier le diamètre par trois, puis à multiplier le résultat par lui-même et d’en prendre la douzième partie ; donc la base en « doigts carrés » est : (3 × 6) × (3 × 6) ×
1 . 12
Ce calcul donne 27. La suite est facile. On sait que un sila vaut 180 doigts cubiques, donc la hauteur du récipient doit être 180 divisé par 27, ou six et deux tiers de doigt.
7. Comme 30 doigts font un cubit et que 360 doigts font une barre, le nombre de doigts cubiques dans un volume-sar est de 360 × 360 × 30. Ce qui équivaut à 21 600 × 3 180. 45
L’aube de la civilisation
Il existe un autre moyen, très différent, de mesurer des quantités. C’est le poids et il utilise le simple fait que les objets possèdent une propriété mystérieuse qui implique qu’il est difficile de les soulever et les déplacer. Il devait être clair pour les premiers fermiers que différents matériaux possèdent cette propriété à des degrés divers : un seau plein d’eau a un poids inférieur au même seau rempli de sable, donc le poids n’est pas simplement un autre moyen de mesurer un volume. Nous devons aussi nous rappeler que les fondementse physiques du concept de poids n’ont pas été clairs jusqu’au XVII siècle après J.-C. et nous devons éviter d’utiliser les mots « gravité » et « masse ». L’ancienne idée de poids était fondée sur l’expérience plus que sur la théorie. Puisque le poids d’un objet n’est pas immédiatement apparent à l’œil humain (à la différence de la longueur et du volume), la mesure du poids devait être effectuée en utilisant un instrument mécanique qui pouvait produire un résultat visible.
5 ? 6
6
6 Figure 2.11 | Deux mesures-silas. Quelle serait la hauteur de la seconde ?
Le mécanisme le plus simple pour déterminer le poids tire probablement ses origines de la pratique commune du transport des charges en utilisant une perche portée sur les épaules, avec (par exemple) des seaux d’eau à chaque extrémité. Ce mécanisme est un excellent moyen de décider si deux objets sont de même poids, et il est probable qu’il ait inspiré la toute première forme de machine à peser, la balance à bras-égaux. De nombreuses illustrations de pesées 46
LE COMPTE Y EST !
L’aube de la civilisation
ont été trouvées sur des sites de l’Égypte ancienne8. Celle qui est montrée sur la figure 2.12 met en scène deux personnes utilisant une balance de ce type. Les actions des participants (et le texte en hiéroglyphes) montrent clairement que la pesée s’est soldée par un accord, car l’horizontalité de la balance est une preuve visible de l’exactitude. Il est possible de distinguer plusieurs étapes dans la mesure pratique des poids et on doit se rappeler que les progrès ont été réalisés à différentes périodes et en des lieux différents. La première étape constitue l’exemple le plus simple de la division exacte. En utilisant la balance à bras-égaux, il est facile de partager une quantité de matière en deux parts égales, de manière simple et visiblement correcte. Cependant, la nouvelle étape correspond à un partage en plus de deux parts qui requiert un peu plus de travail. Si des personnes doivent recevoir des parts égales d’une même marchandise, cela doit être fait en équilibrant chaque part avec un même objet. L’objet référent pouvant être l’une des parts proposées, mais il peut être plus commode d’utiliser des objets différents comme des pierres. Les pierres deviennent ce que l’on appelle, d’une manière qui peut prêter à confusion, des « poids ». (Pour plus de clarté, nous utiliserons quelquefois l’expression « objet-poids ».) Cette étape ne représente pas une mesure à proprement parler, car elle ne donne pas de valeur numérique, mais on pouvait utiliser la méthode dans des sociétés qui ne connaissaient pas l’arithmétique. Par exemple, au cours de fouilles effectuées sur un site de l’âge du fer à Danery, en Grande-Bretagne, les archéologues ont trouvé 68 objets-poids constitués de pierres ; plusieurs d’entre eux étaient équipés d’anneaux de fer pour pouvoir être manipulés plus facilement. Les dimensions de ces poids ne constituent aucune référence et on peut supposer que les habitants de Danery de cette époque n’avaient pas progressé au-delà de cette étape non numérique du poids. Comme on le verra, dans d’autres 8. Une collection intéressante de dessins montrant l’utilisation de la balance à bras-égaux dans l’Égypte ancienne a été publiée par Hippolyte Ducros, « Études sur les balances égyptiennes », Annales du service des Antiquités de l’Égypte 9 (1908) 32–52. La figure 2.12 est le n° 38. 47
L’aube de la civilisation
parties du monde, la mesure du poids a été associée plus étroitement à une expertise numérique.
Figure 2.12 | L’horizontalité de la balance prouve que les poids sont égaux.
L’ORIGINE DES UNITÉS DE MESURE L’unité appelée cubit est trouvée dans des textes de plusieurs parties du monde, car elle est définie à partir de la longueur d’un avant-bras d’homme, qui est à peu près la même quel que soit le lieu où les humains pouvaient vivre. Il n’y a aucune raison de supposer qu’il existait une chose comme un cubit étalon. En pratique, chaque groupe de travailleurs avait sa propre mesure-cubit, probablement en bois et déterminée probablement à l’origine par la longueur de l’avant-bras d’une personnalité locale d’importance. Pour les projets de bâtiments de grandes dimensions, comme les pyramides égyptiennes, la mesure-cubit devait avoir été déterminée officiellement et sa valeur maintenue constante pendant toute la durée de l’opération. Quelques objets, connus sous le nom de « cubits royaux », ont survécu en Égypte et ont pu être utilisés comme tels. Ces commentaires s’appliquent à l’unité appelée yard qui était définie par la longueur d’un grand pas et, comme le cubit, il a pu être utilisé bien avant la découverte de textes écrits signalant son existence. 48
LE COMPTE Y EST !
L’aube de la civilisation
Une autre conclusion qui peut être tirée de nos connaissances actuelles des premières mesures est que ces mesures étaient utilisées à différentes fins. Il n’existait pas une unité de longueur (ou de capacité) à partir de laquelle toutes les autres étaient déduites par multiplication ou subdivision. Une tablette peut préciser, implicitement ou explicitement, que trente doigts valent un cubit, mais cela peut exprimer la relation entre certaines unités à une certaine époque et en un certain lieu. De telles formulations n’étaient pas des définitions officielles ; elles étaient des conventions utiles dans les évaluations numériques. En réalité, on ne devrait pas être surpris que deux unités différentes soient utilisées dans le même but, dans un même lieu, à la même époque. Les essais effectués pour découvrir des systèmes universels de mesures sont au mieux trompeurs. On peut penser que les remarques qui suivent sont innocentes, mais certains antiquaires, au XIXe siècle, ont adopté un point de vue très différent et leurs idées se retrouvent encore aujourd’hui, en particulier sur des sites internet où la vérité est celle que vous voulez qu’elle soit9. On affirmait que des unités telles que le cubit étaient peut-être basée sur une quelconque sagesse préhistorique, probablement délivrée à l’humanité par une révélation divine et conservée précieusement par des sages de l’Antiquité. L’un des tenants de cette théorie était Charles Piazzi Smyth. Son livre Inheritance in the Great Pyramid (figure 2.13) met en avant la théorie selon laquelle ce monument icône révèle la connaissance d’une unité étalon qu’il a nommée « pouce pyramidal ». Non seulement cette unité était dérivée mathématiquement d’une mystérieuse connaissance des dimensions de la Terre, mais c’était (affirmait-il) presque exactement la valeur du pouce impérial britannique, telle qu’elle avait été définie au XIXe siècle. 9. Plusieurs livres sur la métrologie ancienne publiés avant 1970 ne sont pas fiables et ne peuvent pas être conseillés. Un bref exposé de certaines confusions engendrées par ces livres figure au chapitre 2 de Ayia Irini: The Balance Weights de Karl Petruso (Mayence, Verlag von Zabern, 1992). 49
L’aube de la civilisation
Les rêves de Piazzi Smyth ont été brisés par William Finders Petrie qui a remesuré la Grande Pyramide et a obtenu des chiffres incompatibles avec le pouce pyramidal. Plus tard, Petrie est devenu célèbre pour avoir introduit des méthodes systématiques de fouilles archéologiques ; il a beaucoup écrit sur les poids et mesures. Malheureusement, certaines de ses propres conclusions étaient basées sur des fantaisies métrologiques, telles que : La plus grande famille de mesures linéaires est celle du cubit royal d’Égypte, 20,60 pouces (524 mm). Le double remen ou diagonale du cubit de 29,161 pouces (740,69) est presque exactement la longueur d’un pendule qui effectue 100 000 oscillations par jour : à la latitude de Memphis, on aurait 29,157 (740,57). La relation étroite entre 29,161 et 29,157 semble très probablement être une coïncidence.
Figure 2.13 | La page de garde du livre de Piazzi Smyth, 1877.
50
LE COMPTE Y EST !
L’aube de la civilisation
Comme nous l’avons vu, les unités de mesure semblent avoir eu une origine plus modeste. Elles sont fondées sur des pratiques locales et varient aussi bien dans le temps que dans l’espace. Au fur et à mesure que la civilisation se conforte, les dirigeants des empires et royaumes essaient d’asseoir leur pouvoir en établissant des lois sur les unités, et de concevoir des objets standards pour les définir. Les cubits d’Égypte peuvent constituer des exemples de cette pratique, mais ils étaient sûrement établis sur des longueurs choisies arbitrairement, comme l’avant-bras du pharaon, plutôt que sur la théorie des oscillations du pendule. En Mésopotamie, la nécessité de standardisation des poids et mesures a été reconnue vers 2 100 ans avant J.-C. De cette période datent des tablettes avec des hymnes à la déesse Nanshe, la remerciant de la standardisation de la dimension du panier en roseaux (peut-être le sila mentionné ci-dessus) et une mesure connue comme un ban, supposé correspondre à 10 silas. Nanshe était la divinité responsable de la justice sociale, ce qui suggère que l’uniformité de ces mesures était vue comme un gage d’équité dans la distribution du blé. Les hymnes à Nanshe se référaient à un étalon de poids pour peser l’argent ; la raison en est plus complexe, comme nous le verrons plus tard dans Les éléments de la finance. Ces étalons de l’ancienne Babylone ont un long héritage. Au British Museum, on peut voir un poids-objet10 fabriqué environ 1 500 ans plus tard. L’inscription précise qu’il est la propriété de Marduk-shah-ilani et qu’il s’agit d’une copie d’un poids venant de Nabuchodonosor II, roi de Babylone, 604–561 avant J.-C. De manière significative, l’inscription affirme aussi que le poids est en accord avec l’étalon établi par Dungi, qui était roi de Ur de 2096 à 2048 avant J.-C. On peut conclure grâce à une preuve similaire, à la fois documentaire et objective, que dans certaines parties du monde, la pratique de la pesée a avancé bien au-delà de l’étape primitive non numérique, au début du 10. Le poids peut être vu sur le site internet du British Museum. Collection « mina weight », n° 91005. 51
L’aube de la civilisation
IIe millénaire avant J.-C. La pesée en termes numériques requiert des combinaisons de poids-objets, si bien qu’un nombre peut être assigné à une certaine quantité de matériaux. Tout d’abord, un ensemble de mêmes pierres pouvait être associé à deux pierres de matériaux ou à trois pierres, ou à nettement plus si nécessaire. À cette époque, en utilisant des pierres de différents poids-objets, il était possible de mesurer un éventail de poids plus facilement et plus précisément. Avant de passer à un autre sujet que la standardisation, il est bon de souligner que des tentatives pour renforcer l’uniformité des poids et mesures ont rencontré traditionnellement un succès limité. Le premier empereur de Chine, Qin Shihuandi (221–210 av. J.-C.), a affirmé son pouvoir sur les nouveaux états conquis par des proclamations exigeant l’uniformité des poids et mesures. Son successeur a publié des étalons de poids accompagnés d’édits des deux empereurs appelant à la conformité avec les étalons officiels. Cependant, on peut être sceptique quant à l’efficacité de ces tentatives de standardisation, même sous la férule d’un chef de guerre impitoyable. De nos jours, avec de meilleures communications, des personnes accommodantes et un niveau de culture plus élevé, des difficultés subsistent. Ainsi en 1813, le lecteur britannique de l’œuvre de Cullyer Gentleman’s and Farmer’s Assistant (figure 2.9) aurait été persuadé que l’unité de longueur, le yard, était en réalité le standard dans tout le royaume. Mais le gentilhomme et le fermier auraient été moins satisfaits de trouver qu’il existait de grandes variations dans la taille du boisseau utilisé pour le blé. En réalité, Cullyer a ressenti le besoin d’introduire de longs tableaux grâce auxquels les lecteurs pouvaient déterminer combien de « boisseaux d’usage commun » contenait plus ou moins... le boisseau standard de Winchester.
LES ÉLÉMENTS DE LA FINANCE Nos idées actuelles sur l’origine de l’argent sont fondées sur les pratiques des tribus primitives qui existent encore à l’ère moderne, 52
LE COMPTE Y EST !
L’aube de la civilisation
et cette preuve n’entraîne pas nécessairement des conclusions certaines. Heureusement, on peut trouver des preuves plus fiables dans des écrits de la période de l’ancienne Babylone. Par exemple, sur une tablette d’argile datant d’environ 1950 avant J.-C., on trouve une proclamation du roi Eshnunna. Elle donne des preuves des différentes fonctions de la monnaie à cette époque. Les fonctions sociales primitives sont représentées par des amendes pour avoir provoqué des dommages. Par exemple, si vous étiez reconnu coupable d’avoir « donné un coup de poing sur le nez », vous deviez payer 500 grammes d’argent environ, dans le cas d’une simple « gifle sur la figure », cela vous coûtait un peu moins cher. Il existe aussi des exemples de fonctions commerciales de la monnaie, sous la forme de prix recommandés pour des quantités mesurées de marchandises. D’après cette tablette, et de nombreuses autres, il est clair que l’utilisation de l’argent comme monnaie était bien établie au IIe millénaire avant J.-C. Comme le blé et les moutons, l’argent avait une valeur intrinsèque, mais à la différence du blé et des moutons, il était plus facile à transporter et à garder en lieu sûr. Des preuves de l’existence de mines d’argent ont été trouvées en Turquie remontant au IVe siècle avant J.-C. et des quantités importantes d’argent ont été écoulées clairement en Mésopotamie. Au début, cela résultait naturellement du fait que les personnalités de haut rang avaient une addiction à ce que l’on appelle maintenant le bling-bling, mais même si la valeur intrinsèque de l’argent était le fait de la vanité humaine, le désirer était aussi ce qui le rendait adapté à des fins plus fondamentales, monétaires. Quand l’argent et d’autres métaux précieux sont utilisés de cette façon, ils sont appelés lingots. Évidemment, la plupart des habitants de Mésopotamie n’avaient pas d’argent et pour eux, d’autres formes alternatives de monnaie étaient utilisées. La proclamation d’Eshnunna stipulait que le salaire quotidien d’un moissonneur devait correspondre à une certaine quantité d’argent ou de blé. L’unité de poids de l’argent était ce que l’on traduit par un shekel, environ 8 grammes en termes modernes, nettement moins 53
L’aube de la civilisation
que le poids de la pièce britannique d’une livre courante (qui n’était pas faite d’argent, bien sûr). Un document datant de 2000 avant J.-C. environ, prétendu être une correspondance entre le roi d’Ur et son agent, souligne que le taux de change entre un shekel d’argent ou un gur de blé correspond à 300 silas11.
Figure 2.14 | Pesée de monnaie dans l’ancienne Égypte.
Comme nous l’avons déjà vu, le lingot était plutôt une forme particulière de monnaie, même dans les civilisations avancées du Moyen-Orient. Dans certaines parties du monde, la quantité de métal précieux était très petite et d’autres formes de monnaie devaient être utilisées. Toutefois, en Égypte, il y avait de grandes quantités d’or et d’argent, mais le métal le plus prisé était l’or, et des pièces datées du XIVe siècle avant J.-C. contiennent à la fois de l’or et de l’argent12. De nombreuses pièces sont de petits morceaux de métal, et la conclusion
11. La tablette sur les taux de change entre le blé et l’argent est présentée par Robson [K, 141]. Voir également Electronic Text Corpus of Sumerian Literature (comme la note 5, chapitre 1), item 3.1.17. 12. On peut voir des fragments typiques d’argent et d’or sur le site internet du British Museum. Collection : trouvailles d’Amarna, n° 68503.
54
LE COMPTE Y EST !
L’aube de la civilisation
évidente est qu’un morceau de dimension appropriée était choisi et proposé en règlement d’une marchandise ou d’un service. La valeur relativement élevée de l’or et de l’argent signifie que le montant d’un paiement devait être calculé exactement et que cela était réalisé par pesée. Quelquefois, un morceau d’or ou de fil d’argent devait être coupé pour effectuer un règlement de poids requis. L’illustration (figure 2.14) montre des anneaux de métal précieux pesés sur une balance à bras-égaux13. Le poids-objet a la forme d’un taureau et il est peut-être en bronze. L’utilisation du bronze pourrait être compatible avec le fait qu’il ne s’agit pas d’une scène quotidienne, mais plutôt d’une description d’une procédure officielle liée aux fonctions de la monnaie dans l’organisation économique de la société. Ici, et partout où le lingot jouait un rôle important dans l’économie, il y aurait eu une forte incitation pour développer la pesée et les procédures arithmétiques associées. Clairement, il y avait de nombreuses opportunités pour des personnes compétentes en arithmétique. Non seulement la pesée exigeait un haut degré de précision, mais les calculs associés devaient être effectués avec une égale exactitude, pour éviter des pratiques frauduleuses. Un tel niveau de précision n’était pas exigé pour la mesure de marchandises comme le blé, mais dans ce cas le problème provenait des nombreuses unités utilisées, la plupart différentes. Pour le blé, nous avons déjà mentionné le volume-sar, le sila, le ban et le gur, chacun d’entre eux était commode dans une partie spécifique du processus économique, mais il devait être converti par des règles arithmétiques pour que gouvernement et commerce soient efficaces. La conversion entre différentes marchandises entraînait aussi certains problèmes arithmétiques. Pendant presque toute la période connue de l’histoire, l’enseignement des mathématiques élémentaires s’est focalisé sur des problèmes de ce type.
13. Comme la note 8, n° 25. 55
L’aube de la civilisation
La complexité croissante de l’économie a conduit au développement de procédures financières annexes. En Mésopotamie, on parle de prêts d’argent pour lesquels des intérêts étaient payés en blé. Évidemment, le taux d’intérêt était source de préoccupation et, dans ce cas également, les calculs associés devaient être réalisés rigoureusement. On peut faire erreur en parlant de « banques » au IIe millénaire avant J.-C., mais il n’y a aucun doute sur le fait que certaines institutions effectuaient quelques-unes des opérations qui sont réalisées dans les banques actuelles. L’arithmétique a joué inévitablement un rôle dans ces opérations et nous en dirons nettement plus dans les chapitres suivants.
56
LE COMPTE Y EST !
3 De la taxe et du commerce aux théorèmes
Au cours de certains voyages, on peut arriver à un point où certitude et doute entrent en conflit. Comme voyageur mathématicien dans le temps, cela aurait pu vous arriver à l’âge de la civilisation grecque classique, vers 500–200 avant J.-C. Vous auriez été certain de la vérité de l’arithmétique élémentaire, mais en géométrie vous auriez pu avoir quelque doute. Comment être sûr que la somme des angles d’un triangle est toujours égale à deux angles droits ? Ainsi, avec une certaine méfiance, vous auriez pu concevoir de répondre à des problèmes apparemment simples comme le calcul de la longueur de la diagonale d’un carré. Et si vous aviez persisté, vous auriez découvert quelque chose de surprenant.
L’ARRIVÉE DES PIÈCES DE MONNAIE Dans le chapitre 2, nous avons vu que des morceaux de métaux précieux étaient utilisés comme monnaie au IIe millénaire avant J.-C. Là où existait une économie du lingot, les morceaux de métal étaient 57
De la taxe et du commerce aux théorèmes
évalués par pesée et, dans la plupart des cas, à partir de quelques calculs. Ces deux opérations, pesée et calcul, étaient fastidieuses, ainsi on peut être presque sûr qu’à cette époque, l’économie de lingot ne faisait pas partie de la vie quotidienne de la plupart des gens. Au cours des mille ans suivants environ, le monde a changé de plusieurs façons. Les villes et les royaumes allaient et venaient, et le commerce de toutes sortes avait augmenté considérablement. Les archéologues ont fouillé seulement quelques strates de preuves et de nouvelles découvertes significatives pourraient altérer notre tableau. Cependant, on trouve déjà des signes d’alternatives à l’économie de lingot. Par exemple, il existe des preuves que les cauris (voir figure 1.3) étaient utilisés en Chine plus de 1 000 ans avant J.-C. et pendant plusieurs siècles, « cauri » fut synonyme de « monnaie » en chinois. Nous faisons référence aux cauris comme monnaie jeton car ils ont peu de valeur intrinsèque. Ils sont faciles à transporter et comme ils sont pratiquement identiques, il est inutile de les peser. Donc le comptage peut remplacer les calculs dans de nombreux cas, un pain pour un coquillage et donc cinq pains pour cinq coquillages, et la notion primitive de correspondance biunivoque est suffisante pour de telles transactions. Quand ces caractéristiques des cauris sont mises sur des morceaux de métal, nous y faisons référence comme des pièces. En d’autres termes, les pièces ont des dimensions uniformes et elles peuvent être utilisées dans le commerce sans avoir besoin d’être pesées et d’effectuer des calculs complexes. C’est une idée qui a évolué progressivement au cours des siècles14. Dans l’ancien Moyen-Orient, il y a peu d’exemples de morceaux d’argent marqués de certaines façons, vraisemblablement pour indiquer une valeur. Mais des étapes plus significatives vers la frappe de monnaie telle que nous la connaissons se sont produites dans le royaume de Lydie (actuellement dans l’Ouest de la Turquie) vers 650 avant J.-C. Les Lydiens utilisaient des petits 14. Un exposé bien illustré de l’évolution de la monnaie est Money: A History (Londres, British Museum Press, 1997) publié par Jonathan Williams.
58
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
morceaux de métal précieux qui possèdent certaines caractéristiques, mais pas toutes, des pièces, la principale étant qu’ils étaient marqués de différentes façons. Comme ces objets étaient de différentes tailles, il est possible que les marques indiquent différents poids, mais dans ce cas le système n’est pas clair. L’économiste Adam Smith, dans Wealth of Nations (1776), fait une autre suggestion. Les objets lydiens sont composés d’électrum, un alliage d’or et d’argent. Comme l’or a plus de valeur que l’argent, les proportions relatives des deux métaux affectent la valeur des morceaux d’électrum et Smith conjecturait que les marques correspondaient à cette propriété, plus qu’au poids. La détermination de l’alliage dans une pièce est une opération très complexe et nous y reviendrons plus loin car il y a beaucoup à dire. À peu près à la même époque, différents types de pièces commencent à faire leur apparition en Chine. Elles étaient faites en bronze, qui était considéré comme un métal précieux dans cette région. Certaines pièces avaient la forme de cauris, mais elles pouvaient avoir des formes étranges, comme des épées et des couteaux.
Figure 3.1 | Une pièce athénienne, iv e siècle avant J.-C. Cette pièce est un tétradrachme en argent. Wikimedia Commons, fourni par le Classical Numismatic Group, Inc., http:\\www.cngcoins.com.
Les pièces chinoises eurent un développement distinct, mais les morceaux d’alliage fabriqué en Lydie furent suivis bientôt par des 59
De la taxe et du commerce aux théorèmes
versions améliorées produites dans différentes régions de la Grèce. Il s’agissait de vraies pièces faites d’argent de bonne qualité, de dimensions et de poids uniformes, frappées des deux côtés, avec des marques qui identifiaient leur origine. À l’époque, de telles pièces devinrent des symboles de l’importance de l’autorité émettrice et des artistes très habiles étaient employés pour le dessin et la production. Des pièces comme celles montrées sur la figure 3.1 frappaient par leur qualité esthétique comme par leur utilité économique ; de même, certaines pièces impressionnantes étaient produites dans d’autres lieux, en Perse par exemple. Cependant, vers le milieu du Ier millénaire avant J.-C., les conditions sociales et économiques, dans plusieurs parties du monde, furent favorables à l’établissement d’un système monétaire, plus ou moins comme celui que nous connaissons de nos jours, mais avec quelques différences notables. Ce développement devait avoir de grandes conséquences pour les mathématiques.
MATHÉMATIQUES PRATIQUES Le développement des pièces était seulement l’une des innovations qui s’est instaurée dans le monde grec vers 600 ans avant J.-C. Ce monde englobait la plupart des terres bordant la partie est de la mer Méditerranée, incluant la Turquie moderne et des régions de l’Égypte, et c’est ici qu’une nouvelle vision des mathématiques s’est élaborée. Cependant, c’est une erreur de penser que de nouvelles mathématiques se substituent entièrement aux anciennes. La croyance ancienne selon laquelle les Grecs avaient acquis leur savoir de l’Égypte et de la Mésopotamie a joué un rôle essentiel dans la création de leur monde, de son centre, des magnifiques monuments d’Athènes, aux limites du vaste empire d’Alexandre le Grand. Cette connaissance est passée finalement chez les Romains qui construisaient un nouvel et vaste empire renommé pour l’efficacité de sa technologie et de son administration. Ainsi, avant de commencer l’histoire des mathématiques nouvelles, il est bon de consacrer un peu 60
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
de temps à décrire les mathématiques anciennes développées pendant les périodes grecque et romaine15. L’un des principaux avantages des pièces de monnaie était qu’elles facilitaient le recouvrement des taxes. Le principe de la taxation a progressé de la forme préhistorique à une forme de contrats sociaux où les citoyens et les propriétaires terriens effectuaient des paiements à une autorité centrale pour des prestations variées. Quand les taxes étaient payées en « espèces » avec des produits agricoles, l’offre et la demande n’étaient pas toujours équilibrées, et il y avait des problèmes évidents de logistique. L’usage de lingots menait à un processus plus efficace, mais, comme nous l’avons fait remarquer, l’évaluation précise de morceaux de métal précieux était difficile. Si l’autorité centrale pouvait exiger que les taxes soient payées en pièces que l’État avait lui-même émises, elle était certaine de recevoir la bonne somme. Le dessin de la figure 3.2 est l’une des scènes représentées sur le célèbre « vase de Darius »16. Elle présente la collecte de taxes dans une partie du monde grec, et elle offre un regard captivant sur les pratiques mathématiques de cette époque. Le collecteur tient dans sa main gauche un objet qui ressemble à une calculatrice moderne : en réalité, cet objet peut en être un ancien précurseur, contenant une liste des contribuables et ce qu’ils doivent. Sur la table, le collecteur semble écrire quelques lettres grecques. Une certaine licence artistique a été invoquée ici, mais ces lettres sont presque sûrement des noms de nombres. C’est une façon inédite de représenter des nombres qui utilise une nouvelle écriture : un alphabet phonétique. Au lieu d’employer des signes pour des objets et des actions, les signes représentent des sons. L’idée d’un alphabet n’a pas été inventée par
15. On recommande le chapitre « The two cultures of Mathematics in ancient Greece » de Markus Asper dans The Oxford Handbook of the History of Mathematics (Oxford, Oxford University Press, 2009, 107–132). 16. Le dessin est l’un de ceux qui figurent sur le vase. On peut le voir au Museo Archaeologico Nazionale de Naples. 61
De la taxe et du commerce aux théorèmes
les Grecs ; ils l’ont adoptée vers le VIIIe siècle avant J.-C.17. Il est remarquable qu’elle semble être arrivée à la même époque (vers 650 av. J.-C.) dans la même région (l’Asie Mineure) que l’invention de la monnaie.
Figure 3.2 | Image d’une scène sur un vase grec, vers 330 avant J.-C.
À la suite des Égyptiens, les Grecs utilisaient un système de numération à base 10, appelé système décimal. Les nombres de 1 à 9 étaient représentés par les neuf premières lettres de l’alphabet (figure 3.3). Les nombres 10, 20, 30, ..., 90 étaient représentés par les neuf lettres suivantes de l’alphabet et les nombres 100, 200, 300, ..., 900 par les neuf dernières lettres. (Parce que 27 lettres étaient nécessaires et que
17. L’alphabet grec dérivait de celui inventé par les Phéniciens, de même que l’alphabet hébreu. Les Hébreux avaient aussi adopté l’idée de représenter les nombres par des symboles alphabétiques.
62
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
l’alphabet grec n’en comportait que 24, trois lettres obsolètes furent rajoutées.) Avec cette notation, on pouvait représenter les nombres jusqu’à 999 en écrivant les lettres appropriées dans l’ordre ; les nombres plus grands étaient indiqués par des signes spéciaux. Ce système était, en un certain sens, une amélioration des méthodes mésopotamienne et grecque pour écrire les nombres. Mais on doit insister sur le fait qu’il ne présentait aucun avantage pour résoudre des problèmes impliquant addition, soustraction, multiplication et division. Par exemple, quel est le double de ΩMΓ ? 1
2
3
4
5
6
7
8
A
B
F
Z
H
α
β
Γ ̀ E γ δ ̀
F
ζ
9
Θ η θ
Figure 3.3 | Les lettres grecques (minuscules et majuscules) représentant les nombres de 1 à 9.
Comment les Grecs procédaient-ils pour faire de l’arithmétique ? De manière surprenante, une preuve est difficile à trouver. Une « table de multiplication » grecque utilisant des nombres alphabétiques a survécu, mais il s’agit d’un exemple isolé, et nous ne disposons d’aucun document faisant référence à l’utilisation d’une telle table. Une conclusion raisonnable est que la plupart des opérations arithmétiques étaient réalisées avec des moyens de calcul très primitifs, un ensemble de cailloux. En employant cette méthode, les opérations d’addition et de soustraction pouvaient être effectuées de manière presque évidente ; c’est ainsi qu’elles sont enseignées aux enfants. La multiplication et la division simple sont aussi presque immédiates. Par exemple, supposons que nous voulions partager 60 pains également entre cinq groupes de travailleurs. On compte soixante cailloux et on les range en colonnes de cinq, comme sur la figure 3.4 ; puis on compte les colonnes, ce qui donne la réponse, douze. 63
De la taxe et du commerce aux théorèmes
60
Combien de colonnes ?
Figure 3.4 | Résultat de la division de 60 par 5.
L’arithmétique des cailloux est si facile et efficace qu’elle doit avoir été familière à ceux qui se livraient à de l’arithmétique dès l’époque des premières civilisations ou même avant. Qu’il n’y ait aucun témoignage factuel de cette ère est à peine surprenant, car les cailloux qui étaient utilisés ne sont pas facilement identifiables par les archéologues contemporains. Mais il y existe quelques preuves selon lesquelles à l’époque des Grecs, les cailloux étaient posés sur une table à calcul, qui présentait des marquages en colonnes pour faciliter les opérations. Quelques-unes de ces tables de calculs ont survécu, mais elles sont rares18. Il existe aussi quelques rares références à l’arithmétique des cailloux dans la littérature grecque, par exemple dans la pièce Agamemnon, écrite par Eschyle au Ve siècle avant J.-C. En dépit de son caractère élémentaire, il est probable que l’arithmétique des cailloux ait été le catalyseur d’une nouvelle sorte d’activité mathématique : l’étude des nombres pour eux-mêmes. Par exemple, les Grecs étaient intéressés par les nombres triangulaires (figure 3.5). Il s’agit des nombres 3, 6, 10, 15, etc., qui peuvent être disposés selon d’élégants modèles triangulaires quand ils sont représentés par des cailloux.
3
6
10
15
Figure 3.5 | Nombres représentés par des modèles triangulaires de cailloux.
18. Voir Compter avec des cailloux : le calcul élémentaire sur l’abaque chez les anciens Grecs par Alain Scharlig (Lausanne, Presses polytechniques et universitaires romandes, 2001).
64
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
Des modèles analogues, les carrés des nombres 4, 9, 16, 25, etc., suggèrent des relations avec les études grecques de géométrie, sur lesquelles nous reviendrons brièvement. Une autre idée fructueuse a émergé quand les arithméticiens des cailloux remarquèrent que les nombres comme 8, 9, 10 et 12 pouvaient être représentés par des modèles élégants de différentes sortes, certains nombres bizarres comme 11 ne le pouvant pas (figure 3.6). On voit ici l’élan des mathématiques se développant à partir de racines anciennes.
8
9
10
11
12
Figure 3.6 | Le nombre 11 ne peut pas être représenté facilement.
Malgré les bouleversements politiques de la fin du premier Ier millénaire avant J.-C., l’héritage culturel des Grecs s’est transmis aux Romains avec peu de changements. La langue latine a remplacé progressivement la langue grecque, mais les deux langues et les deux alphabets ont coexisté plusieurs siècles durant. Du point de vue mathématique, le changement le plus significatif a été le remplacement des chiffres grecs par les chiffres romains. La base du système romain était différente car il y avait moins de caractères que les 27 grecs, et les nombres étaient représentés en formant des combinaisons de ces caractères de différentes façons. De nos jours, on reconnaît encore la suite : I II III IV V VI VII VIII IX X
car les symboles restent dans l’usage commun, comme indication des heures sur les horloges. Cependant, comme les chiffres grecs, les chiffres romains avaient pour but d’enregistrer surtout des informations plutôt que d’effectuer des opérations arithmétiques. Pour des raisons 65
De la taxe et du commerce aux théorèmes
pratiques, les Romains continuaient à utiliser des cailloux (jetons) et des tables de calcul. Le mot latin pour caillou était calculus et le mot latin pour table de calcul était abacus. Le premier mot a donné le mot « calcul », mais le second a créé quelques problèmes car il était appliqué à d’autres mécanismes de comptage. Actuellement, de nombreuses personnes considèrent que le mot abaque représente un cadre dans lequel des perles glissent sur des fils. Ce mécanisme a été inventé à la fin du Moyen Âge en Chine. Pour éviter les confusions, l’utilisation du mot « abaque » dans ce livre devra être compris comme se référant à un tableau ou un tissu sur lequel les jetons pouvaient être disposés. L’expansion de l’Empire romain a fourni de nombreuses opportunités pour l’utilisation de l’arithmétique. Dans le Nord de la GrandeBretagne, à la frontière de l’Empire, les Romains ont construit le mur d’Hadrien, une structure défensive où une importante garnison était stationnée. En 1970, les archéologues, travaillant sur un fort appelé Vindolanda, ont trouvé un grand nombre de tablettes en bois qui étaient datées d’environ 100 ans après J.-C. Elles avaient été utilisées pour écrire des lettres personnelles et garder des traces écrites d’événements quotidiens. Les tablettes étaient illisibles, mais des techniques scientifiques ont révélé finalement une énorme quantité d’informations détaillées sur la vie quotidienne de la communauté19. Voici un exemple d’une partie de la tablette 343. Octavius à son frère Candidus, salutations, Les cent livres de viande de Marius, je les règlerai. Depuis que tu m’as écrit, il ne m’a rien signalé. Je vous ai écrit plusieurs fois que j’avais acheté cinq mille m[odii] d’épis de blé, pour lesquels j’ai besoin d’argent liquide [...], au moins cinq cents [deniers]. Vois avec Tertius concernant 8 1/2 [deniers] qu’il a reçus de Fatalis. 19. On peut voir les tablettes de Vindolanda sur le site internet csad.ox.ac.uk (consulté le 1er juin 2015).
66
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
Ce message contient plusieurs informations qui donnent un éclairage sur la tradition et la pratique des mesures et de la monnaie, et sur l’arithmétique utilisée à cette époque. Tout d’abord, on a le sujet « cent livres de viande », où la quantité est écrite en lettres (pondo centum). Puis il y a le sujet « cinq mille m[odii] de blé », où l’on a quelques abréviations (m quinque milia). Comme l’on pouvait s’y attendre, la viande est mesurée par son poids (la livre romaine correspond à 324 grammes environ), tandis que le blé est mesuré par son volume (le modius est de 8,7 litres environ). Quand des sommes d’argent sont mentionnées, l’unité, le denier en argent, est sous-entendue : par exemple, la demande d’Octavius pour « au moins cinq cents [deniers] » apparaît comme minime quingentos. Cela semble être la convention, si le denier est utilisé comme une mesure de valeur ou comme un moyen d’échange, de telle manière qu’une dette de 8 1/2 deniers apparaît comme viii ‘s, le s représentant un demi. Le pouvoir militaire des Romains leur permettait d’imposer à leurs sujets toutes sortes d’économie monétaire adaptée à leurs objectifs. Au début, le denier était frappé avec de l’argent de bonne qualité et son poids était contrôlé avec précision, mais vers 250 ans après J.-C., les pièces de monnaie ont été dévaluées en ajoutant une quantité importante de cuivre. Finalement, ces pièces devinrent des jetons comme les coquilles de cauris et leur poids était indifférent. Les gens n’avaient pas d’autre choix que d’accepter ces pièces, et il semble que la vie ait continué de manière satisfaisante, car un grand nombre de deniers dévalués se sont trouvés dans tout l’Empire romain. Un trésor découvert près de Frome, dans le Sud de l’Angleterre en 2010, en contenait plus de 50 00020. Les tablettes de Vindolanda donnent un aperçu fascinant de l’apogée de la domination romaine dans le monde occidental, et l’ampleur du trésor de Frome suggère que l’arithmétique a continué à jouer un 20. The Frome Hoard, A. Moorhead, A. Booth, R. Bland (Londres, British Museum Press, 2010). 67
De la taxe et du commerce aux théorèmes
rôle important dans le gouvernement des populations. Cependant, on doit toujours avoir à l’esprit que les Romains n’utilisaient pas notre notation moderne des nombres ou nos méthodes pour faire de l’arithmétique. L’origine de ces méthodes modernes sera décrite au chapitre 4, mais pour l’heure, revenons à une forme très différente de l’activité mathématique.
LES NOUVELLES MATHÉMATIQUES Que font 27 plus 47 ? On a toujours admis qu’il n’y avait qu’une seule bonne réponse à une telle question ; mais tout le monde peut se tromper, donc il est plus sage de le vérifier. Une méthode usuelle de vérification consiste à faire le calcul d’une autre manière. Si l’on a utilisé les règles de l’addition et trouvé que 27 plus 46 est égal à 73, alors on peut appliquer les règles de la soustraction et vérifier que 73 moins 27 est égal à 46. Dans le papyrus de Rhind, une réponse numérique est souvent suivie d’un signe pour « faites-le donc », qui indique une vérification de ce type. Cette sorte de preuve, plutôt insuffisante, figure encore dans des livres imprimés au XIXe siècle. La réussite remarquable des Grecs était ce qu’ils pensaient être ce qu’il y avait de plus profond dans la nature d’une démonstration. Il est assez ironique de noter que, si leurs études commençaient par des spéculations philosophiques, la conclusion était que les mathématiques s’étaient élevées au-delà du niveau d’une technique utilisée pour le recouvrement des taxes et le paiement des salaires. Elles devinrent la clé principale de l’étude de toute l’activité humaine, qu’il s’agisse de voyager vers la Lune ou de frapper une balle de golf. Le problème pour l’historien contemporain n’est pas d’évaluer le produit, les réussites des mathématiciens grecs ; mais il concerne plutôt le processus de compréhension des origines de ces résultats et de les placer dans un contexte solide. Il faut, assez littéralement, effectuer de nombreuses démythologisations. Par exemple, de nombreux lecteurs de ce livre auront entendu parler d’un dénommé Pythagore, qui 68
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
aurait démontré un théorème important sur les triangles rectangles. Il n’en est pas ainsi. Le statut de Pythagore comme figure historique est pour le moins douteux, et le théorème n’a pas été démontré par quelqu’un de cette époque (VIe siècle av. J.-C.) à laquelle, affirmet-on, il vivait21.Toutefois, il est fort possible que le résultat était connu de ceux qui utilisaient la géométrie comme outil dans leurs travaux pratiques. On peut en dire autant d’autres affirmations qui figuraient principalement dans des récits populaires des premières mathématiques grecques. Heureusement, nous sommes absolument certains que quelqu’un dénommé Euclide a vécu à Alexandrie et a écrit vers 300–250 avant J.-C., bien que ce soit presque tout ce que l’on sache de lui (même son sexe est une conjecture). Il y a des références presque contemporaines à la grande œuvre d’Euclide connue sous le nom d’Éléments, mais c’est presque tout ce que nous possédons22. La plupart de nos connaissances sur ses origines figurent dans un texte de Proclus qui vécut à Athènes 700 ans plus tard, et du texte lui-même nous possédons seulement des traductions de traductions de copies... Le résultat de tout cela est que lorsque l’on utilise le mot « Euclide », on pense plutôt à un livre et non à une personne. Et l’on doit se rappeler que, même si le livre est paru vers 250 ans avant J.-C., on se réfère en réalité à une version utilisant des traductions améliorées publiées bien plus tardivement. Pour les raisons énoncées ci-dessus, ce qui suit ne prétend pas être une citation mot pour mot de ce qu’Euclide a réellement écrit. Au début, les Éléments posaient les fondements de l’étude de la 21. Une discussion complète sur les preuves concernant Pythagore et ses liens avec les mathématiques peut se lire sur le site internet de la Stanford Encyclopedia of Philosophy (version été 2014), plato.stanford.edu, consulté le 1er juin 2015. 22. Une discussion détaillée des manuscrits est donnée dans The Mathematics of Plato’s Academy par David Fowler (Oxford, Oxford University Press, 1997). Un ouvrage accessible et utile, et accepté actuellement comme un texte de référence, de David Joyce, est disponible sur le site internet aleph0.clark.edu (consulté le 1er juin 2015). Une édition critique, prenant en compte tous les documents actuellement disponibles (y compris des manuscrits arabes), est très utile. 69
De la taxe et du commerce aux théorèmes
géométrie en donnant trois sortes d’énoncés. Tout d’abord, on a des définitions d’objets géométriques tels qu’un point, une droite et un angle droit. Puis on trouve les postulats qui décrivent les relations entre ces objets ; ce que l’on affirme d’abord, c’est qu’il est possible de tracer une droite d’un point quelconque à un autre point. Enfin, on trouve des notions communes. Ce sont des affirmations qui peuvent être admises comme étant des faits logiques, tels que deux choses égales à une troisième chose sont aussi égales entre elles. A
D
X C
B
Figure 3.7 | Les angles marqués d’un point sont égaux.
À partir de ce fondement, Euclide déduit toute la géométrie élémentaire. La méthode consiste à démontrer des propositions (théorèmes), chacune pouvant mener jusqu’aux postulats par une chaîne de propositions analogues. Un bon exemple est la proposition selon laquelle lorsque deux droites AB et CD se coupent en un point X, les angles AXC et DXB sont égaux (figure 3.7). Ce résultat est démontré en faisant référence à une proposition précédente, qui énonce que quand une droite coupe une autre droite, la somme de deux angles adjacents est égale à deux angles droits. Donc l’angle AXD plus l’angle DXB est égal à deux angles droits, car AB coupe CD, et l’angle AXC plus l’angle AXD est égal à deux angles droits car CD est coupée par AB.
Maintenant, nous pouvons faire référence aux notions d’égalité, ce qui se produit quand nous ajoutons et retranchons des quantités égales. Par conséquent, on en déduit que les angles AXC et DXB sont égaux. 70
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
Certains lecteurs peuvent objecter que la proposition démontrée ci-dessus est évidente. Mais Euclide nous entraîne au-delà d’une évidence rassurante, dans un territoire occupé par des résultats significatifs qui sont loin d’être évidents. Le théorème appelé « théorème de Pythagore » constitue un tel résultat. Supposons que nous ayons un triangle avec un angle droit et que des carrés sont construits sur chacun de ses côtés, comme sur la figure 3.8. Le théorème énonce que l’aire du carré construit sur le côté opposé à l’angle droit est égale à la somme des aires des deux autres carrés.
Figure 3.8 | L’aire du plus grand carré est égale à la somme des aires des deux autres.
Nous ne savons pas quand ce résultat a été découvert, mais il est existe une preuve claire qu’il était connu bien avant qu’il soit démontré par la méthode trouvée par Euclide. La démonstration dépend de plusieurs suites de déductions logiques utilisant des propositions antérieures, des définitions, des postulats et des notions communes23. Toutefois, caché sous ce voile, se trouve un joyau mathématique qui peut être apprécié pour lui-même. La première étape a été déjà mentionnée : le fait que l’aire d’un triangle correspond à la moitié de l’aire d’un rectangle de même base et de même hauteur. Cela implique que sur la figure 3.9, l’aire du carré grisé (1) équivaut à deux fois celle de l’aire du triangle grisé (2). Maintenant vient le mouvement clé : faire tourner ce triangle d’un angle droit en gardant fixe le point (•). Le résultat est un autre triangle (3). 23. Il existe une alternative à la démonstration dans Euclide Livre VI, 31. Elle est plus courte, mais elle dépend d’une longue suite de résultats démontrés au préalable. 71
De la taxe et du commerce aux théorèmes
3 2 1
Figure 3.9 | Première partie de la démonstration du théorème de Pythagore.
5 4 6
Figure 3.10 | Seconde partie de la démonstration du théorème de Pythagore.
Ce triangle correspond à la moitié de l’aire du rectangle (4) de la figure 3.10, étant donné qu’il a la même base et la même hauteur. Donc le rectangle (4) a la même aire que le carré (1). Comme ce rectangle est une partie du grand carré, nous avons besoin seulement de montrer que l’autre partie, le rectangle (5), est de même aire que le carré (6). Cela peut être fait de manière « semblable », c’est-à-dire que l’on peut répéter le même argument, mais avec un couple différent de triangles24. 24. Dans la démonstration du théorème de Pythagore, la deuxième partie se fait « de manière similaire » en utilisant les triangles présentés ci-dessous.
72
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
PROBLÈMES DE MESURE « Euclide » est en réalité une série de treize « livres ». Les quatre premiers traitent de la géométrie pure des points, des droites, des cercles en utilisant des méthodes analogues à celles décrites ci-dessus. Le sujet suivant est consacré aux relations entre la géométrie et l’arithmétique ; plus particulièrement ce qui est entendu lorsque l’on dit qu’une droite qui joint deux points a une certaine longueur. Aux IIIe et IIe millénaires avant J.-C., la réponse à cette question était que la longueur est définie en termes d’unité étalon. On acceptait que la longueur ne soit pas un nombre entier d’unités, donc l’unité devait être divisée en demis, tiers, quarts, etc. ; en effet, certaines de ces sous-unités pouvaient porter des noms spécifiques. Cette approche a persisté à l’ère contemporaine : par exemple, en Grande-Bretagne, un yard était divisé en 3 pieds, un pied en 12 pouces, etc. Associée à l’idée de division en sous-unités, on trouvait la notion primitive de « fraction », un système nécessaire pour effectuer des mesures précises. Mais comme leurs prédécesseurs mésopotamiens et égyptiens, les Grecs ne considéraient pas les fractions comme des nombres de la même façon qu’aujourd’hui. Malheureusement, il y a un problème avec cette approche de la mesure, que les Grecs ont découvert. L’exemple le plus simple est celui qui se pose lorsque l’on veut mesurer la longueur de la diagonale d’un carré. Imaginons comment un Grec intelligent pratiquant les mathématiques pouvait avoir envisagé ce problème au Ve siècle avant J.-C. Appelons-le Praktos. Pour simplifier l’exposé, on utilisera les notations modernes pour les nombres, bien que l’on doive rappeler que Praktos devait se débrouiller avec les anciennes notations et méthodes grecques de l’arithmétique. Praktos peut commencer son investigation en construisant un exemple, comme sur la figure 3.11, où le carré a des côtés de 100 unités. Combien la diagonale contient-elle d’unités ? D’après « Pythagore », ce devrait être un nombre dont le carré est la somme des carrés des côtés, soit 100 × 100 + 100 × 100, soit 20 000. Homme pragmatique, 73
De la taxe et du commerce aux théorèmes
Praktos pourrait simplement utiliser un bâton de mesure et trouver que la réponse est environ 141, et il pourrait considérer l’éventualité que le nombre est exactement 141, l’écart provenant du fait que son carré n’est pas un vrai carré. Il devrait donc recourir à l’arithmétique et calculer 141 × 141, qui donne 19 881, qui est trop petit. Il pourrait alors calculer 142 × 142, qui donne 20 164, qui est trop grand. À cette étape, il pourrait conclure que c’est le choix initial de 100 unités qui ne fonctionne pas. Il pourrait essayer un autre choix, par exemple 1 000 unités, et après avoir effectué des calculs fastidieux, il trouverait que 1 414 est trop petit et 1 415 trop grand. Quelques essais infructueux pourraient le conduire à abandonner. Mais s’il était empreint de l’esprit grec concernant les exigences de la logique, il devait se poser des questions.
? 100
100 Figure 3.11 | Combien d’unités sont contenues dans la diagonale ?
En réalité, lors de ce premier essai, Praktos pouvait repérer la difficulté fondamentale. Quand le côté du carré est de 100 unités, il pouvait avoir remarqué sans faire aucun calcul que la diagonale ne pouvait pas être de 141 unités, car 141 est un nombre impair et il en résulte que son carré correspond aussi à un nombre impair, qui ne peut donc pas être égal à 20 000 qui est pair. En réalité, quelle que soit la longueur du côté, la longueur de la diagonale doit être un nombre impair, parce que son carré correspond à deux fois le carré du côté. S’il atteint ce point, l’attentif Praktos est sur le point de réaliser une découverte fondamentale. Il sait que si la diagonale est divisible 74
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
par deux, son carré est divisible par quatre. Donc le double du côté du carré est divisible par quatre et le côté est divisible par deux. Il en résulte, par un argument que nous avons déjà utilisé, que la longueur du côté doit être un nombre pair. Mais c’est absurde. Pourquoi ? Parce que si les longueurs du côté et de la diagonale sont des nombres pairs, alors nous pouvons en prendre la moitié et trouver un autre couple de nombres qui résolvent aussi le problème. Par exemple, s’il était vrai qu’un carré de 10 000 de côté ait une diagonale de 14 142, alors il devrait être vrai qu’un carré de 5 000 de côté ait une diagonale de 7 071 ; mais nous avons déjà éliminé cette éventualité car l’un de ces nombres est impair. Quels que soient les nombres de départ, il est clair que l’on ne peut pas continuer à les diviser par deux indéfiniment sans parvenir à un nombre impair, et à une « réponse » impossible. Ce que Praktos a découvert c’est que la diagonale et le côté d’un carré ne peuvent pas tous deux être représentés par des nombres entiers. Cela était connu avant Euclide et était exprimé en disant que le côté et la diagonale d’un carré sont incommensurables. C’est l’une des raisons pour lesquelles quatre des treize livres d’Euclide sont consacrés à un exposé sur les longueurs et les rapports de longueurs, dans le but d’éviter l’hypothèse selon laquelle toute longueur géométrique peut toujours être représentée comme le rapport de deux nombres entiers, ou ce que l’on appelle une « fraction ». Quand on essaie de résumer la contribution d’Euclide, on doit se rappeler deux choses. D’une part, on ne sait pas ce qu’Euclide a écrit exactement ou pourquoi ; la version qui nous est parvenue est plutôt un manuel scolaire et contient quelques conseils quant à la motivation. D’autre part, notre résumé se base nécessairement sur des idées postérieures, dont certaines n’ont été découvertes que bien après Euclide. Nous voudrions que la longueur de la diagonale d’un carré de côté un soit un nombre, et nous voudrions l’appeler racine carrée de deux. Mais elle ne peut pas être une fraction et si nous sommes tentés de dire que la racine carrée de deux est une fraction, 75
De la taxe et du commerce aux théorèmes
alors nous devons expliquer ce qu’est réellement une racine carrée. Plus généralement, s’il existe des nombres qui ne sont pas des fractions, comment sont-ils construits ? La diagonale d’un champ carré n’était pas le seul problème étrange de mesure que les Grecs avaient rencontré. Une autre difficulté surgit quand ils ont essayé de mesurer l’aire à l’intérieur d’un domaine circulaire. Quand un champ est limité par des lignes droites, la découverte de la règle permettant de trouver l’aire d’un triangle ôte la nécessité de recourir à des approximations, en théorie sinon en pratique. Toutefois, le problème de la mesure d’un champ limité par des lignes courbes présentait de plus grandes difficultés, même dans le cas apparemment plus simple du cercle de rayon égal à l’unité.
1
Figure 3.12 | Quelle est l’aire à l’intérieur du cercle ?
Un point de départ évident est de tracer deux carrés, l’un intérieur, l’autre extérieur au cercle, comme sur la figure 3.12. Le carré extérieur a des côtés de longueur 2 et donc une aire de 2 × 2 = 4 unités carrées. L’aire du carré intérieur correspond à la moitié de celle du carré extérieur. (Cela peut être vérifié simplement sans calcul ; si ce n’est pas clair, réfléchissez un instant.) Donc l’aire du carré intérieur est 2, ce qui suggère que l’aire du cercle est environ 3. En réalité, cette approximation peut être trouvée dans plusieurs textes anciens, y compris la Bible. Mais même à ce moment-là, il doit avoir été clair, 76
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
par une mesure directe, que la réponse correcte est légèrement plus grande que 3. Aujourd’hui, cette conclusion est traduite en disant qu’il existe un nombre, représenté par la lettre grecque π, tel que l’aire du cercle soit π. Les mathématiciens de Mésopotamie et d’Égypte n’utilisaient pas le symbole π, mais ils savaient, à leur façon, que π était un nombre compris entre 3 et 4. Quand les Mésopotamiens calculaient l’aire d’une base d’une mesure-sila (figure 2.11), leur méthode équivalait à prendre une approximation de π égale à 3. L’auteur du papyrus de Rhind a une méthode différente pour calculer des aires circulaires qui équivaut à supposer que π vaut 3 × 13/81. Mais les Grecs adoptaient une approche différente, guidée peut-être par la connaissance du fait que certaines mesures ne pouvaient jamais être exprimées par des fractions. Les Grecs considéraient la détermination de π comme un problème de géométrie. Ils se demandaient s’il était possible de construire un carré dont l’aire est égale à celle d’un cercle donné en utilisant seulement, dans ce contexte, une règle et un compas. Dans ce contexte, une règle est un simple segment de droite ; elle n’a pas de marques comme les règles de nos écoliers d’aujourd’hui. Une grande partie du propos d’Euclide est consacrée à ce type de constructions. Par exemple, il est facile de construire un carré dont les côtés sont des segments de longueur unité, et donc la « racine carrée de 2 » peut être construite comme diagonale de ce carré. Cependant, les Grecs n’étaient pas capables de résoudre le problème similaire de la « quadrature du cercle » ; c’est-à-dire construire un carré dont l’aire est la même que celle d’un cercle. Malgré l’échec de la quadrature du cercle pendant la période hellénique, quelques progrès significatifs sur le problème de π sont relevés. Ils sont dus à Archimède, le plus grand mathématicien de e e cette époque, vivant au III siècle avant J.-C. Il commença à montrer qu’il existait une relation entre deux problèmes différents concernant la mesure des cercles. Le premier problème, tel que mentionné 77
De la taxe et du commerce aux théorèmes
ci-dessus, consiste à trouver l’aire d’un cercle de rayon unité et que nous avons décidé d’appeler π. Le second problème consiste à trouver la circonférence de ce cercle. Aujourd’hui, tous les enfants savent (ou devraient savoir) que la longueur de la circonférence est le double de ce même nombre π. Mais peu de personnes de n’importe quel âge seraient capables d’expliquer pourquoi les réponses sont liées de cette manière. Archimède l’a démontré au moyen du résultat suivant : l’aire d’un cercle est égale à l’aire d’un triangle dont la base est égale au rayon du cercle et la hauteur est égale à la circonférence. Étant donné ce résultat, la règle de la moitié de la base multipliée par la hauteur pour l’aire du triangle donne notre formule 2π pour la circonférence d’un cercle de rayon unité. Archimède a été aussi capable de montrer que π est un nombre compris entre 3 × 10/71 et 3 × 1/7, une estimation surprenante de précision et en avance sur son temps. Ce n’est que 2 000 ans plus tard que l’on a finalement montré que le problème de la quadrature du cercle est réellement insoluble. Cela ne signifie pas que π n’existe pas ; cela veut dire qu’il n’est pas un nombre qui peut être construit géométriquement (avec règle et compas), méthode qu’utilisaient les Grecs. Donc la stratégie de l’approximation d’Archimède est la meilleure possible pour comprendre ce qu’est réellement le nombre π. Archimède a réalisé plusieurs autres découvertes amusantes sur les aires et les volumes limités par des courbes et des surfaces, mais il était si en avance sur son temps que nous devons renvoyer la discussion de ces découvertes au chapitre 6. Il fut aussi à l’origine de contributions significatives aux progrès des mathématiques dans leur ensemble et à la compréhension générale de la puissance du sujet. Comme exemple, on citera Calculateur de sable, un ouvrage qui aurait été écrit vers 220 avant J.-C. Dans cette étude, Archimède discute du problème du nombre de grains de sable dans l’« Univers ». Certains de ses contemporains pensaient que ce nombre était si gigantesque qu’il était hors de tout entendement, mais Archimède expliquait comment il pouvait le décrire en utilisant les méthodes de représentation des nombres. Il 78
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
commençait par souligner le fait que tout le monde accepte que des nombres comme 1 000 000 existent et, en dépit d’être grands, sont néanmoins compréhensibles. Étant donné un tel nombre, on doit être capables de comprendre l’idée d’effectuer une opération ce nombre de fois. En particulier, on peut comprendre ce que signifie multiplier ce nombre de nombres. Ce qui est possible même si ces nombres sont eux-mêmes grands. Ainsi, si l’on veut trouver le nombre de grains de sable dans un grand système, on peut remplir simplement un petit récipient de capacité connue avec du sable et compter le nombre de grains qu’il contient. Puis en répétant l’opération, on peut trouver combien de récipients peuvent remplir un récipient plus grand, etc. De cette façon, on peut estimer le nombre de grains qui rempliraient notre planète et même l’« Univers » entier, tel qu’Archimède le comprenait25.
DÉMONSTRATION DE RÉSULTATS SUR LES NOMBRES ENTIERS Les anciens experts au temps de l’arithmétique des cailloux savaient que certains nombres entiers étaient très facilement divisibles en deux parties, en trois parties, en quatre parties, sans laisser de reste. Vu sous cet angle, le nombre 60 possède de meilleures propriétés puisqu’il peut être divisé exactement en 2, 3, 4, 5 et 6 parties (et en réalité aussi en 12, 15, 20 et 30 parties). C’est presque certainement la raison pour laquelle les nombres 12 et 60 apparaissent si fréquemment dans les anciens systèmes de mesure. D’un autre côté, certains nombres sont clairement étranges lorsque survient une division exacte (comme l’illustre la figure 3.6). Il est probable que les mathématiciens de l’ancienne Égypte et de la Mésopotamie l’avaient remarqué, dans le cas de 7, 11 et 13, mais ce point n’a pas été sérieusement étudié avant 25. On ne peut pas délaisser Archimède sans rappeler l’histoire captivante de la découverte d’une copie du Xe siècle dans un précédent article qu’il ignorait. L’histoire est racontée par Reviel Netz et William Noel dans The Archimede Codex (Cambridge, Mass, Da Capon Press, 2007). 79
De la taxe et du commerce aux théorèmes
l’époque grecque. Les avertissements donnés précédemment dans ce chapitre concernant l’attribution de découvertes mathématiques spécifiques aux mathématiciens « grecs » s’appliquent aussi ici, mais il ne peut y avoir de doute sur ce que l’on appelle aujourd’hui la théorie des nombres qui commence avec les Grecs. Dans leur terminologie, le nombre 12 peut être mesuré par 2, 3, 4 et 6, ce qui signifie qu’un bâton d’une quelconque de ces longueurs peut être utilisé pour déterminer la longueur exacte d’un segment de droite de longueur 12. On dit aujourd’hui que 2, 3, 4 et 6 sont les facteurs de 12. Les premières études théoriques sur le sujet figurent dans les 7e, 8e et 9e livres des Éléments d’Euclide, en commençant par observer que certains nombres ne peuvent pas être mesurés par des nombres plus petits (excepté 1 naturellement). Ce sont eux qui sont appelés les nombres premiers. Il est raisonnable d’exclure 1 lui-même, ainsi la liste des nombres premiers commence par 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47...
Bien que les Grecs ne disposassent pas de notre notation efficace pour les nombres, ils étaient capables d’établir une liste comme celle-là. Et il est probable que certains mathématiciens, aujourd’hui oubliés, quelque part dans le monde hellénique, aient été les premiers à suggérer que : la liste des nombres premiers est illimitée.
Cela n’est pas évident : si l’on continue la liste donnée ci-dessus, on s’aperçoit que les nombres premiers deviennent notablement de plus en plus rares. Par exemple, comme le montre la figure 3.13, on trouve 25 nombres premiers entre 1 et 99, alors qu’il n’y en a que 14 entre 901 et 999, un intervalle de même ordre. Ainsi l’énoncé est ouvert à une démonstration ou à une réfutation. L’affaire fut réglée (force est de constater) quand un autre mathématicien oublié dans une autre partie du monde hellénique se présenta avec une démonstration merveilleuse. 80
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
2 11
3 13
5
7 17
61 71
43 53
911
919
29
23 31 41
907 19
37 47
929 937 947
941 59
953
67 79
73
89
83 97
967 977
971 983 991
997
Figure 3.13 | Les nombres premiers entre 1 et 99, et entre 901 et 999.
La démonstration, qui se trouve dans le Livre IX d’Euclide, est considérée comme un joyau de la couronne mathématique. Elle se présente comme suit26. Supposons qu’on puisse dresser une liste de tous les nombres premiers : 2, 3, 5,..., P. Puis, on considère le nombre obtenu en multipliant tous ces nombres et en ajoutant 1 : N = (2 × 3 × 5 × ... × P) + 1.
Ajouter 1 au produit est un coup de maître. Cela garantit que si nous divisons N par tous les nombres de notre liste, le reste est toujours 1, et donc N ne peut pas être exactement divisible par l’un de ces nombres. Par conséquent, nous avons seulement deux possibilités. Tout d’abord, N pourrait être un nombre premier, auquel cas nous avons construit un nouveau nombre premier. Mais si N n’est pas un nombre premier, nous pouvons l’exprimer comme produit de facteurs premiers plus petits. Ces facteurs premiers ne peuvent pas figurer dans notre liste originale, car elle contient seulement des nombres qui ne divisent pas exactement N, et donc nous avons
26. La démonstration d’Euclide prouve qu’étant donné un triplé de nombres premiers, un autre peut être trouvé, mais la même méthode fonctionnerait pour n’importe quel nombre de nombres premiers. 81
De la taxe et du commerce aux théorèmes
trouvé à nouveau un nouveau nombre premier. En résumé, on a commencé par l’hypothèse selon laquelle nous avions établi une liste de tous les nombres premiers, mais nous en avons trouvé un de plus, donc notre hypothèse ne peut pas être vraie. Il existe une autre propriété fondamentale des nombres premiers qui, de manière assez surprenante, ne figure pas explicitement chez Euclide. Comme nous venons de le faire remarquer, tout nombre qui n’est pas lui-même premier peut s’exprimer comme produit de facteurs premiers. La question est : pourrait-on trouver plus d’une manière de le faire ? Par exemple, une façon de décomposer 120 en nombres premiers est de partir de 10 × 12 : 120 = 10 × 12 = (2 × 5) × (3 × 4) = 5 × 2 × 3 × 3 × 3 × 2 × 2 × 2.
Une autre manière est de partir de 8 × 15 : 120 = 8 × 15 = (2 × 4) × (3 × 5) = 2 × 2 × 2 × 3 × 5.
Dans les deux cas, on obtient les mêmes facteurs premiers, mais dans un ordre différent, ce qui suggère que la factorisation est fondamentalement unique. Toutefois, la preuve expérimentale ne permet pas de conclure. Par exemple, les nombres 56 909, 127 643, 25 657 et 283 121 sont premiers, et 56 909 × 127 643 = 72 664 035 487, 25 657 × 283 121 = 72 640 335 497.
Ainsi deux produits de nombres premiers sont presque égaux. Il n’est pas évident qu’il ne pourrait pas exister d’exemple analogue dans lequel les produits soient réellement égaux. Mais en réalité, cela n’arrive pas : tout nombre peut s’exprimer comme produit de nombres premiers et cela d’une seule façon à l’ordre près. Cela signifie que les nombres premiers sont très particuliers : non seulement il est possible de construire tout nombre entier en multipliant des nombres premiers, mais on ne peut le faire que d’une seule manière. 82
LE COMPTE Y EST !
De la taxe et du commerce aux théorèmes
On a beaucoup spéculé sur le fait que le résultat ne figure pas explicitement chez Euclide. La version développée contient certains théorèmes dont les résultats sont immédiats, il est possible que ce résultat figure dans l’édition originale, mais qu’il ait été éliminé, dans les éditions postérieures27. En réalité, il semble que les Grecs et leurs successeurs considéraient les nombres premiers comme étant plutôt bizarres, et ils préféraient étudier des nombres plus sympathiques auxquels ils avaient donné des noms admis tels que « parfaits » ou « amicaux ». De tels nombres sont intéressants mais pas aussi fondamentaux que les nombres premiers. Étrangement, c’était près de 2 000 ans avant que la théorie des nombres premiers soit reprise par les mathématiciens, avec des résultats significatifs, comme nous le verrons au chapitre 7.
27. La preuve que tout nombre entier peut être exprimé, de manière unique, comme un produit de nombres premiers utilise des propositions qui peuvent être trouvées dans Euclid Livre VII n° 30, 31, 32. Pour un exposé moderne, consulter, par exemple, Discrete Mathematics (Oxford, Oxford University Press, 2002) de l’auteur. 83
4 L’âge des algorithmes Vous avez vu comment croissaient les niveaux d’organisation de la société, aboutissant à une plus grande confiance en l’arithmétique et la géométrie. Une conséquence inévitable est la nécessité de trouver de meilleurs moyens d’opérer avec les nombres et, à la fin du Ier millénaire après J.-C., de meilleures méthodes se retrouvaient dans plusieurs parties du monde civilisé. Ces méthodes introduisaient la notion d’« algorithme ». À la même époque émergeait une nouvelle forme de discours mathématique, que nous connaissons sous le nom d’algèbre. Avec les nouvelles façons de faire de l’arithmétique, il constitua les fondements pour les mathématiques qui, au XXIe siècle, imprègnent nos vies quotidiennes.
COMMENT FAIRE DE L’ARITHMÉTIQUE De retour au IIIe millénaire avant J.-C., on note de grandes avancées dans les procédures arithmétiques, en particulier dans le cas de l’opération de division. Mais au cours des 2 000 ans qui ont suivi, peu de progrès ont été accomplis. La fonction essentielle de l’arithmétique consistait à gérer des ressources, à partir de textes écrits utilisant les 85
L’âge des algorithmes
nombres et les mesures. Comme le niveau des structures sociales augmentait, les comptes rendus étaient utilisés de façon de plus en plus complexe, destinés à s’assurer que les ressources étaient allouées et employées efficacement. Cette première arithmétique avait trois composantes28 : •• la notation pour les nombres, y compris les fractions ; •• la procédure, pour obtenir la réponse. Les procédures incluaient l’addition, la soustraction, la multiplication et la division et quelques opérations spécialisées ; •• le moyen utilisé. Plusieurs nouveaux moyens avaient surpassé la méthode préhistorique des entailles pratiquées sur du bois ou de l’os. En plus du calcul sur les doigts et l’arithmétique des cailloux, il y avait des impressions sur des tablettes d’argile, des marques sur les papyrus, faites à la plume rouge, et des lignes tracées sur le sable. De nombreuses façons de combiner la notation, la procédure et le média ont été élaborées. Mais les archives historiques ne contiennent aucun commentaire qui pourrait laisser supposer qu’un système était clairement considéré comme supérieur aux autres. En particulier, les résultats les plus élaborés de l’ère romaine ne fournissent pas vraiment une bonne méthode pour effectuer les calculs sur lesquels ces résultats étaient basés. Les bureaucrates romains devinrent sans aucun doute des adeptes des calculateurs mobiles et du comptage sur les doigts, mais le manque de preuves contemporaines sur les procédures détaillées suggère que ces activités étaient réservées à une élite. L’arithmétique était un processus complexe qui contribuait à maintenir les privilèges de ceux qui la maîtrisait.
28. Plusieurs sujets discutés dans ce chapitre sont développés en détail dans Victor Katz (éd.), The Mathematics of Egypt, Mesopotamia, China, India, and Islam (Princeton, Princeton University Press, 2007). Ce livre est appelé [K] dans les notes suivantes.
86
LE COMPTE Y EST !
L’âge des algorithmes
un
trois
deux
trois
quatre
cinq
six
sept
huit
quatre cinq six sept huit neuf Figure 4.1 | Les nombres 1‒9 représentés par des barres de comptage chinoises.
signifie
trois cents, deux dix et cinq
signifie
six dix et sept
Figure 4.2 | Les nombres que l’on écrit maintenant 325 et 67.
Le catalyseur du changement est venu de l’Est. Vers le IVe siècle après J.-C., les Chinois ont développé un système pratique utilisant des barres de comptage29. Chaque nombre de un à neuf était représenté par une simple configuration des barres, comme celles montrées sur la figure 4.1. Les configurations de barres de comptage pouvaient être utilisées aussi comme chiffres dans les textes écrits. Par exemple, le caractère chinois pour cinq pouvait être remplacé par le symbole |||||, de même que l’on utilise 5 au lieu du mot « cinq ». En plus d’être décimal, (système à base 10), l’aspect important de l’arithmétique utilisant des barres de comptage était l’utilisation d’un système de place des valeurs pour représenter les grands nombres. À la différence du système romain, de nouveaux symboles n’étaient pas nécessaires pour 10, 100, 1 000, etc., car ces nombres pouvaient être indiqués en plaçant les chiffres de base aux places appropriées (figure 4.2).
29. Concernant le calcul avec les barres chinoises, consulter [K, 194-199]. Quelquefois, les barres étaient disposées de façon différente. 87
L’âge des algorithmes
Pour effectuer les calculs, les nombres devaient être représentés en plaçant les barres de comptage dans un tableau divisé en colonnes verticales, et les opérations arithmétiques pouvaient s’effectuer en déplaçant les barres de certaines façons. Dans le cas de l’addition, les procédures s’expliquent d’elles-mêmes : l’utilisation des symboles modernes peut nous aider à les comprendre, mais les barres ellesmêmes montrent le sens. Par exemple, pour ajouter 325 et 67, les barres sont placées dans le tableau de comptage en colonnes représentant (de droite à gauche) les unités, les dizaines, les centaines, etc. (figure 4.3). Tout d’abord, le six dans la ligne du bas de la colonne des dix est ajouté au deux de la ligne du haut, ce qui fait huit dizaines au total. Puis le sept de la colonne des unités est ajouté au cinq de la ligne du haut, ce qui fait douze, il y a donc un excédent de dix, ce qui implique d’ajouter une barre de plus dans la colonne des dix et de garder deux dans la colonne des unités.
3
2 6
5 7
3
8
5 7
3
8
[12]
3
9
2
Figure 4.3 | Addition avec les barres chinoises.
Mais vers 500 ans après J.-C., le système de valeur de placement est arrivé en Inde. On ne connaît pas précisément les procédures utilisées par les Hindous à cette époque, mais il est à peu près clair que leurs pratiques différaient de celles des Chinois, de deux façons significatives au moins : ils utilisaient des symboles différents pour les nombres et leur moyen préféré pour effectuer des opérations arithmétiques était la table à poussière. C’était une planchette de bois recouverte d’une fine couche de sable, sur laquelle les chiffres étaient 88
LE COMPTE Y EST !
L’âge des algorithmes
représentés par des marques faites avec un bâton. Au cours du calcul, tel qu’une multiplication, le chiffre aurait été noté à la première étape seulement, puis effacé après avoir complété la première partie du calcul. Avec la table à poussière, il n’était pas aisé de garder les colonnes alignées, ainsi l’absence de chiffre devait être indiquée par un symbole particulier30. Ce qui est peut-être l’origine de notre symbole 0 pour « aucun » : 305 signifie trois centaines, aucune dizaine et cinq unités. À une époque, on affirmait que l’invention d’un tel symbole était une rupture majeure, mais ce n’était pas une idée nouvelle. Un signe pour rien avait été utilisé dans l’arithmétique de l’ancienne Babylone ; et dans le système chinois, il aurait été indiqué simplement en ne mettant aucune barre dans la colonne appropriée du tableau. Plus important, à l’époque, le symbole 0 était considéré comme représentant un nombre analogue à ceux qui représentaient les nombres de 1 à 9. Avec ce moyen, les Hindous disposaient désormais d’une base solide pour des procédures arithmétiques efficaces. Pendant la période de l’ancienne Babylone et après, il a été reconnu qu’un calcul difficile pouvait être rendu plus facile s’il était effectué à partir de calculs plus simples dont les résultats étaient déjà connus et tabulés. La simplicité des systèmes chinois et hindou implique que relativement peu de tables sont nécessaires. En particulier, si les tables d’addition et de multiplication de 1 à 9 sont connues, on peut ainsi ajouter et multiplier des nombres aussi grands soient-ils en suivant des règles simples. Ces tables sont assez petites pour être mémorisées. Mais, évidemment, la connaissance de ces tables n’est pas suffisante: il faut aussi appliquer correctement les règles. Une indication d’importance cruciale du système hindou est le manque d’avancées à l’Ouest. Dans l’Europe médiévale, et même en Angleterre, de nombreux efforts avaient été consacrés aux calculs complexes. Le sujet principal était le calendrier, particulièrement la date à laquelle la fête chrétienne de Pâques pouvait avoir lieu. Cependant, 30. Sur les problèmes de table à poussière, consulter [K, 532]. 89
L’âge des algorithmes
nous n’avons aucune preuve d’avancées significatives dans la pratique de tels calculs31. L’arithmétique était considérée avec horreur par les érudits anglais de l’époque, tels que Aldhelm de Malmesbury (vers 670 ans) qui écrivait sur « le grand désespoir de faire tous ces comptes ». Il se référait probablement à la sorte de comptage sur les doigts illustré par une copie d’un manuscrit du Xe siècle de Bède le Vénérable, De Tempore Ratione32. Les contorsions exigées pour représenter des nombres plus grands que dix en utilisant des signes faits avec les doigts étaient grotesques et cela a sûrement contribué au désespoir de Aldhelm.
Figure 4.4 | « Grande multiplication » décrite par Wingate au
xviie siècle
après J.-C.
L’arithmétique de placement décimal resta longtemps dans les pratiques. Elle continue à évoluer au XVIIe siècle après J.-C. ; à cette époque, elle avait pris une forme très similaire à ce qu’elle est
31. Consulter Mapping Time: The Calendar and its History, E. G. Richards (Oxford, Oxford University Press, 1999). 32. British Library, Ms Royal BA XI f33v.
90
LE COMPTE Y EST !
L’âge des algorithmes
aujourd’hui. L’exemple typique de la figure 4.4 est extrait du livre célèbre écrit par Edmund Wingate33 en 1630. La description des grandes multiplications par Wingate (à droite sur la figure 4.4) est une suite d’instructions destinées à un étudiant d’intelligence moyenne. Si les instructions étaient suivies fidèlement, la réponse était correcte, même si l’étudiant ne comprenait pas les raisons sous-jacentes. Pendant plusieurs centaines d’années, on a enseigné une façon de « faire de l’arithmétique » de cette manière, mais en 1970 un nouveau moyen devint très largement accessible : la calculatrice. On sait que ce moyen rend la conduite de calculs comme une multiplication plus facile, mais pourquoi ? La réponse réside dans le fait que la calculatrice a été programmée avec une suite d’instructions analogues à celles de Wingate, si bien qu’il suffit d’entrer les nombres donnés et la calculatrice fait le reste. En remontant aux méthodes décrites par Wingate, à leurs origines, on peut commencer à évaluer le pour et le contre d’accorder notre confiance aux moyens électroniques.
AVANCÉES EN ARITHMÉTIQUE Vers 650 ans après J.-C., de grandes parties de l’Afrique du Nord et de l’Ouest de l’Asie sont passées sous la loi arabe, dans un laps de temps relativement court. À la fin du VIe siècle après J.-C., le monde islamique incluait une partie de l’Inde, où le système de placement décimal était utilisé. Par conséquent, la description du système hindou écrit en arabe commença à se mettre en place. Il est possible que le texte le plus ancien et sûrement le plus célèbre fût Short Treatise on Hindu Reckoning écrit vers 825 après J.-C. par un érudit connu sous le nom d’al-Khwārizmῑ. Le trait caractéristique de l’œuvre d’al-Khwārizmῑ était la description précise, étape par étape,
33. Arithmetic de Wingate a été publié pour la première fois en 1630 et est resté disponible pendant 130 ans. L’extrait présenté est tiré de l’édition de 1735, révisée par John Kersey. 91
L’âge des algorithmes
des procédures pour effectuer des opérations mathématiques. Pour cette raison, son nom est immortalisé à travers notre mot algorithme. Ce mot signifie une suite ordonnée d’instructions qui peut être donnée à toutes sortes de calculateurs, humains ou électroniques, pour produire la réponse à un problème général, tel que la multiplication de deux grands nombres. Avec le concept grec de démonstration déductive, l’idée d’un algorithme était à la base des progrès ultérieurs des mathématiques. Comme on le verra, l’importance relative des deux idées a varié au cours des modes successives, mais au XXe siècle, l’importance des algorithmes a été renouvelée avec l’introduction des calculatrices et des ordinateurs. Historiquement parlant, nous ne pouvons pas nous fier entièrement à l’ouvrage d’al-Khwārizmῑ Treatise car aucune version en arabe n’a survécu. Cela a conduit à des spéculations concernant son contenu réel, dont la suggestion qu’au moins une partie était consacrée au comptage sur les doigts. Le premier texte sur l’arithmétique dont on dispose d’une version en arabe est probablement un texte écrit vers 950 après J.-C. à Damas par Abdul Hassan al-Uqlvdisv. Son nom est une forme arabisée d’Euclide, qui nous rappelle que les mathématiques provenant de la Grèce et également d’Inde ont été intégrées dans la tradition islamique. Comme pour al-Khwārizmῑ, il n’existe aucune copie de tout le texte d’al-Uqlῑdisῑ, mais nous disposons d’une version en arabe écrite environ 200 ans plus tard. Dans ce manuscrit, les algorithmes pour les opérations arithmétiques, telles qu’une longue multiplication, sont décrits explicitement34. Les signes indo-arabes pour les nombres apparaissent fréquemment, mais pas toujours, sous la forme utilisée de nos jours. Nous trouvons aussi ce que l’on pense être la première utilisation connue des fractions décimales, un sujet qui sera discuté au chapitre 6.
34. Pour tout ce qui a trait à al-Uqlῑdisῑ, incluant un portrait du manuscrit, voir [K, 533-535].
92
LE COMPTE Y EST !
L’âge des algorithmes
Le manuscrit fait référence aussi à un développement non mathématique de grande signification pratique : l’utilisation d’un nouveau moyen, le papier. Étaient évoqués les problèmes de l’utilisation des tables à poussière, tels que l’exposition du contenu au souffle du vent, et les recommandations d’employer plutôt « l’encre et le papier ». Nous croyons que le secret de la fabrication du papier a été transmis aux Arabes par les Chinois. Bien que le papier soit semblable au papyrus (fait de roseaux) et au parchemin (fait de peaux), il est plus facile à produire. Son utilisation dans l’islam est la principale raison pour laquelle nous sommes sur un terrain plus ferme, historiquement parlant, lorsque nous décrivons les résultats mathématiques de ce monde. Un autre texte ancien en arabe est Principles of Hindu Reckoning, écrit par un érudit persan, Kushya ibn Labban, né vers 975 après J.-C.35 Son livre décrit en détail les algorithmes de l’arithmétique sur une table à poussière. Par exemple, sa méthode pour multiplier les nombres 325 et 243 implique de trouver les produits des chiffres 3 et 5 et des chiffres 2, 4 et 3 et d’ajouter les résultats d’une certaine façon. Sur la table à poussière, il est facile de garder les produits à leur propre place et les chiffres qui n’étaient plus nécessaires pouvaient être effacés au cours du calcul. La procédure pour les « longues multiplications » décrite par ibn Labban utilise le même principe que la méthode donnée dans le livre de Wingate 600 ans plus tard. L’ensemble des calculs est donné en totalité sur la figure 4.5 en utilisant les notations modernes. La colonne centrale montre les produits des chiffres avec leur valeur de place correcte indiquée par le nombre de 0. Les différents algorithmes pour une longue multiplication sont simplement une manière d’organiser ce calcul, si bien qu’il devient une routine fixée, applicable à toutes sortes de problèmes. On ne sera peut-être jamais capable de retracer clairement le cours du développement des algorithmes de l’arithmétique, mais les traces d’une piste qui part de la Chine et passe à travers l’Inde et l’islam jusqu’à Wingate sont encore visibles. 35. Pour le calcul d’ibn Labban, consulter [K, 435-441]. 93
L’âge des algorithmes
325 x 243
= 300 x 243
=
300 x 200 = 60000 +300 x 40 = +2000 +300 x 3 = +900 = 72900
+ + 20 x 243
=
20 x 200 = +20 x 40 = +20 x 3 =
4000 +800 +60 =
5 x 200 = +5 x 40 = +5 x 3 =
1000 +200 +15 =
4860
+ + 5 x 243
=
1215
=
78975
Figure 4.5 | Le principe d’une longue multiplication, en notation moderne.
Pour des références ultérieures, il est bon de noter que les nombres 325 et 243 comportent trois chiffres ; le nombre de multiplications simples nécessaires dans cet exemple est 3 × 3 = 9. Ces neuf étapes déterminent le temps nécessaire à la mise en œuvre de l’algorithme. Si les nombres comportaient quatre chiffres, il y aurait 4 × 4 étapes, etc.
LES UTILISATIONS DE L’ARITHMÉTIQUE Les nouveaux algorithmes se sont répandus en Europe. Les preuves documentaires sont lacunaires, et il se peut que certains récits traditionnels sur ce sujet reposent seulement sur trop peu de documents existants non représentatifs. Un autre facteur qui s’ajoute aux mystères est le fait que ceux qui savaient faire de l’arithmétique gardaient souvent leur connaissance secrète. Des documents et des témoignages sont encore découverts et il est possible que le panorama change. Néanmoins, il est clair que la demande de méthodes de calcul plus efficaces provient des rouages de l’organisation du gouvernement et du commerce. Durant la période initiale de l’expansion rapide de l’islam, les conquérants ne frappaient pas leurs propres pièces, mais vers 670, 94
LE COMPTE Y EST !
L’âge des algorithmes
ils produisirent leurs propres pièces imitant celles qui étaient utilisées dans les territoires conquis. Ces pièces allaient des drachmes en argent de la Perse aux solidi byzantins en or. Toutefois, il devint rapidement clair qu’une monnaie identique aiderait à garantir la stabilité économique de l’Empire. Les revenus de la taxation devaient fournir un système d’assistance, plus précisément pour le paiement de pension d’État aux anciens militaires qui avaient servi dans l’armée.
Figure 4.6 | Un dinar or, ixe siècle après J.-C. La pièce est un dinar du calife al-Ma’mun. Wikimedia Commons, fourni par le Classical Numismatic Group Inc., http://www.cngcoins.com.
À la fin du XVIIe siècle, le calife Abd al-Malik introduisit une nouvelle monnaie islamique en or et en argent. Le dinar or (figure 4.6) diffère des pièces précédentes par le fait qu’il ne possède pas de motifs, cela en accord avec les enseignements de l’islam. À la place, on trouve une longue inscription en arabe. Sa masse était déterminée par un étalon arabe de poids, environ 4,25 grammes en termes modernes, légèrement moins que le solidus byzantin. La pièce en argent qui lui correspondait était connue sous le nom de dirham, pesant environ 2,9 grammes. Les deux poids effectifs et leur rapport entre eux ont été contrôlés étroitement pendant des centaines d’années. Dans le monde 95
L’âge des algorithmes
islamique, le dinar et le dirham étaient idéaux pour les usages qu’en faisait le gouvernement. Les collecteurs de taxes pouvaient insister pour être payés en monnaie courante et les personnes qui disposaient de vieilles pièces de monnaie étrangère ou de pièces bizarres en or et en argent devaient les vendre au gouvernement pour acquérir des pièces acceptables. Il est clair que ce mécanisme permettait aux autorités de faire du profit sur les transactions, à condition d’avoir l’habileté arithmétique requise. Aux frontières du monde islamique, le commerce avec d’autres nations était florissant et présentait différents problèmes. Bien que les pièces fussent communément utilisées comme monnaie-objets, les pièces frappées par différents rois et princes étaient nombreuses et variées. La valeur d’une pièce dépendait de sa teneur en métal précieux et aussi de deux mesures, le poids et la finesse (pureté) du métal. La mesure du poids était relativement simple et les pièces étaient pesées régulièrement au cours des échanges. Mais la pureté d’une pièce était plus difficile à déterminer. Les pièces en or présentaient un problème particulier, car de petites variations dans la pureté pouvaient considérablement affecter leur valeur. La méthode traditionnelle de vérification de la pureté d’une pièce en or consistait à faire une petite marque sur une pierre de touche ; la couleur de la marque indiquait la pureté de l’or. Mais il ne s’agissait pas d’une méthode qui pouvait être fiable pour les transactions de la vie quotidienne et en pratique, l’évaluation des pièces était déterminée par une combinaison d’essais, d’expériences et de calculs astucieux d’arithmétique.
4
3
2
1
10
90 % 80 % 70 % 60 % ? Figure 4.7 | Quelle est la pureté de l’or obtenue en combinant ces pièces ?
96
LE COMPTE Y EST !
L’âge des algorithmes
Des problèmes similaires se posaient en Inde et plusieurs exemples de ce type d’arithmétique commerciale se trouvent dans un document connu sous le nom de manuscrit de Bakshali36. Bien que sa date soit incertaine, ce document est une réminiscence des difficultés arithmétiques associées au commerce au début du Moyen Âge. Il contient plusieurs problèmes importants ; ce qui suit est un exemple très simple. On suppose que l’on a quatre pièces de poids 4, 3, 2, 1 unités et que le pourcentage d’or dans chacune d’elles est celui montré sur la figure 4.7. Si les pièces sont fondues ensemble, quel sera le pourcentage d’or dans le lingot de métal résultant ? Des problèmes simples comme celui-là peuvent être résolus par des méthodes d’essais et erreurs, mais en pratique les problèmes étaient nettement plus complexes. Les mines où étaient produites les pièces d’or devaient employer des mathématiciens très habiles qui pouvaient être considérés comme fiables pour les multiplications et les divisions effectuées correctement. Les nombres devaient être spécifiés exactement et les calculs réalisés avec un haut degré de précision.
LA FRONTIÈRE NORD-OUEST Aux bordures nord-ouest du monde islamique, la forme principale de monnaie était en argent. Le denarius romain dévalué avait été frappé en grande quantité et, dans certaines régions, il a pu rester en circulation pendant un très long temps, après le départ des Romains, mais quand les populations natives de ces régions commencèrent à frapper leur propre monnaie, ils restaurèrent l’idéal d’un haut standard de pureté. 36. Pour le manuscrit de Bakshali, consulter [K, 453-441]. Sutra contient une version légèrement plus complexe du problème du calcul de la pureté moyenne d’un ensemble de pièces. La réponse donnée ici est 80 %. En général, si les pièces ont des poids m1, m2, ..., mn et des puretés f1, f2, ..., fn, la réponse est (m1f1 + m2f2 + ... + mnfn) / (m1 + m2 + ... + mn). 97
L’âge des algorithmes
Un trésor d’argent datant du début du Xe siècle, trouvé à Cuerdale dans le Nord de l’Angleterre, fournit quelques aperçus révélateurs des pratiques économiques de cette période37. C’était à l’époque où les Vikings contrôlaient de grandes parties de l’Angleterre, et la monnaie était une combinaison de pièces et de morceaux de fils d’argent, de barres et d’ornements brisés. Nous ne connaissons pas l’usage exact du trésor de Cuerdale : il pouvait être destiné au paiement de l’armée et de ses provisions ou lié au commerce florissant des esclaves. Les Vikings recouraient aussi à l’ancienne pratique d’extorsion d’importantes sommes d’argent en échange de la paix accordée aux autochtones. Cette monnaie connue sous le nom de danegeld devait requérir une certaine habileté (des deux côtés) pour être gérée. Un autre domaine de la finance qui devait requérir une expertise arithmétique d’un ordre élevé était la frappe des pièces d’argent anglo-saxonnes qui impliquait le changement de monnaie et de poids standard. Les détails de ce système font l’objet encore de nombreux débats parmi les numismates, mais malheureusement, la lumière qui pourrait résulter des preuves de pratiques arithmétiques manque. On sait que les Vikings euxmêmes sont entrés en relation avec les commerçants de l’Europe de l’Est, et en réalité, ils ont adopté les standards de cette source. Mais leurs méthodes arithmétiques restent un mystère et il faut chercher ailleurs les premières traces de l’arithmétique indo-arabe dans l’Europe de l’Ouest. Les premières preuves proviennent du dernier quart du Xe siècle, quand les chiffres dans des manuscrits écrits en latin ont commencé à apparaître. Un personnage clé est l’érudit français Gerbert
37. De nombreuses images du trésor de Cuerdale sont visibles sur le site internet des collections du British Museum. Le trésor a été déposé vers 905, peu après que les colons Vikings en Angleterre ont commencé à frapper des pièces dans le style anglosaxon, et certaines de ces pièces font partie du trésor. Il n’y a pas eu de monnaie sur le sol scandinave des Vikings jusqu’au Xe siècle.
98
LE COMPTE Y EST !
L’âge des algorithmes
d’Aurillac38. Dans les années 960, Gerbert passe trois ans en Espagne et il est presque certain d’y avoir appris les chiffres et les algorithmes associés de cette époque. Des parties de l’Espagne étaient sous la domination de l’islam depuis le VIIIe siècle et l’arithmétique indoarabe y était bien connue. Au cours des dernières années, de nouvelles preuves ont été mises en lumière et on peut désormais être à peu près certains de la nature des innovations de Gerbert. L’abaque romain traditionnel n’utilisait pas, il faut le rappeler, des perles sur des fils ; c’était un tableau sur lequel des compteurs étaient placés en rangées et en colonnes. Gerbert a incorporé l’arithmétique indo-arabe de deux façons. Tout d’abord, il a créé une nouvelle forme de table à calcul, utilisant le système de placement décimal. La figure 4.8 montre la disposition de la partie de l’abaque de Gerbert, d’après un dessin réalisé après l’an 1100. Il y a des groupes de trois colonnes et, à la tête de chaque groupe de trois colonnes, des chiffres indo-arabes sont écrits, mais ils sont utilisés comme marqueurs et ne jouent aucun rôle dans l’arithmétique. La seconde innovation de Gerbert fut de repérer les compteurs avec des chiffres indo-arabes, si bien que les procédures pouvaient être exécutées en déplaçant les compteurs sur l’abaque. Ces innovations étaient simplement des améliorations de méthodes existantes, mais elles ont eu un impact significatif sur l’arithmétique de l’Europe de l’Ouest. Il se peut que d’autres érudits aient été impliqués, mais on sait beaucoup de choses sur Gerbert, parce qu’il avait une autre prétention, celle de figurer dans les annales de l’histoire. Sa réputation comme érudit était largement répandue et il était employé par des princes régnants de son époque. Ces relations ont finalement conduit Gerbert à être élu pape Sylvestre II en 999. Malheureusement, il était considéré comme marginal et sa nomination fut controversée, il fut exclu de Rome en 1002 et mourut en 1003. 38. La vie et l’œuvre de Gerbert peuvent être trouvées dans The Abacus and the Cross de N. M. Brown (New York, Basic Books, 2010). 99
L’âge des algorithmes
Figure 4.8 | Présentation d’une partie de l’abaque de Gerbert.
Au XIIe siècle, de belles représentations de l’abaque de Gerbert commencent à apparaître dans des manuscrits enluminés, fournissant une preuve claire qu’il était connu des ordres monastiques39. Il est raisonnable de supposer que l’abaque était utilisé dans l’administration de leurs grands patrimoines et il est tentant de supposer qu’il était employé à de très hauts niveaux du gouvernement national. En effet, il y eut un accord circonstanciel pour soutenir cette affirmation. Peu après que Henri I devint roi d’Angleterre en 1100, une réforme fondamentale du trésor à Winchester fut mise en place. Le bureau de réception des taxes prit le nom d’Échiquier, dont on pense traditionnellement qu’il fait allusion à l’utilisation d’une table de comptage qui ressemble à un échiquier. Sa différence avec les premières tables de comptage n’est pas claire. L’activité de perception des taxes consistait surtout à ajouter d’importants montants d’argent et cela nécessitait des tables de comptage spécialement 39. Plusieurs manuscrits illustrant l’abaque de Gerbert sont disponibles désormais sur Internet. L’un d’eux est celui de St John College Oxford Manuscript 17, une collection de travaux de savants effectués à Thorney Abbey en Angleterre vers 1110. Le manuscrit peut être vu dans sa totalité avec un appareil critique complet à digital. library.mcgill.calms (consulté le 1er juin 2015). Un manuscrit publié un peu plus tard sur le site internet de Bodleian Library contient des illustrations des procédures pour faire de l’arithmétique, en utilisant des compteurs numériques : Ms. Bodleian Auct. F.1.9 f.65v.
100
LE COMPTE Y EST !
L’âge des algorithmes
conçues pour l’utilisation d’unités monétaires bizarres de l’époque : livres, shillings et pence40. Mais il y avait plusieurs méthodes (dont l’abaque plus sophistiqué de Gerbert) qui pouvaient être utilisées à l’Échiquier et au centre où les pièces étaient frappées. Par exemple, il aurait été très utile pour le calcul de la pureté du métal qui servait à fabriquer les pièces. Bien que les détails soient vagues, il y a peu de doute sur le fait que l’arithmétique indo-arabe, utilisant le moyen de l’abaque de Gerbert, était bien établie en Europe du Nord-Est au XIIe siècle. Au cours du temps, l’abaque a été supplanté par le système de « comptage au crayon » dans lequel les procédures arithmétiques sont effectuées avec des chiffres écrits d’une certaine façon sur du parchemin ou du papier, plutôt que par déplacements de compteurs chiffrés. Cela avait été recommandé par al-Uqlῑdisῑ en 952 et cette méthode a été décrite par Wingate plusieurs siècles plus tard. Au chapitre 5, nous verrons le rôle qu’elle a joué dans le grand épanouissement de l’art et de l’éducation qui est survenu en Europe à partir du XIIIe siècle.
L’ART DE L’AL-JABR Si la réputation d’al-Khwārizmῑ repose sur ses écrits relatifs à l’arithmétique hindoue, elle serait fragile, car il n’y a aucune preuve fiable sur ce qu’il a effectivement écrit sur le sujet. Mais il existe d’autres preuves, plus sûres, affirmant sa renommée. On sait avec certitude qu’il a écrit un livre portant un long titre en arabe,
40. Pour l’Échiquier, le meilleur exposé reste celui de R. T., Poole The Exchequer in the Twelfth Century (Oxford, Clarendon Press, 1912). De plus amples détails incluant les bases du système étrange de «livres, shillings et pence » peut se trouver dans un article de l’auteur « Weight, Coinage, and the Nation c. 973-1200 », British Numismatic Journal 83 (2013) 75-100. 101
L’âge des algorithmes
contenant le mot al-jabr, dont des copies contemporaines existent encore41. Aujourd’hui, deux valeurs seraient autorisées pour la racine carrée, il existe donc une racine négative (–13), en plus de la réponse (3) donnée par al-Khwārizmῑ. Le sens précis de ce mot dans son contexte original est peu clair, mais, finalement, al-jabr est devenu algèbre, la plus puissante de toutes les méthodes mathématiques de résolution des problèmes. Cependant, l’al-jabr n’a pas commencé à ressembler à l’algèbre moderne avant plusieurs centaines d’années. Aussi le lecteur qui s’énerve sur l’algèbre élémentaire et la mystérieuse « inconnue » x peut continuer à lire en toute confiance en suivant les fils historiques, la signification de x lui paraîtra progressivement claire. Il est possible que le livre d’al-Khwārizmῑ ne soit pas le premier à utiliser le mot al-jabr, et il ne dit pas explicitement ce qu’il signifie. Mais il donne assez d’exemples pour que l’on comprenne les méthodes utilisées. L’idée de base est que si l’on a deux quantités égales et si l’on applique les mêmes opérations à ces deux quantités, les quantités obtenues sont aussi égales. Inversement, si les quantités finales sont égales, les quantités originales l’étaient aussi. Des formes plus complexes de ce type de raisonnement peuvent être utilisées pour justifier des constructions géométriques, telles que l’ancienne règle employée pour trouver l’aire d’un triangle (voir figure 2.8). Dans cet argument, le triangle est dupliqué et après certaines opérations de copier-coller, le résultat est un rectangle qui a une superficie double de celle du triangle. En termes modernes, la méthode
41. On peut trouver des extraits d’Algebra d’al-Khwarizmῑ dans [K, 542-547]. Voir aussi V. J. Katz et K. H. Purshall, Taming the Unknown: A History of Algebra from Antiquity to the Early Twentieth Century (Princeton, Princeton University Press, 2014). En notation moderne, la solution de l’équation x2 + 10x = 39 est donnée par la formule √(10/2)2 + 39 + (10/2). 102
LE COMPTE Y EST !
L’âge des algorithmes
d’al-Khwārizmῑ est équivalente à l’utilisation de ce qu’on appelle des « équations », mais ce n’est pas comme cela qu’il la décrit. La traduction littérale du livre d’al-Khwārizmῑ sur l’al-jabr doit être traitée avec précaution, car le contexte historique n’est pas compris complètement. Certains termes de sa terminologie peuvent ne pas avoir de résonance correcte quand ils sont traduits en français moderne. Il se réfère à des entités de trois types qui peuvent se traduire en gros de la manière suivante : •• racine : une quantité, telle qu’une mesure, dont la valeur est à déterminer ; •• carré : le carré d’une racine (ainsi si la racine est une longueur, le carré est une aire) ; •• nombre : une valeur numérique donnée. Les problèmes sont exprimés en mots comme des relations entre ces racines, carrés et nombres. Voici un célèbre problème, que nous appelons aujourd’hui une équation quadratique. Racines et carrés sont égaux à des nombres, par exemple « un carré et dix racines identiques d’un total de trente-neuf » : c’està-dire que le carré doit être un carré qui, lorsque l’on augmente de dix ses racines, donne trente-neuf. La solution est la suivante : on divise par deux le nombre de racines, qui donne ici cinq. Ensuite on multiplie ce nombre par lui-même, ce qui donne vingt-cinq. On ajoute ce nombre à trenteneuf : la somme est soixante-quatre. On prend la racine de ce dernier nombre, soit huit, duquel on soustrait la moitié du nombre de racines, ce qui donne trois. C’est la racine du carré que l’on cherche. La méthode de calcul n’est pas originale ; il existe des tablettes de la période de l’ancienne Babylone qui suivent la même voie, 103
L’âge des algorithmes
mais sans explication ni justification. Al-Khwārizmῑ la rend si simple que, en réalité, la méthode est un algorithme, une suite d’instructions qui le conduit, à partir des valeurs données, dix et trente-neuf, à la réponse voulue. En réalité, il est bon de souligner que l’algorithme, qui s’écrit sous forme abrégée, est très similaire à ce que nous connaissons sous le nom de programme informatique. INPUT: 10, 39 Half(10) → 5 Square(5) → 25 Add(39, 25) → 64 SquareRoot(64) → 8 Subtract(8, 5) → 3 OUTPUT: 3 Comment al-Khwārizmῑ savait-il que son algorithme était correct ? La seule méthode de vérification dont il disposait était la géométrie classique et la façon de l’utiliser. La procédure commence par « compléter le carré » (figure 4.9). Le premier dessin est « le carré et les dix racines ». Cela peut être pensé comme un champ carré de terre, avec dix bandes de largeur une unité et de même longueur que la longueur du côté du carré. Tout d’abord, 10 est divisé en 2 pour donner 5, et deux ensembles de 5 bandes sont disposés comme ce qui est montré sur le second dessin. Cela donne un carré d’un seul tenant dont une partie est manquante, et on sait que la totalité de la terre ajoutée est égale à 39. Cette pièce manquante est un carré de côté 5 et de superficie 25. Donc le grand carré sur le troisième dessin a une aire de 39 plus 25. La dernière partie de l’algorithme (figure 4.10) dépend de 39 + 25 = 64, ce qui signifie que le côté du grand carré a pour longueur 8, la racine carrée de 64. Il en résulte que la longueur du côté du carré original est obtenue en retranchant 5 de 8, d’où la réponse 3. 104
LE COMPTE Y EST !
L’âge des algorithmes
INPUT : 10
Half (10)
39
Square (5)
5
25
? 5 10
25 5
?
39
Figure 4.9 | Complétion du carré.
Add (39, 25)
64
SquareRoot (64)
8
Subtract (8, 5)
3
5 5 64
8
8 3 8 OUTPUT : 3
Figure 4.10 | La conclusion de l’algorithme d’al-Khwārizmῑ.
Les arguments géométriques comme celui-là exigent que les nombres soient positifs, d’où le fait qu’al-Khwārizmῑ avait présenté des règles séparées pour d’autres formes d’équations quadratiques. Il les considérait comme « des carrés et des nombres égaux à des racines » et « des racines et des nombres égaux à des carrés ». Dans ces trois cas, la justification géométrique utilise l’idée de la complétion du carré. Comme avec les algorithmes de l’arithmétique, la remarquable application de la géométrie est arrivée par plusieurs voies existant dans le monde islamique. Par exemple, un texte hébreu écrit par Abraham bar Hiyya Hanassi (Savasorda), né à Barcelone en 1070, contient la solution des trois cas du problème d’al-Khwārizmῑ. Ce texte a été traduit en latin par Platon de Tivoli vers 1145. 105
L’âge des algorithmes
LES ORIGINES DE L’ALGÈBRE SYMBOLIQUE Dans les anciens textes islamiques, les procédures d’al-jabr étaient décrites en mots et justifiées par des arguments géométriques, lorsqu’elles étaient justifiées. Les algorithmes peuvent être élucidés en utilisant les symboles algébriques modernes, mais on a de bonnes raisons de ne pas le faire en ce point de l’histoire. La méthode symbolique n’est pas apparue avant le XIIIe siècle, et elle ne fut pas complètement développée avant le XVIe siècle, quand elle fut déployée avec un grand succès par Isaac Newton et d’autres. En utilisant les formes originales de l’expression, on peut voir plus clairement comment les idées de base se développaient et, incidemment, démystifiaient le symbolisme de l’algèbre. Sur la piste qui va d’al-Khwārizmῑ à Newton, on rencontrera de nombreux résultats qui sont considérés aujourd’hui comme une partie de l’algèbre moderne, bien qu’ils aient été découverts sans cette aide. L’un des pionniers de la méthode symbolique a été Jordanus de Nemore, l’auteur d’au moins six textes mathématiques. Il est presque certain que son œuvre sur l’arithmétique De Numeris Datis date de la période 1220-1240, mais on ne connaît que très peu de choses sur lui42. Il semble qu’il ait été familier de textes arabes, en particulier celui d’ibn Labban Principles of Hindu Reckoning, dans lequel les algorithmes étaient décrits à partir d’exemples avec des nombres particuliers. Jordanus lui-même essayait de donner des explications plus générales, surtout lorsque ces questions étaient destinées à l’enseignement des principes de l’arithmétique. Par exemple, il considérait la question de la détermination des parties quand un nombre donné est partagé en deux parties dont la différence est donnée. Par exemple, peut-on partager dix pains en deux parties qui diffèrent de 2 ? Il expliquait la méthode en observant que la « soustraction de la différence du total donne un reste égal à deux ». Appliquer la méthode au cas où 42. Pour l’œuvre de Jordanus, consulter B. B. Hughes (éd.), Jordanis de Nemore: De Numeris Datis (Berkeley, University of California Press, 1981).
106
LE COMPTE Y EST !
L’âge des algorithmes
10 est décomposé en deux parties dont la différence est 2, soustraire 2 de 10, ce qui donne 8, partagé en deux, ce qui donne la plus petite partie 4. Puis soustraire 4 de 10, l’autre partie est 6. Jordanus est passé à autre chose pour traiter une question légèrement plus complexe : si un nombre donné est partagé en deux parties dont le produit des deux parties est donné, comment les deux parties peuvent être trouvées ? Il se démarque de la méthode traditionnelle en se servant des symboles pour représenter les nombres donnés, sans assigner de valeurs particulières à ces nombres. Soit a un nombre donné à séparer en x et y, dont le produit de x par y est donné, b. De plus, soit e le carré de a et f le quadruple de b. Soustraire celui-là de e donne g, qui est alors le carré de la différence entre x et y. Prenons la racine carrée de g et appelons-la h. Alors h est aussi la différence entre x et y. Puisque h est connu, x et y peuvent être trouvés. On peut écrire la procédure sous forme abrégée comme on l’a fait pour l’algorithme d’al-Khwārizmῑ, mais en utilisant des symboles plutôt que des nombres : INPUT: a, b Square(a) → e Quadruple(b) → f Subtract(e, f) → g SquareRoot(g) → h Maintenant, Jordanus observe que le problème a été réduit à un autre plus simple, discuté précédemment. Les deux parties x et y de a sont telles que leur différence est h et ainsi elles peuvent être trouvées par des méthodes standards de résolution de ce type de problèmes (comme données ci-dessus). Par exemple, supposons que l’on veuille calculer les nombres dont la somme et le produit soient 228 et 3 587. 107
L’âge des algorithmes
En suivant les instructions de Jordanus et en utilisant l’arithmétique indo-arabe, on peut calculer e, f, g et h : a
b
e
f
g
h
228
3 587
51 984
14 348
37 636
194
Donc il reste à trouver les nombres dont la somme et le produit sont 228 et 194, le problème que Jordanus voulait résoudre. Utilisant sa méthode, on calcule la moitié de 228 moins 194 soit 17 qui est le plus petit nombre, et l’autre est 228 moins 17 soit 211. Aujourd’hui, on peut utiliser une calculatrice, car elle a été programmée pour effectuer les opérations arithmétiques élémentaires. Notre travail consiste simplement à lancer l’algorithme, c’est-à-dire à appuyer sur les bonnes touches dans le bon ordre. Mais pendant des centaines d’années, on a dû résoudre ces problèmes en utilisant les méthodes de calcul à la main, comme Wingate les avaient enseignées. L’aspect significatif de l’exposé de Jordanus est qu’il sépare les opérations (l’algorithme) des calculs individuels (l’arithmétique). Si l’on veut faire les calculs, on peut résoudre le problème en suivant rigoureusement les instructions. L’approche symbolique de Jordanus n’a pas été adoptée immédiatement et donc, pendant plusieurs siècles, les mathématiques ont été écrites maladroitement en style littéraire. Le chapitre 5 traite d’importantes découvertes datant de la grande Renaissance de la culture aux XVe et XVIe siècles. Mais en mathématiques, les plus grandes avancées n’arrivent qu’au XVIIe siècle et le temps passant, on assiste à la naissance d’un nouveau domaine des mathématiques plutôt qu’à une renaissance.
108
LE COMPTE Y EST !
5 La fin du Moyen Âge Dans ce chapitre, on verra comment les gens s’habituent progressivement à l’utilisation de méthodes algorithmiques de la fin de la période médiévale. Cela se produit de différentes façons. Certaines procédures arithmétiques étaient adoptées car elles s’appliquaient directement aux problèmes complexes qui se posaient dans le monde marchand. D’autres méthodes, à la fois arithmétiques et algébriques, suggéraient de nouveaux problèmes qui constituaient un défi pour les érudits de l’époque. Les deux méthodes étaient imbriquées et, en temps voulu, ont contribué aux fondements d’un nouveau monde en mathématiques.
MARCHANDS ET MATHÉMATICIENS La dissémination de l’arithmétique indo-arabe en Europe a commencé vers la fin du Ier millénaire. Il se peut qu’elle ait été partiellement inspirée par la réputation de Gerbert comme érudit, mais probablement pas par son bref séjour en tant que pape à Rome. Au début, il apparaît que cette connaissance était limitée à de petits groupes de clercs de haut rang et à des officiels qui n’avaient aucune 109
La fin du Moyen Âge
raison de partager plus largement leur expertise. C’était quelque 200 ans avant que les nouvelles méthodes commencent à infiltrer les classes marchandes43. L’un des principaux catalyseurs était le livre Liber abbaci, écrit par Léonard de Pise en 1202 et révisé en 1228. Léonard est connu sous le nom de « Fibonacci », qui révèle ses origines comme membre d’une famille prospère, la Maison Bonacci44. Son père était représentant des marchands de Pise en Afrique du Nord et il est certain que Léonard a été formé à l’arithmétique indo-arabe. Léonard a voyagé aussi avec son père dans l’Est avant de revenir à Pise vers 1200 pour écrire son livre. De nombreux problèmes de Liber abbaci sont considérés comme ses premiers textes, mais Léonard les avaient agrémentés de bonnes histoires. Par exemple, voici une version de son « problème des oiseaux » trouvé aussi dans un manuscrit écrit par un érudit islamique, Abu Kamil, au début du Xe siècle. J’ai acheté 39 oiseaux pour 30 deniers. Certains sont bruns, d’autres gris et d’autres encore blancs et ils coûtaient respectivement 1/3, 1/2 et 2 deniers. Combien d’oiseaux de chaque espèce ai-je achetés ? Pour un étudiant d’aujourd’hui, ce problème serait attaqué par l’écriture de quelques équations algébriques. Léonard ne disposait pas de ces outils, mais il était capable de trouver des solutions et d’expliquer comment résoudre des problèmes similaires. En supposant raisonnablement que seuls les nombres entiers d’oiseaux sont autorisés et que l’on doit en acheter au moins un de chaque espèce, dans ce cas il y a une seule réponse45. 43. Un exposé fascinant des activités mercantiles dans l’Europe médiévale se trouve dans Power and Profit de Peter Spufford (Londres, Thames and Hudson, 2000). 44. Sur Fibonacci, nous recommandons The Man of Numbers de Keith Devlin (New York, Walker, 2001). 45. La solution de la version donnée ici est neuf oiseaux bruns, dix oiseaux gris et onze oiseaux blancs. La version du problème des oiseaux d’Abu Kamil se trouve dans le manuscrit Paris B.N. Ms.4946, ff7.B-10a.
110
LE COMPTE Y EST !
La fin du Moyen Âge
Le Liber abbaci contient des instructions pour effectuer toutes les opérations arithmétiques standards, utilisant les méthodes indoarabes. Un développement important était que Léonard traitait les fractions à peu près de la même façon qu’aujourd’hui et il utilisait la notation moderne. Ainsi, il pouvait expliquer clairement comment effectuer les sommes bizarres qui nous étonnent encore, comme ajouter 17/44 et 15/26. Une conséquence plus subtile de cette approche est que l’on devenait familier à l’idée que les fractions sont des nombres, exactement comme les nombres entiers, car elles peuvent être ajoutées et multipliées de la même manière. Ces opérations possédaient des propriétés que l’on trouvait rassurantes, exactement comme 5 plus 3, ainsi 17/44 plus 15/26 est la même chose que 15/26 plus 17/44. Ce point de vue est le fondement du concept moderne de système de nombres vérifiant certaines règles et il est fondamentalement différent de la façon de penser qui prévalait dans l’Ancien Monde. Le contenu de Liber abbaci s’est diffusé lentement dans la communauté marchande et nous savons que Léonard a écrit d’autres livres sur le sujet, dont certains n’ont pas survécu. Son plaidoyer pour le système arithmétique indo-arabe s’est établi progressivement, et à la fin du XIIIe siècle, ces méthodes étaient bien connues, non seulement à Pise, mais aussi dans les cités italiennes comme Gênes et Florence. En effet, en 1299, les Florentins ont interdit les nombres indo-arabes dans les textes, un fait qui a souvent été mal compris. L’interdit s’appliquait spécialement à l’utilisation des nombres dans les comptes rendus, ainsi les clients pouvaient vérifier leurs comptes. L’existence de l’interdit suggère que, à des fins internes, les banquiers florentins étaient devenus familiers du système des nombres indo-arabes et des algorithmes associés. Plusieurs problèmes arithmétiques de Léonard présentaient des aspects commerciaux et de nombreux autres, comme le problème des oiseaux, pouvaient être interprétés comme tels. Son livre contient plusieurs chapitres entièrement consacrés à l’arithmétique 111
La fin du Moyen Âge
commerciale, l’un traite de l’alliage de métaux pour les pièces en argent. En remontant au IIIe siècle, les Romains avaient dévalué leurs pièces d’« argent » en ajoutant d’importantes quantités de cuivre si bien que les pièces devinrent une sorte de jeton. Il n’est pas surprenant d’apprendre que le jeton était très impopulaire. Après l’effondrement de l’Empire romain, de nouvelles formes de gouvernement des nations, indépendantes, sont apparues et à l’époque, la plupart des gouvernements avaient une monnaie d’argent de qualité. En Angleterre, la pièce standard était le penny en argent et la pureté de cet alliage a été maintenue sur plusieurs siècles, bien que le poids ait varié. Mais dans d’autres contrées, la monnaie en argent a progressivement dégénéré à nouveau, entraînant dans les échanges l’apparition d’une monnaie connue sous le nom de « monnaie noire ». Une telle monnaie était le petit denier de Florence, qui était supposé, de manière quelque peu ridicule, contenir 1 partie d’argent pour 99 parties de cuivre. La valeur du petit denier était si faible qu’il devint non rentable d’en frapper (même sans trace d’argent) et il fut remplacé par une unité appelée quattrino, également monnaie noire mais valant nominalement quatre deniers. Finalement, une déconcertante complexité résultait de ces changements de systèmes financiers. À Florence, au XIVe siècle, les pièces en circulation – la monnaie utilisée comme moyen d’échange – étaient principalement les florins d’or (figure 5.1) et les quattrinos à base de métal. Par ailleurs, la monnaie utilisée en comptabilité était exprimée en unités traditionnelles de base, le denier et ses multiples, le sou (12 deniers) et la livre (20 sous)46.
46. La division de la livre en 20 sous et 240 deniers était la même que celle de la livre en 20 shillings et 240 pence. Ces systèmes avaient un ancêtre commun datant de l’époque de Charlemagne, vers 800.
112
LE COMPTE Y EST !
La fin du Moyen Âge
Figure 5.1 | Pièces d’or européennes frappées à la fin du Moyen Âge. En haut, une augustale de Frédéric II de Sicile et au-dessous un florin de Florence (ce florin date de 1347). Wikimedia Commons : fourni par le Classical Numismatic Group Inc., http://www. cncoins.com.
De retour au temps de Léonard, de nombreuses pièces d’« argent » étaient frappées dans toute l’Italie et alentour. Leur pourcentage en argent variait considérablement, ce qui explique pourquoi Liber abbaci contient des instructions détaillées sur la production d’alliages et les pourcentages spécifiques. Léonard ne parlait pas beaucoup des pièces en or, probablement car elles étaient relativement rares lorsqu’il écrivit son livre. Très peu de pièces en or avaient été frappées en Europe de l’Ouest pendant plusieurs siècles, bien que le denier d’or (voir figure 4.6) poursuivait son long règne comme monnaie caractéristique du monde islamique et circulait dans les régions chrétiennes voisines. Toutefois, à l’époque de Léonard, cette situation a évolué considérablement et il est possible qu’elle ait joué un certain rôle dans le processus. Le personnage 113
La fin du Moyen Âge
central était Frédéric II, qui devint empereur du Saint-Empire romain en 1220. Frédéric était roi de Sicile depuis 1197, et la position géographique de l’île en faisait un point de rencontre entre musulmans et chrétiens, aussi bien commercialement qu’intellectuellement. C’est en Sicile, vers 1231, que Frédéric commença à produire un nouveau type de monnaie en or, connu sous le nom d’augustale (figure 5.1). Le style d’une augustale était basé sur un modèle romain classique montrant l’empereur en chef militaire suprême portant une couronne de lauriers. Frédéric était un homme très cultivé et il portait un grand intérêt aux arts et aux sciences, apportant son soutien aux traductions de manuscrits grecs et latins. On sait qu’il a rencontré Léonard en 1225 et il se peut, à cette occasion, qu’il ait discuté avec lui des problèmes de production des pièces en or. Bien que l’augustale ait été essentiellement une expérience, le temps d’une monnaie en or à grande échelle était venu, comme le montre le florin qui était frappé à Florence à partir de 1252. Il constitua un modèle pour les pièces en or dans l’Europe chrétienne pendant plusieurs centaines d’années. Mais le modèle ne fut pas suivi exactement et au début du XIVe siècle, il y avait de nombreuses pièces en or en circulation, toutes de différents poids et de différentes puretés. Comme exemple de ce désordre monétaire, on peut imaginer les difficultés d’un voyageur florentin dans certaines parties reculées de l’Europe, telles que Londres. Pour payer la nourriture et le logement, il devait échanger ses florins contre une monnaie locale acceptable. Les seules pièces courantes en Angleterre à cette époque étaient les pennies, par conséquent il était nécessaire de connaître le taux de change, le nombre de pennies donnés pour un florin. Ce nombre variait très considérablement (en gros dans un intervalle de 30 à 42) car il dépendait de facteurs économiques, tels que l’offre et la demande d’or et d’argent. Un voyageur florentin du nom de Balducci Pegolotti, le représentant de la Bardi, une grande banque, qui a travaillé à Londres de 1317 à 1321, fut l’un de ces voyageurs. Au cours de ses voyages, il a tenu un 114
LE COMPTE Y EST !
La fin du Moyen Âge
carnet connu sous le nom de La Pratica della mercatura qui contient une quantité d’informations utiles concernant les monnaies, les poids et les mesures des lieux visités. Par exemple, le livre comprend un tableau donnant la pureté d’une trentaine de monnaies en or différentes incluant le dinar, l’augustale et le florin. Pegolotti évaluait la pureté en or en nombre de carats, comme cela est fait aujourd’hui, ainsi l’or pur était de 24 carats. Son tableau indique que le denier valait 23 1/2 carats, l’augustale 20 1/2 carats et le florin 24 carats. Les difficultés personnelles que Pegolotti a rencontrées au cours de ses voyages étaient insignifiantes en comparaison de ses activités professionnelles qui devaient comporter la conclusion d’arrangements pour l’exportation de grandes quantités de marchandises, comme la laine de Londres à Florence. Exportateurs et importateurs s’attendaient à traiter d’importantes sommes, mais envoyer des pièces pour un long voyage était une activité pleine de risques. De plus, l’exportateur s’attendait à recevoir des florins en or, la monnaie courante à Florence. Pour surmonter cette difficulté, une loi sur l’échange fut promulguée (figure 5.2). Par ce biais, les parties pouvaient effectuer et recevoir des paiements dans leurs devises locales ; toutefois, les documents autorisant les paiements devaient être acheminés pour un long trajet. FLORENCE
LONDRES Biens
Importer
Exporter
Facture Florins
Argent
Banque
Agent
Figure 5.2 | La loi sur l’échange. La banque de Florence, ayant payé en florins, envoie une facture à Londres. Lorsque la facture est présentée à l’agent, le paiement est effectué en argent.
115
La fin du Moyen Âge
Le système était équilibré lors des échanges commerciaux dans le sens opposé : dans ce cas, les marchandises étaient envoyées de Londres à Florence. La rédaction d’une note d’échange exigeait une grande expertise arithmétique, car les paiements effectifs dépendaient non seulement de taux de change variables, mais aussi des systèmes de comptabilité de Londres et de Florence. À Londres, les prix des marchandises, comme la laine, étaient exprimés en marks, un mark correspondant à 160 pence. À Florence, les prix étaient exprimés en livres, sous et deniers et, à cette époque, le florin d’or était estimé à 29 sous ou 348 deniers. De telles complications expliquent le fait que le carnet de Pegolotti contienne de nombreux tableaux de change, dont voici un court extrait. A denari 34
1 95 sterl, il fior, viene il mar. lire 6, sol. 15, den. 5 . 4 137
A denari 34
1 21 sterl, il fior, viene il mar. lire 6, sol. 14, den. 5 . 2 23
A denari 34
3 49 sterl, il fior, viene il mar. lire 6, sol. 13, den. 6 . 4 139
A denari 35 sterl, il fior, viene il mar. lire 6, sol. 12, den. 6
6 . 7
La première ligne peut se traduire ainsi : 34
1 sterlings de penny correspond à un florin, le mark correspond à 4 95 deniers. 6 livres, 15 sous et 5 137
Cette valeur du mark est le résultat de la division du produit des nombres 160 et 348 (dont le sens est expliqué ci-dessus) par le taux de change donnant le résultat en deniers, 1 625
95 . 137
Dans ce tableau, ce montant a été converti en livres, sous et deniers. 116
LE COMPTE Y EST !
La fin du Moyen Âge
La complexité du calcul, en particulier la division de nombres avec des parties fractionnaires, suggèrent que le tableau était établi par des arithméticiens hautement qualifiés utilisant les méthodes indo-arabes décrites dans Liber abbaci. D’autre part, un utilisateur typique du tableau avait un travail simplifié. Un clerc de Florence devait rédiger une facture pour une cargaison de laine évaluée à 875 marks (par exemple). Il devait vérifier le taux de change courant et examiner la valeur correspondante d’un mark, puis multiplier par 875 pour obtenir les montants qu’il devait entrer dans ses comptes. De tels calculs n’avaient rien de trivial, mais ils pouvaient être effectués par un clerc correctement entraîné. Des documents précisent qu’en 1345, à Florence, un millier d’enfants avaient reçu les éléments d’abaco et d’algorisimo, ce qui suggère que les techniques arithmétiques, à différents niveaux de sophistication, étaient très utiles dans le commerce. L’établissement des « écoles d’abaque » et l’existence d’un groupe de personnes formées aux arts des algorithmes ont eu d’importantes conséquences pour l’avenir de toutes les mathématiques.
INTÉRÊT SUR INTÉRÊT, ET PLUS... L’objectif essentiel de l’agenda de Pegolotti était la collecte d’informations spécifiques sur les pièces, les poids et les mesures de nombreuses localités. Mais il contient aussi des informations générales, incluant des tables à calcul d’intérêts sur un prêt. À cette époque, les objections éthiques et religieuses concernant les intérêts des prêts avaient été laissées de côté ; on arguait qu’à certains égards, l’argent était une marchandise comme une parcelle de terrain, et par conséquent il était amplement justifié de le louer. Non seulement il était acceptable de demander des intérêts pour un prêt d’argent, mais il était aussi acceptable de demander des « intérêts d’intérêts » ou ce que nous appelons aujourd’hui des intérêts composés. Par exemple, quand 100 livres sont prêtées à 5 % par an, l’intérêt dû à la fin de la première année est de de 5 livres, donc le prêt est de 105 livres. À la fin de la 117
La fin du Moyen Âge
seconde année, l’intérêt dû est de 5 % de cette dernière somme, qui se monte à 5 livres et 5 sous, légèrement plus que ce qu’il aurait été dans le cas de l’intérêt simple. Les tables de Pegolotti donnent les intérêts d’un prêt de 100 livres sur une période de 20 ans à un taux annuel de 8 %. Les calculs étaient fastidieux mais pas compliqués pour un arithméticien compétent. Par exemple, le calcul d’un intérêt à un taux annuel de 5 % s’effectue de la même façon en ajoutant un vingtième du montant à la fin de chaque année. Ainsi pour les première et deuxième années, les calculs donnent (en notation moderne) : 100 × (1 +
1 ) = 105, 20
100 × (1 +
L’expression 1+
1 1 1 ) × (1 + ) = 110 . 20 20 4
1 20
est connue sous le nom de binôme qui est la somme de deux nombres. Les chiffres pour les années successives peuvent être calculés à partir de ce terme binomial : après cinq années, le montant aura augmenté (en livres) de 100 × (1 +
1 1 1 1 1 ) × (1 + ) × (1 + ) × (1 + ) × (1 + ). 20 20 20 20 20
Après des calculs fastidieux, la réponse trouvée est de 100 livres, 12 sous, 7 deniers. Face à ce nombre de calculs, même un arithméticien compétent pouvait bien souhaiter une méthode plus simple. Le produit de cinq termes binomiaux peut sûrement être simplifié d’une certaine façon, n’est-ce pas ? La multiplication de plusieurs termes binomiaux intervient dans plusieurs contextes mathématiques, et nous avons déjà rencontré le cas le plus simple, la règle pour élever au carré un binôme, sous une forme géométrique déguisée. Sur la figure 5.3, les côtés d’un carré ont été divisés en deux parties de longueurs a et b, si bien que le carré lui-même a été divisé en quatre parties a × a, a × b, b × a, b × b. 118
LE COMPTE Y EST !
La fin du Moyen Âge
En notation moderne, ces termes sont notés a2, ab, ba et b2, et on admet que ab est la même chose que ba. Il en résulte que l’aire du carré entier est (a + b)2 = a2 + 2ab + b2.
Cette formule est utilisée de plusieurs façons. Par exemple, elle peut être appliquée à d’autres calculs d’intérêts composés à 5 % sur deux ans. Le résultat est (1 +
1 2 1 1 ) = 1 + 2 × ( ) + ( )2 20 20 20
où le deuxième terme représente deux versements d’intérêt simple à 5 % et le dernier terme représente « l’intérêt sur l’intérêt ». Une application nettement plus ancienne apparaît dans la procédure géométrique utilisée par al-Khwārizmῑ dans la résolution des équations quadratiques, comme dans son exemple « une racine carrée et 10 unités est égal à 39 » (voir figures 4.9 et 4.10). Ici, la formule était appliquée à un carré dont les côtés sont partagés en deux parties, 5 et le nombre inconnu. D’après l’algorithme, l’aire du grand carré est 25 + 39 = 64, donc les côtés ont une longueur de 8 (la racine carrée de 64), d’où il résulte que l’inconnue est 8 – 5 = 3.
b
bxa
bxb
a
axa
axb
a
b
Figure 5.3 | Élever au carré un binôme, de manière géométrique.
119
La fin du Moyen Âge
Cet exemple est facile, parce que la racine de 64 est un nombre entier. Mais que devient cet exemple si al-Khwārizmῑ avait posé le problème « un carré et 10 unités est égal à 40 », si bien que l’aire du carré est égale à 25 + 40 = 65 ? Dans ce cas, l’algorithme requiert le calcul de la racine carrée de 65, qui n’est certainement pas un nombre entier. Une stratégie évidente est de commencer avec 8 comme approximation et d’essayer d’en trouver une meilleure. Pour ce faire, il existe une règle qui remonte à l’Antiquité47. Cependant, nous devons être être vigilants, car cette règle produit des approximations qui sont des fractions. À la lumière des découvertes grecques concernant √2, ce n’était nullement une surprise d’apprendre que √65 ne pouvait pas s’exprimer exactement comme une fraction et donc que cette méthode ne pouvait pas donner la réponse exacte. Néanmoins, elle peut être utilisée pour obtenir un résultat aussi proche que l’on veut de √65, même si nous ne pouvons pas expliquer précisément ce qu’est réellement ce nombre. Arrêtons-nous ici pour examiner l’état de l’art vers la fin du XIVe siècle. Les Mésopotamiens connaissaient les procédures arithmétiques pour compléter un carré et al-Khwārizmῑ les avait écrites sous forme d’algorithme. Il était clair que l’étape essentielle consistait à trouver la racine carrée d’un certain nombre. Dans l’œuvre de Léonard, les manipulations algébriques et les procédures arithmétiques pour calculer une racine carrée étaient largement connues. Si l’on élargit l’horizon et l’on se rappelle l’œuvre de Jordanus (telle qu’elle est décrite au chapitre 4), on peut voir que l’esquisse d’une approche 47. La règle est : prendre la moyenne de 8 et de 65/8, donnant la seconde approximation de 8 1/16. Le carré de ce nombre diffère de 6 d’une petite quantité, 1/256, alors que le carré de 8 (la première approximation) diffère de 65 de 1. L’élégance de la méthode réside dans le fait que la même règle peut s’appliquer encore et encore, donnant une suite d’approximations qui deviennent de plus en plus précises. Cet algorithme utilise le fait que x est une approximation de √d, alors (sous certaines conditions) une meilleure approximation est (x + d/x)/2. Cette règle est plus utile quand d = a2 + e et que e est petit, ainsi la première approximation est a et la seconde approximation est a + e/2a.
120
LE COMPTE Y EST !
La fin du Moyen Âge
symbolique moderne commence à prendre forme. Les érudits du Moyen Âge n’utilisaient pas notre notation, mais leurs lignes de pensée étaient similaires à celles utilisées de nos jours. Les mathématiciens d’avant-garde, bien inspirés, n’auraient eu aucune difficulté à lire certains livres d’algèbre moderne. Les remarques précédentes signifient que nous pouvons commencer maintenant à utiliser les notations modernes pour fournir des explications : en réalité, nous avons déjà commencé à le faire. Mais nous devons garder en tête les aspects non historiques de cette procédure. Lorsque nous parlons d’une « équation », nous devons nous souvenir que le signe (=) pour l’égalité a été introduit vers le milieu du XVIe siècle. Avant cela, les équations étaient encore écrites avec des mots, bien que des abréviations comme p pour plus et m pour moins fussent habituelles. La quantité inconnue dont la valeur satisfait l’équation était notée comme la « chose » ou « cosa » en italien. L’utilisation de lettres telles que x et y comme inconnues et a et b pour les nombres donnés n’est réellement mise en place qu’à la fin du XVIe siècle. Nos signes modernes +, –, √ ont été introduits peu à peu et sont devenus standards quand les imprimeurs de livres ont été persuadés de les d’ajouter à leur table de caractères typographiques. Dans le chapitre 6, nous verrons comment la maîtrise de l’algèbre symbolique a ouvert un nouveau monde à l’ensemble des mathématiques, mais auparavant nous devons expliquer comment l’algèbre nouvelle a été découverte en utilisant les notations anciennes.
RÉSOLUTION D’ÉQUATIONS Plusieurs manuscrits du XIVe siècle contiennent des problèmes sur les intérêts composés apparemment destinés à l’utilisation des abaques dans les écoles italiennes. Un tel problème requiert de calculer le taux d’intérêt qui, à partir d’un dépôt de 100 livres, produit 150 livres au bout de trois ans. Pegolotti a établi des tables fournissant le montant final quand le taux est donné ; ici, nous avons le problème 121
La fin du Moyen Âge
inverse, on nous demande de calculer le taux d’intérêt lorsque le montant final est connu. En d’autres termes, nous devons trouver le facteur multiplicatif qui appliqué trois fois à 100 donne comme réponse 150. De nos jours, nous noterions le taux d’intérêt x % et nous écririons le problème symboliquement sous la forme 100 × (1 +
x 3 ) = 150. 100
C’est un problème typique d’algèbre : la condition est une équation et la réponse un taux d’intérêt (le taux d’intérêt x) inconnu. Le format est très semblable à celui utilisé par al-Khwārizmῑ 500 ans plus tôt, mais ses équations étaient quadratiques (mettant en jeu la seconde puissance x2), alors qu’ici nous avons une équation cubique (mettant en jeu x3). Avec les notations modernes, il est manifeste que cet exemple particulier a une forme très simple, car c’est essentiellement seulement une puissance qui est en jeu. Quand ce problème a été posé, vers 1395, les méthodes arithmétiques pour le calcul des racines cubiques étaient bien connues des experts. Les méthodes étaient très complexes, mais elles reposaient fondamentalement sur une règle d’obtention d’approximations successives, comme celle permettant de calculer des racines carrées. Les experts avaient découvert aussi que les équations cubiques présentaient une nouvelle difficulté. Alors que toute équation quadratique pouvait être résolue en trouvant des racines carrées, ils n’était généralement pas vrai qu’une équation cubique puisse être résolue uniquement en trouvant des racines cubiques, et c’est pourquoi le problème des intérêts composés discuté n’était pas typique. L’héritage du Liber abacci était un développement constant de l’activité dans les domaines mathématiques. En 1494, près de 300 ans plus tard, l’état de l’art était représenté par l’un des tout premiers livres imprimés sur les mathématiques, Summa de Arithmetica, Geometrica, Proportioni et Proportionalita de Luca Pacioli. Le livre couvre l’algèbre et l’arithmétique commerciale, et affirme nettement qu’une 122
LE COMPTE Y EST !
La fin du Moyen Âge
méthode générale de résolution de l’équation cubique, analogue à celle de l’équation quadratique, n’a cependant pas été trouvée48. L’assertion de Pacioli n’était pas exprimée en termes utilisés de nos jours, car il ne disposait pas du langage mathématique. Toutefois, l’essence du problème aurait été comprise par un groupe de gens disposant d’une culture mathématiquement sophistiquée qui lisaient ce livre. On pense que l’un d’entre eux, Scipione del Ferro, professeur de mathématiques à l’université de Bologne, a été le premier à faire des progrès significatifs. Cela s’est produit, probablement, vers 1520, mais on ne peut pas en être sûr, car il existait à l’époque, en Italie, une culture du secret des découvertes mathématiques. On pense que del Ferro a découvert la résolution de n’importe quelle équation qui s’écrirait maintenant sous la forme x3 + cx = d, où c et d sont des nombres positifs donnés et il semble probable qu’il ait aussi résolu des équations de la forme x3 + d = cx et x3 = cx + d. À cette époque, ces cas devaient être traités séparément, car seules les équations avec des nombres c et d positifs avaient une signification. Mais del Ferro n’a pas publié ses travaux. Environ vingt ans plus tard, Nicolas de Brescia, connu sous le nom de Tartaglia, a redécouvert sa méthode et résolu les trois types d’équation. Tartaglia était déterminé à protéger ses découvertes, parce qu’il voulait apparemment gagner de l’argent. Mais on comprend mal pourquoi il pensait que la méthode sousjacente pouvait ou devait rester secrète indéfiniment, alors qu’elle avait déjà été découverte par del Ferro. Quelle qu’en soit la raison, sa nature possessive l’a conduit à une célèbre querelle dans l’histoire des mathématiques, entre lui et Girolamo Cardano, un éminent érudit italien de cette époque (figure 5.4). 48. Quelques équations cubiques particulières avaient été résolues numériquement. Le résultat le plus impressionnant avait été donné par Léonard dans Liber abbaci. Il considérait l’équation que l’on écrit x3 + x2 + 10x = 20. Il est assez facile de calculer que l’une de ses racines est proche de 4/3 et Léonard a trouvé une meilleure approximation qu’il écrivit sous forme sexagésimale [1|22|742]. Cette méthode de représentation des fractions était encore utilisée dans les calculs en astronomie et aurait été familière de Léonard. 123
La fin du Moyen Âge
Figure 5.4 | Tartaglia et Cardano, d’après les pages de garde de leur livre.
Cardano était renommé pour ses écrits en mathématiques et également en médecine. Il savait, comme de nombreux autres, qu’une méthode générale de résolution des équations cubiques avait été trouvée et il essayait de persuader Tartaglia d’en révéler le secret. Finalement, en 1539, après avoir promis à Cardano de ne pas le publier, Tartaglia le lui donna sous la forme d’un poème. C’était, à l’époque, une manière de décrire un algorithme, comme ceux discutés au chapitre 4. Traduit approximativement, voici ce qu’il donne : Quand un cube et certaines choses sont égales à un nombre : trouver deux nombres qui diffèrent de ce nombre, et dont le produit est égal au cube de un tiers du nombre de choses ; la différence de leurs racines cubiques est la réponse49. 49. L’algorithme de Tartaglia pour l’équation x3 + cx = d est le suivant : tout d’abord, trouver des nombres u et v tels que u – v = d et uv = (c/3)3. Puis trouver les racines cubiques de ces nombres, soit u = p3, v = q3, alors la solution de l’équation est x = p – q. Pour le démontrer, remarquer que (c/3)3 = uv = (pq)3 ; d’où c = 3pq et d = u – v = p3 – q3. En utilisant la formule du binôme pour (p – q)3 et les règles de l’algèbre élémentaire, nous avons x3 + cx = (p – q)3 + 3pq(p – q) = p3 – q3 = d.
124
LE COMPTE Y EST !
La fin du Moyen Âge
Voici un exemple simple. Supposons que le problème consiste à trouver une chose telle que son cube et 9 choses fasse 26. Dans ce cas, les nombres donnés sont 9 et 26 et le cube de un tiers de 9 est 27. Cette première étape revient à trouver deux nombres qui diffèrent de 26 et dont le produit est 27. Ici, nous avons de la chance et remarquons que 27 et 1 conviennent. Les racines cubiques sont 3 et 1, donc la réponse est la différence 3 – 1 = 2. L’algorithme n’est pas très performant comme cet exemple peut le suggérer. Il comporte deux parties, dont la première consiste à trouver deux nombres dont la différence et le produit sont donnés. Ce problème remonte aux anciens. Au XIIIe siècle, Jordanus avait conçu un algorithme pour le cas où la somme et le produit sont donnés, et le cas présent (où la différence et le produit sont donnés) est légèrement différent. La seconde partie comporte le calcul de racines cubiques. L’algorithme de Tartaglia dépend d’une formule algébrique d’élévation à la puissance trois d’un binôme, (a + b) 3 = a3 + 3a2b + 3ab2 + b3,
qui ressemble beaucoup à la solution donnée par al-Khwārizmῑ pour l’équation quadratique, dépendant quant à elle de (a + b) 2. Au XVIe siècle, les Italiens n’avaient pas de notation commode, mais ils étaient familiarisés avec les idées sous-jacentes. Cardano en avait donné une démonstration géométrique que l’on peut concevoir comme étant une « complétion du cube ». Dans la pratique, le calcul ne se déroule pas aussi facilement que dans l’exemple donné ci-dessus. Supposons que nous essayons de résoudre l’équation « un cube et 12 choses est égal à 32 ». Nous devons commencer par trouver deux nombres qui diffèrent de 32 et dont le produit est 64 (le cube de 4, qui est le tiers de 12). En utilisant la méthode de Jordanus, ces nombres se révèlent être 8√5 +16 et 8√5 – 16. Pour obtenir la réponse finale, nous devons trouver les racines cubiques de ces nombres et calculer leur différence. Nous pouvons être tentés de le faire avec une calculatrice, et nous serions 125
La fin du Moyen Âge
probablement surpris de trouver que la réponse est 2. Il est facile de vérifier que le cube de 2 plus 12 fois 2 est égal à 32, ainsi 2 est la solution de l’équation50. Cardano était capable de surmonter plusieurs des difficultés qui se présentaient dans la résolution d’équations cubiques, y compris celle qui est décrite dans le paragraphe précédent. Son étudiant Ludovico Ferrari avait découvert aussi la méthode de résolution des équations quadratiques dans lesquelles la puissance quatre des choses inconnues intervient. Ces découvertes et de nombreuses autres ont été publiées en 1545 dans le livre de Cardano, Ars Magna, ouvrage qui a grandement irrité Tartaglia. Il a accusé Cardano de n’avoir pas tenu sa promesse et ne se consola pas du fait que son propre travail ne soit pas complètement reconnu. La querelle qui s’ensuivit fut violente et se poursuivit même après la mort de Tartaglia en 1557. Si seulement les mathématiciens avaient tiré une leçon du fait que le secret marche dans les deux sens, de nombreuses controverses futiles auraient pu être évitées. COMPTER ET ARRANGER Voici un autre problème tiré de Liber abbaci : Sept vieilles femmes se rendent à Rome. Chacune d’elles a sept mules et chaque mule porte sept sacs. Chaque sac contient sept pains, chaque pain contient sept couteaux et chaque couteau a sept étuis. Quel est le nombre total de choses ? Des problèmes de ce type appartiennent à une ancienne branche des mathématiques qui relèvent aujourd’hui du domaine de la combinatoire51. Les Hindous, en particulier, semblent avoir assimilé 50. La raison pour laquelle cette arithmétique complexe conduit à une réponse simple est que les racines cubiques de 8√5 + 16 et 8√5 – 16 sont √5 + 1 et √5 – 1. L’utilisation à nouveau de la formule du binôme est cruciale, car elle nous indique comment calculer le cube de √5 + 1. Essayez. 51. L’ancienneté de cette branche des mathématiques est attestée par le fait que le problème des sept est remarquablement similaire à celui qui figure dans le papyrus de Rhind (vers 1650 avant J.-C.).
126
LE COMPTE Y EST !
La fin du Moyen Âge
comptage et arrangement dans leur approche philosophique de la vie en général. Seulement quelques-uns des tout premiers documents ont survécu, mais, heureusement, il existe plusieurs copies fiables d’un manuscrit écrit par Bhaskara au XIIe siècle après J.-C. De nombreuses choses dans son livre ne sont pas nouvelles, mais c’est un excellent exposé de l’état des mathématiques indiennes de l’époque, écrit dans un style agréable. Il est connu sous le nom de Lilavati, qui est présumé être le prénom de la fille de Bhaskara, qui, disait-on, était une « fille intelligente » aux « yeux de biche ».
D
C
M L
Figure 5.5 | Les autres attributs de Vishnou : le disque (D), la conque (C), la masse (M) et le lotus (L).
127
La fin du Moyen Âge
Le Lilavati contient plusieurs problèmes de combinatoire. L’un d’entre eux concerne les quatre attributs du dieu Vishnou, qui est représenté, conventionnellement, avec quatre bras, chacune des mains tenant un symbole de l’un des quatre attributs (figure 5.5). Bhaskara demande : « Combien de variations de la forme de Vishnou obtient-on en échangeant la masse, le disque, le lotus et la conque ? » Chaque variation est l’un des arrangements des quatre objets. Si l’on note l’arrangement montré sur la figure 5.5 DCML, alors l’arrangement où le disque et la conque sont interchangés peut être noté CDML, etc. En utilisant cette notation, il est très facile de dresser une liste des possibilités comme suit. DCML
DCLM
DMLC
DMCL
DLMC
DLCM
CDML
CDLM
CMDL
CMLD
CLMD
CLDM
MDLC
MDCL
MCDL
MCLD
MLCD
MLDC
LMCD
LMDC
LCMD
LCDM
LDMC
LDCM
Ce sont ce que l’on appelle aujourd’hui les 24 permutations des lettres D, C, M et L. La liste est complétée de telle manière que l’on sait clairement comment le nombre 24 a été obtenu. Il y a 4 choix pour l’objet en première position et chaque rangée correspond à l’un de ces choix. Dans une rangée, on peut mettre n’importe quel autre des 3 objets restant en seconde position, puis les 2 objets restants en deuxième position. Le dernier objet doit être placé en quatrième position. Donc le nombre de permutations est 4 × 3 × 2 × 1 soit 24 au total. Bhaskara donnait une règle de calcul du nombre de permutations d’un nombre quelconque d’objets en multipliant tous les nombres en partant de 1 et se terminant par le nombre d’objets. Ainsi, dans le cas du dieu Sambhu, qui a dix bras et dix attributs, il trouvait que le nombre de permutations était : 1 × 2 × 3 × 4 × 5 × 6 × 7 × 8 × 9 × 10 = 3 628 800. 128
LE COMPTE Y EST !
La fin du Moyen Âge
Un autre problème du Lilavati est le nombre de combinaisons d’un nombre donné qui peuvent être formées à partir d’un ensemble d’un nombre donné d’objets. Par exemple, à partir des quatre attributs de Vishnu, on peut obtenir les combinaisons suivantes de deux d’entre eux : D et C
D et M
D et L
C et M
C et L
M et L
Notez que « D et C » est la même combinaison que « C et D ». L’ordre n’intervient pas donc il y a six combinaisons dans ce cas. Voici l’un des exemples de Bhaskara, pris dans une source nettement plus ancienne. Mathématicien, combien y a-t-il de combinaisons... avec... six saveurs différentes, douce, piquante, astringente, aigre, salée et amère, lorsqu’on les choisit par une, deux, trois, etc. ? Pour les combinaisons avec une saveur, la réponse est clairement 6. À première vue, le nombre avec deux saveurs semble être 6 × 5 = 30 puisque l’on peut choisir la première de six façons et la seconde (différente) de cinq façons. Mais (par exemple) « douce et piquante » est la même chose que « piquante et douce », donc le nombre est en réalité : 15. Bhaskara a donné une règle générale pour le nombre de combinaisons dans le cas de un, deux, trois, etc. Pour six objets, il décrit la règle sous la forme d’un tableau : 6
5
4
3
2
1
1
2
3
4
5
6
Par exemple, le nombre de combinaisons lorsque les objets sont pris parmi trois est obtenu en effectuant le produit des trois premiers nombres de la ligne du haut ci-dessus, divisé par le produit des trois premiers nombres de la ligne du dessous : 63534 = 20. 13 233 129
La fin du Moyen Âge
En utilisant cette règle, on peut vérifier que le nombre de combinaisons est : Taille :
6
5
4
3
2
1
Combinaisons :
6
15
20
15
6
1
On peut se demander pourquoi ce sujet a été introduit ici ; la raison est qu’il est en étroite relation avec l’algèbre des binômes qui a joué un rôle important dans la résolution des équations. Pour rendre cette relation claire, nous avons besoin d’un peu de notation moderne. De nos jours, le nombre de combinaisons de n objets pris r à r fois s’écrit n r
et on dit « r choisi parmi n ». La règle de Bhaskara pour six saveurs donne les réponses 6 = 6, 1
6 = 15, 2
6 = 20, 3
etc. Bhaskara a donné plusieurs exemples dans Lilavati et il est évident qu’il connaissait la règle générale du calcul du nombre de combinaisons de n objets pris r à r qui s’exprime par la formule n 3 (n – 1) 3 … 3 (n – r + 1) n . = r 13 2 3…3 r
Le lien entre ces « nombres de combinaisons » et l’algèbre des binômes est assez simple avec la notation correcte fournie. Mais en l’absence de notation algébrique, les fils historiques sont entremêlés. Nous avons expliqué comment les formules (a + b)2 = a2 + 2ab + b2, (a + b)3 = a3 + 3a2b + 3ab2 + b3
constituent la base des algorithmes de résolution des racines carrés et des racines cubiques. Pour cette raison, les nombres 1, 2, 1 et 1, 130
LE COMPTE Y EST !
La fin du Moyen Âge
3, 3, 1 sont finalement connus sous le nom de coefficients du binôme. Quand les arithméticiens du Moyen Âge ont continué à découvrir les méthodes de calcul des racines quatrièmes et cinquièmes, ils trouvèrent que les nombres importants étaient 1 4 6 4 1 et 1 5 10 10 5 1.
D’où l’émergence d’un schéma remarquable : 1 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1
Figure 5.6 | Le schéma triangulaire, tel qu’il apparaît dans un manuscrit chinois.
Dans ce tableau, chaque nombre correspond à la somme des nombres à gauche et à droite de la ligne au-dessus. Ce n’est certainement pas un hasard. Si l’on applique la même règle pour calculer la ligne suivante, on obtiendra : 1 6 15 20 15 6 1. 131
La fin du Moyen Âge
Ces nombres se trouvent à partir de la règle de Bhaskara pour le calcul des nombres de combinaisons de six objets, donnée plus haut ; ces nombres correspondent aussi aux coefficients qui figurent dans le calcul de la puissance sixième du binôme. (a + b)6 = a6 + 6a5b + 15a4b2 + 20a3b3 + 15a2b4 + 6ab5 + b6.
Maintenant, nous pouvons formuler une conclusion : les coefficients du binôme sont les nombres de combinaisons. La règle de formation d’une nouvelle rangée des coefficients du binôme peut être justifiée en utilisant une simple propriété des nombres de combinaisons52. Le schéma triangulaire remarquable formé des nombres de combinaisons a été trouvé dans des manuscrits chinois du XIIIe siècle (figure 5.6). Il est trouvé également dans des manuscrits islamiques. Ses véritables origines n’ont probablement jamais été connues et ce n’est qu’à l’arrivée du symbolisme algébrique que sa relation avec les coefficients du binôme a été complètement comprise. Aujourd’hui, ce schéma est connu sous le nom de triangle de Pascal, d’après le nom du mathématicien français du XVIe siècle qui a été le premier à publier un exposé en termes modernes. Mais il n’a pas été le premier ni le dernier à obtenir des résultats mathématiques surprenants sous la forme d’un tableau mémorable de nombres.
COMMENT GARDER UN SECRET : LA MÉTHODE MÉDIÉVALE La technique et la science de la combinatoire ont de nombreuses applications. Elles se sont développées de manière aléatoire, souvent 52. En notation moderne, la propriété de base du tableau triangulaire est
n = n -1 + n -1 2 r -1 2 La démonstration dépend des combinaisons de n objets pris r à r avec r membres divisés en deux classes : ceux contenant un objet donné et ceux qui ne contiennent pas cet objet.
132
LE COMPTE Y EST !
La fin du Moyen Âge
en réponse à des questions qui n’étaient pas de grande importance en mathématiques. L’un de ces problèmes séculaires était l’envoi de messages secrets. Par exemple, l’auteur romain Suétone nous apprend que Jules César avait l’habitude d’envoyer des instructions écrites aux commandants de son armée. Malheureusement, l’hypothèse selon laquelle ses ennemis étaient illettrés était fausse et lorsque les barbares interceptaient un message, ils savaient l’interpréter. D’où le fait que César avait un système pour dissimuler ses instructions, mais il voulait être certain que ses commandants les comprendraient. C’est ce qui sera appelé, simplement, un code secret, ou, en terminologie moderne, un système de cryptage ou cryptosystème53. Les alphabets, comme le grec et le latin, étaient utilisés dans de nombreuses méthodes ingénieuses pour essayer de protéger un secret. Certaines de ces méthodes n’étaient pas très efficaces, par exemple la méthode qui consistait à écrire chaque mot à l’envers, soit ATTAQUE qui devenait EUQATTA. Le système de cryptage de César était plus efficace. D’après Suétone, il remplaçait chaque lettre par celle qui suivait trois places plus loin dans l’ordre alphabétique standard, ainsi ATTAQUE devenait DWWDTXH. Un avantage de cette méthode est que tout nombre, pas seulement trois, peut être utilisé. Le nombre choisi s’appelle la clé et Suétone dit qu’Auguste, le neveu de César, utilisait un comme clé au lieu de trois. Il est fort possible que César lui-même changeât régulièrement de clé : s’il changeait de clé chaque jour de la semaine, ses instructions étaient plus sécurisées. Malheureusement, la méthode de César avait une faiblesse fatale. Nous ne devrions pas le blâmer trop facilement car, au cours des deux derniers millénaires, nous avons découvert que tous les systèmes de cryptage avaient leurs limites. Pour cette raison, il y avait une lutte permanente pour en faire de meilleurs, poussée par la 53. Il existe de nombreux sites internet traitant de la cryptographie, mais ils sont de qualité très variable et il est préférable de recourir à de bons livres tels que celui de Simon Singh, The Code Book (Londres, Fourth Estate, 2000). La référence au système de César se trouve dans Lives of Caesars écrit par Suétone au IIe siècle après J.-C. 133
La fin du Moyen Âge
découverte que tout nouveau système était destiné finalement à échouer. Comme nous le verrons, les idées mathématiques ont joué un rôle croissant dans cette lutte. Commençons par examiner de plus près le système de cryptage de César. En utilisant l’alphabet anglais de 26 lettres, sa méthode consistait à choisir un nombre k compris entre 1 et 25 et à remplacer chaque lettre par celle qui est à k places plus loin dans l’ordre alphabétique. Cette règle s’étend de manière évidente aux lettres de la fin de l’alphabet ; par exemple, pour k égal à 5 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
sont remplacées par F G H I J K L M N O P Q R S T U V W X Y Z A B C D E
En utilisant cette règle, si l’expéditeur voudrait crypter le message SEE YOU TOMORROW, il obtiendrait XJJ DTZ YTRTWWTB. Le destinataire voulu est censé connaître la clé, donc il lui est possible de décrypter le message en se servant de la règle inverse. Par ailleurs, si quelqu’un interceptant le message ne connaît pas la clé, le décodage n’est pas aussi facile. La principale leçon que l’on tire de l’histoire est qu’il est futile d’essayer de dissimuler le système de cryptage : la sécurité du système doit dépendre seulement du choix de la clé. Ainsi, imaginez que vous Barbara/Barbarus ayez intercepté un message crypté comme SGZNY OY MUUJ LUX EUA. Vous connaissez le système utilisé, donc votre problème est de trouver quelle clé a été employée dans ce message particulier. Comme seule possibilité, nous avons les nombres de 1 à 25 ; nous essayons ces clés tour à tour en nous rappelant que si la clé est k, nous devons remonter de k places dans l’alphabet pour trouver le message original. Pour commencer, nous essayons : k = 1, donne RFYMX NX... k = 2, donne QEXLW MW...
134
LE COMPTE Y EST !
La fin du Moyen Âge
Il est clair que la clé n’est ni 1 ni 2 car si c’était le cas, le message original n’aurait pas de sens ; il n’est pas nécessaire de regarder tout le message pour établir ce fait. Donc on doit continuer à tester les clés k = 3, 4, ..., 25 jusqu’à trouver un message ayant du sens54. La méthode qui consiste à essayer toutes les clés est la méthode de recherche exhaustive. Elle se solde par une réussite dans le cas du système de César, car le nombre de clés est petit, mais elle peut échouer pour des raisons pratiques si le nombre de clés est nettement plus grand. Donc il est important de pouvoir modifier le système pour atteindre l’objectif de protection du secret. La règle de substitution des lettres ne doit pas être aussi simple que celle de César ; par exemple, le mot PERSONALITY définit une permutation dans laquelle les lettres A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
sont remplacées par P E R S O N A L I T Y B C D E F G H J K M Q U V W X Z
Ce type de règle est utile puisque l’expéditeur et le destinataire peuvent mémoriser le mot clé : il n’a pas à être écrit. Mais toute permutation des lettres devrait l’être à condition qu’il y ait des moyens sécurisés partagés entre l’expéditeur et le destinataire. Le nombre de clés possibles est grand : en réalité, c’est le nombre de permutations de 26 lettres qui, d’après la règle de Bhaskara, est 26 × 25 × 24 × ... × 3 × 2 × 1. Ce nombre est gigantesque, plus grand que le nombre de microsecondes qui se sont écoulées depuis la formation de la Terre, donc une attaque par une recherche exhaustive dépasse nos capacités de barbares55.
54. MATHS IS GOOD FOR YOU. 55. Vous pouvez objecter réellement que certaines permutations ne sont pas acceptables dans un cryptage, parce que toutes les lettres ne sont pas changées : par exemple, la permutation dans laquelle seules les lettres Y et Z sont échangées et les autres inchangées. Cependant, un célèbre résultat de la combinatoire moderne donne le nombre exact de permutations dans lesquelles toutes les lettres sont changées et ce nombre est gigantesque. 135
La fin du Moyen Âge
« Celui qui dévoile un secret qu’il devrait garder doit garder secret le fait qu’il l’a dévoilé. » Il s’agit d’un vieux dicton qui s’applique avec une pertinence particulière aux activités de ceux qui conçoivent des systèmes de cryptage, ainsi qu’à ceux qui les attaquent. C’est pourquoi les textes historiques sont très lacunaires. Cependant, on peut déduire qu’un système de cryptage basé sur des permutations arbitraires était d’usage fréquent vers 850 après J.-C., car il existe une preuve documentaire de cette époque. Cette preuve provient du monde islamique où un nombre important de manuscrits arabes ont été découverts56. Le manuscrit principal a été mis au jour en 1987. Il a été écrit par le philosophe al-Kindi (803-873) qui a vécu la plus grande partie de sa vie à Bagdad et écrit effectivement plusieurs centaines de livres. Son ouvrage sur les systèmes de cryptage donne de nombreuses idées qui sont encore importantes aujourd’hui ; il décrit en particulier une méthode d’attaque de systèmes basés sur des permutations de lettres. La méthode d’al-Kindi est fondée sur l’observation du fait que dans tout message écrit, les lettres se présentent avec des fréquences différentes. Par exemple, en anglais moderne, la lettre E se retrouve très souvent, tandis que la lettre J est relativement rare. De plus, il apparaît que les fréquences sont relativement constantes quelle que soit la source du message. Les valeurs typiques de ces fréquences exprimées comme nombre d’occurrences par 10 000 symboles en anglais sont présentées ci-dessous. A
B
C
D
E
F
G
H
I
765 128 289 418 1243 296 143 582 669 N
O
P
748 794 237
Q 7
R
S
T
U
V
J
K
8
41
W
X
Y
Z
29
166
9
674 650 901 300 109 155
L
M
370 269
56. Les travaux en arabe sur ce sujet sont développés par I. A. Al-Kadit, « The origins of cryptology: the Arab contributions », Cryptologia 16 (1992) 97-126.
136
LE COMPTE Y EST !
La fin du Moyen Âge
Ce tableau est la base de l’attaque par la méthode connue sous le nom d’analyse des fréquences. Dans tout message de longueur raisonnable, les symboles interviennent avec des fréquences proches de celles données dans le tableau. Cela signifie que les formes cryptées avec certaines lettres peuvent être identifiées très aisément. Par exemple, il est probable que E soit la lettre qui intervienne le plus fréquemment dans le message original, et donc la lettre qui se retrouve le plus fréquemment dans le message crypté est probablement celle qui représente E. Les représentants des autres lettres qui apparaissent fréquemment peuvent être analysés de la même façon, bien que quelques essais et erreurs puissent être nécessaires. En résumé, l’attaque par l’analyse de fréquences peut s’effectuer en trois étapes. 1. Compter les fréquences des symboles dans le message crypté. 2. Comparer ces données avec les fréquences des tableaux standards. 3. Tester les correspondances probables des symboles jusqu’à ce qu’un message intelligible soit trouvé. Cette méthode d’utilisation des données pour justifier une conclusion pratique est typique de ce que l’on appelle aujourd’hui la statistique. Naturellement, la fiabilité de la conclusion dépend de deux facteurs, la précision des données et la structure des données sousjacentes. La collecte des données à des fins administratives est une très ancienne pratique, mais son application aux messages cryptés constitue certainement l’un des premiers exemples de l’apparition d’une structure mathématique. Les écrits d’al-Kindi et d’autres confirment que la théorie et la pratique des systèmes de cryptage étaient connues dans le monde islamique avant la fin du Ier millénaire. Petit à petit, cette connaissance s’est infiltrée dans les pays chrétiens, conséquence probable de la guerre plutôt que du commerce. Durant cette période, les concepteurs de systèmes de cryptage étaient orientés principalement vers la défense contre l’attaque par l’analyse de fréquences. De nombreuses façons étaient proposées pour le faire, mais la plupart étaient peu pratiques 137
La fin du Moyen Âge
car elles étaient trop complexes : si le destinataire concerné ne pouvait pas décrypter facilement le message, le système était incommode. Toutefois, au XVe siècle, une approche plus fructueuse émergea. L’idée de base était de mettre en place un système dans lequel tout symbole tel que E ne soit pas toujours crypté de la même manière. On peut faire cela en utilisant une règle au sein de laquelle la clé change suivant une règle connue seulement de l’expéditeur et du destinataire. L’un des premiers systèmes de ce type a été inventé en 1467 par Léon Battista Alberti, un Italien connu pour ses écrits sur l’architecture et la théorie de la perspective. Il proposa que l’expéditeur et le destinataire disposent de la même copie d’un disque avec deux anneaux concentriques comme ceux de la figure 5.7. Dans cet exemple, chaque anneau contient 24 lettres ; les lettres manquantes sont supposées intervenir rarement voire pas du tout. Les deux anneaux peuvent tourner l’un par rapport à l’autre et ils peuvent être arrêtés dans une position correspondant à une clé choisie. Avec ce dispositif, il est facile de concevoir des procédures dans lesquelles les clés changent de la façon requise : par exemple, l’anneau intérieur pourrait tourner dans le sens des aiguilles d’une montre d’un intervalle après chaque segment de cinq symboles.
I
c
q
h
k w a r n
N O L M P
s
u
y o x b e g
K
A B Y Z C X p l
G H E F
f
Q
D
t
i m z
d
T U R S W
Figure 5.7 | Le disque d’Alberti. Les anneaux tournent indépendamment et chaque position détermine une clé de cryptage.
138
LE COMPTE Y EST !
La fin du Moyen Âge
Une autre méthode similaire à celle d’Alberti, mais qui ne requiert aucun équipement spécial, a été suggérée par Giovan Battista Bellaso. Elle est nommée habituellement d’après Blaise de Vigenère, qui a découvert essentiellement la même méthode quelques années plus tard. Elle utilise la méthode de décalage de chaque lettre d’un certain nombre de places permettant une variation en fonction de la position de la lettre dans le texte. Les différents décalages sont déterminés par un mot-clé. Si le mot-clé est CHANGE, les décalages sont 3, 8, 1, 14, 7, 5, correspondant aux positions des lettres de l’alphabet C, H, A, N, G, E. En utilisant ce mot-clé, on décompose le message en blocs de six lettres et on applique un décalage de 3 à la première lettre de chaque bloc, un décalage de 8 à la deuxième lettre, etc. Le système de Vigenère a comme effet de régulariser les fréquences des lettres dans le message crypté. Par exemple, supposons que le message original contienne des lettres avec leurs fréquences usuelles, comme données dans notre tableau et que le mot clé soit CHANGE. Alors la lettre A dans le message crypté représente l’une des lettres X S Z M T V car ce sont les lettres qui arrivent respectivement 3, 8, 1, 14, 7, 5 places avant A dans l’alphabet. Donc on peut s’attendre à ce que A se présente à peu près 1 (29 + 650 + 9 + 269 + 901 + 109) 6
fois dans chaque groupe de 10 000 lettres, ce qui donne environ 358. Quand on calcule les fréquences attendues pour les autres lettres de la même façon, on trouve que les réponses sont assez proches. En d’autres termes, les irrégularités qui rendent possible l’analyse de fréquences ont été lissées. Pendant plusieurs siècles, on a pensé que le système de Vigenère était indéchiffrable et on l’appelait le chiffre indéchiffrable. Mais nous le verrons à la fin de notre histoire, comme tous les systèmes de cryptage, il a été finalement cassé. Le déchiffrement fut le résultat de l’utilisation de méthodes statistiques plus sophistiquées, rendues possibles par les avancées du langage mathématique. 139
6 Un nouveau monde en mathématiques Après plusieurs siècles d’obscurantisme, le XVIIe siècle fut une période de grande clarification dans la théorie et la pratique des mathématiques. En tant que personne instruite vivant à cette époque, vous auriez été capable de découvrir de nombreuses idées nouvelles en lisant des livres en langage courant plutôt qu’en latin. Par conséquent, vous auriez été conscient du fait que les avancées en mathématiques se retrouvaient dans de nombreux domaines de l’activité humaine et nous aideraient également à comprendre les grandes merveilles de l’Univers.
MESURER ET CALCULER En 1584, la reine Élisabeth a envoyé Sir Walter Raleigh dans le Nouveau Monde dans le but d’étendre les territoires des colonies anglaises57. Le premier problème de Raleigh consistait à déterminer 57. Le brevet de Sir Walter Raleigh se trouve sur le site avalon.law.yale.edu/16th\_ century/raleigh.asp (consulté le 1er juin 2015). 141
Un nouveau monde en mathématiques
comment s’y rendre (et en revenir) sans risque. Finalement, il sollicita l’aide d’un jeune diplômé d’Oxford, Thomas Harriot, qui s’avéra être un génie des mathématiques. Harriot avait étudié la théorie mathématique de la projection des cartes, conçu des instruments d’observation et accompagné Raleigh dans l’un de ses voyages. La navigation en mer dépend de mesures de plusieurs sortes et de leur utilisation comme données pour des calculs destinés à déterminer la position d’un navire. La branche de la géométrie appelée trigonométrie était la base de ces calculs58. Mais au XVIe siècle, la navigation n’était pas une science exacte : un officier de l’un des premiers voyages de Raleigh a rapporté que les navigateurs étaient souvent en désaccord d’une centaine de miles. Il existait des cartes avec des indications de latitude et de longitude, mais malheureusement les cartes étaient de peu d’utilité au milieu de l’océan Atlantique. Le compas magnétique était utilisé pour décider du cap à suivre, mais ici aussi de nombreuses difficultés subsistaient. Thomas Harriot posait ces problèmes en termes mathématiques et était capable de tirer de ses résultats un avantage pratique. L’une de ses contributions a été de construire des tables, qu’il appelait « parties méridiennes », qui indiquaient aux navigateurs une façon plus précise d’estimer le cap souhaité. La fabrication de ces tables exigeait une masse importante de calculs et à cet égard, il était aussi capable d’apporter des améliorations significatives. Plus tard, ses méthodes furent appliquées, plus généralement, aux tables arithmétiques. À la fin du XVIe siècle, l’arithmétique jouait aussi un rôle important dans les affaires ordinaires. Les transactions financières impliquées dans le commerce devenaient de plus en plus complexes : la durée d’un prêt était souvent calculée en semaines ou en jours, les paiements partiels ou les remboursements étaient permis et le taux d’intérêt variait. Les instruments financiers tels que les baux et les annuités engendraient des
58. L’histoire de la trigonométrie est racontée merveilleusement par Glen Van Brummelen dans The Mathematics of the Heavens and the Earth (Princeton, Princeton University Press, 2009).
142
LE COMPTE Y EST !
Un nouveau monde en mathématiques
difficultés similaires. Par conséquent, il y avait une demande pour des mathématiciens qualifiés, en particulier pour ceux capables d’établir des tables fiables et assister ceux qui devaient faire des calculs. Un tel travail figurait dans Tafelen van Interest (1582), écrit par Simon Stevin, comptable et ingénieur, qui vivait à Bruges. Le même auteur écrivit De Thiende (1585), un ouvrage d’une autre catégorie. Dans ce livre, il défendait l’utilisation des fractions décimales et expliquait pourquoi elles étaient supérieures dans les calculs aux « vulgaires » fractions, comme 17/44, qui étaient employées59. Bien que Léonard de Pise ait donné les règles pour effectuer des calculs avec de vulgaires fractions depuis 1202, il était certain que peu de gens en comprenaient les raisons sous-jacentes. Il est très surprenant que les livres scolaires de l’époque offrissent peu ou pas d’explications. L’extrait montré à la figure 6.1 est typique.
Figure 6.1 | Comment ajouter des fractions, d’après Hand-maid to Arithmetick de Nicholas Hunt (1633).
59. Une raison de préférer les décimaux aux fractions est qu’il est plus facile de comparer des nombres. Par exemple, préféreriez-vous être l’un des 11 ayant à se partager 25 000 dollars équitablement, ou l’un des 9 se partageant 20 000 dollars équitablement ? 143
Un nouveau monde en mathématiques
Stevin suggérait que l’on pouvait faire plus simple, en particulier pour les utilisateurs de tables, si tous les nombres étaient représentés avec la même puissance de dix en dessous. Quand cela fut fait, l’addition des fractions n’était pas plus difficile que l’addition des nombres entiers et la règle était évidente. Par exemple, les nombres 17/44 et 15/26 peuvent être représentés par 386363 1000000
et
576923 1000000
et leur somme peut être calculée simplement en ajoutant 386 363 et 576 923. La réponse est 963 286 donc la somme donne 963286 . 1000000
La notation a été améliorée en utilisant le séparateur décimal et la réponse s’écrit maintenant 0,963 286 ; d’autres chiffres peuvent être ajoutés si une meilleure approximation est nécessaire. Plusieurs autres mathématiciens, outre Stevin, avaient proposé des suggestions similaires ; en réalité, l’idée peut déjà se trouver dans les œuvres d’alUqlῑdisῑ décrites au chapitre 4. Mais le livre de Stevin a fait office de catalyseur et les fractions décimales d’outil standard de l’arithmétique. Le fait que les algorithmes arithmétiques pour la multiplication et la division soient considérablement plus complexes que ceux de l’addition et de la soustraction a servi de stimulant à une autre invention qui a révolutionné la technique du calcul. L’idée est très simple. À chaque nombre, on en assigne un autre que l’on appelle son logarithme. Ces logarithmes sont calculés et disponibles dans des tables. Pour multiplier deux nombres donnés, on cherche leurs logarithmes dans la table et on les ajoute. La réponse est le nombre dont le logarithme correspond à cette somme. Pour diviser un nombre par un autre, on soustrait le logarithme du second nombre du logarithme du premier. De nombreux calculs de ce genre étaient nécessaires pour 144
LE COMPTE Y EST !
Un nouveau monde en mathématiques
établir des tables commerciales. Par exemple, l’œuvre de Pegolotti sur les taux de change, discutée au chapitre 5, contient un calcul de la multiplication de 348 par 160 suivie de la division du produit par 34. Avec une table de logarithmes, le problème se réduit à calculer log(348) + log(160) – log(34).
La réponse attendue est le nombre dont le logarithme est le résultat de ce calcul et le nombre peut être trouvé dans la table. La première personne à concevoir un tel système était un noble écossais, John Napier. Sa table de logarithmes a été publiée en 1614. Elle était destinée plus particulièrement à certains calculs trigonométriques, et le système était complexe, mais c’est Napier qui a laissé son nom à l’invention originale et au mot logarithme. La création d’un système plus commode est arrivée quelques années plus tard. Henry Briggs, professeur au Gresham College à Londres, a discuté du problème avec Napier et ils se mirent d’accord sur quelques détails techniques. Ils décidèrent que pour tout couple de nombres a et b, les logarithmes de a, b et ab devaient satisfaire la règle de base : log(ab) = log(a) + log(b).
Mais cette condition n’est pas suffisante pour définir uniquement le logarithme, il en faut un peu plus. Puisque multiplier n’importe quel nombre par 1 n’a aucun effet, le nombre 1 devrait être interprété par ajouter 0. En d’autres termes, le logarithme de 1 devrait être 0. Mais quel nombre devait être choisi pour que son logarithme soit 1 ? Comme la notation décimale pour les nombres et les fractions commençait à être largement utilisée, Napier et Briggs se mirent d’accord sur le fait que le choix évident était 10. C’était l’origine de ce qui devint connu sous le nom de logarithmes communs. Compiler les tables de logarithmes communs était une tâche ardue, mais leur utilité pour les calculs en navigation et en astronomie fut immédiatement reconnue et fin 1620, des tables étaient disponibles pour les nombres de 1 à 100 000. Une autre amélioration s’avérait 145
Un nouveau monde en mathématiques
nécessaire. Comme on l’a fait remarquer plus haut, la dernière étape consiste à trouver le nombre dont le logarithme est le résultat d’additions (ou de soustractions) des logarithmes des nombres impliqués. Cela peut être fait en parcourant la table de logarithmes à l’envers. Mais il est nettement plus commode de disposer d’une table établie dans ce but, une table dite d’antilogarithmes. Par conséquent, en 1640, une table fiable d’antilogarithmes fut compilée en utilisant les méthodes développées à l’origine par Thomas Harriot dans son ouvrage sur la navigation. Pendant 300 ans, ces tables de logarithmes et d’antilogarithmes ont été utilisées constamment, dès que des calculs arithmétiques étaient nécessaires dans la science, l’industrie, le commerce.
VERS LA LIMITE Thomas Harriot avait lu l’ouvrage de Stevin. Sa collaboration avec Sir Walter Raleigh s’est poursuivie au cours des années 1590, après avoir été recruté par le comte de Northumberland. Dans des conditions très agréables, il a pu poursuivre ses intérêts mathématiques, délivré des tracasseries financières, et il fit un bon usage de son temps. Le 26 juillet 1609, il fut le premier à réaliser un dessin de la Lune vue à travers un télescope, devançant Galilée de quatre mois. Il a produit également d’importantes notes sur une variété de sujets mathématiques. Sa situation confortable lui permettait de ne pas écrire expressément ses notes et rien n’a été publié de son vivant. Heureusement, de nombreux écrits privés ont survécu et ils prouvent qu’il était certainement l’un des plus éminents savants de son temps60.
60. Les articles d’Harriot sont disponibles en partie sur le site internet du projet European Cultural Heritage Online projet (ECHO), echo.mpiwg-berlin.mpg.de (consulté le 1er juin 2015).
146
LE COMPTE Y EST !
Un nouveau monde en mathématiques
Figure 6.2 | Transcription de notes de Harriot sur un problème d’intérêts composés. © The British Library, Add Ms 6782f.67.
Parmi les documents d’Harriot, il en existe un qui traite des intérêts composés (figure 6.2). Le fait de prendre des intérêts sur les intérêts était une pratique courante du temps de Pegolotti, et Harriot apporta une contribution hautement significative, pas simplement pour son contenu spécifique, mais aussi parce qu’elle présageait des découvertes plus importantes au XVIIe siècle. Comme on l’a vu, Harriot lui-même ne donnait presque aucune explication de ses travaux, mais avec du recul, on peut comprendre ce qu’il faisait. Sa motivation était d’observer que si l’intérêt était ajouté plus d’une fois par an, mais au même taux équivalent, alors le rendement serait plus élevé. Il notait le taux annuel d’intérêt 1/b (par exemple, b = 20 correspond à 5 %), ainsi une livre investie pendant un an aura un rendement de 1 + 1/b. Mais si l’intérêt est ajouté sur deux 147
Un nouveau monde en mathématiques
semestres au taux de 1/2b, d’après la formule du binôme, le rendement à la fin d’une année serait de (1 +
1 2 1 1 2 ) =1+2×( )+( ). 2b 2b 2b
On peut se convaincre que cela est légèrement supérieur à 1 + 1/b. Si l’intérêt3 est ajouté trois fois par an au taux de 1/3b, il vient (1 + 1/3b) qui est encore plus grand, etc. La question est : que se passe-t-il lorsque la composition est effectuée avec des fréquences de plus en plus grandes, mais avec le même taux ? En particulier, le rendement peut-il devenir arbitrairement grand ? Pour attaquer ce problème, Harriot considère un cas où l’intérêt est ajouté n fois par an à un taux équivalent à 1/nb. Supposons que la pratique normale est de calculer les intérêts sur une année, 2 ainsi n est un et le prêt initial est b livres Donc le rendement après sept ans est donné dans la première ligne du calcul d’Harriot ; on devrait écrire : b2(1 +
1 7 35 35 21 7 1 ) = b2 + 7b + 21 + + 2 + 3 + 4 + 5 . b b b b b b
Les nombres 1, 7, 21, 35, 35, 21, 7, 1 sont les coefficients du binôme. Il est clair que Harriot était familier de ces nombres ; en réalité, la formule algébrique pour les calculer figure dans plusieurs de ses documents, y compris celui-là. Les deuxième et troisième lignes du manuscrit d’Harriot donnent le résultat de l’application de la formule du binôme dans les cas où n = 2 et n = 3. Puis il cherche ce qui se produit si n peut devenir arbitrairement grand : c’est ce que l’on appelle maintenant les intérêts composés continus. Pour la valeur particulière b = 10, il obtient la série de termes 100 +
148
LE COMPTE Y EST !
70 49 343 2 401 16 807 + + ... + + + 1 2 60 2 400 120 000
Un nouveau monde en mathématiques
Il semble qu’Harriot ait calculé quelques termes de plus et qu’il ait remarqué qu’ils devenaient rapidement de plus en plus petits. Donc il convertissait ses termes en livres, shillings et pence et il les ajoutait, concluant que 100 livres prêtées à 10 % pendant sept ans avec intérêts continus donneraient 201 livres, 7 shillings et 6,062 05 pence. Le point important à relever est que le rendement ne devient pas arbitrairement grand : même si l’on a un nombre infini de termes, leur somme a une limite bien définie qui peut être calculée avec un degré quelconque de précision. Harriot lui-même fit le commentaire sibyllin « pas 7/100 », suggérant qu’il avait estimé les termes restants et qu’il était conscient que la valeur réelle de la somme n’excédait pas 201 livres, 7 shillings et 6,07 pence. D’un point de vue théorique, des séries infinies comme celle-là intervenaient dans de nombreux autres contextes, et les mathématiciens avaient besoin de méthodes fiables pour les traiter.
ALGÈBRE ET GÉOMÉTRIE COMBINÉES L’introduction des notations symboliques menait à une compréhension plus claire des procédures arithmétiques, telles que l’addition des termes du problème des intérêts composés d’Harriot. Vers 1630, il était courant de représenter une quantité inconnue par une lettre comme x et d’utiliser les signes + (plus), – (moins) et = (égal), comme on le fait aujourd’hui. Les règles opératoires avec ces symboles étaient bien comprises et l’époque était propice à l’extension des méthodes algébriques à la géométrie. Le personnage central fut René Descartes, né en France en 1596. Vers 1619, il décida de consacrer sa vie aux fondements de la connaissance. La majeure partie de son œuvre était de nature philosophique et de nombreux livres ont été écrits sur ce sujet. Mais il avait étudié aussi les mathématiques et son célèbre Discours de la méthode (1637) contient une annexe importante intitulée La Géométrie. Dans cette œuvre, Descartes montrait comment l’algèbre et la géométrie 149
Un nouveau monde en mathématiques
pouvaient être unifiées, en utilisant les symboles algébriques pour représenter des quantités géométriques. Cette découverte a eu d’énormes implications, bien qu’en soi, l’idée de base n’ait pas été nouvelle. De même que la position d’un navire en mer peut être spécifiée par sa latitude et sa longitude, la position d’un point dans un plan peut être spécifiée par deux nombres, disons x et y. À l’époque, il devint conventionnel de définir x et y comme les distances à deux droites se coupant à angle droit et de nos jours, les deux droites sont habituellement orientées, l’horizontale vers la droite (l’axe des x) et la verticale vers le haut (l’axe des y) (figure 6.3). En l’honneur de Descartes, les nombres x et y sont appelés coordonnées cartésiennes. Mathématiquement, il n’y a aucune distinction entre un point P et ses coordonnées (x, y).
x
P
y
Figure 6.3 | Coordonnées cartésiennes telles qu’elles sont définies aujourd’hui.
Descartes et d’autres se sont mis à étudier ce qui se produirait si un point de coordonnées (x, y) pouvait se déplacer de telle sorte que x et y satisfassent une relation définie par une équation algébrique. Par exemple, pour m un nombre fixé, une équation de la forme y = mx signifie que y est égal à une constante m que multiplie x. Dans ce cas, le point (x, y) sera sur une droite, dont des points caractéristiques sont (0, 0), (1, m), (2, 2m), etc., comme le montre la figure 6.4(1). Plus généralement, une équation reliant x et y définira une courbe, consistant en des points dont les coordonnées satisfont l’équation. 150
LE COMPTE Y EST !
Un nouveau monde en mathématiques
De nombreuses courbes utiles peuvent être définies de cette façon : par exemple, pour définir un cercle, on peut utiliser le fait que tous les points sur la courbe sont à la même distance r (le rayon) du centre. En prenant comme centre le point (0, 0) et x, y comme point courant sur le cercle, le théorème de Pythagore implique que x2 + y2 = r2, qui est alors l’équation définissant le cercle, comme le montre la figure 6.4(2).
y = mx
x
x2 + y2 = r2
x r y
y
(1)
(2)
Figure 6.4 | Deux courbes et leurs équations en coordonnées cartésiennes.
La perspective d’utiliser les méthodes algébriques pour étudier les propriétés des courbes en général était une forte motivation pour Descartes. Les courbes étudiées par les Grecs et leurs successeurs avaient été définies géométriquement, mais dorénavant les courbes pouvaient être définies algébriquement. L’une des nouvelles courbes étudiées par Descartes était définie par l’équation x3 + y3 = 6xy ; elle est connue sous le nom de folium de Descartes. À l’époque, il n’était pas évident d’ébaucher le dessin de cette courbe. La méthode standard (encore enseignée dans les écoles) qui consiste à choisir quelques valeurs de x et à calculer les valeurs correspondantes de y est inefficace ici car l’équation en y est généralement cubique. Par exemple, la coordonnée y d’un point de coordonnée x égal à 1 doit satisfaire 151
Un nouveau monde en mathématiques
1 + y3 = 6y. Il est probable que Descartes lui-même ait commencé par la méthode essai et erreur pour trouver des points sur la courbe tels que (0, 0), (3, 3), (4/3, 8/3) et (8/3, 4/3). Après cela, les choses sont devenues délicates. Cependant, il a été capable de se convaincre que pour les valeurs positives de x et y la courbe est une boucle comme le montre la figure 6.5. Mais il semble qu’il se soit trompé pour l’image complète, car il pensait que la courbe entière avait quatre boucles similaires, ressemblant ainsi à une fleur à quatre feuilles symétriques. En réalité, la courbe a seulement une boucle et le tracé correct est donné dans les notes61.
Figure 6.5 | Le folium de Descartes.
Descartes semble avoir utilisé le folium pour tester son programme de résolution de problèmes géométriques par des méthodes algébriques. Un problème de ce type, avec de nombreuses applications, était la construction d’une droite tangente à une courbe en un point donné : c’est-à-dire une droite qui touche la courbe sans la traverser. 61. Une façon précise d’établir les propriétés de la courbe est de considérer ses intersections avec la droite d’équation y = tx pour différentes valeurs de t. L’algèbre élémentaire conduit à des formules simples pour les coordonnées : x = 6t/(1 + t3) et y = 6t2/(1 + t3). On ne sait pas si Descartes ou Fermat utilisaient cette méthode.
152
LE COMPTE Y EST !
Un nouveau monde en mathématiques
Dans le cas d’un cercle, la construction est facile, parce que la droite tangente est perpendiculaire au rayon en un point donné, elle peut donc être construite par des méthodes à la règle et au compas des géomètres classiques. Toutefois, c’est un cas très particulier. Descartes découvrit une méthode algébrique plus générale pour trouver les tangentes mais très complexe et à l’époque (1637) où il écrivait La Géométrie, on lui avait dit qu’une meilleure méthode avait été inventée par Pierre de Fermat (1601 ?–1665), un mathématicien remarquable dont nous parlerons beaucoup par la suite. Au début, Descartes ne fut pas impressionné par la méthode de détermination des tangentes de Fermat, car il pensait qu’elle ne pouvait être utilisée que dans des circonstances particulières. Ainsi, il défiait Fermat d’appliquer sa méthode au folium, s’attendant pleinement à ce qu’il échoue. Mais Descartes avait tort : Fermat a résolu le problème presque immédiatement et Descartes s’est excusé, plutôt à contrecœur. Pour Descartes, le folium constitue aussi un bon test pour la résolution d’un problème général très étudié au XVIIe siècle. Quelle est l’aire limitée par la boucle du folium ? L’histoire remarquable de la façon dont ce problème a été résolu est notre prochain sujet.
RETOUR VERS LE FUTUR : ARCHIMÈDE Le problème du calcul de l’aire d’un domaine entouré par une courbe présente de grandes difficultés. Les Grecs ont échoué à résoudre la quadrature du cercle, ils n’ont pas pu trouver une construction à la règle et au compas d’un carré dont l’aire est égale à celle d’un cercle. En réalité, ce problème n’est pas résoluble. Cependant, Archimède a réussi une nouvelle approche pionnière de tels problèmes, et nous sommes prêts maintenant à considérer l’un de ses plus grands résultats. Il concerne le calcul de l’aire d’une région dont la frontière est constituée d’une droite et d’une partie d’une autre courbe, une parabole. La parabole était définie géométriquement par les Grecs, et nombre de ses propriétés étaient connues, de sorte qu’Archimède 153
Un nouveau monde en mathématiques
pouvait les utiliser dans ses calculs. Sa méthode était particulièrement remarquable car elle fournissait une réponse exacte, sans employer d’algèbre.
B A
C
Figure 6.6 | Méthode d’Archimède de détermination de l’aire d’un domaine borné par une parabole et une droite.
Archimède, lors d’une première étape, construisait un triangle dont la base était la ligne droite donnée. Le sommet du triangle était situé sur la parabole et avait la plus grande hauteur possible soumise à cette contrainte. L’aire A du triangle est le demi-produit de la base par la hauteur. Puis Archimède construisait deux autres triangles de la même manière en prenant comme bases les deux côtés du premier triangle, comme le montre la figure 6.6. L’étape cruciale est de montrer que la somme des aires de ces deux triangles B et C est le quart de A. Donc l’aire totale A + B + C est égale à 5A/4. En répétant la construction, on obtient quatre autres triangles dont la somme des aires est (B + C)/4, soit A/16. L’aire totale est (1 +
1 1 21 + )A = A. 4 16 16
L’étape suivante consiste à ajouter un terme A/64 et le total devient 85A/64. Nous devons nous souvenir qu’Archimède n’utilisait pas les 154
LE COMPTE Y EST !
Un nouveau monde en mathématiques
nombres indo-arabes et qu’il ne disposait pas de la notation algébrique pour l’aider à comprendre le comportement de la suite d’approximations : A, 5A/4, 21A/16, 85A/64. Néanmoins, il était capable de montrer que lorsque le nombre de termes augmente, l’aire totale approche 4A/3 ; il n’exprimait pas cet argument de cette façon, mais sa conclusion était correcte : l’aire calculée correspond aux quatre tiers de l’aire du triangle inscrit62. L’œuvre d’Archimède était très en avance sur son temps. Une difficulté majeure était la justification de l’association d’un nombre défini 4A/3 à la somme d’un nombre infini de termes. À la fin du Moyen Âge, les érudits ont beaucoup écrit sur la notion d’infini, mais peu d’entre eux ont considéré le problème consistant à trouver la somme « à l’infini » d’une série de termes. L’absence d’une notation symbolique claire avait pour conséquence des conclusions obscures, et ce n’est qu’à la fin du XVIIe siècle que des progrès substantiels ont été accomplis.
FERMAT ET LA NOUVELLE ALGÈBRE Au XVIIe siècle, il y eut un intérêt renouvelé pour le problème du calcul des aires de domaines bornés par des lignes courbes. Cela était connu sous le nom du problème de la « quadrature ». La réussite de Fermat dans la résolution du problème de la tangente pour le folium de Descartes l’avait encouragé à s’attaquer au problème de la quadrature pour cette courbe. On sait qu’il a réussi finalement à trouver l’aire intérieure à la boucle du folium, mais sa méthode ne fut publiée qu’en 1679, longtemps après sa mort, survenue en 1665. Cependant, à cette époque, de nombreux problèmes de quadrature furent résolus par d’autres mathématiciens, toutefois Fermat avait 62. Les termes de la suite des approximations d’Archimède, 5/4, 21/16, 85/64, ..., sont des fractions de la forme (4m + 1)/(3m + 1). Notre notation facilite la mise en évidence de cette règle et permet de déduire que comme (4m + 1)/(3m + 1) est très proche de 4m/3m, pour m grand, la limite est 4/3. 155
Un nouveau monde en mathématiques
développé une méthode efficace qui marque une étape importante dans cette histoire. Comme Archimède, Fermat utilise une somme de termes dans son calcul et comme Archimède, il n’avait pas les outils pour transcrire ses découvertes avec une précision logique totale. Il commençait à exprimer, en mots, un théorème qu’il disait être bien connu (notissimum). Il concerne la somme « à l’infini » d’une série S = a + ax + ax2 + ax3 + ...
où les termes forment ce que l’on appelle aujourd’hui une progression géométrique. C’est-à-dire que chaque terme est obtenu à partir du précédent en le multipliant par un même nombre x. Si x est plus petit que 1, ces termes deviennent de plus en plus petits et si l’on est assez téméraire concernant l’infini, il est facile d’obtenir une formule pour S. Multiplier la relation précédente par x, il vient xS = ax + ax2 + ax3 + ...
et le soustraire de la première ligne. À gauche, le résultat est (1 – x)S et à droite, tous les termes disparaissent sauf a, d’où S=
a . 1− x
L’étude d’Archimède sur la parabole était liée à la sommation d’une progression géométrique pour a = A et x = 1/4. Il a trouvé S = 4A/3, ce qui correspond à la formule générale. Mais ni Archimède ni Fermat ne disposaient d’une théorie des limites et ils avançaient avec précaution dans leurs approches de l’infini. C’est probablement pour cette raison que Fermat utilisait un argument détourné, mais qui apparaît équivalent à l’argument jugé téméraire donné ci-dessus. Sa contribution au problème de la quadrature était d’appliquer la formule pour la somme d’une progression géométrique spécifiquement adaptée aux courbes comme celle de la figure 6.7. 156
LE COMPTE Y EST !
Un nouveau monde en mathématiques
C
F
E
A
G
I H
N
P
S
O
M
R
D
Figure 6.7 | Fermat a calculé l’aire de la région grisée.
Le périmètre de la région grisée est clairement infini, mais Fermat pouvait démontrer que, dans de nombreux cas, son aire est finie. Il définissait ses courbes en supposant que les valeurs de y GE, HI, ON, etc., étaient reliées aux valeurs de x AG, AH, AO par une formule algébrique. Puis par des choix adaptés pour les valeurs de x, il montrait que les aires des rectangles GEIH, HINO, ONPM formaient une progression géométrique dont les termes décroissaient. La somme des termes de cette progression est connue, et donc l’aire peut être calculée exactement. Par exemple, lorsque l’équation de la courbe est y = 1/x2 et AG = 1, l’aire est égale à 1. Fermat a réussi à appliquer sa technique à de nombreuses autres courbes de la même forme, mais il n’a pas traité le cas particulier y = 1/x. Il correspond à une courbe classique appelée hyperbole. Comme sa cousine, la parabole, elle a fait l’objet de nombreuses études depuis la période hellénique, mais toutes les tentatives de quadrature avaient échoué. Comme nous le verrons au chapitre 7, il y a ici un riche filon de mathématiques, mais sa découverte a dû attendre la seconde moitié du XVIIIe siècle. Fermat est aussi à l’origine d’une autre technique algébrique. Dans l’une de ses contributions aux mathématiques, vers 1630, il a considéré le problème suivant : « Étant donné un segment de droite AB, trouver la position d’un point P sur le segment pour lequel le produit des longueurs AP et PB soit le plus grand. » Une conjecture raisonnable est de supposer que ce maximum correspond au cas où P est le milieu du segment AB, et cela était certainement accepté du temps 157
Un nouveau monde en mathématiques
de Fermat. Sa contribution a été de proposer une méthode générale pour démontrer que sa conjecture donnait la bonne réponse, en utilisant les ressources de la symbolique algébrique. Comme le montre la figure 6.8, soit l la longueur AB et soit x la longueur AP, d’où l – x la longueur PB. Le problème est de trouver la valeur de x pour que le produit x(l – x) atteigne sa valeur maximum. Fermat a considéré ce qui se produit pour une petite variation de x, soit x + e, ce qui modifie le produit x(l – x) qui devient (x + e)(l – x – e). Il affirme que, au point maximum, ce changement est essentiellement nul (il utilisait le mot « adéquat »). En appliquant les règles de l’algèbre, il trouva que la variation pouvait être écrite (l – 2x – e)e. A
P
B
x
l–x Figure 6.8 | Problème de Fermat : trouver le point P tel que x(l – x) soit le plus grand.
Désormais, il pouvait appliquer la condition selon laquelle le dernier résultat ci-dessus ne pouvait qu’être nul. Tout d’abord, il éliminait le multiplicateur commun e, obtenant l – 2x – e. Puis il ignorait le terme e qui est arbitrairement petit, obtenant l – 2x égal à 0. Ce qui donne la réponse attendue. Bien que la réponse de Fermat soit certainement correcte, il subsistait un problème logique dans son argumentation. Il est bon de l’examiner de plus près, parce qu’elle est historiquement significative. Tout d’abord, il divise par e ce qui n’est permis que si e n’est pas nul ; toutefois, à l’étape finale, il prend e égal à zéro. Cette difficulté n’est pas fatale, mais il se passa beaucoup de temps avant que des mathématiciens trouvent une façon réellement satisfaisante de la résoudre.
UN PETIT PAS... Le fait d’utiliser l’algèbre pour étudier l’effet de petits changements en faisant varier des quantités était devenu la base d’une 158
LE COMPTE Y EST !
Un nouveau monde en mathématiques
rupture de méthodologie dans la résolution des problèmes de mathématiques. C’est ce que l’on appelle le calcul différentiel. En plus du traitement du problème de maximum, Fermat a utilisé une méthode analogue lorsqu’il a résolu le problème de la détermination des tangentes au folium de Descartes. On pense désormais à ces problèmes comme à des « problèmes de calcul », et Fermat occupe une place de choix parmi les précurseurs du calcul différentiel. La première personne à développer systématiquement la théorie fut Isaac Newton, probablement le plus grand mathématicien et scientifique depuis Archimède. Newton est né dans le petit village de Woolsthorpe dans le Lincolnshire en 1642, il est entré à l’université de Cambridge en 1661. Bien que les mathématiques ne fussent pas un sujet d’étude majeur à l’époque, il se procura les livres les plus récents sur le sujet et commença à travailler lui-même. En 1665–1666, l’université ferma à cause d’une épidémie de peste et Newton retourna dans le Lincolnshire. On pense que c’est pendant cette période qu’il fit ses plus grandes découvertes. Newton considérait des variables, telles que les coordonnées (x, y), comme celles d’un point se déplaçant sur une courbe, comme des quantités variables. Il commença de la même manière que Fermat, effectuant de petits changements sur x et y. Il supposait que o est une petite quantité et lorsque x devient x + po, alors y devient y + qo. Les quantités p et q sont appelées fluxions ; elles mesurent les taux de variation lorsque x et y changent, et leur rapport q/p mesure le taux relatif de variation de y par rapport à x. Newton se proposait de calculer la variation de ces quantités en fonction de la nature de la courbe au point (x, y). Supposons, par exemple, que la courbe soit une droite d’équation y = mx comme sur la figure 6.9. Les points E = (x, y) et F = (x + po, y + qo) vérifient l’équation de la droite, et donc nous avons les deux conditions : y = mx,
y + qo = m(x + po). 159
Un nouveau monde en mathématiques
F E
(x+po, y+qo)
(x,y)
Figure 6.9 | La variation lorsque le point E se déplace vers F sur la droite y = mx.
Ici, l’algèbre nécessaire pour trouver le rapport q/p est très facile. On soustrait la première relation de la seconde et on annule o ; il en résulte que q = mp, d’où q/p est égal à m. Dans ce cas, la relation entre p et q ne dépend pas du point (x, y) : le rapport q/p est toujours égal à m, la pente de la droite, et c’est une constante parce que la courbe est une droite. Avec cette idée, on peut utiliser la même technique pour étudier des courbes pour lesquelles la pente n’est pas constante, comme dans le cas du cercle x2 + y2 = r2 (figure 6.10). Ici, l’algèbre est légèrement plus complexe. Après avoir remplacé (x, y) et (x + po, y + qo) dans l’équation et par soustraction, on obtient (2px + 2qy)o + (x2p2 + y2q2)o2 = 0.
À cette étape, la méthode de Newton est similaire à celle de Fermat : on divise par o et on ignore le dernier terme, car il est multiple d’une petite quantité. Le résultat est xp + yq = 0 à q/p = –(x/y).
Dans ce cas, q/p, le taux de variation de y, change par rapport à x ; il dépend du point (x, y) choisi, comme on pouvait s’y attendre. (x,y) E F
(x + po, y + qo)
Figure 6.10 | La variation lorsque le point E se déplace vers F sur le cercle x2 + y2 = r2.
160
LE COMPTE Y EST !
Un nouveau monde en mathématiques
En termes géométriques, le calcul des fluxions de Newton fournit une solution complète au problème de la recherche de la tangente à une courbe en un point donné. En permettant à o d’approcher zéro, on peut amener F aussi proche que l’on veut de E, de telle sorte que la droite EF s’approche de la tangente à E, la droite qui touche la courbe en E. Le rapport q/p des fluxions est la pente de la droite tangente, comme souhaité. Évidemment, l’algèbre peut être pénible, mais cela n’a pas découragé Newton (ses exemples étaient plutôt plus complexes que ceux donnés ici). Newton était bien conscient que dans sa méthode, il y avait un problème au sujet du statut de la quantité o. À l’étape finale du calcul, o est prise égale à zéro, mais avant elle ne peut pas être nulle pour que la division par o soit permise. Il a réalisé plusieurs tentatives pour expliquer cette difficulté, il a beaucoup écrit sur ce qu’il appelait les rapports ultimes, mais n’a jamais complètement traité le sujet. Avec un certain recul, on peut voir que le problème sous-jacent était le manque de définition du système de nombres que ses symboles représentaient. Un autre des résultats fondamentaux de Newton a été la découverte d’un lien entre la méthode des fluxions et le problème de quadrature. Son propre récit dit qu’il a, à l’origine, découvert ce lien en examinant plusieurs exemples et en notant un modèle surprenant. Comme d’habitude, ses exemples étaient plutôt complexes, mais on peut suivre ses traces en examinant un cas simple. Le diagramme (figure 6.11) montre l’aire limitée par la courbe y = x2 et l’axe des x entre les valeurs x = 0 et x = z. On cherche une formule pour calculer S en fonction de z que l’on considère comme une variable. En utilisant les formules de quadrature comme celles d’Archimède et de Fermat, Newton a été capable de trouver S = z3/3. Le point clé, comme Newton l’a vu, est que le taux de variation de z3/3 par rapport à z est z2. Il est remarquable que la règle qui définit le taux de changement de l’aire est la même que celle qui définit la courbe. Évidemment, Newton avait besoin de nombreux exemples similaires avant d’être convaincu que la relation n’était pas un accident. Cette conclusion d’une grande portée est aujourd’hui connue sous le nom de théorème fondamental du calcul. Il énonce que l’aire 161
Un nouveau monde en mathématiques
bornée par une courbe peut être calculée en trouvant une règle dont la fluxion est la règle qui définit la courbe. y = x2
S 0
z
Figure 6.11 | L’aire S peut être trouvée par la méthode des fluxions.
Un exemple élucidera ce lien étonnant entre les fluxions et les aires. Supposons que l’on veuille calculer l’aire A entre la courbe y = x4 du point 0 au point z. Il faut seulement trouver la relation entre A et z pour laquelle la fluxion est z4. Maintenant, l’une des premières règles du calcul des fluxions, presque aussi importante que les tables d’opérations en arithmétique, est que la fluxion de zn est nzn – 1. En revenant en arrière, on trouvera que la réponse est A = z5/5. Ce principe général mérite d’être répété : la méthode des fluxions s’applique à l’envers, elle résout les problèmes de quadrature, tout comme elle peut s’appliquer directement à la résolution du problème des tangentes.
PLUS SUR LES SÉRIES Newton a réalisé de nombreuses découvertes fondamentales dans les années 1660, mais aucune d’elles n’a été publiée de son temps63. 63. Les articles de Newton sont disponibles dans une édition critique éditée par D. T. Whiteside, The Mathematical Papers of Isaac Newton, 8 volumes (Cambridge, Cambridge University Press, 1967-–1981). Sa correspondance est disponible dans H. W. Turnbull (éd.), The Correspondance of Isaac Newton, 7 volumes (Cambridge, Cambridge University Press, 1959–1977).
162
LE COMPTE Y EST !
Un nouveau monde en mathématiques
Les raisons de cette réticence sont complexes et de nombreux livres ont été écrits à ce propos. Mais ce livre concerne les mathématiques, non les mathématiciens, on laissera donc de telles spéculations à ceux qui aspirent à devenir romanciers ou critiques de télévision. Nous aurons beaucoup plus à raconter sur Newton au chapitre 7, mais l’une de ses premières découvertes a sa place ici : celle d’une remarquable extension de la formule du binôme. Quand Newton écrivit sur ce sujet, il commença à expliquer sa notation pour les puissances d’un nombre b. Harriot (figure 6.1) avait écrit bb, bbb, bbbb pour le carré, le cube et la puissance quatre de b, mais Newton préférait la notation non standard b2, b3, b4. Quand r (connu comme l’exposant) est un nombre entier, br est défini simplement comme le produit de r fois b et la propriété des exposants est alors précisément exprimée par la condition br × bs = br + s. Il est naturel de se demander si cette notation peut être étendue. Quel est le sens de br quand r est un nombre négatif ou une fraction ? Par exemple, que représente b1/2 ? La réponse s’impose à partir de la propriété fondamentale, car on doit avoir b1/2 × b1/2 = b1/2 + 1/2 = b1 = b,
ce qui signifie que b1/2 est la racine carrée de b. Un argument analogue montre que b1/3 est la racine cubique de b et b1/n est la racine n-ième de b. Étendre cette idée à une fraction générale m/n est immédiat : bm/n doit être la m-ième puissance de b1/n. Par exemple, 82/3 = (81/3)2 = 22 = 4. Une autre découverte, la plus utile de Newton, est la formule des puissances du binôme lorsque l’exposant est une fraction. Pour comprendre la signification de ce résultat, il est utile de revenir à la situation où n est un nombre entier positif. On peut considérer la formule pour (a + b)n comme une description de ce qui se produit à la n-ième puissance de a lorsque a est remplacé par a + b. En d’autres termes, c’est un algorithme de calcul de (a + b)n en ajoutant les termes à partir 163
Un nouveau monde en mathématiques
du premier, an. Explicitement, (a + b)n est une somme de termes T0, T1, T2, ..., Tn où T0 est an et n n–k k a b . Tk = k
Ce point de vue suggère une bonne façon d’effectuer les calculs, car il existe une relation claire entre chaque terme et le suivant : Tk =
n – k +1 b × × T k – 1. k a
On peut donc calculer les termes successivement, à partir de T0 = an. Par exemple, supposons que l’on sache que 203 = 8 000 et que l’on veuille calculer 213. On écrit 213 comme (20 + 1)3 et on utilise la règle donnée ci-dessus ; le calcul se présente comme suit : T0 = 8 000, T2 =
T1 =
3 1 × × 8 000 = 1 200, 1 20
2 1 × × 1 200 = 60, 2 20
T3 =
1 1 × × 60 = 1. 3 20
ainsi, on voit que l’on a calculé 213 = 8 000 + 1 200 + 60 + 1 = 9 261.
Quand n est un nombre entier, le calcul s’arrête au n-ième terme Tn. La plus grande découverte de Newton était que l’on peut utiliser les mêmes règles pour développer un binôme lorsque l’exposant est une fraction ou un nombre négatif au lieu de l’entier n. Mais dans ces cas, la suite des termes n’a pas de fin. En d’autres termes, on a une suite infinie. Heureusement, comme Archimède, Harriot, Fermat et Newton le savaient tous, si les termes deviennent de plus en plus petits de la bonne manière, alors la série infinie aura une somme finie. Ainsi, nous avons un outil idéal pour trouver des 164
LE COMPTE Y EST !
Un nouveau monde en mathématiques
approximations de nombres tels que la racine carrée de 2 (c’est-àdire 21/2) pour laquelle nous n’avons pas de réponse exacte64. Au XVIIe siècle, un nouveau monde mathématique a été créé. Il commence par le développement du symbolisme algébrique qui rendra l’arithmétique plus facile, et cela reste un trait caractéristique des nouvelles mathématiques comme le montre l’exemple de la série du binôme de Newton. Mais l’utilisation de l’algèbre a aussi transformé la géométrie et mené à la découverte du calcul. Les mathématiques étaient prêtes à jouer leur rôle dans certaines des plus grandes réussites de l’espèce humaine, comme l’explication des mouvements de la Lune et finalement comment nous pouvions nous y rendre.
64. Dans sa formulation, Newton utilisait les symboles P et PQ au lieu de a et b. Il supposait que Q était un petit nombre, ainsi l’addition de PQ à P représentait une petite variation. Il écrivait (P + PQ)m/n = A + B + C + D + ... où la règle pour calculer successivement les termes devient A = Pm/n, B = (m/n)AQ, C = ((m – n)/2n)BQ, D = ((m – 2n)/3n)CQ, ... Par exemple, on veut utiliser cette méthode pour trouver la racine carrée de 1,2 qui est (1 + 0,2)1/2. Avec la notation de Newton, on doit prendre P = 1, Q = 0,2, m/n = 1/2, d’où A = 1 et B = (m/n)AQ = 1/2 (0,2) = 0,1, C = ((m – n)/2n)BQ = –1/4 (0,1) (0,2) = –0,005, D = ((m – 2n)/3n)CQ = –3/6 (–0,005)(0,2) = 0,000 5, etc. Donc √1,2 est approximativement égal à 1,095 5. Et l’on peut obtenir une précision aussi grande que l’on veut en calculant suffisamment de termes. 165
7 L’ascension des mathématiques
Si vous viviez à Londres à la fin du XVIIe siècle, vous pouviez entendre qu’un homme s’appelant Newton était employé par le gouvernement pour s’occuper de la monnaie nationale ; vous pouviez supposer (à juste titre) que ses dons en mathématiques étaient très utiles pour un genre d’activités comme l’échange des monnaies étrangères. Toutefois, vous seriez presque certainement surpris par les grandes avancées de la science qui se mettaient en place en partie grâce aux découvertes mathématiques de Newton. De nombreux résultats apparaissaient hautement théoriques à cette époque, mais en temps voulu, ils trouvèrent des applications pratiques d’une portée considérable.
CALCUL, MONNAIE ET CONTROVERSE L’étape des fluxions, et 100 ans plus tard d’autres découvertes mathématiques fondamentales réalisées par Newton dans les années 1660, n’ont pas été publiées pendant de nombreuses années. Les raisons sont complexes et semblent être plus personnelles que 167
L’ascension des mathématiques
mathématiques. Mais quelles que soient les raisons, les faits sont importants pour notre sujet et doivent être rapportés brièvement65. Au cours de ses premières recherches, Newton avait effectué d’importantes découvertes en optique, en mécanique et en astronomie, ainsi qu’en mathématiques. Il continua ses recherches dans l’anonymat relatif de Cambridge jusqu’en 1687, date à laquelle il publia son grand ouvrage Mathematical Principles of Natural Philosophy, auquel on se réfère habituellement sous le nom de Principia, une partie de son titre latin. Cet ouvrage contenait une description du monde physique qui expliquait presque tout ce que l’on rencontre dans la vie quotidienne, du mouvement des planètes à la trajectoire d’une balle de tennis. Bien que de nombreux résultats aient été obtenus par la méthode des fluxions, Newton choisissait d’exprimer la plupart de ses arguments en termes géométriques, il se plaçait ainsi clairement dans la tradition classique. Les Principia ont rendu Newton célèbre, bien audelà du cercle étroit limité au milieu universitaire. Dans le monde académique, le fait que Newton ait fait de grandes avancées en mathématiques a été progressivement reconnu. Ses découvertes l’avaient mené à sa nomination comme professeur lucasien de mathématiques à Cambridge en 1669 et, en 1671, il écrivit un long mémoire exposant certains de ses travaux sur les fluxions et les séries. Mais en 1676, Henry Oldenburg, le secrétaire de la Royal Society, persuada Newton d’écrire deux lettres exposant, brièvement, certains de ses résultats au mathématicien allemand Gottfried Wilhelm Leibniz dont nous parlerons brièvement. Ces révélations partielles et peu satisfaisantes des résultats de Newton furent à l’origine d’une âpre et lamentable controverse. En 1696, la vie de Newton prit un nouveau tournant quand il fut nommé directeur de la Tour de Londres. De nombreux aspects de sa vie changèrent, mais les raisons n’en sont pas très claires. On pensait 65. Une bonne bibliographie de Newton est Never at Rest de R. S. Westfall (Cambridge, Cambridge University Press, 1980).
168
LE COMPTE Y EST !
L’ascension des mathématiques
parfois que la situation de Newton à la Royal Mint (l’Hôtel royal des monnaies) était une sinécure et, en effet, sa nomination en 1696 pourrait être interprétée de cette façon puisqu’il gardait sa chaire professorale à Cambridge. Mais il fut bientôt impliqué dans les problèmes de monnaie anglaise qui subissait une révision majeure des pièces en argent. En 1699, le poste de maître de la Royal Mint se libéra. Historiquement, le Maître était « l’homme à tout faire », ce qui impliquait un engagement au jour le jour dans les activités de direction des affaires, et Newton était chargé de ce poste. Il conserva ce poste jusqu’à sa mort en 1727, et pendant cette période, il fut confronté aux problèmes engendrés par une monnaie dont les pièces étaient faites de métal précieux66. À cette époque, fixer la valeur des pièces était devenu un problème d’une plus grande complexité qu’il n’avait été aux XIIIe et XIVe siècles, au temps de Fibonacci et Pegolotti. Voici un court extrait de l’un des nombreux rapports de Newton au trésorier. Il a été écrit en 1701 et il concerne l’évaluation des pièces françaises qui circulaient en Angleterre. Le louis d’or vaut quatorze livres et l’écu ou couronne française vaut trois livres et dix-sept sous. À quel taux de change le louis d’or vaut 16s 7d sterling, en supposant que l’écu vaille 4s 6d, comme il est estimé dans le cours que j’ai trouvé dans certaines études. Le rapport entre l’or et l’argent est connu et il est maintenant le même en France que ce qu’il a été en Hollande pendant quelques années. Quelques personnes pouvaient donner un sens à ce texte. Celles qui étaient impliquées dans les échanges et le commerce quotidiens disposaient de petits barèmes de monnaies et de poids, de sorte qu’elles pouvaient vérifier le poids des pièces de louis d’or français et de guinées d’or anglaises qui circulaient simultanément (figure 7.1).
66. Les travaux de Newton à la Royal Mint sont décrits dans Newton at the Mint de J. Craig (Cambridge, Cambridge University Press, 1946), mais les commentaires de Craig sur la controverse Newton-Leibniz sont partisans. 169
L’ascension des mathématiques
La guinée avait été frappée à un poids et une pureté fixés depuis 1660, mais sa valeur variait car, à cette époque, la valeur de référence était l’argent, et les prix de l’or et de l’argent dépendaient des circonstances économiques. Dans les années 1690, la valeur de la guinée avait atteint 28 shillings, mais en 1701, elle était redescendue à 21 shillings et 6 pence. Peut-être l’héritage le plus durable de Newton à la Royal Mint a été la fixation de la valeur de la guinée à 21 shillings en 1717. La pièce d’une guinée est devenue obsolète 100 ans plus tard, lorsque l’or est devenu l’étalon officiel de la valeur et qu’une nouvelle pièce fut introduite. Mais pendant au moins 150 ans après, le mot « guinée », signifiant 21 shillings, est resté comme unité de compte des honoraires des médecins et des avocats.
Figure 7.1 | Barèmes de monnaies et de poids, vers 1700. Les poids sont destinés à la vérification des pièces d’or d’une guinée et d’une demi-guinée anglaises et d’un louis d’or et d’un demi-louis d’or français.
170
LE COMPTE Y EST !
L’ascension des mathématiques
Du temps de Newton, les problèmes de comparaison des monnaies entre les pièces anglaises et françaises étaient source de difficultés. Le poids et la pureté du louis d’or différaient de ceux de la guinée, et le rapport de Newton, cité plus haut, indiquait des modifications. Le gouvernement avait besoin de nombres précis pour la collecte des taxes, ce qui entraînait des calculs non triviaux. Newton effectuait de nombreux calculs lui-même et sa réputation conférait de l’autorité à ses recommandations. Newton remplissait assidûment ses obligations à la Royal Mint. Il insistait non seulement sur les hauts standards d’uniformité du poids et de la pureté des pièces produites, mais il poursuivait, sans relâche, les contrefacteurs et accordait de l’intérêt à la production de médailles commémoratives. En dépit de cette charge de travail permanente, il continuait à faire des mathématiques et certains de ses premiers travaux (pas tous) furent finalement publiés. Comme nous l’avons déjà mentionné, dans les années 1670, Gottfried Leibniz commença à s’intéresser au calcul – déterminer des tangentes aux courbes et calculer des aires. Son intérêt pour ces problèmes l’avait conduit à entretenir une correspondance avec Newton par l’intermédiaire de Henry Oldenbourg et finalement, en 1684, Leibniz commença à publier ses propres travaux qui traitaient du sujet d’une nouvelle manière. De nombreux résultats dans son article de 1684 avaient déjà été trouvés par Newton, mais n’avaient jamais été publiés. Une différence très importante résidait dans le fait que la notation de Leibniz était nettement plus claire que celle de Newton, alors que les techniques d’imprimerie de l’époque ne permettaient pas toujours de mettre en évidence cet avantage. Leibniz notait les petites variations des variables x et y par dx et dy et les appelait différentielles. Il pouvait calculer la relation entre dx et dy lorsque y dépend de x d’une certaine manière : par exemple, si y = xn pour n un nombre entier positif, la règle est dy = d(xn) = nxn – 1dx. Il expliquait comment étendre cette règle aux puissances négatives 171
L’ascension des mathématiques
et fractionnaires (pour une puissance négative, x–m est définie par 1/xm). Il a donné aussi des règles générales utiles, telles que la règle de la différentielle d’un produit, d(uv) = udv + vdu. Par essence, ses méthodes étaient très analogues à celles de Newton, mais ses différentielles étaient plus faciles à manipuler que les fluxions de Newton, et ses notations ont été bientôt adoptées, sauf en Angleterre. Leibniz a travaillé aussi sur les problèmes de quadrature. Sa méthode utilisait une expression de l’aire comme somme de tas de petits morceaux, dans la tradition des anciens arpenteurs (et d’Archimède bien sûr). Sa méthode lui suggéra une notation nouvelle, un S allongé qui est aujourd’hui le signe intégral, ∫. Leibniz était aussi familier du « théorème fondamental » qui énonce que trouver l’aire d’un domaine limité par une courbe (l’intégrale) et trouver la pente d’une tangente (la différentielle) représentent des problèmes inverses. Ce principe est à la base du calcul des intégrales indéfinies, telles que
∫
x n dx =
x n+1 . n+ 1
Cette règle est justifiée parce que la différentielle du membre de droite est l’expression qui suit le signe intégral. (Cela reste vrai si une constante est ajoutée au second membre.) La notation de Leibniz et les règles de calcul constituaient les fondements du calcul différentiel et du calcul intégral. Elles étaient très simples à utiliser et adoptées avec enthousiasme par de nombreux autres mathématiciens de premier plan dans des domaines divers d’avant-garde, dont certains seront décrits dans les pages suivantes. Toutefois, nous ne délaisserons pas Newton et Leibniz sans faire référence à l’amère controverse survenue à propos de la découverte du calcul intégral67. Les faits sont énoncés ci-dessus, mais dans les affaires de ce genre, les faits sont souvent moins importants que les opinions 67. Consulter Philosophers at War: The Quarrel between Newton and Leibniz de A. R. Hall (Cambridge, Cambridge University Press, 1980).
172
LE COMPTE Y EST !
L’ascension des mathématiques
d’importants personnages. D’un point de vue historique, il est heureux que cette controverse ait eu peu d’impact sur le développement des mathématiques.
LOGARITHMES ET EXPONENTIELLES Un problème particulier était abordé maladroitement dans la théorie de Newton et de Leibniz. La règle présentée plus haut pour trouver l’intégrale de xn s’applique non seulement aux puissances positives, mais aussi (lorsqu’elle est interprétée correctement), dans la plupart des cas, aux puissances négatives. Cependant, elle échoue dramatiquement si n = –1, car le membre de droite prend la valeur zéro au dénominateur. Donc la règle générale ne peut pas s’appliquer à la quadrature de la courbe y = x–1, c’est-à-dire à la courbe y = 1/x. Cette anomalie a été expliquée par la méthode de quadrature de Fermat (figure 6.7), qui avait fonctionné, en général, pour les courbes de la forme 1/xm, mais qui avait échoué dans le cas où m = 1. C’était un sérieux problème, car l’hyperbole était l’une des courbes célèbres étudiées par les géomètres grecs, et la quadrature de l’hyperbole avait suscité beaucoup d’attention. De nombreux résultats intéressants avaient été découverts par Grégoire de Saint-Vincent dans la période 1625–1627, mais son étude était entièrement géométrique et, par conséquent, il manquait la propriété algébrique qui aurait été sa plus grande découverte68. Dans les années 1650, un Anglais, William Brouncker, utilisa la méthode algébrique pour calculer numériquement l’aire, mais lui non plus n’a pas su énoncer explicitement ce que l’on considère aujourd’hui comme étant la propriété clé. Bien que les détails restent obscurs, il semble qu’à la fin des années 1660, 68. Plusieurs historiens des mathématiques ont affirmé que la propriété de l’aire sous l’hyperbole a été découverte par Saint-Vincent ou par son élève Sarasa. Cependant, R. P. Burn a réalisé une étude attentive des sources originales et est parvenu à la conclusion qu’aucun des deux n’avait formulé explicitement ce résultat. Voir son article dans Historia Mathematica 28 (2001) 1–17. 173
L’ascension des mathématiques
cette propriété ait été acceptée comme un fait par la communauté mathématique. Comme sur la figure 7.2, nous notons H(a) l’aire bornée par l’hyperbole 1/x, l’axe des x et les droites x = 1 et x = a. La propriété la plus remarquable de H(a) peut s’exprimer très simplement en termes algébriques : H(ab) = H(a) + H(b).
L’importance de ce résultat est qu’il est exactement de la même forme que la loi des logarithmes log (ab) = log a + log b. Pour cette raison, H(a) devint connu sous le nom de logarithme hyperbolique de a.
y = 1x
H(a) 1
a
Figure 7.2 | L’aire H(a).
Il semble à première vue que le logarithme hyperbolique ait été considéré simplement comme une curiosité, mais les mathématiciens de l’époque ont réalisé rapidement que des questions importantes ne pouvaient pas rester sans réponse. Les logarithmes hyperboliques peuvent-ils être calculés facilement ? L’antilogarithme hyperbolique a-t-il un sens ? Quelle est sa relation avec les logarithmes communs calculés par Briggs et d’autres ? Une réponse à la première question fut donnée par Nicolaus Mercator en 1668 sous la forme d’une série infinie pour le calcul du logarithme hyperbolique. Une petite étape, mais significative, a 174
LE COMPTE Y EST !
L’ascension des mathématiques
été d’écrire la variable a sous la forme 1 + x ; dans ce cas, le résultat apparaît facilement H(1 + x) = x –
x2 x3 x4 x5 + – + – ... 2 3 4 5
La publication de cette série par Mercator a éveillé l’attention de Newton, car lui aussi l’avait découverte. C’est probablement ce qui l’a incité à publier ses travaux de 1669–1671, mais comme on le sait, ils restèrent non publiés. Le mémoire contient de nombreux résultats importants, en particulier la réponse à une autre de nos questions. Après avoir calculé le logarithme de 2 avec un grand nombre de décimales et expliqué comment la méthode pouvait s’appliquer à un nombre quelconque donné, Newton remarqua que de tels calculs pouvaient être utilisés pour construire des tables de logarithmes communs, car le logarithme commun d’un nombre quelconque peut être obtenu en multipliant son logarithme hyperbolique par 0,434 294 481 903 251 8 approximativement. À la différence de ses prédécesseurs, Newton n’avait pas peur de l’infini et ne craignait pas d’effectuer des opérations algébriques sur des séries infinies. Il utilisa cette méthode pour étudier le problème de l’antilogarithme hyperbolique : trouver le nombre x tel que le logarithme H(1 + x) ait une valeur donnée y. Avec témérité, il supposa que x pouvait s’écrire comme une série infinie : x = Ay + By2 + Cy3 + Dy4 + ...,
ainsi le problème équivalait à trouver les nombres A, B, C, D, etc. On peut faire cela en substituant la série de x dans la série de H(1 + x). L’algèbre est fastidieuse, mais la fin justifie les moyens, car pour la série 1 + x, le nombre dont le logarithme hyperbolique est y est exceptionnellement remarquable : c’est 1+y+
y2 y3 y4 + + + ... 2 6 24 175
L’ascension des mathématiques
Le terme général est simplement yn divisé par 1 × 2 × 3 × ... × n ; habituellement, cette série remarquable est connue sous le nom de série exponentielle, pour des raisons expliquées maintenant. La notation moderne rend l’explication claire, bien que, au XVIe siècle, la question ait été moins claire. Supposons que r et s soient les logarithmes hyperboliques de a et b. Alors, puisque H(ab) = H(a) + H(b), le logarithme hyperbolique de ab est r + s. En retournant cet énoncé, le nombre dont le logarithme hyperbolique est r + s est ab, le produit dont les logarithmes hyperboliques sont r et s. Si, au lieu de la phrase complexe : « le nombre dont le logarithme hyperbolique est y », on utilise l’abréviation E(y), on obtient la règle E(r + s) = E(r)E(s).
Aujourd’hui, cette règle est familière : il s’agit juste d’une règle pour calculer les puissances br + s = brbs, bien connue depuis plusieurs siècles et exprimée sous forme symbolique par Harriot, Newton et d’autres. La valeur de E(r) est simplement la puissance r de E(1) ; c’est une simple conséquence de la règle exponentielle69. Donc quel est ce nombre E(1) dont le logarithme hyperbolique est 1 et dont la puissance r est E(r) ? Il s’agit clairement d’un nombre important et sa valeur numérique est 2,711 828..., il est très facile à calculer à partir de la série infinie. Mais au XVIIe siècle, il était caractérisé par l’étrange phrase « le nombre dont le logarithme hyperbolique est 1 ». Le baptême différé de E(1) prit fin à la suite d’un résultat indirect de Leibniz dans l’un de ses travaux. Peu après, il commença à publier ses résultats sur le calcul ; le sujet fut accueilli avec enthousiasme par les deux frères Jakob et Johann Bernoulli. Tous deux formulèrent rapidement la plupart de ce que les étudiants débutants d’aujourd’hui apprennent en calcul intégral et différentiel, et leurs progrès rapides constituent la raison principale de la notation de Leibniz devenue standard et préférée à celle de Newton. Comme 69. Noter que E(2) = E(1 +1) = E(1)E(1), E(3) = E(2 + 1) = E(2)E(1), etc.
176
LE COMPTE Y EST !
L’ascension des mathématiques
nous le verrons par la suite, d’autres membres de la famille Bernoulli ont contribué aussi au développement des mathématiques. Dans les années 1680, alors qu’il préparait sa grande œuvre sur la théorie des probabilités, l’Ars Conjectandi, Jakob Bernoulli tomba sur la série exponentielle. Il semble qu’il redécouvrit l’œuvre d’Harriot sur les intérêts continus, œuvre qui, naturellement, n’avait jamais été publiée. Harriot et Bernoulli commencèrent par le développement du binôme, plus précisément sous la forme d’une série finie (1 +
y n ) = 1 + A1y + A2y2 + A3y3 + ... + Anyn, n
dont les coefficients dépendent de deux occurrences de n dans le membre de gauche. Quand n augmente, Harriot et Bernoulli ont trouvé que les coefficients sont voisins de 1, 1/2, 1/6, 1/24, etc. Ainsi, si l’on permet à n d’approcher l’infini, on obtient la série exponentielle donnée plus haut. Au début du XVIIIe siècle, la série exponentielle était une connaissance commune, mais sa somme était encore décrite comme « le nombre dont le logarithme hyperbolique est y ». Par exemple, ce terme est utilisé dans un gros volume portant le titre Tables of Ancient Coins, Weights and Measures, écrit par John Arbuthnot et publié en 1727. Le livre traite, presque entièrement, des bourses d’études anciennes, mais au milieu d’un récit appris des taux d’intérêt facturés au temps des Romains, Arbuthnot change soudain de ton. Les intérêts mensuels sont plus élevés que les intérêts annuels au même taux, car ils interviennent comme des intérêts composés. Cela m’a suggéré le problème suivant. Le taux par année étant donné, trouver la plus grande somme que produirait une livre, sachant que les intérêts seraient payables à n’importe quel moment indivisible du temps. Arbuthnot commence à travailler sur la réponse à « son » problème – mais comme nous le savons, il en avait discuté avec Harriot et Jakob 177
L’ascension des mathématiques
Bernoulli. Le « moment indivisible du temps » est une variable t qui peut être arbitrairement petite, et peut donc valoir 1/n dans la discussion ci-dessus. En utilisant fondamentalement la même méthode, il calcula que 10 000 000 livres investies pendant un an à 6 % pourraient rapporter approximativement 10 618 364 livres. C’est plus de 18 000 livres que ce que rapporterait un paiement annuel. Dans son calcul, Arbuthnot fait référence au « nombre dont le logarithme hyperbolique est r » où r est le taux annuel. Dans notre terminologie, c’est E(r), la puissance r de E(1), le nombre dont le logarithme hyperbolique est 1. À la publication du livre d’Arbuthnot, E(1) n’avait pas encore de nom, mais il en reçut un peu après, donné par le meilleur mathématicien du XVIIIe siècle, Leonhard Euler. Le père d’Euler avait été élève de Jakob Bernoulli et Leonhard lui-même avait étudié avec Johann Bernoulli, avant de partir à Saint-Pétersbourg en 1727. Il y resta jusqu’en 1741, puis partit pour Berlin où il demeura jusqu’en 1766, et retourna enfin à Saint-Pétersbourg jusqu’à sa mort en 1783. Il était extrêmement prolifique, il a écrit plus de 700 livres et articles, et a été père de 13 enfants. On pense que c’est Euler qui a utilisé le premier le symbole « e » pour ce que l’on a appelé E(1), dans une lettre non publiée écrite en 1728, l’année après la publication du livre d’Arbuthnot. En 1731, il a défini e explicitement comme le nombre dont le logarithme hyperbolique est 1 et il figure dans le premier volume imprimé de Mechanica (1736). En introduisant cette notation, Euler est sorti du brouillard qui s’était formé pendant plusieurs décennies. Il est clair aujourd’hui que la somme de la série exponentielle avec le paramètre r est simplement la puissance r de e, soit er.
NOMBRES, PARFAITS ET PREMIERS Les nouvelles théories de calcul et de probabilités développées au XVIIe siècle indiquaient que les mathématiques pouvaient éclairer de nombreux domaines des sciences naturelles et de l’activité humaine. 178
LE COMPTE Y EST !
L’ascension des mathématiques
En même temps, certaines parties des mathématiques telles que la théorie des nombres étaient revisitées. L’étude des propriétés mathématiques des nombres entiers avait commencé auréolée de gloire par la démonstration donnée par Euclide d’une infinité de nombres premiers. Mais les Grecs et leurs successeurs ont trouvé les nombres premiers moins intéressants que les nombres parfaits et pendant près de 2 000 ans, les nombres premiers furent considérés comme des curiosités. Ce n’est qu’à partir du XVIe siècle que les mathématiciens ont commencé à s’apercevoir que les nombres premiers avaient des propriétés qu’il était parfaitement intéressant d’étudier ; ce n’est qu’au XXe siècle que leurs propriétés se sont appliquées aux problèmes de la vie réelle. Les Grecs avaient déclaré qu’un nombre est « parfait » s’il est égal à la somme de ses facteurs, à l’exclusion de lui-même. Par exemple, 6 a comme facteurs 1, 2 et 3, et 28 a comme facteurs 1, 2, 4, 7 et 14 ; ils sont des nombres parfaits puisque 6 = 1 + 2 + 3,
28 = 1 + 2 + 4 + 7 + 14.
Euclide avait donné une méthode remarquable de construction de tels nombres, que l’on peut traduire de la manière suivante. Supposons que, partant d’une unité, les nombres soient pris continûment en double proportion, jusqu’à ce que la somme de ces entiers soit un nombre premier. Alors le produit de ce dernier entier multiplié par le dernier nombre de la somme est un nombre parfait. Si l’on traduit cela en langage moderne, on dira que si 1 + 2 + 22 + ... + 2k est un nombre premier p, alors 2k fois p est un nombre parfait. Pour k = 1 et k = 2, cette règle donne les nombres 6 et 28, et elle produit aussi les nouveaux nombres parfaits suivants 496 et 8 128. Euler a démontré que tout nombre parfait doit être donné par 179
L’ascension des mathématiques
la règle d’Euclide, mais aujourd’hui on ne sait toujours pas s’il existe des nombres parfaits impairs. Dans toute l’histoire, l’étude mathématique des nombres a toujours été masquée par des spéculations sur leur signification mystique. C’est ce que l’on appelle la numérologie, et ses relations avec les mathématiques semblent similaires à celles de l’astrologie avec l’astronomie. Un numérologue caractéristique de la fin du XVIe siècle était Peter Bungus, qui croyait que certains nombres avaient des vertus spéciales, tandis que d’autres nombres comme 666 étaient particulièrement mauvais. Dans un ouvrage publié en 1584, Bungus avait compilé une longue liste de nombres dont il affirmait qu’ils étaient parfaits, car il pensait que tout nombre tel que 1 + 2 + 22 + ... + 2k était premier. En réalité, dans la liste de nombres de Bungus, nombre d’entre eux n’étaient pas parfaits, comme l’avait souligné Marin Mersenne en 1644. Mersenne était une figure importante des cercles mathématiques au cours de la première moitié du XVIIe siècle. Il entretenait une importante correspondance avec plusieurs mathématiciens éminents comme Descartes, Fermat et Pascal, et contribuait à la diffusion de leurs résultats à une époque où il n’y avait que très peu de revues mathématiques. Il a apporté également des contributions personnelles significatives. Son approche des nombres était essentiellement pratique ; il n’essayait pas de donner des démonstrations à la manière d’Euclide, pas plus qu’il ne tolérait les spéculations de Bungus. L’approche de Mersenne donne un aperçu de l’efficacité des algorithmes arithmétiques. Il savait qu’une somme de la forme 1 + 2 + 22 + ... + 2k était égale à 2k + 1 – 1 et il pouvait calculer facilement sa valeur numérique en multipliant de proche en proche par 2. C’est une tâche facile, et certains la trouvait même ludique. Mersenne n’avait pas besoin de le faire lui-même puisque des tables de valeurs des puissances de 2 étaient disponibles dans des manuels d’arithmétique comme celui publié par Nicholas Hunt en 1633 (figure 7.3). 180
LE COMPTE Y EST !
L’ascension des mathématiques
Figure 7.3 | Une table des puissances de 2, par Nicholas Hunt, Hand-maid Arithmetick, 1633. Le nombre après n est 2n – 1.
Par ailleurs, Mersenne avait remarqué que toutes les procédures arithmétiques n’étaient pas aussi faciles. Si l’un des problèmes mathématiques les plus difficiles est d’exposer une liste des nombres parfaits, il serait aussi important de comprendre pourquoi des nombres de 15 ou 20 chiffres sont premiers ou non, puisqu’une vie entière ne suffirait pas à le déterminer par quelque méthode que ce soit connue à ce jour70. 70. Mersenne qualifiait cet énoncé par la phrase quocumque modo hactenus cogito (par toute méthode connue à ce jour). Dans le chapitre 11, on expliquera comment de meilleures méthodes ont été découvertes. 181
L’ascension des mathématiques
C’est une remarque fondamentale. Sa particularité réside dans le fait que les seules méthodes disponibles pour vérifier si un nombre était premier ou non consistaient à essayer de trouver (à cette époque) ses facteurs. Mais l’algorithme de vérification permettant de savoir si un nombre donné a des facteurs est à peine meilleur que la force brutale. Un facteur potentiel spécifique peut être vérifié après par une longue division, possible mais fastidieuse. Le problème est qu’il y a trop de facteurs potentiels : si m a 20 chiffres, alors tous les nombres de 10 chiffres doivent être vérifiés comme facteurs potentiels. Certes, on peut restreindre la recherche aux nombres premiers, mais pour cela, on doit disposer d’une liste fiable de tous les nombres premiers pour tous ceux qui ont moins de 10 chiffres avant de commencer. En réalité, ils sont des centaines de millions, et chacun doit être testé en effectuant la division de m par chacun d’eux. C’est pourquoi Mersenne affirmait qu’une vie entière n’y suffirait pas. Mersenne concluait que cette difficulté était la cause des nombreuses erreurs de Peter Bungus. Pour montrer qu’un nombre n’est pas premier, il est suffisant de trouver un facteur, mais pour montrer qu’il est premier, on doit montrer qu’il n’a aucun facteur. Alors excepté pour de petites valeurs de n, il est très difficile de vérifier si un nombre de la forme 2n – 1 est premier. Évidemment, cela rend le problème plus intéressant. Une liste de puissances de 2, telle que celle qui apparaît sur la figure 7.3, mène à quelques conjectures évidentes. Par exemple, en remarquant que les nombres 22 – 1 = 3, 25 – 1 = 31, 27 = 127
sont tous premiers, il est tentant de suggérer que 2n – 1 est un nombre premier à partir du moment où n est premier. Mais on peut montrer facilement que cette conjecture est fausse, car 211 – 1 = 2 047 a comme facteurs 23 et 89 ; néanmoins, il est facile de montrer par une technique d’algèbre élémentaire que la réciproque est vraie : si 2n – 1 est un nombre premier, alors n est premier. Donc la question pour 182
LE COMPTE Y EST !
L’ascension des mathématiques
Mersenne et ses contemporains était : pour quelles valeurs de p il est-il vrai que 2p – 1 est un nombre premier ? Les nombres premiers de la forme 2p – 1 sont connus aujourd’hui sous le nom de nombres premiers de Mersenne et les recherches sur ces nombres sont encore activement poursuivies71. Mersenne en a trouvé lui-même un certain nombre, le plus grand étant 219 – 1 = 5 242 287. Il a affirmé aussi que 267 – 1 est premier, mais il s’est trompé car : 267 – 1 = 193 707 721 × 761 838 257 287.
Il avait testé de nombreux facteurs premiers potentiels, mais de manière incompréhensible, il n’était pas allé aussi loin que 1 937 707 721. Ce n’est qu’en 1903 que les facteurs ont été trouvés72. Revenant à l’époque de Mersenne, la perspective d’un test simple de primalité semblait sans espoir et en effet, on en resta là jusqu’à la fin du XXe siècle, quand les tests de primalité sont devenus importants pour des raisons pratiques, et les ordinateurs modernes ont permis des méthodes de calcul plus rapides. Ironiquement, les méthodes modernes dépendent fondamentalement de découvertes effectuées au XVIIe siècle par le correspondant de Mersenne, Fermat. En 1640, à propos de trois de ses résultats sur les nombres 2n – 1, Fermat écrit à Mersenne. L’un de ses résultats était : « lorsque l’exposant [n] est un nombre premier, le radical [2n – 1] réduit d’une unité est mesuré par le double de l’exposant ». En termes modernes, Fermat 71. La recherche des nombres premiers de Mersenne est poursuivie actuellement dans le cadre du projet internet GIMPS, le Grand Projet de recherche des nombres premiers de Mersenne par Internet, www.mersenne.org (consulté le 1er juin 2015), projet dont l’objectif est de trouver des nombres premiers de classes un peu plus générales. 72. Le fait que 267 – 1 soit un nombre premier a été démontré par Édouard Lucas en 1876, mais les facteurs n’ont été obtenus qu’en 1903, lorsque Frank Nelson Cole a annoncé le résultat lors d’un exposé à l’American Mathematical Society. Sa présentation était presque entièrement silencieuse ; elle consistait à calculer 267 – 1 en utilisant de grandes multiplications pour montrer que le produit des deux facteurs était en réalité le nombre donné. On s’est levé pour l’acclamer. 183
L’ascension des mathématiques
affirmait que si p est premier, alors 2p – 2 est un multiple de 2p. Ce résultat implique que 2p – 1 – 1 est un multiple de p. Par exemple : 27 – 1 – 2 = 63 = 7 × 9,
217 – 1 – 1 = 65 535 = 17 × 3 855.
Fermat n’a pas donné de démonstration dans sa lettre, bien qu’il prétende en avoir trouvé une. C’était, disait-il, « non sans difficulté ». La première démonstration a été donnée probablement par Leibniz et reposait sur ses recherches en combinatoire. Dans un manuscrit (non publié à cette époque), il remarquait que le théorème du binôme donnait une expression de 2p comme somme des coefficients du binôme, soit p p + 2p = (1 + 1)p = 1 0
p + 2
+ ... +
p . p
Les premier et dernier termes sont égaux à 1, donc 2p – 2 = la somme des autres termes, et il est facile de vérifier, en utilisant la formule de Bhaskara (chapitre 5), que chacun d’entre eux est un multiple de p. Par conséquent, 2p – 2 est un multiple de p et il en résulte (pourvu que n ne soit pas égal à 2), que 2p – 1 – 1 est aussi multiple de p. Fermat a remarqué aussi que le résultat peut s’étendre à des nombres autres que 2. Cela est connu comme le petit théorème de Fermat : si x est l’un des nombres 2, 3, ..., p – 1, alors xp – 1 – 1 est un multiple de p. Par exemple, si p = 7, on peut établir un tableau des valeurs de x6 – 1 : x:
2
3
4
5
6
x6 – 1 :
63
728
4 095
15 624
46 655
et vérifier que les nombres de la dernière ligne sont tous multiples de 7. Aujourd’hui, le petit théorème de Fermat joue un rôle important dans notre vie de tous les jours. Comme nous l’expliquerons au chapitre 11, c’est l’un des résultats derrière les algorithmes qui assurent 184
LE COMPTE Y EST !
L’ascension des mathématiques
la sécurité de nos communications électroniques. Toutefois, le nom de Fermat est plus connu pour un autre théorème. Il est tombé par hasard sur ce dernier en lisant les œuvres de Diophante d’Alexandrie, un mathématicien de la tradition grecque dont on ne connaît que très peu de choses. Tout ce que l’on sait de lui, c’est qu’il a vécu pendant un certain temps à Alexandrie, entre 100 ans avant J.-C. et 350 ans après J.-C., et qu’il a écrit plusieurs livres sur les propriétés arithmétiques des nombres entiers. Ces livres ont été perdus pendant une très longue période, mais certains d’entre eux ont été redécouverts au XVe siècle et Fermat, dans sa jeunesse, s’est procuré une copie d’une traduction en latin de Claude Bachet publiée en 1621. Il l’a étudiée attentivement. La seconde partie contient une discussion sur des nombres entiers qui vérifient le théorème de Pythagore, tels que 32 + 42 = 52 et 52 + 122 = 132. En lisant cela, l’esprit de Fermat s’est égaré et il a écrit une note en latin dans la marge. Il est impossible pour un cube d’être la somme de deux autres cubes, ou... en général, pour tout nombre qui est une puissance plus grande que la seconde d’être écrit comme somme de nombres à cette puissance. J’ai une démonstration merveilleuse de ce fait, mais la marge est trop étroite pour la contenir. Ce commentaire était personnel et cette démonstration est restée inconnue du vivant de Fermat. Après sa mort en 1665, son fils rassemblera une collection d’annotations analogues écrites dans les marges et il les publiera dans une édition de Diophantus « contenant des observations de P. de Fermat ». La note en marge est ce qui est connu comme étant le dernier théorème de Fermat : le fait (et c’est maintenant un fait reconnu) qu’il n’existe pas de nombres entiers positifs x, y, z tels que xn + yn = zn, pour toute valeur de n supérieure à 2. Fermat prétendait avoir trouvé une démonstration merveilleuse, mais c’est improbable, car pendant plus de 300 ans, des mathématiciens se sont acharnés à en trouver 185
L’ascension des mathématiques
une. Ils ont trouvé de nombreux faits importants dans le processus et construit de merveilleuses structures mathématiques, mais une démonstration complète, pour toutes les valeurs de n, a échoué. Ce n’est qu’en 1990 qu’Andrew Wiles a accompli l’étape finale. C’était le bon moment73.
NOUVEAUX TYPES DE NOMBRES Quand on enseigne l’arithmétique aux enfants, on leur dit « vous ne pouvez pas soustraire 7 de 4 ». Cela est correct, surtout si l’on calcule avec des cailloux et il se passera un long moment avant que les gens soient assez hardis pour franchir une nouvelle étape. Quant aux mathématiciens, les premiers à découvrir comment résoudre les équations quadratiques et cubiques, ils devaient envisager plusieurs cas, car les coefficients ne permettaient pas de considérer des nombres négatifs. Mais peu à peu, il devint clair que calculer avec un nombre négatif comme –3, le résultat de la soustraction 7 de 4, n’était pas seulement anodin, mais en réalité très commode. Toutes les règles de l’arithmétique pouvaient être étendues aux nombres négatifs, à condition que l’on soit préparé à accepter quelques nouvelles règles, telles que « moins multiplié par moins égal plus ». Un autre nouveau type de système de nombres s’était introduit en force dans le monde mathématique comme conséquence logique de l’acceptation des nombres négatifs. Un nombre positif comme 25 possède la racine carrée 5 ; si l’on s’autorise les nombres négatifs, alors –5 est aussi une racine carrée, car –5 × –5 = 25. Donc 25 a deux racines carrées, ce qui est bien, mais maintenant il y a un autre problème. Quelle est la racine carrée de –25 ? À première vue, il n’existe pas une telle chose ; en effet, il semble n’exister aucune racine carrée d’un nombre négatif, car le carré d’un nombre positif ou négatif est 73. Fermat Last Theorem de Simon Singh (Londres, Fourth Estate, 1997) comprend un exposé de la découverte de Wiles.
186
LE COMPTE Y EST !
L’ascension des mathématiques
toujours positif. Toutefois, les racines carrées de nombres négatifs sont apparues dans les calculs des racines des équations quadratiques et cubiques et, progressivement, des mathématiciens ont réalisé qu’il existait, en réalité, une autre opportunité d’avancer avec assurance – dans ce cas, en inventant un nouveau type de nombres. Ainsi √(–25) a été acceptée dans le royaume des nombres. Cela a été obtenu en introduisant un nouveau symbole « i » pour √(–1) et en disant qu’une expression de la forme a + ib est un nombre complexe, où a et b sont des nombres de l’ancien type, aujourd’hui appelés nombres réels. Ici, l’audace était sa propre récompense, car si les règles de l’arithmétique sont imposées, avec une nouvelle règle i2 = –1, tout fonctionne. Par exemple, il est facile de vérifier que –25 possède deux racines carrées, 5i et –5i. À cette époque, il était plus habituel d’utiliser les mots « nombre imaginaire » que « nombre complexe », mais il ne s’agit que d’une appellation impropre. Si l’on accepte que –1 est un nombre, il n’y a aucune raison de rejeter sa racine carrée i. Les nombres complexes ne sont pas des curiosités académiques. Leur importance cruciale en mathématiques a été montrée d’abord par Euler dans les années 1740. Il était un utilisateur enthousiaste des séries infinies, d’une manière parfois à la limite de la témérité, et une importante découverte qui résultait de son enthousiasme était que les nombres complexes créent un lien entre des parties des mathématiques sans lien apparent entre elles. Dans Introductio in Analysin Infinitorum (1748), il décrit sa propre approche des séries exponentielle et logarithmique. Comme nous l’avons vu, cela revenait à montrer que les puissances de e, le nombre 2,718 28..., sont données par ex = 1 + x +
x2 x3 x4 x5 + + + + ... 2 6 24 120
La grande découverte d’Euler était basée sur ce qui se produisait lorsque l’on remplaçait x par ix dans la formule. En utilisant 187
L’ascension des mathématiques
uniquement la règle i2 = –1, il a été capable d’écrire le résultat précisément sous la forme d’un nombre complexe a + ib : eix = (1 –
x2 x4 x3 x5 + + ...) + i(x – + + ...). 2 24 6 120
Euler a remarqué un lien entre les deux parties de cette série et les calculs qui interviennent dans les mesures sur les triangles qu’utilisaient les navigateurs et les arpenteurs. En employant uniquement de l’algèbre simple, il trouva des séries infinies que l’on appelle aujourd’hui les fonctions trigonométriques, sinus et cosinus, notées sin et cos. De manière remarquable, ces séries sont simplement les parties a et b de la série pour eix et donc, avec une certaine audace, il concluait que eix = cos x + i sin x.
Puis Euler a démontré que la fonction exponentielle et les fonctions trigonométriques étaient liées très simplement au royaume des nombres complexes. Après cela, il n’y avait aucun doute sur le fait que les nombres complexes étaient destinés à jouer un rôle important en mathématiques et, en réalité, ils sont à la base de nombreuses applications pratiques, par exemple en ingénierie électrique. Un cas particulier du résultat d’Euler est absolument remarquable. Si x = π, on a la formule eiπ = –1.
Ici, un fait étonnant est que les deux constantes π et e sont reliées de façon très simple, si elles sont observées dans le bon contexte. Il n’y a rien de surnaturel à propos de ce lien ; ce n’est qu’une conséquence inévitable de nos conceptions de l’arithmétique et de la géométrie.
TOUTES SORTES DE CHOSES MERVEILLEUSES De nombreux excellents mathématiciens ont suivi les pas d’Euler. Le plus grand d’entre eux est incontestablement Carl Friedrich Gauss 188
LE COMPTE Y EST !
L’ascension des mathématiques
(1777–1855), qui a étendu les frontières du sujet à un point tel que, même aujourd’hui, peu de gens peuvent comprendre tous ses résultats. Ses prodigieux talents mathématiques ont été reconnus dès son plus jeune âge. En 1790, alors qu’il était sous le patronage du duc de Brunswick, il a reçu un livre de tables de logarithmes qui contenait aussi une longue liste de nombres premiers. A priori, il était au courant de la démonstration d’Euclide du théorème sur l’infinité de la liste des nombres premiers, mais il lui semblait que le nombre des nombres premiers diminuait lorsque la valeur des nombres entiers augmentait. Il essaya donc de découvrir une règle qui décrirait ce comportement. Les tables de logarithmes lui furent utiles ici, car il avait noté que le nombre de nombres premiers plus petits qu’un nombre n était approximativement n log n (où le logarithme est le logarithme hyperbolique). Il n’a pas publié ce résultat, probablement parce qu’il n’a pas pu le démontrer, mais en 1798, une forme modifiée de la même conjecture fut publiée par Adrien-Marie Legendre, un membre du groupe de mathématiciens français qui, comme Gauss, a été inspiré par les travaux d’Euler. Gauss lui-même a découvert, plus tard, une approximation légèrement meilleure, mais la démonstration lui a échappé, et le théorème sur les nombres premiers (nom sous lequel il est connu) est resté une conjecture pendant plus d’un siècle. En 1801, Gauss a publié Disquisitiones arithmeticae, un exposé des résultats connus sur les nombres entiers et plusieurs résultats qu’il avait lui-même établis. Il commença par introduire un peu de terminologie nouvelle. Il proposa une notation : si a – b est un multiple de m, on dira que a est congruent à b modulo m.
Quand le module est égal à 5, on trouve, par exemple, que 6 est congruent à 1, que 24 est congruent à 4 et que –2 est congruent à 3 ; tout nombre positif ou négatif est congruent à l’un des nombres 0, 1, 2, 3, 4. Dans le langage des anciens, ce nombre correspond simplement au reste lorsque le nombre donné est divisé par 5. 189
L’ascension des mathématiques
Le point de vue moderne est que la relation de congruence définit une nouvelle sorte d’arithmétique, que l’on appelle arithmétique modulaire ou « arithmétique mod m ». L’étape cruciale est de penser la classe de tous les nombres qui sont congruents à un module donné comme un nouveau type de nombres. Par exemple, en arithmétique mod 5, il y a cinq classes notées 0, 1, 2, 3, 4. Les règles de l’arithmétique ordinaire impliquent que la relation de congruence se comporte bien par rapport à l’addition et à la multiplication, si a1 et b1 sont congruents à a2 et b2, alors a1 + b1 est congruent à a2 + b2 et a1 × b1 est congruent à a2 × b2. Il en résulte que les classes 0, 1, 2, 3, 4 peuvent être ajoutées et multipliées par de simples applications des règles ordinaires, comme le montrent les tables (figure 7.4).
Addition
0
1
2
3
4
Multiplication
0
1
2
3
4
0
0
1
2
3
4
0
0
0
0
0
0
1
1
2
3
4
0
1
0
1
2
3
4
2
2
3
4
0
1
2
0
2
4
1
3
3 4
3 4
4 0
0 1
1 2
2 3
3 4
0 0
3 4
1 3
4 2
2 1
Figure 7.4 | Tables d’addition et de multiplication dans l’arithmétique mod 5.
Les Disquisitiones de Gauss contiennent de nombreux résultats fondamentaux sur l’arithmétique modulaire, suffisamment pour montrer que ce n’est pas seulement de l’abstraction pour l’abstraction. En particulier, quand le module est un nombre premier p, il en résulte que l’arithmétique mod p possède quelques propriétés remarquables. Mais la beauté n’est pas leur seul attribut, elles sont si utiles que l’on ne pourrait pas se passer d’elles, comme nous le verrons au chapitre 11. Nous devons nous souvenir d’une chose, ces résultats sont valables pour tout nombre premier p, même très grand. On a tendance à 190
LE COMPTE Y EST !
L’ascension des mathématiques
penser aux petits nombres comme 5 et 113, mais le théorème est vrai pour tous les nombres premiers, tels que, par exemple : p = 19 071 808 545 892 096 411 623 637 574 883 577 971 067 495 906 730 316 533 701 683 922 600 112 207 679 844 273 858 329 666 379 998 629 245 551 661 101.
Mais cette valeur de p est aussi très petite, elle n’a que 108 chiffres, alors que le plus grand nombre premier connu est le nombre premier de Mersenne 257 885 101 – 1 qui a plus de 17 000 000 chiffres. Traduit en langage d’arithmétique modulaire, le petit théorème de Fermat énonce que, en arithmétique mod p, p premier, tout élément non nul x, tel que xp – 1, est congruent à 1. Euler avait noté qu’il existait toujours un élément r pour lequel les puissances r, r2, r3, ... rp – 1 sont toutes différentes et puisqu’il y en a p – 1, ces puissances sont toutes des éléments non nuls. Comme on le sait, Euler n’avait pas une démonstration complète de cette propriété, mais peu après sa mort, elle a été démontrée par Legendre et par Gauss dans Disquisitiones. Tout nombre r qui possède cette propriété est appelé racine primitive de p : par exemple, 2 est une racine primitive de 5, car en arithmétique mod 5, 21 = 2, 22 = 4, 23 = 3, 24 = 1. Une conséquence de ce résultat est que dans l’arithmétique mod p, tout nombre (sauf 0) a un inverse ; pour tout x, il existe un y tel que le produit x × y = 1. Une autre conséquence utile est que l’on peut introduire les « logarithmes »74. Étant donné toutes ces propriétés remarquables, ce n’est pas une surprise de constater que le monde merveilleux de l’arithmétique modulaire est encore exploré au XXIe siècle. Gauss avait de nombreux intérêts scientifiques qui l’ont conduit à faire des avancées dans presque toutes les branches des mathématiques. Par exemple, son intérêt pour l’astronomie, suscité par la 74. Étant donné une racine primitive r, pour tout couple de nombres a et b, on sait que a = ru et b = rv. Il en résulte que ab = ru + v : en d’autres termes, u est une sorte de logarithme de a et v est une sorte de logarithme de b, et on peut calculer le produit ab en calculant la somme des logarithmes u + v. 191
L’ascension des mathématiques
découverte des astéroïdes Cérès et Pallas, l’a encouragé à inventer des méthodes de calcul des orbites à partir d’un petit nombre d’observations. D’autres problèmes de l’astronomie l’ont inspiré et l’ont amené à apporter d’importantes contributions en statistique ; celles-là seront décrites plus tard. Ses travaux sur l’électricité et le magnétisme l’ont conduit à une forme de télégraphe électrique et une unité de flux de densité de champ magnétique porte son nom. Nombre de travaux mathématiques de Gauss n’ont pas été publiés de son vivant, en partie parce qu’il recherchait toujours de meilleures méthodes de démonstration. Ses travaux sur la géométrie l’ont conduit à considérer le statut de l’axiome d’Euclide énonçant que par un point, il passe exactement une droite parallèle à une droite donnée. Il y avait eu de nombreuses tentatives pour démontrer que cet énoncé pouvait être déduit des autres axiomes, mais Gauss avait conclu que ces tentatives étaient vaines et, vers 1830, son point de vue a été vérifié par Janos Bolyai (1802–1860) et Nikolai Lobachevskii (1793–1856). Leur méthode consistait à montrer que des systèmes de géométrie non euclidienne sont logiquement cohérents. Il est possible de définir des géométries dans lesquelles par un point passent de nombreuses droites parallèles à une droite donnée – ou en réalité à aucune droite. Aujourd’hui, notre vision du monde réel est fondée sur des idées géométriques nettement plus élargies que celles autorisées par Euclide et de telles possibilités ne sont pas surprenantes. Mais du temps de Gauss, de nombreuses personnes pensaient que la géométrie euclidienne était une loi de la nature, traduisant la vérité du monde réel et, pour elles, la possibilité de géométries non euclidiennes fut un grand choc.
VERS LA LIMITE, PRÉCISÉMENT Au début du XIXe siècle, les calculs de Newton et de Leibniz avaient trouvé de nombreuses applications et ils étaient utilisés sans état d’âme sur leurs fondements. Mais des personnes d’un naturel 192
LE COMPTE Y EST !
L’ascension des mathématiques
nerveux (des mathématiciens) étaient encore inquiètes. L’une des critiques les plus virulentes avait été formulée par George Berkeley, un évêque irlandais, dans son livre The Analyst, or a Discourse Addressed to an Infidel Mathematician (1734). Il y évoquait « les fantômes de quantités défuntes », faisant allusion aux petits incréments qui étaient initialement non nuls, mais qui étaient finalement mis égaux à zéro pour obtenir les réponses attendues. Une telle critique était troublante. Un problème relié au précédent était de définir précisément le système des nombres dans lequel on effectuait les calculs. Les nombres entiers et les fractions étaient admis, et l’utilisation de la notation décimale permettait de s’en sortir pour faire face aux autres nombres nécessaires comme √2 = 1,414 21..., π = 3,141 149..., e = 2,718 28... Mais, en réalité, la notation décimale est simplement une façon d’écrire les nombres comme des séries infinies de fractions ; par exemple, 1,414 21... est une autre façon d’écrire 1+
4 1 4 2 1 + + + + + ... 10 100 1000 10 000 100 000
Donc le problème subsiste : expliquer comment une série infinie de termes peut avoir une somme finie. L’étape cruciale consistait à clarifier la notion de limite. Par exemple, si la dépendance de y par rapport à x est donnée et, par conséquent, la relation entre les différentielles dy et dx est connue, comment la limite du rapport dy/dx sera-t-elle définie ? Lorsque dx tend vers 0, et qu’il en est de même de dy, le piège de donner un sens à 0/0 doit être évité. Progressivement, il émergea une forme de mots logiquement précise. On doit dire que la limite est L si l’on peut approcher dy/dx aussi près que l’on veut de L, en choisissant dx suffisamment proche de 0. De même, pour la somme d’une série infinie, on doit insister sur le fait que l’on peut rendre la somme Sn de n termes aussi proche que l’on veut de S en prenant n suffisamment grand. Au XVIIIe siècle, plusieurs mathématiciens ont essayé d’élaborer des définitions précises des notions de base. La nécessité de donner 193
L’ascension des mathématiques
des définitions réellement rigoureuses a été soulignée par Bernard Bolzano (1781–1848). En 1817, il publia un court pamphlet avec un titre qui peut être traduit grossièrement par « Une démonstration purement analytique du théorème qui dit qu’entre deux valeurs de x qui donnent des valeurs opposées à y, on a au moins une racine de l’équation. » Pendant longtemps, ce résultat avait été admis pour localiser les racines d’une équation. Par exemple, pour localiser les racines de l’équation x3 + x – 1 = 0, on peut commencer par calculer quelques valeurs : x: x3
+x–1:
–2
–1
0
1
2
–11
–5
–1
1
9
Sur la base de ce tableau, il est évident intuitivement qu’il y a une racine entre 0 et 1. La valeur de x3 + x – 1 est négative pour x = 0 et positive quand x = 1, ainsi sa valeur doit être 0 en un point intermédiaire. Naturellement, cet argument est intuitif, il suppose que les valeurs de x3 + x – 1 varient continûment, comme on le suppose lorsque l’on trace le graphe de la courbe d’équation y = x3 + x – 1. Bolzano voulait éviter le recours à l’intuition, et il y est parvenu en donnant une définition de la continuité, à partir de laquelle le résultat peut être obtenu. Quelques années plus tard, probablement après avoir lu Bolzano, Augustin-Louis Cauchy a utilisé des définitions similaires comme point de départ pour son Cours d’analyse qui a eu un rôle très influent. Les travaux de Bolzano et de Cauchy clarifiaient les notions de base de limites et de continuité, mais un problème subsistait. Leurs démonstrations supposaient qu’il n’y avait pas de lacunes dans le système de nombres. Cela semble évident intuitivement, mais à cette époque, il n’y avait aucune justification logique de cette propriété. Bien qu’il ait été possible de dire précisément ce qu’était une limite, il n’était pas possible de garantir l’existence de la limite. La difficulté a été surmontée par Richard Dedekind (1831–1916) et Georg Cantor 194
LE COMPTE Y EST !
L’ascension des mathématiques
(1845–1918). Ils ont donné des constructions explicites d’un système de nombres qui n’a pas de lacune : les nombres appelés réels. À la fin des années 1870, les fondements semblaient solides, car le système de nombres représentait assez précisément le schéma intuitif des points sur une droite. Aujourd’hui, on peut enseigner les fondements de l’analyse mathématique aux étudiants débutants sans se préoccuper « des fantômes des quantités disparues ». Mais cela ne signifie pas que les mathématiques sont un livre ouvert. Au début du XXe siècle, les mathématiciens ont commencé à trouver que le système des nombres possédait des propriétés contre-intuitives : par exemple, quand on essaie de mesurer un ensemble arbitraire de nombres75. Cette difficulté particulière a de profondes implications pour comprendre la notion de probabilité et ses applications aux problèmes pratiques. Cependant, il serait incorrect de terminer cet exposé de l’analyse moderne sur une note pessimiste. Le théorème des nombres premiers, conjecturé par Gauss, a été démontré au XIXe siècle par Jacques Hadamard et Charles-Jean de La Vallée Poussin en utilisant des méthodes basées sur les nombres complexes. Et à la fin du XXe siècle, Andrew Wiles a démontré le dernier théorème de Fermat, en utilisant un panel de techniques empruntées à de nombreuses branches des mathématiques, si bien qu’il n’y pas de marge assez grande pour en contenir ne serait-ce qu’un résumé.
75. Bien que le système des nombres réels ait des propriétés réconfortantes sur l’existence de la limite (sous certaines bonnes conditions), il n’est malheureusement pas vrai que tout ensemble de nombres réels est mesurable. Ce fait conduit à quelques situations remarquablement contre-intuitives. Par exemple, il est possible de décomposer une boule en morceaux et de rassembler ces morceaux pour construire deux boules de même dimension que la boule originale. 195
8 Saisir sa chance On gagne tant, on perd tant. Quand on joue à lancer une pièce de monnaie, le résultat (face ou pile) est incertain. Mais si l’on répète l’expérience de nombreuses fois, on s’attend à ce que les nombres de faces et de piles soient à peu près les mêmes. Ce chapitre décrit comment une théorie satisfaisante de ces événements a été développée et comment elle peut aider à résoudre des problèmes tels que calculer combien vous pouvez espérer de vos investissements financiers.
DE GRANDES ESPÉRANCES Autrefois, un jeu populaire consistait à lancer de petits morceaux d’os et à parier sur la façon dont ils retombaient76. À l’époque, on se mit à sculpter l’os en un cube et à graver sur chaque face des symboles représentant les nombres 1, 2, 3, 4, 5, 6. Cet objet sera appelé dé. De notre point de vue, le point important est que la forme symétrique
76. Une bonne introduction à l’histoire des débuts des probabilités et de la statistique se trouve dans Games, Gods, and Gambling de F. N. David (Londres, Griffin, 1962). 197
Saisir sa chance
du cube justifie l’hypothèse selon laquelle le dé est non pipé, ce qui signifie que, lorsque le dé est tombé, le nombre figurant sur sa face supérieure peut être n’importe lequel des nombres de 1 à 6, et ce, de manière équiprobable. (Cette remarque apparemment simple est l’objet de difficultés philosophiques, mais nous les laisserons de côté pour le moment.) Historiquement, l’hypothèse de l’équité était une justification de l’application des méthodes mathématiques à l’étude des jeux de dés. Supposons que trois dés non pipés soient lancés et que les joueurs parient sur la somme des trois nombres inscrits sur leurs faces supérieures. Les totaux possibles peuvent varier de 3, quand les trois dés affichent 1 sur leurs faces supérieures, à 18 s’ils affichent 6. Les personnes qui jouaient à ce jeu régulièrement avaient remarqué que les totaux n’apparaissaient pas tous aux mêmes fréquences et ils pariaient en tenant compte de cette observation. Ils pouvaient deviner aussi qu’un total comme 11 apparaissait plus fréquemment que 3 ou 18 car 11 peut se présenter de plusieurs façons différentes (figure 8.1).
Figure 8.1 | Les six partitions de 11 qui résultent du lancement de trois dés.
Mathématiquement parlant, nous avons ici six partitions de 11 en trois parties, soumises à la condition que chaque partie soit un nombre de 1 à 6. Pour chacun des totaux possibles, il est facile de calculer le nombre des 56 partitions. 198
LE COMPTE Y EST !
Saisir sa chance
Total
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18
Partitions
1
1
2
3
4
5
6
6
6
6
5
4
3
2
1
1
Pour analyser complètement le jeu, un peu de réflexion est nécessaire car une partition peut se présenter plus d’une fois. Chaque dé peut montrer six valeurs possibles, et quand les trois dés sont lancés en même temps, il y a 6 × 6 × 6 = 216 résultats possibles. Supposons que l’on distingue les dés, en les appelant par exemple rouge, vert et bleu. La partition avec les nombres 5, 4, 2 se présente lorsque ces trois nombres sont visibles sur les trois dés dans un ordre quelconque ; il importe peu que ce soit sur le dé rouge, le dé vert ou le dé bleu. En d’autres termes, la partition 5 + 4 + 2 peut apparaître de six façons, correspondant aux permutations 3 × 2 × 1 des nombres 5, 4, 2. Cela est vrai pour toute partition composée de nombres distincts. Toutefois, une partition comme 5 + 5 + 1 ne peut se présenter que trois fois : 1 peut apparaître sur les trois dés et les deux autres dés doivent afficher seulement 5. En se référant au tableau ci-dessus, nous constatons que trois des 11 partitions apparaissent six fois et les trois autres trois fois, donc le nombre total d’apparitions de la somme 11 est 27, parmi les 216 résultats possibles. Une analyse du jeu avec trois dés se retrouve dans un long poème narratif écrit en latin vers 1250. Dans ce poème, la relation entre les 56 partitions et les 216 résultats possibles est décrite très clairement. Parmi les nombreux manuscrits et copies de ce poème, intitulé De Vetula77, celui que l’on trouve dans la Bibliothèque britannique est annoté et illustré de dessins et d’une table qui donne les nombres pertinents pour chaque total.
77. De Vetula est une allégorie complexe autour d’un amour non partagé (ainsi qu’on le disait) et le titre signifie littéralement « One the Old Woman ». The British Library, copie BL.Ms.Harl.5263. 199
Saisir sa chance
Totaux
Partitions
Résultats
3
18
1
1
4
17
1
3
5
16
2
6
6
15
3
10
7
14
4
15
8
13
5
21
9
12
6
25
10
11
6
27
56
216
Comme l’analyse de De Vetula est inhabituelle pour cette époque et ce lieu, quelques historiens ont suggéré une origine islamique des calculs. En effet, il y a une ressemblance avec la manière dont la fréquence relative des lettres dans un code de messages était utilisée par les cryptographes islamiques. L’une des raisons pour lesquelles de nombreuses copies de De Vetula ont survécu est peut-être le fait que le livre offrait un moyen de faire du profit avec des jeux. Ceux qui avaient assez de chance d’en obtenir une copie voulaient la garder en sécurité. Le parieur médiéval typique n’avait aucune idée d’explication rationnelle de la façon dont le dé pouvait tomber : en réalité, beaucoup considéraient que tenter de réaliser des prédictions de n’importe quelle sorte était une intrusion dans le royaume des divinités. La toile enchevêtrée des idées concernant le risque et la chance entourant ce que l’on appelle les jeux de hasard faisait partie de leurs attraits. Dans ce contexte, on peut imaginer un scénario dans lequel un entrepreneur médiéval (que l’on appelle aujourd’hui bookmaker) crée un jeu et invite les joueurs à parier sur les résultats du lancer de trois dés. Un joueur qui parie correctement reçoit une lire du bookmaker. Si le jeu est équitable, le bookmaker demande une participation en fonction des nombres trouvés dans De Vetula : par exemple, un joueur pariant sur 11 a 200
LE COMPTE Y EST !
Saisir sa chance
27 chances sur 216 et devrait parier 27/216 de lire (30 deniers). Il est clair que le bookmaker peut faire du profit en demandant des mises plus élevées que celles qui seraient équitables : certains lancers pourront représenter une perte pour lui, mais quand les dés sont lancés plusieurs fois, les mises dépasseront les paiements. Au XXIe siècle, ce principe est à la base d’une industrie qui brasse des milliards de dollars. Au Moyen Âge, l’intérêt pour les mathématiques des paris était guidé partiellement par les analogies entre les jeux de dés et les problèmes de finance et de commerce. Au XIVe siècle, les marchands italiens avaient commencé à établir des contrats garantissant des domaines comme l’assurance maritime. Cela concernait l’estimation du risque encouru lorsqu’une cargaison de marchandises était transportée et, comme dans un jeu, le risque devait être évalué de telle sorte qu’il puisse s’exprimer en termes monétaires. Il y avait le vague sentiment que l’enjeu (la prime d’assurance) devait être déterminé par la perspective de gain ou de perte, mais une base mathématique pour cette notion n’était pas encore disponible. Le développement d’une base solide fut le résultat d’un travail sur un problème ressemblant aux problèmes de marché. Il était connu sous le nom de problème des points. Le scénario est similaire à celui d’un « set » de tennis, où deux personnes jouent à plusieurs reprises jusqu’à ce qu’un joueur atteigne un certain nombre de points. Les joueurs mettent les mêmes mises et le joueur qui gagne le set empoche la mise. (Pour simplifier, on laisse de côté les règles du tie-break.) Le problème est le suivant : si le set est interrompu avant la fin, comment la mise doit-elle être partagée ? Il existe un manuscrit datant des années 1400, probablement destiné aux élèves d’une école italienne des abaques, qui contient la solution correcte du cas où trois succès constituent une victoire et le jeu est interrompu sur le score de 2-0. Dans ce cas, les mises doivent être divisées selon le rapport 7:1. Cependant, le même manuscrit traite d’un autre cas pour lequel une réponse fausse est obtenue. 201
Saisir sa chance
Clairement, à l’époque, il n’y avait aucune base solide aboutissant à une solution générale et un long temps s’est écoulé avant que le résultat soit fondé. Luca Pacioli a discuté ce problème dans Summa et suggéré que les mises devaient être partagées de la même façon que le score en cours : si le score est de 4-3 lorsque la partie est interrompue, les mises doivent être partagées selon le rapport 4:3. Malheureusement, la règle de Pacioli peut conduire à des résultats déraisonnables. Par exemple, si la partie est interrompue sur le score de 1-0, le second joueur ne recevra rien, ce qui n’est pas une évaluation raisonnable de l’espérance du joueur. Une solution rationnelle au problème des points n’est pas apparue avant le XVIIe siècle. Elle était basée sur une définition de probabilité qui permettait à l’espérance d’être définie de manière cohérente. Les détails sont développés dans la correspondance entre Fermat et son ami Blaise Pascal commencée en 1654. On expliquera la méthode de Fermat en considérant le cas où les succès sont nécessaires pour gagner, mais que la partie est interrompue sur le score de 5-4. Fermat commence par suggérer que les espérances des joueurs Alice (A) et Bob (B) devraient dépendre seulement du nombre de succès dans les jeux non joués dont ils auraient besoin pour gagner. Si ces nombres sont notés a et b, alors a = 2 et b = 3 dans notre exemple. Exactement les mêmes valeurs s’appliqueraient si le total était de 8 et le score de 6-5. Fermat fit aussi une observation importante, remarquant qu’un joueur doit gagner après au plus a + b – 1 jeux additionnels. Cela parce que si Alice a gagné moins de a jeux et que Bob a gagné moins de b jeux, alors ils doivent jouer au plus (a – 1) + (b – 1) = (a + b) = a + b – 2 jeux. Donc pour a = 2 et b = 3, quatre jeux supplémentaires au plus sont nécessaires. Il est facile d’établir une liste de tous les résultats possibles de ces quatre jeux : il y a 2 × 2 × 2 × 2 × = 16 possibilités en tout.
202
AAAA
AAAB
AABA
AABB
ABAA
ABAB
ABBA
AAAB
BBBB
BBBA
BBAB
BBAA
BABB
BABA
BAAB
BAAA
LE COMPTE Y EST !
Saisir sa chance
L’analyse de ce tableau montre qu’Alice devrait gagner dans tous les cas soulignés ; elle a donc 11 chances et Bob 5 seulement. Si l’on suppose que chacune des 16 possibilités sont équiprobables, alors les mises doivent être partagées selon le rapport 11:5. Quelques points discutables dans l’argument de Fermat étaient passés sous silence dans sa correspondance avec Pascal78. Le fait que les quatre sets additionnels n’étaient pas toujours nécessaires soulevait certaines questions, mais Pascal fut capable de montrer que la conclusion de Fermat était néanmoins correcte. Au cours de cette analyse, il fut amené à étudier des nombres de combinaisons n qui, comme nous le savons (chapitre 5), sont simplement les r
coefficients du binôme. Le résultat du travail de Pascal fut un livre classique, Le Triangle arithmétique, dans lequel il donnait un exposé complet en termes modernes de la configuration triangulaire formée par ces nombres. Muni de cette information, il fut capable de trouver la solution générale du problème des points, sans disposer de la liste de toutes les possibilités. Il est à noter qu’Alice gagne dans tous les cas où Bob n’atteint pas b ou plus de succès au cours des a + b – 1 jeux non joués. Dans notre exemple, les possibilités pour lesquelles Bob a 0, 1 ou 2 succès en quatre jeux entraînent une victoire d’Alice, et le nombre de possibilités est alors 4 + 4 1 0
+ 4 2
= 1 + 4 + 6 = 11.
De même, une victoire de Bob se produit dans les cas où il réussit dans 3 ou 4 jeux, et le nombre de possibilités est 4 + 4 = 4 + 1 = 5. 4 3
78. La correspondance entre Fermat et Pascal est disponible en anglais dans le livre de F. N. David (comme dans la note 1). 203
Saisir sa chance
La notion générale qui ressort de l’analyse de Fermat-Pascal est l’attribution à un événement d’un nombre p qui mesure sa probabilité. La situation la plus simple est lorsque l’on se donne n événements, qui ne se recoupent pas, et qui épuisent tous les résultats possibles. Alors les probabilités de ces événements, notées p1, p2, ..., pn, sont des nombres compris entre 0 et 1 qui doivent satisfaire la condition p1 + p2 + ... + pn = 1.
Dans notre exemple du problème des points, les événements élémentaires étaient les 16 résultats possibles des quatre jeux non joués, comme listés ci-dessus. Chacun d’entre eux était supposé équiprobable, ainsi il n’y a que seize probabilités p1, p2, ..., p16, chacune égale à 1/16. La probabilité d’un événement composé, tel que « A gagne », s’obtient en ajoutant les probabilités des 11 événements qui le constituent, donc on a Probabilité(A gagne) =
1 1 1 11 + + ... + = . 16 16 16 16
Il apparaît que ce simple cadre est une base adéquate pour décrire de nombreuses situations où intervient une part de hasard. En l’utilisant pour formuler une définition de l’espérance, cela conduit à une théorie résolvant de nombreux problèmes qui semblaient auparavant mystérieux. Dans notre exemple, on suppose qu’Alice et Bob ont misé chacun une lire ; alors si Alice gagne, elle gagnera 1 lire et si elle perd, elle gagnera –1 lire. Ainsi l’espérance d’Alice est Probabilité(A gagne) × 1 + Probabilité(A perd) × (–1) =
11 5 3 – = . 16 16 8
Généralement, l’espérance de gain est obtenue en ajoutant les termes p × g, où p est la probabilité de gagner g. Comme la méthode des fluxions de Newton, la théorie des probabilités du XVIIe siècle n’avait pas dit tout à fait son dernier mot sur le sujet. Dans la suite de ce chapitre, nous expliquerons comment la 204
LE COMPTE Y EST !
Saisir sa chance
théorie s’est développée et a été utilisée pour construire des modèles de situations plus complexes.
JEUX ET STRATÉGIES Les règles de base pour le calcul des probabilités telles que les avaient décrites Fermat et Pascal ont été rapidement appliquées aux problèmes de jeux de différentes catégories. Jakob Bernoulli a travaillé sur ce sujet de 1684 environ jusqu’à sa mort en 1705, mais son livre Ars Conjectandi (« L’Art de la conjecture ») a été publié pour la première fois en 1713. Pierre de Montmort a publié la première version de son livre Essai d’analyse sur les jeux de hasard en 1708 et a publié ensuite une nouvelle version plus développée en 1713. Une illustration du livre de Montmort montre plusieurs jeux auxquels on jouait dans ce qui paraît être un splendide environnement, peut-être l’un des châteaux de Louis XIV. Parmi les personnes dépeintes figurent Montmort lui-même et (pense-t-on) Minerve, la déesse de la sagesse. Un jeu de cartes auquel jouaient les aristocrates français était connu sous le nom de Her. Bien que le jeu lui-même soit simple, son analyse exigeait de très nombreux calculs. Les détails sont développés dans la correspondance entre Montmort et Nikolaus Bernoulli79, et leurs résultats furent publiés dans la seconde édition du livre de Montmort, Essai. L’importance particulière de cet ouvrage est qu’il constituait le premier exemple connu d’une manière entièrement nouvelle de considérer les jeux. Le Her est un jeu de cartes à deux joueurs qu’on appellera Min (Minerve) et Mon (Montmort). On utilise un jeu de 52 cartes dont les valeurs vont dans l’ordre croissant 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, valet,
79. Ce Nikolaus Bernoulli était le fils d’un frère de Jakob et Johann. Il y avait un autre Nikolaus Bernoulli, fils de Johann, qui a apporté aussi des contributions aux mathématiques. 205
Saisir sa chance
reine, roi, les couleurs étant sans importance. Le jeu se déroule en quatre étapes qui se présentent comme suit. 1. Une carte du jeu est distribuée à chaque joueur. Si Mon a un roi, il gagne et le jeu est terminé, autrement le jeu continue. 2. Min peut ou garder sa carte, ou bien échanger sa carte avec celle de Mon. 3. Mon peut ou garder sa carte ou l’échanger avec une carte tirée au hasard dans le jeu. 4. Si Min a la carte dont la valeur est plus élevée, elle gagne, sinon Mon gagne (cette éventualité inclut le cas où les deux cartes sont les mêmes). Noter que si Min a opté pour l’échange à l’étape (2), les joueurs connaissent les deux cartes et l’option pour Mon à l’étape (3) est déterminée : elle doit garder sa carte si elle sait qu’elle va gagner et l’échanger sinon. Il a un choix réel à faire à l’étape (3), uniquement lorsque Min a opté pour conserver sa carte à l’étape (2). L’analyse du jeu dépend de la stratégie adoptée par chaque joueur. Pour chacune des 13 dénominations des cartes, un joueur peut opter pour garder ou échanger quand il tient sa carte, ce qui signifie qu’il dispose, à première vue, de 2 × 2 × 2 × ... × 2 = 213 stratégies possibles. Mais presque toutes les cartes peuvent être laissées de côté. On note Hc la stratégie : garder la carte c ou de plus haute valeur, autrement l’échanger.
Montmort et Bernoulli ont étudié le cas où chaque joueur a seulement deux stratégies favorables à considérer, car on peut montrer que toutes les autres sont inférieures. Pour Min, les deux stratégies sont H7 et H8 et pour Mon H8 et H9. Supposons que Min joue H7 et Mon joue H8. Montmort et Bernoulli effectuent une longue série de calculs complexes sur la probabilité des cartes tirées à l’étape (1) et la probabilité qu’une carte particulière soit tirée du jeu à l’étape (3). Ils déduisent que dans ce cas, Min peut s’attendre à gagner 2 828 206
LE COMPTE Y EST !
Saisir sa chance
des 5 525 jeux. Des calculs analogues pour les autres cas conduisent au tableau ci-dessous. Mon joue H8
Mon joue H9
Min joue H7
2 828
2 838
Min joue H8
2 834
2 828
Jusqu’ici, l’analyse est standard bien que les détails soient complexes. La conclusion essentielle est que Min a un léger avantage puisqu’elle est assurée de gagner au moins 2 828 jeux, ce qui est plus grand que la moitié de 5 525. Toutefois, il apparaît que c’est la meilleure stratégie qu’elle puisse adopter, car si elle joue H7, Mon jouera H8, et si elle joue H8, Mon jouera H9. La question est : comment peut-elle utiliser les résultats légèrement meilleurs offerts par les autres entrées du tableau ? La réponse à cette question est communiquée dans une lettre à Montmort par un certain Monsieur de Waldegrave, datée du 13 novembre 1713. Waldegrave est un personnage pratiquement inconnu80, mais sa suggestion était claire : Min devrait varier ses stratégies. Précisément, à chaque jeu, elle devrait choisir H7 ou H8 selon un mécanisme aléatoire. Elle pourrait disposer d’un sac contenant des jetons noirs et des jetons blancs, extraire un jeton à chaque fois et jouer H7 si le jeton est noir ou H8 si le jeton est blanc. En termes mathématiques, cela correspond à jouer H7 avec une probabilité x et H8 avec une probabilité 1 – x, où x est la proportion de jetons noirs par rapport à la proportion de jetons blancs. Aujourd’hui, on l’appelle stratégie mixte (x, 1 – x). Pour voir pourquoi la stratégie mixte marche, on peut simplifier la situation en considérant seulement les nombres du tableau qui 80. Voir l’article de David Bellhouse « The Problem of Waldegrave » disponible sur le site internet www.jehps.net (consulté le 1er juin 2015) ; voir aussi D. Bellhouse et N. Fillion. « Le Her and other problems in probabilities discussed by Bernoulli, Montmort, and Waldegrave », Statistical Science 30 (2015) 26–39. 207
Saisir sa chance
améliorent la situation de base, 2 828. On fera référence à ces nombres comme étant des gains : 0
10
6
0
Supposons que Min joue la stratégie (x, 1 – x). Si Mon joue H8, elle s’attend à un gain de 0 avec la probabilité x et à un gain de 6 avec la probabilité 1 – x. En d’autres termes, elle s’attend à un gain de 6(1 – x). Si Mon joue H9, elle s’attend à un gain de 10 avec une probabilité x et à 0 avec une probabilité 1 – x, c’est-à-dire 10x. Ainsi Min est assurée de gagner la plus petite de ces quantités quelle que soit la stratégie choisie par Mon. Ici, un simple diagramme peut aider à comprendre (figure 8.2).
10x
6(1 – x) 0
3 8
1
Figure 8.2 | Les espérances de Min pour la stratégie mixte (x, 1 – x) si Mon choisit H8 et H9.
Les droites en gras représentent la plus petite des valeurs de 6(1 – x) et 10x pour chaque valeur de x. Il s’agit du minimum de gain garanti pour Min, quelle que soit la stratégie adoptée par Mon. Donc Min choisira la valeur de x de telle sorte que ce gain minimum garanti soit aussi grand que possible : en d’autres termes, elle cherchera à maximiser ce minimum. Il est clair, d’après le graphique, que le meilleur choix possible est celui de x tel que 6(x – 1) = 10x. Ce qui arrive pour 208
LE COMPTE Y EST !
Saisir sa chance
x = 3/8, donc le gain maximum de Min pour cette stratégie particulière est 10 × 3/8, soit trois et trois quarts pour tout jeu gagnant. Ces résultats avaient été obtenus par Waldegrave en 1713. Il n’a pas donné de détails de son analyse, mais il savait que si Min jouait H7 trois fois sur huit et H8 cinq fois sur huit, elle pouvait améliorer son résultat 2 828 fois sur les 5 525 jeux qu’elle pouvait espérer gagner en utilisant seulement des stratégies simples. En réalité, elle pouvait espérer gagner un supplément dans trois et trois quarts des jeux. La découverte sous-jacente de Waldegrave contenait une partie remarquable de mathématiques qui n’a pas été complètement reconnue avant le XXe siècle, jusqu’à ce que les mathématiciens commencent à étudier sérieusement la théorie des jeux. Supposons que l’on fasse une analyse similaire, mais du point de vue de Mon plutôt que de celui de Min. On trouve qu’il est possible aussi d’améliorer ses résultats à partir de stratégies simples utilisant une stratégie mixte. Son but doit être de minimiser ses pertes maximum et cela peut être fait de la même façon que Min maximise son gain minimum. Le trait remarquable est que le résultat pour Mon se trouve être l’inverse de celui de Min : la plus petite perte possible de Mon est la même chose que le gain le plus grand possible de Min. La première tentative d’application des méthodes mathématiques modernes aux jeux de stratégie est un article d’Ernst Zermelo en 1913. Il discutait quelques questions de base concernant les résultats possibles du jeu d’échecs, mais ses résultats sont très généraux – ils sont fréquemment cités de manière erronée81. L’analyse détaillée des échecs est complexe, mais le jeu de Her est beaucoup plus simple car il y a exactement deux stratégies pures pour chaque joueur. Aujourd’hui, il est appelé jeu à deux personnes à somme nulle avec de 81. L’expression « théorème de Zermelo » se retrouve fréquemment dans la littérature sur la théorie des jeux, mais de nombreuses déclarations qui lui sont attachées sont vaguement liées à ce que Zermelo a écrit réellement dans son article. Voir U. Schwalbe et P. Walker, « Zermelo and the Early History of Game Theory », Games and Economic Behaviour 34 (2001) 123–137. 209
Saisir sa chance
nombreuses stratégies simples. Le nom indique que le gain pour un joueur est exactement l’opposé du gain de l’autre joueur, quel que soit celui qui gagne ou celui qui perd. Le tableau des gains a un nombre fini de lignes et de colonnes, et ses propriétés peuvent être étudiées en utilisant les techniques analytiques qui sont les outils mathématiques du quotidien. Le traitement moderne de ce type de jeu a été initié par Émile Borel, dans une série d’articles écrits entre 1921 et 1927. Il a trouvé, dans de nombreux cas, que la solution avait la propriété remarquable soulignée dans le paragraphe précédent et a conjecturé que ce résultat était vrai en général. En 1928, von Neumann a donné une démonstration complète de ce fait : pour un jeu à deux personnes à somme nulle, il existe des stratégies telles que le maximum du gain minimum pour un joueur est égal au minimum des pertes maximum pour l’autre. Dans certains cas, les stratégies sont simples, mais habituellement elles sont mixtes. En d’autres termes, un équilibre existe pour les jeux de ce type. L’implication selon laquelle les situations compétitives peuvent conduire à un jeu équitable et à un résultat équilibré a inspiré von Neumann et Oskar Morgenstern qui ont écrit un livre célèbre, The Theory of Games and Economic Behaviour, publié pour la première fois en 1944. Depuis lors, de nombreux travaux ont été réalisés pour étendre l’idée d’équilibre et l’appliquer à toutes sortes de jeux, tels que ceux dans lesquels les deux joueurs ne disposent pas d’une information complète concernant les résultats.
LA LOI DES GRANDS NOMBRES On pense que les origines du lancer des pièces de monnaie et l’approche mathématique déductive remontent au monde grec, en particulier la partie de l’Asie Mineure connue sous le nom de Lydie. Dans des écrits datant d’environ 450 ans avant J.-C., Hérodote affirmait que les Lydiens avaient inventé aussi de nombreux jeux de hasard pour se distraire alors qu’ils étaient victimes d’une grande famine. C’est presque certainement faux mais, comme on l’a vu, les jeux 210
LE COMPTE Y EST !
Saisir sa chance
ont longtemps été un passe-temps courant. En réalité, il existe des preuves qu’un type de jeu assez primitif, basé sur le lancer d’osselets, était populaire à l’ère romaine. L’un de ces osselets était un astragale trouvé dans les talons des moutons et d’autres animaux. Sa forme irrégulière fait que lorsque l’astragale est lancé, il peut retomber sur l’une des quatre positions possibles qui ne sont pas toutes équiprobables. Bien que le résultat sur un simple lancer ne puisse pas être prévu, on peut néanmoins, pour un grand nombre de lancers, faire certaines prévisions avec une certaine cohérence, car la proportion des lancers donnant un résultat particulier reste à peu près la même, aussi souvent que l’expérience est répétée. Il n’est pas clair d’après la preuve romaine que cette observation ait été clairement formulée en termes numériques. Cependant, il est raisonnable de supposer que les joueurs professionnels pouvaient se rendre compte que le profit devait être lié aux caractéristiques d’un astragale particulier. Au IXe siècle après J.-C., un principe similaire était utilisé par les cryptographes arabes pour décrypter les messages cryptés par la méthode de substitution (chapitre 5). Supposons qu’un certain symbole, appelé X, se présente m fois dans un texte de n symboles. Un fait observable est que la fréquence relative m/n reste pratiquement constante, quel que soit le texte, et on peut donc la supposer (approximativement) connue pour n’importe quel texte. La fréquence relative m/n peut être interprétée comme une estimation de probabilité. Si l’on considère une partie quelconque du texte, disons le cinquanteseptième symbole, alors la probabilité pour que ce symbole soit X est m/n. Lorsque la notion de probabilité a été formellement définie vers le milieu du XVIIe siècle, le cadre mathématique a aidé à clarifier les relations entre les modèles mathématiques et les applications pratiques telles que les jeux et la cryptographie. Jakob Bernoulli, dans Ars Conjectandi (1713), et Abraham de Moivre, dans Doctrine des chances (1718, seconde édition en 1738), ont été les premiers à considérer des modèles probabilistes de situations réelles, comme le lancer 211
Saisir sa chance
d’une pièce de monnaie équilibrée. Ils imaginaient un processus qui produit, à chaque essai, l’un des deux résultats F (face) ou P (pile), chacun avec la probabilité 1/2. Le résultat d’une série d’essais ressemblera à quelque chose comme FFPFPPPFFPFPPFFPPPFFFFPFFPPPPPPFFFFFPFPPFFPPPFF.
S’il y a 100 essais, alors il y a 2100 résultats possibles, et chacun a une probabilité (1/2)100. Intuitivement, on s’attend à ce que la série contienne 50 faces et 50 piles, bien que l’on ne doive pas être surpris de trouver que les nombres ne sont pas égaux. Bernoulli et de Moivre avaient essayé de concevoir une justification mathématique de cette intuition. Quelle la probabilité d’avoir exactement 50 faces et 50 piles – en d’autres termes, combien de résultats sur les 2100 possibles ont cette propriété ? Plus généralement, quelle la probabilité d’avoir exactement h faces et 100 – h piles ? Le nombre total des suites, 2100, est un nombre de plus de 30 chiffres, donc ce n’est pas un problème de dresser la liste de toutes les possibilités. Toutefois, on peut faire un petit progrès en utilisant un peu de combinatoire élémentaire. Le nombre de suites avec h faces sur n essais est le nombre de façons de choisir h essais « fructueux » sur n h
un total de n, et il s’agit simplement du coefficient du binôme
.
Divisant par le nombre de possibilités, 2n, on obtient la probabilité requise. Par exemple, la probabilité d’avoir exactement 50 faces pour 100 essais est de 1 2100
100 . 50
Il est important de comprendre pourquoi cette formule ne donne pas une réponse complète à notre problème. Une formule est simplement une façon compacte de représenter un algorithme, de calculer 212
LE COMPTE Y EST !
Saisir sa chance
un nombre, et son utilité dépend de la facilité avec laquelle on peut effectuer les calculs. Cette formule détermine une valeur numérique définie et comment faire en théorie, mais en pratique, elle ne nous aide pas beaucoup. D’après la formule de Bhaskara pour les coefficients du binôme, on sait que 1 2100
1 100 3 99 3 98 3 … 3 51 100 = 2 3 2 3 2 3 … 3 2 × 1 3 2 3 3 3 … 3 50 . 50
Évaluer cette expression exige de nombreuses multiplications et si l’on essaie de faire ces calculs, on comprend rapidement pourquoi c’est un problème. La méthode de de Moivre utilisait deux des outils qui avaient été développés au XVIIe siècle, les logarithmes et les séries infinies. La première étape consistait à appliquer la propriété de base des logarithmes, le fait que le logarithme d’un produit comme 1 × 2 × ... × n est la somme des logarithmes des termes, soit log 1 + log 2 + ... + log n (noter que log 1 est en réalité 0). Puis, à la manière de Newton, il a exprimé chaque logarithme comme une somme infinie et en utilisant un peu d’algèbre astucieuse, il a trouvé que log 1 + log 2 + ... + log n est approximativement égal à (n +
1 ) log n – n + c, 2
où c est un nombre qu’il a calculé et qui est égal à 0,919 environ. Muni de cette formule et de ses variantes, de Moivre a obtenu des estimations des probabilités dans le problème du lancer d’une pièce de monnaie. L’un de ses premiers résultats était que la probabilité d’obtenir 50 faces sur 100 essais était à peu près de 0,079 559. À première vue, les résultats de de Moivre peuvent apparaître comme un moyen habile d’effectuer certains calculs pénibles, mais ils cachaient une nouvelle façon de relier les mathématiques à des situations de la vie réelle. Supposons, pour simplifier, que n soit un nombre pair. Il semble alors raisonnable de penser que le résultat le plus probable sur n essais d’obtenir le nombre h de faces soit n/2 et que le nombre de piles soit aussi n/2. De même, la probabilité 213
Saisir sa chance
d’obtenir n/2 + 1 faces et n/2 – 1 sera légèrement plus petite, et, de manière générale, la probabilité d’obtenir n/2 + d faces et n/2 – d piles décroît lorsque d croît. De Moivre était capable de démontrer mathématiquement ces assertions. De plus, ses estimations numériques lui permettaient de calculer la probabilité que h se situe dans certains intervalles. Par exemple, il a trouvé que « si 3 600 essais sont pris en compte... alors la probabilité de l’événement n’apparaissant pas plus souvent que 1 830 fois ni plus rarement que 1 770 fois sera de 0,682 688 ». Un tel énoncé conduit à un résultat connu sous le nom de loi des grands nombres. Les résultats de de Moivre impliquent que la probabilité que h/n diffère de 1/2 de plus que n’importe quelle quantité donnée tend vers zéro lorsque n croît. Cet énoncé peut être considéré comme une justification de notre notion intuitive de probabilité : dans ce cas, la probabilité d’obtenir face à n’importe quel essai peut être mesurée expérimentalement par la fréquence relative de h faces h/n pour n essais. Mais il faut insister sur le fait que la loi des grands nombres est susceptible d’être mal interprétée : ce n’est pas une justification universelle pour des énoncés désinvoltes selon lesquels certaines choses sont limitées à se produire « en moyenne ». Et comme nous le verrons, son application à des situations de la vie réelle dépend généralement d’hypothèses cachées, notamment quand ces situations impliquent des êtres humains. Nous nous trouvons sur un terrain solide quand nous nous penchons sur les conséquences des travaux de de Moivre. Une découverte amusante a été réalisée par le mathématicien écossais James Stirling, qui, de manière indépendante, a travaillé sur des sommes de logarithmes comme log 1 + log 2 + ... + log n. Il a trouvé que le nombre c de l’approximation de de Moivre, (n + 1/2) log n – n + c, est le logarithme de la racine carrée de 2π. L’apparition de π, l’aire d’un cercle de rayon unité, dans le contexte de calculs de probabilités et de coefficients du binôme, a dû être une grande surprise. Ce qui est plus significatif encore, c’est que le nombre e joue aussi un rôle. Avec du 214
LE COMPTE Y EST !
Saisir sa chance
recul, cela est moins surprenant, car on est coutumier du fait que ex est un autre nom pour « le nombre dont le logarithme hyperbolique est x ». Cependant, cette notation n’était pas utilisée par de Moivre et Stirling dans les années 1730. Quand la formule de de Moivre est exprimée en fonction de e, elle devient une formule que l’on appelle factorielle de n, le produit de 1 × 2 × ... × n. Elle s’écrit habituellement n! et le résultat est connu sous le nom de formule de Stirling : n! est approximativement égale à √(2πn)(n/e)n.
Cette formule est l’un des outils les plus utiles dans la théorie mathématique des probabilités.
STATISTIQUE La collecte des données pour l’administration est une pratique ancienne. Les recensements étaient des événements habituels de la Rome impériale et étaient utilisés pour que les citoyens rendent à César ce qu’il affirmait être à lui par le biais des impôts et du service militaire. Un millier d’années plus tard, les conquérants normands d’Angleterre compilèrent le Domesday Book pour des raisons analogues. Les officiels qui utilisaient ces informations étaient sans doute capables d’en tirer des conclusions générales, mais on ne dispose pas de preuves qu’ils organisaient et consolidaient les données d’une quelconque façon, par exemple pour calculer des moyennes. Les progrès dans ce domaine furent lents et ce n’est qu’au XVIe siècle que l’on peut trouver des traces de ce que l’on appelle aujourd’hui les méthodes statistiques82. Les tables de « statistiques vitales » constituaient un important outil dans le secteur des annuités et d’assurancevie et leur calcul impliquait inévitablement de faire des déductions à partir d’une masse de données empiriques. 82. Consulter The History of Statistics de S. M. Stigler (Cambridge, Mass, Harvard University Press, 1980). 215
Saisir sa chance
Au début du XVIIIe siècle, les travaux de Jakob Bernoulli et d’Abraham de Moivre aboutirent à une meilleure compréhension des implications des données observées. Par exemple, quand les estimations de de Moivre pour la probabilité du nombre h de faces sur 100 lancers d’une pièce non truquée sont représentées sur un graphe, on obtient une courbe remarquable (figure 8.3). La probabilité est plus grande quand h = 50 et s’écarte de chaque côté de cette valeur, devenant très petite (mais pas exactement égale à zéro) aux valeurs extrêmes h = 0 et h = 100. Probabilité
Nombre de lancers 0
50
100
Figure 8.3 | Probabilité d’obtenir h faces sur 100 lancers d’une pièce non truquée.
Un dessin similaire est obtenu pour n’importe quel nombre d’essais n, et lorsque ce nombre croît, les points tracés sont proches d’une courbe lisse, connue sous le nom de courbe en cloche. L’équation de 2 cette courbe peut s’exprimer en fonction de e–d où d = h – n/2 est la déviation à partir du maximum. L’importance fondamentale de la courbe en cloche n’a été reconnue qu’au début du XIXe siècle. À cette époque, il y eut un grand intérêt pour les observations astronomiques qui permettaient de prévoir les mouvements des planètes, des comètes et (en particulier) des astéroïdes. Mais les observations empiriques étaient entachées de nombreuses erreurs et il était nécessaire de faire plusieurs lectures 216
LE COMPTE Y EST !
Saisir sa chance
et de les combiner pour en obtenir une qui soit fiable. Quel était le moyen pour ce faire ? Legendre (1805) et Gauss (1809) découvrirent une solution à ce problème et Gauss la justifia en supposant que la probabilité des erreurs d’observation pouvait être décrite par une courbe en cloche. Cette supposition reçut une confirmation en 1812, lorsque Pierre-Simon Laplace publia sa Théorie analytique des probabilités. La courbe en cloche, dans sa forme analytique, a joué un rôle clé dans une partie de son œuvre. Laplace suggéra qu’une observation numérique peut être considérée comme la moyenne d’un grand nombre de contributions aléatoires indépendantes (erreurs). Il démontra que la distribution d’une telle variable tendra vers la courbe en cloche, quelle que soit la distribution des erreurs. Ce résultat est maintenant connu sous le nom de théorème central limite et, avec la loi des grands nombres, il sous-tend une grande partie de la théorie statistique. Au fur et à mesure des progrès de la statistique, il devint clair que la courbe en cloche était un bon modèle pour de nombreuses autres sortes de données. Pour cette raison, cette distribution de probabilités devint connue sous le nom de normale. Dans certains cas, l’utilisation de la distribution normale est justifiée parce que le théorème central limite de Laplace semble s’appliquer, mais dans d’autres cas, son utilisation est basée sur une conjecture. Cela peut mener à des problèmes ; par exemple, les crises économiques du début du XXIe siècle ont été rejetées d’après l’hypothèse selon laquelle certaines variables financières sont normalement distribuées (voir le chapitre 10). Plus généralement, en statistique, le lien entre la théorie et la pratique s’établit souvent avec difficulté. Pour tirer des conclusions à partir des données observées, il est important d’être clair sur les hypothèses posées. Une bonne illustration s’est présentée dans notre discussion du problème des points. Rappelons que Pacioli avait suggéré que les enjeux devaient être partagés selon le score au moment de l’interruption de la partie, ce qui correspond à l’hypothèse selon laquelle le score donne une information sur la classe relative des 217
Saisir sa chance
joueurs. Cependant, un doute subsiste. Après un jeu, le score doit être de 1-0 ou 0-1, impliquant que l’un des joueurs est infiniment meilleur que l’autre. Cela n’est habituellement pas le cas, parce que le fait qu’ils ont accepté de jouer l’un contre l’autre et parier sur le résultat suggère qu’ils sont de classes comparables. La règle de Fermat de partage des mises s’appuyait sur l’hypothèse selon laquelle les joueurs étaient de même classe, ce qui est habituellement, en pratique, une meilleure supposition. Un autre exemple se présente dans le cas du lancer d’une pièce de monnaie. On a considéré la « pièce non truquée » comme un idéal mathématique et on a assigné la probabilité 1/2 à chacun des deux résultats, F et P. Lorsque la théorie est appliquée à une pièce réelle, on fait l’hypothèse qu’elle est non truquée, dans le sens où les résultats sont équiprobables ; si elle est légèrement endommagée, alors ses propriétés physiques ne correspondent pas exactement à l’idéal. Si l’expérience des 100 lancers est répétée de nombreuses fois et que l’on obtienne 70 faces à chaque fois, on a une bonne raison de supposer que la pièce est truquée. Ces exemples ne font qu’effleurer l’écume à la surface du profond océan que représente la théorie de l’inférence statistique. Au XXe siècle, les statisticiens ont développé de bonnes techniques leur permettant de traiter des situations pratiques, et leurs règles ont été utilisées pour le plus grand bénéfice de l’humanité. Les avancées en médecine, qui ont permis de sauver des millions de vie et en ont prolongé des milliards d’autres, n’auraient pas été possibles sans l’analyse statistique. Mais il subsiste un sérieux débat sur l’interprétation de la notion de probabilité. Un groupe de statisticiens, connus sous le nom de bayésiens, suppose que la probabilité d’un événement est basée sur un « degré de croyance » plutôt que sur la notion de fréquence relative. Ils tiennent leur nom d’un résultat élémentaire de Thomas Bayes, publié après sa mort en 1763. D’après Bayes : « la probabilité que deux... événements se produisent... est la probabilité composée de la probabilité du premier et de la probabilité du second en supposant 218
LE COMPTE Y EST !
Saisir sa chance
que le premier se soit produit ». Laplace, en 1812, dans Théorie, fut le premier à reconnaître l’importance de ce principe dans l’inférence statistique. Dans sa forme abrégée, le résultat de Bayes dit que pour tout couple d’événements A et B, Probabilité(A et B) = Probabilité(A) × Probabilité(B pour A donné).
Le dernier terme est connu maintenant sous le nom de probabilité conditionnelle de l’événement B, lorsque A se produit. Par exemple, supposons que A soit l’événement correspondant à un dé affichant un nombre pair, qui a la probabilité 1/2, et B soit l’événement correspondant au fait que ce nombre soit 4, qui a la probabilité 1/6. Alors le résultat nous dit que la probabilité d’un 4, sachant que le nombre est pair, est de 1/3. Personne ne conteste la véracité du résultat de Bayes, le débat se situe autour du statut de la théorie de l’inférence statistique. Il est bon de souligner une autre innovation du XVIIIe siècle dans le domaine de la statistique. Les données statistiques, allant du nombre de naissances aux chiffres du commerce, étaient présentées sous une forme indigeste, comme des tableaux de nombres. En 1786, William Playfair eut l’idée de présenter les données observées sous la forme d’un graphique, comme des courbes en géométrie cartésienne. Selon lui, « faire appel aux yeux dans le cas où la proportion et l’amplitude sont concernées est la meilleure et la plus lisible des méthodes ». En partant de ce principe, Playfair a construit des diagrammes du commerce maritime anglais en traçant les courbes des valeurs monétaires des importations et des exportations en fonction du temps exprimé en années (figure 8.4)83.
83. Playfair a publié de nombreux diagrammes similaires dans Lineal Arithmetic (Londres, 1798). 219
Saisir sa chance
Figure 8.4 | L’un des graphiques de balance commerciale de Playfair. William Playfair, Commercial and Political Atlas (Londres, 1786). Diagramme tiré de Wikimedia Commons.
Il y a quelque chose de mystérieux dans le fait que ces graphiques de données financières n’aient pas été adoptés plus largement à cette époque. Il se peut que ce soit le coût de la préparation des graphiques pour l’imprimerie, ou peut-être était-ce une réaction envers la réputation douteuse de Playfair en tant qu’homme d’affaires. Dans le chapitre 10, nous verrons que les graphiques sont finalement devenus courants et ont mené à d’importantes avancées.
220
LE COMPTE Y EST !
9 Modéliser et mesurer Vous êtes souvent enclin à « faire ce que vous voulez ». Dans une société éclairée, il existe certaines normes et conventions destinées à adapter vos préférences individuelles dans un cadre qui respecte le bien commun. Des économistes et des politologues ont tenté de trouver des façons de décrire ces comportements en langage mathématique. Dans ce chapitre, vous découvrirez que les progrès sont intimement liés, en temps et en espace, avec des différences apparentes – dans la construction d’étalons communs de poids et de mesures. Comme on l’a vu au chapitre 2, ce problème remonte aux premiers frémissements de l’activité mathématique.
MATHÉMATIQUES EN SITUATION L’idée de donner des noms aux nombres et d’utiliser ces noms pour compter des objets comme des outils en pierre et des moutons a émergé sans doute pour la première fois pendant la période pour laquelle il n’existe aucun récit écrit. Les méthodes d’utilisation des nombres écrits sont inextricablement liées à l’étape suivante du développement, lorsque les êtres humains commencèrent à vivre et à 221
Modéliser et mesurer
travailler en communauté, et il était essentiel de disposer d’archives écrites. Il est donc clair que pratiquement depuis le tout début, les mathématiques font partie du contexte social. Par exemple, la nécessité d’allouer des ressources équitablement a mené au développement de procédures arithmétiques pour diviser un nombre par un autre. Il existe différents systèmes sociaux dans différentes parties du monde, mais le calcul a joué partout un rôle important. Dans les périodes grecque, romaine et islamique, la complexité croissante des structures sociales a conduit au développement de meilleures méthodes de calcul, plus particulièrement dans les domaines liés aux monnaies, poids et mesures. Mais de nouveaux types de mathématiques ont commencé à prendre racine. L’idée que les procédures mathématiques sont justes – qu’elles incarnent une sorte de vérité – avait été admise une fois pour toutes dans le cas de l’arithmétique, et les Grecs ont découvert que la géométrie exigeait une approche plus minutieuse. Ils ont aussi commencé à étudier les propriétés des nombres, utilisant des arguments logiques plus que des observations intuitives. Ainsi naît ici l’idée que les mathématiques pouvaient être étudiées pour elles-mêmes. Néanmoins, pendant près de 2 000 ans après Euclide, la plupart des avancées en mathématiques étaient motivées par des problèmes pratiques, comme la navigation. Ce n’est qu’au début de la période moderne que les mathématiques « pures » ont réellement commencé à se développer, nourries par les méthodes symboliques de l’algèbre. De grands mathématiciens comme Newton et Gauss étaient souvent motivés par l’utilisation des nouvelles méthodes de calcul pour résoudre des problèmes qui se posaient dans le domaine « appliqué » du sujet. Le développement d’une théorie mathématique prit un nouveau tournant vis-àvis des relations entre la théorie et la pratique. Les débats autour des bases théoriques des probabilités et de l’inférence statistique continuent aujourd’hui, même si d’importantes décisions reposent sur ces notions. En effet, la totalité du sujet des mathématiques « pour elles-mêmes » s’est révélé être un grand avantage pour l’humanité, 222
LE COMPTE Y EST !
Modéliser et mesurer
car l’arithmétique, la géométrie, l’algèbre, le calcul et les probabilités ont été utilisés pour résoudre un grand éventail de problèmes pratiques, quelquefois très inattendus. Dans ce chapitre, on expliquera comment les méthodes mathématiques ont permis d’aborder des problèmes courants de l’économie et de la politique, et comment le développement de la communauté scientifique internationale a mené à des avancées dans la technique de la mesure.
MESURE DE LA VALEUR ET UTILITÉ L’argent prend de nombreuses formes et possède de nombreuses fonctions. L’un de ses buts est de servir de mesure commune de valeur, si bien que l’association argent-objets telle que les pièces et les cauris peut être utilisée pour faciliter les échanges de marchandises. Cependant, on ne peut pas tenir une mesure commune de la valeur pour acquis. Au début de ce livre, le scénario du mammouth abattu a été utilisé pour illustrer la période préhistorique : la valeur d’une denrée pouvait dépendre de sa nécessité pour une personne. Dans ce scénario, le découpage et le choix d’un algorithme offrait un moyen de résoudre un litige sans utiliser d’argent. Quand la croissance du commerce et de l’industrie a conduit à une utilisation largement répandue de l’argent, il était inévitable que des questions se posent sur les relations entre la valeur d’un objet et sa contrepartie en argent : le prix. Les anciens philosophes spéculaient sur ces questions en termes généraux, mais ce n’est qu’au XVIIIe siècle que l’on commença à penser numériquement à la mesure de la valeur. La nouvelle théorie des probabilités semblait offrir quelques aperçus, et la quatrième partie d’Ars Conjectandi, de Jakob Bernoulli, comprenait une tentative d’appliquer cette théorie aux affaires économiques, morales et civiles. Mais le livre n’a été publié qu’en 1713, huit ans après la mort de Jakob, et il apparaît qu’il ne contient qu’une ébauche des objectifs à atteindre. Vers 1730, Daniel, le fils de Johann Bernoulli, reprit le sujet. 223
Modéliser et mesurer
En 1738, il publia un article sur une « nouvelle théorie de l’évaluation du risque ». Il introduisait un scénario plus moderne que celui du mammouth abattu. Un homme pauvre obtient un billet de loterie qui pourra lui rapporter ou bien rien ou bien vingt mille ducats avec une égale probabilité. Comment évaluera-t-il ses chances de gagner vingt mille ducats ? Ne serait-il pas mal avisé de vendre son billet pour neuf mille ducats ? D’après moi, il me semble que la réponse est négative. Par ailleurs, disait Daniel, un homme riche serait mieux avisé d’acheter le billet car ses besoins sont différents. Bernoulli poursuivit avec une discussion plus générale du concept que l’on appelle aujourd’hui l’utilité. Il considérait la façon dont l’utilité d’un produit, tel que des pommes, peut dépendre de la quantité disponible. L’utilité U d’un nombre x de pommes augmente clairement avec x, mais le taux de croissance diminuera lorsque x sera plus grand, car on ne peut pas manger que des pommes. En particulier, il suggère que la formule U = log x pourrait être utilisée pour représenter la situation. Comme le montre la figure 9.1, les valeurs de U croissent, mais le taux de croissance décroît progressivement. Bernoulli supposait que les valeurs de x étaient des nombres entiers ou, comme il est dit maintenant, x est une variable discrète plus que continue. Dans ce cas, les valeurs de U pour une valeur particulière de x sont mesurées par la différence des valeurs de U entre x et x – 1. Désormais, les économistes appellent cela l’utilité marginale de U et la notent MU ; ils la décrivent parfois comme l’« utilité de la dernière pomme ». Ici, la variation de U, que l’on peut noter dU, est mesurée par rapport à la variation d’une unité de x ; en d’autres termes, dx = 1. Dans le cas d’une variable continue x, MU correspond à dU/dx. Cela montre que l’on peut se servir du calcul différentiel. 224
LE COMPTE Y EST !
Modéliser et mesurer
En réalité, Daniel Bernoulli a utilisé cette analogie pour justifier son choix de la courbe logarithmique pour représenter l’utilité84. Utilité U
Nombre x Figure 9.1 | Une courbe d’utilité de forme logarithmique.
Dans la seconde partie du XVIIIe siècle, l’école classique des économistes et des philosophes porta leur attention sur les questions d’utilité, de valeur et de prix. Adam Smith tenta d’élucider la mesure de la valeur, mais son analyse était basée sur des notions qu’il n’expliquait pas de manière convaincante. Jeremy Bebtham discuta de l’utilité en termes plus généraux, dans le but de faire des comparaisons interpersonnelles et de donner une base rationnelle à la législation. Mais la possibilité d’utiliser les mathématiques pour expliquer les relations entre les variables économiques n’a pas été exploitée avant une centaine d’années après la première tentative de Bernoulli. Antoine Augustin Carnot avait été nommé professeur à l’université de Lyon en 1834. Il était familier des avancées formidables réalisées dans la théorie et dans les applications du calcul différentiel : dans ses Recherches sur les principes mathématiques de la théorie de la richesse (1838), il n’avait aucun scrupule à représenter les variables économiques par des symboles algébriques. Ainsi utilisait-il p pour le prix d’un bien 84. Au chapitre 5, nous avons vu que l’aire sous la courbe y = 1/x est le logarithme hyperbolique log x. Le théorème fondamental du calcul nous dit que si l’utilité U de x éléments est log x, alors le taux de variation dU/dx est 1/x. Comme 1/x décroît lorsque U croît, U a la propriété caractéristique de l’utilité. 225
Modéliser et mesurer
et D pour sa demande. Il exprimait le fait économique par l’existence d’une relation entre D et p en langage mathématique en disant que D est une fonction de p et écrivait D = F(p). En utilisant F comme symbole général pour une fonction plutôt qu’une formule particulière, il posa les bases d’une théorie de l’activité économique en termes d’analyse mathématique de relations fonctionnelles. Par exemple, le fait économique que la demande diminue lorsque le prix augmente peut être traduit en mathématiques en disant que le taux de variation dF/dp est négatif. Le calcul différentiel est bien adapté à une telle analyse, car de nombreuses activités économiques peuvent être considérées comme des problèmes d’optimisation. Un exemple simple est le problème d’une entreprise qui souhaite fixer le prix de son produit pour que son revenu soit maximisé. Si le prix est p et la demande D, le revenu est p × D = pF(p). Le calcul différentiel dit que le maximum de p × F(p) est atteint lorsque le taux de variation est nul, et ce fait détermine le prix optimum85. Quelques années après la publication de l’article de Cournot, un autre Français, Jules Dupuit, écrivit un article intitulé « Sur la mesure de l’utilité dans les travaux publics ». Entre autres choses, il décrivait comment le nombre de gens utilisant un pont à péage pouvait dépendre du prix du péage, et il expliquait comment les données (bien qu’hypothétique) pouvaient être utilisées pour mesurer le bénéfice que pouvait en tirer le public. Les données de Dupuit étaient discrètes, mais il traçait dans une annexe la courbe de la demande en termes de variables continues (figure 9.2). Il soulignait clairement que son analyse pouvait se faire en langage de calcul différentiel : pour la commodité de l’exposé, nous avons calculé des différences au lieu d’utiliser le calcul différentiel. Ceux qui sont familiers des éléments du calcul verront plus tard comment la précision peut se substituer aux approximations. 85. Le taux de variation de pF(p) est p(dF(p)/dp) + F(p), donc son maximum est atteint quand il est égal à zéro : c’est-à-dire pour la valeur de p qui satisfait l’équation p = –F(p)/(dF(p)/dp).
226
LE COMPTE Y EST !
Modéliser et mesurer
N
n nȀ nȀ
0
p
pȀ
pȀ
P
Figure 9.2 | Courbe de Dupuit de la demande en fonction du prix.
Quelques décennies après la publication des travaux de Dupuit, plusieurs économistes commencèrent à utiliser le calcul différentiel pour étudier les relations entre l’utilité et le prix. Leurs travaux étaient basés sur le scénario d’une consommatrice (Jenny) qui s’était fixé un budget à dépenser pour l’achat de plusieurs marchandises, compte tenu des prix des marchandises et de leur utilité. Cela peut être formulé comme un problème d’optimisation. Jenny souhaite maximiser son utilité, soumise à la contrainte que son budget est fixé. Il est facile d’établir un modèle mathématique de la situation. Supposons qu’il y ait seulement deux produits, de prix p1 et p2 euros l’unité, et que le budget soit de m euros. L’achat de x1 unités du premier produit et de x2 unités du second coûte p1x1 + p2x2 euros, et donc x1 et x2 doivent satisfaire la contrainte p1x1 + p2x2 = m. En termes géométriques, cela signifie que le point (x1, x2) doit se situer sur une droite, la droite du budget, comme on le voit sur la figure 9.3(1). Maintenant, supposons que les utilités de Jenny pour les quantités x1 et x2 soient U1 et U2 respectivement. Alors le problème est : maximiser l’utilité totale U1(x1) + U2(x2) soumise à la contrainte budgétaire p1x1 + p2x2 = m.
227
Modéliser et mesurer
x2
x2 (1)
x2 (2)
x1
(3)
x1
x1
Figure 9.3 | Le problème du consommateur : (1) la droite du budget, (2) les courbes d’indifférence, (3) l’optimum.
Parmi les économistes qui travaillaient sur ce problème en 1870, il y avait Stanley Jevons, Carl Menger et Léon Walras. En combinant des arguments mathématiques et économiques, tous les trois obtinrent des solutions similaires. Peu après, Francis Ysidro Edgeworth en donna un exposé dans son livre Mathematical Psychics publié en 1881. L’approche d’Edgeworth était géométrique et était basée sur des courbes définies par la règle U1(x1) + U2(x2) est constant. En tous les points d’une courbe fixée de ce type, l’utilité totale est la même et on peut dire que Jenny est « indifférente » au point choisi (x1, x2) sur la courbe. Edgeworth l’appelait courbe d’indifférence. Esquissant les courbes d’indifférence pour quelques valeurs particulières de la constante, on obtient une représentation comme sur la figure 9.3(2). Le problème de Jenny consiste à trouver la plus grande valeur de la constante pour laquelle la courbe d’indifférence ne coupe pas la droite du budget : Jenny ne peut pas se permettre n’importe quel niveau d’utilité. Autrement dit, pour les petites valeurs de la constante, on aura en général deux points d’intersection. Le diagramme suggère que la meilleure constante est celle qui n’a qu’un point d’intersection ; plus précisément le point où la droite du budget est tangente à une courbe d’indifférence (figure 9.3(3)). En utilisant des calculs élémentaires, Edgeworth pouvait expliquer le résultat obtenu par Jevons, Menger et Walras. Son argument est le suivant : la pente de la droite du budget est –p1/p2 et cette droite est 228
LE COMPTE Y EST !
Modéliser et mesurer
tangente à la courbe d’indifférence cherchée. On a donc besoin d’une formule qui donne la pente d’une tangente à la courbe d’indifférence. L’équation de la courbe définit x2 implicitement en fonction de x1 et, d’après les règles du calcul, le taux de variation de x2 par rapport à x1 est dx2/dx1 = –dU1/dx1 / dU2/dx2.
On veut la courbe d’indifférence particulière pour laquelle le point de contact de la tangente avec cette pente est sur la droite du budget. Donc le point optimum peut être trouvé en résolvant les deux équations : dU1/dx1 / dU2/dx2 = p1/p2
et
p1x1 + p2x2 = m.
En réarrangeant la première équation et en transformant les dérivées en utilisant la notation marginale des économistes, il en résulte que la répartition optimale (x1, x2) est telle que MU1(x1)/p1 = MU2(x2)/p2.
En d’autres termes, les quantités optimales sont telles que le rapport de l’utilité marginale au prix est le même pour chaque produit. Par exemple, si le budget de Jenny est de 1 euro et si elle décide d’acheter 4 pommes à 15 centimes chacune et 2 bananes à 20 centimes chacune, alors son envie de la quatrième pomme et son envie de la deuxième banane sont dans le rapport 15:20. Il est possible que la première personne à énoncer ce principe soit Heinrich Gossen, un écrivain auteur de quelques rêveries profondes mais très obscures sur la théorie économique. En 1854, il écrivit : une personne maximise son utilité quand elle répartit son revenu entre des produits variés, de manière à obtenir la même quantité de satisfaction que le Geldatom dépensé pour chaque marchandise86. 86. L’œuvre de Gossen a été publiée en allemand en 1854. Une traduction anglaise est disponible : The Laws of Human Relations and the Laws of Human Action Derived Therefrom (Cambridge, Mass., MIT Press, 1983). 229
Modéliser et mesurer
L’introduction du calcul a conduit à un changement radical dans la pensée économique, souvent appelé « la révolution marginale », et c’est de cette époque que datent les économies néoclassiques. Le terme n’est pas strictement défini, mais l’un de ses traits caractéristiques est la tentative de créer des modèles de comportements économiques qui peuvent être construits sur des relations mathématiques. Par exemple, la discussion sur un seul consommateur ébauchée ci-dessus peut éclairer des situations où figurent plusieurs consommateurs en concurrence. Edgeworth lui-même utilisait ses courbes d’indifférence pour analyser le cas de deux personnes abandonnées sur une île déserte souhaitant partager leurs provisions de manière équitable. Elles trouvent qu’il y a de nombreuses solutions à leur problème et qu’elles peuvent être représentées graphiquement sur ce qui est appelé une courbe de contrat. Bien plus tard, quand la théorie des jeux fut développée mathématiquement, on réalise que la même idée pouvait aussi être exprimée dans ce cadre.
LES PROBLÈMES DE LA DÉMOCRATIE C’est un truisme que de dire que des individus différents évaluent des marchandises de différentes façons. John peut considérer qu’une pomme a plus de valeur que deux bananes, mais Paul peut penser qu’une pomme et une banane sont de même valeur. Comme on le sait, des difficultés peuvent survenir lorsque John et Paul doivent combiner leurs préférences. Bien que l’on essaie de se fier à un vote démocratique pour résoudre de telles situations, de nombreuses raisons font que la réponse n’est pas complète. La procédure traditionnelle consiste, pour les électeurs, à voter seulement pour leur option préférée et l’option qui remporte le plus de voix gagne. Mais la procédure peut ne pas toujours sélectionner la meilleure option, de l’avis de l’électorat pris dans sa totalité. Vers la fin du XVIIIe siècle, un problème de vote fut discuté par plusieurs mathématiciens français. Le premier d’entre eux était 230
LE COMPTE Y EST !
Modéliser et mesurer
Jean-Charles de Borda, un homme retrouvé dans plusieurs domaines. Son travail comme ingénieur militaire l’a conduit à une nomination à l’Académie française des sciences en 1770. Il a servi aussi dans la marine et a été fait prisonnier par les Anglais, mais il est revenu en France et a joué un rôle important dans l’administration de l’Académie. En 1770, Borda décrivit une situation dans laquelle des électeurs devaient choisir un candidat pour occuper un poste ; son article fut imprimé dans un volume de l’Histoire de l’Académie (mais n’a été publié qu’en 1784). Son analyse était basée sur l’observation selon laquelle chaque électeur choisit un ordre de classement pour les candidats, mais la prise en compte d’un seul vote ne reflète que partiellement cet ordre. Borda a considéré l’exemple de trois candidats A, B, C et les six permutations ABC, ACB, BAC, BCA, CAB, CBA. Supposons qu’il y ait 21 électeurs et que leurs préférences soient distribuées comme suit Première préférence
A
A
B
B
C
C
Deuxième préférence
B
C
A
C
A
B
Troisième préférence
C
B
C
A
B
A
Nombre d’électeurs
3
5
0
7
0
6
En utilisant la procédure standard, chaque électeur exprime un vote pour son candidat préféré, ainsi A obtient 8 votes, B 7 et C 6, ce qui signifie que A est le gagnant. Mais comme Borda le soulignait, la plupart des électeurs (13 sur 21) préfèrent effectivement B ou C à A. Borda suggéra que la difficulté pourrait être surmontée en attribuant des notes à chaque candidat en fonction de leur position dans le classement. Si l’on attribue 3 points pour une première préférence, 2 points pour une deuxième préférence, 1 point pour une troisième préférence, le total des points attribués à A, B et C est de 37, 44 et 45 respectivement. Sur cette base, C serait élu. Cette procédure est connue sous le nom de compte de Borda. Elle a été utilisée pour les élections à l’Académie jusqu’en 1801, date à laquelle elle 231
Modéliser et mesurer
fut abandonnée par le célèbre démocrate Napoléon Bonaparte. On l’utilise encore aujourd’hui dans certaines circonstances. Le compte de Borda n’est pas exempt de critiques. Par exemple, on suppose que les étapes dans les préférences relatives des électeurs sont uniformes ; ainsi, quand le classement est ABC, A est préféré à B avec exactement la même valeur que B est préféré à C. Il est très facile de concevoir des procédures permettant de surmonter de telles difficultés, mais il semble malheureusement qu’il soit toujours possible d’inventer un scénario où la procédure conduit à un résultat pervers. En 1785, l’ami de Borda, le marquis de Condorcet, a essayé d’appliquer la théorie des probabilités aux procédures électorales dans un Essai long et complexe. Plusieurs auteurs de textes sur les probabilités ont trouvé l’Essai difficile à comprendre, et parfois inconsistant, mais en réalité, Condorcet avait découvert plusieurs des complexités du sujet87. Un peu plus tard, Laplace tenta aussi d’appliquer la théorie des probabilités et apporta une démonstration théorique de la supériorité du compte de Borda, dans certaines conditions. Mais il réalisa également que les aléas du comportement humain, tels que la tactique de vote, pouvaient invalider sa conclusion. Un siècle plus tard, la théorie des élections fut discutée par Charles Dodson, plus célèbre sous le nom de Lewis Carroll, l’auteur de Les Aventures d’Alice au pays des merveilles. Dans la vie réelle, il était assistant de mathématiques à Christ Church, Oxford, et Alice était l’une des filles du directeur, Dean Liddell. Son intérêt pour les élections avait été éveillé par diverses questions litigieuses présentées devant la direction de l’université et qui avaient été attisées par l’animosité envers Lidell. Dans les années 1873–1878, il écrivit plusieurs pamphlets sur les procédures électorales et revisita certains domaines
87. Une discussion complète de l’œuvre de Condorcet se trouve dans The Theory of Committees and Elections de Duncan Black (Cambridge, Cambridge University Press, 1958).
232
LE COMPTE Y EST !
Modéliser et mesurer
traités par Borda, Condorcet et Laplace, mais il ne fit aucune avancée significative88. Au XXe siècle, le développement de l’économie mathématique conduisit à un grand intérêt pour les relations entre préférences et utilité. La théorie de l’utilité dite cardinale, la notion selon laquelle les besoins d’une personne en paquets de marchandises peuvent être exprimés en attribuant un nombre, a été très critiquée car elle paraissait artificielle. Des tentatives ont été réalisées pour la remplacer par une approche ordinale, basée sur un classement au moyen de préférences. Dans Theory of Games and Economic Behaviour (1944), von Neumann et Morgenstern ont essayé de réconcilier les deux approches. Ils ont formulé certaines conditions assurant qu’une préférence ordonnée peut être représentée par une fonction d’utilité U qui assigne un nombre U(X) à une action X de telle sorte que, chaque fois que X est préféré à Y, alors U(X) est plus grand que U(Y). Mais pour ce faire, ils furent contraints d’introduire quelques axiomes qui sont un peu artificiels. Le soupçon de l’existence d’obstacles fondamentaux à la mise en place de la « démocratie » sur l’agrégation de préférences individuelles a été confirmé au début des années 1950. Kenneth Arrow a énoncé quelques conditions très raisonnables valables lorsque les préférences individuelles sont combinées à une simple préférence sociale et a démontré qu’il n’y avait aucune raison pour qu’elles soient satisfaites. Ses conditions ont été un peu améliorées et peuvent être simplement énoncées comme suit. 1. Si chaque électeur classe A au-dessus de B, alors la préférence sociale des électeurs classe A au-dessus de B. 2. Si un ensemble de préférences d’électeurs est tel que leur préférence sociale classe A au-dessus de B et si certains des électeurs revoient leur préférence, mais sans changer leur avis sur les mérites relatifs de A et B, alors la nouvelle préférence sociale classe aussi A au-dessus de B. 88. Pour Lewis Caroll, voir R. J. Wilson, Lewis Caroll in Numberland (Londres, Allen Lane, 2006). 233
Modéliser et mesurer
3. Il n’y a pas de dictateur – c’est-à-dire qu’il n’y a aucune personne dont la préférence correspond toujours à une préférence sociale. Le fait qu’il ne peut y avoir de méthode générale de définition d’une préférence sociale qui satisfasse ces conditions est connu sous le nom de théorème d’impossibilité d’Arrow.
LA MESURE DU MONDE L’intérêt des mathématiciens français pour les procédures démocratiques à la fin du XVIIIe siècle était le reflet des bouleversements de la nation à cette époque. Borda, Condorcet et Laplace se retrouvèrent impliqués dans la Révolution française et, en raison de cette implication, ils posèrent les bases d’une sorte de révolution – dans la mesure. À cette époque, la nécessité d’étalons de poids et de longueur était reconnue par toutes les nations développées. En 1742–1743, l’Académie de Paris et la Royal Society de Londres échangèrent des copies de leurs étalons nationaux et les comparèrent avec une grande attention. Elles étaient particulièrement intéressées par ce que l’on appelait les poids troyens qui utilisaient de l’or et de l’argent, car ces métaux étaient utilisés aussi dans des expériences scientifiques. Elles déterminèrent le rapport entre les poids troyens de France et d’Angleterre, il était exactement de 64:63. Cependant, dans les deux pays, la position de la communauté la plus majoritaire n’était pas aussi simple. Dans les îles Britanniques, la mesure de capacité du boisseau variait d’un lieu à l’autre, alors qu’en France, la persistance d’un système de gouvernement médiéval avait pour conséquence que toutes les sortes de poids et mesures étaient déterminées localement. Les systèmes français étaient particulièrement résistants aux changements, car cela affectait les droits féodaux de l’aristocratie. Certains dirigeants de la Révolution s’emparèrent de cette question et, en avril 1790, le problème fut posé par Charles-Maurice de Talleyrand. Il proposa de créer un système de poids et mesures qui serait non seulement le même dans toute la France, mais aussi réellement international, car construit sur des standards objectifs. 234
LE COMPTE Y EST !
Modéliser et mesurer
Une commission avait été nommée pour examiner le problème, trois de ses membres de la commission étant les susnommés Borda, Condorcet et Laplace. En mars 1791, ils rédigèrent un rapport sur la manière dont l’étalon de l’unité de longueur pouvait être défini objectivement et conclurent qu’il utiliserait sur la circonférence de la Terre. Ils recommandaient en particulier que cette unité devrait être la dix millioniéme partie de la longueur du quart de méridien du pôle Nord à l’équateur. L’unité proposée devrait s’appeler le mètre. Les travaux commencèrent en 1792. Le plan consistait à déterminer la longueur d’une partie du méridien qui part de Dunkirk et va jusqu’à Barcelone (figure 9.4). Quand la longueur de la base est connue et les angles des triangles ont été mesurés, la distance entre les points extrêmes du triangle peut être calculée. Les latitudes des points extrêmes peuvent alors être déterminées par des méthodes utilisées en astronomie, qui donnent la réponse attendue. La théorie était relativement facile, mais il y avait d’énormes difficultés pratiques89. Les arpenteurs devaient opérer dans un terrain difficile et ils étaient souvent harcelés par les populations locales suspicieuses qui les prenaient pour des espions. Cela n’était pas totalement illogique puisqu’une révolution était en cours. Les longueurs et les angles devaient être mesurés avec une très grande précision.
Méridien Nord
Base
Figure 9.4 | La triangulation utilisée pour mesurer le méridien près de Carcassonne.
89. Ken Alder, The Measure of All Things (Londres, Little, Brown, 2002) décrit les nombreux problèmes de la mesure du méridien. 235
Modéliser et mesurer
Borda lui-même construisit des barres de mesures et un instrument connu sous le nom de « cercle sans fin » qui facilitait la mesure des angles. Borda fut aussi impliqué dans la mise au point du nouvel étalon de poids. Il était admis que l’unité appelée gramme serait le poids d’un volume d’eau pure de la capacité d’un cube de côté de un centième de mètre. Étant donné qu’il s’agissait d’une définition physique peu pratique, on le représenterait par un objet étalon d’un kilogramme (égal à 1 000 grammes) constitué d’un certain métal. On s’attendait à ce que ces travaux durent plusieurs années, et ce fut effectivement le cas. Heureusement, de nombreuses personnes pensaient que cela en valait la peine dans une période de bouleversements nationaux. Le règne de la Terreur en 1793 entraîna la fermeture de l’Académie, mais la commission sur les poids et mesures fut autorisée à poursuivre ses travaux. Condorcet, qui avait été un fervent partisan de la Révolution, fut emprisonné et mourut, et Laplace pensa qu’il était sage de quitter Paris pour un temps. Il put continuer à écrire sa grande œuvre Mécanique céleste, dans laquelle les arguments géométriques de Newton étaient traduits en langage d’analyse et d’algèbre. En dépit de ces revers, le nouveau système métrique fut autorisé par un décret publié en 1795 (figure 9.5). Malheureusement, l’adoption du système métrique ne débuta pas très bien. En partie car certaines des innovations étaient si étranges que l’échec était presque inévitable. La commodité de la division décimale des unités de longueur et de poids était claire, mais l’application proposée consistant à adopter le système décimal pour le calendrier entraînait la plus grande confusion. On supposait que l’année était divisée en 12 mois, chaque mois divisé en 3 semaines, chaque semaine divisée en 10 jours, chaque jour divisé en 10 heures, chaque heure divisée en 100 minutes, chaque minute divisée en 100 secondes. Une autre proposition un peu plus raisonnable consistait à mesurer des angles en nouveaux degrés, un angle droit valant désormais 100 nouveaux degrés, au lieu des anciens degrés où 90 correspondait à un 236
LE COMPTE Y EST !
Modéliser et mesurer
angle droit. Mais cela aussi se solda par un échec. Le problème le plus sérieux était l’opposition innée de la plupart des Français à toute évolution vers une nouvelle forme de mesure, quel que soit leur zèle révolutionnaire.
Figure 9.5 | Page de garde des instructions officielles sur le nouveau système métrique.
Pour cette raison, un décret fut publié en 1812, précisant que le système métrique pouvait être utilisé en conjonction avec les anciennes unités de longueur et de poids. Le résultat se solda par une immense confusion, peut-être le reflet de la gouvernance en France à cette époque. La restauration du système métrique en 1840 fut un long retour tardif à la raison, et après cela, il n’y aurait plus de maladresses bureaucratiques. Avec le temps, le système métrique fut adopté par la plupart des nations du monde, justifiant la vision des mathématiciens 237
Modéliser et mesurer
français qui l’avaient conçu. Quelques pays conservèrent leur terminologie traditionnelle désuète pour leurs unités de mesure, mais la plupart d’entre eux (incluant le Royaume-Uni depuis 1963) ont choisi de définir dorénavant ces unités en termes de standards métriques internationaux. Il est quelque peu ironique de constater que le système métrique ne dépend pas des efforts gigantesques consacrés à la détermination de la longueur du méridien. Progressivement, il devint évident que cette longueur ne pouvait pas être utilisée comme un étalon objectif, car la Terre n’est pas une sphère parfaite. Des étalons en métal du mètre et du kilogramme furent construits en 1799 et pendant plusieurs années, on pensa que l’objet connu sous le nom de « mètre des archives » pouvait servir de manière adéquate d’étalon primaire de longueur, indépendamment de sa relation avec la longueur du méridien. Cependant, au fil du temps, cette présentation du mètre étalon fut aussi abandonnée, car l’objet lui-même montrait des signes de détérioration. Par conséquent, de nouveaux étalons du mètre et du kilogramme furent réalisés à partir d’un alliage hautement stable de platine et d’iridium, et ces étalons furent adoptés formellement en 1901. Le système consistant à avoir défini des étalons primaires à partir desquels toutes les autres unités dériveraient était une bonne idée en théorie, mais elle engendrait quelques problèmes en pratique. La véritable opération de comparaison d’un étalon secondaire à un primaire risquait d’altérer les deux, et même un tout petit changement n’était pas acceptable. Ainsi, au XXe siècle, la communauté scientifique commença à reconsidérer la possibilité de définir des étalons objectifs. Les principes étaient qu’ils devaient reposer sur des phénomènes physiques donnant le même résultat partout où ils seraient observés. En 1960, le mètre fut défini en fonction de la longueur d’onde de la lumière émise par l’isotope krypton-86 et en 1967, l’unité de temps (la seconde) fut définie en fonction de l’horloge basée sur l’isotope du césium-133. Cette dernière définition ouvrit la voie à une redéfinition 238
LE COMPTE Y EST !
Modéliser et mesurer
du mètre en 1983, en fonction de la vitesse de la lumière, l’une des constantes physiques les plus élémentaires. Ainsi le mètre est officiellement la distance parcourue par la lumière dans le vide en l’une des 299 792 458 parties de la seconde90. Malheureusement, les tentatives de définir le kilogramme par une méthode scientifique à partir sur des constantes physiques fondamentales n’ont rencontré seulement que des succès partiels91. Par conséquent, en 2015, le prototype international du kilogramme de 1901 est encore l’étalon primaire de masse et de poids, et il constitue certainement l’un des objets les plus importants de notre planète.
90. Le principe qui affirme que la vitesse de la lumière s’élève à 299 792 458 mètres par seconde reste vrai, mais pour une raison différente. 91. L’histoire en cours de la quête d’étalons basés sur des constantes de la physique est racontée dans From Artefacts to Atoms de Terry Quinn (Oxford, Oxford University Press, 2011). 239
10 Mathématiques et monnaie à l’ère de l’information
Quand vous payez vos factures par carte de crédit, vous êtes simplement autorisé à faire des modifications de l’information stockée sur certains ordinateurs. Il s’agit d’un aspect des relations symboliques qui existent maintenant entre l’argent et l’information. Le monde financier moderne est byzantin dans sa complexité et les mathématiques sont impliquées de plusieurs façons, pas toujours de manière clairement transparente. Heureusement, il existe des points positifs, tel le fait qu’il soit possible maintenant de mesurer l’information d’une façon mathématiquement précise.
SPÉCULATION FINANCIÈRE L’idée de spéculer en se basant sur une croyance en des événements futurs pourrait remonter aux industries primitives des temps préhistoriques. Avant 3000 avant J.-C., des tunnels souterrains avaient été construits à l’Est de l’Angleterre en un lieu appelé Grime’s Graves. En dépit de leur nom, les tunnels n’étaient pas destinés à l’enterrement 241
Mathématiques et monnaie à l’ère de l’information
des morts, mais à l’extraction du silex en vue de la fabrication d’outils en pierre mentionnés au chapitre 1 de ce livre. On ne sait pas comment la production et la répartition du silex étaient organisées, mais il est clair qu’une certaine forme de spéculation devait exister. Ceux qui pratiquaient l’extraction dans des conditions extrêmement rudes s’investissaient dans leur travail dans l’espoir que, d’une façon ou d’une autre, les matériaux qu’ils produisaient leur apporteraient des biens pour couvrir les nécessités de la vie. Au XVIIe siècle, les échanges et le commerce constituaient une partie importante de l’économie monétaire en Angleterre et les gens fortunés pouvaient spéculer en investissant leur argent, plutôt que leur travail. Des groupes de « marchands aventuriers » comme la Compagnie britannique des Indes Orientales permettaient aux investisseurs d’acheter des actions qui procuraient en retour une forme de dividende si la compagnie était prospère. Les actions elles-mêmes pouvaient être échangées, si bien que les gens pouvaient spéculer dans l’espoir que leurs actions rapporteraient finalement plus que ce qu’ils les avaient payées. Le poste d’Isaac Newton comme directeur de la Royal Mint avait fait de lui un homme riche et quand il mourut, en 1727, il laissa une fortune considérable dont une partie importante sous forme d’actions. Mais tous ses investissements n’avaient pas été fructueux. La croyance populaire selon laquelle la valeur des actions de la Compagnie des mers du Sud augmenterait avait été fondée sur rien de plus qu’une rumeur ; par conséquent, la bulle de la Compagnie des mers du Sud devait éclater et cela s’est réellement produit, causant des ennuis financiers à Newton. On raconte qu’il aurait déclaré que malgré tous ses dons mathématiques, il ne pouvait pas calculer la folie des hommes. Tout au long des XVIIIe et XIXe siècles, les marchés financiers, naissants au temps de Newton, ont crû jusqu’à devenir de grands oiseaux de proie, offrant d’innombrables opportunités pour spéculer. En plus des stocks et des actions, on pouvait spéculer sur des rentes, des assurances, des échanges avec l’étranger, sans parler des 242
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
loteries. Mais l’étude mathématique des opérations financières fit très peu d’avancées, malgré des progrès réguliers des probabilités et de la statistique. L’utilisation de graphiques pour représenter les données financières avait fait quelques progrès après son introduction par William Playfair en 1786. La situation commença à changer dans les années 1850, en partie suite à l’influence de Florence Nightingale92. Ses travaux sur l’amélioration du soutien médical aux soldats étaient basés sur des statistiques et, comme Playfair, elle croyait que les données sont plus facilement comprises lorsqu’elles sont présentées sous forme graphique. La même conviction avait conduit à une discussion lors d’une Conférence internationale de statisticiens en 1857, et l’idée avait été poursuivie par d’éminents théoriciens. L’un d’eux, Stanley Jevons, avait imaginé que le cycle de 11 ans observé dans l’activité des taches solaires influençait le commerce, car les variations du temps qui en résultaient affectaient la production des ressources alimentaires. Jevons construisit des diagrammes qui montraient clairement les fluctuations périodiques de l’activité économique connues aujourd’hui sous le nom de « cycle des affaires ». Mais sa théorie sur les taches solaires n’a pas survécu. À la fin du XIXe siècle, on acceptait que de telles « cartes » fussent un excellent moyen de représenter les mouvements des prix en fonction du temps. La carte de la figure 10.1 est tirée de l’ouvrage de George Clare, Money Market Primer and Key to the Exchanges, publié en 1893. Il montre les fluctuations sous deux versions des taux de change entre Londres et Paris pour l’année 188893. Le diagramme de Clare montre un net taux d’irrégularités, même si elles ont été lissées en prenant des moyennes hebdomadaires. Aujourd’hui, les taux changent très fréquemment et si la période était 92. Florence Nightingale a utilisé surtout le type de diagramme appelé camembert, mais elle a utilisé aussi des cartes comme Playfair, pour comparer par exemple les nombres de soldats perdus ou disparus dans l’armée pour différentes raisons. 93. Voir Mary S. Morgan, The History of Econometric Ideas (Cambridge, Cambridge University Press, 1990). 243
Mathématiques et monnaie à l’ère de l’information
de une heure au lieu de une année, les diagrammes seraient pratiquement identiques. Dans l’industrie de la finance, de tels diagrammes sont encore connus sous le nom de graphiques et les numérologues d’aujourd’hui consacrent leur vie à les étudier dans l’espoir de gagner de l’argent. Évidemment, ils perdent leur temps – et notre argent, étant donné que les frais que l’on paie pour les services financiers leur procurent salaires et bonus. Cela ne signifie pas que les mathématiques ne peuvent pas être employées utilement pour décrire les mouvements de prix en fonction du temps, à condition que l’on ne prétende pas qu’il devrait être possible de les prévoir de manière fiable. La « folie des hommes » demeure le principal facteur qui provoque des variations dans les prix d’un actif financier, et il est plus difficile à prévoir que les facteurs décrits par les lois de la physique. Nous ne disposons encore d’aucune méthode fiable pour prédire les tremblements de terre, donc il n’est pas surprenant de découvrir que nous ne pouvons pas prévoir les catastrophes financières.
Figure 10.1 | Un graphique financier de la fin du
244
LE COMPTE Y EST !
xixe siècle.
Mathématiques et monnaie à l’ère de l’information
UN MODÈLE DES CHANGEMENTS DE PRIX Le premier qui a essayé de construire un modèle mathématique des mouvements des prix des actions était un jeune mathématicien français, Louis Bachelier. En 1900, il a présenté sa thèse de doctorat intitulée Théorie de la spéculation, dans laquelle il posait les bases du sujet qui est connu maintenant sous le nom de mathématiques financières. Son travail était vraiment remarquable, car il avait pu mettre en évidence les traits essentiels du problème, même si les fondements de la rigueur mathématique n’ont été posés que plus tard94. L’un des problèmes fondamentaux résidait dans le fait que la théorie des probabilités devait être améliorée. Les modèles discrets qui étaient suffisants pour traiter des problèmes de lancers de dés ne l’étaient pas assez dans des situations où les variables changent sur des intervalles de temps arbitrairement petits et où d’autres méthodes de calcul doivent être mises en œuvre. Depuis, le modèle de Bachelier a été amélioré et généralisé, mais les idées de base pourraient encore être expliquées telles quelles à Leibniz, qui les aurait comprises. Le but est de décrire les modalités des variations des prix d’un actif en fonction du temps t. Dans un petit intervalle de temps dt, la variation de S est dS, la valeur numérique de S est quelconque et on peut considérer le rapport dS/S. Le modèle standard actuel suppose que dS/S est la somme de deux contributions, l’une déterministe et l’autre aléatoire. La première traduit les tendances sous-jacentes qui contribuent à un changement proportionnel au temps, soit Adt. La seconde est une contribution résultant de la « folie des hommes » que l’on note Bdx. On suppose que A et B sont des caractéristiques de l’actif et qu’elles peuvent être calculées à partir des données sur les variations du prix dans le passé. Ainsi le modèle mène à l’équation dS = A dt + B dx. S 94. L’œuvre de Bachelier est analysée par Marie Davis et Alison Etheridge dans Louis Bachelier’s Theory of Speculation (Princeton, Princeton University Press, 2006). 245
Mathématiques et monnaie à l’ère de l’information
À partir de cette équation, une carte virtuelle de prix d’un actif peut être construite. Supposons que les paramètres aient été estimés par A = 0,01, B = 0,2 et considérons une période de 100 jours, en prenant dt égal à 1 jour. Les variations de S dépendent de 100 variations de dx, une pour chaque jour, par exemple, elles peuvent se répartir comme dans le tableau suivant. Jour : dx :
1
2
3
4
...
100
+0,04
–0,06
–0,01
+0,02
...
–0,03
Le prix initial S0 étant donné, il est facile de calculer les valeurs à la fin de chaque jour S1, S2, S3, ..., S100. La valeur de S1 est S0 + dS et l’équation donne dS/S0 = (0,01 × 1) + (0,2 × 0,004) = 0,018 d’où S1 = S0 + dS = 1,018 S0.
Poursuivant de cette manière, on peut dresser un tableau, comme dans la figure 10.2, et calculer le prix final S100. Si l’on avait donné une suite différente de dx, on obtiendrait un prix final S100 différent. L’idée de Bachelier était de supposer que la règle pour choisir les dx est probabiliste. Par exemple, une règle très simple devrait permettre à dx de prendre seulement deux valeurs, disons dx = +0,02 avec la probabilité p et dx = –0,02 avec la probabilité 1 – p. Le fait est que si la distribution de probabilité de dx est connue, alors il est possible de déterminer la distribution de probabilité du prix final S100. Cela permet de répondre à des questions qu’un spéculateur poserait, telles que : quelle est la probabilité pour que le prix augmente d’au moins 10 % ? Dans la réalité, il est peu probable que le comportement de dx puisse être déterminé par une règle simple comme celle suggérée ci-dessus. Un modèle plus convaincant exigerait une meilleure règle, qui prendrait en compte le fait que les intervalles dt devraient varier et devenir arbitrairement petits. Une subtile combinaison de probabilités et de calculs est nécessaire pour construire un modèle adapté à cette situation. Cela n’était pas disponible du temps de Bachelier, 246
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
mais il pouvait obtenir néanmoins des résultats significatifs. Son idée la plus importante était qu’il devait y avoir certaines contraintes sur dx lorsque dt est proche de zéro, autrement le processus deviendrait trivial. Comme dx est le résultat de nombreuses actions indépendantes des investisseurs et des spéculateurs, Bachelier supposait qu’il suivait une distribution normale. À partir de là, il trouva qu’il pouvait construire un modèle satisfaisant, dans lequel l’espérance de dx est nulle et l’espérance de (dx)2 est proportionnelle à dt. S
t 0
1
2
3
4
100
Figure 10.2 | Un tableau virtuel de mouvements de prix sur 100 jours.
Il est remarquable de noter que quelques années plus tard, la même conclusion fut obtenue dans un autre article écrit par un mathématicien travaillant dans un autre contexte. Ce mathématicien était Albert Einstein et l’article est l’un des quatre publiés en 1905, son « année miraculeuse ». Dans ces articles, on trouve les bases de la théorie de la relativité restreinte et la célèbre formule E = mc2. Mais l’article qui nous concerne est celui qui porte sur un phénomène connu sous le nom de mouvement brownien. En 1827, Robert Brown avait observé que lorsque des particules de pollen sont en suspension dans l’eau, elles sautent d’une curieuse façon. Einstein croyait que ce mouvement apportait une preuve de l’existence physique des molécules d’eau, le mouvement étant provoqué par le bombardement des particules de pollen par les molécules d’eau. Dans sa tentative de construire un modèle, Einstein parvint indépendamment à la même conclusion que 247
Mathématiques et monnaie à l’ère de l’information
Bachelier : le déplacement d’une particule doit être proportionnel à la racine carrée de l’intervalle de temps pendant lequel il est mesuré. À notre connaissance, Einstein ignorait la thèse de Bachelier qui, en effet, passa inaperçue pendant plusieurs années. À cette époque, il y eut plusieurs avancées qui justifiaient les idées de Bachelier et d’Einstein. Dans les années 1920, la théorie requise pour prouver l’existence d’un modèle mathématique dans lequel dx est normalement distribué avait été développée par Norbert Wiener, et dans les années 1930, Andrey Kolmogorov renforça les bases de la théorie des probabilités. Finalement, à partir de 1944, Kiyosi Ito montra comment des équations introduisant des processus non déterministes pouvaient être résolues. Ces avancées ont abouti à un nouveau domaine appelé analyse stochastique. C’est un secteur de recherche encore très actif au XXIe siècle, car le modèle d’évaluation des prix d’actifs de Bachelier est devenu un outil fondamental dans le monde réel de la finance.
LES FORMES DE LA MONNAIE Dans ce livre, nous avons rencontré quelques problèmes liés à l’utilisation des pièces de monnaie comme moyen d’échange. Ces problèmes pratiques conduisent inévitablement à des problèmes mathématiques. L’utilisation de pièces d’or et d’argent était l’une des raisons principales du développement des algorithmes de l’arithmétique élémentaire, qui a pris finalement une forme qui pouvait être enseignée aux jeunes enfants. Cela exigeait la mise au point de calculs subtiles, tels que ceux nécessaires à la mesure de métal précieux dans une pièce, mais ils étaient enseignés seulement à quelques privilégiés. Lorsque de grandes transactions devaient être traitées, l’utilisation de pièces de monnaie n’était pas toujours commode. En Europe, cela a abouti à la loi sur les échanges (voir figure 5.2) et à la nécessité de calculs basés sur des taux de change variables. En Chine, le problème des grosses transactions n’a fait qu’empirer avec l’unique pièce, la « sapèque » en bronze ayant une faible valeur. Vers 1100 après 248
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
J.-C., les paiements impliquant un nombre de sapèques très élevé étaient devenus courants, et la Chine commença à utiliser des billets, équivalents à 1 000 sapèques. Partout, des développements similaires ont conduit à l’essor d’institutions que l’on appelle aujourd’hui des banques, bien qu’elles aient été impliquées dans des domaines autres que celui d’activités commerciales. L’utilisation des billets s’est progressivement répandue dans l’Ouest et ils sont devenus un moyen commode de paiement de toutes sortes95. Le principe sous-jacent était que M. Affluent, qui avait déposé des objets à la banque (en général, des métaux précieux sous des formes variées), voulait que lui soient donnés des billets qu’il pouvait utiliser pour payer des marchandises. Si Mme Baker et M. Butcher recevaient de tels billets, ils pouvaient les utiliser de la même façon ou, si nécessaire, les présenter à la banque qui les avait émis et récupérer un montant équivalent en or ou en argent. Naturellement, l’idée originale était qu’une banque voulait seulement des billets qu’elle avait émis de la valeur des objets qu’elle avait en dépôt, mais cette règle était souvent contournée, principalement pour faciliter les échanges par l’octroi d’un crédit. Par conséquent, au XIXe siècle, de nombreuses banques privées firent faillite quand il devint clair qu’elles ne pourraient pas rembourser leurs billets en argent liquide. Pour ces raisons, les billets de banque étaient souvent considérés de manière suspicieuse par le public, bien qu’ils aient constitué un important outil des politiques financières des gouvernements. La Banque d’Angleterre a été créée en 1694 et, comme les banques privées, elle émettait des billets. En 1797, quand on craignit que la France n’envahisse l’Angleterre, il avait été interdit à la Banque de se séparer de ses stocks d’or et des billets avaient été proposés en échange. Un document écrit de l’époque96 montre 95. En Angleterre, le système bancaire s’est développé tard comparativement à d’autres pays européens. Les premiers banquiers étaient des orfèvres de Londres dans la seconde partie du XVIIe siècle. 96. British Museum Online Collection, No. 1851, 0901.848. 249
Mathématiques et monnaie à l’ère de l’information
le Premier ministre, William Pitt, donnant des billets de banque à John Bull, un Anglais abasourdi, alors que de grands sacs d’or sont cachés sous le comptoir. Les opposants politiques de Pitt chuchotent à l’oreille de John Bull, suggérant qu’il devrait trouver l’or plus efficace que les billets de banque, s’il était agressé par un fier Français. Au XXIe siècle, l’émission de billets de banque est encore considérée comme un mécanisme commode pour gérer l’économie nationale, et nous sommes devenus familiers de l’expression de « facilité quantitative », qui est un euphémisme signifiant que trop de billets de banque ont été imprimés pour éviter une dépression économique. L’utilisation des billets constituait seulement une étape vers une notion d’argent plus obscure et abstraite. Les Romains avaient découvert que les pièces ne devaient pas nécessairement contenir de métaux précieux ; ils pouvaient décider de leur fonction par décret et les retirer de force si nécessaire. De nos jours, le monde développé est habitué à utiliser des jetons, des billets de banque et d’autres formes de papier-monnaie, telles que des chèques, des obligations et des certificats d’actions, mais ce ne sont pas les objets les plus nébuleux échangés sur les marchés monétaires du XXIe siècle. Il y a, par exemple, l’option. Sous sa forme la plus simple, une option donne au spéculateur le droit d’acheter un actif à un prix fixé E à un temps ultérieur T. Si à ce moment T, le prix du marché de l’actif ST est plus grand que E, alors le spéculateur prendra l’option et gagnera ST – E ; autrement, il ne la prendra pas et ne gagnera rien. L’option peut être échangée à tout moment intermédiaire t et sa valeur à ce moment-là, Vt, dépend, d’une certaine façon, du prix de l’actif St. La question évidente est : si la distribution de probabilités de St évolue d’après un modèle comme celui de Bachelier, quelle est la distribution de probabilités de Vt ? Pour répondre à cette question, il faut émettre quelques hypothèses sur les mécanismes des marchés financiers. Depuis 1960, la connaissance du modèle de Bachelier a progressivement pénétré les 250
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
cercles mathématiques, mais aucune application en finance n’avait été trouvée. En particulier, son importance dans l’évaluation des options n’avait pas été sérieusement discutée. L’un des premiers à mettre en lumière cette lacune fut l’éminent économiste, Paul Samuelson, qui a analysé les bases des hypothèses de Bachelier en termes de théorie des opérations financières. Mais c’était quelques années avant que ces idées soient traduites dans une forme qui avait des applications pratiques directes. La clé est le principe du non-arbitrage, quelquefois paraphrasé comme suit : « il n’y a pas de déjeuner gratuit ». Il n’est pas possible pour un opérateur de faire des bénéfices garantis en passant simplement d’un actif à un autre, quelle que soit la rapidité des transactions. En particulier, le porteur d’une option ne devrait pas faire de bénéfices en l’échangeant avec l’actif sur lequel elle est basée. En 1973, Fischer Black et Myron Scholes ont vu comment combiner ce principe avec le modèle de Bachelier, et en utilisant les outils de l’analyse stochastique, ils ont obtenu une équation qui donne la relation entre le prix de l’actif S et la valeur V d’une option basée sur l’actif. La théorie a été étendue plus tard par Robert Merton, un élève de Samuelson. Une particularité attractive de l’équation de Black-Scholes-Merton est qu’elle est étroitement liée à l’équation qui régit la propagation de la chaleur étudiée pendant près de 200 ans par les mathématiciens et les physiciens. La disponibilité de modèles qu’il était possible d’étudier a conduit à un boom spectaculaire dans le commerce des options de toutes sortes. L’équation de Black-Scholes-Merton a donné une formule explicite puissante pour l’évaluation du prix des options, mais fallacieuse, mais incitative. Le cas en apparence facile d’application de « la formule » annihilait le fait qu’elle avait été établie à partir d’un modèle mathématique qui, inévitablement, simplifiait à outrance la situation réelle. Malheureusement, de nombreux responsables de ce boom ne comprenaient pas grand-chose aux mathématiques et aux hypothèses sur lesquelles la formule était basée. Même s’ils 251
Mathématiques et monnaie à l’ère de l’information
étaient conscients des problèmes, ils croyaient que l’opération sur les marchés financiers corrigerait automatiquement les mauvaises décisions. Le commerce des options devint de plus en plus bizarre et les circonvolutions baroques de cette activité atteignirent des sommets qui étaient, littéralement, formidables : pendant longtemps, la valeur alléguée des options échangées fut plusieurs fois supérieure à la valeur de toutes les ressources du monde réel. C’était à nouveau la bulle de la Compagnie des mers du Sud, et elle avait encore éclaté.
ARGENT, INFORMATION ET INCERTITUDE Le monde de la banque moderne présente une autre caractéristique qui tend à se propager dans les royaumes de la fantaisie. D’énormes sommes d’argent peuvent être transférées en un instant, plus rapidement que le temps nécessaire pour lire cette phrase. À l’humble niveau des opérations bancaires personnelles, cela nous touche directement, car les méthodes traditionnelles de paiements en liquide ou par chèque sont remplacées progressivement par des paiements par carte de crédit. Quand nous achetons des choses dans un magasin ou par Internet, nous utilisons nos cartes pour les payer, donc les cartes elles-mêmes peuvent être considérées comme une forme de monnaie. Mais il est nécessaire d’examiner plus attentivement ce qui se produit réellement.
Biens
MOI
BOUTIQUE
Argent
BANQUE A
BANQUE B
Figure 10.3 | Paiement par carte de crédit. Comment diffère-t-il du mode médiéval (figure 5.2) ?
252
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
Les cartes bancaires ont le pouvoir de lancer une suite d’opérations comptables (figure 10.3). Supposons que j’utilise une carte pour acheter à une femme un cadeau d’une valeur de 100 euros. Tout d’abord, un message est envoyé à la banque de l’acheteur lui demandant de déduire 100 euros de son compte : en d’autres termes, sa banque lui doit maintenant 100 euros de moins qu’avant. Au même moment, un message est envoyé de la banque de l’acheteur à la banque du vendeur, transférant les 100 euros à cette dernière et, finalement, la banque du vendeur ajoute ce montant au compte de ce dernier. Ces opérations sont instantanées et ont un coût négligeable. Il en résulte que la banque émettrice doit 100 euros de moins et qu’une autre banque doit au vendeur 100 euros de plus. Les comptes entre les banques ont été ajustés en conséquence, si bien que leur situation est fondamentalement inchangée. Le seul changement physique significatif correspond aux enregistrements conservés, par les différentes parties, des opérations effectuées. Dans ce cas, l’argent est représenté par des nombres stockés dans des ordinateurs : c’est une simple information. Cette information indique combien d’argent est dû par les banques à leurs clients et la carte permet de modifier cette information d’une manière particulière. La situation que nous venons de décrire correspond seulement à un aspect des relations entre l’argent et l’information. En réalité, il devient clair que le concept d’information est omniprésent et qu’il joue un rôle jusque dans les lois de la physique. Ce point de vue se présente en partie car nous avons maintenant une façon satisfaisante de mesurer l’information, qui peut être appliquée aux nombreuses voies via lesquelles l’information est exprimée. Il y a longtemps, les hommes commencèrent à échanger des informations en faisant des signes et des bruits. Progressivement, les signes et les bruits sont devenus un langage tout d’abord parlé, puis écrit. Le processus était stimulé par les exigences de l’échange et du commerce, et étant donné que le commerce se complexifiait, 253
Mathématiques et monnaie à l’ère de l’information
plus d’informations étaient nécessaires. De même, les contacts humains impliqués dans le commerce contribuaient à la transmission de l’information concernant les autres aspects de la vie, culturels, sociaux et même mathématiques. Les langages naturels, écrits de manière uniforme, constituaient des moyens de faire circuler l’information. Un message écrit en langage naturel peut être considéré comme une suite de symboles telle que celle imprimée sur cette page. C’était le point de vue des cryptographes arabes du IXe siècle lorsqu’ils utilisaient la méthode d’analyse de fréquences pour déchiffrer des messages codés. Dans tout langage particulier, tel que l’anglais moderne, la succession des symboles possède certaines propriétés statistiques qui restent des constantes fiables dans un grand domaine de sources, de Hamlet à Harry Potter. La plus simple des propriétés est la fréquence des symboles individuels, mais il existe aussi des propriétés plus complexes impliquant les relations entre des symboles successifs, tels que la lettre q habituellement suivie par u. Par conséquent, un langage naturel a une certaine redondance : dans un message, les symboles ne sont pas tous nécessaires pour qu’il ait un sens. On utilise cette propriété pour envoyer des Textos. Par exemple, on peut utiliser la transformation Tu viens demain ? à tu vi1 2m’1
Ici, 25 symboles (en comptant les espaces) ont été remplacés par 16, en utilisant l’irrégularité de la procédure de l’encodage connue sous le nom de « langage parlé ». Nous verrons qu’il existe des algorithmes formels pour de telles procédures, mais il est déjà clair que pour mesurer la quantité d’information d’un message, nous devons regarder de plus près la dimension de la donnée brute qu’il contient. Dans le cas de langages naturels, la situation est très complexe (bien que l’on puisse donner de bonnes définitions), mais les idées de base peuvent être illustrées en examinant une configuration plus simple.
254
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
Supposons qu’il y ait deux symboles possibles dans la série, et la seule règle est que leur fréquence relative soit fixée. Par exemple, si l’on répète le lancer d’une pièce de monnaie, on obtient une série de F (faces) et de P (piles). C’était le cas étudié par Jakob Bernoulli et Abraham de Moivre vers 1700 : ils ont montré que si la pièce est lancée un très grand nombre de fois, alors on peut faire une estimation précise du nombre de faces et de piles dans un échantillon fixé (chapitre 8). Si la pièce « n’est pas truquée », le flux de données produit par ce processus peut ressembler à : FFPFFPPPFFFFPFFPPFPPPFFPPPFFFPFPFFPPPFFPPPPF.
Par ailleurs, si les données sont générées par un procédé au cours duquel les deux résultats ont des probabilités différentes, alors la série peut paraître très différente. Par exemple, on peut répéter le lancer d’une paire de dés de telle sorte que les 6 × 6 = 36 résultats soient équiprobables comme le montre la figure 10.4. 1
1 1
2
1 2
2 1
3
2
3 1
4
5 1
6
6 1
6 2
4 5
5 4
4
6 5
5 6
6 3
6
5
4
3
3
4
5
6
5
4
3
2
3
4
5 2
2
3
6
5
4
3
2
1 5
3
2
1
4 2
3
4
4
3
2
1
1
6 6
5
6
Figure 10.4 | Les 36 résultats équiprobables du lancer de deux dés non truqués.
255
Mathématiques et monnaie à l’ère de l’information
Supposons que nous enregistrions B (pour blanc) quand les deux dés présentent le même chiffre et G (pour gris) dans le cas contraire. Alors 6 des résultats sur les 36 possibles sont B et il reste 30 G. Il en résulte que la probabilité de blanc est de 6/36 = 1/6 et que la probabilité de gris est de 30/36 = 5/6. Maintenant, le flux de données peut ressembler à : GGGBGGGGGBGGGGGGBGGGBGGGGBGGGGGGGBBGG.
Laquelle des deux séries, F-P ou B-G, contient le plus d’informations ? La réponse correcte est la série F-P. Afin de comprendre pourquoi, considérons l’incertitude de quelqu’un qui reçoit les données, symbole par symbole. Dans le premier cas, chaque nouveau symbole apporte une réponse à une question pour laquelle les deux résultats (F ou P) sont équiprobables. Mais dans le second cas, le résultat B est nettement moins probable que G, ce qui signifie que son incertitude est plus petite. Alors, du point de vue du destinataire, l’information donnée pour chaque nouveau symbole est aussi moindre. Le renseignement de base est au cœur de la théorie : pour mesurer l’information contenue dans une série de données, on mesure la quantité pour laquelle notre incertitude est réduite quand les données sont fournies.
MESURER L’INFORMATION La formulation d’une définition mathématique qui saisit la relation entre information et incertitude est due à un ingénieur et mathématicien américain, Claude Shannon. Son intérêt pour le sujet date de 1937, alors qu’il écrivait un mémoire pour son examen de maîtrise décrivant la construction de circuits électriques afin de résoudre des problèmes de logique. Les recherches de Shannon ont été un catalyseur majeur d’avancées techniques en ingénierie, mais heureusement, le cadre logique sous-jacent peut être expliqué sans aller jusqu’aux détails pratiques. 256
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
Comme exemple, considérons le problème suivant. Vous choisissez un nombre entier k dans l’intervalle 1 à 8, et je souhaite trouver ce nombre en posant des questions ayant pour réponse oui/non. Une manière de procéder est de commencer en demandant est-ce que « k = 1 » ? Si la réponse est non, alors je devrais demander est-ce que « k = 2 » ? Etc. Dans le pire des cas, si le nombre choisi est 8, je devrais poser huit questions en utilisant cette stratégie. Plus généralement, si les choix sont équiprobables, alors on devrait poser au moins quatre questions97. Cependant, il existe une meilleure stratégie. L’idée est de partager les possibilités en deux parties et de découvrir celle qui contient la réponse. Dans ce cas, la première question serait « k se trouve-t-il dans l’intervalle 1 à 4 ? » Connaissant la réponse à cette question, on réduit le nombre de possibilités de huit à quatre. Une deuxième question réduit les possibilités à deux et une troisième réduit les possibilités à une (figure 10.5). Ainsi, je peux deviner le choix en posant seulement trois questions. k = 1 ou 2 ou 3 ou 4 ? O
N k = 5 ou 6 ?
k = 1 ou 2 ? O k=1? O
N
N
O
k=3? O
k=5?
N
O
N
N k=7? O
N
Le nombre k est : 1 2 3 4 5 6 7 8 Figure 10.5 | Comment trouver un nombre entre 1 et 8 en posant trois questions.
97. Si chaque nombre entre 1 et 8 possède une probabilité de 1/8, alors le nombre de questions attendu est (1/8)(1 + 2 + 3 + 4 + 5 + 6 + 7 + 8) = 4,5. 257
Mathématiques et monnaie à l’ère de l’information
S’il y a n alternatives au lieu de 8, combien de questions oui/non seront nécessaires ? La méthode illustrée à travers le diagramme montre qu’une question résoudra deux possibilités, deux questions résoudront quatre possibilités, trois questions résoudront huit possibilités et de manière générale, x questions résoudront 2x possibilités. En considérant ce résultat sous un autre angle, pour découvrir l’une des n alternatives, il faut x questions, où x est (approximativement) le nombre tel que 2x = n. La relation inverse entre exponentielle et logarithme (chapitre 7) suggère que ce nombre est le logarithme98 à base 2 de n ; on l’écrira log2 n. L’analyse précédente suggère que l’on devrait considérer log2 n comme une mesure d’incertitude lorsque n alternatives sont équiprobables. Cela revient à dire que log2 n est la mesure de la quantité d’information communiquée lorsque l’une des n alternatives est découverte. Shannon utilise cette idée dans un article célèbre intitulé « Une théorie mathématique de la communication », publié en 1948. Le concept central était une définition de l’incertitude qui recouvre des situations où les événements se produisent avec différentes probabilités. Ce type de situation a été discuté dans la section précédente, lorsque l’on considérait deux sources, chacune produisant une succession de symboles. Dans les deux cas, il y avait deux alternatives pour chaque symbole, face/pile ou blanc/gris. Si les deux alternatives se produisent avec des probabilités p et q = 1 – p, la mesure de l’incertitude par Shannon est p log2 (
1 1 ) + q log2 ( ). p q
De manière équivalente, il s’agit de la quantité d’information transportée par chaque symbole de la série.
98. Le logarithme à base 2 est lié au logarithme commun (à base 10) par la formule approximative log2 n ≈ 3,222 × log10 n. 258
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
L’unité d’information est appelée bit, dérivé de l’expression « binary digit » en anglais (système binaire) utilisée pour décrire les symboles 0 et 1. Pour trancher entre ces deux alternatives, une question oui/non est nécessaire, donc cela représente un bit d’information. De manière plutôt déroutante, les symboles 0 et 1 sont aussi considérés comme des bits (de données). La définition générale de l’information de Shannon (ou de l’incertitude) est une généralisation de la formule ci-dessus99. Il apparaît que si l’on compile une liste de propriétés que l’on souhaiterait associer normalement à la notion d’incertitude, il y aurait essentiellement une seule définition pour les englober toutes, et c’est celle de Shannon. En réalité, la définition est justifiée non seulement parce qu’elle possède les bonnes propriétés, mais aussi parce qu’elle peut être utilisée pour formuler et démontrer des résultats importants. Comme exemple, revenons aux deux séries de données discutées dans la section précédente, les séries de faces-piles et de blanc-gris. Dans le cas F-P, p et q sont toutes les deux égales à 1/2, le logarithme (à base 2) de 2 est 1, la formule donne donc la valeur 1. Ceci signifie que chaque symbole, F ou P, transporte un bit d’information. Si l’expérience d’un lancer de pièce produit une série de 1 000 symboles, alors 1 000 bits de données sont nécessaires pour représenter le résultat. D’autre part, dans le cas de la succession de B et de G, les probabilités sont p = 1/6 et q = 5/6. En reportant ces valeurs dans la formule, on obtient à peu près 0,65, ce qui signifie que chaque symbole transporte environ 0,65 bit d’information. Donc si la théorie est correcte, il serait possible de représenter une série de 1 000 B et G en utilisant moins de 1 000 bits de données (avec un peu de chance environ 650). La technique utilisée pour réaliser ceci est connue sous le nom de compression des données.
99. Une introduction à la théorie mathématique de l’information, incluant la compression des données, peut être trouvée dans mon livre Codes: An Introduction to Information, Communication and Cryptography (Londres, Springer, 2008). 259
Mathématiques et monnaie à l’ère de l’information
L’idée est de couper la série en blocs de deux symboles, tels que chaque bloc corresponde à BB, BG, GB ou GG. Les propriétés de la source impliquent que ces blocs apparaissent avec les probabilités suivantes : BB
BG
GB
GG
1/36
5/6
5/36
25/36
On représente maintenant les blocs d’une manière simple en utilisant les symboles 0 et 1. En particulier, on encode les données en utilisant les « mots de passe » pour les quatre blocs : BB à 111, BG à 110, GB à 10, GG à 0. Le point crucial est que le bloc GG, le plus probable, est représenté par un mot de passe avec seulement un symbole : il est vrai que certains blocs sont représentés avec des mots de passe plus longs, mais ils se présentent plus rarement, et donc en moyenne, la série de données sera plus courte. En réalité, les mots de passe de longueur 1 sont utilisés avec une probabilité de 25/36, les mots de passe de longueur 2 sont utilisés avec une probabilité de 5/36 et les mots de passe de longueur 3 sont utilisés avec une probabilité de 5/36 + 1/36 = 1/6, ainsi le nombre moyen de bits requis pour un bloc de deux symboles est (1 ×
25 5 1 53 ) + (2 × ) + (3 × ) = . 36 36 6 36
Une série de 1 000 symboles contient 500 blocs, donc on s’attend à un nombre de bits utilisés pour la forme encodée de 500 × 53/36, ce qui vaut environ 736. C’est une économie significative. On pourrait utiliser une meilleure manière de représenter les données en partant avec des blocs plus longs, et on serait plus proche du minimum théorique de 650 bits. Il reste seulement à expliquer pourquoi aucune information n’a été perdue : en d’autres termes, pourquoi les données originales peuvent-elles être retrouvées en utilisant uniquement la série encodée de 0 et 1 ? À première vue, 260
LE COMPTE Y EST !
Mathématiques et monnaie à l’ère de l’information
cela paraît improbable : par exemple, comment peut-on décoder la série suivante ? 01000100011001000001100010000110000010100010
Il faut insister sur le fait que l’on peut seulement utiliser la règle d’encodage des blocs, comme nous l’avons donnée ci-dessus ; il n’y a aucune indication supplémentaire sous forme de ponctuation. La raison pour laquelle le décodage est possible est que l’on a choisi une règle de codage avec une propriété particulière : aucun mot de passe n’est le début d’un autre. On est capable ainsi de décoder la série de 0 et de 1 de la façon la plus simple possible, en contrôlant les blocs correspondants dans l’ordre. Le premier symbole est 0, qui correspond à GG, et comme il n’y a aucun mot de passe commençant par 0, le premier bloc doit être en réalité GG. Le suivant est 1, qui n’est pas un mot de passe, donc on continue jusqu’à avoir un mot de passe complet, dans ce cas 10, qui représente GB. La construction assure que 10 n’est pas le début d’un autre mot de passe. Le principe est maintenant facile à saisir à partir d’un exemple, tel que celui donné ci-dessus : on trouve que ces 43 bits d’information représentent une série de 64 B et G100. Ce bref résumé ne peut pas rendre justice à tout le travail de pionnier de Shannon. Ses découvertes sont à la base d’énoncés de théorèmes, sur des choses comme la capacité d’un canal d’information, et de démonstrations de théorèmes avec toute la force de la précision mathématique. Les résultats peuvent être utilisés pour prévoir le comportement des systèmes et ont été appliqués avec succès dans un large éventail de problèmes de l’industrie des télécommunications. Cette situation pourrait être comparée au manque de réussite dans le cas des théories financières modernes, comme discuté précédemment dans ce chapitre. La différence peut survenir 100. La succession de données qui produit la suite compressée est GGGGGGGGBBGGGGGGBGGGGGBGGGGGGGGGGBGBGGGGGB. 261
Mathématiques et monnaie à l’ère de l’information
parce que la théorie de l’information est appliquée à des situations dans lesquelles le comportement est régi par les lois de la physique, alors que la théorie de l’évaluation du prix des options est appliquée à des situations dans lesquelles le comportement humain est un facteur déterminant.
262
LE COMPTE Y EST !
11 Les mathématiques peuvent-elles assurer notre sécurité ?
L’information que l’on donne avant d’envoyer un message électronique est une sorte de clé destinée à assurer un modeste niveau de sécurité. Une meilleure sécurité exige des méthodes plus sophistiquées qui utilisent aujourd’hui des algorithmes possédant des propriétés mathématiques des nombres premiers. Malheureusement, il reste des questions encore non résolues sur les systèmes employés couramment. Donc si l’on pense que c’est la fin de l’histoire...
LA RECHERCHE DE LA SÉCURITÉ La monnaie, sous forme de pièces et de bijoux, était traditionnellement gardée sous clé. Les riches familles médiévales utilisaient un coffre-fort avec une grosse clé, tous deux étaient cachés avec précaution. Plus tard, le coffre pourra être gardé dans des chambres fortes d’une banque, derrière des portes sécurisées fermées à clé. Dans les deux cas, un voleur potentiel pouvait connaître l’emplacement du coffre, mais pour voler l’argent, il lui fallait trouver les clés. Un 263
Les mathématiques peuvent-elles assurer notre sécurité ?
principe analogue fut appliqué à l’envoi de messages secrets à des fins militaires ou diplomatiques : les moyens de communication pouvaient être facilement découverts, mais les « clés » devaient être gardées secrètes. Il en résulta une longue bataille entre les constructeurs de codes qui essayaient de produire de meilleures clés et les briseurs de codes qui cherchaient de meilleurs moyens de les trouver. Les constructeurs de codes gagnèrent la bataille à l’époque de Jules César, mais au IXe siècle, les briseurs de codes arabes découvrirent comment trouver les clés de systèmes tels que celui de César en utilisant la méthode de l’analyse de fréquences (chapitre 5). Peu à peu, les constructeurs de codes reprirent l’ascendant et après l’invention du système de Vigenère au XVIe siècle, on pensait que le système était impossible à briser. Mais au XIXe siècle, des améliorations des techniques statistiques ont conduit à trouver des méthodes efficaces pour trouver une clé de Vigenère et la bataille entre constructeurs de codes et briseurs de codes fut relancée. Durant la première moitié du XXe siècle, l’accent fut mis sur des systèmes utilisant des machines qui pouvaient brouiller les données de manière très complexe, si bien que le nombre possible de clés était astronomiquement grand101. De nos jours, la cryptographie est un épisode de routine de notre vie quotidienne, bien que nous ne puissions pas toujours en être conscients. Mais, comme toujours, nous sommes profondément conscients de la nécessité de conserver notre argent en sécurité. Parce qu’une grande partie de notre argent n’est pas gardée sous une forme tangible mais sous forme d’information, garder notre argent en sécurité et garder nos messages secrets sont devenus deux problèmes presque identiques. Les messages issus de nos cartes de crédit doivent pouvoir être envoyés et reçus en toute sécurité : pour que toutes les parties impliquées soient satisfaites, l’ensemble de l’opération doit être exécuté avec un niveau élevé de confidentialité. Donc on insiste sur les sauvegardes pratiques comme l’authentification (les instructions 101. Consulter Simon Singh, The Code Book (Londres, Fourth Estate, 1999).
264
LE COMPTE Y EST !
Les mathématiques peuvent-elles assurer notre sécurité ?
prétendant venir de moi-même doivent l’être réellement), l’intégrité (personne ne peut altérer les instructions au cours de la transmission) et la non-répudiation (je ne dois pas pouvoir affirmer que je n’ai pas émis les instructions le premier). Les tentatives de nos gouvernements de construire un cadre légal dans ce domaine sont toutefois plutôt primitives, en témoigne la situation curieuse du Royaume-Uni qui a une loi sur la protection des données et une loi sur la liberté de l’information. À un niveau plus pratique, il est clair que l’outil de base des constructeurs de codes a été introduit dans nos affaires financières. Ma carte de crédit présente un nombre à 16 chiffres au recto et un autre plus court au verso, et elle contient aussi une « puce » qui peut effectuer quelques opérations mystérieuses avec ces nombres. Je possède aussi un code « PIN » (numéro d’identification personnel) qui doit être mémorisé et fourni dès que j’utilise ma carte. Ces nombres constituent une sorte de clé cryptographique. Mais comme nous allons l’expliquer maintenant, les cryptosystèmes modernes les plus sophistiqués diffèrent des systèmes traditionnels dans la façon d’utiliser les clés. Une caractéristique des systèmes traditionnels était le fait qu’une simple clé était utilisée par l’expéditeur pour crypter le message et par le destinataire pour le décrypter. Le problème avec cette procédure résidait dans le fait qu’une méthode séparée et sûre pour communiquer la clé était requise, avant que les correspondants puissent utiliser le système. Les cryptographes s’y référaient sous le nom de problème de distribution de la clé, et il aboutissait à deux grandes difficultés, notamment en temps de guerre. Une nouvelle approche radicale a été développée en 1970, basée sur une manière différente d’utiliser les clés. L’idée fondamentale est qu’un utilisateur, appelons-le Bob, dispose de deux clés, une « clé publique » et une « clé privée ». La clé publique est utilisée pour coder les messages que d’autres correspondants souhaitent envoyer à Bob et la clé privée est utilisée par Bob pour décrypter ces messages. La sécurité du système dépend de 265
Les mathématiques peuvent-elles assurer notre sécurité ?
l’assurance que la clé privée de Bob ne pourra pas être trouvée facilement, même si quelqu’un connaît sa clé publique. Dans la suite de ce chapitre, nous examinerons les principes mathématiques qui sont à la base de cette cryptographie de la clé publique.
CERTAINES CHOSES SONT FACILES, MAIS D’AUTRES NON Notre dépendance aux ordinateurs tend à nous faire oublier que, à l’origine, l’arithmétique était un sujet difficile. Les scribes égyptiens et babyloniens étaient très entraînés, mais la pratique de leur art exigeait une facilité innée pour manipuler les nombres. Pendant plusieurs siècles, les algorithmes se sont considérablement améliorés et finalement, des écrivains comme Edmund Wingate au XVIIe siècle purent espérer les enseigner aux écoliers peu doués. Plus récemment, les mêmes algorithmes ont été implantés dans nos ordinateurs qui travaillent nettement plus vite que les écoliers et font moins de bruit. La révolution électronique a conduit à plusieurs nouvelles idées sur le processus de calcul lui-même. Dans les années 1930, plusieurs mathématiciens ont commencé à considérer la façon dont le calcul pouvait être décrit en termes mathématiques. Ils étaient motivés en partie par des problèmes logiques concernant les limites du calcul, et en partie par l’utilisation croissante des machines électromécaniques qui effectuaient des calculs longs et complexes. Le modèle le plus performant a été construit par Alan Turing (1912–1954). Sa description mathématique de ce que l’on appelle une machine de Turing s’est avérée d’une importance capitale, et dans les années 1940, le développement des ordinateurs électroniques a été guidé dans une certaine mesure par ses travaux. Pour illustrer l’état de l’art actuel, supposons que je demande à mon ordinateur de trouver les résultats du produit de deux nombres, r = 190 718 085 458 920 964 116 236 375 748 835 779 710 674 959 067 30 3 165 370 168 392 260 012 207 679 844 273 858 329 666 379 998 629 245 551 661 101,
266
LE COMPTE Y EST !
Les mathématiques peuvent-elles assurer notre sécurité ?
s = 3 390 914 846 854 132 702 461 119 005 170 659 611 590 183 264 349 3 49 314 118 399 149 154 498 993 443 438 522 697 051 601 444 997 586 070 043 641 531.
Cela donne instantanément la réponse : n = 6 467 087 875 462 503 741 036 180 030 918 781 080 605 161 336 528 5 14 858 515 194 383 497 290 371 265 134 131 631 596 192 510 894 008 358 952 072 408 451 489 068 314 747 895 266 246 659 178 026 938 998 472 81 1 416 895 946 348 840 095 581 638 293 010 126 348 584 409 544 381 895 7 12 500 040 785 631.
Que de tels grands nombres puissent être multipliés si rapidement, en utilisant la notation standard et les algorithmes, justifie l’affirmation selon laquelle aujourd’hui, ce type d’arithmétique est très facile. Toutefois, dans les années 1960, on commençait à découvrir que tous les problèmes de calcul ne partageaient pas cette propriété, et une théorie de la complexité du calcul fut développée pour essayer d’expliquer cette observation. La première étape a consisté à comprendre pourquoi certains algorithmes, tels que l’algorithme utilisé par la méthode des longues multiplications enseignée dans les écoles, fonctionnent aussi bien pour les grands nombres que pour les petits. La raison réside dans le fait que les nombres peuvent être représentés par une notation compacte. Le résultat de la multiplication de 2 par lui-même 50 fois donne un nombre gigantesque, mais en 1633, Nicholas Hunt écrivit ce nombre avec seulement 16 chiffres (figure 7.3). Dans les calculs, c’est la taille de la représentation qui intervient, non la taille du nombre lui-même. Avec la notation positionnelle décimale, n chiffres sont suffisants pour représenter tout nombre plus petit que 10n, et on peut effectuer effectivement toutes les opérations de l’arithmétique élémentaire en employant cette notation. Nous avons vu qu’il était facile pour un ordinateur moderne de multiplier deux grands nombres de plus de 100 chiffres ; en réalité, l’ordinateur exécute l’opération en utilisant essentiellement la même méthode que celle qu’employait ibn Labban pour multiplier des nombres à trois chiffres il y a 1 000 ans 267
Les mathématiques peuvent-elles assurer notre sécurité ?
(figure 4.5). Les étapes de base sont des multiplications à un chiffre : chaque chiffre du premier nombre est multiplié par chaque chiffre du second nombre. Ainsi, ibn Labban avait besoin de 3 × 3 = 9 étapes et si les nombres ont n chiffres, il faut n × n = n2 étapes en tout. Généralement, pour mesurer l’efficacité d’un algorithme, on utilise la méthode décrite au paragraphe précédent. C’est-à-dire que l’on examine la relation entre la taille de l’entrée et le nombre d’étapes nécessaires. Pour ce dernier, une estimation est tout ce dont on a besoin, car en pratique, on ne s’intéresse qu’à une estimation grossière du temps que l’algorithme prendra. Supposons que l’on puisse utiliser un ordinateur qui peut effectuer un milliard (109) d’étapes à chaque seconde, ce qui n’est pas une supposition déraisonnable. Alors le temps nécessaire pour multiplier deux nombres de 20 chiffres est 202/109 secondes ou 0,000 000 4. Naturellement, si n croît, le temps augmente aussi, mais seulement à une vitesse modeste. Si n = 100, le temps nécessaire est de seulement 0,000 01 seconde. Même si l’on a un problème qui nécessite un algorithme plus complexe qui requiert n3 étapes (par exemple), les résultats sont analogues. Les calculs sont un peu plus longs, mais encore faisables car le temps nécessaire peut toujours être évalué en fractions de seconde, comme dans le tableau suivant. n = 20
n = 40
n2 étapes
0,000 000 4
0,000 001 6
0,000 003 6
0,000 01
n3
0,000 000 8
0,000 006 4
0,000 021 6
0,001
Taille de l’entrée étapes
n = 60
n = 100
Les résultats ci-dessus justifient le mot « facile » pour les problèmes qui peuvent être résolus par un algorithme pour lequel le nombre d’étapes est n2 ou n3, ou généralement pour toute puissance nm. On dit que de tels algorithmes opèrent en temps polynomial et les problèmes correspondants appartiennent à une classe appelée P. 268
LE COMPTE Y EST !
Les mathématiques peuvent-elles assurer notre sécurité ?
Ces algorithmes polynomiaux permettent d’effectuer les opérations de base de l’arithmétique élémentaire, donc ces opérations sont de la classe P et sont relativement faciles. Il apparaît que de nombreux autres problèmes de calcul appartiennent aussi à la classe P. Ce qui signifie que de tels problèmes peuvent être résolus en utilisant des algorithmes efficaces (exprimés dans un langage de programmation d’ordinateur), même si les nombres ont des centaines de chiffres. Toutefois, il est essentiel d’utiliser un algorithme efficace. Par exemple, rappelons les mots de Mersenne, écrits au XVIe siècle. « Pour décider si des nombres donnés de 15 ou 20 chiffres sont premiers ou non... une vie entière ne suffirait pas pour examiner ce problème par n’importe quelle méthode actuellement connue. » L’affirmation de Mersenne était correcte, car il faisait référence à l’algorithme qui vérifie si un nombre est premier en essayant de trouver ses facteurs. En réalité, on croyait encore (en 2015) que trouver les facteurs d’un nombre n’était pas un problème facile. D’autre part, Mersenne était prudent en envisageant la possibilité de l’existence d’autres algorithmes pour le problème de la primalité, qui ne fonctionne pas en temps polynomial. Ce n’est qu’en 2002 qu’un algorithme a été trouvé par trois jeunes mathématiciens indiens, Manindra Agrawal, Neeraj Kayal et Nitin Saxena102. L’algorithme d’Agrawal, Kayal et Saxena montre que le test des nombres premiers appartient à la classe P, par une très ingénieuse méthode théorique. En pratique, une méthode différente, introduite en 1980, est utilisée ; elle n’est pas strictement un algorithme de temps polynomial, mais elle est néanmoins efficace. L’algorithme utilise deux idées qui remontent à Fermat : son petit théorème (chapitre 6) et les lois de probabilité développées en coopération avec Pascal (chapitre 8). L’idée est très simple. Si l’on souhaite tester si 102. L’algorithme d’Agrawal, Kayal et Saxena est basé sur (x + y)p congru à xp + yp modulo p, résultat déjà observé par Leibniz. 269
Les mathématiques peuvent-elles assurer notre sécurité ?
un nombre donné n est premier, on choisit un nombre x entre 2 et n – 1 et on pose la question de Fermat : xn – 1 est-il congru à 1 mod n ?
Le calcul de xn – 1 modulo n peut se faire en temps polynomial, le test est donc facile à faire. Si la réponse est non, on peut conclure que n n’est pas premier, car sinon le petit théorème de Fermat serait contredit. Mais si la réponse est oui, n peut être ou non premier et (à première vue) nous sommes bloqués. En 1976, Gary Miller a suggéré une façon de surmonter ce problème de la question de Fermat et en 1980, Michael Rabin a démontré un théorème qui le rend utilisable. La question de Miller-Rabin est un peu plus complexe que la question de Fermat, mais le calcul peut s’effectuer en un temps polynomial. Il est important de noter que la nouvelle question possède la propriété suivante : quand n n’est pas premier, la réponse oui surviendra pour moins de 25 % des valeurs possibles de x. Donc si l’on choisit x au hasard, la probabilité que l’on obtienne une fausse réponse positive est au plus de 1/x. Et si l’on répète le test k fois, chacun avec une nouvelle valeur aléatoire de x, la probabilité d’obtenir k fausses réponses positives est de (1/4)k. Par exemple, si l’on fait le test vingt fois, la probabilité d’une erreur est de moins de un sur mille milliards (1012). Le test de Miller-Robin est maintenant communément utilisé pour trouver des nombres premiers jusqu’à 1 000 chiffres et on ne connaît pas d’exemples où il aurait échoué. Bien que les problèmes de test de primalité d’un nombre soient considérés désormais comme faciles, tous les problèmes n’appartiennent pas à cette catégorie. Cette situation joue un rôle crucial dans la cryptographie moderne, comme on va l’expliquer en détail dans cette section. Pour le moment, on considère un exemple simple. Supposons qu’Ève soit une voleuse d’identité qui tente d’obtenir sur son ordinateur le mot de passe de mon compte en banque enregistré sur mon ordinateur. J’ai choisi un mot de passe enregistré sous forme binaire, quelque chose comme 01100 11101...0101010111. Si le mot 270
LE COMPTE Y EST !
Les mathématiques peuvent-elles assurer notre sécurité ?
de passe a n bits, le nombre d’étapes est 2n et chacune d’elles doit être testée. Ici, le fait que le nombre d’étapes est 2n a un effet remarquable sur le temps consacré à la recherche. Par exemple, supposons qu’Ève utilise un ordinateur qui effectue un milliard d’opérations par seconde. Avec un mot de passe de 20 bits, le nombre d’étapes est 220, qui est égal environ à un million, si bien que le temps total nécessaire n’est seulement que d’un millième de seconde. Doubler la taille de l’entrée de 20 à 40 signifie que le nombre d’étapes passe de 20 à 40, c’est-à-dire 220 × 220, soit environ mille milliards et, dorénavant, le temps nécessaire est d’environ 1 000 secondes, soit 16 minutes et 40 secondes. À ce niveau, mon mot de passe n’est pas encore sécurisé, mais pour de plus grandes valeurs de n, l’effet sur le temps requis est spectaculaire. Entrée de taille n Temps pour 2n
20 0,001 seconde
40 16+ minutes
60 200 ans environ
Donc si mon mot de passe a 60 chiffres en binaire, il est sécurisé. En réalité, même si Ève possédait un ordinateur plus rapide, il n’y aurait pas une grande différence avec la conclusion générale. En 1960, il avait été remarqué que certains algorithmes pratiques semblaient présenter le même comportement que la « force brute » qu’utilise Ève pour la recherche de mon mot de passe. Plusieurs d’entre eux avaient été utilisés en recherche opérationnelle, la branche des mathématiques qui traite de l’allocation et de la planification des ressources, dans laquelle les praticiens trouvent que les méthodes qui fonctionnent bien pour de petits problèmes échouent complètement quand la taille du problème augmente. Un autre cas où des difficultés analogues se présentent était l’ancien problème de la recherche des facteurs de nombres entiers. Bien que la multiplication de deux grands nombres soit facile, les « démultiplier » (c’est-à-dire trouver les facteurs du produit) ne l’est pas. Si le nombre est petit, trouver les facteurs est immédiat : par exemple, il est facile de montrer « à 271
Les mathématiques peuvent-elles assurer notre sécurité ?
la main » que les facteurs de 1 001 sont 7, 11 et 13. Même pour un nombre comme 267 – 1 = 1 475 739 525 806 764 412 927, qui a tenu Mersenne en échec en 1643, a été factorisé par Frank Nelson Cole en 1903. Il n’avait aucune aide mécanique, mais c’était, comme il le disait, « le travail de trois années de dimanches ». L’arrivée des ordinateurs a semblé offrir la perspective de plus grands succès immédiats, et en effet, j’ai des programmes sur mon ordinateur qui peuvent faire le travail de Cole très rapidement. Quand j’ai demandé les facteurs de 267 – 1, la réponse est arrivée instantanément : 193 707 721 × 761 838 257 287. Mais personne n’a été capable de trouver un algorithme qui fonctionnerait pour des nombres vraiment grands où, au moment où j’écris, « vraiment grand » signifie 300 chiffres décimaux. C’est un hiatus qui est couramment exploité pour s’assurer que nos affaires financières restent sécurisées.
COMMENT GARDER UN SECRET : LA FAÇON MODERNE Le fait important qui émerge de la discussion de la section précédente est qu’il y a quelques opérations mathématiques qui sont faciles à faire mais difficiles à défaire. Cette observation jette une nouvelle lumière sur nos modèles métaphoriques des processus en termes de fermeture d’un coffre avec une clé. En termes simplistes, si l’on a une clé qui ferme le coffre facilement, on suppose que la même clé l’ouvrira aussi facilement. Mais maintenant, on doit admettre l’éventualité que l’ouverture avec la même clé peut être difficile, bien qu’avec une autre clé ce soit plus facile. Cela est à la base de la cryptographie à clé publique, proposée par Whitfield Diffie et Martin Hellman en 1976. Diffie et Hellman ont décrit les idées centrales de la cryptographie à clé publique, mais ils n’avaient pas construit un système opérationnel. Cela a été fait l’année suivante par Ronald Rivest, Adi Shamir et Leonard Adleman, et leur système connu sous le nom de RSA est 272
LE COMPTE Y EST !
Les mathématiques peuvent-elles assurer notre sécurité ?
devenu célèbre du jour au lendemain, essentiellement parce qu’il avait été décrit par Martin Gardner dans l’un de ses articles mensuels de la revue Scientific American103. Il est basé sur les résultats mathématiques décrits dans la section précédente et il a illustré très élégamment les principes de base de la cryptographie à clé publique104. RSA est un ensemble de plusieurs algorithmes. Le premier est une procédure qui permet à un utilisateur (disons Bob) de calculer deux clés numériques. On les appelle sa clé privée et sa clé publique. Bob commence par choisir deux nombres r et s qui doivent être premiers. Comme nous le savons, il peut facilement trouver de tels nombres avec plusieurs centaines de chiffres. Puis, il utilise r et s pour calculer trois autres nombres, notés n, d et e. Le nombre n correspond simplement à r fois s, et bien que ce soit de grands nombres, nous savons que l’on peut l’obtenir facilement par une longue multiplication. Pour d et e, Bob doit être sûr que le produit d × e est congru à 1 modulo (r – 1)(s – 1) : cela peut aussi se faire facilement. Les nombres n et e incluent la clé publique de Bob et il peut la donner à tout le monde. Mais d est sa clé privée et il garde ce nombre secret, de même que les nombres premiers r et s qu’il utilise pour poluer d (figure 11.1).
r
s
d PRIVÉE
e
n PUBLIQUE
Figure 11.1 | Clés publique et privée dans le cryptosystème RSA.
103. L’article de Martin Gardner sur RSA est « Un nouveau type de chiffrage qui prendrait des millions d’années à être cassé », Scientific American (août 1977) 120–124. 104. On sait maintenant qu’un système similaire à RSA a été proposé il y a quelques années par des mathématiciens travaillant pour le GCHQ, le service britannique de cryptographie, mais cette information n’a pas été rendue publique avant 1997. Voir The Code Book (comme dans la note de bas de page 1). 273
Les mathématiques peuvent-elles assurer notre sécurité ?
Pour compléter le système RSA, deux algorithmes supplémentaires sont nécessaires : l’un pour crypter les messages et l’autre pour les décrypter (figure 11.2). L’entrée pour l’algorithme de cryptage est le message original, avec les valeurs publiques de n et e. L’entrée de l’algorithme de décryptage est le message crypté avec les valeurs privées de d (et n). Quand une personne (disons Alice) souhaite envoyer un message à Bob, elle utilise sa clé publique pour le crypter et Bob utilise sa clé privée pour le décrypter. Il résulte de la manière dont les clés ont été choisies que l’algorithme de décryptage est l’inverse de l’algorithme de cryptage. En d’autres termes, c’est le message initial est le même que l’original. La démonstration repose sur certains résultats de base découverts par Fermat et Euler : il est bon de rappeler qu’en termes d’applications, les mathématiques peuvent être très en avance sur leur temps105. L’efficacité de RSA dépend de deux choses. Il est efficace, car les algorithmes de cryptage et de décryptage utilisés par Alice et Bob sont faciles, dans le sens où ils s’effectuent en temps polynomial. D’autre part, on pense qu’ils sont sûrs, car personne n’a trouvé une méthode facile pour décrypter le message crypté sans la clé privée de Bob. On ne dispose pas d’un algorithme « facile » pour calculer les nombres privés r, s et d, bien que les nombres publics n et e soient connus. Malheureusement, cela n’est pas démontré en termes mathématiques106. message original =
e,
n message crypté
message décrypté
d, n Figure 11.2 | Le trait essentiel du système de cryptage RSA.
105. Les algorithmes de cryptage et de décryptage dans RSA opèrent sur des messages exprimés sous la forme d’entiers modulo n. Un message original m est crypté en me et un message crypté c est décrypté en cd. Le système fonctionne car e et d sont choisis de telle manière que med = m (modulo n). 106. Il s’agit de l’un des sept « problèmes du prix du millénaire » pour lesquels la fondation de l’Institut de mathématiques Clay offre un prix de un million de dollars.
274
LE COMPTE Y EST !
Les mathématiques peuvent-elles assurer notre sécurité ?
Pour cette raison, il est bon d’examiner avec plus d’attention la manière dont RSA fonctionne en pratique. Bob doit commencer par trouver deux nombres premiers r et s. Ils doivent être assez grands, mais comme nous l’avons observé, de bons algorithmes pratiques pour cette tâche sont disponibles depuis les années 1970. Par exemple, si l’on veut être sûr que les deux nombres aient plus de 100 chiffres, on peut demander à son ordinateur un nombre premier plus grand que (disons) 1399 et un nombre premier plus grand que 1988. Presque instantanément, l’ordinateur donnera les nombres r et s affichés plus haut. À nouveau, quand Bob demande à son ordinateur de multiplier r par s, un nombre avec plus de 200 chiffres apparaît immédiatement. D’autre part, supposons qu’Ève ait réussi à intercepter un message crypté d’Alice à Bob. Elle connaît la clé publique de Bob, les nombres n et e, mais cette information ne lui permet pas d’accéder à l’algorithme de décryptage, car elle ne peut pas calculer la clé privée de Bob, d. Si elle pouvait trouver les facteurs premiers r et s, la tâche deviendrait triviale, car les règles pour effectuer les calculs initiaux de Bob sont connus de tous. Mais Ève connaît seulement n et non la factorisation n = rs. Elle pourrait demander à son ordinateur de trouver r et s, mais si n est un nombre avec plusieurs centaines de chiffres, les algorithmes actuellement disponibles ne répondront pas à la demande d’Ève, même si elle est prête à attendre sa vie entière. Quand Martin Gardner a écrit pour la première fois un article sur RSA dans Scientific American, il a illustré la puissance du système en mettant au défi ses lecteurs de trouver un nombre premier de 129 chiffres. Cela a pris 17 ans pour résoudre ce problème, en utilisant les efforts combinés de plus de 600 personnes. Par la suite, des sommes d’argent ont été offerts pour la factorisation de plus grands nombres, et des nombres jusqu’à 232 chiffres ont été factorisés avec succès. Mais (à notre connaissance), il n’y a eu aucune percée. Aucune idée fondamentalement nouvelle n’a été découverte, les succès ayant été considérés comme le résultat d’avancées mineures dans la stratégie et le développement des ressources de calcul. Les sommes 275
Les mathématiques peuvent-elles assurer notre sécurité ?
d’argent ont été supprimés en 2007, mais certains des nombres non atteints peuvent encore être trouvés sur Internet et il y a sans doute de nombreuses personnes qui travaillent avec acharnement pour les factoriser107. Si une façon facile de résoudre de tels problèmes était trouvée, cela aurait de graves conséquences.
LES MATHÉMATIQUES PEUVENT-ELLES ASSURER NOTRE SÉCURITÉ ? La question posée au début de ce chapitre mérite d’être considérée dans un contexte plus vaste, même si la réponse ne permet pas toujours de conclure. Sur l’échelle de l’évolution de plusieurs milliards d’années, la période couverte dans ce livre ne représente qu’un battement de cil. En près de 5 000 ans, les mathématiques ont aidé à transformer la condition humaine et sont devenues notre meilleur espoir de la comprendre. Mais nous ne pouvons pas négliger le fait que, dans de mauvaises mains, les mathématiques peuvent créer d’énormes problèmes. Dans la centaine d’années à venir, il y aura sûrement des progrès (de type traditionnel) et les mathématiques aideront à les réaliser. Par ailleurs, l’espèce humaine est maintenant face à la possibilité réelle de sa disparition. Les mathématiques constituent-elles une sauvegarde contre les extrémismes de toutes sortes, ou sont-elles une arme dangereuse ? Il serait bon de terminer sur un renvoi réconfortant aux leçons de l’histoire, mais ces leçons ne nous apportent que de l’espoir, non de la certitude.
107. Il existe de nombreuses références sur des sites internet relatifs à la compétition de factorisation RSA, par exemple www.emc.com (consulté le 1er juin 2015).
276
LE COMPTE Y EST !
INDEX A abaco d’algorisimo 117 abacus 66 abaque 64, 66, 99, 100, 101, 117 de Gerbert 99, 100, 101, 109 Académie française des sciences 231 actif prix 245 Adleman, Leonard 272 Agrawal, Manindra 269 aire circulaire 45, 76 Alberti 138, 139 disque 127, 128, 138 aléatoire 132, 207, 245, 270 algèbre 85, 102, 106, 121, 122, 124, 130, 149, 152, 154, 155, 158, 160, 161, 165, 175, 182, 188, 213, 222, 223, 236 moderne 102, 106, 121 symbolique 106, 121 algébrique 125, 130, 132, 148, 150, 153, 155, 157, 158, 165, 173
algorithme 85, 92, 94, 104, 105, 107, 108, 119, 120, 124, 125, 163, 182, 212, 223, 267, 268, 269, 272, 274, 275 de l’arithmétique 93, 105, 248 de résolution 130 de Tartaglia 123, 124, 125, 126 algorithmique(s) 9, 109 al-jabr 101, 102, 103, 106 al-Kindi 136, 137 alphabet grec 62, 63 phonétique 61 analyse des fréquences 137 Arbuthnot 177, 178 Archimède 77, 78, 79, 153, 154, 155, 156, 159, 161, 164, 172 approximation 78 argent 51, 52, 53, 54, 55, 56, 58, 59, 60, 66, 67, 95, 96, 97, 98, 100, 112, 113, 114, 115, 117, 123, 169, 170, 223, 234, 241, 242, 244, 248, 249, 250, 252, 253, 263, 264, 275, 276 Aristote 19, 20
INDEX
arithmétique 11, 13, 15, 16, 18, 21, 22, 23, 32, 34, 36, 37, 39, 45, 47, 55, 56, 57, 63, 64, 66, 67, 68, 73, 74, 79, 85, 86, 87, 89, 90, 91, 92, 93, 94, 96, 97, 98, 99, 100, 101, 105, 106, 108, 109, 110, 111, 116, 122, 126, 142, 144, 162, 165, 180, 186, 187, 188, 190, 191, 203, 222, 223, 248, 266, 267, 269 commerciale 97, 111, 122 de placement 90 des cailloux 64, 79, 86 modulaire 190, 191 Arrow, Kenneth 233 impossibility Theorem 234 astragale 211 astronomie 123, 145, 168, 180, 191, 192, 235 augustale 113, 114, 115 authentification 264
B Bachelier, Louis 245, 246, 247, 248, 250, 251 Bakshali manuscrit 97 balance à bras-égaux 46, 47, 55 ban 51, 55 banque 114, 115, 249, 250, 252, 253, 263, 270 Barcelone 105, 235 barre(s) 42, 44 de mesures 236 278
LE COMPTE Y EST !
bâton(s) de comptage 15, 16, 17, 18, 23, 27 Bayes 218, 219 Bebtham, Jeremy 225 Bellhouse, David 207 Bernoulli, Jakob 176, 177, 178, 205, 206, 207, 211, 212, 216, 223, 224, 225, 255 Bernoulli, Johann 176, 178, 205, 223 Bernoulli, Nikolaus 205 Bhaskara 127, 128, 129, 130, 132, 135, 184, 213 bidimensionnel 41 billet 224 binôme 118, 119, 124, 125, 126, 131, 132, 148, 163, 164, 165, 177, 184, 203, 212, 213, 214 algèbre 130 coefficient 131, 132, 148, 184, 203, 212, 213, 214 formule 124, 126, 148, 163 Black, Fischer 232, 251 Black-Scholes-Merton 251 équation 251 Bolzano 194 Borel, Emile 210 Brouncker 173 bulle de la Compagnie des mers du Sud 242, 252 Bungus, Peter 180, 182
INDEX
C cailloux 63, 64, 65, 66, 79, 86, 186 arithmétique 64 calcul différentielle 171 calculateur de sable 78 électronique 92 mobile 86 moderne 61 calculus 66 Cantor, Georg 194 caractère(s) grecques 63 romains 65 carat 115 Carcassonne 235 Cardano, Hiéronimo 123, 124, 125, 126 Caroll, Lewis 233 carré 41 Carroll, Lewis 232 carte(s) 142 bancaires 252, 253, 264 Cauchy, Augustin-Louis 194 César, Jules 133, 134, 135, 215, 264 Clare, George 243 diagramme 244 clé(s) 68, 71, 98, 133, 134, 135, 138, 139, 161, 173, 217, 251, 263, 264, 265, 266, 272, 273, 274, 275
privée 265, 266, 273, 274, 275 publique 265, 266, 272, 273, 274, 275
Cole, Frank Nelson 183, 272 combinaison 31, 96, 98, 129, 246 combinatoire 126, 128, 132, 135, 184, 212 moderne 135 complétion du carré 105 du cube 125 complexité du calcul 117, 267 compression de données 259 Condorcet 232, 233, 234, 235, 236 contrats sociaux 61 coquillage(s) 21, 58 correspondance biunivoque 17, 58 couper-et-choisir 14, 15 courbe de contrat 230 en cloche 216, 217 Cournot 226 cryptage 133, 134, 135, 136, 137, 138, 139, 274 cryptographe(s) 254, 265 arabes 211, 254 islamiques 200 cryptographie 133, 211, 264, 266, 272, 273 de la clé publique 266 moderne 270 279
INDEX
cryptosystème(s) 133, 265, 273 cubit 40, 44, 45, 48, 49, 50 doigt 40 royal 50 cunéiforme 30, 31 cycle des affaires 243
D débat entre Grain et Sheep 18, 27 de Borda 231, 232, 233, 234, 235, 236 décimal 62, 87, 90, 91, 99, 144, 236 placement 90, 91, 99 décrypter 134, 138, 211, 265, 274 Dedekind, Richard 194 définition(s) 161, 194, 202, 204, 234, 236, 238, 256, 258, 259 de La Vallée Poussin, CharlesJea 195 del Ferro, Scipione 123 démocratie 230, 233 de Moivre, Abraham 211, 212, 213, 214, 215, 216, 255 démonstration déductive 92 démythologisation(s) 68 denarius 97 de Pise, Léonardo 110, 143 dérivée 49 dé(s) 198, 255 280
LE COMPTE Y EST !
de Saint Vincent, Grégoire 173 de Talleyrand, Charles-Maurice 234 déterministe 245 De Vetula 199, 200 diagonale 43, 50, 57, 73, 74, 75, 76, 77 champ carré 76 différentielle(s) 171, 172, 193 Diffie, Whitfield 272 dinar 95, 96, 115 romain 97 distribution normale 217, 247 division 35, 36, 37, 38, 47, 63, 64, 73, 79, 85, 86, 112, 116, 117, 144, 145, 161, 182, 236 arithmétique 36, 37 complexe 36 exacte 47, 79 simple 63 Dodson, Charles 232 droite du budget 227, 228, 229 Dunkirk 235 Dupuit, Jules 226, 227
E économie néoclassique 230 Edgeworth, Francis Ysidro 228, 230 Éléments 69, 80 équation(s) 102, 103, 105, 110, 119, 121, 122, 123, 124, 125, 126, 130, 150, 151, 152, 157,
INDEX
159, 160, 186, 187, 194, 216, 226, 229, 245, 246, 248, 251 cubique 122, 123 quadratique 103, 122, 123, 125 résolution 121, 123, 124, 130 équiprobable 198, 204 équité 13, 51, 198 Eschyle 64 espérance(s) 197, 202, 204, 208, 247 étalon 48, 49, 51, 73, 95, 170, 235, 236, 238, 239 Euclide 69, 70, 71, 73, 75, 77, 80, 81, 82, 83, 92, 179, 180, 189, 192, 222 Euler 178, 179, 187, 188, 189, 191, 274 exponentielle(s) 173, 176, 177, 178, 187, 188, 258 série 176
F face(s) 197, 198, 212, 216 factorielle 215 Fermat 152, 153, 155, 156, 157, 158, 159, 160, 161, 164, 173, 180, 183, 184, 185, 186, 191, 195, 202, 203, 204, 205, 218, 269, 270, 274 dernier théorème 185, 186, 195 Pascal, Blaise 202 petit théorème 270 Fibonacci 110, 169
finance 51, 52, 98, 201, 244, 248, 251 fluxion(s) 159, 161, 162, 167, 168, 172, 204 fraction 34, 35, 38, 39, 73, 75, 120, 163, 164 Frédéric II 113, 114 fréquence(s) 136, 200, 211, 214, 218, 254, 255 analyse 137, 139, 254 relative 200, 211, 214, 218, 255
G Gardner, Martin 273, 275 Gauss, Carl Friedrich 188, 189, 190, 191, 192, 195, 217, 222 Disquisitiones 189, 191 nombre premier 191 géométrie(s) 13, 15, 40, 42, 57, 65, 69, 70, 73, 77, 85, 104, 105, 142, 149, 165, 188, 192, 222, 223 cartésienne 219 élémentaire 70 euclidienne 192 mesure de la terre 40 non euclidienne 192 Gerbert, d’Aurillac 98, 99, 100, 101, 109 abaque 99 Gossen, Heinrich 229 Grain et Mouton, débat 27 guinée 170, 171 d’or 169 gur 54, 55 281
INDEX
282
H
J
Hadamard, Jacques 195 Harriot 142, 146, 147, 148, 149, 163, 164, 176, 177 Hellman, Martin 272 Hérodote 210 Hésiode 14 hiéroglyphe 40 Hunt, Nicholas 143, 180, 181, 267 hyperbole 157, 173, 174
jeton 22, 58, 112, 207 Jeux stratégies 205 Jevons, Stanley 20, 228, 243 Jordanus de Nemore 106, 107, 108, 120, 125
I
L
incertitude 252, 256, 258, 259 incommensurable(s) 75 incommodité du troc 19 indifférence courbes 228, 229, 230 information 10, 203, 210, 217, 241, 252, 253, 254, 256, 258, 259, 260, 261, 262, 263, 264, 265, 273, 275 argent 252 liberté 265 mesure 256 intégrales indéfinies 172 intégrité 265 intérêt(s) 37, 39, 56, 114, 117, 118, 119, 121, 122, 142, 146, 147, 148, 149, 155, 171, 177, 191, 201, 216, 232, 233, 234, 256 composés 117, 119, 121, 122, 147, 148, 149, 177
Laplace, Pierre-Simon 217, 219, 232, 233, 234, 235, 236 Mécanique céleste 236 théorème central limite 217 Legendre, Adien-Matie 189, 191, 217 Leibniz, Gottfried Wilhem 168, 169, 171, 172, 173, 176, 184, 192, 245, 269 Lilavati 127, 128, 129, 130 limite 146, 149, 155, 187, 192, 193, 194, 195, 217 lingot 54, 55, 57, 58, 97 lire 201, 204 logarithme(s) 144, 145, 146, 174, 175, 176, 177, 178, 189, 191, 213, 214, 215, 225, 258, 259 antilogarithmes 146 hyperbolique 174, 175, 176, 177, 178, 189, 215, 225 table 175
LE COMPTE Y EST !
K Kayal, Neeraj 269 kilogramme 238, 239 prototype 239
INDEX
logique 9, 11 Loi des grands nombres 210, 214, 217 longueur d’ondes 238 louis d’or 169, 170, 171 Lucas, Edouard 183
M mammouth 14, 223, 224 scénario 14 marginale 224, 229, 230 mark 116, 117 masse 46 mathématique(s) anciennes 29, 61, 126 de la situation 227 des paris 201 forme 12 jeux de dés 198, 201 langage 123, 139, 221, 226 modernes 209 nouvelles 60, 68 pratiques 60 préhistoriques 12 résolution des problèmes 102, 159 sauvegarde 264, 276 sécurité 263, 276 utilitaires 9 vraies 13 Menger, Carl 228 Mersenne, Marin 180, 181, 182, 183, 191, 269, 272 nombres premiers 180, 191, 269
Merton, Robert 251 Mésopotamie 18, 27, 28, 32, 34, 51, 53, 56, 60, 77, 79 message 67, 133, 134, 135, 136, 137, 138, 139, 253, 254, 263, 265, 274, 275 mesure aire 9, 39, 43 information 10, 256 longueur 9, 39 monnaie 9 mesure-sila 44, 45, 46, 77 cylindrique 44, 45 méthode algébrique 153, 173 symbolique 106 mètre 235 Miller-Robin 270 mod 190, 191 modius 67 modulo 189, 269, 270, 273, 274 monnaie invention 62 jeton 22, 58, 112 nationale 167 objet 15, 22 origine 19 primitive 20 Montmort, Pierre de 205, 206, 207 Morgenstern, Oskar 210, 233 multiplication 32, 33, 35, 37, 41, 49, 63, 86, 89, 90, 91, 92, 283
INDEX
93, 94, 118, 144, 145, 190, 267, 271, 273 longue 92, 93, 94, 273 mythe(s) 14, 18
N Naqada 29, 37 Newton, Isaac 106, 159, 160, 161, 162, 163, 164, 165, 167, 168, 169, 170, 171, 172, 173, 175, 176, 192, 204, 213, 222, 236, 242 Nightingale, Florence 243 Nippur 33 nombre(s) amicaux 83 complexe 187, 188, 195 entier 73, 82, 83, 120, 163, 164, 171, 257 impair 74, 75 parfait 179, 180, 181 particuliers 18, 24, 106 premiers 24, 80, 81, 82, 83, 179, 182, 183, 189, 190, 191, 195, 263, 269, 270, 273, 275 réels 187, 195 triangulaires 64 valeur numérique donnée 103 non-répudiation 265 notation 32, 33, 34, 35, 36, 38, 39, 63, 68, 80, 86, 94, 102, 111, 118, 119, 121, 125, 128, 130, 132, 144, 145, 155, 163, 165, 171, 172, 176, 178, 189, 193, 215, 229, 267 284
LE COMPTE Y EST !
notions communes 70, 71 numéraux arithmétique 64 grecs, romains 65 numérique langage 23 numérologie 180 numérologue(s) 180, 244
O objet poids 46, 47 Oldenbourg, Henry 171 opération(s) bancaires 252 comptables 253 ordinale 233 ordinateur(s) 92, 183, 241, 253, 266, 267, 268, 269, 270, 271, 272, 275 électroniques 266
P π 45, 77, 78, 188, 193, 214 Pacioli, Luca 122, 123, 202, 217 paiement carte de crédit 252 papyrus de Rhind 37, 40, 68, 77, 126 partie(s) fractionnaire(s) 34, 35, 117 partition 199
INDEX
Pascal, Blaise 132, 180, 202, 203, 204, 205, 269 Pegolotti, Francesco Balducci 114, 115, 116, 117, 118, 121, 145, 147, 169 table 116, 118, 121 permutation 135 pesée 47, 51, 52, 55, 58 Petit Théorème de Fermat 184, 191, 269 Petrie, William Flinders 50 phénomènes physiques 238 pièce(s) 20, 54, 57, 58, 59, 60, 61, 67, 94, 95, 96, 97, 98, 101, 112, 113, 114, 115, 117, 169, 170, 171, 210, 223, 248, 250, 263 pile(s) 29, 197, 212, 213 Pitt, William 250 Playfair, William 219, 220, 243 poids 33, 46, 47, 48, 50, 51, 52, 53, 54, 55, 59, 60, 67, 95, 96, 97, 98, 112, 114, 115, 117, 169, 170, 171, 221, 222, 234, 236, 237, 239 postulats 70, 71 préférence sociale 233, 234 Principia 168 prix des actions 242, 245 probabilité(s) 177, 178, 195, 197, 202, 204, 205, 206, 207, 208, 211, 212, 213, 214, 215, 216, 217, 218, 219, 222, 223,
224, 232, 243, 245, 246, 248, 250, 255, 256, 257, 258, 259, 260, 269, 270 calcul 205 événements 204 théorie mathématique 215 problème arithmétique 9, 55, 111 problème des points 201, 202, 203, 204, 217 problèmes pratiques 13, 27, 195, 222, 223, 248 procédure(s) 14, 33, 36, 55, 86, 93, 104, 107, 121, 230, 231, 232, 254, 265, 273 arithmétique 15, 32, 55, 85, 89, 101, 109, 120, 149, 181, 222 géométrique 15, 119 programme informatique 104, 272 puissance fractionnaire 172 pureté 96, 97, 101, 112, 115, 170, 171 Pythagore 68, 69, 71, 72, 73, 151, 185 théorème 69, 71, 72
Q quadrature 155, 156, 157 du cercle 77, 78, 153 quattrinos 112 quingentos 67 minime 67 285
INDEX
R racine carrée de deux 75 racine(s) 75, 76, 77, 102, 103, 104, 107, 119, 120, 163, 165, 186, 187, 191, 194, 214, 222, 248 cubiques 122, 124, 125, 126, 130 d’une équation 194 nombre négatif 186 primitive 191 Rivest, Ronald 272 Royal Mint 169, 170, 171, 242 RSA 272, 273, 274, 275, 276
S Saint-Vincent 173 Sarasa 173 Saxena, Nitin 269 Scholes, Myron 251 Scientific American 273, 275 seconde horloge 65 sécurité 134, 185, 200, 263, 264, 265, 276 série(s) exponentielle 177 infinie 164, 174, 175, 176, 193 infinies 149, 175, 187, 188, 193, 213 infinies de fractions 193 somme finie 164, 193 sexagésimal 31 Shamir, Adi 272 286
LE COMPTE Y EST !
Shannon, Claude 256, 258, 259, 261 shekel 53, 54 sila 44, 45, 46, 51, 54, 55, 77 mesure 44 Smith, Adam 59, 225 Smyth, Charles Piazzi 49, 50 solidi 95 byzantins 95 spéculation 14, 242, 245 financière 241 statistique 137, 192, 197, 217, 218, 219, 222, 243 sterling 169 Stirling, James 214, 215 formule 215 stratégie mixte 207, 208, 209 structure mathématique 137, 186 subdivision 49 Suétone 133 symboles algébriques 106, 150, 225 système de placement 91, 99 métrique 236, 237, 238 monétaire 60
T table à poussière 88, 89, 93 de multiplication 63 tableau calcul 88, 89 de comptage 88 Tartaglia 123, 124, 125, 126
INDEX
taux d’intérêt 56, 121, 122, 142, 177 taxe 57, 61 temps polynomial 268, 269, 270, 274 test de Miller-Robin 270 théorème 70 binôme 184 central limite 217 d’Arrow 234 de Fermat 184, 185, 191, 195, 270 de Pythagore 69, 71, 72, 151, 185 de Zermelo 209 du binôme 184 fondamental du calcul 161, 172, 225 théorie de la spéculation 245 des jeux 209, 230 des nombres 39, 80, 83, 179 du risque 224 utilité cardinale 233 triangle de Pascal 132 triangulaire 42, 131, 132, 203 triangulation 43, 235 trigonométrie 142 troc 19 échange 20 Turing, Alan 266 machine 266
U unité(s) longueur 45, 236, 237 poids 237
Ur 51, 54 Uruk 28, 29, 30, 40, 41, 42 utilité 60, 142, 145, 213, 223, 224, 225, 226, 227, 228, 229, 233 cardinale 233
V valeur 223 évaluation 15 variable discrète 224 variation des prix 244, 245 Vigenère, Blaise 139, 264 système 139 Vindolanda 66, 67 vitesse de la lumière 239 volume-sar 44, 45, 55 von Neumann 210, 233
W Waldegrave 207, 209 Walras, Léon 228 Wiles, Andrew 186, 195 Dernier Théorème de Fermat 195 Wingate, Edmund 90, 91, 93, 101, 108, 266
Y yard 24, 25, 48, 52, 73 mégalithique 24, 25
Z Zermelo, Ernst 209 théorème 209 287