Principia Mathematica | |
Auteur | Bertrand Russell et Alfred North Whitehead |
---|---|
Pays | Royaume-Uni |
Version originale | |
Langue | Anglais |
Titre | Principia Mathematica |
Éditeur | Cambridge University Press |
Date de parution | 1910 |
modifier |
Les Principia Mathematica sont une œuvre en trois volumes d'Alfred North Whitehead et Bertrand Russell, publiés en 1910-1913. Cette œuvre a pour sujet les fondements des mathématiques. Avec en particulier l'idéographie de Gottlob Frege, c'est un ouvrage fondamental, dans la mesure où il participe de façon décisive à la naissance de la logique moderne.
Entre 1898 et 1903, Whitehead travaille à l'édition d'un deuxième volume de son Treatise on Universal Algebra (de)[1]. Il se rend compte que son approche est similaire à celle que choisit Russell dans le deuxième volume des Principles of Mathematics[1], ouvrage lui aussi en projet[n 1]. Ils décident donc de ne pas publier leurs travaux personnels et de travailler ensemble[1].
Après près de dix ans, ils soumettent leurs travaux pour publication à la Cambridge University Press. Cette dernière estimant perdre 600 £[n 2], dont 300 qu'elle accepte de prendre en charge, et la Royal Society accordant 200 £, Russell et Whitehead doivent apporter chacun une contribution personnelle de 50 £ [3],[n 3].
Les Principia englobent la théorie des ensembles, avec les nombres cardinaux et ordinaux, ainsi que les nombres réels. Des théorèmes plus avancés de l'analyse réelle n'ont pas été inclus. Un quatrième volume était initialement prévu, mais n'a jamais été réalisé[4].
Ils utilisent une notation logique développée par Peano, bien qu’elle ait été réadaptée, dans l'optique de rendre le contenu du livre plus clair, et plus concis[5].
Plusieurs centaines de pages précèdent la preuve de cette proposition très célèbre de mathématiques, qui peut être trouvée à la page 379 du Volume I de la 1re édition[6].
Dans son langage mathématique, la section en question se propose de démontrer que « si deux ensembles α et β n'ont qu'un seul élément (respectivement x et y), alors dire qu'ils n'ont pas d'élément en commun (x est différent de y) est équivalent à dire que leur réunion contient deux éléments (x et y). »
La preuve que 1 + 1 = 2 est véritablement complétée dans le Volume II (1re édition), à la page 86[7], accompagné du commentaire « The above proposition is occasionally useful » (« la proposition ci-dessus peut parfois être utile »). Ils poursuivent en disant « Elle est utilisée au moins trois fois, en ✸113.66 et ✸120.123.472 ».
Une édition résumée a paru[8] à mi-chemin entre l'œuvre complète et le livre moins technique de 1919 de Russell[9],[10],[11], Introduction à la philosophie mathématique. En 1925, les auteurs ont ajouté une Introduction à la Deuxième édition[n 4], un Appendice A (qui s'est substitué au ✸9) et un nouvel Appendice C.
Les Principia sont considérés comme un des livres les plus influents de l'histoire de la logique, comparable en cela à l'Organon d'Aristote[13]. Il a joué un rôle moteur dans la recherche sur les fondements des mathématiques. Dans sa critique du livre, Godfrey Harold Hardy reconnaît l'importance du contenu et même le style d'écriture, tout en admettant que c'est un livre que bien peu de personnes liront intégralement et que les notations utilisées sont de nature à rebuter la majorité des lecteurs, y compris les mathématiciens eux-mêmes[14]
La Modern Library l'a classé 23e sur une liste comprenant les cent livres non fictionnels anglais les plus importants du vingtième siècle[15].
Le traité essaye de déduire tous les théorèmes mathématiques à partir d'une liste bien définie d'axiomes et de règles de déduction, en utilisant un langage logique-symbolique particulier.
Un des buts des Principia est de résoudre les paradoxes qui apparaissaient dans Les Fondements de l'arithmétique de 1884 de Gottlob Frege, et qui ont été mis en évidence par le paradoxe de Russell de 1901. La « théorie des types logiques » résout ce paradoxe de la façon suivante : un ensemble est différent, ontologiquement, de ses éléments, donc un ensemble ne peut appartenir à lui-même.
Contrairement à une théorie formaliste, la théorie « logiciste » des Principia Mathematica n'a pas « précisé la syntaxe du formalisme ». Les interprétations de cette théorie (au sens de la théorie des modèles) sont présentées en termes de valeurs de vérité, notamment avec les symboles « ⊢ » (affirmation de la vérité), « ~ » (non logique), et « V » (OU inclusif).
La théorie formaliste suivante est présentée en contraste de la théorie logiciste des Principia Mathematica. Un système formel contemporain serait construit comme suit:
Les théories contemporaines spécifient souvent leur premier axiome, le modus ponens ou la «règle de détachement» :
A, A ⊃ B │ B
Le symbole «│» est habituellement représenté par une ligne horizontale, ici «⊃» signifie «implique». Les symboles A et B sont des variables ; cette forme de notation est appelée un «schéma d'axiome». Ceci peut être lu ainsi : SI A et A implique B ALORS B pour ainsi retenir B pour une utilisation ultérieure. Mais les symboles n'ont pas d'«interprétation» (c.-à.-d., pas de «table de vérité», de «valeur de vérité» ou de «fonction de vérité») et le modus ponens procède mécaniquement, par grammaire seulement.
La théorie des Principia Mathematica possède de nombreuses similitudes avec les théories formelles modernes. Kleene a déclaré que «cette déduction des mathématiques de la logique a été présenté comme une axiomatique intuitive. Les axiomes étaient destinés à être acceptés comme des hypothèses plausibles décrivant le monde»[20]. En effet, contrairement à une théorie formaliste qui manipule les symboles selon des règles de syntaxe, Les Principia Mathematica ont introduit la notion de «valeurs de vérité», c.-à.-d., la vérité et la fausseté dans leur sens réel, et l'«affirmation de la vérité» prend place dans les cinquième et sixième éléments de la structure de la théorie. (PM 1962:4–36):
Cf. PM 1962:90–94, première édition:
La première édition débute avec la définition du symbole «⊃».
✸1.01. p ⊃ q .=. ~ p ∨ q. Df.
✸1.1. Tout ce qui est impliqué par une proposition élémentaire vraie est vrai. Pp modus ponens
(✸1.11 a été abandonné dans la deuxième édition.)
✸1.2. ⊦: p ∨ p .⊃. p. Pp principe de la tautologie
✸1.3. ⊦: q .⊃. p ∨ q. Pp principe d'addition
✸1.4. ⊦: p ∨ q .⊃. q ∨ p. Pp principe de permutation
✸1.5. ⊦: p ∨ ( q ∨ r ) .⊃. q ∨ ( p ∨ r ). Pp principe associatif
✸1.6. ⊦:. q ⊃ r .⊃: p ∨ q .⊃. p ∨ r. Pp principe de sommation
✸1.7. Si p est une proposition élémentaire, alors ~p est une proposition élémentaire. Pp
✸1.71. Si p et q sont des propositions élémentaires, alors p ∨ q est une proposition élémentaire. Pp
✸1.72. Si φp et ψp sont des fonctions élémentaires qui prennent des propositions élémentaires comme arguments, alors φp ∨ ψp est une proposition élémentaire. Pp
Avec l'«Introduction à la Seconde Édition», l'annexe A de la seconde édition a abandonné la section entière ✸9. Cela comprend six propositions primitives de ✸9 à ✸9.15 avec les axiomes de réductibilité.
La théorie révisée est rendue difficile par l'introduction de la barre de Sheffer («|») qui symbolise l'«incompatibilité» (c.-à-d., si les deux propositions élémentaires p et q sont vraies, leur «barre» p | q est fausse), le NON-ET logique contemporain. Dans la théorie révisée, l'introduction présente la notion de la «proposition atomique», une «donnée» qui «appartient à la partie philosophique de la logique». Celles-ci n'ont pas de composant, et ne contiennent pas les notions «tout» ou «certains». Par exemple: «c'est rouge», ou «celui-là est plus récent que celui-ci». Les Principia Mathematica ont alors «évolué vers les propositions moléculaires» qui sont toutes liées par la «barre». Les définitions donnent des équivalences pour «~», «∨», «⊃», et «.».
La nouvelle introduction définit les «propositions élémentaires» comme des positions atomiques et moléculaires rassemblées. Il remplace alors toutes les propositions primitives de ✸1.2 à ✸1.72 avec une seule proposition en termes de barre:
«Si p, q, r sont des propositions élémentaires, soit p et p|(q|r), nous pouvons en déduire r. C'est une proposition primitive.»
La nouvelle introduction maintient la notation «il existe» (maintenant écrite «parfois vrai») et «pour tout» (écrite «toujours vrai»)[21]. L'Annexe A a renforcé la notion de «matrice» et de «fonction prédicative» (une «idée primitive», PM 1962: 164).
« La notation de ce travail a été remplacée par le développement ultérieur de la logique au cours du XXe siècle, dans la mesure où un néophyte aurait du mal à lire les Principia Mathematica[13] » ; tandis qu'une grande partie du contenu symbolique peut être converti en notation moderne, la notation originale est elle-même « un sujet de litige scientifique[22]. »
Kurt Gödel a durement critiqué cette notation :
Ceci se reflète dans l'exemple ci-dessous des symboles «p», «q», «r» et «⊃» qui peuvent être formés dans la chaîne «p ⊃ q ⊃ r». Les PM exigent une définition de ce que signifie cette chaîne de symboles par d'autres symboles; en logique moderne, les «règles de formation» (règles syntaxiques conduisant à des «formules bien formées») auraient empêché la formation de cette chaîne.
Source de la notation : Chapitre I «Explications préliminaires des idées et Notations» commence par la source des parties élémentaires de la notation (les symboles =, ⊃, ≡, −, Λ, V, ε, et le système de points) :
Les Principia mathematica ont changé le signe de Peano Ɔ en ⊃, et ont également adopté plus tardivement quelques-uns des symboles de Peano, comme ℩ et ι, avec l'habitude de Peano de retourner les lettres à l'envers.
Les PM adoptent le signe d'assertion «⊦» du Begriffsschrift de 1879 de Frege:
Ainsi, pour affirmer une proposition p, on écrit:
(Remarquez que, comme dans l'original, le point gauche est carré et d'une plus grande taille que le point droit.)
La majeure partie du reste de la notation des PM a été inventé par Whitehead.
L'utilisation des points du PM est similaire à celle des parenthèses. Chaque point (ou un point multiple) représente une parenthèse soit à gauche, soit à droite, soit le symbole logique ∧. Les points multiples représentent la «profondeur» des parenthèses, par exemple, «.» «:» ou «:.», «::». Cependant, la position de la correspondance entre la parenthèse droite ou gauche n'est pas indiquée explicitement avec cette notation, mais doit être déduite de certaines règles qui sont confuses, et parfois ambiguës. En outre, lorsque les points représentent le symbole logique ∧, ses opérandes gauche et droite doivent être déduits en utilisant des règles similaires. Tout d'abord, on doit décider en fonction du contexte si les points représentent une parenthèse, ou un symbole logique. Ensuite, il faut décider jusqu'où l'autre parenthèse correspondante se situe : il faut poursuivre cette recherche jusqu'à ce que l'on rencontre, soit un plus grand nombre de points, soit le même nombre de points suivants qui ont une «force» égale ou supérieure, ou qui se situent à la fin de la ligne. Les points situés à côté des signes ⊃, ≡, ∨, = Df ont plus de force que les points à côté de (x), (∃x) et qui ont eux-mêmes plus de force que les points indiquant un produit logique ∧.
Exemple 1. La ligne
correspond à
où le taquet représente les parenthèses extérieures, les deux points suivants représentent les parenthèses autour de ~p et ~q, le troisième point représente les parenthèses autour de p ∧ q, le quatrième point représente le symbole logique ∧ plutôt qu'une paire de parenthèses.
Exemple 2, avec des doubles, triples, et quadruples points :
signifie
Exemple 3, avec un double point indiquant un symbole logique (volume 1, page 10) :
signifie
où le double point représente le symbole logique ∧, et son opérande droite se compose de tout ce qui suit, car il possède une force supérieure à celles des points seuls. Plus loin dans la section ✸14, les crochets «[]» apparaissent, et dans les sections ✸20 et plus, les accolades «{ }» apparaissent. Malheureusement, le point seul (mais aussi «:», «:.», «::», Etc.) sont également utilisés pour symboliser un «produit logique» (le ET logique moderne, souvent symbolisé par «&» ou par «∧»).
L'implication logique est représentée par «Ɔ» (par Peano) simplifié en «⊃», la négation logique est symbolisée par un tilde allongé, à savoir, «~» (le «¬» contemporain), le OU logique par «v». Le symbole «=», conjointement avec «Df» est utilisé pour indiquer «est défini comme», alors que dans les sections ✸13 et plus, «=» est défini comme étant (mathématiquement) «identique», à savoir, l'«égalité» mathématique contemporaine. l'équivalence logique est représentée par «≡» (le «si et seulement si» contemporain); les fonctions propositionnelles «élémentaires» sont écrites de manière contemporaine, par exemple, «f(p)», mais plus tard, les parenthèses seront supprimées, par exemple, «φx», «χx», etc.
Exemple, les PM ont introduit la définition du terme «produit logique» comme suit :
Traduction des formules en symboles contemporains : Divers auteurs utilisent des symboles atlernatifs, donc aucune traduction définitive ne peut être donnée. Toutefois, en raison des critiques comme celle de Kurt Gödel ci-dessus, les meilleures traductions contemporaines seront très précises en ce qui concerne les «règles de formation» (syntaxe) des formules. La première formule pourrait être convertie en symboles modernes comme suit[25] :
ou encore
ou encore
etc.
La seconde formule peut être convertie comme suit :
Mais notez que ce n'est pas (logiquement) équivalent à (p → (q → r)), ni à ((p → q) → r), ces deux formules ne sont pas logiquement équivalentes entre elles non plus.
Ces sections concernent ce qui est maintenant connu comme le calcul des prédicats et la logique des prédicats avec l'identité (égalité).
Section ✸10 : Les «opérateurs» universels et existentiels : Les PM ajoutent «(x)» pour représenter le symbole contemporain universel «pour tous x» ou «∀x», et il utilise un E renversé pour représenter «il existe un x tel que», ou «(Ǝx)». La notation typique serait similaire à ce qui suit :
Sections ✸10, ✸11, ✸12 : Propriétés d'une variable étendue à tous les individus : la section ✸10 introduit la notion de «propriété» d'une «variable». Les PM donnent cet exemple: φ est une fonction qui indique «est un grec», et ψ indique «est un homme», et χ indique «est un mortel», ces fonctions s'appliquent ensuite à une variable x. Les PM peuvent maintenant écrire, et évaluer :
parce que Zeus n'est pas mortel.
Équipé de cette notation, les PM peuvent créer des formules pour exprimer ce qui suit: «Si tous les Grecs sont des hommes, et si tous les hommes sont mortels, alors tous les Grecs sont mortels». (PM 1962: 138)
Les symboles ⊃x et «≡x» apparaissent dans ✸10.02 et ✸10.03. Les deux sont des abréviations pour l'universalité (pour tout). La notation contemporaine aurait simplement utilisé les parenthèses en dehors du signe d'égalité («=»):
Les PM attribue le premier symbole à Peano.
La section ✸11 applique ce symbole à deux variables. Ainsi, les notations suivantes : ⊃x, ⊃y, ⊃x, pourraient tous apparaître dans une formule unique.
La section ✸12 réintroduit la notion de «matrice» (table de vérité), de types logiques, et en particulier les notions de fonctions et propositions du premier et second ordre.
Le nouveau symbolisme «φ ! x» représente une valeur d'une fonction de premier ordre. Si un accent circonflexe «^» est placé sur une variable, alors celle-ci est une valeur «individuelle» de y.
Maintenant équipé de la notion de matrice, les PM peuvent affirmer leur axiome de réductibilité controversé : une fonction d'une ou deux variables où toutes ses valeurs sont données (ie, dans sa matrice) est (logiquement) équivalent («≡») à une fonction «prédicative» des mêmes variables. La définition d'une variable est donnée ci-dessous à titre d'illustration de la notation (PM 1962: 166-167):
✸12.1 ⊢: (Ǝ f): φx .≡x. f ! x Pp;
Cela signifie que : «Nous affirmons la vérité de ce qui suit : Il existe une fonction f avec la propriété que : étant donné toutes les valeurs de x, leurs évaluations dans la fonction φ (c'est-à-dire, résultant de leur matrice) est logiquement équivalente à une certaine valeur de f (et vice-versa, donc l'équivalence logique).». Autrement dit, étant donné une matrice déterminée par la propriété φ appliquée à la variable x, il existe une fonction f qui, lorsqu'elle est appliquée à x est logiquement équivalente à sa matrice. Ou encore : chaque matrice φx peut être représentée par une fonction f appliquée à x, et vice versa.
✸13: L'opérateur d'identité «=» : Celui-ci est une définition qui utilise le signe de deux manières différentes, comme indiqué par la citation des PM :
signifie:
Le signe d'inégalité «≠» fait son apparition en tant que définition dans ✸13.02.
✸14: Descriptions :
Le texte saute de la section ✸14 directement aux sections fondamentales ✸20 THÉORIE GÉNÉRALE DES CLASSES et ✸21 THÉORIE GÉNÉRALE DES RELATIONS. Les «relations» sont ce qui est connu dans la théorie des ensembles contemporaine comme des ensembles de paires ordonnées. Les sections ✸20 et ✸22 introduisent un grand nombre de symboles encore utilisés aujourd'hui. Ceux-ci comprennent les symboles «ε», «⊂», «∩», «∪», «-», «Λ», et «V»: où «ε» signifie «est un élément de» (PM 1962: 188); «⊂» (✸22.01) signifie «est contenue dans», «est un sous-ensemble de»; «∩» (✸22.02) représente le produit logique de classes (ensembles); «∪» (✸22.03) représente la somme logique de classes (ensembles); «-» (✸22.03) signifie la négation d'une classe (ensemble); «Λ» signifie la classe nulle; et «V» signifie la classe ou l'univers du discours universel.
Les petites lettres grecques (autre que «ε», «ι», «π», «φ», «ψ», «χ», et «θ») représentent les classes (par exemple, «α», «β», «γ», «δ», etc.) (PM 1962:188)
Appliquée aux relations dans la section ✸23 CALCUL DES RELATIONS, les symboles «⊂», «∩», «∪» et «-» acquièrent un point : par exemple: «⊍», «∸».
La notion et la notation d'une «classe» (ensemble) : La première édition des PM affirme qu'il n'y a pas de nouvelles idées primitives nécessaires pour définir ce qu'on entend par «une classe», et seulement deux nouvelles «propositions primitives» appelées les axiomes de réductibilité (en) pour les classes et les relations respectivement (PM 1962: 25)[27]. Mais avant que cette notion soit définie, les PM affirment qu'il est nécessaire de créer une notation particulière «ẑ(φz)» qu'il appelle un «objet fictif». (PM 1962: 188)
Les PM peuvent exposer au lecteur comment ces objets fictifs se comportent, parce que «Une classe est entièrement déterminée lorsque sa composition est connue, à savoir qu'il ne peut y avoir deux classes différentes ayant la même composition» (PM 1962: 26). Ceci est symbolisé par l'égalité suivante (similaire au ✸13.01 ci-dessus) :