 1, 2, 5, 14, 42, 132. En 1751, Leonhard Euler s'intéresse à la triangulation des polygones et obtient alors cette étrange suite de nombres. En 1838, Eugène Catalan retrouve ses mêmes nombres en étudiant la façon dont on peut parenthéser une expression. Il en dénuira une formule relativement simple, signant que la postérité appellera ses nombres, la suite de Catalan. Ça tombe bien, j'ai 2 minutes pour en parler. Les nombres de Catalan sont un passage obligé pour comprendre ce champ des mathématiques qu'est la combinatoire, l'art de savoir comment compter le plus efficacement possible un ensemble donné d'objets. Ils illustrent parfaitement la façon dont les mathématiciens peuvent être amenés à retourner un problème dans tous les sens pour le rendre trivial. Mais avant d'aborder le vif du sujet, ouvrons la boîte à outils d'un mathématicien spécialisé dans la combinatoire. Premier exemple tout bête, voici un jeu de 7 familles, ils comptent 7 familles. Dans chaque famille, on peut compter 6 personnages. Combien de cartes y a-t-il en tout dans ce jeu ? Si tu penses qu'il y en a 7 fois 6, soit 42, tu assaisis toute la subtilité dont il faut faire preuve en dénombrement. Le meilleur moyen de compter les cartes n'est pas de les compter une à une, mais plutôt de considérer que l'on cherche à calculer le cardinal du produit cartésien de 2 ensembles finis comptant respectivement 6 et 7 éléments. Dans des termes plus simples, on dira qu'on a fait une multiplication. Allez, autre exemple, je distribue ces 42 cartes à 3 personnes de façon à ce que chacune reçoive le même nombre de cartes, elles recevront donc chacune oui 14 cartes, il fallait procéder à une division. Heureusement, le mathématicien des outils un peu plus subtils pourra bander les problèmes de combinatoire comme les factoriels, les arrangements et les combinaisons. Nouvelle exemple, je souhaite ranger mes 7 romans de la saga Harry Potter dans mon étagère. De combien de façon vais-je pouvoir les ordonner ? Je peux par exemple les ranger par ordre alphabetique, par nombre de pages ou simplement par ordre chronologique. On pourrait tenter de lister tous les rangements possibles, mais cela risque d'être un peu long. Prenons plutôt le problème d'un autre point de vue. Pour le premier livre que je vais ranger, j'ai 7 choix possibles. Une fois ce premier choix effectué, il ne reste plus que 6 choix pour le deuxième livre, il reste ensuite 5 choix pour le suivant et ainsi de suite. On peut donc conclure qu'il existe 7 fois 6 fois 5 fois 4 fois 3 fois 2 fois 1 façon différente de classer 7 sagas soit 5,040. Ce nombre est ce que l'on appelle la factorial de 7. De manière plus générale, on appelle factorial d'un nombre entier N, le produit décroissant de tous les nombres entiers de N jusqu'à 1, que l'on note par un point d'exclamation. La factorial de N est donc le nombre de façon d'ordonner N objet différent. Continuons le rangement. C'est maintenant ma collection des 24 DVD James Bond que je vais ranger. Malheureusement, mon étagère est trop petite et je n'ai la place que d'en mettre 4. De combien de façon différente pourrais-je alors les ranger ? Dans ce dénombrement, l'ordre est important. Plutôt que de compter une à une les possibilités, on va utiliser la même astuce que pour le problème précédent. J'ai 24 choix pour poser le premier DVD, puis 23 pour le suivant et ainsi de suite. Puisque je ne vais ranger que 4 DVD, le nombre total s'élève à 24 fois 23 fois 22 fois 21, soit au total 255,024. On parle de nombre d'arrangements. De manière plus générale, on appelle arrangement de K parmi N, le produit décroissant des 4 premiers entiers en partant de N et on le note à NK. L'arrangement de K parmi N désigne donc le nombre de façon d'arranger K objet choisi parmi N différent. Un petit coup d'œil sur la définition des arrangements permet d'obtenir la formule A N K égal factorial de N divisé par factorial de N-K. Un dernier outil incontournable de la combinatoire, les combinaisons. Pour parfaire mon étagère, j'aimerais y ajouter quelques figurines légaux. J'en ai 25 différentes et je veux emplacer 4. Combien ai-je de façon de choisir 4 figurines parmi ces 25 ? On a envie de répondre avec les arrangements de K parmi 25, c'est-à-dire 25 fois 24 fois 23 fois 22, mais ce n'est pas vraiment la réponse attendue puisque l'ordre n'intervient pas ici. Chaque sélection de 4 figurines intervient en effet dans plusieurs arrangements différents. Mais dans combien exactement ? Eh bien on peut le dénombrer puisque l'on cherche ici le nombre de façon différente de ranger 4 figurines différentes, ce qui se dénombre avec les factorials, il y en a exactement 4 fois 3 fois 2 fois 1. Le nombre de façon de choisir les 4 figurines est donc égal au nombre d'arrangement de K parmi 25 divisé par la factorial de 4, soit 25 fois 24 fois 23 fois 22 divisé par 4 fois 3 fois 2 fois 1, ce qui donne tout de même 12 650. Ce nombre est appelé combinaison de K parmi 25. De manière plus générale, on appelle combinaison de K parmi n ou plus laconiquement K parmi n, le nombre d'arrangement de K parmi n divisé par la factorial de K. La combinaison de K parmi n désigne alors le nombre de façon de choisir K objet parmi n différent. On le note parfois cnk mais plus couramment en plaçant K sous n entre deux parenthèses. Vous connaissez peut-être ces nombres sous le nom de coefficient binomio que l'on retrouve dans le triangle de Pascal des nombres disposés en triangle où chacun est égal à la somme des deux nombres juste au-dessus. A noter enfin que la formule de K parmi n peut se réécrire sous la forme factorial de n divisé par factorial de n-K fois factorial de K. Il me semblait important de le dire. Ces quelques outils, mais surtout le dernier, ermettent de résoudre bien des problèmes de dénombrement. Par exemple, combien existe-t-il de combinaison différente à l'euro-million ? Il faut y cocher 5 n° parmi 50 et 2 étoiles parmi 12. Puisqu'on ne tient pas compte de l'ordre, on dispose au total de 5 parmi 50 choix pour les numéros et de 2 parmi 12 choix pour les étoiles, soit 2,118,760 combinaisons de n° et 66 combinaisons d'étoiles. Chaque combinaison de n° peut être associée à n'importe quelle combinaison d'étoiles, ce qui ne donne donc au total 2,118,760 fois 66 gris possible, soit au total 139,838,160. Autre exemple de problème de combinatoire, c'est celui des teintements de verre. Lors d'une soirée réunissant 13 amis et pas mal de boissons, deux invités annoncent l'arrivée d'un heureux événement. Naturellement, chaque invité lèvera son verre afin de traquer une et une seule fois avec chacun des autres invités. Combien entendra-t-on alors de teintements de verre ? Il y a plusieurs façons de raisonner, ce qui donnera plusieurs réponses différentes mais pourtant équivalentes. On peut essayer de compter directement le nombre de teintements de verre. Déjà, l'invité A traquera avec chacun des 12 autres invités, ce qui donne les 12 premiers teintements. L'invité B ayant déjà traqué avec l'invité A, cela donne donc 11 teintements supplémentaires. L'invité C ajoutera 10 teintements et ainsi de suite. Au final, le nombre de teintements s'élèvera 12 plus 11 plus 10 etc, soit 78. On peut aborder le problème différemment en considérant que chacun des 13 invités doit traquer avec les deux autres. Cette façon de compter ne tenant pas compte du fait que chaque teintement sera compté deux fois, il faut donc diviser le résultat par deux. Au total, le nombre s'élève donc à 13 fois 12 divisé par deux soit 78, le compte est bon. Une dernière façon de voir le problème est de se placer du point de vue des verres. Un teintement, c'est la rencontre de deux verres. Il y a donc autant de teintements que de façon de choisir deux verres parmi les 13. Le nombre est donc égal à 2 parmi 13, soit 78. Un même problème, trois approches différentes. Un dernier exemple pour la route avant de parler des nombres de catalans. Dans ce rectangle de dimension 10 sur 10, comment existe-t-il de façon de relier le point A au point B en empruntant que des chemins vers le haut ou vers la droite ? La réponse ne saute pas aux yeux, mais il faut faire à nouveau intervenir les combinaisons. En effet, un chemin valide est une succession de 20 déplacements vers le haut ou la droite. Dans cette succession de déplacements, on contrat toujours 10 déplacements vers le haut et tout autant vers la droite. Pour fabriquer un chemin valide, il faut donc choisir où seront ces 10 déplacements vers le haut parmi les 10 déplacements. Il y en a donc 10 parmi 20, c'est-à-dire 144,756 au total. Bref, quand on est en phase d'un problème de dénombrement, on peut souvent s'en sortir en utilisant de façon malignes les combinaisons, surtout si l'on parvient à regarder le problème de la bonne façon. Revenons en 1751. Durant sa très féconde correspondance avec Christian Goldbach, Leonard Euler s'est intéressé à la question des triangulations des polygones. De quoi s'agit-il exactement, détaillant un peu ? Voici un polygône régulier à N côté. En y traçant N-3 diagonale qui ne se croise pas, on découpe le polygône en pièces triangulaires. On dit alors que le polygône est triangulier. Une question légitime qui se pose est le nombre de triangulation d'un polygône donné. À la main, on peut facilement vérifier que le carré n'a que 2 triangulations possibles, le pentagone en a 5 et que l'exagone en a 14. Avec un peu de volonté, on peut vérifier que l'heptagone a 42 triangulations différentes. Euler est parvenu à calculer à la main et sans erreur le nombre de triangulation de tous les polygônes réguliers jusqu'au dégagone, et à conjecturer une formule de son cru, permettant de calculer E-N, le nombre de triangulation du polygône à N plus de côté. Il n'arrive cependant pas à démontrer ce résultat. Il en parle alors à Johann Segnert, qui lui fait remarquer une façon ingénieuse de dénombrer les triangulations. Prenons l'exemple de l'un dégagone, polygone à 11 cotés que Euler n'a pas essayé de traiter, et numéro-tons ses côtés et ses sommets de 1 à 11. Si l'on fera trianguler, le côté 1 fera partie d'un triangle. Dans cet exemple, il lit le côté numéro 1 au sommet numéro 5. Si l'on retire ce triangle, on obtient deux sous polygônes. Dans l'exemple, ils ont respectivement 5 cotés et 7 cotés. Euler a calculé qu'un pentagone possède 5 triangulations et qu'un heptagone en possède 42. On peut donc affirmer qu'il existe 5 x 42, c'est-à-dire 210 triangulations de l'un des cagones, qui possèdent ce triangle liant la phase numéro 1 au sommet numéro 5. En procédant de la même façon, et grâce à la connaissance du nombre de triangulations des polygônes plus petits, on peut compter les triangulations de l'un des cagones qui possèdent un triangle liant la phase numéro 1 au sommet numéro 2, numéro 3, numéro 4 ou n'importe quel sommet jusqu'au numéro 10. On a ainsi compté l'ensemble des triangulations de l'un des cagones, il y en a 4,862. En généralisant ce processus, on obtient la formule récursive de Segner, qui a permis à Euler de démontrer une bonne fois pour toute sa formule donnant le nombre de triangulation d'un polygône à un côté. La suite de nombres 1, 2, 5, 14, 42, etc. devient alors la suite de Euler-Segner. En 1838, Eugène Catalans s'intéresse à un autre problème qu'il relit tout de suite au travail de Euler et Segner, celui du nombre de façons de faire une multiplication à plusieurs facteurs. La multiplication à 3 facteurs 1 x 2 x 3 par exemple peut être traité de 2 façons différentes. On peut commencer par traiter 1 x 2 puis multiplier le résultat par 3 ou bien commencer par 2 x 3 et multiplier le tout par 1. Un produit à 3 termes peut donc être effectué de 2 façons différentes. Cela revient en fait au nombre de façons de parenthéser le produit 1 x 2 x 3. Pour un produit à 4 facteurs, on peut voir qu'il y a 5 façons de le traiter et qu'il y en a 14 pour en avoir des 1 à 5 facteurs. Autrement dit, il y a autant de façons de faire une multiplication à n termes que de façons de trianguler un polygon à n plus un côté. Le lien entre les 2 problèmes, Catalans le fait en remarquant que la formule de Segner s'applique dans les 2 cas. La démonstration est donc calculatoire et ne montre alors pas un lien direct entre les 2 phénomènes. Il prouve cependant, toujours de manière calculatoire, une formule permettant de faire ce dénombrement. En appelant cn le nombre de façons de multiplier n plus un terme, il prouve que cn égale n parmi 2n moins n plus 1 parmi 2n. Les formules sont belles, les nombres deviennent alors les nombres de Catalans. On a donc d'un côté des triangulations de polygones, de l'autre des parentaisages de multiplication, et au milieu de tout ça des jolis formules, mais aucun lien profond entre tout ça. On peut pourtant en trouver, en associant à chaque triangulation un parentaisage et un versement. Prenons par exemple un héptagone et associant à chaque côté un facteur du produit A, B, C, D, F, F, F. On garde aussi un côté libre. Après avoir triangulé le polygon, on va voir qu'il est possible d'associer une expression à chacune des diagonales. Pour cela, on fait en sorte que dans chaque triangle, un côté soit égal au produit des 2 autres. On commence ainsi par les diagonales qui bordent des côtés nommées de l'héptagone. Sur l'exemple, on a une diagonale qui correspond à B x C, et une autre qui correspond à D x E. Puis on poursuit de proches en proches. On obtient finalement un parentaisage de l'expression A x B x C x D x F x F. Ainsi, on montre qu'à toute triangulation de polygones à n plus un côté, correspond à un unique parentaisage d'un produit de n facteur et réciproquement. Le problème de Euler et celui de Catalans sont donc deux facettes différentes d'un même problème. En 1857, Arthur Calais et Thomas Kirkman s'intéressent à un problème qui n'a a priori rien à voir, celui du décompte des arbres enracinés. Structure bien connue aujourd'hui par ceux qui s'intéressent à la formatique. Un arbre est une structure mathématique composée de différents nœuds reliés par des arêtes, mais qui ne présente aucun cycle. Sur un arbre, les nœuds situés aux extrémités sont appelés les feuilles. On dit que l'arbre est enraciné lorsque l'un des nœuds a été choisi pour en être la racine. Il cherche alors à dénombrer le nombre d'arbres enracinés ayant un nombre d'arêtes donnés. Par exemple, pour deux arêtes, on compte deux arbres. Pour trois arêtes, on en compte cinq, et pour quatre, on en compte quatorze. Ce sont bien sûr les nombres de catalans que nos deux mathématiciens ne reconnaissent pas du tout. Par une étude numérique, ils obtiennent cependant une formule donnant le nombre d'arbres enracinés qu'ils considèrent remarquables. Ces nombres deviennent alors les nombres de Kelly Kirchman. Ils ne s'arrêtent pas aux arbres enracinés, mais étudient aussi les arbres binaires entiers, des arbres enracinés où chaque nœud interne a toujours deux nœuds fils. Les plus biologistes d'entre vous parlent d'arbres phylogénétiques. Quand on cherche à les compter, on remarque qu'il y a deux arbres à trois feuilles, cinq arbres à quatre feuilles ou quatre arbres à cinq feuilles et ainsi de suite. Encore une fois, les nombres de catalans. Il y a donc autant d'arbres enracinés à n'arrêt que d'arbres binaires entiers à n plus une feuille. Pourquoi ? On peut s'en convaincre graphiquement en partant d'un arbre enraciné quelconque à n'arrêt. On fait alors pousser de nouvelles arrêtes sur cet arbre, de façon à ce que chaque arrête initiale devienne une arrête gauche, ce qui donne un arbre binaire entier à n plus une feuille. Inversement, si l'on part d'un arbre binaire entier quelconque, la rétraction des arrêtes droites donne des arbres enracinés. Bref, on peut associer à chaque arbre enraciné un unique arbre binaire, et inversement, il y en a donc autant. Mais ce n'est pas tout. Si je prends un arbre binaire et que je place sur chaque feuille une lettre, j'obtiens une représentation parfaite de mon problème de parenthésage de produits. Il y a donc autant d'arbres binaires à n plus une feuille que de parenthésage d'un produit à n plus un facteur, et donc tout autant que de triangulation de polygone à n plus deux côtés. Tout est donc lié. Mais cela n'explique pas encore la formule de catalans, qui prétend qu'il y en a très exactement n parmi deux n, moins n plus un parmi deux n. Pour le comprendre, il faut interpréter les nombres de catalans d'une nouvelle façon et se tourner vers les mots de diques. Un mot de diques est un mot composé de deux lettres données, disons A et B, qui comptent autant de A que de B, et tel que le nombre de A est toujours supérieur ou égal au nombre de B lorsqu'on lui retire une ou plusieurs de ses lettres finales. Le mot AABBAAB de longueur huit n'est pas un mot de diques, puisque lorsqu'on lui retire ses trois dernières lettres, on compte plus de B que de A. Le mot AABBAABBB est quant à lui tout à fait valide. Une façon plus visuelle de se représenter un mot de diques est d'utiliser non pas les lettres A et B, mais des parenthèses ouvrantes et fermantes. Un mot de diques est alors une succession valide de parenthèses, où chaque parenthèse ouverte est bien fermée. Dénombrons alors les mots de diques. Avec deux paires de parenthèses, on obtient deux expressions. Avec trois paires, on en a cinq, et avec quatre paires, on en trouve 14, et ainsi de suite. Ce sont bien sûr les nombres de catalans. Pour le prouver, on peut montrer qu'il existe autant de façon de disposer n paires de parenthèses que d'arbres enracinés à n arrêtes. Pour voir cela, prenons un arbre enraciné quelconque et marquons le trajet qui en fait le tour. Lorsque l'on passe à gauche d'une arrête, on le note par une parenthèse ouvrante, et sinon par une parenthèse fermante. Il s'associe à n'importe quel arbre enraciné à n arrêtes, une expression valide à n paires de parenthèses et inversement. On peut aussi interpréter plus géométriquement les mots de diques en regardant ce que l'on appelle les escaliers de diques. On se place dans une grille de dimension n x n et, pour un mot de diques donné, on effectue le chemin sur la grille, où a correspond à se déplacer d'une unité vers le haut et b d'une unité vers la droite. On obtient un escalier de diques, c'est-à-dire un chemin reliant les sommets opposés du carré, qui ne coupe jamais la diagonale. Il y a bien sûr autant de mots de diques de longueur de zen que d'escaliers de diques de longueur de zen. L'intérêt de cette représentation des nombres de catalans, c'est qu'elle se laisse dénombrer. Dans cette grille de dimension n x n, combien existe-t-il de chemins qui relient le point a au point b ? Un chemin n'étant composé que de déplacement vers le haut ou vers la droite. Un tel chemin est composé de deux zen déplacements, dont n déplacement vers le haut. Il y en a donc au total n parmi deux zen. Pour obtenir un escalier de diques, il faut rajouter l'hypothèse que le chemin ne passe jamais en dessous de la diagonale ab. De tous les chemins reliant a à b, combien coupe cette diagonale ? Un chemin a valide donc qui coupe la grande diagonale ab, et touche en au moins un point, disons c, la diagonale alfa-beta juste en dessous. L'astuce est de considérer un nouveau chemin obtenu à partir du précédent. On garde la partie liant a à c, et on prend le symétrique de la partie liant c à b par rapport à la sous-diagonale alfa-beta. Ce nouveau chemin relient alors a au point b', symétrique de b par rapport à alfa-beta. On peut alors voir qu'il y a autant de mauvais chemins liant a à b que de chemins liant a à b'. Ces derniers peuvent être dénombrés facilement, puisqu'il s'agit d'une succession de deux zen déplacements comptant n plus un déplacement vers la droite. Il y a donc n plus un parmi deux zen chemins liant a à b', soit tout autant que de mauvais chemins liant a à b. Puisque le nombre de chemins de Dic est égal au nombre de chemins liant a à b moins le nombre de mauvais chemins liant a à b, on peut donc à présent affirmer que le nombre d'escalés de Dic, c'est-à-dire le n-m nombre de Heuler-Segner-Catalans-Calais-Kirchmann, est égal à n parmi deux zen moins n plus un parmi deux zen. Résumons la situation. Le n-m nombre de catalans et le nombre de triangulations n'a polygon à n plus de côté, qui est égal au nombre de façons de parentiser un produit de n plus un facteur, qui est égal au nombre d'arbinaires entiers à n plus une feuille, qui est égal au nombre d'arbres racinés à n arrêtes, qui est égal au nombre de façons de disposer n paires de parenthèses, qui est égal au nombre de mots de Dic de longueur deux zen, qui est égal au nombre d'escaliers de Dic de longueur deux zen, qui est finalement égal à n parmi deux zen moins n plus un parmi deux zen. Je crois que c'est pour cela que j'adore la combinatoire.