 Je vais présenter mes travaux d'été sur la distribution de la cassie-espèce avec mon directeur, Falser. Pour commencer, je vais présenter les modèles d'Egen qui a donné naissance à cet terme de cassie-espèce. Les modèles d'Egen, c'est un modèle qui a été créé en 1971 par Manfred Egen dans un long article où il explore les possibles façons dont l'avis a pu apparaître sur Terre et notamment les premières set-ups de l'avis sur Terre. Donc d'après la théorie Darwinienne, on croit que c'était des macromolecules très très simples, qui d'une façon un peu miraculeuse, on ne sait pas trop comment, sont arrivés à s'y reproduire. Pour modéliser ça, Egen a utilisé les ingrédients suivants. D'abord, nos individus, nos macromolecules vont être identifiés avec leur génotype, ce qui est une chaîne de 0 et 1, des longueurs L. On va prendre 0 et 1 pour simplifier, mais ici on pourrait considérer n'importe quel alphabet, comme par exemple ATGC, si on voudrait modéliser des chênes d'ADN, ou je ne sais pas, les vents aminoacides pour des protéines. Donc c'était un modèle avec sélection et mutation. Donc pour modéliser la sélection, on va utiliser un paysage de fitness qui est une fonction des linsins de des génotypes dans les règles positifs. Si cette fonction est une fonction constante, il n'y aurait pas de sélection, on parlerait d'une population neutre, mais ça ne nous intéresse pas. La fonction de fitness la plus simple qu'on peut imaginer qui n'est pas neutre, c'est le paysage à un pic. Le paysage à un pic veut dire qu'il existe une séquence particulière W étoile, on va prendre les séquences formées qu'est par des 1 et on va l'appeler la master sequence et on va dire que c'est là une fitness sigma plus grand que 1, alors que toutes les autres, on fitness 1, donc il y a juste une séquence qui va se reproduire plus vite que toutes les restes. Les mutations vont arriver au cours des reproductions et on va supposer qu'elles s'arrivent en département par site de la chaîne avec probabilité Q, donc la probabilité d'émuter d'une chaîne U vers une chaîne V va être donnée par Q à la puissance, la distance des amigens entre les deux chaînes, à un moment Q, à la puissance elle ou moins la distance des amigens entre les deux chaînes. La distance des amigens c'est juste le nombre des digits qui sont différentes, parce que c'est là qu'il faut muter ailleurs, il faut rester pareil, donc entre deux chaînes on compte le nombre des digits qui sont différentes et ça nous donne la distance des amigens. Donc une fois on a tous nos ingrédients, on va appeler X V DT à la concentration des chaînes ayant un génotype V autenté dans une population et le modèle de Higuette nous dit que c'est la varie selon l'équation différentielle suivante. On somme sur toutes les génotypes possibles, la concentration, la fitness, la probabilité de muter vers V, moins X V DT fois la fitness moyenne de la population, et on fait ça pour toute génotype. Donc qu'est ce qui nous est en train de dire cette équation ? Il y a clairement deux termes, les premières, c'est un terme des productions, on produit des chaînes des types V et les deux secondes termes, c'est un terme des destructions et la destruction elle est proportionnelle au taux des reproductions totales, donc si on suppose que la concentration totale des chaînes est égale à 1, on voit bien en faisant la somme en dérivant que c'est la reste constante au cours de temps. Donc quand Higuette avait proposé cette théorème, il avait étudié ce qui se passe dans l'écart du Scharping Landscape, et donc ce qu'il avait trouvé c'est qu'en fait tangre L, la longueur du génome vers l'infini, il existe une taux de mutation critique qui est de l'ordre de l'oxygma sur L qui va séparer deux régimes très différents. Si l'étoil des mutations est sur critique, ça veut dire qu'on met trop vite et la master sequence peut rien faire à l'équilibre, on va voir une population totalement désordonnée. Par contre, si on mute suffisamment lentement, on ne va plus parler des sorbes, à l'équilibre on va observer ce qu'on appelle une casse espèce, c'est-à-dire une concentration positive de la master sequence est un nuage des moutons autour. Donc après avoir appris ça, il y avait plein de gens dans la communauté et surtout des virologues qui étaient très très contents parce qu'on a fait des simulations pour voir à quel ça ressemblait cette nuage des moutons et on s'est rendu compte que ça approchait assez bien les distributions observées expérimentalement d'après des populations de virus. Donc imaginez maintenant que vous, vous êtes quelqu'un qui a la recherche d'une baccente pour le VIH ou je n'en sais rien et là vous n'avez rien à faire parce qu'il moute trop vite et vous ne savez pas quelle séquence, quel génotype il faut attaquer. Vous ne savez pas quoi visser parce que ça moute trop vite. Donc maintenant on vous dit, ah, tiens si ça moutait juste un petit peu plus vite, on rentrerait dans la phase des dessordes, ça se tuerait toute seule parce qu'il mouterait trop vite dans des séquences qui ne sont pas viables. Peut-être que vous allez aller changer votre approche pour développer des vaccins et aller essayer de remonter les taux de mutation. Qu'est-ce qui font certains approches, notamment dans les recherches des médicaments pour le VIH ? Donc si vous voulez savoir plus sur ça, il y a un livre qui vient d'épargner sur Springer qui s'appelle Cassius Piches, From Theory to Experimental Systems, comme ça, je ne suis pas sûr si c'est Systems à la fin, et parle beaucoup de ça. Bon, par contre les problèmes avec cette modèle, c'est que c'était un modèle qui était conçu pour expliquer les débuts de la vie sur Terre, dont les macromolecules sont vraiment très, très simples. Et les virus, les génomes, ils sont un peu plus longues. Donc il y a eu pas mal de critiques à cet égard pour cette modèle, parce qu'il est un modèle à population infinie, ce qui n'est pas très cohérent, puisque vous voyez, on peut former deux à la puissancelle des génomes possibles, et ça, pour des virus, c'est énormément plus grand qu'à n'importe quelle taille de population qu'on peut observer dans la nature. Donc ce n'est pas très cohérent d'observer des supposés qui aiment la taille de la population infinie, alors que la longueur du génome n'est pas. Le deuxième critique vient du fait que les modèles sont déterministes. Et les gens qui ont travaillé dans la génétique des populations, ça fait plus longtemps qu'il y a un facteur important qui guide l'évolution d'une population, c'est qu'il y a un aléatoire. Donc maintenant, les challenges, c'est de retrouver le seuil d'erreur pour le taux d'immutation et la distribution des cassiers spécifiques pour des modèles à population finie et aléatoire. Donc pour faire cela, on va prendre un des modèles les plus connus, un génétique des populations, qui est le modèle des right fissures. Donc on garde tout notre cadre, nos génotypes, la sélection, la mutation, tout égal, mais on va rajouter un nouveau paramètre M qui va représenter la taille de la population. Donc les modèles des right fissures vont être donnés par une chaîne de Marcov. À la génération N, on va avoir plusieurs chaînes différentes, peut-être de master sequence, je n'en sais rien moi. Et voilà. Et maintenant, on doit définir comment on fait pour passer à la génération suivante. Donc on va choisir la im chaîne dans la population avec une probabilité proportionnelle à sa finesse. La probabilité de la choisir va être donnée par sa finesse, divisé par la somme des finesses dans la population. Donc avec cette loi, disons qu'on a choisi une première chaîne. On la note et on la remet dans les sacs. Et maintenant, on la fait muter et là on garde. Et maintenant, on va yterrer cette procédure M fois. On va prendre une chaîne avec cette loi, on va la noter, on va la remettre dans les sacs et puis on fait muter ce qu'on a noté ici. Et voilà. Et comme ça jusqu'à en avoir un nouveau M chaîne. Et ça va nous faire la génération M plus 100. Donc est-ce qu'il est clair à les mécanismes des transitions? Oui? Oui? Oui, oui. Si ça arrive avec probabilité, un moins qu'à la puissance L. Donc voilà, on repère ça M fois avec remise et on retrouve la nouvelle mutation, la nouvelle génération. Donc en particulier, ça, c'est un modèle où les générations ne se superposent pas. OK. Les processus qu'on vient de définir est une chaîne de marque haute ergotique et on va s'intéresser aux quantités suivantes. On peut regarder les nombres d'individus dans la population N, dans la génération N, pardon, qui sont des master sequences. Ou plutôt, on peut regarder la concentration, mais encore l'espérance, mais encore la limite de l'espérance quand n'est envers l'infini. Comme la chaîne de marque haute ergotique, cette limite est bien définie. On peut l'appeler row de 0. De façon plus générale, on peut considérer la quantité row de K qui est la limite quand n'est envers l'infini de l'espérance d'une nombre d'individus dans la population, dans la génération N qui sont à distance des amigues K de la master sequence. Et on s'intéresse à ces quantités-là. Malheureusement, on ne peut pas dire grand chose. Les choses sont entre elles, mais on peut considérer un régime asymptotique intéressant en voyant les longuards du génome vers l'infini, la probabilité des mutations vers 0 et la taille de la population vers l'infini aussi. Mais on ne fait pas ça n'importe comment, on dit qu'il faut que tu es envers A et M sur L est envers un paramètre alpha. Donc voilà, quand on fait ça, on a les théorèmes suivants qui nous dit que dans l'espace des paramètres à alpha, on trouve une curve donnée par alpha en certaine fonction fidea égale à l'N2D, qui va nous séparer une région où elle est des sordres et une autre où il y a la cassie-espèce. Et là où il y a la cassie-espèce, la concentration de la master sequence va tendre vers sigma exponentielle mois à mois sans sur sigma mois sans. Et puis plus généralement, la quantité Roka va tendre vers sigma exponentielle mois à mois sans à la puissance K sur K factorial. Somme pour I plus grand qu'1, I à la puissance K sur sigma à la puissance I. Si on somme sur K ici, on va bien voir que ça fait 1, donc ça, ça définit une distribution sur les sentiers qu'on appelle la distribution de la cassie-espèce des paramètres sigma et A. Pour voir à quel ça ressemble, on peut tracer les différents concentrations en fonction des A. Donc A va varier entre 0 et l'oxygma, puisque après, la cassie-espèce disparaît. Et on va voir que la master sequence a une concentration comme ça et puis on va voir que la classe 1 fait quelque chose comme ça, puis la classe 2, puis la classe 3, etc. Donc vous voyez quand vous êtes près du point critique, les nuages des moutons il est beaucoup plus important que la master sequence. Donc la concentration de la master sequence peut être vraiment très, très faible alors que les nuages des moutons peut être bien plus important. Un autre petit commentaire avant de définir, pour justifier un peu cette travail, donc on a dit que dans les modèles des gaines, il y avait une transition de face pour Q de l'ordre des l'oxygma sur L. Donc ça revient ici, vous voyez ici où ça est l'oxygma. Ce qui se passe dans les modèles des gaines, c'est qu'il n'y a pas de la taille de la population. Donc c'est comme si vous étiez à l'infini ici et du coup vous saviez la face espèce d'un côté et le désordre de l'autre. C'est par moment ici, on voit que quand la taille de la population est finie, même dans les régimes ou pour les modèles des gaines, il y a une case espèce, maintenant il faut que la population soit suffisamment grand, soit assez grand pour que cette case espèce-là puisse s'éformer. S'il y a trop plus d'individus, on ne va pas pouvoir arriver à former cette case espèce. Donc voilà, avec ça j'ai fini, merci beaucoup. Vous avez des informations sur la façon de la génélogie du processus évolue. Est-ce qu'on est capables de faire des choses sur... J'aurais chantillonné un temps haine et regardé ce qui se passe. Aucune idée, je n'ai jamais regardé, je ne sais pas ce qui se passe. Mais normalement, je pense que c'est assez compliqué de savoir ça quand il y a la sélection et la mutation. Oui, peut-être une autre question. Ici, dans ton modèle, tu as fait un choix uniforme dans l'individu et ensuite tu veux le faire muter avec cette probabilité de transition, c'est ça ? Mais le choix, il n'est pas uniforme. Le choix, il est donné, c'est dans cette loi. Donc ici, on favorise les individus avec plus grand fitness. Ok, donc la sélection, ça fait tant les deux côtés. Donc la reproduction et la mutation. Donc la sélection, c'est d'abord ici, pour reproduire. Il y a les gens qui ont plus de finesse, qui vont être choisis plus avec plus de probabilité. Mais après, la mutation, elle est la même pour toutes les chaînes. On va flipper chaque spin avec probabilité Q. Donc peu importe que ce soit un master cyclone ou pas, la mutation marche pareil. D'accord. Tu as parlé uniquement d'un paysage à pic. Tu regardes que ça pour l'instant ou tu as déjà regardé ? Non, on a... Alors, les paysages général, pour l'instant, c'est beaucoup trop compliqué. Mais par contre, on peut étendre, on peut étendre, bon, on est en train d'étendre ça à des paysages qui vont dépendre de la classe diamine. Donc la classe diamine, ici, dans ces modèles-là, ça correspond au nombre des 0 qu'il y a dans la chaîne. En particulier, ce qui se passe, c'est que cette matrice de mutation respecte la classe diamine. Donc, elle va juste pour muter d'une chaîne à un autre, qu'on peut juste regarder les nombres des 0 que chacun de deux ans, on s'en fout de Wholeson. En fait, c'est pas très grave ça. Donc, du coup, ce qu'on peut faire, c'est qu'on peut éteindre ça à des fonctions des fitness qui, toutes les séquences, avec le même nombre des 0, ont la même fitness. Et ça, plus ou moins, on sait faire, oui ? Et est-ce que tu as essayé de regarder des paysages avec deux ou trois pics ? Par exemple, tu pourras avoir un paysage avec deux pics et essayer de voir si ta population évolue toujours vers le même ou si tu as la moitié de la population vers l'un ou vers l'autre. Alors est-ce que tu peux observer, par exemple, les phénomènes de spécification ? Alors là, là, c'est aussi... C'est plus compliqué que les trucs qui dépendent de la classe de la mingue parce que ce n'est pas du tout le même méthode. Donc je ne sais pas trop ce qui se passerait. Normalement, je pense que si tu as deux pics, tu peux avoir des questions de symétrie qui peuvent t'aider. Mais... Donc en gros, ce qui est là, bon, j'imagine si les pics sont en distance finie, ce n'est pas très intéressant. Ce qui est intéressant de régarder, c'est quand les pics sont en distance qui est proportionnée à elles ou peut-être à... Ouais, tout comme ça. Mais là, je pense qu'il y aura des casiers spécifiques qui s'éformeraient et pas souvent ensemble dans les deux pics. Pour moi, ça a l'impression que j'ai, mais je ne sais pas t'assurer. Ok, s'il n'y a pas d'autres questions, merci d'y aller. Je ne sais pas encore une fois. Et aussi, merci à tous les orateurs de cette première session d'après-midi.