 D'abord, je veux vous remercier pour cette invitation. C'est la première fois que je viens ici, j'ai vécu à l'extrême-door. C'est dans le Gifte-Rivette, dans l'Orsay. Je suis local, mais je n'ai jamais mis les pieds dans l'institut. Je suis très heureux d'être ici aujourd'hui et je veux vous remercier pour cette opportunité. Aujourd'hui, je vais parler de la technique que nous avons développée dans mon équipe. Mon équipe est très intéressée par le fonctionnel de la formule de la génome. La génome de la matière, la génome de l'esprit. Mais en travaillant sur ces soucis, nous avons fini de trouver un point que nous pouvons exploiter les mesures quantitatives de collisions physiques entre les molécules de DNA pour résoudre les limitations génomiques ou métal génomiques qui existent dans ces fields. Nous ne venons pas de l'esprit de la génome ou de l'esprit de la génome, mais maintenant, une partie de mon équipe ne travaille pas sur ces approches par développant de nouvelles méthodes. Et donc, je vais vous montrer aujourd'hui comment cela fonctionne. Donc, quelque chose commun entre tous les écosystèmes dans le monde, c'est-à-dire le gât de la mouche ou le mangrove, les caribans françaises, sont le fait qu'ils sont colonisés par des populations complexes et heterogeneouses de micro-organismes, surtout bactérias, mais aussi gistes, warmes et beaucoup d'autres espèces. Et ces communautés d'organismes ont des rôles importants dans beaucoup de fields. Par exemple, la production d'oxygène, les matières recyclées, la pollution, l'énergie bio, etc., pour qu'elles puissent avoir une importance industrielle ou juste une relevance biologique. Et donc, c'est assez intéressant ou important pour beaucoup de gens d'essayer de déceivre les contenus de ces communautés pour trouver outre à quoi les bactérias sont là, à quoi sont les génomes, afin de comprendre la maintenance sur l'équilibrium de l'écosystème. Je vais changer ici parce qu'il y a plus de gens ici, que là. Donc, pour comprendre ces écosystèmes, beaucoup de gens sont intéressés à décrire à eux le plus précisément possible à l'extérieur de leur complexité. Donc, vous avez beaucoup de species coexistant ensemble. Vous pouvez aussi imaginer, vous avez les phages, les virus, les éléments mobiles qu'il peut changer entre les espèces. Donc, c'est assez important de pouvoir décrire la structure à l'extérieur de leur complexité. Et c'est là où le fil de métagénomique s'émerge entre les génomes et les séquences. Donc, un fil très technique, comment explorer les génomes par la structure, par la séquence. Donc, la séquence de l'hôpital, à la question, quels sont les diversités de microbes dans le monde? Donc, le fil de métagénomique consiste en séquences de DNA de l'environnement, en essayant de trouver outre ce que les espèces coexistent avec eux-mêmes et en essayant de trouver outre comment elles coexistent ou coexistent en temps. Donc, ces études proviennent des hints sur le contenu de l'écosystème et aussi des hints par rapport à la balance ou à l'inbalance de la communauté. Et puis, vous pouvez vraiment travailler sur beaucoup de choses avec ces approches. La façon dont c'est fait est d'extraire la DNA de la population, de l'écosystème que vous regardez. Vous avez tout de même extracté les molécules de DNA qui belongent à différents génomes, différents organismes. Et vous faites la séquence de l'hôpital sur cette mélange de molécules de DNA. Donc, vous séquencez beaucoup de lignes longues ou de longues lignes. Donc, vous vous rendez avec une grande picture de l'hôpital présent dans la population. Et vous pouvez improving les choses un peu parce qu'on ne sait pas quel molécules belongent à quoi. Vous pouvez en fait essayer d'extraire les molécules de l'hôpital dans les molécules de l'hôpital qui sont appelées contigues. Et encore, elles ne représentent pas les genomes entiers parce que les limitations des programmes de l'assemblée de courant parce que aussi certains de ces molécules ont fait des séquences identiques. Donc, les programmes ont failli isoler les molécules individuelles de la population originale. Et parce que c'est un problème très complexe, vous devez imaginer que certains de ces communautés contiennent des centaines de molécules, donc des centaines de genomes. Et donc, c'est assez impossible d'assembler ces séquences de l'hôpital dans des genomes entiers qui vous donnent un bon insight dans la communauté originale. Donc, ce que les gens ont fait c'est essayer de poursuivre ces contigues qui sont des séquences de l'hôpital de quelques milliers de bases dans les portes de contigues qui groupent ces molécules de l'hôpital selon, par exemple, les covarions dans différents expériments. Vous regardez les covarions entre l'amount de ces contigues que vous obtenez après la séquence. Donc, vous pouvez poursuivre ces gars ensemble. Vous pouvez regarder le contenu de l'Hôpital, le code de l'usage, différentes informations étérigènes présentes par ces molécules qui vous aideront à poursuivre ces contigues selon des features spécifiques. C'est un procès très imperfecte et souvent ce que vous vous rendez est de nombreux plus de poules de contigues que vous avez originales séquences dans la communauté. Donc, ici par exemple, vous avez six, par exemple, vous avez six bactériens. En fin de l'an, vous vous rendez avec neuf communautés de contigues qui sont des discroupés entre les seuls de contigues et les seuls de génomes que vous attendez en fin de l'an. Donc, il y a une forte inability dans cet état pour atteindre une structure de géométrie compréhensible de communautés complexes. Donc, ce sont les limites de l'investigation de la dynamique et de l'équilibre de ces écosystèmes. Donc, mon équipe a déjà travaillé sur le folding de la génome. Et donc, ce que l'on a montré et je vais vous montrer ce que je veux dire c'est que, évidemment, chaque séquence, la séquence d'un D, a une unique signature de 3D dans le monde. Et donc, nous pouvons actually exploiter cette signature de 3D pour reverser, pour retourner dans la structure de l'1D. Ok, donc, ici c'est ce que nous faisons. Donc, on utilise surtout un essai qui est appelé l'assassage de la formation chromosme, qui a été développé par Jobdecker 15 ans plus tard. Il est en train de traiter des collisions physiques entre la séquence de la génome et le génome en l'accès aux frequencies de collision dans la population de cellules. Donc, comment vous faites c'est que vous la freeze le folding de la génome dans chaque séquence par ajouter un agent de la chimie, comme le formaldehyde, qui va générer les bridges de la covalent entre les protéines et les protéines et les protéines de la génome. Et donc, si vous avez un molecule de la génome dans la cellule qui est foldé comme ça avec une complexe de protéines, vous en générera les bridges de la covalent entre ces protéines et la génome. Et donc, vous freezez le folding de ce molecule dans cette cellule. Donc, si vous avez des millions de cellules ou des millions de cellules, vous avez une population de structures frozen comme ça dans votre mélange où vous ajoutez ces agents de la chimie. Et puis le truc c'est de déjeuner ces molécules de la génome. Et donc, vous vous termine avec des fragments de restriction. Donc, des pièces de fragments de la génome qui sont, encore une fois, fixées avec eux-mêmes selon la fréquence de la collision dans cette population. Et puis, quand vous ajoutez un enzyme de l'alcool qui va réalcooler ces deux fragments de restriction, vous vous termineriez avec un molecule qui est de la chimie avec respect à l'original génome. Mais ça reflète le facteur que ces deux fragments rèdes et bleus sont en fait près de eux-mêmes dans l'espace 3D. OK? Donc, ce que vous faites c'est que vous vérifiez tous les molécules de la génome. Et vous vous terminez avec une libraire de molécules de la génome avec des fragments de restriction. Donc, les segments de la génome qui sont près de eux-mêmes dans l'alcool 3D. Quels sont les segments de la génome? Donc, ça dépend de l'ondim que vous utilisez, mais il peut être entre, c'est-à-dire, 10 base pairs à 2 kB, 3 kB. Donc, si vous utilisez un coût de fréquence, ce serait généralement entre 20 base pairs et 200 base pairs. Si vous utilisez un coût de six, un enzyme qui reconnaît les six base pairs, ce serait entre 500 base pairs et 3 kB. Et ça dépend aussi de l'intérêt de la génome. Donc, il y a beaucoup de paramètres à jouer, mais généralement entre 1 kB et 1 kB, c'est-à-dire, en avareille. Donc, pour longtemps, la limitation dans cet état était de quantifier l'amount respectif de ces événements. Parce que si vous pouvez avoir un overview global de l'amount respectif de tous les événements entre tous les segments dans la population originale, vous pourriez avoir un overview global de l'amount respectif de la génome. C'était la théorie. Et ça a été soulevé avec l'advance de la séquence de l'amount comme l'amount respectif où, basiquement, vous pliez les adapteurs de séquences à l'aide de ces molécules. Et vous séquencez l'un de les molécules sur l'autre. Et maintenant, vous comptez combien de fois vous avez trouvé dans la bibliothèque, par exemple, le fragment gris qui est relié avec le fragment bleu et en fait avec tous les autres fragments de la génome. Et donc, vous avez le contact je veux dire le respectif contact le contact respectif de l'amount respectif de l'amount respectif entre tous les fragments de l'amount respectif de la génome avec les autres. Et ça vous permet de générer des maps de contact de maps de contact qui reflèrent ce ratio respectif. Donc, c'est un exemple pour l'advance de l'amount respectif qui contient 2 genomes circulaires approximately 4 genomes de megabase Donc, ici, les genomes sont représentés ici sous la forme linéaire. Et quand vous plaites le contact entre tous les fragments de l'amount respectif et le contact de l'amount respectif avec eux-mêmes, vous vous endvez avec ce map de contact ici. Donc, c'est un map de contact de contact de l'amount respectif. C'est le map de contact de la map de contact de l'amount respectif. Et puis, vous pouvez aussi plaitre le contact entre le contact de l'amount respectif et le contact de l'amount respectif. Et ici, vous avez un map de contact interchromosomal. Donc, ces map de contact de l'amount respectif sont assez représentatives de ce que vous avez quand vous faites ça sur toutes les espèces que vous avez, soit c'est de l'amount de l'amount respectif ou de l'amount de l'amount de l'amount respectif. Vous avez, d'abord, une très forte diagonale qui réfléchit au fait que les molécules de l'amount de l'amount respectif sont un polymère. Et donc, deux fragments de l'amount de l'amount respectif qui sont close à eux-mêmes par ce polymère vont être religés plus souvent que deux fragments qui sont faraouks des autres. Alors vous avez un contact de l'amount de l'amount respectif que, la contact de l'amount respectif c'est de l'amount respectif. Normalement, les molécules de l'amount respectif ne sont pas les coils de l'amount respectif. Elles ont de l'amount respectif. Excuse-moi. Elles ont de l'amount respectif et elles ne sont pas les coils de l'amount respectif. Oui, c'est ça. Ce qui est différent de les coils de l'amount respectif d'un des coils de l'amount respectif. Donc, Donc, la fréquence de contact se reflète plus ou moins à la poignée de pouvoir. Et donc, le plus tard, vous allez... Le plus tard, vous augmentez la distance entre les fragments de restriction 2 et ça va se droguer très rapidement. Et c'est en fait une scale logique. Mais la ligation dépend de les séquences de distance, oui. Oui, donc vous avez des bioses à ce niveau, un peu de bioses qui sont caractérées et ne sont pas assez fortes pour effectuer le résultat de ce résultat. Vous pouvez avoir des problèmes si vous avez de très hauts Gc riche. En fait, la séquence va être affectée aussi. La séquence Illumina peut être problématique sur de très hauts Gc riche. Donc, il y a des bioses, mais en général, ce n'est pas l'affectation générale, c'est que deux fragments de près de l'un à l'autre, ce polymère, vont être fréquentement en contact et deux fragments de loin de l'autre, comme ici, ne vont pas être fréquentement en contact. Donc ici, la couleur de la scale reflète, les contacts rares sont en blanc, les contacts fréquents sont en bleu. Mais aussi dépendant de ce stage et de la séquence, oui, donc c'est exactement. Donc, cela modifiera, pour exemple, le width de ce diagonal. Si vous allez dans la métaphase, vous augmentez le width. Si vous êtes dans l'application, cela ressemble à ceci. Donc, il y a des événements fonctionnels que vous pouvez identifier dans cette map de contact. C'est quelque chose qu'on travaille sur, dans différentes spécifiques. Pour exemple ici, les chromosomes sont circulaires, c'est-à-dire que cette position ici, est adressée à ceci. C'est pourquoi vous avez ce contact dans les âges des maps. Et aussi, pour les événements fonctionnels, vous pouvez voir ici, pour exemple, vous avez le contact, c'est très lourd, c'est-à-dire que vous avez le contact entre l'origine de chromosome 2 et le milieu de chromosome 1. Et cela correspond à la termination de la position de l'application de ces deux chromosomes. Et vous pouvez également demander pourquoi vous avez le chromosome C dans l'espace. Vous avez aussi un contact spécifique entre l'origine de chromosome 2 et la position de la position de la chromosome 1. Cela relationne à l'control original et c'est quelque chose que nous travaillons en collaboration avec DJ Mazelat à Pasteur. Mais aujourd'hui, ce que je veux insister c'est que dans tous les génomes, vous avez ce très fort diagonale qui reflète le fait que ces deux chromosomes sont polymers et donc dans l'espace, l'espace cellulaire a relativement individualisé les entités. Alors la question qu'on a demandé à un moment, quand nous travaillions sur cela, c'était, ok, il y a beaucoup d'experiments sur un mélange de species. Est-ce que le fragment de genome 1 va être en contact par accident, par procédure d'expérimentation de la biose ou est-ce que le fragment de genome 2 ou de genome 3 ou est-ce que ces événements vont être suffisamment longs? Il y a quelques événements qui ne l'ont pas compris. Quand vous vous inquiétez, les séquences vont être complétables. Il n'y a pas d'experimentation. Juste parce qu'il n'y a pas d'experimentation, il n'y a pas d'experimentation. Non, parce qu'il n'y a pas d'experimentation. Non, parce qu'il n'y a pas d'experimentation. Il s'arrête le même site. Donc vous avez un site cohésif. En parlant de l'experimentation, il dit 6 mètres. Il dépend de l'experimentation. Donc si vous utilisez un end cohésif, il sera très efficace. Si vous utilisez un cut blanc, ce n'est pas si efficace. Mais il faut savoir si ces fragments vont être relagés souvent avec l'un de l'autre de différents génomes. Et donc, il se brise le signe. Ce que nous avons fait, c'était de faire une expérimentation pour les prévenus. Nous avons pris 3 différents espèces. Vibrio colleré, Hérichia coli et Basile subtilis. Nous avons créé elles indépendamment. Nous avons mixé les deux ensemble. Et puis nous avons performé ce genou de 3D expériment pour les deux espèces. Et donc, nous avons pris le signe de l'experimentation. Et nous avons aligné le signe contre les génomes référents de ces 3 espèces. Et puis nous avons regardé la pattern de contact entre ces génomes et dans ces génomes. Et quand nous avons fait ça, nous avons été très heureux de voir qu'actuellement, il y a un très petit background entre les différents espèces. Et donc, nous avons été très heureux de voir qu'il y a un fragment avec un fragment de espèces entre l'élégation. Ce qui peut s'occuper parce que quand vous lisez la cellule, et que vous processez la cellule biochimique, chimiquement, vous pouvez distraire le génome et avoir un fragment dans la solution. Ce n'est pas souvent possible. Il y a un bloc de l'esprit qui est le génome de l'écoli. Vous pouvez voir qu'il y a aussi un bloc de l'esprit qui correspond à un plasmid qui a beaucoup de l'esprit de l'écoli. Et donc, ça vous dit que ce plasmid peut probablement shares le même espace cellulaire que le génome de l'esprit de l'écoli. Et ici, vous avez, again, les deux chromosomes de bivriocooleries qui aussi se voient en 3D très souvent, et donc vous pouvez déconvolter, en fait, les génomes de ces 3 différents espaces de cette map de la cellulaire. Donc, le covrège peut-être en jouance ici, et c'était un expérience très primaire, donc il y a peut-être des différences. Dans l'amount de cellules, même si on pensait qu'on pouvait mettre un similar amount de cellules, peut-être que nous avons fait quelques petits erreurs. des bactérias, c'est un bactérias de gramme-minus, et il semble être un peu plus facile d'extraire le DNA des bactérias de gramme-minus et de gramme-plus. Donc, le coverage de Bacillus est plus bas dans cet expériment que ces deux gars ici. Donc, vous êtes attribuant ce spread de... Oh, la ligne thinne ici. Oui. Donc, le diagonale est beaucoup plus... Oui, le diagonale est aussi un matériel de couleur, ici. C'est le même color scale pour toute la map, et, pour cela, vous avez un bleu. Et c'était, encore, un expériment très ancien. Donc, Bacillus ne ressemble pas à ça. Nous avons travaillé sur ça. Je vais vous montrer les maps. C'est beaucoup plus beau que celui-ci. Ok, donc... Ok, j'ai mis ça. Donc, qu'est-ce que la thickness du diagonale? Donc, ça signifie que... C'est peut-être interprété à un niveau de condensation. Ce n'est pas totalement vrai, mais vous pouvez, en fait, visualiser ça comme une mesure de condensation de l'chromosome. Donc, si la condensation est haute, deux fragments de DNA qui sont plus loin vont être plus fréquentement connectés avec l'un de l'autre, alors que c'est très déconnacé. C'est une façon de le voir. Donc, ce que nous avons fait, c'était de faire un même expériment avec 11 spécies. Donc, 11 génomes. Et ces sont les génomes. Donc, chaque génome maintenant est composé de multiples chromosomes. Donc, nous avons mis tous ces spécies ensemble dans un mélange. Et nous avons fait l'assay métagénomique que... non, sorry... le assay métatricien, comme l'on le appelle, directement dans le mélange. Alors, quand nous alignons les risques contre les génomes référents de ces spécies, nous sommes contents de observer qu'il y a, en fait, 11 grandes squares dans le diagonale principal qui correspondent aux génomes de ces spécies. Donc, certains de ces spécies ne sont pas bien couvertes comme d'autres. Encore une fois, vous pouvez voir les différences, mais ce n'est pas très... ce n'est pas très différent. Mais, encore une fois, ici nous alignons les génomes contre... nous alignons les risques contre les génomes référents donc, nous pouvons chier. Nous savons l'entrée. Donc, ce que nous voulons faire c'est de faire un assay qui nous permettra de commencer. Excuse-moi, mais pour ces, vous n'avez pas d'une séquence commune ou d'une séquence commune ou d'une séquence commune? Non, ici, il n'y a pas d'une séquence commune. Nous n'avons pas d'une séquence commune. Mais chaque de ces grandes squares sont composées de petites squares qui correspondent aux chromosomes présentes dans chaque espèce. Et aussi sur les dots. Donc, vous savez, dans les centromeres, vous l'avez entendu, on peut-être parler de ça, mais les centromeres sont collocées dans les nucléus. Et donc, le DNA à l'arrivée du centromere collègue avec l'autre DNA, assez souvent. Et donc, vous pouvez voir les clôtures des centromeres qui sont ces dots dans les maps de contact. Et dans le cas de Cerevisia, vous avez les 2 macromes placées? Oui, mais nous ne l'avons pas aligné. Donc, il y a peut-être un placement là-bas, mais c'est dépendant du train, je pense. Mais pour ce train, certainement, c'est-à-dire Cerevisia, oui. Ok. Est-ce que vous pouvez prendre le nombre de chromosomes et que ça va être... Oui. Donc, je vais vous montrer ce que nous faisons maintenant, qui est exactement ça. Donc, ce que nous voulions faire, c'est parce que c'est un peu utile, mais c'est un peu utile, si vous voulez explorer quelque chose que vous avez de l'air, où vous ne connaissez pas le contenu dans les chromosomes. Vous ne pouvez pas aligner les rites contre les chromosomes si vous n'avez pas les chromosomes. Donc, ce que nous voulions faire, c'est de créer un protocole, un protocole computationnel où nous commençons par les rites. Donc, seulement les rites parentes. Et nous aimerions voir si nous pouvons aller vers le genome de toutes ces espèces. Donc, nous commençons ici seulement avec les sequences rues qui sont les rites parentes parentes qui reflèrent les fréquences de contact avec tout le DNA dans la population. Donc, ce que nous pouvons faire, c'est que nous pouvons premièrement essayer d'augmenter la taille de cette petite rite de DNA. Donc, nous pouvons utiliser des assemblages standardes, comme le DBIUD, qui vont augmenter la taille de la taille de DNA qu'on a. Donc, nous avons un set de comptes que nous pouvons travailler sur. L'autre information qu'on a, parmi les sequences de DNA, dans cette rite de DNA, sont les informations parentes qui correspondent au contact entre les molécules de la DNA du design de l'expérience de la tricie. Donc, maintenant, ce que nous pouvons faire, c'est que nous pouvons également aligner l'information de contact sur cet état de comptes. Et ça nous donne un contact de contact entre cet état de comptes. Ok? Donc, nous avons cette état, qui est très grande. Et donc, une bonne façon d'analyser l'état est d'utiliser l'algorithme Louvain qui va partitionner le réseau pour optimiser la modularité du réseau du réseau du réseau de partition. Et on regarde les communautés de contigues qui se trouvent très bien dans cette grande networks. Et on ne voit le reste des autres communautés très souvent. Et donc, nous travaillons avec ce Louvain de l'algorithme qui nous permet d'actuellement ségrer ces boules de contigues dans 11 communautés. Juste par utilisant l'algorithme Louvain nous avons terminé de trouver 11 communautés qui est en fait le nombre de boules que nous avons originalement mis dans le mélange. Nous avons aussi un contaminant comme un genome ici, 1%, qui est probablement venu d'une culture de boules que nous avons en même temps. Donc, c'est ok. Donc, la plupart de ces communautés ne voient pas les contigues des autres communautés, très bien. Je peux vous répéter la nature des âges dans votre interaction ? Les âges sont les contigues et le nombre de contacts entre les contigues sera la note. Donc, l'âge, vous mettez un âge entre ce contigue et un autre contigue mais, nous savons que le nombre de contacts sera la reflète de la collocalisation dans la même cellule. Donc, nous avons juste... Donc, ça marche relativement bien mais ici nous avons des contigues et si nous avons une de ces communautés nous regardons le contact entre ces contigues c'est ce que nous avons donc ici nous avons 1 000 contigues et bien sûr la reflète donc, quand nous nous alignons les contigues les risques entre les contigues et nous générons le contact map c'est ce que nous avons c'est un contact map comparé à ce que j'ai montré avant et donc ici je vais introduire un autre algorithme que nous avons créé en même temps qui nous permet de ré-order ce contigue en accord à leurs fréquences de contact et donc, essayons de ressortir le génome de ces espèces donc, c'est un programme qu'on appelle le GRAL qui a été créé par un parlementaire dans mon groupe et c'est comme un interlude que l'AIMS a créé des contigues basées sur leur contact en 3D donc, la situation que nous avons ici est la même si nous avons la fréquence de contact entre un génome beaucoup de génomes ne sont pas fully assemblés donc, quand vous alignez l'experiment de contact contre les génomes de référence vous avez ce contact de contact où parce que vous ne savez ici que le contigue gris est ajouté ici vous n'aurez pas positionnés ces deux gars à l'arrivée et donc vous avez ce contact de contact ici c'est en congrès avec ce que nous savons de la polymère physique de la propriété polymère de la DNA donc, en même temps pour la cromosome ici qui se couvrent dans 3 contigues ici, là et là vous avez ce contact de contact de long distance dans le contact de contact donc, ce que vous voulez c'est de solver ce puzzle ici, c'est assez simple vous pouvez solver de la main par exemple, ici, vous pouvez prendre la contigue gris ici, avec ce gars donc, vous vous positionnerez cette échec à l'arrivée et maintenant vous avez un long scaffold et ça ressemble bien sur la map mais vous pouvez avoir de long distance des interactions oui, vous pouvez avoir de long distance des interactions qui sont peut-être fonctionnelles par exemple, comme les centromeres dans l'île mais ces contacts fonctionnelles sont toujours plus petits que les très fortes polymères de la cromosome et les contacts diagonaux sont toujours 1,2 c'est-à-dire 2 fold 2 logs plus haut que les contacts que vous voyez à de longs distances et puis, ce que vous voulez faire par exemple, avec le gars gris vous avez une contigue ici et vous voyez que c'est de l'arrivée et donc, vous avez un gars gris en tout cas, vous avez l'idée vous ressortez les contigues jusqu'à que vous avez seulement les squares dans les diagonaux et vous minimisez les diagonaux de l'arrivée au-delà de la main donc, c'est facile de faire par la main mais c'est en fait plus compliqué de faire avec de l'art avec des genomes très grands complexes donc, ce que nous avons fait c'est de créer un programme qui utilise ces contacts qui sont très quantités de contacts sur la production de polymères pour explorer l'espace de structures de genomes et identifier les structures de genomes en 1D qui reflèrent les données 3D avec la hausse de la probabilité donc, c'est ce que nous avons fait donc, encore une fois, c'est par exemple le pouvoir low et nous l'avons remarqué donc, si vous connaissez les frequencies de contact entre 2D et un fragment et vous avez les contacts diminuent par rapport à la distance de la genome pour la genome si vous connaissez la frequency de contact vous pouvez en fait imaginer avec une très grande accuré la distance qui sépare les deux lois que vous avez regardées donc ici, par exemple, vous avez un contact autour de la 100 et puis vous pouvez dire ok, donc ces deux les deux ce contact serait comme 50 et puis vous dites ok, si vous avez un contact de 50 entre deux segments cela signifie qu'ils sont séparés avec une certaine likelihood de 100KB en 1D donc, Hervé a designé ce programme qui commence seulement avec les données 3D et il est initialisé avec un modèle polymère parce que, d'abord, nous n'avons pas suffisamment de compter cette distribution qui change sur les génomes légèrement donc, d'abord, nous commençons avec un modèle polymère sur les données sur les génomes originales donc, le set de contique qui n'est pas fully scaffoldé ou qui a été publié ou que nous avons généré et puis, il va s'occuper par les structures de génome en 1D en essayant d'améliorer la probabilité de la structure par les données 3D sur les données et d'améliorer une nouvelle compétition entre les données et la structure de 1D donc, nous allons samplez la structure de la structure en 1D et compter pour chaque fois la nouvelle probabilité donc, c'est la probabilité sur le point de vue c'est ici et c'est l'incréditation de la probabilité de l'interaction de les événements donc, nous faisons des changements de la structure de 1D et pour chaque changement nous compterons la probabilité et puis, nous prenons la meilleure probabilité de la structure de la structure la meilleure probabilité et puis, nous conversons sur la situation où nous sommes oscillés par la structure de la structure de 1D et c'est juste un film qui illustre ce processus donc, c'est un génome qui a été publié comme un set de 76 contiques donc, 76 big pieces de DNA et nous savons que ces espèces n'ont pas 76 chromosomes donc, il y a plus de chromosomes et non, plus de contiques publiées que de nombreuses chromosomes et quand vous faites le data de 3D vous pouvez voir clairement que, il y a quelque chose avec cette map de contact il ne ressemble pas, et ici, nous avons illustré 76 contiques publiées donc, ce que nous voulons c'est de réorder ce fragment de DNA selon les contacts de 3D et convertir la structure plus probable donc, la première partie de notre programme est de expliquer ces grandes contiques dans deux petites pièces parce que nous espérons qu'il y a des erreurs d'assemblées dans le premier place qui ont été publiées et donc, nous couvons ces gros fragments dans deux pièces de 10 kB et nous commençons à les assortir selon les fréquences de leurs collisions donc, la première partie de ce film est juste en train d'améliorer donc, nous avons expliqué ces fragments de DNA dans deux petites pièces et puis, ici, c'est le nombre de contiques et nous commençons d'explorer ces structures et d'améliorer la likelihood et en fin de compte, nous commençons à convertir dans un état où nous avons 11 grands chansons de DNA et nous avons une map de contact qui, apparemment, représente quelque chose qui ressemble donc, ici, quand nous arrêtons le programme sorry, pas 11, mais 7 chansons oui, oui, ça n'a pas commencé à la fin ok, c'est arrêté oui, c'est arrêté c'est arrêté c'est un de ces chansons mais ça ne s'intéresse pas bon, de toute façon donc, quand nous arrêtons le programme, qui est oscillé pour toujours autour de la même structure nous avons un contact qui ressemble à l'intercentromérique contact qui est totalement prévue pour le Phongi à cet état et, comme ici, nous pouvons identifier les centromeres en regardant la position de ces dots dans la séquence etc. donc, nous pouvons s'occuper de cette génome assez efficace et c'est une vraie génome que nous avons indépendant et nous pouvons faire ça pour d'autres espèces c'est juste un exemple de données publiées de petits génomes comme cet Phongi mais c'est le WASP parazitoïde c'est une collaboration avec Jean-Michel Dresen en Angers où, quand nous faisons le contact entre les chromosomes de ces WASPs nous avons ce très méchant contact map, c'est un génome publié par des milliers de contiques vous pouvez les voir ici, chaque contique se fait un square mais vous avez tous ces contacts interchromosomal et vous pouvez aussi faire ça efficacement je vais juste aller rapidement mais encore, nous sommes juste ressortir les chansons de DNA selon les fréquences collégiales et ça nous donne une relativement robuste un square dans le final donc ça fait un peu plus long mais ici donc quand nous faisons ça, nous terminerons une relativement scalfold qui correspond à ce que c'est expected de la data de cytologie donc nous nous avons expliqué les fréquences collégiales entre ces fragments de DNA pour risquer ces genomes et dans un moyen qui matchait les data intelligentes donc maintenant notre collaborateur peut regarder les séquences de genomes comme des séquences virales qui contribuent à le processus de WASPs peut-être le WASP distraite le système d'immunité pour je ne sais pas si vous parlez de Pondre mais pour envisager les eggs dans le caterpillar qui est infecté donc ces séquences virales sont importantes pour la reproduction du WASP de toute façon donc, en revanche dans cet assiette nous avons fait ce programme nous avons rendu ce programme de 1000 contigues et nous avons rendu quelque chose qui ressemble à une map de contact et quand nous comparons ce map de contact avec le genome de référence nous avons 95 % du genome de référence couvert par ce map donc, dans un seul expérience nous pouvons isoler 11 genomes d'une mixte de species et les risquer avec environ 90 % d'accuré comparé à ce publiqué donc, ce qui était ici, je vais vous montrer le réel expérience ce n'est pas un mix de contrôle il est fait sur le gât de la mousse de l'Institut Pasteur Animal Facilité ce n'est pas un sample très excitant parce que encore, nous n'avons pas microbiologiste à cette fois mais donc, nous avons rendu un seul expérience et nous avons rendu l'asset de métat de contact directement sur ce seul expérience donc, nous pouvons poursuivre pour assembler ce DNA dans deux contiques et ici, c'est une très grande networks, nous avons 400 contiques 400 000 contiques cela représente environ 600 megabays de DNA et le N50 est autour de 4 kB donc, les contiques sont relativement petits encore, quand vous regardez sur le contact map de ces contiques encore, nous avons l'information pour couper ces contiques selon les fréquences de contact et nous avons cette networks de contiques qui contiennent 45 millions de contacts donc, c'est une très complexe network et c'est ce que ça ressemble quand ce n'est pas sorti ce que nous avons fait encore, c'était pour participer cette networks en utilisant l'algorithme et quand nous avons sorti cette networks en utilisant de belles communautés de contiques qui présentent plus de contacts à l'intérieur d'un autre comparé à l'extérieur avec l'autre donc, chaque square correspond à un set de séquences de DNA qui collèrent plus souvent dans l'espace comparé à l'autre ok, je vais quitter ok donc, ce que nous avons fait c'est d'investir les contenus de ces communautés et, d'abord, ce qu'on peut faire c'est d'investir les annotations de genome contre la DNA présente dans toutes ces communautés donc, les communautés sont sorties d'un certain nombre donc, bien sûr, nous avons des petites communautés de quelques contacts qui commencent de l'un à l'autre mais, la plupart des communautés sont en train d'entrer les communautés de contacts qui contiennent plus de 1000 contacts donc, il y a plus de 1 megabase de DNA donc, bien sûr, la plupart des communautés sont présentes dans des communautés donc, ce que vous voyez ici la plupart des jinx sont présentes dans les communautés parce que ce n'est pas intéressant si nous regardons les domaines essentiels encore la plupart des genes essentiels sont présentes dans ces communautés suggestant que ces communesisanales correspondent à l' botkiel de les données qui n'est, hein, pas du tout désolé L'Ontario n'est pas utile ou de l'analyse ou de l'analyse conjugative de l'analyse, nous avons vu un enrichissement aussi dans les communautés plus petites comme si, bien sûr, les phages sont en contact avec les génomes bactériaux, les génomes bactériaux, parce que les phages sont intégrés dans les génomes bactériaux, comme des phages profiles, ou des phages qui sont peut-être infectés par les génomes bactériaux. Mais aussi, certains phages comportent comme entiers individuels, qui, dans l'espace, sont en contact avec eux-mêmes, et non avec un autre molecule. C'était assez intéressant, donc nous avons décidé de analyser ces deux étapes de communautés individuelles, les premières, les plus grandes et les plus petites. Et donc, ce que nous observons, par exemple, si nous prenons l'une des communautés plus grandes, donc c'est le 68, encore une fois, nous avons ce pattern de contact messier, nous pouvons improving ce pattern en travaillant avec le programme de design, et en fin de l'année, nous avons terminé avec un scaffold, de près de 4 megabays de DNA, un single scaffold, qui présente ce genre de pattern. Donc, vous avez ici le grand diagonal, et interestingly, vous avez aussi un second diagonal. Et je vais vous montrer pourquoi c'est intéressant, c'est parce que, en même temps, nous avons travaillé sur la cellule subtilise, ce genre de 3D folding de bactéria-génome est typique de bactéria, comme la cellule subtilise. Donc, d'abord, cette origine de réplication est positionnée à l'endroit de la cross-section entre ce second diagonal et le main diagonal. Vous avez plus de DNA autour de la origine de réplication comparé à la termination de réplication, qui correspond à un bactéria qui est activement divisé, donc vous avez plus de DNA à la oreille qu'à la termination de réplication. Et le second diagonal reflète le fait que les deux armes de chromosomes, même s'il y a des bactéria-génomes, collègent avec eux-mêmes plus souvent parce qu'ils sont trahisés par la cohésie, comme nous l'avons fait dans la cellule subtilise. Donc, quand vous commencez la réplication, vous mettez les deux armes de chromosomes et ils se maintiennent en contact avec eux-mêmes durant la cellule. Et c'est ce qui se reflète par ce second diagonal. Donc, c'est typique de la structure 3D de bactéria-génomes, comme subtilise. Donc, ce sont d'autres communautés, d'autres, d'autres. C'est plus comme l'hécoli de bactéria-chromosome, où nous n'avons pas le second diagonal. Donc, c'est comme la vacillus, c'est comme l'hécoli. Mais nous avons une structure qui ressemble à la structure 3D de bactéria-génomes. Donc, dans une seule expérimentation, nous pouvons récupérer des doigts de bactéria-scapfolds, ce qui est en fait... Je ne sais pas si vous pouvez le faire dans cet ordinateur. Vous devez avoir plusieurs samples, vous devez faire beaucoup d'analyses de corrélation. Mais ici, dans une seule expérimentation, nous endurions 100 bactéria-génomes relativement complets. En même temps, ce que nous avons fait c'est analyser le contenu de ces petites communautés, c'est les phages. C'est comme les phages. Donc, ici, nous avons pris 82 petites communautés qui contiennent la plupart des gènes qui sont les phage-génomes. Nous reprochons les données un petit peu. Et nous regardons les séquences que nous avons obtenues pour ces 82 communautés. Et donc, ce sont différents exemples de ces 82 communautés. Donc, un d'entre elles, c'est les du BKZ-génome. C'est la phase. Ces les KZ-génomes correspondent sur deux molécules de 25 KB, qui sont aussi de la bonne size pour la phase-génome. Peut-être une phase de la phase-génome ou de la phase-guerre. On a donc les gènes de phase dans ces communautés, que nous pouvons maintenant en corrélation avec les hostes potentiels qui sont les génomes bactériaux. On a en une partie les génomes bactériaux, et en l'autre, on a les génomes phages. Maintenant, on peut plier les contacts entre les génomes phages et les génomes bactériaux. Ce que nous faisons ici, nous avons les séquences phages 82 et les séquences bactériales. C'est ce que nous avons maintenant. Nous avons un bon overview de l'infection spectrum, l'infection spectrum global dans la communauté. C'est important, parce que maintenant, ce que nous pouvons faire c'est de faire ce genre d'expérience en temps. On regarde par la propagation, par exemple, d'un virus dans différentes espèces bactériennes, ou des bactériennes closely relatives. Nous pouvons aussi regarder les génomes de l'interesse, par exemple, une génome anti-biotique résistant qui est présente dans l'une des espèces bactériennes. Et puis, si nous traînons l'une de la communauté avec l'antibiotique à un patient, nous pouvons regarder la propagation de cette phase ou cette génome anti-biotique résistant dans la population de bactériennes. Et si, à un point de vue, il va induire des stress dramatiques dans la population de bactériennes, nous pouvons regarder l'activation de profégements selon les stress, etc. Donc, cela ouvre un grand range de études qui, jusqu'à maintenant, sont très difficiles à adresser parce qu'il n'y avait pas de bon moyen de briser le virus, donc les séquences de phase à la microbiome, ce qui est les séquences bactériennes. Et aussi, nous n'avons pas le plein de génomes de ces bactériennes, donc c'est difficile de regarder l'interplay entre les networks métaboliques dans ces communautés complexes. Donc, c'est... Je ne sais pas comment... Qu'est-ce que c'est? Ok, donc... Donc, c'est juste une autre petite observation, c'est qu'on a aussi des profégements dans les génomes de bactériennes, donc qu'ils ne correspondent pas à ces communautés de séquences de phase mais nous pouvons aussi observer des séquences de phase dans les chromosomes bactériennes qui correspondent à des profégements, probablement. Et donc, ici, dans la rède, c'est l'annotation des séquences de phase. Et vous pouvez voir les clôtures des annotations de phase dans ces chromosomes bactériennes qui correspondent à cette pattern rare dans les contacts de 3D. Et donc, ce sont typiques des séquences de phase dans ces génomes de bactériennes, peut-être des différences dans la composition de phase 80 qui affectent l'outre de l'expérience. Et ce que nous avons montré c'est que, par exemple, dans la subtilisation de Bacillus, c'est une phase, ici, spb-beta, qui présente aussi cette pattern rare. Donc, la composition de phase 80 de cette séquence est différente de la restée du chromosomes, donc la restriction va être affectée et, donc, la pattern de contact va être affectée. Et ce que nous avons montré c'est que si nous stressons ces bactériennes, la phase, maintenant, est activement divisé et est, en fait, très prominente dans les données de contact. Donc, c'est, de nouveau, l'expérience contrôlée de Bacillus subtilis. Et nous pouvons, en fait, observer aussi l'incrise en séquences de séquences de cette protége, ici. Et donc, ça nous dit que cette protége est activement divisé dans ces bactériennes, c'est peut-être une bactérie. Et quand nous retournons aux données annoncées du monde, nous pouvons observer des patterns similaires. Par exemple, ici, nous avons une protége qui ne semble pas être activée. La protége est en fait flat comparé à la restée du chromosomes. Mais ici, ce gars-là semble être activement divisé. Donc, peut-être, cette protége est active. Cette est active. Et donc, nous inquiétons si nous pouvons réveiller l'activité de la protége, les séquences à l'intérieur de la bactérie, encore dans ce single expériment. Donc, ça serait aussi intéressant. Donc, c'est l'expériment que nous faisons maintenant, avec d'autres, à l'aide d'une mouche ou d'une mouche avec des mixes contrôles de species, comme 13 species ou plus. Et nous pouvons, par exemple, traiter un peu de ces mailles avec des biothèques. Nous pouvons changer la composition de la protége par ajouter, par exemple, les species avec une résistance anti-biothèque, etc. Et donc, maintenant, l'idée est de sample les physiques de cette mouche à différentes tempses et de traiter en 3D, en 4D actrice, ou en 3D, en temps. La propagation des genes, la activation de protége et de atteindre une picture compréhensible de la dynamique de la population. Et donc, c'est où je vais arrêter. C'est juste une très primaire date où nous observons que les lignes ici correspondent à la fêche, sur les 5 fèches présentes dans cette bactérie, qui est l'une de les 120 bactériques présentes dans la mouche dans ces mailles. Donc, c'est l'une de les bactériques sur la fêche, la fêche, l'expérience est représentée avec cette ligne, les 5 fèches présentes là-bas. Et en fait, l'une de les fèches qui a l'air très différemment de la reste de les fragments de DNA et l'amplifier donc, ça peut rappeler quand nous traitons l'antibiotique, l'activation de cette fêche qui peut jouer un rôle dans l'amplification de la bactérie ou de la dynamique de la population. Donc, maintenant, nous essayons de l'intégrer toute cette date. C'est assez complexe. Pour nous, c'est complexe parce que nous n'avons pas l'air de travailler sur ces choses. Mais, pour essayer de l'intégrer toute cette date ensemble, pour obtenir cette picture compréhensible. Donc, encore, ce que j'ai montré c'est que ces fréquences de contact peuvent être utilisées, bien sûr, pour analyser la biologie de l'chromosome. Mais nous pouvons aussi développer ces approches alternatives qui nous permettent d'entraîner le microbiome avec un virus et d'améliorer l'éco-système de l'éco-système. Ce sont des systèmes de l'éco-système. Donc, ce sont des gens qui ont fait le travail de la plupart des expériences qui ont été réalisées par un postdoc dans mon lab, Marcel, qui a maintenant une position de scénario deux ans plus tard, accélant un ingénieur dans mon équipe et le PhD du Liam, ainsi que le professeur de l'éco-système pour le programme Gral et l'évent de l'éco-système qui a travaillé avec le UPMC, mais qui n'a pas contribué à ce travail, mais qui est un collaborateur très bon. Je vous remercie pour votre attention.