 Alors, première annonce, il y aura deux séances supplémentaires en janvier, parce que, évidemment, je suis allé plus lentement que prévu, et donc, on continuera en janvier. Vous avez tous inscrit sur des mailing lists ou des choses comme ça, vous recevez les infos par email, vous recevrez les dates, donc vous recevrez l'information sur les dates et sans doute, sans doute, les prochains cours, ça sera 25 janvier, 1er février à confirmer. Deuxièmement, je vais revenir sur un point de la séance précédente sur lequel je suis allé un petit peu vite et je vais prendre cinq minutes pour détailler de quoi il s'agit. C'était la preuve de la formule de Boltzmann par la méthode des types, ce que j'avais appelé méthode des types, et vous vous souvenez, j'avais dit donc retour sur la deuxième preuve, vous souvenez, il s'agissait de prouver la formule S égale moins somme des FK log FK dans un certain régime asymptotique. Et j'avais dit, pour tout P égale P1 etc. Pk, 1 est égal à la somme des pays à la puissance n et ce qui est égal à la somme des factorials n sur factorial n1 etc. factorial nk, P1 puissance k1 etc. Pk puissance alors P1 puissance n1 etc. Pk puissance nk. Bon, avec une formule du multinome de Newton et on avait vu que, j'avais dit que la formule s'en déduisait tout de suite, je reprends le raisonnement, j'avais dit que c'était égal à la somme, sur tous les F appartenant à grand fn qui était l'ensemble des vecteurs F1 etc. Fk avec des nominateurs grand n, des Wn de F et puis ici on va mettre P1 puissance nF1, Pk puissance nFk. Bon, et avec Wn de F est égal à factorial n sur factorial nF1 etc. nFk factorial. Bon, et ce que j'avais dit, ce qui fait tout marcher, c'est que ici il n'y a pas beaucoup de vecteurs fréquences différents possibles. Il n'y en a plus quelque chose comme grand n puissance k parce qu'en gros, chaque composante peut prendre que n valeur puisque c'est une fraction dont le dénominateur est égal à grand n, n ou n puissance 1, quelque chose comme ça. Mais en gros, c'est une somme qui porte sur grand n puissance k élément. Alors l'argument où je suis allé un peu vite qui permet de conclure, c'est que d'abord, on en déduit que pour tout F appartenant à F grand n, Wn de F, P1 nF1 etc. Pk nFk est inférieur ou égal à 1. Ça, c'est la majoration triviale où je dis que chaque termes est plus petit que la somme. Et d'autre part, supe pour F appartenant à grand fn des Wn de F, P1 puissance nF1 etc. Alors je vais écrire ça P puissance nF et c'est entendu que c'est le produit des pays puissance nfi. Et supérieur ou égal là, 1 sur cardinal de fn et voilà, 1 sur cardinal de fn. Et ici, c'est donc supérieur ou égal de manière grossière à 1 sur n puissance k. Et alors, ce qu'on fait ensuite, c'est qu'on va particulariser la première inégalité F égalp. Pas de souci, c'est vrai pour tous les F. A priori, c'est vrai pour P. Et c'est pour la deuxième qu'il faut justifier. C'est là que je l'ai juste admis. Et c'est un truc que je vais juste insister par que c'est bon à savoir. Bon, à savoir, c'est que le max, le supe, est atteint pour F égalp. Je veux dire donc F i égal pi, quel que soit i. Bon, autrement dit, ça vous pouvez le prendre comme un l'âme indépendant. Quand vous regardez factorial n sur, on va l'écrire comme ça, n1, etc. nk, P1 puissance n1, etc. Alors F1 puissance n1, non P1 puissance n1, etc. Pk puissance nk. Dans le cas où pi est égale à mi sur grandaine, et maximal pour ni égale mi, quel que soit i. Une manière équivalente, Wn de F, P puissance nF est maximal pour F égalp. L'âme complètement indépendante de toutes questions d'entropie et tout ça. Et qu'est-ce qui vous dit ce l'âme ? Imaginez que vous êtes en train d'estimer une distribution inconnue qui est selon une certaine loi F, F1, etc. Fk. Ça, c'est les fréquences d'apparition de valeur 1, valeur 2, etc., valeur k. Vous ne connaissez pas le vecteur fréquence F selon lequel sont tirés vos observations, mais tout ce que vous voyez, c'est l'observation P, et vous vous demandez, connaissant P, qu'est-ce que je vais choisir comme valeur probable de F ? Dans une approche de maximum de vraies semblances, si ça dépend d'un paramètre theta, vous allez choisir le paramètre theta tel que la valeur de la fonction de vraies semblances, la densité, soit maximale, le theta qui maximise l'observation. Ici, l'observation, c'est tout le vecteur. Et ce que ça dit, ce l'âme, c'est que si vous appliquez le maximum de résidence à cette situation ou le paramètre, c'est la probabilité tout entière, votre estimateur, il est trivial. Le meilleur choix que vous puissiez faire, c'est prendre F égalp, prendre les fréquences égales à celles que vous observez. Le meilleur choix en termes de maximum de vraies semblances pour le vecteur inconnu F selon lequel ont tiré grandaine observation et F égalp. Autrement dit, si vous voulez, l'estimateur, si vous voulez, F chapeau de P égalp. Je peux l'écrire comme ça. Paramètre, c'est F ici, c'est-à-dire toute la loi. P, c'est l'observation. Et le meilleur choix que vous pouvez faire, c'est juste le choix trivial où je garde le truc égal à lui-même. Alors, le l'âme, je vais juste esquisser la démonstration ou juste dire, pour la preuve du l'âme, on prend le max. Prenons le meilleur N. Alors, pour tout y remplacer N i par N i moins 1 et N j par N j plus 1, pardon, pour tout y et j et N j est un moins bon choix et écrire les équations correspondantes et en déduire et vous allez trouver, je donne la solution N j M i par B N i M j inférieur au égal à N j M i plus M i. Et comme ça, c'est quel que soit i, quel que soit j. Et puis avec un peu de travail, vous en déduirez que N i égale, et ça, c'est quel que soit i, quel que soit j. Et avec un peu de travail, vous en disiez que N i égale est mi, quel que soit i. Autrement dit, vous faites un raisonnement de type équation de, vous faites des variations selon chaque direction et vous vérifiez que vous cherchez à établir l'équation qui correspondrait à gradient F égale 0 si vous regardiez le maximum d'une fonction ou gradient F égale constante si vous regardiez le maximum d'une fonction sous une contrainte que la somme des composantes est égale à une certaine constante. Ici, vous êtes en train de faire un raisonnement juste de type calcul des variations avec plusieurs variables. Sous contrainte, la seule subtilité, c'est que c'est avec des entiers au lieu que ce soit avec des réels. Voilà. Alors, donc ça c'est, ça c'est, ça c'est bon à savoir. Et une fois que vous avez ça, comme j'avais dit la dernière fois, vous en déduisez la majoration qui est extrêmement bonne de, extrêmement bonne qui vous dit que la conclusion de tout ça, ça vous dit que quand vous regardez un Suren log WN de P sans cadre entre moins somme des FK log FK et moins somme des FK log FK, alors c'est moins au plus, c'est moins, moins K log de N plus 1 sur N. C'est une estimation exacte, pas asymptotique. En un sens cette deuxième preuve, elle est, elle est bien meilleure que celle basée sur Stirling parce qu'elle est plus économe et elle donne un résultat exact. Ok, donc ça c'était pour revenir sur, sur cette question sur laquelle j'étais allé un peu vite. Question, tout va bien ? Donc ça c'est le truc, la bonne façon de le retenir c'est si je veux estimer une loi, une loi toute bête, un vecteur de probabilité inconnue et que j'applique le problème du maximum de vraie semblance aux observations ou comme paramètre je prends toute la loi, eh bien l'estimateur est trivial, le meilleur choix que je puisse faire avec le maximum de vraie semblance c'est prendre la loi égale à l'observation. Asymptotiquement on sait que c'est toujours vrai quand elle est envers l'infini, c'est le principe de la de la mesure empirique qui converge vers la loi presque sûrement. Ce que ça vous dit ici c'est que si vous le faites avec le maximum de vraie semblance, vous allez prendre ça égale par définition d'autre estimateur et c'est cohérent avec le fait que le maximum de vraie semblance il est asymptotiquement toujours bon, ouais. On start, on suit souvent l'amargument mais on dit que le bas de la semblance est équivalent à l'incidence de K.L. avec l'impirique auquel cas ce que tu dis il découle évidemment. Absolument, je crois que c'est juste une c'est juste une reformulation mais à la base derrière quand c'est discret il y a ce petit l'âme, il y a ce petit l'âme qui est un truc incontournable avec juste des entiers. Et ici ce qu'on trouve c'est une divergence, quand on le réécrit avec les pk derrière ça va donner la divergence. Alors on va arriver maintenant, on va arriver maintenant au coeur de l'affaire sur la rencontre entre différents domaines, j'avais une grande brosse, une grande, ah elle est là, 1, 2, 3, 4, 5, il y a 6 brosses ici. Alors chapitre 4 rencontre, donc rencontre entre courbure, information, transport optimal. Donc il s'agit de mettre les 3 ensemble et c'est une rencontre qui s'est produite à la fin des années 90. Et je vais commencer par parler de quelques précurseurs. Premièrement, Martin, Cataline Martin, 1996, inégalité de concentration via le transport optimal. Concentration c'est le phénomène par lequel presque tous les points sont pas trop loin d'un ensemble de mesures strictement positives ou de manière quantifiée, si je prends un ensemble de mesures disons ennemies, les points sont jamais très loin de cet ensemble et c'est l'un des domaines qui a lancé la concentration de la mission des questions, qui a lancé un lien entre courbure, inégalité géométrique et tout ça avec en particulier l'éviche et l'inégalité de l'évigromove dont je vous parais dans une autre séance. Alors 1996, Martin comprend que la concentration s'est traduit facilement en termes de transport et on peut le comprendre simplement. Imaginez que vous avez un ensemble grand A dont la probabilité est mettons au supérieur égal à un demi. Bon et demandez-vous quelle va être la probabilité de l'élargie de A avec un élargissement taillé epsilon ou A epsilon égal à l'ensemble des x, que la distance de xA est inférieure ou égale à epsilon et on se demande quand epsilon grandit, qu'est-ce que ça devient alors ? Mettons R parce que ça ferait drôle de faire tendre epsilon vers l'infini. Alors comment aborder ça en termes de transport ? Si on a une inégalité du style, distance de transport, alors on va mettre ici W2 entre mu et nu inférieure ou égale à constante racine carré H nu de mu. Mettons pour avoir la bonne normalisation c'est égal racine de 2 sur lambda pour être cohérent avec la gossienne. Gossienne qui serait exponentielle moins lambda x² sur 2 divisé par constante. Bon si on a une inégalité comme ça moralement ça dit à quel point c'est facile ou difficile de transporter toute la mesure mu sur nu en tenant compte de la façon dont mu diverge de nu au sens de la densité et cette quantité là par exemple si on a une information sur la densité de l'un par rapport à l'autre on pourra la contrôler. Donc prenons par exemple nu A est égal à nu restreinte à A donc nu A divisé par nu de A est égal à nu restreinte à A au sens des poibilités. Alors je vais regarder la distance entre mu A et mu A r complémentaire dire que ça c'est majoré par la distance de mu A à nu et la distance de mu A r complémentaire à nu en prenant nu comme intermédiaire. Peut-être je perds un facteur de haut passage mais ça changera rien qualitativement et majorer ça par constante racine de H nu de mu A plus racine de H nu de mu A epsilon complémentaire. Bon qui vaut si on dit pas de bétise racine de logarithm insur nu de A plus racine de logarithm insur alors nu de A epsilon complémentaire qui vaut un moins nu de A epsilon sauf que ce n'est pas un epsilon c'est un R. Bon et comme d'autre part il est clair que pour transporter toute la masse de A au complémentaire de l'élargie de A chaque grain de masse doit parcourir une distance au moins R cette distance est évidemment supérieur au égal à R. Bon alors quand je regarde ça et on inverse on en déduit que nu de A r est supérieur au égal à une certaine quantité la bonne quantité c'est 1 moins exponentiel moins lambda sur 2 fois R moins racine de 2 sur lambda log 1 sur nu de A et un carré en facteur de l'exponentiel. Donc quelque chose qui tend vers 1 exponentiellement vite et même carré exponentiellement vite. Concentration gaussienne. Bon donc ce qu'on voit sur cet exemple c'est qu'une information de type concentration gaussienne on peut l'encoder dans une égalité comme ça qui dit que W2 est inférieur ou égal à constante fois racine carré de l'information relative. Ça a été plus tard généralisé redeveloppé en particulier il ya un théorème plus récent de Gauss-Land qui dit que c'est équivalent d'avoir ça ou d'avoir de la concentration avec des constantes indépendantes de la dimension quand vous regardez le produit tensorisé nu tensor n. Donc c'est une façon efficace fonctionnelle de coder tout un profil de concentration. Donc la morale une inégalité comparant W2 de point nu à h nu est un moyen efficace d'encoder un profil de concentration gaussienne. Comme je vous disais ça a été généralisé et les résultats les plus marquants c'était ce de Nathalie Gauss-Land et puis ça ça démontre rien mais comme traditionnellement la concentration s'était abordée avec des outils liés à la courbure. Le fait qu'il se lien ça indiquait quelque chose d'un lien entre courbure et transport optimal. Deuxième précurseur Macan 1997 qu'on va reformuler le long du transport de l'interpellation géodésique pour W2 donc distance du transport optimal avec exposition 2. On se place dans Rn alors h nu ce que j'avais appelé h nu vous souvenez h nu de nu est égal à l'intégrale de un de rho des nu où rho égale des mu sur des nu et un de r est égal à nr1-r-n. H nu est convex si seulement si grand n est supérieur au égal à petit n. Donc ici c'est quelque chose qui relie les informations le comportement long du transport optimal et la dimension. Ici il n'y a pas de notion de courbure mais une notion de dimension qui apparaît. Alors vous vous souvenez de quand on a fait les inégalités sur la courbure on a vu qu'il y avait des choses des inégalités faisant intervenir le le déterminant Jacobien à certaines puissances on avait parlé de Brun Minkowski évidemment que ça garde un sens même quand la courbure n'est pas là. Alors plus généralement McCan plus généralement vous dit qu'intégrale de u de rho des nu et convex le long des géodésies du transport optimal dans Rn dès que u appartient à une certaine classe de non-linéarité je vais noter ça dCn pour déplacement convex c'est ce qui est convex quand on fait du déplacement long du transport optimal et on va dire que dCn c'est l'ensemble des fonctions u de r plus dans R qui sont continues sur 0 plus l'infini c2 sur l'intervalle ouvert 0 infini vérifiant u 0 égal 0 u convex et tel que une certaine condition est vérifiée pour l'instant c'est juste des choses générales demande que ça va y 0 en 0 que soit convex que soit régulier à l'intérieur pour les pour les r strictement positifs il n'y a rien de particulièrement frappant et la vraie condition structure elle arrive ici et elle dit que r puissance n u de r puissance moins n et convex quand n égal infini ça il faut le lire comme exponentiel r u de exponentiel moins r ou de manière équivalente ou de manière équivalente p de r sur r puissance 1 moins 1 sur n est une fonction croissante de r c'est convex de r avec p de r égal r u prime de r moins u de r et puis c'est encore équivalent une troisième condition qui est p de de r supérieur plus p de r sur n et supérieur ou égal à 0 ou p de de r est égal à r p prime de r moins p de r donc les trois conditions sont équivalentes c'est un jeu d'écrire les différentes fonctions et il y a des interprétations thermodynamiques si u correspond à la densité d'une énergie interne p ça correspondra à une pression et on peut le faire en regardant les formules thermodynamiques sur les liens entre pression et énergie alors ça pas clair ce que ça veut dire dans mon livre je l'appelle la pression itérée faute de mieux parce que c'est le même processus qui va de u à p et de p à p2 en tout cas les trois formulations sont équivalentes et selon les contextes c'est l'une ou l'autre qui est la plus utile et ce que Macan montre donc c'est que dès que la non linearité est dans cette classe et donc l'exemple typique c'est un lui c'est l'exemple lui c'est le représentant si on veut emblématique de DCN et bien la propriété est vrai bon un autre une autre remarque une autre remarque qui est clair quand on qui est clair c'est que les classes DCN évidemment elles dépendent de la elle dépendent de n et elles sont de plus en plus petites fur et à mesure que n grandit plus contraignant ces décès infinis le plus grand cdc1 et donc vous avez comme ça plus la dimension grandaine est élevée moins vous avez de fonction ce qui est logique parce que ça correspond si on veut à des contraintes supplémentaires à des ouais à des contraintes je c'est exactement le contraire de ce que je voulais dire fur et à mesure que votre borne n augmente on s'attend à ce que les choses soient de plus en plus soient de moins en moins contraignantes et ça correspond à une classe de fonction qui est de plus en plus resserré classe de fonction des scènes plus en plus resserré de moins en moins de conditions de moins en moins de de fonctions qui sont convexes bon ça c'est le deuxième préliminaire et puis on va mentionner un troisième préliminaire important qui arrive aussi à la fin des années 90 qui lui est plus diffus dix dix milieux à fin des années 90 des preuves basées sur des arguments de transport des preuves de choses qui d'habitude se prouver sans transport preuve d'inégalité fonctionnelle on va citer macan encore on va citer corps d'héro hérosquin et puis moi et puis d'autres je vais donner un exemple exemple prouver ce qu'on appelle souvent le théorème de bacryémerie dans herène à savoir que si vous avez un potentiel sur herène qui est convex l'ambda convex avec l'ambda striclement positif alors pour toute probabilité muches h nu de mu inférieur ou égale à nu de muche divisé par de l'ambda avec nu est égal à exponentiel moins v de x dx et nu une mesure de probabilité sur herène autrement dit ingénie de ce bolèfle logarithmique avec paramètres l'ambda alors comment on va faire ça par transport allons-y donc la preuve ben je prends une densité alors les sont tombés le cas où il ya de la singularité de façon on aura des quantités infinies donc on garde que re de x dx et on regarde le transport optimal vers exponentiel moins v de x dx bon nu est normalisé bien sûr pour être une mesure de probabilité ce qui change rien ça revient à ajouter une constante à v ce qui changerait à une égalité à gauche donc sans perte de généralité z égal alors on écrit on écrit le l'inégalité de transport qui va avec ça et ça va nous faire re de x égale exponentiel moins v de t de x que je vais écrire ouais je vais créer ça comme ça d'abord déterminant d t de x où t transport et je vais écrire t de x égale x plus gradiant psy de x pour insister sur psy gradiant psy qui est le déplacement l'égalité d'identité jacobienne on passe au log log gros de x est égal à moins v de x plus gradiant psy de x plus log déterminant identité plus dé de psy de x bon d'où log de gros de x sur exponentiel moins v de x je suis en train de former ici la densité relative entre la mesure muche et la mesure nu est égal à v de x moins v de x plus gradiant psy de x plus log déterminant identité plus et si un psy de x c'est le moment d'appliquer l'hypothèse de convexité sur v donc ça ça va être inférieur ou égal à moins grad de v de x scalaire gradiant psy de x moins lambda sur deux gradiant psy de x carré et je vais appliquer là-dessus l'hypothèse d'uniforme convexité et puis maintenant il y a le logarithm déterminant lui je vais le majorer par la trace de ce qui est à l'intérieur est ce qu'il y a une constante non je crois que c'est bon ouais là je suis en train de regarder l'augurite du produit des 1 plus lambda i et de majorer ça par la somme des lambda i alors une fois qu'on est là ah oui et pardon et ici le fait que ce soit symétrique est important ici on utilise ici une psy symétrique donc c'est là d'avoir la bonne structure de l'application de transport est utile alors c'est pas que psy soit convainc c'est que identité plus voilà on utilise gradiant psy symétrique et identité plus cnc positif sinon effectivement en train de mélanger des valeurs prop négatives et positives bon alors maintenant qu'on en est là qu'est ce qu'on va faire ben on va intégrer intégrale de rhodo x log rhodo x sur exponentiel moins v2x dx est inférieur ou égal à moins intégrale rhodo x grad v2x scalaire alors est-ce que tant des peut-être que je peux sucer bon je suis bien comme ça gradé en psy de x moins lambda sur deux l'intégrale de rhodo x grad psy de x carré plus l'intégrale de la place si un psy rhodo x dx oh ici on est dans l'argument formel et c'est une bête intégrale de le bec bête intégrale de le bec et puis on se pose pas trop de problèmes de sa va on en particulier on se pose pas la question de la régularité sur psy ici si on veut le faire vraiment faut faire gaffe parce que la place c'est un psy pas défini partout oui défini presque partout il y a peut-être une partie singulière l'expérience montre que chaque fois qu'elle est partie singulière les inégalités vont dans le bon sens alors comment on va gérer ça ben ici ça je vais dire que c'est pareil que moins intégrale de grade psy de x gradien rhodo et gradien rhodo je vais l'écrire gradien rhodo sur ro foiro je vais retomber sur les pieds alors ah oui si en gros il y a les ingrédients qui sont là alors c'est une bêtise de fait intégration par partie attendez avant de noter ici ici j'ai une intégrale je prends je prends le morceau qui est ici et le morceau qui est ici donc ça je fais pas je prends les deux morceaux qui sont là et j'ai fixé moins intégrale de rhodo x c'est plus l'intégrale de rhodo x la place si un psy moins grade psy ce qu'elle est gradi en v et je vais écrire alors je vais prendre pour ro je vais prendre ro tel que intégrale de ro des nuches égale 1 ro égale des mues sur des nuches donc ici ça sera une intégrale par rapport à ici ben ça change rien attendez ici je vais faire apparaître l'opérateur qui vient de donner l'intégration par partie quand on ah non c'est bon c'est bon c'est bon c'est bon c'est bon c'est bon non on change pas attendez avant d'écrire le temps de faire converger ça ici je vais mettre des x oui ça a l'air bien ici je vais mettre ici c'est toujours des x c'est bien ce que j'avais écrit et ici je vais mettre exponentiel moins v ici et exponentiel moins v des x ici et puis d'autre part ici je garde moins lambda sur deux intégrale de ro gradi en psy carré ici je reconnais l'opérateur d'intégration par partie l'opérateur la placien qui est associée à la mesure invariante nu donc je vais faire une intégration par partie avec ça donc ça va me faire moins l'intégrale de gradi en psy ce qu'a l'air gradiant ro de x sur exponentiel moins v de x exponentiel moins v de x de x et puis plus lambda sur deux intégrale de ro gradi en psy carré ici il faut que j'insère un ro ça doit aller ça m'a l'air pas mal plus lambda sur deux intégrale de ro gradiant psy carré et puis maintenant le truc qui est là je vais dire que c'est inférieur au égale à moins lambda sur deux intégrale de alors alors alors alors alors alors il y a un signe qui ne va pas ici c'était un moins plus lambda sur deux intégrale de ro gradi en psy carré sur deux qui simplifie avec ça voilà et si tout va bien ce qui reste là ça va donc il va y avoir un ro et il va y avoir gradiant de ro de x sur exponentiel moins v de x divisé par ro de x sur exponentiel moins v de x avec un carré et puis voilà des x et normal je crois que c'est bon je pense que ça c'est juste et alors il y a le sur deux lambda bien sûr qui vient de l'immigrété de jung bon et si je dis pas de bêtises là on a bien c'est bien ce qu'il nous faut c'est la formation de ficheur avec le bon avec la bonne normalisation sur deux lambda intégrale de gradiant intégrale de ro ici jusque la densité à l'intérieur du log doit être renormalisé doit être divisé par exponentiel moins v de x voilà et notre façon de réécrire ça qui est plus classique ça serait de poser rôte yield égal rôte de x sur exponentiel moins v de x et d'écrire que ça serait l'intégrale de rôte yield de x gradiant log rôte yield de x carré nu de dx ou encore sur deux lambda intégrale de grade rôte yield de x carré divisé par rôte yield de x nu de dx tout ça c'est pareil c'est juste un jeu de réécriture donc si vous faites les comptes si vous faites les comptes dans cette démonstration n'utilisez très peu de choses ici on a utilisé la convexité et puis l'inégalité log dette laplacien après on a intégré on a fait une intégration par partie avec la place et le gradiant psy et ensuite on a fait une inégalité de jung inégalité de jung après avoir écrit intégrale de de fonction qu'est ce qu'on veut dire inégalité de jung par rapport à la mesure avec la mesure rô et jung dans le plus la plus bête quoi cochi schwarz quoi bon donc ici on voit qu'on arrive à faire des choses non triviales la démonstration classique de stérames de bâquerie emmerich elle reposait sur l'étude de la variation seconde de l'information ici il n'y a pas de variation seconde le long de l'équation de la chaleur il y a juste un peu de convexité alors ce bouleif logarithmique ce bouleif logarithmique comme je disais la dernière fois ça a une information à la fois spectrale et isopérimétrique et il n'y a pas de notion de dimension dans ce bouleif logarithmique alors pour se convaincre qu'on peut aussi avoir des inégalités dimensionnelles on va faire on va faire ce boulef autre exemple de ce boulef classique par transport alors rô une densité de probat sur rn prouvons que intégrale de grade rô sur rô puissance p ici puissance 1 plus 1 sur n fois rô et supérieure au égal à k strictement positif et comme j'avais mentionné la dernière fois c'est équivalent au ce boulef classique qui dit que u lp étoile est inférieur ou égal à constante u lp équivalent juste que en faisant le changement de fonction sur u en fonction de rô bon alors celui là on va le faire ceci on va il y a plusieurs façons de l'aborder ceci on va le faire avec un raisonnement explicite de variation le long du transport optimal alors on va se donner rô 0 et rô 1 rô 0 égal rô rô 1 quelconque densité de probat et on introduit le transport optimal et l'interpellation optimale rô t 0 t 1 interpolation au sens w2 entre rô 0 et rô 1 allons-y formellement des surdétés intégrale de rô 1 moins 1 sur n avec la dépendance en temps c'est pareil que 1 moins 1 sur n fois l'intégrale de rô t puissance moins en sur n des ronterros des ronterros vérifie l'équation des ronterros plus d'hivergence de rô gradient psy égal 0 on se souvient avec psy qui évolue selon amilton jacobi pour avoir un champ géodésique là on est en train d'écrire que rô est transporté par une famille de géodésique et donc ça ça va me donner moins un sur n fois alors que je réfléchis alors d'abord on le remplace tout bêtement moins un moins en sur n intégrale de rô t puissance moins en sur n d'hivergence de rô gradient psy et ensuite on fait l'intégration par partie pour trouver plus un sur n un moins en sur n intégrale de rô t puissance moins en moins en sur n gradient rô rô toujours et dépendé gradient psy et il y a une simplification entre l'expérience ici pardon sur l'ensemble bien moins il y a moins qui vient de à ta raison il y a un moins qui vient d'ici un moins qui vient de là encore moins en sur n un moins en sur n intégrale de rô puissance moins en sur n gradient rô ce qui a l'air gradient psy donc ça c'est la façon dont la fonctionnelle évolue l'onde du transport optimal et puis on va regarder maintenant la dérivée seconde et je vous laisse faire le calcul ou croire et c'est lié au c'est lié au à ce qu'on a vu précédemment ma canne et tout ça que la variation seconde de intégrale de rô un moins en sur n est inférieure ou égal à 0 de façon c c'est le résultat que je vous ai cité pour ma canne il y avait le signe moins quand j'avais cité le résultat bon quand j'ai une fonction dont la dérivée seconde et négative je peux contrôler la valeur en 1 par fit 0 plus un fil prime de 1 fil prime du 6 prime de 0 pardon t égale 0 t égale 1 alors on écrit ce que ça donne et on trouve que alors intégrale de rô un puissance un moins en sur n est inférieure ou égal intégrale de rô 0 puissance un moins en sur n plus un moins en sur n plus un sur n un moins en sur n il faut un moins un fois l'intégrale de rô 0 puissance moins en sur n gradiant rô 0 ce qu'a l'air gradiant psy bon pourquoi pas et donc on va majorer ça faire un regard la rô 0 puissance un moins en sur n plus un sur n un moins en sur n alors qu'est ce que je vais faire ici tout ce que je sais sur quoi je sais donner un sens c'est intégrale de rô gradiant psy alors on va mettre ici puissance p gradiant psy puissance p si on considère l'interpolation pour wp ici j'ai mis w2 mais mettons que ce soit un wq bon donc on va le faire apparaître là et donc je vais me retrouver avec l'intégrale de rô 0 gradiant psy puissance q 1 sur q et puis un autre truc qui sera l'intégrale de rô 0 alors que je n'ai pas de bêtises voilà rô 0 gradiant rô 0 sur rô 0 puissance 1 sur n puissance p 1 sur p est ce que c'est raisonnable si c'est le wq les poissons de transport vous avez d'étéro il faut mettre une l'oignée à état en gradant psy tu as raison on va se contenter du cas on va se contenter du cas 2 ça me démontrera un des sobolefs alors tout tout tout tout tout tout gradiant psy ici carré 1 sur 2 ici carré 1 sur 2 alors est ce qu'on y est presque presque presque presque puissance moins 2 le 2 1 plus 1 sur n il est bien le rô 0 et le rô 0 moins 2 rô 0 il y a encore quelque chose qui cloche ah oui oui ici j'ai mis rô 0 et donc là j'ai divisé par rô 0 et donc ici il y a un plus d'insuréne je crois que c'est ça est ce que ça correspond c'est parfait c'est bien ça ici en fait j'ai multiplié par rô 0 et divisé par rô 0 et donc quand je fais le cauchy schwarz il y a rô 0 qui est ici rô 0 qui est là c'est vrai mais ici il y a le 1 sur rô 0 qui est resté de là bon alors on y est presque on y est presque ici c'est w2 entre rô 0 et rô 1 bon et vous allez me dire c'est pas vraiment ce que j'avais annoncé on va s'en sortir avec une astuce on a ainsi montré intégrale de rô 1 moins insuréne inférieur au égal intégrale de rô 0 un moins insuréne plus insuréne un moins insuréne w2 de rô 0 rô 1 fois intégrale de rô 0 gradient rô 0 sur rô 0 un plus insuréne carré rassile carré et maintenant on va appliquer ça à rô 0 indice lambda exposant lambda est égal à lambda puissance n rô 0 de lambda x en faisant une dilatation et on va faire tendre lambda vers l'infini donc c'est comme si on était concentré vers un dirac alors et qu'est ce qui va se passer quand l'ambdate envers l'infini intégrale de rô 1 puissance un moins insuréne lui il bouge pas ce terme là il tend vers 0 rô 0 lui même tend vers un dirac ça correspond à ce qu'on avait dit quand on prend une fonction soulinière qu'on l'applique une masse de dirac on trouve 0 ici le w2 de rô 0 rô 1 ça va être tout simplement intégrale de rô 1 de y y carré et tout ça avec une racine carré qui est la distance entre le dirac en 0 et rô 1 et ici ça ça bouge pas racine carré de l'intégrale rô 0 gradiant rô 0 sur rô 0 1 plus insuréne car cette quantité là est invariante par le changement d'échelle rô de une rô lambda bon et bien voilà d'où on a la conclusion sur rô 0 1 plus insuréne et supérieur égal à une constante indépendante de rô 0 alors là je l'ai fait avec p égale 2 et on peut faire de même toute valeur de p non du lot plus de soin sur l'équation en béronterre ou c'est le moment de rô 1 rô 1 tu t'en fous il est il est fixé toi qu'il a choisi comme tu veux après on peut optimiser un rô 1 si on veut et ça donnera les constantes optimales un peu ensuite c'est en fait c'est gréant si zéro gréant si zéro on utilise seulement ou seulement autant zéro voilà c'est ça mais il faut aussi utiliser que l'interne rô graviant si carré des compagnies temps si tu regardais la dérivis seconde ça jurerait mais une fois que t'as une fois que tu connais la con la concavité du bidule tu utilises seulement la dérivis au temps t égale 0 effectivement c'est un psy c'est le psy zéro quoi c'est juste pour dire que l'interne rô 0 graviant si zéro carré est aussi égal c'est pas complètement évident voilà voilà alors dis pour ça c'est pour dire oui mais c'est le problème de monge c'est la définition du problème de monge w2 de rô 0 rô 1 alors nous y voilà presque donc ça c'est juste deux exemples ce boulef logarithmique par transport ce boulef classique par transport et ainsi de suite et c'est des inégalités pareil qui classiquement font intervenir de la courbure des bornes inférieures sur la courbe d'hôtes comme ça donc ça ça présageait aussi le fait qu'il y avait un lien direct alors les deux articles qui réalisent vraiment la rencontre d'abord il y a un article très influent de Jordan kinder l'erreur auto qui payait pas forcément tant de mines que ça au départ et elle fait eu le temps de le digérer et donc cette date de 1998 et je vais résumer en une phrase en disant le flot gradient de l'énergie libre en distance w2 et l'équation de fauteurs planques et oui c'est drôle alors on va dire que plus tard donc là c'est fait dans rn et puis par la suite ça a été généralisé à un degré inouï c'est vrai en gros toujours et on va donc donner un sens alors vous souvenez que l'énergie libre c'est ce qu'on va appeler intégrale de ro logro plus intégrale de ro v on va payer ça e de ro et c'est la même chose que h nu de ro nu nu égal exponentiel moins v de x dx et donc ce que ça dit c'est que si on construit le flot gradient par discretisation en temps qui est la méthode la plus populaire alors comment on fait ça on fixe taux strictement positif un pas de temps et on pose ro k taux et défini de manière récursive ro 0 taux égal ro 0 et puis ro k plus un taux minimiseur de e de ro plus w2 de ro k taux ro carré sur deux taux voilà et ensuite on dit que ro k plus un taux on appelle ça ro taux de k plus un taux et ro taux k ro taux de kato on prolonge pour avoir un ro continu par morceaux rô taux continu par morceaux et puis on fait tendre taux vers zéro rô taux converges vers solution de dérompérot égal la placien ro plus divergence de ro gradient v ceci étant l'opérateur divergence duale l'opérateur sous forme divergence duale de l psi égal la placien psi moins gravé scalar gradient psi opérateur kj sur les mesures de probabilité alors on voit pas de géométrie explicitement mais là mais c'est un tournant cet article constitue un tournant car il s'intéresse à la géométrie de p2 de w2 sous un angle riemannien parce qu'on dit flot gradient derrière il y a une métrique riemannienne sous-jacente classiquement plus tard on se posera la question de la nature de cette géométrie jusqu'à quel point elle est riemannienne est-ce qu'elle est singulière et tout ça donc là c'est un tournant et l'autre article c'est celui que j'ai publié en 2000 avec auto il a mis 2000 qu'est ce qui montre un ensemble de résultats d'abord LSI lambda implique inégalité à la grande lambda avec préservation donc de la constante la constante lambda il montrait surtout qu'il y avait un lien entre le monde de la courbure dimension et le transport optimal et puis l'établissé que quand on a courbure dimension 0 infini on a une inégalité en h nu inférieur au égal à racine de w2 nu fois pardon pas racine carré ici w2 fois racine de nu je vais mettre ça comme ça avec des nu et puis suggérer que cd de k infini c'est juste avec k doit pouvoir se lire dans la convexité de h nu dans les propriétés de convexité de h nu et c'était le démarrage le démarrage d'une idée qui a été développée et redeveloppée de lire la géométrie de l'espace dans celle de p2 de x la géométrie de l'espace x dans celle de p2 de x précisément lire la courbure dimension dans les propriétés de convexité de h nu en géométrie w2 et les outils techniques qui permettaient de faire ça ont été développés dans la foulée par cordero hérosquin macane schmuckenschläger d'une part je tourne et faune renaisse d'autre part ok c'était là c'était la rencontre alors on va donner le je vais donner le résultat maintenant de la rencontre et le présenter sur le cas le plus simple qui est le critère cd de 0 infini et puis après on va compliquer progressivement pourquoi cd infini parce que c'est le plus simple on revient en arrière on se souvient de l'une des façons de présenter cd de 0 infini qui est de dire que si l de tx est égal à moins log du jacobien autant t pour le problème de transport issu de x le long d'une géodésique avec un en souviens on avait regardé gama de t égal exponentiel x grapxil x t grapxil x bon et ben le critère c'était l point point supérieur au égal à zéro ça c'était le critère typique de courbure dimension 0 infini aucune borne sur la dimension de l'espace et la courbure de richi qui est positive bon alors ça c'est un critère ponctuel parce qu'il est le long d'une géodésique ou si vous voulez ou le long d'une famille de géodésique paramétrés par x bon départ bon et la question ça va être d'intégrer ce critère intégrer cette inégalité et le transport optimal le permet réécrivant le jacobien en termes des densités du transport optimal bon bien sûr on a roté de tt de x jt de x est égal à rho 0 de x où tt de x est égal à transport autant t et x x t gradé en psi de x ça c'est l'équation jacobienne qui va bien avec le transport et quand j'interpelle entre rho 0 et rho t c'est ça qui se produit bon ben de là je déduis que j de tx est égal à rho 0 de x sur rho t de tt de x et ça là ça dépend pas du temps donc le jacobien c'est comme si on regarde l'inverse de la densité le long du transport juste l'équation juste l'équation jacobienne et ben traduisons ce que ça fait en coup de logarithm donc l de tx est égal à moins log j de tx est égal à moins log rho 0 de x plus log rho t de tt de x donc l de tx convex en t équivaut à dire que log rho t de tt de x est convex en t et ce pour tout x bon et ben j'intègre maintenant ça implique log rho t de tt de x mu 0 de dx et convex en t j'intègre une famille de fonction convex de x c'est un paramètre et ça c'est la même chose que l intégrale de log rho t de y tt mesure image mu 0 de dx formule du changement de variable et donc ça c'est la même chose que l intégrale log rho t de y mu t de dx donc c'est ici que tout se joue on intègre pas cette inégalité contre n'importe quelle mesure on interle contre la mesure rho 0 la même mesure qui fait que quand changement de variable va jouer ça va reconstituer rho t muté partie du tt ici va reconstituer le muté l'autre partie reste ici et on se retrouve avec h de muté fonction h de bolsman et donc on a bien formellement ici ça y est on a fait le truc si c'est si c'est effectivement courbure positive alors la fonction h est convex en t et derrière tout ce qui reste à justifier c'est juste un problème d'analyse est ce qu'on a le droit d'intégrer est ce qu'on a le droit de dériver tout ça peut-on faire le chemin inverse vous allez me dire maintenant inversement si je sais que h est convex comment revenir à la convexité de l alors cela que c'est des 0 infinies un pic h nu convex faire le chemin inverse la réponse est oui par exemple en fixant une géodésique minimisante rho 0 très concentré près de x rho ici et une autre rho 1 très concentré près de y de sorte que l'interpolation écrit muté 0 t1 sera à peu près diraq pris sur gamma de t je visite minimisante on va l'appeler gamma et grader en psy sera à peu près égal à la vitesse initiale à la vitesse de la géodésique gradie en psy t après la vitesse gamma pointé bon et quand on écrit quand on écrit les inégalités on va trouver que trouvera alors dans la limite et ben moins log du gt de x à une que la dépendance sera comme ça plus des fonctions qui dépendent que de x que je mets là juste comme ça quand on regarde ce que devient quand on regarde ce que devient l'information l'anthropie à peu près égal à ça moralement on peut dire que musero joue le rôle de quelque chose qui moyenne l'information dans l'espace comme une fonction peste entre les distributions plutôt là c'est plus serait plutôt musero et mu 1 disons le couple musero mu 1 et le fait qu'on puisse regarder toutes les directions est lié au fait que toute fonction psy assez petite et des deux sur deux convex n'importe quelle fonction psy je peux l'interpréter comme la fonction qui correspond à un déplacement optimal et regarder si j'ai une information le long des le long des géodésiques transport optimal regardez ce qui se passe dans cette direction psy alors le théorème correspondant celui ainsi soit mg nu variété riemannienne avec nu ddx égal exponentiel moins vdx volume ddx alors cd de zéro infinie et vous souvenez que ça ça s'est écrivé richi plus essienne de v moins grade v tend soeur grade v sur n moins n grand n moins n pardon rien du tout ici super regal à zéro cd de zéro infinie est équivalent à dire que pour tout musero et mu 1 appartenant à p2 de m on va les mettre à support compact pour éviter de plus en nuits à l'infini il existe muté alors c'est pas qu'il existe mais la géodésique et et minimal la géodésique alors je vais les prendre absolument continue ici sinon de façon mon entropy sera infini la géodésique muté 0 t1 en distance w2 vérifie d2 sur dt2 h nu de muté et supérieur au égal à zéro voilà alors ça ça paraît beaucoup plus compliqué que ça mais ça c'est hyper stable alors que ça c'est beaucoup plus subtil et donc ça c'est une formulation synthétique de cobo richi positive dont il est devenu plus en plus clair au fur et à mesure que ça a été étudié qu'elle remplissait tout le cahier des charges cd de zéro est fini et maintenant arrive les points plus subtils l'incorporation de k et n que comment traduire cd de k n première remarque qui vient à l'esprit c'est de prendre n en compte par la non linearité dans cd de k n on a des inégalités différentielle on se souvient sur d qui était égal à j puissance 1 sur n dans les notations au lieu de moins log g donc au lieu de regarder log on prend une puissance et cela revient à remplacer r log r par celui que j'avais appelé nr 1 moins r moins en sur n etc autrement dit regarder des inégalités sur une nu de mu pour u appartenant à la classe dc n de macan d'où l'idée cd 0 n se lira par nu de mu convex en t convexe le long de l'interpolation et cette fois pour tout tuches appartenant à dc n bon donc ça c'est l'idée changer la classe de non linearité au lieu de l'entropie ce sera typique au lieu de l'intégrale de rôle au gros typiquement ce sera moins l'intégrale de repuissance un moins en sur n ce qui est équivalent à sa modulo enlever une constante divisé par une constante donc ça c'est l'idée c'est une idée qui marche bien quand vous avez 0 n mais qui marche pas bien quand vous avez k et n alors une autre idée qui vient c'est utiliser donc quantifier la convexité quantifier la convexité de h nu et donc ça c'est l'autre idée qui vient c'est lire cd de k infinie par le fait que d2 h nu sur dt2 soit superbe égal à k w2 de mu 0 mu 1 carré bon ça c'est une autre bonne idée mais c'est une idée qui marche bien que si vous avez n égale infinie et en fait les cas qui vous compliquent vraiment l'existence c'est quand soit k et non nul soit n est fini autrement dit pardon quand k et non nul et que n est fini autrement dit quand k sur n est différent d'héro complexe bon deux remèdes ont été trouvées la première c'est approche par coefficient distorsion qui revient à écrire une inégalité de convexité sur une puissance du jacobien avec des coefficients qu'est ce qu'on va dire avec des avec des constantes multiplicatives correspondant à la distorsion alors qu'est ce qu'on entend par là dans l'arsenal d'inégalité qu'on avait qui sont équivalents que les unes les autres ça correspondrait à celle-ci toujours avec d2t égal j2t x j'oublie le x puissance 1 sur n l'inégalité c'est d2t supérieur au égal à certains coefficients tôt avec qui va dépendre du paramètre 1-t et qui va dépendre de x et de y fois d 0 plus ce tôt qui va dépendre du lieu aussi de x et de y d1 et voilà et c'est un certain coefficient qui dépend de la géométrie et je vais vous donner l'expression tout à l'heure pas tellement en fonction de tôt mais en fonction de en fonction d'une quantité dérivée et cela on le réécrit de force comme une inégalité de convexité autrement dit d2t supérieur au égal à 1-t fois quelque chose et le quelque chose c'est tôt puissance 1-t de xy sur 1-t d0 plus t fois le quelque chose qui est tôt t de xy sur t fois d21 je me souviens maintenant de ce que c'est que d2t et je passe au et je passe aux densités et puis on va poser bta t de xy est égal à tôt t de xy divisé par t et tout ça à la puissance n à la puissance n c'est ça alors si on incorpore ça et si on se souvient que d2t est proportionnel à 1 sur roté de tt de x à la puissance insurène on trouvera roue de tx puissance moins insurène roue de tt de x puissance moins insurène supérieur au égal à 1-t alors ici ça va être roue de t0 de x sur bta 1-t de xy puissance moins insurène plus t rho de t1 de x divisé par bta t de xy tout ça à la puissance moins insurène et oui pardon et ici le y c'est t1 de x l'image je transporte autant 1 alors le bta ainsi obtenu coïncide avec ce qu'on avait appelé coefficient de distorsion vous souvenez on avait la geodésique ici on avait y ici on avait x on avait quelque chose comme ça et on avait posé bta t de xy est égal à la limite quand r tend vers 0 ou r était la diamètre de la boule ici le rayon de la boule ici limite de nu de alors c'était quoi c'était le ratio entre l'interpollé et la boule de rayon r y divisé par puissance n nu de br du x de br de y voilà voilà et encore s'agit de triturer sa géométrie riemannienne pour voir que les deux coïncide à coup de change à coby alors vous allez me dire qu'est ce qu'on va faire de ça une fois qu'on est arrivé à un truc comme ça ben on va l'intégrer et alors d'intégrer l'inégalité différentielle contre grand pide d gama la mesure qui est portée sur l'ensemble des geodésiques et qui correspond à l'optimum dans le transport optimal et quand on va faire ça avec un truc comme ça il n'y a pas de soucis on va retrouver comme d'habitude un truc qui dépend que de muter parce que ça dépendra que l'évaluation autentée en revanche quand on l'appliquera à ce truc là on va se retrouver avec un couplage entre x et y qui va perdurer et le couplage optimal va se réinviter dans les inégalités alors quand vous faites le quand vous faites le calcul la manip vous arrivez à la formulation l'inégalité clé que je vais vous écrire ici intégrale de u de rotée des nu ça change pas inférieure ou égale là donc ça c'est quelque soit u appartenant à dc n traduisant le fait qu'on est en train de regarder des puissances moins insurènes de la densité intégrale de u de rotée des nu inférieure on regarde un mointé l'intégrale de u de rotée 0 de x divisé par bêta un mointé de x y bêta un mointé de x y et ici le couplage va rester et il y aura un pi de dy par rapport à x nu de dx nu de dy ici nu de dx plus t intégrale de u de ro 1 de x divisé par bêta t de x y bêta t de x y pi de dx alors ici je vais mettre plutôt y c'est plus joli pi de dx sachant y nu de dy alors juste pour qu'on voit sans faire le calcul explicitement d'où ça vient et d'où viennent les probabilités conditionnelles en effet on a un truc du genre intégrale de u de par exemple ro 0 de x sur bêta je ne mets plus le mointé de x y fois bêta de x y sur ro 0 de x et ici on aura un ro 0 de x pi de dy sachant x nu de dx et ça quand vous regardez ce que c'est c'est la même chose que alors nu fois ro 0 c'est pareil que mu 0 donc on a mu 0 de dx fois pi de dy sachant x et quand on écrit pi de dy sachant x par définition c'est la désintégration de pi par rapport à sa première marginale qui est mu 0 et donc ça c'est la même chose que pi de dx dy bon donc ça c'est exactement la même chose que intégrale de u de ro 0 de gamma 0 je met ça comme ça divisé par bêta de gamma 0 gamma 2 1 bêta de gamma 0 gamma 2 1 divisé par ro 0 de gamma 0 fois pi de dy gamma vous voyez dans l'expression on arrive à ce truc là qui est juste une fonction de ro 0 de gamma 0 divisé par le coefficient bêta et quand on a intégré par rapport à grand pi ça a redonné un résultat qui est ce qu'on réécrit comme ça avec une simplification du ro 0 du ro 0 et il vous reste une mesure conditionnelle donc ici on voit bien si il n'y avait pas les coefficients de distorsion les y n'interviendrait pas on s'en ficherait du pi de dy par rapport à x et on se retrouverait avec l'intégral de u de ro 0 de x nu de dx comme comme on avait avant comme il y a les coefficients de distorsion il reste un couplage entre les x et les y et une mesure conditionnelle qui traduit ça bon ça c'est la ça c'est une approche qui a été introduite par Sturm et il reste un truc à régler quelle coefficient de distorsion on prend pour que ce soit une égalité évidemment que soit une égalité utilisable il faut des coefficients de distorsion universelles et vous avez le choix entre deux coefficients de distorsion possible les uns qui sont naturels si on veut et les autres qui sont optimaux détectés cdk n avec les choix qui s'en suivent premier choix naturel ou je vais mettre plutôt d'avoir le choix optimal ben on prend beta t de x y égal beta t k n de x y coefficient de distorsion le vrai qui est sur la sphère et il s'écrit alors dans le cas positif dans le cas ou k est positif sinus de t alpha sur t sinus alpha puissance n moins 1 avec alpha est égal la racine de n moins 1 sur de k sur n moins 1 distance de x y bon ça c'est le vrai coefficient de distorsion sur la sphère dimension n courbure k et puis il y a celui qui est naturel beta y t y y égal beta t on va le noter avec une étoile beta c t star k n de x y et c'est le même sauf que les n moins 1 sont devenus des n donc sinus t alpha sur t sinus alpha puissance n avec alpha égal racine de k sur n distance de x y vous avez le choix de possibilité ces deux possibilités sont rigoureusement équivalentes au niveau des inégalités au niveau de la caractérisation et ça ça traduit une propriété d'auto amélioration des coefficients de distorsion géométrie riemannienne si vous avez un coefficient de distorsion qui est aussi bien que ça alors automatiquement il est aussi bien que ça et ça traduit la structure particulière assez rigide de la géométrie riemannienne et comment moralement c'est quoi le passage de l'un à l'autre une fois que vous savez faire ça pour aller à suicide il s'agit d'enlever la direction dans laquelle il y a dans laquelle il se passe rien la direction du déplacement et c'est pour ça que vous voyez ici il n moins une direction de n donc ce coefficient de distorsion là il prend en compte le fait qu'on sent la courbure que dans n moins une direction sur les n tandis que celui ci il ne prend pas en compte alors pourquoi celui ci il est naturel parce que quand vous cherchez à l'établir c'est celui ci qui vient spontanément et il provient de la caractérisation différentielle d'inégalité de la forme des formes du genre f point point plus lambda f négatif il y a derrière une inégalité différentielle linéaire une gaïté différentielle linéaire que vous arrivez à mettre en conjonction avec les coefficients tauté et que vous arrivez à mettre en conjonction avec les coefficients beta et alors les coefficients voilà voilà ce qui est derrière ça c'est le théorème 14 28 dans optimal transports all the new ce qui est derrière ces coefficients là c'est le fait tout bête que f point point plus lambda f négatif c'est équivalent à dire que f de 1 moins lambda t0 plus lambda t1 et supérieur ou égale à tout un moins lambda f de t0 plus tout lambda f de t1 avec tout lambda de t0 moins t1 est égal à sinus lambda t0 moins t1 racine de lambda divisé par sinus t0 moins t1 racine de lambda donc si vous voulez il y a un chemin il y a un chemin simple et sûr qui mène à ses coefficients de distorsion c'est on regarde l'inégalité qui est vérifiée par le déterminant jacobi à la puissance insurène dans le liste d'inégalité qu'on avait c'était celui-là avec f égal f j'avais appelé d on regarde de là on passe à la représentation avec des coefficients en appliquant ce théorème qui est un bête comparaison avec des solutions explicites avec des sinus et de là on passe à la présentation avec des beta c'est un truc que vous pouvez refaire sans vous sans avoir d'état d'âme tandis qu'ensuite pour aller de là à la c'est plus basé sur une équation différentielle et une équivalence il faut retirer à la main la direction dans laquelle il n'y a pas de transport et vous allez appliquer sur le jacobiens un petit coup d'inégalité de holder ou qui sait quoi à la fin les deux approches seront équivalents dans le cas de géométrie émanienne mais rien ne dit que quand on applique rares espaces non lisses les deux approches sont équivalentes et ça reste l'un des problèmes ouverts irritant dans l'ensemble de la théorie synthétique il y a des raisons de penser que à la fin c'est quand même équivalent alors je termine très vite en donnant une autre approche possible donc ça c'est ça c'est la ça c'est les approches par coefficient de distorsion autre approche possible qui est historiquement est venue après mais qui est d'être respectivement paraît plutôt plus simple alors restez avec les logarithmes et donc l'entropie et modifier l'équation de convexité alors qu'est ce que ça veut dire ben vous vous souvenez que si on travaille avec elle une des façons de caractériser cd de kn c l point point plus l point carré sur n un supérieur ou égal à k gamma point carré le long d'une géodésique bon et c'est l'équation de ricati et je vous avais expliqué là aussi on peut enlever le 1 ou n le transformer en n-1 et d'ailleurs c'est ça qui fait le différence entre l'estimation de bonnet mailleurs sous-optimal l'estimation optimale etc mais peu importe donc on a cette inégalité là qui n'a notre panneau pli et ben on va garder cette inégalité et on va voir ce qui se passe quand on intègre par rapport à mu l point de tx c'est égal la log ro de t ro de t t de x roté de t t de x d sur d t quoi et le l point point quand je l'intègre l point point de tx contre mu 0 d x même calcul que précédemment ça fait d 2 sur d t 2 de l'intégral de roté log de nu ça c'est le même calcul que précédemment que ce passe-t-il maintenant du thème qui est à droite que ce passe-t-il maintenant du thème qui est à droite et ben quand je regarde k fois l intégral de gamma point carré mu 0 d x quand j'intègre sur un transport optimal s'il y a un autre que k fois gradé en psy carré mu 0 d x gradé en psy 0 carré mu 0 d x on sait que ça c'est une constante entre t égal 0 et t égal 1 c'est indépendant et donc c'est k fois w 2 de mu 0 mu 1 carré et ça c'est l'un c'est le deuxième et revanche évidemment il y a le l point carré qui lui s'intègre pas bien sur l intégral de l point carré mu 0 de d x bon il s'intègre pas bien mais il y a une égalité qui va bien aller et l'inégalité qu'elle dispose de que je dis pas de bêtises point carré oui bien sûr je m'étais planté c'est l point point supérieur wéga l point carré puisque gamma point carré c'est pour voir si vous suivez voilà c'est ça l point point supérieur au galel point carré sur n plus qu'à gamma point carré bon alors on va intégrer ça et on va appliquer tout bêtement coche et schwarz pour dire que ça c'est supérieur ou égal donc à un sur n intégral de l point de tx mu 0 de d x carré mu 0 étant une mesure de poignabilité bon et ça c'est un sur n fois d sur d t intégral de roté log roté dénu par le même raisonnement précédemment avec un carré d'où cette approche alternative où il n'y a plus de coefficient de distorsion qui dit on va garder on va tout exprimer en fonction de l'entropie un log quelle que soit la dimension mais c'est la forme de la de l'équation de convexité qui va changer h nu point point supérieur au égal à h nu point carré sur n plus qu'à w2 de mu 0 mu 1 carré et n intervient ici car intervient ici voilà alors il y a d'autres variantes et tout ça mais les trois que j'ai indiqué ici donc soit distorsion avec celui ci distorsion avec celui là où cette inégalité là c'est les trois qui finalement se sont imposés pour donner trois notions synthétiques légèrement différentes de la de la courbure de richey alors cette approche ci on l'appellera c correspondra à ce qu'on appellera cd k n comme là comme dans le cas classique ça on appellera cd étoile k n et celui là on l'appellera cd e k n pour entrepique parce que ça utilise l'entropie quel que soit la quelle que soit la dimension bon et on verra alors dans la dans les courses je vais vous faire un je vais prendre 5 minutes pour faire juste un juste un avant goût les trois sont équivalents sous certaines conditions bon donc là on est presque arrivé à tout ce qu'il nous faut pour faire la pour faire pour boucler ce chapitre sur la rencontre un dernier point cependant un dernier point cependant ce qui a été on va appeler ça condition riemannienne condition riemannienne on va dire qu'elle est surtout due à gili si l'on utilise les critères précédents pour définir des notions faibles de courbure dimension ça marche très bien c'est très général mais c'est peut-être trop général général très bien pour certains problèmes et trop général pour d'autres par exemple et c'est celui là qui faisait tiquer les gens par exemple insuffisant pour avoir le théorème du splitting vous pouvez prendre n'importe laquelle de ces définitions là de ces inégalités là la tourner dans toutes les sauces ça sera jamais suffisant pour avoir un théorème coupé de factoriser votre espace par les jeux des icain finis en courbure positive d'où l'idée d'où l'idée qu'il y aurait une autre condition supplémentaire qu'on peut imposer ou pas c'est comme on veut qu'on peut imposer ou pas et la condition qui vous dit qu'on est riemannien en un certain sens dit juste intégrale de gradient que l'intégrale de gradient f carré intégrale de f carré plus l'intégrale de gradient f carré définit une forme quadratique définie positive forme quadratique surtout c'est ça bon en géométrie riemannienne c'est évident mais ça le distingue de ça distingue de de géométrie non riemannienne alors on va dire que c'est fini là pour ce chapitre lui est juste maintenant faire un petit tableau pour annoncer dont on va parler dans la prochaine séance où on s'intéressera aux espaces cd kn faible on garde en tête que c'est un petit dessin que j'avais fait dernière fois le plus général qu'on s'autorise ces espaces métriques plus réguliers que les espaces métriques à les espaces géodésiques plus réguliers que l'espace géodésique à l'espace géodésique non branchant juste appelé espace non branchant ce dans lesquels les géodésiques ne bifurent que pas et puis que plus réguliers que les espaces plus réguliers que les espaces branchant on avait plusieurs il y a un choix entre plusieurs possibilités voilà les limites d'espace riemannien les espaces de type carton alexandroph toponogorphes plus les espaces finselériens plus réguliers que le finselaire on a rn plus réguliers que riemann on a les riemanniens sont aussi plus réguliers que les 4 plus et plus réguliers à la fois que rn et que les et que les riemanniens on a l'espace euclideen off course alors pour l'instant tout ce qu'on a fait c'était à ce niveau riemannien quand on a fait la théorie quand on a développé établis ingéit et tout ça et maintenant on va se demander quand je vais être plus général qu'est ce que je peux faire pour avoir du cd de kn bon et ici au niveau de l'espace géodésique on va voir qu'il y a trois définitions possibles cd kn cd star et puis le cde qui correspond aux trois inégalités que je vous ai donné là soit avec les coefficients de distorsion soit avec soit avec l'anthropie quand vous avez des espaces non branchants il y a une qui s'impose cd star et les de façon équivalente à cde et les équivalent à la version locale de cd c'est-à-dire quand on impose cd sur des petits morceaux et donc c'est clairement celle-là c'est clairement cette cette notion ou l'autre équivalente qui s'impose et on va voir que dans cette catégorie là dans cette catégorie on peut généraliser beaucoup d'inégalités y compris les vigromov qui nous avaient servi de référence et puis également il y a une catégorie qui s'intercale entre espace non branchant et puis rimanien 4 plus c'est les espaces r cd on va mettre r cd étoile de kn qu'on définit avec cd étoile plus la condition r que sa r plus cd étoile bon et là on peut tout entre guillemets prouver tout le théorème avec le splitting avec la formule de bockner et tout ça le fait de rajouter r permet d'avoir une catégorie qui est plus général que les limites de variété rimanienne ou les espaces 4 mais pas assez général pour inclure les espaces de fince l'air alors ici ceci cela inclut des géométries vraiment non rimanienne comme des géométries finselériennes et cela ne les inclut pas cela exclut des géométries vraiment non rimanienne voilà donc si vous voulez il y a trois degrés de généralité qui vont se dégager premier avec juste espace je disais qu'on sait rien d'autre ben on a le choix il y a les trois et ils sont pas équivalents les uns et autres deuxièmement les espaces non branchant et là on sait que c'est celui là qu'il faut c'est celui là qu'il faut utiliser et puis d'autre part des espaces avec en plus la condition rimanienne où là il y a encore plus de où là il y a tout ce qu'on veut voilà l'idée question ouais oui condition r elle est équivalente à dire que l'équation de la chaleur est linéaire alors il y a juste il y a une subtilité de savoir si l'équation de la chaleur est définie ou pas et le l'idée quand on la pose comme ça on se dit c'est bêta pour qu'on n'a pas fait ça il y a cent ans et ainsi de suite là le truc c'est que c'est pas bêta du tout c'est que quand on combine quand on regarde ça a priori c'est pas bon si je mets juste ça parce que c'est pas stable par convergence de de grommet fausse d'orfe et ainsi de suite mais si on combine ça avec cd alors ça devient stable r plus cd est stable alors que r tout seul est pas stable cd rend r stable et alors ça devient un truc légitime et et effectivement c'est lié au fait que la la chaleur est linéaire et pour le comprendre ça c'est une condition du c'est comme une condition du premier ordre chaleur linéaire si chaleur c'est la dérivée de l'entropie c'est une condition de premier ordre on voit pourquoi ça serait stable tandis que quand on le combine avec l'autre truc la courbure c'est une condition du second ordre et là on comprend le dérivée d'ordre 1 elle est stable quand je suis dans une situation convainc sur un truc comme ça quand j'ai une borne inférieure sur la dérivée seconde alors la première dérivée passe à la limite et donc on a la on a la stabilité donc ce qui était le coût de génie c'était de rajouter cette condition à la condition courbure et d'en faire une condition à part entière et donc effectivement on rajoute la courbure on peut montrer que le full de chaleur est toujours défini ça c'est un très beau résultat d'embrosio d'hélice avare et cette condition là équivaut à dire que le full de chaleur est linéaire oui c'est en fait la définition cde on a l'impression que ça paraît plus adapté à la possibilité d'utiliser des cas il serait variable oui oui oui oui oui on peut disons c'est plus facile on peut toujours manière artificielle gérer des cas qui sont variables au moins dans les définitions en localisant quoi en disant parce que le transport est local en disant que pour des petits points autour de ça on a en associé cela en fait en fait dans le cas dans ce cas là ils arrivent même les donc Sturm, Kuwada, Erbar ils arrivent même essentiellement à obtenir une formule de Böckner une égalité de Böckner avec un cas qui va dépendre qui va varier point à point donc c'est pas tant un problème que ça considérer un cas variable on peut toujours prendre le pire des cas autre question on est ok on est ok bon alors la prochaine fois donc on va faire le chemin à l'envers on va partir d'un espace quelconque imposer les conditions et demander ce que ça ce que ça donne ce que ça donne en termes de régularité en termes de conséquences géométriques sera plus un espace rimanien ça sera un espace métrique sur lequel on imposera qui effiterait telle condition on se demandera quels sont les propriétés de cet espace métrique et comment ils sont stables les uns les autres et ainsi de suite voilà et donc à suivre la prochaine fois début 2016 espace non métrique métrique métrique espace espace métrique espace sera métrique et localement compact complet localement compact et sans doute il faut juste que ce soit avalisé par les grands chefs de l'ihs mais sans doute on fait ça le si on garde les lundi le 25 janvier comme ça on a on a deux mois pour réfléchir tranquillement alors d'espaces de fraîchée d'habitude c'est des alors ce sont d'espaces métriques avant je ne sens pas localement compact et donc ils vont pas ils vont pas s'appliquer là oui parce que là j'aurais bien fait des séances en décembre je vais partir en uruguay chile mexique vous avez je pense pas envie de faire court le 28 décembre non je ne sens pas pourquoi je ne sens pas 4 janvier peut-être c'est un peu tôt après je suis de reparti pour taïwan singapour et quand je suis revenu 25 janvier là je suis là pour mes février pour finir tranquillement de façon il s'agira de repartir à zéro de la définition donc ça marchera bien voilà ok super