 Je suis Bruma Brangier, je vais parler de Nashik Lugria. Nashik Lugria est un concept étudié par Nash et a été fameux et étudié beaucoup par économistes en sciences politiques et biologiques et non en sciences computers, bien sûr. Je vais essayer d'abord de motiver le étudiant de Nashik Lugria pour les sciences computers par vous donner un petit exemple que vous pouvez interroger. Donc, dans cet étudiant, on a un antenne qui est là-bas et il y a quelques laptops qui sont écrits et qui communiquent avec cet antenne sur l'escalier. Donc maintenant, vous devez imaginer que vous pouvez contrôler le pouvoir que vous utilisez pour émettre cet antenne. Donc, au début, j'ai brûlé sur ce graphique. Donc, ici est le bandwidth que vous avez si tout le monde utilise le même pouvoir. Maintenant, imaginez que l'un de vous veut upload un file et il y a plus de bandwidth. Ce qu'il peut faire, c'est augmenter le pouvoir que vous utilisez. Donc, ici vous voyez que le pouvoir a été éclaté et le bandwidth a également été éclaté. Mais il diminuera le bandwidth de l'escalier parce qu'il y a des différences. Donc, bien sûr, les utilisateurs qui sont connectés à cet antenne ne sont pas heureux. Ce qu'ils peuvent faire, c'est de réacte. Mais en faisant la même chose que le red laptop a fait. Et ensuite, vous voyez que le bandwidth est probablement le même que au début. Mais ils sont tous en utilisant plus de pouvoir. Donc, c'est pas mal parce que votre batterie est en train. Et donc, la situation est moins qu'au début. Donc, c'est une chose qu'on voudrait éviter. Donc, on veut trouver un moyen de contrôler le pouvoir que tout le monde utilise. Alors que tout le monde s'appuie et la situation est quelque chose que vous voulez garder et ne deviendrez pas de la situation initiale comme le red laptop. Donc, je veux faire des pictures globales de comment nous voulons dealer avec ce problème. Donc, vous avez un problème présenté. Donc, c'est un exemple d'un problème avec plusieurs agents qui ont différents objectifs. Alors, je vais spécifier ce problème dans des langues formales pour décrire un arena. Je ne sais pas si vous le voyez, mais c'est un modèle, un graph, un jeu en graph, comme un jeu de concurrence ou un jeu de temps. Ce sont les modèles que je vais vous parler. Donc, quand vous avez un algorithme pour vous donner une bonne solution. Donc, une bonne solution pour nous sera le Nash equilibria. Vous n'avez pas d'unité de Nash equilibria dans un jeu. Donc, c'est pourquoi j'ai ici 5 solutions différentes qui sont vraiment différentes. Parce que vous avez en réalité un nombre infinitaire de solutions dans ce jeu particulier. Mais il n'y a que 5 qui sont vraiment différentes dans ce state final dans lequel c'est stabilisé. C'est différent. Alors, je vais choisir une de ces solutions. La première sur la droite est meilleure parce qu'elle utilise moins de pouvoir pour tout le monde. Et j'ai besoin de mon outil pour me donner la toute stratégie qui implique cette equilibria. Et puis je peux impliquer vraiment dans les modèles la stratégie. Donc, c'est ce que nous aimerions avoir. Et bien sûr, la partie vraiment difficile c'est la partie quand vous allez du jeu à la solution. Et c'est ce que je vais parler de. Donc, première notre modèle. Au début, nous étions intéressés dans les jeux de temps. Donc, c'est bien de modèler un système de temps réel. Donc, dans ces modèles, vous avez un state, vous avez des clots. Vous pouvez réciter les clots et comparez-les à des constants. Donc, par exemple, Y est plus grand que 23. Donc, ce n'est pas un automatique de temps. C'est un jeu de temps. Vous voyez que les transitions sont d'une couleur rouge ou bleue. Donc, les transitions sont contrôlées par les joueurs. Donc, la transition rouge est contrôlée par le joueur rouge et la transition bleue par le joueur bleu. Et vous pouvez avoir autant de joueurs que vous voulez. Ici, je n'ai que deux joueurs. La façon dont c'est joué est de mettre un token dans les states initiales. Puis, les joueurs choisissent un délai et une transition qui est leur couleur. Donc, par exemple, les joueurs bleus choisissent un délai de 1.5 et la transition qui est en train. Et les joueurs bleus choisissent un délai de 2 et la transition qui va à la droite. Entre toutes ces actions qui sont données par le joueur, vous avez le petit délai. Donc ici, c'est 1.5. Donc, vous avez la transition rouge à la gauche et vous movez le token. Vous updatez les clois et ensuite, vous continuez le jeu et ça vous donnera un joueur infinit. Si vous savez du temps automatique, vous savez de la construction regionale et en utilisant la même chose, vous pouvez transmettre le temps dans un jeu concurrent qui est finit. Donc, je ne vais pas détailler la construction, mais vous devez savoir qu'à l'aide d'une délai, vous choisissez un intervalle qui correspond à la régionale. Donc, ce jeu est finit. C'est un jeu concurrent parce que les joueurs choisissent des actions en parallèle à la même time. Mais ce que il s'agit de ce jeu concurrent est non déterminant et je vais parler un peu plus de cela plus tard. Donc, ce jeu concurrent est formelé. Donc, vous avez des études. Donc ici, en fait, je vais modéliser le jeu que j'ai parlé au début sur le contrôle de pouvoir. Donc, ici, les études représentent le pouvoir que chaque joueur utilise. Donc, 0, 0 signifie qu'ils n'utilisent pas pas de pouvoir à tout. 0, 1 signifie que le second joueur utilise un peu de pouvoir et 2 un peu plus. Donc, dans cet exemple, je n'ai encore que deux joueurs mais vous pouvez avoir beaucoup plus. La action dans ce jeu est d'aider le pouvoir que vous utilisez ou d'aider le même. Nous avons une fonction qui décrive les actions qui sont éloignées pour chaque joueur. Donc, si vous n'êtes pas au maximum, vous pouvez either lever ou rester au même temps et si vous êtes au maximum, vous pouvez seulement rester au même pouvoir. Donc, 2. Vous avez un table de transition qui décrive d'une state et une action pour chaque joueur qui est la prochaine state. Et et puis, vos stratégies dépendent sur la séquence des states que vous avez vu depuis. Donc, en particulier, ici, nous voulons leur dépendre seulement sur les states et pas sur l'action de chaque joueur. Donc, dans un sens, ils sont invisibles. Donc, c'est particulièrement important si vous voulez modéliser les jeux de temps parce que ils choisissent en parallèle leur délai et vous choisissez l'action qui était la première. Mais si vous voulez imaginer ça dans la vie réelle, vous n'avez pas d'aider de savoir quel était le délai qui était choisi pour le joueur qui a le plus grand. Vous avez seulement vu l'action du petit délai. Donc, en un sens, l'action de les autres joueurs sont invisibles. Vous avez seulement vu ce qui était l'outil de l'action qui était sélectée avec le petit délai. Donc, nous avons des restrictions sur le problème. Donc, nous avons seulement regardé les stratégies pure nous n'avons pas d'un stochastique des stratégies et nous avons une information perfecte sur le pays. Donc, tout le monde s'occupe les pays avec de l'information et si on essaie de retirer l'une de ces trois conditions, le problème général de l'action national va devenir indécisible. Donc, c'est pourquoi nous en parlons pour maintenant. Donc, le concept de l'action national que nous avons déjà parlé de. Donc, formule, c'est un profil stratégique. Donc, vous donnez chaque joueur une stratégie comme ça, il n'y a pas un joueur seul qui peut changer l'outil de la stratégie. Comme ça, il profite. Donc, vous pouvez le voir formule. Donc, vous avez une stratégie comme ça pour tout le joueur. Si si elle choisit de changer sa stratégie, l'outil n'est pas mieux pour l'air que l'outil de l'outil de la stratégie qui définit l'action national. Donc, j'ai dit que le jeu concurrent que nous allons regarder n'est pas déterminé. Donc, le problème c'est que vous pouvez avoir plusieurs outils pour le même stratégie profil. Donc, nous allons définir un autre concept que c'est le Sud-Ona-Chèque-Ribouillard. Donc, ce n'est pas si différent. C'est juste que quand vous déviérez, vous pouvez également choisir l'outil que vous préférez. Donc, maintenant, je vais parler de le problème de décision. Nous avons donc, c'est nous avons trois décisions différents problèmes de décision. Alors, bien sûr, le plus simple est l'existence. Est-ce qu'il existe dans le jeu Unachèque-Ribouillard? Donc, ce n'est pas toujours le cas parce que nous n'avons pas les stratégies mixed seulement les stratégies pure. Nous aussi avons aussi construire l'existence et les problèmes de vérification. Donc, la vérification vous donne un pay-off pour chaque joueur. Donc, vous dites que chaque joueur est gagné et quelles sont perdues. Et vous voulez savoir si il y a Unachèque-Ribouillard avec cette particular pay-off. Dans l'existence de constrain vous dites que certains joueurs sont perdus, certains joueurs sont gagnés et les autres ne carent pas. Donc, ce sont trois différents problèmes de décision mais nous verrons que, en général, ils ont la même complexité. Maintenant, les objectifs qui nous regardent pour maintenant sont un très simple. Donc, la puissance, la sécurité et les objectifs de Boucher. Donc, pour l'objectif de la puissance, chaque joueur est en train d'acheter quelques études. Pour la sécurité, les joueurs vont essayer d'éviter quelques études. Et pour Boucher, vous êtes en train de voir infinitiously souvent quelques études. Maintenant, je vais essayer de caractériser la nature pour que nous voulons avoir un algorithme pour décider les trois problèmes. Donc, vous devez, dans la nature, vous devez assurer que personne par déviéting peut éprouver son payage. Donc, pour si vous avez un objectif de la puissance, pour exemple, vous devez assurer que dans un état qui est contrôlé par un joueur, il ne peut pas déviéter et visiter son état. Donc, dans un jeu de tournage, c'est très facile. Donc, vous computez l'attracteur et vérifiez que le path de votre outil ne peut pas visiter cet attracteur. Mais ce n'est pas aussi simple dans les concurrents, dans les concurrents. Aussi, quand vous n'avez pas de terminisme et, bien sûr, dans les temps-games, parce que les études ne sont pas contrôlées par un joueur. Donc, vous voyez que, pour exemple, si vous avez deux joueurs qui jouent avec un jeu de pin de match, ils, si le path va en haut, ils peuvent tous changer les réactions pour que le path va en haut. Donc, vous ne pouvez pas réutiliser l'attracteur ici. Donc, c'est le même en temps-games si ils changent un peu le délai. Donc, l'un qui était le plus long, fait le plus court que l'un du premier, ou de l'autre, de l'autre côté, c'est le même chose, vous ne pouvez pas savoir quel jeu est dévié. Donc, si vous avez deux joueurs qui pourraient être déviés par le path, vous devez être sûr qu'ils ne n'ont pas les joueurs qui n'ont pas visité les réactions. Donc, c'est c'est c'est les récroyeurs que vous vous devez savoir qui est dévié ou savoir tous les joueurs qui vont pouvoir déviéer. Donc, dans le cas de Koubio, c'était simple si il n'y a qu'une chose dans le cas de Thornbase, c'était simple si vous avez seulement un, vous devez blamer et l'assurer il se perd. Mais si les deux joueurs peuvent déviéer, vous devez assurer que les deux sont déviés. Donc, ça lead à la notion des suspects. Donc, les suspects sont les joueurs qui peuvent être déviés par votre path. Donc, en début, tout le potentiel est le déviéant potentiel. Donc, les suspects sont tous les joueurs. Mais ensuite, quand vous choisissez le path, vous devez pouvoir savoir un peu plus sur qui sont les suspects et peuvent être déviés. Depuis Nashi Kibuya, vous savez que seulement un joueur à la fois peut déviéer. Donc, si vous avez donné une action, une action profonde, donc une action pour chaque joueur et le path est allé de la façon dont vous l'avez prévue. Tout les joueurs sont suspects parce qu'ils sont les potentiels déviéateurs. Ils seraient pouvoir déviéer plus tard dans le jeu. Dans le jeu de base interne, vous savez que si vous avez dévié à un autre joueur, seulement un joueur qui a contrôlé le jeu que vous venez de, peut changer sa action pour aller aux autres joueurs. Donc, c'est la chose que vous allez déviéer. Donc, comme je l'ai dit l'année dernière, vous devez compter l'attracteur et vérifier que ce jeu n'est pas dans le jeu. Maintenant, dans les jeux non déterminants, j'ai dit que si quelqu'un peut changer, il peut choisir l'attaquement qui est le meilleur pour lui. Donc, quand vous avez une transition qui peut être dans aucun état, vous devez considérer que tous les joueurs sont suspects. En temps de temps, donc, ici, j'ai mis un exemple. Si vous si vous avez une transition contrôlée par un joueur et une transition contrôlée par un joueur rouge, alors, ils peuvent changer leur délai. Donc, il y a deux suspects pour la déviation qui est allée dans le roi état. Donc, maintenant, nous voulons caractériser l'équilibre. Donc, nous avons défendu un système de transition de réplique. Donc, c'est le état et la transition de laquelle vous êtes sûrs que vous pouvez dépasser quelqu'un qui est déviéant sur sa zone. Donc, vous pouvez le faire formelier comme ça. Si quelqu'un déviéant, vous êtes sûrs que l'équilibre n'est pas gagnant. Donc, la computation est assez similaire à l'étracteur de la computation, à l'exception que vous devez maintenir les trahts de qui sont suspects. Donc, comme je l'ai dit, vous pouvez avoir plusieurs joueurs qui sont suspects et vous devez être sûrs que les n'ont pas qui sont objectifs. Donc, les n'ont pas qui peuvent gagner. Et nous avons la caractérisation de Nachec-Lebrouillard. C'est que nous avons un path où les joueurs dans un set P perdent si nous avons un path infinit dans ce système de transition réplique qui visite si l'infini est souvent le state d'un joueur qui est gagnant. Donc, maintenant, nous voulons un algorithme pour décider cela pour donc, c'est pour les objectifs de Bushi et l'un efficace. Donc, en Bushi, je vais donner un exemple. Donc, le couleur n'est pas bon. C'est OK. Dans les jeux de Bushi, vous savez que votre l'objectif de votre profil stratégique va s'endurer dans des compagnons fortes de la jeu. Donc, ce que vous faites c'est que je ne sais pas si vous pouvez le voir clairement. Mais dans ce jeu, vous avez 2 components de la connexion d'air. Vous regardez à quel joueur vous l'avez si vous regardez tous les states des components de la connexion d'air. Vous competez le système de transition de réplique. Donc, vous êtes peut-être qui éliminait des states. Donc, vous vous retirez. Et puis, les components de la connexion de la connexion d'air ne sont pas les mêmes. Donc, vous avez à faire ça de nouveau. Et, au final, si il y a une correspondance entre le système de transition de réplique et les components de la connexion de réplique que vous trouverez, vous verrez que vous avez une connexion de réplique dans ces components de la connexion de réplique. Et ce c'est parce que l'algorithme peut fonctionner en polynomial de temps. Donc, par la compétition de la connexion de réplique et de la connexion de réplique de la connexion de réplique que nous pouvons renforcer la losing. Donc, nous avons un algorithme de polynomial de temps pour les conditions de bichot. Maintenant, nous voulons exercer ça pour exercer ce résultat un peu. Donc, nous défendons un notion de simulation de jeu que je peux illustrer sur quelques exemples. Donc, vous avez deux jeux qui sont différents. Donc, dans le premier jeu, les joueurs A1 et A2 choisissent un numéro entre 0 et 1 et ça nous donne un un outil. Donc, soit le gris, le bleu, ou l'orange. Donc, c'est un algorithme infinit parce que le nombre de actions de chaque joueur est infinit. Et ceci est un jeu finit. Donc, chaque joueur a 4 actions différentes. Et si vous vous prendre un profil action dans ce jeu, vous pouvez faire correspondre à un profil action dans ce jeu. Vous regardez le possible outil où le bleu est suspect, le particular outil où le bleu est suspect. Donc, pour le bleu, vous avez le gris, le bleu et le bleu. Et vous pouvez voir que le bleu est suspect pour la même région dans l'autre jeu. Donc, en fait, ce jeu se similaient à chaque joueur. Et nous avons l'appropriation que si il n'y a pas d'action, dans l'une d'elles, il n'y a pas d'action dans l'autre jeu. Donc, nous utilisons cela pour montrer que dans les jeux de temps, nous pouvons utiliser le jeu de régions, le jeu de régions, nous l'avions. Et c'est c'est compliquant parce que le nombre de régions est exponentiel. Une autre chose que nous voulons faire est spécifier les objectifs avec Bucchi Automata. Donc, nous pouvons faire le produit avec le jeu et montrer qu'ils se similaient à chaque joueur. Et nous aussi avons un résultat exponentiel de temps. Donc, c'est dans l'autre jeu et l'autre jeu compliquant. Et nous avons monté cela par l'un code pour le jeu. Quand Bucchi Automata décrivent l'objectif de chaque joueur une semaine, nous voyons un résultat particulier que nous pouvons nous pouvons utiliser seulement un espace polynomial. Dans des jeux déterminants, nous avons aussi quelques résultats quelques bons résultats qui disent que pour compter le système de régions nous n'avons pas besoin de temps polynomial parce que la table de transition peut être grande. Donc, c'est le summary du résultat. Donc, nous avons Bucchi avec la simple condition pour notre problème. Pour la sécurité déterminant, nous avons et la réchabilité, nous avons un algorithme NP. Et nous avons parlé d'un cas plus général de Bucchi Automata et de temps. Donc, nous avons une implementation de l'algorithme polynomial et nous pouvons aussi résoudre la sécurité et la réchabilité du jeu. Nous aimerions exercer ces résultats pour nos objectifs par donner un moyen général pour adapter l'algorithme pour gagner la région de compétition pour compter la région de compétition pour compter notre équilibre national. Nous aimerions aussi à notre kat en diverses modèles, pour leHello à l'équilibre et à la machine qui s'occupe de l'équilibre, et je l'ai acheté à la fin de ma job. Donc, merci pour votre attention.