 Bonjour et bienvenue sur le stream en français du 34 C3. Je suis Christian avec moi et Yannou et nous allons essayer de traduire ce talk en français pour vous. Si vous avez du feedback ou voulez nous contacter, vous pouvez envoyer un mail à eloarobasec3ligo.org ainsi que contacter à travers le compte Twitter C3Translate ou en utilisant le hashtag C3T. Les journalistes de données sont des gens qui essayent de déduire des informations depuis les méga-donnets. Et une de ces personnes est ici avec nous, Mickael et là, et voici son exposé. Bonjour à tous. J'espère que vous avez bien dormi, pas moi, parce que d'une part je me trouve maintenant devant plein de gens et deuxièmement je m'occupe ici d'un sujet qui mène souvent à des débats très animés. C'est pour cela qu'il y a ce premier dia. Je suis de gauche et j'aimerais me distancier de toutes formes de racisme, sexisme, antisémitisme, xenophobie, islamophobie et tout discours et nœud. Dans le cadre de cet exposé je suis scientifique et j'essaye d'être le plus nôtre possible. J'observe le débat et je ne m'y implique pas. Je ne veux pas ici vous présenter mon opinion politique mais observer celle des autres. Commençons. D'abord je vais vous parler de la méthodologie, pour que vous puissiez voir comment ma recherche a fonctionné et pour que vous puissiez voir comment elle est reproduisible. Il y a une API sur Twitter grâce à laquelle on peut télécharger ou plutôt voir quelles sont les statuts, voir combien de followers ils ont, notamment on a donc une interface grâce à cette API. Il y a un cache entre l'interface et l'API. Donc ça veut dire que quand je fais une requête auprès de l'API, il suffit qu'il va juste la chercher depuis une base de données. Si on se donne du mal après quelques semaines ou quelques mois, on peut avoir plusieurs interfaces grâce aux recherches à long terme. L'idée est que je ne fais pas une requête auprès d'un seul utilisateur mais de nombreux utilisateurs. Il y a ce qu'on appelle un load balancer qui permet d'équilibrer un petit peu les charges. La API Twitter est malheureusement limitée donc je ne peux pas faire un nombre infinie de requêtes par minute. Si j'ai l'autorisation auprès de plusieurs personnes de faire une requête, je peux en faire plusieurs par minute. Ça permet aussi d'équilibrer les charges et ça permet surtout d'avoir un processus un petit peu démocratique. Mon collègue a programmé une interface où on peut dépenser un token. Il y a un code qui nous permet d'envoyer plus de requêtes auprès de l'API. Tout cela va dans le livre NetPolitik, une sorte de journal de bord que nous avons tenu avec mon collègue pour avoir une base de données avec toutes les requêtes que nous avons envoyées. Voilà pour la méthodologie. Correction, NetPolitik est un blog qu'ils ont ajouté. J'ai envoyé 10 requêtes par seconde et par comparaison, si je veux envoyer une requête à 330 millions de comptes Twitter, cela prend 4 jours. En ce qui concerne les fake news, les fausses informations. C'est un thème très complexe. Voici un graphique qui vient de l'Institut pour la nouvelle responsabilité. Ce qui est considéré comme les fake news, c'est à droite. Il y a la désinformation, la manipulation, les fausses informations et à gauche ce qui n'est pas des fake news. Au milieu, il y a le mauvais journalisme, le clickbait, en ce qui concerne la manipulation d'informations à droite. On parle là des images manipulées ou des images avec une fausse légende. Je n'ai que peu de temps donc je ne vais pas trop parler des fake news. Il y en a une dont je vais vous parler que je trouve assez typique. C'est une fake news sur une alerte terrorisme en Suède qui était fausse. Après quelques jours, il y a eu un tweet du ministère des Affaires étrangères en disant qu'il n'y avait absolument pas d'annonce qui déconseillait que les gens aillent en Suède. On peut ensuite réfléchir à faire quelques graphiques qui permettent de visualiser un peu ces fake news. Ici sur l'axe des X vous avez le temps qui va du 2 mars 2017 au 9 mars 2017. En bas vous avez les fake news et en haut vous avez les tentatives de contradiction de ces fake news. L'avantage et qu'on ne voit pas seulement combien de tweets ont été publiés mais surtout l'impact de ces tweets. Si il y a un tweet et personne ne le retweet, il y a juste un petit point. Par contre s'il y a beaucoup de retweet, vous voyez un grand arc. Ce tweet avec l'avertissement du voyage en Suède a été publié en septembre et il n'y a pas eu de retweet. En février, il y a eu un autre tweet sur ce sujet. Le compte n'a qu'un seul follower et il n'y a aucun retweet. Donc le thème avait déjà été traité mais il n'a absolument pas été porté. Un autre exemple, 1 mars 2017 et là on va aller sur le mur de cette personne, de ce compte Twitter. Voilà une capture d'écran, le tweet a toutefois 6 retweets et donc on peut voir qu'il y a le premier impact de cette information. Et puis au fil du temps, ça augmente et il y a encore un tweet sur ce sujet avec 29 retweets. Et là je ne peux même pas vous montrer de capture d'écran parce que le compte a été fermé depuis, c'est quelque chose qui arrive très souvent. Le tweet et le suivant, le thème avait raison, il y a un avertissement du voyage en Suède après son discours sur le terrorisme. Voilà un autre tweet, finalement ça bouge pas mal en Suède. Citations du tweet, encore la même chose. Ici terrorisme islamiste. Et puis au final, le parti AFD à Magdeburg qui suit également la tendance avec un tweet sur la Suède. Donc on commence avec une fausse annonce du ministère des Affaires étrangères et ça termine avec le terrorisme islamiste. Ensuite il y a les réponses en fait des personnes qui voulaient clarifier que c'était des fake news. Premièrement après le premier ministère des Affaires étrangères ainsi que des faire-média qui ont montré que c'était en fait des fake news. Si on regarde entièrement la ligne dans le temps, ce qui est vraiment intéressant c'est que le thème c'est moins que le fake news est publié, que ça expose ensuite, mais que c'est qu'il y a un début graduel, ça commence tout petit, ça grandit de plus en plus. Et on a plus l'impression qu'il y a des gens qui expérience un peu, qui essayent, qui tentent pour voir quand est-ce que le réseau répond là-dessus. En fait moi je dis que les fake news sont des mêmes, ils n'ont pas de primaire, de source primaire, ils se forment dans le réseau. Le phénomène du centre est pas à leur résistance mais qui se puisse se répandre aussi facilement. C'est pas la source qui les crée mais c'est la résonance qui crée, c'est ça qui est vraiment important. Alors si on interdisait les sources de fake news, il serait toujours présent dans le réseau. Comme les fake news, en tant que même une portée très grande, on peut en faire un très grand capital en fait. Donc on peut parler de les Bretman news ou de Trump qui essaient de prendre du capital de cette idée. On ne peut pas seulement les montrer dans la ligne sur du passé mais on peut aussi regarder les comptes qui ont répondu les fake news et qui ont répondu dessus. Donc on crée un réseau. Les bleus sont les personnes qui essaient de clarifier, les rouges sont les fake news. Et de plus en plus qui soient prêts, de plus ils se suivent. Donc on peut voir des réseaux complexes comme ça, on peut voir comment ils se suivent et comment ils sont connectés. Ce qui est vraiment intéressant c'est que les personnes qui font les fake news sont dans un groupe qui est très isolé. Ils sont dans leur coin et ils sont seulement connectés à la société, à travers les médias par exemple. Donc ils essaient de se distancier aussi même de ces médias et ils se créent vraiment deux groupes complètement séparés qu'on peut voir en fait, qui sont juste interconnectés par les médias. Donc la première fois que j'ai vu l'image, je me suis dit ou la la c'est un filtre en fait, c'est une bulle dans laquelle les gens se bougent. Donc ce qui est vraiment bien c'est qu'avec la pays de Twitter, on peut regarder plus profondément dans les auseurs dont on peut aussi regarder le timeline des utilisateurs de Twitter. On a plus d'accès de données, donc je montre en bleu encore les non fake news et en rouge des fake news. 89% des personnes qui ont répondu les fake news n'ont pas vu la réponse, mais 89% des personnes qui ont répondu les fake news n'ont pas suivi ce chose. Ce que je veux dire c'est qu'il y a vraiment une bulle en fait parce que la bulle des fake news reçoit main d'information de l'autre bulle que la bulle des médias normaux reçoivent de la bulle des fake news. Donc ça c'est une carte, ça c'est la carte des utilisateurs de Twitter en Allemagne entière et la couleur selon le pays dans lesquels est vielle, donc on peut mettre des couleurs différentes. Donc là avant on avait la selon pays, là c'est selon âge du compte, donc en vert c'est des comptes qui sont très très jeunes qui sont très nouveaux en fait, pas jeunes en termes d'âge de la personne mais jeunes en termes de durée sur Twitter. Et donc aussi ils sont rouges, ils sont des cd comptes un peu plus vieux et là on voit différents groupes en fait, donc des groupes de jeunes, les médias en fait, le marketing, on a même un peu de porn, cliquez pas là dessus. Donc on voit vraiment des groupes et comment ils sont connectés, mais ce qu'on peut faire aussi avec ce graphique, on peut le mettre dans une autre couleur, on peut aussi mettre la couleur selon quelle partie politique se trouve dans quelle bulle du réseau en fait. Donc on a vu les différents couleurs des parties qui sont plus ou moins dans leur groupe ici en bas, donc il y a à l'AFD l'extrême droite allemagne qui sont un peu dans leur coin. Donc là on avait avant en bleu les personnes de l'extrême droite et maintenant avec l'autre couleur on a les personnes qui répartissent les fake news. Donc là vraiment on voit qu'il y a une considence sur la carte même. Donc le truc marrant c'est que ce n'est pas vraiment les députés de l'extrême droite qui font ça, c'est leurs followers et les groupes qui le font. Donc là si on va lâcher des comptes donc on voit que c'est des comptes très très jeunes, ils ont une activité très très grande, beaucoup beaucoup de tweets par jour. Et puis on peut voir quels genres de termes ils utilisent et pour les comparer avec d'autres termes qui sont utilisés sur le reste du réseau Twitter en fait. Et donc les termes qui sont les plus utilisés sont Islam, Allemagne, Migrant, Merkel, Mass, c'est un politicien politique. Bataille pour la liberté où SPD c'est parti de gauche, la droite, Antifa, censure, Pédigas, Syriens et donc on voit vraiment que c'est un groupe très jeune, très spécial. Comment est ce groupe ? Ils sont très jeunes sur Twitter, ils sont très proches de l'AfD, l'extrême droite. Ils repartissent, beaucoup de fake news, ils sont très actifs sur Twitter et ils se concernent principalement juste sur la politique d'immigration de l'Asile en fait. Et je vais revenir sur ce groupe, la première théorie qu'on pourrait avoir c'est que c'est des bots sociaux en fait. Et c'est ça que je veux parler dans ce talk en fait. À propos des social bots, on les désigne de différentes manières dans les médias. On parle de robots d'opinion, de bots d'opinion, de diffuseurs d'opinion etc. Mais qu'est-ce que c'est ? Voici la définition du Parlement allemand, ce sont des vrais personnes qui font des communiques. Qu'est-ce que c'est ? Prenne ces bots pour des vraies personnes et ne se rendent pas compte de la manipulation qui s'exerce sur eux. Est-ce que les social bots pourraient passer le test de Turing ? C'est un test où on peut dire si la personne ou l'ordinateur qui fait ce test, on peut déterminer si c'est une personne ou un ordinateur. Et c'est important parce que parfois les bots peuvent changer notre opinion. Je voudrais maintenant vous expliquer un petit peu comment on trouve les social bots. Mais quand je fais ça, je rentre dans un cercle vicieux. Si je veux chercher les social bots sur Twitter, je dois savoir à quoi ils ressemblent. Mais pour cela, je dois connaître leurs caractéristiques. Mais pour cela, je dois trouver des social bots. Pour casser ce cercle vicieux, il y a différentes possibilités. Et l'une d'entre elles, c'est celle que j'ai utilisée, j'ai acheté des bots. Ce ne sont pas des social bots au sens propre, mais j'ai simplement acheté des bots. Et je ne sais pas encore si les gens vont interagir avec ces bots. Il y en a un qui s'appelle Software Berlin. J'ai cherché sur Twitter acheter des social bots et j'ai pu voir que tout d'un coup j'avais 4500 followers. Ensuite, j'ai balancé la paix Twitter dessus pour voir les métadonnées sur ces bots. Chacun de ces points sont un follower et je sais que 100% de ces points sont des bots. J'ai fait passer le test de Touring à ces bots. Ce qui est à gauche est plutôt un bot et ce qui est à droite ressemblerait plus à un être humain. J'ai essayé d'appliquer certaines caractéristiques pour les filtrer. Par exemple, 100% d'entre eux n'ont pas encore d'avatar. 100% d'entre eux ont moins de 10 followers. 100% d'entre eux n'ont pas indiqué leur fuseau horaire, etc. Et on peut tout à fait voir que tout à gauche et la plupart de ces bots qui sont assez vierges, je dirons nous, sur leur profil, ce sont des comptes qui sont très jeunes. Au milieu, vous avez des bots qui ont été inactifs jusqu'à 3 ans. Et la troisième catégorie, je trouve que c'est assez intéressant, ce sont des comptes qui ont été en partie vérifiés. Donc là, il y en a une, c'est Peggy qui est présentatrice à la télévision, Chris Glorioso et un New Yorker très connu, un journaliste chez NBC. Et c'est intéressant parce que j'ai acheté les followers et dans ces followers, il y avait des personnes qui sont réelles. J'ai essayé de trouver comment c'est arrivé, mais je ne sais pas, je n'ai rien trouvé. Apparemment, il s'agissait peut-être plus à cause de citations. Ce que je trouve intéressant, c'est la question que je me suis posé pendant que j'ai préparé cette exposé. Quelles comptes existent aujourd'hui encore ? En vert, il y a les comptes qui ont été fermés par Twitter. Et en rouge, il y a les comptes qui ont été fermés par Twitter. Voilà, le réseau des followers entre eux, c'est 4500 bots que j'ai achetés. En rouge, il y a les bots. Et en bleu, ce sont les autres utilisateurs, les autres comptes, etc. On peut zoomer. C'est assez joli. On dirait le monstre de spaghetti volant. En bleu, ce sont des jeunes qui se sont achetés des bots qui sont achetés des followers sur Twitter. C'est assez intéressant d'ailleurs. C'est assez intéressant de voir que c'est très facile d'acheter des bots et c'est d'ailleurs assez bon marché. Comment reconnaître les bots ? Il y a des analyses grâce à des apps de Twitter. Les données sont encore dans la paix de Twitter d'ailleurs. Il y a marqué donc la source qui indique quel service on a utilisé pour Twitter. Il y a Twitter pour iPhone, il y a Twitter pour Android, mais il y a aussi Facebook, Instagram. Ce que je trouve intéressant, c'est qu'il y a 350 autres services. C'est un énorme potpourri d'applications coréennes, turques, japonaises, etc. C'est aussi intéressant de voir qu'il y a toute une flopée de scripts qui permettent de poster sur Twitter. Pour montrer aux gens ce que c'est comme service qui se trouve derrière tout cela. Il y a par exemple Feed Blitz, Feed Blitz. Il y a Tweetbot.net qui est aussi un truc assez bricolé. Je pense que c'est quelqu'un qui a essayé de bricoler un truc et c'est toujours en cours. Il y a aussi un outil, Kim Kardashian Hollywood. C'est bizarre parce qu'il y a aussi des applications qui ont été effacées. Je ne sais pas si le chiffre se suit, parce que là dans celui du bas, il veut dire qu'il y aurait 5 millions de services qui ont été effacés. Alors je veux clarifier quelque chose, les bots ne sont pas toujours méchants. Je ne sais pas si vous connaissez le compte Rathaus-Urwerk Neukölln, ça veut dire horloge de la mairie de Neukölln. Mais il Tweet sans arrêt, bam, bam, bam, bam, voilà. Spiegel Online Top utilise les services de If This And That et Site Online Digital a aussi un service de bot qui est enregistré sous Site Online. Comment reconnaître ces fameux bots ? Est-ce que le profil est complet ? Est-ce qu'il y a un avatar ? Est-ce qu'il y a une description ? Est-ce que le compte fait partie d'un réseau ? Depuis quelles applications sont envoyées les tweets ? Et à quoi ressemblent les métadonnées, les autres métadonnées du Tweet ? Je veux être très clair, ce ne sont que des indices. Qu'est-ce qu'il y a ? Ce sont des caractéristiques qui peuvent tout à fait s'appliquer à des comptes gérés par des humains. Dans tous les cas, je voudrais maintenant trouver des bots. Voilà ce que j'ai trouvé. Je vais vous montrer ce que j'ai trouvé. J'ai trouvé des comptes qui sont inactifs. J'ai trouvé des comptes de service, des trolls, enfin des jeunes, des racistes, des éteurs. Puis bon, beaucoup de spam, des links sur YouTube, c'est de suite. Ce que je n'ai pas trouvé, c'est des bots qui sont politiquement correctifs en fait. C'est un peu bizarre quand même. Alors je me suis dit, on va demander aux pros comment est-ce qu'ils font. C'est professeur Dr Simon Hegalich. Il travaille sur la science de données politiques. Ce qui fait lui en fait sa méthode. Il travaille sur le machine learning avec d'autres taux. Il publie des documents pour des grandes institutions sur comment fonctionne. Malheureusement, il ne publie pas comment il fait les recherches. Là, il y a un document qui a été publié où ils ont trouvé un réseau de bots politiques en Ukraine. Donc là, ils ont trouvé 1740 bots qui sont politiquement actifs selon les messages publiés. Donc on peut dire, ça c'est un réseau de bots qu'ils ont trouvé en Ukraine. Mais enfin bon, comment est-ce que ça ressemble en Allemagne ? Peut-être que moi je n'ai pas trouvé, mais moi je n'ai pas trouvé de document de professeur Hegalich dessus. Avec une méthode qui n'est pas de vérifier. Mais ce que j'ai trouvé, c'est un reportage du ZF, de ZF Zoom. Professeurs Hegalich avaient le travail de trouver des social bots dans des gigabytes de nonnets. Donc ils ont trouvé un. C'est Hegalich Dombrowski, c'est un des social bots qui l'a pensé. Il publie 136 posts par jour avec une tendance très proche de la droite. Donc on s'est posé la question, est-ce que c'est un bot ou est-ce que c'est un vrai homme ? Donc la rédaction du ZF lui a écrit. Et le bot s'appelle Hegalich Dombrowski, il a 50 ans. Il ne travaille pas, il est au chum. Il travaille, il vit à Airford et était dans la commune. Et puis maintenant il est sur Facebook très actif. Et il dit que les médias font de la poker ballande. Et il fait de la publicité pour la droite et n'est pas payé par la droite même, mais il le fait pour lui-même. Donc voilà. Donc il essaie, si on essaie de trouver un social bot, on a trouvé une vraie personne et le but. Mais il y a d'autres personnes qui travaillent là-dessus aussi. Donc il y a botswatch.net, ils essaient de trouver, parler des événements très importants, de regarder ce qui se passe sur Twitter s'il y a des social bots qui mélangent dans les autres utilisateurs. Donc ils ont une description aussi de la méthode comme ils font. Donc eux ils disent que des comptes qui publient plus de 50 tweets par jour sont des bots. Alors moi j'ai dit, bon, mais Monsieur Dombrowski il fait 136 posts par jour. Donc là aussi les personnes qui ont regardé ce qui s'est passé dans les élections ont fait une liste de tous les comptes qui ont fait plus de 50 tweets. Et là j'ai fait un compte rendu de tous les comptes qui ont publié plus de 58 par jour en déjà social bots. Donc là on a déjà des médias en fait, Velt et Focus Online qui font plus de 50. Christopher Lauer un politicien allemand, ainsi que Madame Schellenheck, ils font les chez les Verts, ils font aussi plus de 58 par jour. Bien sûr aussi les parties avant les élections, la CDU, les conservatifs, les républicains en Allemagne qui ont fait 64 tweets par jour et puis bon après, plein d'autres aussi. Donc 58 par jour pour qualifier un bot c'est vraiment pas sérieux et ces scientifiques n'ont pas approuvé. Et comment est-ce que vous ont trouvé ça ? C'est le critère de social bots de l'Université d'Oxford. Donc c'est intéressant je trouve. Donc j'ai commencé à regarder les études des pêpeurs des différents qui parlaient de ce thème comment est leur méthode en fait. Et puis j'en ai pris que deux parce qu'il n'a pas vraiment pas mal. Donc il y en a vraiment deux qui sont importants. Donc les social bots, leurs élections préliscent aux États-Unis. Ça c'est une publication qui a été publiée avec le titre les bots et l'automobile de l'Association sur Twitter pour nos élections présidentielles. Et j'avance un peu au moment où ça arrive. Alors ils commencent à parler des social bots en fait. Et après ils commencent à parler social bots qui ressemblent à les social bots. Et à la fin ils parlent de heavy automated bots, donc des bots qui sont très automatisés. Donc eux ils disent si 50 posts par jour sur un certain hashtag on peut être catégoré comme bot. Donc là vous avez une liste de tous les hashtags qu'ils ont vu. C'est d'abord les pro-Trump, les pro-Hillary et après les hashtags qui sont en général sur les élections principales. Bon mais j'ai des questions concernant sur cette définition. Pourquoi est-ce que c'est 50 et pas 30 passants ? Est-ce que c'est valide pour tous les pays ? Est-ce que ce critère, est-ce qu'on peut le prendre aux États-Unis et le mettre en Allemagne ? Et qu'est-ce que ce genre c'est qu'on se compte ? Est-ce que si je peux les identifier, je peux les regarder plus précisement ? Combien de followers ils ont ? Combien de favoris, combien de retweets ? Parce que peut-être qu'ils font plein de retweets mais peut-être personne ne les lit. Et à travers quel service est-ce qu'ils écrivent sur Twitter ? Parce que c'est assez important aussi. Et je peux comprendre qu'il y a pas mal de comptes mais il y a des méthodes scientifiques qui sont prouvées et on en prend 100 au hasard et on regarde vraiment si c'est des comptes qui ont une influence politique. Mais malheureusement dans les détudes, il n'y a pas de description là-dessus. Malheureusement je ne peux pas vérifier parce que l'université d'Oxford ne publie pas les données là-dessus. Donc le problème c'est qu'il y a des guides de Twitter sur les licences de la pays qui ne peuvent pas être publiées. On peut s'acheter de ça, on peut publier une liste des adis de Twitter donc on peut prendre les tweets après, après on crée. Heureusement l'université de George Washington a une publication de 2016 et ils ont une liste de tous les adis, en fait une liste de tous les adis de comptes qui ont utilisé le hashtag election day. Donc malheureusement je n'ai pas la même base de données que l'université d'Oxford mais je peux prendre un petit bout. Je peux regarder qui le jour de l'élection a utilisé plus de 100 tweets d'un des hashtags qui étaient dans la liste. Donc et là ça c'est une liste de ceux qui ont fait plus de 100 tweets par jour. Ce sont ces 12 à compte et ça c'est son enquêteur de social bots. Ceux qui sont meilleurment visibles en tant que social bots. Donc si on regarde plus précisément qui est ces social bots et on va prendre un peu de temps et regarder les 12 bots. Donc le premier est un stream of tasks donc il a fait 437 tweets le jour de l'élection. Elle généralement est fait des liens sur le reddit de Donald Trump, donc vers les commentaires. Et il utilise service of this and that. Et donc là on est sûr c'est un bot parce qu'IFTTT c'est un système de bots. Mais tout ce qu'il fait en fait c'est qu'il prend des commentaires sur reddit et il les remet sur Twitter. Et bon je vais prendre un risque comme je veux dire qu'il n'a aucune relévance dans le système. Le prochain raconte, il publie des trucs totalement fou, des screenshots de textes qui sont totalement bizarres. Ce sont des complots impossibles. Ce qui utilise pour les screenshots c'est les hashtags qui sont actuellement en trending en fait. Il a 4 followers et on est sûr que ce n'est pas un bot. Enfin moi je suis sûr que ce n'est pas un bot. Le prochain raconte, il supporte Trump parce que Clinton est horrible. Il utilise beaucoup de hashtags, il vit sur Abay, il dort 6 heures et fait une pause à midi et c'est un bot. 6 heures de sommeil on voit quand est-ce qu'il tweed et pas. Le prochain c'est quelqu'un qui aime bien Bernie Sanders. Il déteste Donald Trump, Clinton, les démocrates parce qu'ils ont Bill et Chelsea. Et il déteste aussi Expedia parce que Chelsea Clinton est dessus mais ce n'est pas un bot non plus. Le prochain a l'air très bizarre. Je pense que c'est un clic bot espagnol qui essaye de prendre les utilisateurs et les mettre sur des sites de pub en fait. Donc il n'y a aucun contenu politique. Juste prennent les hashtags qui sont actuellement populaires pour se mettre dans les tops des tweets. Ils ont un faux-lauteur, moi je pense que c'est certainement pas un bot, il y a des photos de frappe et des trucs comme ça. Donc voilà, ce n'est généralement pas le cas. Voilà, ça se vient un peu plus intéressant. C'est une mamie de Brooklyn, elle est artiste, elle fait des images, elle vend des bijoux et elle arrêtait de fumer. Et le jour de l'élection, elle a mis beaucoup de tweets pour se prieter Trump et c'est certainement pas un bot. Et celui-là de Tokyo, c'est sûrement un étudiant et il fait des tweets dans le Japonais seulement. Donc c'est un peu difficile de voir ce qu'il fait en fait. Mais je pense qu'il déteste Toro Hashimoto et Kasu Muran. Donc c'est un politicien, un entrepreneur internet. Et le soir de l'élection, il a vraiment mis beaucoup de tweets. Il a juste pris les achetages actuels pour tirer dessus. Mais ça, ce n'est pas un bot. Bon, le prochain. Paulo a écrit 13 tweets en 3 secondes. Donc vraiment impressionnant. Il utilise 3 services italiens totalement connus. Il y en a un qui est bloqué maintenant. Il est pro-hilarie, personne fave ou retweet ses tweets. Et c'est certainement un bot mais il n'a aucun impact. Et celui-là, il aime Jésus, il aime la famille Trump, il utilise Fox News et les armes. Donc voilà. Et il déteste le féminisme avec l'ancienne N. Obamacare et la portion de le processus. Mais ce n'est pas un bot non plus. Et on a Président Trump. Ça c'est un account de satire. Parfois il est marrant, il a un follower. Et ce n'est pas un bot non plus. Donc Marika, elle est journaliste de l'Afrique du Sud. Elle travaille pour l'AFP. Elle a tweeté live sur Election Day. Et ce n'est pas un bot non plus. On a encore Dr. Van Nostrand. Il n'a pas de photo de lui, il aime bien le baseball, le football américain, Fox News et Trump. Il déteste Hillary Clinton, CNN, l'islam, les féministes et la gauche. Et lui aussi il a suivi la victoire de Trump live sur Twitter en fait. Il a fait ça pendant la journée de l'Election Président Sensif. Et ce n'est pas un bot non plus. Donc ça c'était les 12 de la liste en fait. Et on fait pour conclure. Alors j'ai fait un petit tableau, une liste. Pro Clinton, notre et pro Trump. Et dans les colonnes et pour les lignes, j'ai fait humain, pas sûr et bot. On a trouvé un bot Clinton, un bot Trump. Si c'est vraiment un bot, je ne suis pas sûr. Parce qu'ils n'ont pas d'interaction sociale en fait. Donc ils ont juste publié des informations, mais ils n'avaient aucun impact en fait. Un grand groupe de personnes qu'on a trouvées, c'est des pro Trump mais humains. Ce pro Clinton, on a trouvé un compte de satire en fait. C'est entre temps. Et on a trouvé un fan de Bernie Sanders, un journaliste, un japonais et quelqu'un qui aime bien les complots. Et on en a un qui n'est pas sûr. C'est lui qui écrit quelques déliens. Si je regarde maintenant que les... Si je montre les comptes qui ont vraiment participé à une discussion politique, c'est les comptes ici présents. Et c'est à peu près la moitié de ces comptes. Voilà. Les études... L'étude devrait avoir une autre nom, et pas les bottes automatisations de Twitter. C'est... devrait avoir des listes de comptes qui sont très actifs en fait. Donc les bottes sont des politiques, des citoyens qui sont politiquement actifs, des gens qui font du spam avec des actales, hashtag, des médias, des journalistes. Et puis quelques simples bottes en fait. Donc il y a une étude de l'Université de Carl Rosine du Sud. Ils ont dit que des bottes sociaux ont... ont modifié la discussion en ligne des bottes sociaux. Donc eux, ils utilisent un service qui s'appelle BOT ON BOT, BOT OR NOT. Donc je ne veux pas aller trop profond là-dessus. Mais dans le centre, ce qu'ils font, c'est ce que j'ai fait au début. Ils regardent de tout... de collecter tous les... donner des mètres autour du Haut-Conte, et de les catégoriser. Et après, ils ont... avec une probabilité, ils essaient de définir si le BOT est un... si le compte est un BOT ON BOT. Donc ça, c'est leur base. Donc... attention... ...ce n'est qu'ils n'ont pas de lise-rechte. Sauf qu'ils veulent aussi des schreiberechte. Voilà. Donc ça, c'est un service... si vous l'utilisez, faites attention, parce qu'ils veulent avoir aussi des droits d'écriture sur votre tweet. Donc moi, j'ai regardé un peu... j'ai mis quelques comptes dedans pour vérifier si... si... si ils sont des bottes. Donc si le compte, à moins de 50% de... de points, c'est un BOT, si il a plus, c'est... c'est la moins, c'est la moins, c'est un BOT. Et donc il a dit que... les personnes de gauche, Erdgeist, Frank Rieger, et les nous de se faire, c'est pas des bottes. Et il a dit que le service a dit que les... services de l'État, par exemple, le BKA, le... le BMV, donc c'est... c'est un... institut des ministères. Et là, il a dit que c'était des bottes, sûrement. Donc là, encore un peu une vue. Il a dit que beaucoup de... de médias sont des bottes, en fait. Le Président est un BOT, donc c'est un... voilà, les résultats de ce service de test. Donc, vous pouvez le laisser vous-même aussi, si vous voulez. Donc scientifiquement, on peut pas tenir ça. Et pour ceux qui ne sont pas... pour ceux qui ne sont pas convaincus, voilà. En résumé, les bottes sociaux, les bulles de filtrage, et les fausses informations. La méthodologie est assez nouvelle. Cette recherche est assez nouvelle. Et les publications scientifiques doivent être vérifiées. Si quelqu'un veut faire un travail de fin de cycle, un travail, un mémoire de master, vous êtes les bienvenus. Il y a des exemples, notamment... et comme Dombrovsky et... et... on a tendance... à définir les gens comme étant des... fachos, appartenant à la fachosphère, des nazis, des gens d'extrême droite. Et maintenant, ce sont aussi des bottes sociaux. Ils utilisent les nouvelles technologies pour diffuser des fausses informations et diffuser leur vie politique. On obtient aussi que les réseaux sociaux ne se sont pas unis pour essayer de trouver des solutions. Peut-être y a-t-il des solutions techniques. En tout cas, il faut essayer de... d'ouvrir le débat pour essayer de trouver une solution à cela. Mais en tout cas, je pense qu'il y a là une nouvelle science qui est en train d'apparaître. Elle est encore dans sa plus tendre enfance. Elle fait ses premiers pas. Mais je pense qu'il y a quelque chose. On est en train de décrire un phénomène qui appartient à la science politique et à la science sociale. On peut avoir une méthodologie qui permet de reproduire des résultats. On a vu aussi des... ce genre de développement en astrologie. On a d'abord observé les étoiles gras au télescope et puis on en a tiré des conclusions qui sont devenues des lois physiques et ça a été la naissance de l'astrologie. Et je pense que là, sur les réseaux sociaux, nous avons aussi trouvé une nouvelle science qui ferait des recherches sur les médias sociaux. Je pense qu'elle est nécessaire dans une tentative approximative de rapprocher de sciences. Je pense que là, on est vraiment à la croisée des chemins entre la science des données et l'essence sociale. J'aimerais bien soutenir les premiers pas de cette science. J'ai publié une partie du code source de mes outils. Je suis disponible au numéro DECT 3600. Je suis ici pendant les deux jours du congrès si vous avez envie de me poser des questions. Sur le fait que nous pourrions peut-être commencer, entamer un débat sur le thème des bots sociaux. Merci. J'aimerais bien réécouter cela. Nous avons encore un petit quart d'heure pour poser des questions. Est-ce que vous avez des questions à poser à Mikhail Krail? Il y a des microphones dans la salle. Je vais essayer d'équilibrer un peu les microphones 4. Allez-y. J'ai une question concernant la propagande qui est payée par l'État. C'est des personnes qui sont payées par des États qui travaillent sur des programmes comme ça. Est-ce que vous avez fait de la recherche sur ce thème aussi? On a essayé de trouver des personnes qui participent au discours politique. On n'a pas pu savoir si on participe au botte ou pas. On voit des personnes qui postent sur des élections présidentielles. Si on voit qu'ils participent aux élections sur Twitter, et à côté de ça, il y a encore une vie privée sur Twitter, on ne pense pas que c'est un botte. C'est la grande question qu'on a vraiment. C'est l'impact qu'on a. Est-ce que vraiment par Twitter, je peux faire que les gens changent leur vie politique par Twitter? Donc je fais attention à ne pas partir de ce point de vue. Merci pour l'exposé. Je pense que c'est un sujet très important, surtout si cela veut dire qu'on doit changer notre méthodologie scientifique. Merci beaucoup pour cela. Je suis un petit peu déçu que tu n'es pas trop parlé des fake news. Parce que j'aurais bien voulu savoir comment l'influence qu'on s'est botte dans la diffusion des fake news. En tout cas, ils ont une énorme influence. On a pu voir que pendant les élections américaines, de nombreux comptes ont diffusé des fausses informations alors qu'ils se trouvaient en Europe. Il n'y a absolument aucun programme politique. Il n'y a absolument aucune raison qu'ils diffusent des fausses informations. Il n'y a pas de but politique derrière. Au début, il y en a même qui ont essayé au début de diffuser des informations pour Mme Clinton. Et puis ils ont vu que cela ne marchait pas trop, donc ils ont changé de bord. Donc on a une question de l'Internet. Il y a beaucoup de compliments pour l'exposer. Les personnes ont dit qu'ils seraient intéressants d'analyser le hashtag du Congrès et de voir les trolls. Donc il y a des questions. Est-ce qu'il y a encore des smart bots qui se battent entre eux et qui ont des interactions entre bots ? Des flame bots. C'est des concepts théoriques. Même si on se lit les études là-dessus, c'est des concepts qui disent que ça pourrait être comme ça. Moi je ne suis pas ici pour dire que ça peut passer. Moi je n'ai aucune idée ce qui se passait avec l'intelligence artificielle dans les années à venir. Mais ce qu'on voit jusqu'à maintenant, il n'y a pas d'artificence intelligente qui fait ces contenus. Microphone 3. Salut. Le premier critère pour différencier les comptes humains des comptes de bots serait la fréquence des postes. Pourquoi est-ce que vous n'en êtes pas servi ? Parce que ce n'est pas toujours un critère auquel on peut faire confiance. Si je développe maintenant un bot social, je vais être intelligent et je vais faire en sorte qu'il ne poste pas 100 fois la minute. Mais au final, ce n'est arrivé qu'une fois où on a vu qu'un bot social diffusait de manière réaliste. Microphone 1. Je voulais demander, est-ce qu'on t'a dit que les social bots perdent d'influence ? Est-ce que ça veut dire qu'il n'y a pas vraiment de discours de contact ? Mais est-ce qu'il y a la question plus ou moins s'il y a un changement dans l'impact et dans le danger que présentent ces bots ? Alors premièrement, il y a une phrase qu'on a entendue l'année dernière, c'est-à-dire que l'Internet n'est pas à la source de problèmes, juste montré des problèmes qui étaient déjà là. Donc c'est quelque chose qui est juste devenu possible avec les réseaux sociaux. Donc ça c'est la différence. Donc je voulais savoir que si ce danger est un peu réduit, parce que chacun vit dans sa petite bulle, c'est-à-dire que les bots n'ont pas d'influence parce qu'ils sont contenus dans leur bulle en fait. Non, mais je n'ai pas d'idées finales là-dessus. Mais je sais enfin en le sent que les réseaux sociaux n'ont généralement pas conçu pour faire un discours. Ça finit toujours dans un flamboire en fait. Vraiment des solutions, ce n'est pas le bon endroit pour faire des solutions. Peut-être que l'homme n'est pas fait pour ça, peut-être que les réseaux ont un problème que nous ne sommes pas conscients et on ne doit pas oublier que c'est une technologie très expérimentale, un réseau qui donne la possibilité de communiquer de cet âge. Microphone 4, bonjour. D'abord, félicitations pour cette exposé. Ma question est la suivante. Tu as parlé de Twitter. Est-ce que vous avez aussi analysé des réseaux sociaux qui ont aussi une grande capacité de diffuser des informations ? La question est, quelle influence a un tweet quand c'est envoyé par des petits comptes un tweet à 10 000 followers et plus important que 10 000 tweets à un follower ? Effectivement. C'était d'ailleurs un critère d'extusion pour les tweets qui n'avaient pas favorité ou qui n'avaient pas été retweetés. Ce qui concerne les réseaux sociaux, on voit que ça arrive pas mal sur YouTube. Il y a beaucoup de gens qui sortent leur caméra dans leur salon et qui partagent leurs opinions politiques. Il y a aussi ce réseau sociaux russe qui s'appelle VK. Vous pouvez contacter. Il y a aussi un petit peu d'activité là-bas, mais ce n'est pas très grand. Par contre, il y a Facebook. Sur Facebook, il y a énormément de discussions politiques. Mais au final, les thèmes sont les mêmes. C'est un peu un problème. Ça ne sert à rien d'étudier les mêmes thèmes sur deux réseaux sociaux différents. L'autre problème, c'est que la pays est très fermée. Il y a énormément d'informations sur Facebook. Le discours politique est très actif. Là, il y a beaucoup de données à analyser. Un autre bot de social a encore une question. Est-ce qu'il y a des questions ? Est-ce qu'il y a une étude pour l'impact de fake news, en dehors des réseaux sociaux ? Je ne connais pas d'études à ce thème. De mon expérience, je dirais qu'ils n'ont pas d'influence. Parce que généralement, ils ne peuvent pas changer l'idée des personnes. C'est-à-dire qu'ils ne peuvent pas changer l'idée des personnes. Les personnes ont déjà une idée fixe entre les médias sociaux et que leur idée est juste consolidée par les bots. Les personnes qui ont peur des migrants qui viennent, ils sont dans leur but de filtrage. Ils ont leur idée de renforcer. Je ne connais pas d'études à ce cas. Il y a aussi des suites psychologiques. Merci pour l'exposer. Tu avais un beau graphique avec les différents groupes sur Twitter. Il y avait l'AFD et après, il y avait les fake news. D'où vient la relation de cause à effet ? Oui, c'était des fake news. J'ai cherché des articles où je savais que c'était des fake news. Et grâce à l'URL, j'ai réussi à sortir quel tweet et transmettre des fausses informations. J'ai encore une question sur la réponse. J'ai des journalistes qui travaillent sur ces thèmes. Ils reçoivent beaucoup de réponses par des bots. Est-ce que c'est quelque chose que tu as vu ? Ou est-ce que les réponses sont faits par bots ? Ce sont tous des vraies personnes. Avec un bot, je peux prendre un hashtag mais c'est plus de spam pour déranger le discours mais pas pour avoir une influence. Pour les journalistes, je connais quelques journalistes qui sont actifs sur Twitter et toujours qui sont confrontés à un grand nombre de comptes. Mais je ne suis pas sûr que c'est des réseaux de bots parce que c'est généralement des personnes uniques qui font beaucoup de tweets. C'est très difficile de créer 100 000 tweets avec une intelligence artificielle donc c'est vraiment un problème. Je ne suis pas sûr qu'il a déjà résolu. Une question à propos d'un écritère. Je ne sais pas si tu en as parlé. Peut-être que je n'ai pas fait attention sur les informations dans les tweets par exemple. Je sais que pas mal de bots copient simplement des citations et je pense que c'est aussi un critère assez important pour dire si c'est un bot ou pas. Est-ce que dans tes études ça a joué un rôle ? Dans mon étude non. Parce que vous avez bien vu la liste des critères en ce qui concerne mon travail il y a bien évidemment des gens qui se disent je ne vais pas tweeter tout ça je vais simplement en prendre une partie et le citer. Mais il y a effectivement des formulations qui reviennent dans des milliers de tweets. Mais en fait ce ne sont que des banques de données de textes, il y a aussi du contenu politique qui revient assez souvent mais par contre il n'y a pas trop d'activité politique au niveau des bots. Alors salut et merci beaucoup pour cette présentation. J'ai une question sur ce thème sur la suede qu'il y avait au début comment est-ce que travail Emmanuel il y avait dedans pour sélecter les tweets qui sont sur cette histoire et tu ne peux pas être sûr d'avoir tout se trouvé ? Non je ne peux pas être sûr de ça. Parce que beaucoup de tweets sont supprimés ou des contes entiers quand on les a vus quand on a regardé les données beaucoup plus tard on pouvait voir combien de contes ont été disparus. Il faut trouver tous les tweets évidemment non mais ce qu'on peut faire c'est d'essayer de A à B on commence par la suede, on voit les contes on voit d'autres mots-clés donc avec ces mots-clés on recherche d'autres racontes donc on se passe de mots-clés en mots-clés et la base de données elle grandit de plus en plus et j'essaye de les catégoriser un peu semi-automatiquement donc ça c'est la méthode en fait Oui fait fait J'ai une question assez courte Tout d'abord est-ce que tu va publier les données que tu as trouvées et ensuite sur la ligne de temps que tu as fiché je me demande est ce que c'est est ce que la charge la masse de gens était pertinente alors sur la publication des données il y a une condition sur Twitter qui ne me permet pas de publier les données sur 10 000 contes Twitter Sinon j'aurais simplement fait clic droit à publier mais en fait je peux peut-être exporter un fichier Excel avec le nom des contes et le conduit du tweet c'est quelque chose qui est possible mais je n'ai pas trop envie de le diffuser à grande échelle pour la deuxième question est-ce que tu peux la répéter est-ce que tu trouves que analyser 2000 contes sur ta ligne de temps c'est pertinent parce que sur 80 millions d'allemands 2000 personnes ça ne me paraît pas représentatif oui alors en fait j'ai pris ce chiffre parce que ça me paraissait déjà faisable il y a sur les 80 millions d'allemands il y en a énormément qui sont sur Facebook parmi eux il y en a beaucoup moins qui sont sur Twitter et donc en fait j'ai simplement essayé de réduire le chiffre et de plus je ne trouve pas que la discussion politique soit pertinente au niveau social en Allemagne une dernière question merci beaucoup parce que ton projet m'a sauvé mes études merci beaucoup pour ça alors ce que moi j'ai vu spécialement par ses armées de troll en fait est-ce que tu as regardé dans les contes combien de choses se répètent à l'intérieur d'un compte alors par exemple ils ont souvent les mêmes images de profils ils ont des contes avec des noms qui se suivent en fait alors ça c'est un phénomène général qui est présent sur Twitter en fait donc c'est quelque chose qui n'est pas juste pour les bots par exemple si un nom de compte est pris il met un chiffre derrière donc on peut pas vraiment le dire parce qu'il n'y a pas de différence entre les bots et les citoyens donc il faut reprendre un ethnologue qui mène une conversation avec les personnes pour voir si elles sont payées ou pas moi je trouve ça dangereux dès le début de mettre un label là dessus pour dire donc c'est très compliqué et il faut une recherche très importante alors moi je les ai trouvé que par hasard en fait parce que je les fais pour les élections en Turquie il y avait beaucoup de comptes qui ont posté des spam turcs mais d'un coup on continue avec un allemand très mauvais en Allemagne on devrait se discuter donc voilà on est désolé les questions sont terminées merci beaucoup Michael Carrel pour le discours et à ce moment là aussi il y a nous et moi question en haut