 Diesen Talk hält David McCoy. Er erklärt politische Online-Werbung. Er hat untersucht, wie verschiedene Online-Communities. Danke euch allen fürs Kommen. Ich bin hier oben um zu sprechen. Es war sehr schön nach Deutschland zu fahren über Weihnachten und Neujahr. Es waren drei Leute an dem Research beteiligt. Einer davon ist mein Gradstudent, Laura Adelson. Sie hat vieles davon geschrieben. Einer davon ist der Endergradstudent, Schiecher Saruja und Rattan. Der hat ebenfalls mitgewirkt. Also eine kleine Einführung von mir selbst. Ich bin ein Professor an der NYU-Engineering School. Wir untersuchen, wie Technologie, Privacy und Privatspiele beeinträchtigt. Das hier war ein opportunistisches Projekt, um den Einfluss von Online-Marketing auf die politische Sphäre zu untersuchen. Kampagnen in den Vereinigten Staaten. Alles, was ich euch hier zeigen werde, und die meisten Daten-Scripts sind alle auf GitHub, wie ihr es auf den Slideset. Wenn ihr selbst euch die Daten ansehen wollt oder die Skripte überprüfen wollt und damit rumspielen wollt, macht das. Das ist das erste Mal, dass ich diesen Vortrag außerhalb der Vereinigten Staaten vortrage. Also lasst mich euch schnell erklären, wie US-Wahlen funktionieren, falls ihr es nicht wisst. Alle zwei Jahre gibt es bundesweite Wahlen innerhalb den Vereinigten Staaten, die so also alle Staaten betreffen. Alle vier Jahre haben wir eine Wahl für die Präsidentinnen und die Präsidenten. Die letzte Wahl war keine Wahl für den Präsidenten, sondern nur für Insenat und die Sitze im Haus auf dem Bundeslevel und auch innerhalb der Staaten und noch lokalere Positionen sind gewählt worden. Das haben wir vor allem in Facebook-Daten und weniger in Twitter und Google-Daten angesehen. Die Perspektive dieses Talks sind die 2008 Wahlen in den USA entlang von Facebook-Daten. Einige von euch werden hier von wissen, manche vielleicht nicht, in den 2016er-Wahlen gab es Wahlbeeinflassungen mit diesen Facebook-Werbungen, die von einer russischen Firma bezahlt wurden, die Internet-Research-Agency, die diese Werbung hat laufen lassen und der Senat hat die dann öffentlich für Leute gemacht. Es war insbesondere gemeint, um Leute vom Wahlen abzuhalten. Getargetet wurden Leute zwischen 18 bis 65 Plus mit im wesentlichen Schwarzen Interessen, also Martin Luther King, Junior African American Culture, Bürgerrechtsbewegung, Schwarzer Leute, Schwarze Geschichte und sofort. Und Facebook ist nun mal sehr effektiv entlang dieser Interessen, die Leute zu tagenden und rauszusuchen. Es gab andere Werbungen wie etwa diese, um Desinformation zu streuen, eine Werbung, die von dieser russischen Agentur bezahlt wurde, die dieses völlig substanzfrei Gerücht streuen und verstärken wollte, dass Clinton dieses illegitimale Kind hätte. Und hier sind wieder die Afroamerikaner in ein wichtiger Anteil der Abstimmenden für liberalere Politik. Das Wahlsystem auf dem Bundeslevel hat im Wesentlichen zwei Parteien, die wichtig sind und bedeutungsvolle Beiträge innerhalb der feinlichen Staaten haben. Die Demokratinnen sind eher auf der Seite von mehr Regierungen, mehr Social Services, mehr solche soziale Unterstützung, die Republikaninnen kommen eher auf der Seite rauszuderegulieren, möglichst wenig sozialen Support zu haben, viel von eigener Leistungen und Put Stripping zu reden. Dann sehen wir viele von diesen Ads jetzt als Nächstes, die auf Facebook gezeigt wurden. Fast alle davon wollen entweder Leute, sie wollen entweder Chaos stiften, indem sie Leute davon abhalten, sich an der Wahl als wichtiger Teil zu führen. 2016 hat der Direktor einer amerikanischen Agents festgestellt, dass Russland versucht hat, einzugreifen in die Wahlen und genau das diese russische Agentur involviert war. Und das ist ziemlich genau das, was die nationalen Sicherheitsorganisationen WSA und NSA festgestellt haben. Das andere, das wichtig war, war diese Skandal in Facebook, dass diese beiden Skandale wurden veröffentlicht. Das erste Resultat davon ist, dass wir Mark Zuckerberg hatten, in einem richtigen Anzug vor dem Senat. Was er ausgesagt hat, ist vor allem dieses Senats zu den Aktionen von Facebook. Das hat er am 10. und 11. April 2018 gemacht. Dabei hat er zugegeben, dass Facebook Fehler gemacht hat und Dinge in der Zukunft in ihrer Plattform verbessern muss. Die fühlbarste Effekt dieser Aussagen waren die Transparenzarchive, die wir hier anschauen. Hier ist ein Blick in dieses Facebook Transparenzarchiv. Initial brauchte man einen Facebook Account, um hier rumzustöbern. Mittlerweile hat sich das geändert, jeder, der eine Internetverbindung hat. Interesse am Thema kann sich dieses Archiv anschauen und reinschauen, was dort passiert ist. Man gibt dazu einen Schlüsselwort ein und sieht dann, welche Erz, welche Werbung darauf zutreffen. Man sieht alle politischen Werbeanzeigen, die für diesen Begriff zutreffen. Facebook hat angefangen, diese Werbeanzeigen zu archivieren am 7. Mai 2018. Bis zum 7. November 2018 haben sie 1,6 Millionen Werbeeinblendungen von über 85.000 Werben archiviert. Facebook hat ziemlich viele Informationen in dieses Archiv aufgenommen, und zwar alle Werbeeinblendungen für amerikanische Wahlen, egal auf welcher Ebene, und auch Dinge für polarisierende Issus auf allen Eben. Zusätzlich eine Liste von rund 13 Kriterien von Werten und polarisierenden Angaben, die in diesem Archiv aufgenommen wurden, plus Videos, die in diesen Werbungen, die Informationen sind meistens auf einem Staatenlevel gehalten und haben geografisch spezifische Angaben. Es gab außerdem einige Spendeninformationen in diesen Werbeanzeichen, wo man verschiedene Beträge spenden könnte. Eines der wichtigsten Dinge an Informationen, die darin waren, war die Targetinformation, also die zielgruppenbasierte Information, die man in diesem Archiv suchen kann. Man kann diesen Keyword-Search in dem Webportal machen, und wir haben auf einem großen Skala Daten analysiert mit Hilfe dieses Keyword-Searches. Also Schlüsselwort suche, entschuldigung. Und wir haben dann eine sehr lange Liste an Schlüsselworten gemacht, die wir wichtig fanden, Staatennamen, ja verschiedene Sachen, die wir einfach auf dieser Liste brauchten. Ich werde euch die Geschichte erzählen, wie wir das geschrieben haben. Am Anfang haben sie dieses Archiv eröffnet, und wir hatten die Idee, dass wir eine groß skalierte Untersuchung starten können. Meine Schüler fanden das sehr interessant, und mit ihnen habe ich angefangen, nach Schlüsselworten zu suchen und die Ergebnisse aufzuschreiben. Wir haben von daraus erst mal nur einen ziemlich generellen Statistischen Report veröffentlicht auf unserem GitHub. Danach, also etwa zwei Wochen später, hat Facebook angefangen, Anti-Scraping-Maßnahmen zu implementieren. Das hat unsere Bemühungen natürlich erheblich behindert. Ich möchte hier keinen bösen Willen unterstellen, und ich glaube auch nicht, dass nur wir davon betroffen und nur wir gemeint waren, sondern sie wollten immer gemeint das Scraping anbinden. Es ist natürlich etwas seltsam, dass Facebook ausgerechnet beim Transparenzarchiv Leute davon abhalten will, Daten zu ziehen. Das war halt eine Wahl, die Facebook getroffen hat. Wir haben versucht ein bisschen mit Facebook darüber zu kämpfen, aber es war halt ein Katzenmaßspiel. Wir haben also unseren Scraper modifiziert, um das Anti-Scraping zu blocken. Sie haben wieder geblockt, hin und her. Das ging ungefähr zwei Wochen so, und dann haben Facebook ihre API bedeployt, die leider sehr limitiert ist und immer noch beta ist. Und wie ich vorhin erwähnt hatte, ein Non-Disclosure-Aggreement davon hat also, man darf dann die Daten auch nicht beliebig weitergeben. Es ist außerdem limitiert zu nur, auf nur NutzerInnen aus den Vereinigten Staaten. Das hat also auch limitiert über welche Personen wir Daten uns ansehen konnten. Das hat uns andererseits auch davon abgehalten, mit guten Journalistinnen darüber arbeiten zu können, die im Zweifelsfall in anderen Staaten leben. Oder vielleicht war das Glück, kann sein. Diese Einschränkungen auf das Non-Disclosure-Aggreement gehen hier noch weiter mit, man darf es auf keinen Fall länger als ein Jahr behalten. Wer an Facebook eine Datenhistorie bis sieben Jahre garantiert und hat, ich habe dieses NDA angesehen, ist ein Brat gesteckt und einfach weitergeschraubt. Nee, war leider eine schwere Entscheidung, zwei Studenten, die sich ansehen mussten, ob wir entweder die Daten analysieren wollen und darauf unsere Zeit verwenden oder darauf sie überhaupt zu kriegen mit Scraping beim Kämpfen mit Facebook. Insofern haben wir dann doch mit dem NDA zugestimmt. Wir scrapen immer noch ein bisschen und auch die Daten, die wir früh gescrapt haben, nutzen wir und wir können euch natürlich leider nicht vorstellen, was unter dieses NDA fällt. Gegeben unsere Engineering-Einschränkungen konnten wir hier leider nicht auch Europa ansehen, via Scraping. Mit Google ist die Story ein bisschen anders. Der Anarchive fangen am 31. Mai 2018 an, also ein bisschen später, zum Wahltag, also am 7. November 2018 hatten sie 45.000 Werbeanzeigen von ungefähr 600 Werbebetreibenden angesehen und erhoben und sie haben nur Werbung zu US-Bundeskandidaten oder schon amtierenden Personen inkludiert. Keine geografischen oder demografischen Einblendungs- oder Kosteninformationen werden mitarchiviert. Taget hin gibt es geografisch und demografisch, aber begrenzt. Was Facebook halt überhaupt nicht getan hatte. Ihre Daten sind, also die Daten von Google sind auch in einem Webportal, wie er Schlüssel überhatern. Es gibt aber auch eine Datenbank, auf die wir zugreifen können. So sieht er ein Portal aus und so sieht diese große Datenbank aus, die man sich ansehen kann, die wöchentlich geupdatet wird. Kann man runterladen und relativ einfach analysieren. Die letzten, die so ein Archiv gestartet haben, waren dann Twitter von unseren drei Zielgruppen, die haben angefangen zu archivieren am 27. Juni 2018. Twitter ist halt relativ klein, schon als Werbebetreibende im Vergleich zu Facebook und Google Ads. Insofern finden wir hier nur 2.000 Werbeanzeigen von 88 Werbebetreibenden. Sie haben auch nur inkludiert, Bundeskandidatin, aber auch Werbung zum politischen Themen. Es scheint aber in Twitter niemanden zu geben, der sich um die Transparenz hauptberuflich kümmert. Und wenn wir das, wenn wir reporten, dass es hier eine Werbung gibt, die in Twitter fehlt, die in diesen Daten nicht vorkommt, dann wird das korrigiert. Aber Twitter scheint sich initiativ nicht so kümmern, stattdessen ist es gerade irgendwie unser Job, das zu tun, die dann von Hand damit arbeiten. Twitter veröffentlichten aber zu ihrer Werbung die meisten Informationen, nicht nur Arranges von Data, sondern exakte Daten über geografisches und demografisches Targeting. Nein, sie veröffentlichten sogar alles Targeting, die exakten Daten für geografisch und demografisch sind die Anzeigendaten, also die Impressions, wie die Kosten. Und die Daten sind zugänglich über ein Webportal, über das wir suchen können. Das haben wir natürlich wieder scraped, das war völlig unproblematisch. Und da die Daten auch relativ wenig sind, war das einfach damit Schritt zu halten. Und hier ist ein Bild von Twitter's Transparenzarchiv. Mit einer Liste von all den Accounts, die in diesem Archiv genannt werden. Wenn wir also solche Accounts sehen, die solche politischen Werbung machen, werden wir in der Regel Twitter davon in Kenntnis setzen und sie werden das hinzufügen. Das ist also der Hintergrund, den ihr darüber verstehen müsst. Gut, damit haben wir eine Datenbank, die wir analysieren können. Was machen wir jetzt damit? Für Facebook hatten wir dieses Schlüsselwort getriebene Verfahren, mit dem wir etwa 80 Prozent der Anzeigen sammeln konnten. Das Problem mit der API ist, dass sie sehr, sehr rate demittet ist. Wir können also nur drei bis vier Anfragen pro Minute absetzen. Wir haben versucht so viele Daten wie möglich zu sammeln. Vor der Wahl hat Facebook angefangen ihr Transparenzarchiv zu veröffentlichen mit den Werben und wie viel sie ausgegeben haben. Und über diese Zahlen können wir Quereferenzieren, dass wir ungefähr 80 Prozent haben. Das Schöne aus dem Transparenzreport ist, wir können daraus ableiten, welche Daten uns fehlen. Und in Kombination haben wir damit nun eigentlich komplette Abdeckung aller Facebook-Daten. Bei Twitter bekommen wir 100 Prozent der Daten und haben alle diese Daten in einem einfach verarbeitbaren Format wieder veröffentlicht. Und bei Google haben wir auch alle Daten, weil wir die via BigQuery bekommen. Was uns aufgefallen ist, dass viele der Werbeanzeigen bei den fehlt der tatsächliche Content. Was angezeigt wird ist, ob die Anzeige durch Google oder eine Partner gekauft wurde und wenn es durch ein Partner gekauft wurde, dann ist der Content nicht in der Datenbank. Das heißt, uns fehlen dort die Informationen, wenn das über einen Drittpartner eingespiesen wird, was eine schöne Lücke ist, die ausgenutzt werden kann, um solche Erz zu verstecken. Es ist uns nicht klar, ob das eine technische oder eine Vorgabenlimitation ist. Aber was wir wissen, ist, wir haben nur die Inhalte von ungefähr 70 Prozent der Einträge dieser Datenbank, die halt direkt über Google-Splatform eingegeben wurden. Eine der ersten Aufgaben, die wir machen wollten, ist, die sementische Bedeutung zu den Anzeigen hinzufügen. Wir haben mit ein paar verschiedenen Techniken rumgespielt, ein bisschen Natural Language Processing und was am Ende geklappt hat, ist eigentlich eine einfache Variante. Die meisten dieser Anzeigen haben eine URL hinterlegt und die meisten dieser URLs zeigen auf irgendwelche Services von Trittanbietern wie Eventbrite oder wenn man Spenden sucht, etwas wie ActBlue und für Republikanen gibt es auch zwei, drei Zahlungsverarbeiter. Also was wir gemacht haben, ist einfach die wichtigsten URLs angeschaut und manuell angemerkt, welcher Gruppe diese Werbung zuzuordnen ist und herausgefunden, ob das einfach eine informationale Werbeanzeige war oder ob das Ziel der Anzeige war, Kontaktdaten von Leuten herauszufinden, Telefonnummern, damit man sie beispielsweise für Spenden rekrutieren kann oder für Unterstützung und schlussendlich Bewegungswerbung, die die Leute zu bringen soll an Rallys teilzunehmen oder direkt zu unterstützen und weiter, als die direkt zu Spenden aufrufen. Eine weitere Kategorie waren normale kommerzielle Werbe anzeigen, wie zum Beispiel für Solarpanels, die aber eine gewisse politische Zuordnung haben. Was wir machen konnten, war für ungefähr 75 Prozent der Werbung konnten wir mit etwa 96 Prozent Präzision kategorisieren, in welch Kategorie etwas gehört. Wie für die Werbenden waren wir in der Lage bei Facebook für rund 75 Prozent, bei Google für rund 80 Prozent einzuordnen, welcher Kategorie dieser Werbende angehört, beispielsweise ein Pack oder eine Gewerkschaft oder eine For-Profit-Unternehmen und konnten dort relativ sinnvoll anhand der Bezeichnung einordnen, in welche Gruppe ein Werbendeck gehört. Und für Twitter mussten wir das manuell machen. Gut, damit können wir nun anfangen, Dinge zu analysieren. Das erste war ganz einfach, wir haben die Größe der Anzeigen angeschaut. Was aufgefallen ist, ist, dass die Mehrheit der Anzeigen auf allen Plattformen zwischen 0 und 100 Dollar waren. Das nennen wir microtargeted Werbeanzeigen. 0 bis 1000 Leute, die sehr sehr kurzlebig sind und sehr sehr präzise gezielt auf eine spezielle Domografie sind, microtargeting halt. Die Mehrheit der Werbeanzeigen, insbesondere auf Facebook, gehört in diese Kategorie. Es bestätigt auch diese allgemeine Presseberichterstattung, die über microtargeting gesprochen hat. Weiter konnten wir anhand dieser Kategorisierung herausfinden, wie die verschiedenen Plattformen genutzt wurden. Das Problem ist, dass verschiedene Kategorien in diesen Datenbanken vertreten waren. Zum Schluss können wir anschauen, welche Typen werbetreibender auf welcher Plattform aktiv sind. Was schwierig für uns ist, ist, dass zum Beispiel Facebook viel mehr kommerzielle Werbeanzeigen in den Transparenzarchiven hinterlegt hat als die anderen, 45 Prozent hier. Zuletzt, was wir aufzeigen können, ist der Ramp-up zu den Wallen, wie das immer größer wurde, dass die Abgabe für unser Paper war am 6. November, deshalb haben die Grafik bis dann weitergezogen und seither nicht mehr weitergemacht. Die Linie ganz oben im Grün, das sind sogenannte Move Ads, die eine direkte Aktion der Empfänger provozieren sollen, die sich zum Ende entwickelt haben, die sehr präzise auf einzelne Personen abzielen, die wissen, wo die Person lebt und sie ganz spezifisch dann beispielsweise für die nächste Wahlstation angesprochen haben. Das insbesondere gegen das Ende der Kampagne. Hier ein Gleiches mit Gleichen zu vergleichen. Was wir gemacht haben, ist, die Werbetreibenden einzuschränken und nur auf die bundesweiten Kandidaten einzuschränken. Und hier habt ihr ungefähr eine Anzeige, wie die Scala dieser Werbung ist. Wenn man das hier einschränkt, dann sieht man immer noch, dass auf Facebook sehr viel mehr Werbetreibende aktiv sind als auf Google und sehr viel mehr Werbe anzeigen sind, als auf Google. Die Ausgaben sind aber in einem ähnlichen Rahmen, weil bei Google sind die Zahlen auch etwas weniger präzise, weil Google dort nur einen wöchentlichen Report rausgegeben hat. Schließlich die Zahlen bei Twitter sind viel kleiner, sowohl wenn es um die Durchschnitte geht, als auch Anzahl Werbetreibender. Was wir daraus schließen konnten, ist, dass viele der Effekte nur eine Verzerrung sind aufgrund der Daten in unserem Archiv. Dass das keine Verzerrung sind, der dann in den Archiven, auch wenn wir das auf bundesweite Kandidaten einschränken, dann sehen wir immer noch, dass sehr viele Microtargeted Ads dieser in diesen Plattformen vertreten sind. Das ist natürlich abhängig vom Kandidaten von der Gruppe und man sieht beispielsweise bei jemandem, wie Präsident Trump das sehr viel Microtargeting gemacht wurde, 90, 95 Prozent der Werbeausgaben. Wenn man sich andere Kandidaten anguckt, dann machen die viel weniger Microtargeting. Man kann hier die Strategie der einzelnen Kandidaten ableiten. Sieht aber immer noch durchspannt, dass Microtargeting etwas sehr Populäres ist. Wir können außerdem darauf schauen, worauf Geld verwendet wurde in den unterschiedlichen Plattformen und daran sehen wir ganz gut, wie die verschiedenen Plattformen verwendet werden. Bei Google wurden deutlich mehr Spenden gesammelt, aber dafür gab es weniger Informationen als zum Beispiel bei Facebook. Bei Twitter haben wir einen sehr schmalen Datensatz, aber wir sehen, dass es hier sehr viel mehr darauf abzielt, Leute miteinander zu verbinden. Außerdem war es uns recht wichtig auf Facebook zu schauen, wo wir die regionalen Daten besser nachvollziehen können, um hier zu sehen, wie der Facebook-Advertiser eigentlich funktioniert. Hier können wir sehen, dass die Kampagnen eigentlich immer startenbasiert sind. Sie haben immer in einem Staat operiert und die meisten Anzeigen werden den Leuten gezeigt in den einzelnen Staaten, die tatsächlich wählen. Wir können außerdem sehen, dass es in vielen Staaten Spenden gesammelt wurden, deutlich mehr als an Staaten auch getargetet wurden. Es wurden recht wenig Staaten angemeldet. Hier können wir beispielsweise sehen, Texas ist ein sehr konservativer Staat und dort wurden besonders viel online auch Spenden gesammelt. Das war für Trumps Wahlkampf sehr wichtig. In den USA sind eigentlich alle Spenden dem zentralen Wahlkommittier gemeldet werden. Dadurch können wir das ganz gut nachvollziehen. Wir konnten sehen, dass Trump 52 Prozent seiner Spenden aus Texas bekam und nur 48 Prozent aus den anderen Staaten. Während das bei den Liberalen eher anders ist, kommen viele Staaten aus New York, California, in Washington. Es zeigt, dass es recht effektiv ist, durch Online-Werbung kleine Spenden zu bekommen. Das letzte worüber ich reden möchte, ist das Ad Targeting, also die Zielgruppen-Specific. Bei Facebook ist es so, dass man einen Browserplug installieren kann. Das sorgt dafür, dass die Werbung kategorisiert wird bei den Ad Targeting. Wenn ihr so eine Werbung in Facebook seht, wisst ihr, dass ihr oben rechts klicken könnt, warum ihr dafür getargetet wurdet. Innerhalb von Europa ist es übrigens erheblich bestätigt worden durch die DSG-Vorgabe. Sie werden euch insbesondere die beiden größten Kategorien für diese spezifische Ad zeigen. Das ist ziemlich interessant für als Nutzerin auf Facebook. Also seht euch das regelmäßig an, das ist schon spannend und ziemlich augenöffnet. Insbesondere seht ihr gut, wie die Ebenen vom Targeting und nachher von Marketing funktionieren und von Werbe betreiten sind. Dann seht ihr insbesondere gut die Gründe, warum ihr diese Werbung seht. ProPublica hat dieses Browserplug in und damit einen Datensatz erhoben durch diese Freimelegen. Wenn ihr also Facebook habt, wenn ihr in den Vereinigten Staaten seid, könnt ihr das mit diesem Plug-in uns sehr helfen, politische Werbung zu verstehen. Also haben wir ProPublica's Datenmenge genommen und mit Facebooks Ad Transparenz Archiv zusammenpackt. Dafür brauchen wir aber Ad-IDs, die geben sie auf ihre API. Nicht her, aber auf dem Scrape sind diese IDs und dann können wir hinterher einfach auf die ProPublica Daten joinen und haben dabei 75% dieser Werbung so verknüpfen können. Und haben aber im ProPublica Archiv auch reichlich Werbung gefunden, die nicht in dem Transparenz Archiv von Facebook zu finden war und sehen damit auch was im Facebook Transparenz Archiv fehlt. Das kann natürlich auch annehmen, der Voreingenommen hat, dadurch liegen, wer diese Plug-ins überhaupt installiert. Das ist genau das, was wir hier eingestehen müssen, dass dieser Datensatz natürlich ein BIAS drin hat. Das ist nicht eine gute Schnittmenge über den gesamten Facebook-User, aber es ist das Beste, was wir haben. Wir haben das kollabiert in drei verschiedenen Kategorien an Targeting, nämlich das einen typischer Weg für euch, die Facebook-Targeting nicht kennt, dass ihr könnt einerseits Targeten nach Interessen oder Segmenten wie Alter oder Geschlecht. Das ist ein generischer Weg und anderer Weg ist Listen. Ihr könnt auch Daten hochladen wie Mail-Adressen oder Telefonnummern, um diese User zu identifizieren. Facebook findet dann das Profil und targett diese Leute. Sie erzeugen dann davon ein Publikum für diese Werbung und strahlen denen diese Werbung aus. Die letzte, größte oder große Form, die Facebook als Targeting hat, sind sogenannte Lookalike. Sieht ähnlich aus Publikums. Wir starten also mit einer Liste von Telefonnummern, Mail-Adressen und dann versucht Facebook für uns andere NutzerInnen zu finden, die ähnlich sind wie diese Nutzer. Das ist ein Lookalike Publikum, wie es Facebook anmietet. Wenn wir das jetzt kategorisieren und so nach den Werbebetreibenden unterteilen, sieht ihr hier diese Verteilung, bei For Profit wird in der Regel nach Interessen und Segmenten getargetet. Sie wissen also, dass nicht im Lookalike-Sumlist zu beschreiben, sondern halt mehr nach den Interessen. Während die politischen Kandidaten natürlich reichlich solche Listen mit Telefonnummern und Namen haben und in Facebook auch benutzen. Das war auch der Verdacht, den wir hatten, aber es ist gut zu sehen, dass diese Daten das so auch quantifizieren. Es macht auch Sinn, wenn man so eine Liste von Personen hat, dann das zu erweitern mit ähnlichen Leuten über diese Lookalike-Auditions. Was anderes was wir tun können, ist das Gopieren nach Absicht dieser Werbung. Und da seht ihr die Differenz sehr, sehr deutlich, dass halt kommerzielle Werbung weiterhin primär zu drei Vierteln nach Interesse getargetet wird, während die anderen eher über Listen von Usern und ähnliche User gehen. Wieder einmal macht das total Sinn, so politische Motivationen über Spenden oder Bewegungen lassen sich mehr so überähnliche Leute tageln. Und wenn man sie dann über die Lookalike-Auditions gefunden hat, kann man sie direkt wieder über List Targeting wieder retargeten, also wiederholt mit Werbung bestrahlen. Das hier macht es also in quantifizierbaren Daten gut transparent, wie US-amerikanisches, politisches Targeting von Marketing funktioniert. Das letzte und das Interessanteste an Story, was ich hier präsentieren möchte, sind die eher dubiosen Werbebetreibenden im Rahmen von politischen Werbung. Wir nennen sie also hier höflich die neuen Typen von Werbebetreibenden. Das erste, was ihr erwarten würdet, sind also Astroturfing. Leute, die behaupten wollen, dass es ein Grassroots-Movement wäre, aber das über Marketing und große Vereinigungen machen. Wenn man sich also diese Gruppe hier etwa ansieht von Bürgerinnen für Tabakrechte, ja, da würde man auch erwarten, dass das keine tatsächliche Grassroots-Movement sind und das ist auch das, was sich bei dieser Werbung erwarten wird, dass es daher kommt. Wenn wir uns also diese Werbung ansehen, das ist schon ziemlich ehrlich, es ist schon ziemlich klar, worum es geht. Aber und die Webseite gibt auch klar her, dass sie von Philip Morris betrieben wird, also etwa den Hersteller von Marlboro. Das ist also auch einfach eine Seite, die von Philip Morris betrieben wird. Das erzeugt ein großes Problem mit Facebooks Transparenzer-Archiv. Das von Facebook, der überprüft wird, da kann jede reintippen, was sie möchte in den Disclaimer und Facebook wird es genauso dann auch betreiben und es zu überprüfen. Sie werden euch blocken, wenn ihr behauptet, dass ihr Facebook, Instagram oder Max Ackerberg seid, aber ansonsten gibt es da ziemlich wenig Überprüfung. Als wir das also gefunden haben, haben wir das höflich freundlich privat an Facebook mitgeteilt. Und ein Reporter hat dann versucht, als diese 100 Senator in Werbung auf Facebook laufen zu lassen und Facebook hat sie alle durchgelassen. Google macht das anders, Google überprüft tatsächlich diesen Disclaimer-String, entweder über Steuer-ID-Number oder über die ID ist für so bundesweite Wahlkomitees, die beide angegeben werden müssen. Das macht es also auch einfach, diese Advertiser auf Google zu identifizieren. Auf Facebook, da sie tippen können, was er wollen, macht es das wesentlich schwieriger. Oder sogar unmöglich, wenn der Disclaimer halt nicht zu nutzen ist. Das ist definitiv ein Problem, wenn wir diese Lobby-Organisationen haben, die eigentlich einfach lügen können, wer für diese Facebook-Werbung zahlt. Was wir auch gefunden haben, sind Junk-Media-Outlets, profitorientierte Organisationen, die sagen, dass sie News machen, aber eigentlich ist es gar nicht News, es ist einfach Quatsch oder Propaganda, die sie rauslassen. Beispielsweise die New American Media Group LLC, die auch unter Democracy Now verkehrt. Und was die gemacht haben, ist, die haben diese Werbung hier angezeigt. Wir haben angeschaut, was das für Limited Liability Corporations waren und das waren einfach Briefkastenfirmen. Die Atlantic hat sich das mal näher angeschaut und Alexis Merrick war dort in der Lage, da sich auch zu finden, wer hinter diesen Briefkastenfirmen steckt. Was sich rausgestellt hat, ist, das war eine Werbeagentur, die einfach verschiedene Organisationen aufgezogen hat, die wie Grassroots-Movements ausschauen sollten und die Zielgruppe von den Republikanern hatten, damit ein Publikum aufbauten und dieses Publikum dann mit sehr demokratisch angehauchten Botschaften beliefert haben. Die Firma dahinter nennt sich Motive AI und der Versuch ist, dass sie das demokratische Cambridge Analytica werden wollen. The National hat ebenfalls eine Untersuchung gemacht und hat rausgefunden, dass gewisse werbetreibende das auch rausgefunden haben. Also wenn die Werbung auf Google geschallt haben, dann waren sie ehrlich im Disclaimer-String, auf Facebook hingegen nicht, weil sie wussten, dass es nicht kontrolliert wurde. The Texas Tribune hat eine ganze Gruppe von Werbetreibenden offengelegt, die solche Propagande verbreitet haben. Eine Stelle, die er hinter rausgefunden wurde, ist DGCO LLC und offenbar war das auch einfach eine Werbeagentur, die von einer, die bezahlt wurde, um diese Botschaften rauszuschicken und dabei verbarg, dass das einfach eine Werbeagentur war. Das ist, was wir am Ende so summiert haben, nachdem wir uns verschiedene Archive angeguckt haben. Wir konnten vor allem die guten werbetreibenden herausfinden und weniger die mit der schlechteren Werbung. Keine dieser Archive, dass wir benutzen können, ist wirklich gut. Alle von ihnen haben Probleme. Bei allen fehlt irgendwas. Bei Facebook fehlt Target Information. Google lässt viel vom Inhalt aus. Bei Twitter ist einfach das Problem, dass jemand fehlt, der dafür angestellt ist, sich darum zu kümmern, dass es auch tatsächlich, ja, dass dieses Archiv, ja, wir müssen Druck machen, dass Twitter, Google und Facebook ihre Archive verbessern. Ich weiß, dass es Leute in den Firmen gibt, die versuchen, diese Transparenzarchive wirklich zu bauen, aber das funktioniert leider nicht so gut, weil es diesen Firmen nicht so richtig wichtig erscheint, diese Transparenzarchives-Archive zu bauen. Genau, wir hoffen, dass wir die nächsten Wahlen dann besser verstehen bzw. auch die 2018er Wahlen besser verstehen, weil da die Datensätze jetzt schon aktueller sind und irgendwie besser zu erheben, als es bei den Wahlen davor war. Es gibt mehr Druck auf die Firmen von Technikern und anderen Stellen, diese Archive zu verbessern. Hier seht ich noch mal meine Mitarbeiter. Sie waren heute leider nicht auf der Bühne, aber sie haben viel von der Arbeit mitgemacht. Sie haben viel von den Daten mitanalysiert und nun eröffne ich für die Fragen. Okay, wir beginnen mit ein paar Fragen aus dem Publikum Mikrofon 6. Habt ihr auf Verbindungen zwischen den Werbenden geschaut und verwenden Sie Bilder zum Beispiel? Das ist eine der Analysen, die wir gerade machen, zum Beispiel über Clustering von den Bildinformationen zu finden. Also das Problem ist, dass diese Werbe betreibenden verschiedenen solcher Proxy-Unternehmen ausgründen und die müssen wir versuchen zu klustern. Sie haben verschiedene solche LSEs gegründet, wie ihr gerade gesehen habt in dieser Media Corporation, die aber einfach alle diese Bewerbungen scheiden. Gut, danke sehr. Wenn ihr Fragen habt, bitte stellt euch bei den Mikrofonen in Schlangen. Danke für den Talk. Es war bisher der Beste, den ich hier gesehen habe. Zwei Fragen. Erstens, warum gibt es diese Transparenzarchive? Ist dahinter irgendeine politische Agenda politischer Druck? Und zum Zweiten, welche Daten sind für Europa da? Also ich bin nicht intern in den Unternehmen, also kann ich nur spekulieren. Warum es diese Archive gibt? Ich denke, es war einfach nur eine Reaktion von Zuckerberg und hohen Leuten in Google und Twitter, die versuchen, sich selbst zu regulieren, bevor in regulärem Aufgedrückt werden. Also es geht hier wieder einmal auf den Druck, den wir auf sie ausüben können. Und so gehen sie jetzt also auf Transparenzarchive, um nicht dazugezwungen zu werden. Solange die Briten noch in der EU sind, Facebook versucht in Brasilien und UK ihre Werbung, also auch die Transparenzarchive in diesen Ländern zu machen, aber auch in anderen Ländern innerhalb der EU. Das geht auch wieder um den Druck, der politisch auf sie geht. Es gibt auch wieder, also ich habe hier noch einmal, es gibt nur für die Vereinigten Staaten so eine API. Und es gibt auch nur für die Vereinigten Staaten so einen Transparenzreport. Manche dieser Zahlen, die wir genau wissen, sind halt relativ wenig, weil wir solche großen Ranges angegeben sind, die ihr in den Ausgaben gesehen habt. Also relativ vieles davon erfordert noch weiter politischen Druck auf diese Unternehmen. Gut, danke sehr. Mikrofon Nr. 2 bitte. Du hast erwähnt, dass es auf den Donations, ich denke es macht Sinn, um die Daten zu kombinieren. Du hast mit dem, was sie haben, zu schauen, ob die Elektronik ausgespült ist, ob die Elektronik ausgespült ist, ob die Ausgaben ausgespült ist, und so weiter. Ja, eigentlich, das ist das Nr. 1 Projekt auf unserer Roadmap, das ist, dass eigentlich Google die FEC-Information hat, und sie haben Google hat die Informationen aus FEC bearbeitet und zugänglich gemacht in ihrem eigenen proprietaryen Datenmangsystem, Victory, und dann haben sie halt die Daten aus den FEC-Daten und ihre eigenen Werbedaten zusammengetan, und das berichtet. Und wir versuchen jetzt also zu verstehen, wie effektiv diese Spendenwerbeaufrufe sind dabei tatsächlich. Danke, Mikrofon Nr. 4. Hallo, danke für den Talk. Es war sehr interessant. Ich habe mich gefragt, ob es weitere Untersuchungen gibt von anderen Wissenschaftlern, die die politischen Wichtigkeiten dieser Werbekompanien haben. Wir sind uns bewusst über andere Teams, die sich das ansehen, aber wenn sie nicht geoutet werden möchten, wollen wir das natürlich respektieren, also wollen wir es nicht versehentlich tun. An unserer Hauptziele von dem ganzen Bogen an Online-Transparenz Überwerbung ist auch weniger technische Personen in die Lage zu bringen, dass sie diese Daten ansehen können und analysieren können. Wir haben also hart daran gearbeitet, die politischen Wissenschaftler auf den neuesten Stand zu bringen, was hier die Daten hergeben können. Aber der momentanen Zugang, insbesondere wieder mit dem Non-Disclosure Agreement von Facebook, das heißt, wir können die Daten nicht weitergeben, macht es erheblich schwieriger, das tatsächlich in Realität umzusetzen. Ich würde also gerne genug Druck auf Facebook ausüben, um irgendeine Reaktion zu kriegen. Eine Frage aus dem Internet, bitte. Nomad fragt, warum sind diese Werbungen politisch oder warum meint ihr, sie sind politisch? Habt ihr euch den Inhalt angeschaut und dann konkludiert, dass der Inhalt politisch ist? Gute Frage. Relativ viel davon geht auf die Taktiken, die benutzt werden. Sie erzeugen diese Gemeinschaften, die aussehen, als wären das Grassrootsbewegungen. Bis vor einer kurzen Weile gab es auf Facebook keine Zeile, die dieses New Media LSE angezeigt hätte. Das heißt, es konnte tatsächlich aussehen, dass werden das viele kleine Grassroots-Movements. Und das ist so der schwierige Anteil. Und wenn man dann auch nicht sehen kann, warum man davon getargetet wird, war es relativ einfach, Leute herzuzubringen, dass sie ohne zu verstehen, was ihnen da eigentlich gerade passiert, sich in diese Grassrootskampagnen mit einwerfen. Und dann haben wir uns halt auf diese Kampagnen geworfen, um diese Idee von nur Fake Grassrootsbewegungen endlich ausheben zu können. Mikrofon Nummer 3, bitte. Ich interessiere mich dafür, wie effektiv diese Werbung sind, die auf Facebook und so veröffentlicht werden. Ist irgendeine Gruppe wie ProPublica oder andere? Schreiben die auf, wie viele Leute sich das angeschaut haben, wie oft es geteilt wurde, so dass man irgendwie sehen kann, dass diese Fake Grassroots-Communities, ja, Dinge aufbauen, seiten etc. Auch wieder eine sehr gute Frage. Dass wir andere Leute ermutigen möchten, dass sie sich ansehen. Relativ viel dieser Informationen werden nicht hier gezeigt durch die Transparenzarchive. Das wäre also eher Bestandteil der eben nicht Werbeinformation, sondern der organischen Information auf Facebook, denn du sprichst ja gerade von Likes und Shares. Es wäre also interessant zu sehen, wie man diese Daten erst mal erhebt und sammelt übermacht, effizient scrapen könnte. Das ist ziemlich schwierig. Und man arbeitet da halt gegen die Anti Scraping Teams in Facebook, Google, Twitter. Das macht es also ziemlich schwierig. Wir versuchen da Pilot, ein Pilotverständnis sozusagen auf die Wege zu bringen. Ein Teil der ProPublica, Leute haben versucht zu crowdsourcen, wie Leute damit interagieren und das dann irgendwie zurückzuspielen. Dann müssen wir halt eine Strategie finden, wie man diese Information bereinigt, denn da wird auch sensible Informationen drin sein. Also müssen wir sehr, sehr vorsichtig damit umgehen, weil wir versehentlich sensible Informationen in der Hand haben könnten, als wenn es zu dem Punkt klar ist. Es ist also etwas, was wir effektiver Facebook-Überzeugung sagen zu tun. Ich kenne die Aussicht. Letzte Frage von Mikrofon Nummer 1. Am Anfang deines Talks hast du erklärt, wie Russland die Wahlen beeinflusst hat. Ich interessiere mich dafür. Gibt es irgendwo in dem, was du vorgestellt hast, Evidenz, Hinweise darauf, dass es wirklich Russland oder China war? Leider veröffentlichen die NSA ihre Informationsquellen, nicht. Aber die Informationen, die wir von Robert Muller von der Untersuchung haben, enthalten ein bisschen mehr Informationen. Wir können nicht hundert Prozent einstimmig der Meinung sein, dass das garantiert Russland war. Es könnte auch einfach nur proxene False Flag Operation sein, aber die Indikationsbehandlung. Damon McCoy, thank you very much. Please give him a round of applause. Damon McCoy, danke sehr. Bitte gebt ihm eine Runde Applaus.