 Mein Name ist Paul. Ich bin hier aus Dresden, aus dem Open Data Lab oder Code for Dresden. So in der Ecke kann man mich hier finden. Und ich beschäftige mich ein bisschen so mit dem maschinellen Lärmverfahren. Und wollte heute mal, weil es ja um Datenspuren, was ja darum geht, ein bisschen darum kümmern, das Leuten näher zu bringen, was das eigentlich heißt, wenn Maschinen lernen. Wer von euch ist Selberprogrammierer? Wer codet selber? Und wer ist... Ja, in euch? Ja, frag an euch. Also ungefähr nur die Hälfte, das ist gut, das hatte ich so gehofft. Ich will nämlich ein bisschen so ganz einfach die ganze Sache erklären. Die Leute, die selber programmieren, die werden lachen. Das ist auch manchmal so gewollt. Wenn wir über schlaue Computer reden, dann reden wir eigentlich darüber, dass sich Mathematiker vor allen Dingen, das sind die schlauen Menschen gewesen, Gedanken gemacht haben, wie man Zahlen und Computer können nur Zahlen verarbeiten, wie man also im Computer Zahlen so verarbeitet, dass dann irgendwie halbwegs cleverere Antworten kommen. Und clever ist dann in dem Fall Definitionssache. Wer bei Amazon zum Beispiel einen Kühlschrank kauft, der bekommt dann ja unten angezeigt hier. Das könnte sie vielleicht auch interessieren. Und dann sind vielleicht Kühlschrank Magnete dabei und so. Und das ist dann schon die Cleverness, die bei Amazon im System steckt. Das ist also ein maschinelles Lernverfahren, das der Computer rausbekommt. Okay, also wenn jemand einen Kühlschrank kauft, dann ist das relativ wahrscheinlich, dass er auch Kühlschrank Magnete brauchen könnte. Und dann schlage ich ihm das vor. Das ist das, was heutzutage das maschinelle Lernen ist. Und als Beispiel für ein Algorithmus für das Verarbeiten von Zahlen für die Leute, die nicht selber programmieren, wie gesagt für die Leute, die selber programmieren, ist das jetzt wirklich zum Lachen. Ich will es aber trotzdem mal zeigen für die Leute, die das nicht wissen so. Ein Computer ist nicht sonderlich schlau, aber ein Computer ist wahnsinnig schnell. Und diese Geschwindigkeit, diese Schnelle, dieses Parallele, dass der einfach wahnsinnig schnell Zahlen oder Buchstaben verarbeiten kann. Das wird in ganz vielen Algorithmen genutzt. Und als Beispiel möchte ich mal das Beispiel zeigen, wenn der Computer, wenn ich jetzt ein Algorithmus schreiben soll, der z.B. eine PIN redet. Ihre PIN von ihrer EC-Karte. Sagen Sie mir mal Ihre PIN. Ich gehe mal davon aus, es ist die 4521, als Beispiel. Wenn ich jetzt ein Algorithmus schreiben müsste, der diese PIN redet, dann sind das genau die drei Zahlen danach. Dann sage ich dem Computer nämlich einfach nur, probiere einfach alle Zahlen von 0 bis 10.000 durch. Und wenn die Zahl, die der Computer jetzt gerade dann hat, mit ihrer PIN übereinstimmt, dann ist das die Geheimzahl fertig. Die Ausführung auf meinem kleinen Laptop hier dauert so lange. Es ist also 0,00 irgendwas gewesen. Und genau so funktioniert es auch, wenn irgendjemand eine Passwortdatenbank irgendwo klaut und da wird einfach nur durchprobiert. Und der Computer ist eben einfach so schnell, dass er das schafft, in überschaubarer Zeit zu lösen. Und das ist genau auch der Punkt, der für viele maschinelle Lernverfahren, also das heißt, woher kommt die Cleverness jetzt am Computer, kommt oftmals einfach nur daher, dass er ziemlich schnell Zahlen vergleichen und zusammenrechnen kann. Und ein Mathematiker oder ein Programmierer hat sich dann mal hingesetzt und gesagt, okay, wenn du so schnell bist, dann brauche ich dich jetzt mal, um eine Million Zahlen miteinander zu vergleichen. Und dann werden die verbunden. Wie und welche Verfahren es gibt, habe ich mal so eine kleine Übersicht. Wir gehen das zusammen mal durch. Also das einfachste Verfahren ist das Erste, das nennt man Überwachteslernen oder im englischen Supervised Learning. Da sage ich dem Computer einfach, pass auf, die und die Zahlen, die sind gut und die und die Zahlen, die sind schlecht. Und immer wenn eine neue Zahl kommt, dann weißt du ja dann, ob das gut oder schlecht ist. Also ich sage ihm vorher, was ein Ergebnis ist, was ich haben möchte. Und der Computer gibt das dann so wieder mit neuen Zahlen, die er noch nicht gesehen hat. Als Beispiel könnte man ein Bildverarbeitungsalgorithmus nehmen. Ich lerne im Computer, wie Tassen aussehen. Ich zeige ihm also 100 Tassen. Alle, die in meinem Schrank sind, von meinem Nachbarn noch, die mit, alle aus meinem Haus, mache ich ein Foto von den Tassen und sage dem Computer, so sehen Tassen aus. Und immer wenn er eine neue Tasse sieht, soll er mir möglichst sagen, ob das eine Tasse ist oder nicht. Das wäre zum Beispiel Supervised Learning. Unüberwachtes Lernen an Supervised Learning ist dann schon ein bisschen was anderes. Da bräuchte im Computer nämlich gar nichts sagen. Der sortiert sich das selbst. Wir gucken uns vor allem das Beispiel an. Und Reinforcement Learning, bestärkendes Lernen, das ist so, wie wir unsere Kinder großziehen. Wenn die laufen und das schaffen bis zum Papa, dann sagen wir, das hast du gut gemacht. Dann freut sich das Kind, das lacht. Und das ist, mal wird es das vielleicht wieder genauso versuchen. Genau das ist der Hintergrund hinter diesem Reinforcement Learning. Man sagt im Computer, du bist so schnell, machst einfach eine Million Mal und irgendwas davon wird schon so gut sein, dass du zum Ziel kommst und dann sage ich ihm, das war jetzt das Beste, was du kannst. Und dann nimmt er das und macht das einfach nochmal nach oder besser. Grundsätzlich sagen die Statistiker, dass eigentlich alle Modelle, so Rein programmiert, dem Computer sagt, dass die falsch sind. Aber einige sind doch eben nützlich. Und das wird man jetzt auch sehen anhand der ganz einfachen Beispiele, die ich zeigen möchte, was damit gemeint ist. Wie gesagt, wir fangen an mit dem Superweis Learning. Wir haben, oder die Algorithmen, wie laufen die ab? Ganz links oben sind Trainingsdaten, zum Beispiel Text, Dokumente, Bilder, was ich gerade erzählt habe, und so weiter. Unten links sind ein neues Text-Dokument. Als Beispiel werde ich jetzt mal sagen, ich möchte ein Spam-Filter programmieren. Der Google Spam-Filter ist also ein maschinelles Lernverfahren. Der soll also selber rauskriegen, ob das Spam ist oder nicht, und das in den richtigen Orner sortieren. Dann hat er da links oben Trainingsdaten, die er bekommt. Das hat also mal ein Google-Engineur dann gemacht und er holt dann sogenannte Feature-Vector raus. Feature-Vector für Spam als Beispiel. Die große Kunst ist das Feature-Engineering. Rausholen aus diesen Daten, was ist das Entscheidende? Wenn ich jetzt Spam-Erkennung machen müsste, zähle ich einfach, wie oft das Wort Viagra in der E-Mail vorkommt. Wenn bei Viagra mehr als eins in dem E-Mail-Text, dann Spam. So einfach wäre ein Algorithmus. Damit werden Sie jetzt Google nicht ausperformen, aber es ist eine Möglichkeit, Spam zu erkennen. Diesen Feature-Vector labeln Sie, wie gesagt. Sie sagen, wenn Viagra in der E-Mail vorkommt, dann ist das Spam. Das Ganze packen Sie in ein Machine Learning Algorithmus. Und jetzt ist nämlich der Clue. Für jede neue ankommende E-Mail kann dieser Algorithmus dann sagen, ob das Spam ist oder nicht. Das heißt, eine neue E-Mail, die ankommt, wird automatisch gelabelt, ob Spam oder nicht. Das ist das Spam im Rahmen von Computern. Wir machen das einfache Beispiel. Ein Freund hat mich darum gebeten, der ist im Finanzwesen. Er hat gesagt, wenn ich schon Beispiele durchfeuere, dann nehme ich gleich was aus dem Bankenwesen. Wir nehmen das Beispiel Kreditwürdigkeit. Ich bin also eine Bank. Sie kommen alle zu mir und fragen mich, ob ich ihnen Geld leihen würde und falls ja zu welchem Zinssatz. Wir haben hier als Beispiel die Punkte. Das ist also das, was Sie bei Ihrer Bank für einen Kreditantrag wahrscheinlich gefragt werden. Was ist das monatliche Einkommen? Wie viel Geld wollen Sie denn haben? Was ist der Kreditbetrag? Was ergibt sich dann über die Laufzeit für eine monatliche Rate? Das sind also die Features, die ich daraus hole aus dem Datensatz. Der Datensatz ist der Datensatz, der kommt jetzt an. Er hat gesagt, wir brauchen jetzt das Wichtigste von dem. Und ich habe jetzt gesagt, okay, für mich ist das Allerwichtigste zu wissen, wir sehen auf der X-Achse das freie monatliche Einkommen. Das kriegt eine Bank relativ leicht raus. Das sieht ja, was im monatlichen Gehaltsengang ist und sieht dann, was an dem Tag vorm Gehaltsengang noch auf dem Konto ist. Dann weiß es also, was das freie monatliche Einkommen ist von jedem Einzelnen hier im Raum. Da oben auf der Y-Achse ist die angefragte monatliche Kreditrate, die logischerweise aus Kreditbetrag und Laufzeit ergibt. Und jetzt sind das alle Leute, die auf den Datenspuren sind, haben sich jetzt bei der Bank gemeldet und fragen nach einem Kredit. Das sind jetzt 500 Bankkunden, die danach fragen, ob sie von der Bank einen Kredit bekommen. Und jetzt, wenn man sich das so einguckt, wem würdet ihr jetzt einen Kredit geben? Also eher jemand, der links oben ist und jemandem rechts ist. Ich bin um Zwischenrufe lauter. Rechts unten? Warum? Genau, das ist genau die Logik, die man als Mensch, man guckt drauf und sagt, na ja, ist ja Logo. Wenn jemand 200 Euro jeden Monat übrig hat, also wir sind jetzt hier, wenn jemand 200 Euro jeden Monat übrig hat und nur 100 Euro dann zurückzahlen will mit Kredit, das schafft er. Dann kriegt er den Kredit. Ein Kollege hier, der hatte Monat hier minus 20 Euro auf dem Konto und fragt aber noch eine Kreditrate von 160 Euro. Das ist sehr unwahrscheinlich, dass die Bank dem Geld leiden. Das ist jetzt also das Feature Engineering. Das holt man sich aus den Daten raus, die der Kunde bei der Bank hinterlegt hat und kann dadurch entscheiden, und das machen wir jetzt, kann damit entscheiden, ob der einen Kredit bekommt oder nicht. Wir schauen mal von dem Beispiel unten weg. Wir haben jetzt also genau diese Darstellung aus der PowerPoint. Und jetzt gibt es hier so ein Superweis Learning Algorithmus, der heißt Support Vector Classifier. Der macht nichts anderes als ich bin falsch und zwar hier muss ich hin. Der macht nichts anderes als und ich versuch das dir jetzt nochmal nachzubauen. Ich sage also, ich habe hier die Leute die label ich jetzt übrigens, die weißen Punkte sind die, die ich Kredite geben würde und die schwarzen Punkte sind die, den würde ich nicht unbedingt einen Kredit geben. Ich habe da jetzt Wissen reingesteckt, ich habe nämlich weiß und schwarze Punkte verteilt. Das ist genau das, was gerade hier passiert ist. Innerhalb von 10 Sekunden guckt ein Mensch drauf und sagt, na ja, ist ja logisch. Den gebe ich Geld und den gebe ich kein Geld. Und wenn wir in einer anderen Bank sind und tausend Kreditanfragen pro Sekunde haben, dann soll da kein Mensch mehr sitzen, der jeden Antrag durchblättert und sagt, ähm, ähm, ähm, sondern die Entscheidung muss in Echtzeit auf einer Plattform gerankt nach Bank, muss die Prozentzahl und ja, ich gebe Ihnen ein Kredit stehen. Und deswegen müssen das Algorithmen übernehmen. Jetzt findet man hier also so ein lineares Modell dieses Support Vector Machine oder Support Vector Classifier gerade durchzulegen, um das zu teilen, die beiden Gruppen. Und es versucht noch den Abstand jeweils zu maximieren. Denn es wird natürlich Leute geben, die sind hier oben und es wird Leute geben, die zahlen nicht zurück, die sind hier unten. Das ist also das Know-how der Bank. Dieses Modell jetzt im Hintergrund auf den Rechnern zu haben und zu entscheiden, dieses Modell auf dem Rechner zu haben und dann halt gute oder schlechte Kredite zu verteilen. Jetzt ist die Frage nach dem Zinssatz natürlich auch kein Problem. Wenn man die Gruppen schon mal geteilt hat nach guten und schlechten Krediten nehmen, dann kann man natürlich auch das Ganze abstufen. Die da ganz links oben sind, die kriegen den Kredit für 1,9 Prozent und die da ganz unten sind, kriegen den Kredit für 4,8 Prozent. Hat man jetzt schon eine Echtzeitanzeige auf der Webseite für den Kredit, den man anbieten kann. Und jetzt ist die Frage, warum Big Data, also warum gibt es das jetzt noch nicht so lange, die ganze Sache, oder warum heißt das jetzt Big Data? Das sieht man ganz einfach daran. Ich reduziere jetzt die Anzahl der Kunden 500, 200, 100, 20, 10, 8, 7, 6, 2, 3, 1. Und dann sieht man schon, dass die Modelle dann zappeln, wenn das ganz wenig Leute werden. Und das ist der Grund, warum das jetzt seit Neustem sozusagen seit ein paar Jahren nicht excessiv betrieben wird mit dem maschinellen Lernverfahren, einfach weil man richtig viele Menschen braucht, richtig viele Daten, man muss die schnell auswerten und das machen jetzt eben erst die Amazon Cloud oder die Google Cloud. Also, wir haben jetzt 500 Leute, wir haben uns über das Feature Engineering Gedanken gemacht, wir haben die jetzt separiert und wir können jetzt in Echtzeit, wenn wir das Modell sozusagen dem Kunden anbieten würden, der Bank, könnte die Bank in Echtzeit entscheiden, ob es einen Kredit gibt oder nicht oder auch zu welchen Prozentsatz. Und genau das passiert, wenn man mal bei mobile.de oder so ein Auto eingetippt hat und dann finanzieren, dann gibt es also eine Liste, welche Bank zu welchem Kreditsatz anbietet. So, die zweite Sache war Ansüberweis Learning. Das sieht ganz genau so aus, ein kleiner aber feiner Unterschied, den gibt es und zwar hier, war vorher, dass wir das per Hand labeln, das hat man also die weißen und schwarzen Punkte, also ein Beispiel von den Bildfarben und den Tassen, hat ich gesagt, ich muss meine 100 Tassen und die 100 Tassen von meinem Nachbarn muss ich dem Computer zeigen und der kann dann selber entscheiden, wir reden ja hier von einer Million oder 100 Millionen oder einer Milliarden Beispiel, wo soll ich 100 Milliarden Tassen hernehmen und wie lange dauert das, die alle zu fotografieren, in allen Belichtungen von allen Seiten. Also Superweis Learning hat seine Grenzen, deswegen gibt es Ansüberweis Learning und das kommt ohne Labels aus, ich gebe dem Computer also gar keine Info dazu, habe ich auch ein Beispiel vorbereitet und zwar ist es das Gleiche, dass man es auch schnell wieder versteht und wir haben also wieder unser Bank-Experiment, wir haben unsere 500 Kunden und jetzt sage ich, ich habe da 500 Kunden dort rein in diesen Algorithmus und sage ihm, mach dir mal selber Gedanken wie man die beiden oder wie man die teilen könnte in zum Beispiel gute und schlechte Kunden und der Ablauf ist folgender und da kommt wieder das Pin-Raten Beispiel von vorhin, das ist echt simpel, aber im Endeffekt ist das nichts anderes und zwar, ich weiß nicht ob man das sieht, also hier sind zwei größere Punkte, die sind jetzt zufällig hier in die Gruppe geworfen, einfach zwei Punkte rein und guckt, ob diese 500 Kunden eher zu dem oder eher zu dem Punkt passen, also dicht dran sind in der Nähe von dem Punkt sind und jetzt gehe ich in den nächsten Schritt, da hat er das rausbekommen, also wir sind jetzt in einer Größenordnung von, wir sind eine Mikrosekunde später oder so, also das geht jetzt wirklich schnell, jetzt hat der Rechner also gemessen die Punkte hier, die sind alle dichter an dem als an dem und im zweiten Schritt verschiebt da den erst zufällig gesetzten Mittelpunkt einfach in den Mitte von allen Punkten, die jetzt zu ihm gehören, das ist also durch den Pfeil jetzt hier gekennzeichnet, der verschiebt jetzt einfach den Mittelpunkt dahin, dann ist das der neue Bindelpunkt, dann guckt da wieder, bist du dich da bei mir oder bei mir lieber Kunden, also sind sie ein guter oder ein schlechter Kunde, einfach dadurch rot, schlecht, aber sie gehören ja eigentlich viel mehr zu der Gruppe, sortiert das also neu, verschiebt wieder zum Mittelpunkt, sortiert neu und jetzt kann ich, ihr seht da oben die Schritte springen, unten passiert fast gar nichts mehr, also wir sind schon nach 3 oder 4 iterationen, das heißt, wir sind irgendwas in der halben Millisekunde auf meinem Laptop, sind wir fertig, der Computer hat es selber festgestellt, okay, wir haben 500 Kunden, ein paar könnten gut sein, ein paar könnten schlecht sein, ich unterteise einfach mal in der Logik und schlag das der Bank vor. Ohne, dass ich als Mensch dort irgendwelche Informationen reingegeben habe außer die Anweisung dieses mathematische Verfahren verschieben, Abstand messen, verschieben, Abstand messen. Das Dritte, was ich noch zeigen wollte ist Reinforcement Learning, das war das Beispiel, wie wir auch unsere Kinder erziehen, wenn es hinfällt, tut es weh, wenn sie es schaffen, dann belohnen wir sie, also streicheln und da hast du gut gemacht. Genau das Gleiche gibt es auch für Computer, heißt Reinforcement Learning und habe ich auch eine Demo, und zwar habe ich nicht selber geschrieben, logischerweise, und zwar sieht die so aus. Ganz easy gemacht, eine gewisse Anzahl Rechtecke zufällig verbunden, bewegen sich zufällig, Schwerkraft drauf und geschaut, wie lange, und das ist jetzt der Bewertungsalgorithmus, wie lange der Kopf höher war als die Füße, also wie viel höher der Kopf als die Füße waren und wie weit er gelaufen ist. Und logischerweise, wenn der Kopf immer über den Füßen bleibt und der läuft, dann kann der laufen. Das ist sozusagen ein Algorithmus, der sagt einfach ich generiere das ist Samstagabend Neustadt Style ist der Führende der Zeit es ist der Führende der Zeit es gibt jetzt hier also eine besten Liste und übrigens das ist jetzt hier zum Spaß animiert, also das dauert so lange, weil wir dazugucken wollen, weil wir Menschen das nicht in echt, macht man das parallel auf GPUs, also eine GPU hat sowas 256 Kerner da rechne ich das 256 mal parallel auf einem Computer und dann gibt es Cluster also das heißt, so ein Computer hat hier innerhalb von ich sag mal, nach halben Minuten weiß der wie man läuft mit so einem einfachen Algorithmus, ich rechne einfach ich pack Rechtecke zusammen, gibt eine Erdbeschleunigung drauf, lasst die zufällig bewegen und wenn es klappt dann sage ich, du bist der Klassenbester hier unten die Liste hier, du bist der Klassenbester den nehm ich und fange mit dem wieder an also immer der Beste ist jeweils der der dann neu wieder anfängt und den variiere ich und das führt, also die ua ist rednutt.org das kann jeder ja mal abends an seinem Browser starten, schlafen gehen und wer früh dann zum Rechner kommt dann sieht das Melle laufen der läuft dann früh wegen uns Menschen, weil wir das sehen wollen, ja, nicht weil der Computer so lange braucht das rauszukriegen, sondern weil wir dabei gerne zugucken wollen man kann dann hier noch Genmutation, Wahrscheinlichkeit und wie viel dann noch mal davon mutiert wird und so weiter und so fort man kann dann viele Sachen da einstellen und sich das mal angucken wie das funktioniert, das ist witzig wie gesagt, kann man sich in der WG schön an die Wand werfen und gucken ob der Sonntagabend dann laufen kann das ist also Reinforcement Learning so und dann gibt es noch eine Sache das nennt sich Deep Learning das hatte ich zum Anfang nicht so richtig mit genannt so als Klasse, weil ich nicht so richtig weiß wo ich das einsortieren soll das sind so genannte neuronale Netze das funktioniert so man hat hier drüben Layer das ist Eingang, das ist zum Beispiel was Apple jetzt macht mit Apple Health oder so die sammeln einfach Blutdruck, Anzahl der Schritte wie viel geschlafen habe ich denn es sich denn in Apple oder nicht die sammeln einfach alles und rechts gibt es Ausgänge ja, sie hatten leider ein Herz entfragt den Zusammenhang weiß keiner aber es gibt ein neuronales Netz und da haben die Mathematiker sich in den 70er Jahren irgendwann abgeguckt vom Gehirn, vom Menschen, das ist nämlich genauso es gibt dann so Synapsen die werden aktiviert das funktioniert da mathematisch genauso da gibt es eine Aktivierungsfunktion dann wird der Durchgang aktiviert und dann wird gesagt, naja ich weiß es auch nicht, aber irgendwie gibt es einen Zusammenhang so, und was ich jetzt hier angezeichnet hab das ist jetzt ja 2 Hidden Layer und irgendwie 4 das ist nix in Google das macht dann lassen wir neuronales Netz ganz Youtube gucken also Google hat ja Youtube und das sind Videos und die lassen ihr Data Warehouse ganz Youtube gucken also gleichzeitig alles und fragen dann was hast du gesehen, was kannst du uns über das Video sagen und das ist kein Witz also das ist ja sozusagen wo ich will, dass es langsam in die Magen gehen gilt ihr seht es jetzt leider nicht wegen dem Beamer dass dieser Deep Dream kann jeder mal Google ein Deep Dream das war jetzt auch viel in der Presse so immer diese Bilder die aussehen so psychidelisch dass diese neuronalen Netze selber Sachen erkannt haben also das ist ansehberweist es hat ihm niemand gesagt, was dort zu sehen ist aber es kam nach ganz Youtube gucken auf die Idee, dass in unserem Leben irgendwie Katzen relevant sind weil ja hier rechts ist eine Katze zu sehen das seht ihr jetzt nur nicht ich seh das aber dass irgendwie Katzen relevant sind es kann Schaus-Schaus von Pudeln unterscheiden es kann selbstständig labeln ob ein Stabhochspringer oder ein Weitspringer an dem Video zu sehen war es kann sehen ob das ein Rennrad war oder ein Mountainbike ohne dass diesem Neuronal-Netz irgendjemand was gesagt hat und damit hat man das Problem vom Superweiß-Learning nämlich dass man 1000 Tassen braucht um gut zu werden, das Problem hat man nicht mehr man nimmt einfach ganz Youtube wer hat nochmal ganz Youtube außer Google ja, niemand genau das ist der Punkt die nehmen einfach diese Riesendatenbasis können mit diesen Algorithmen Informationen daraus ziehen und haben das selbst gelabelt genauso wie vorhin dieses ganz einfache Beispiel mit der Kreditwürdigkeit wo die Punkte rumspringen, das ist genauso ähnlich einfach läuft das von der Mathematik her nur einfach groß und viel und oft und schnell auf Google Maßstab und deswegen sind die einfach gut meine Youtube-Empfehlung Andrew ehemaliger Google Engineer ist jetzt von Baidu abgeworben worden Professor für Machine Learning Deep Learning, diesen Talk mal angucken das ist schon erstaunlich was er da so alles erzählt so und wenn man das jetzt alles mal kombinieren ja also der, wir belohnen den Rechner ein bisschen mit plus 1, plus 1, plus 1 hast du gut gemacht, hast du gut gemacht, hast du gut gemacht kannst jetzt laufen das ist sonst noch so ja, das ist also hier Boston Dynamic das ist also Geheimhaltungsstand Youtube ja, die Videos sind also auf Youtube das sind also mittlerweile zwei vierbeinige Roboter die selber Untergrund erkennen laufen können wer die Videos sich mal anguckt, man tritt gegen das Ding weicht aus wie ein wie ein Zebra oder das auch machen würde von der Seite gegen tritt, dann merkt er das und macht die Bewegung also das hat den auch kein Mensch gesagt ich hab das halt selber gelernt oder hier der Kollege Runden ja, das ist ein Roboter der laufen kann, den Algorithmus haben uns gerade angeguckt, relativ simpel, der kann das jetzt und ja, was ist, wenn es einfach gar kein Peaceful Use dafür gibt ja, die Boston Dynamic ist von der DARPA finanziert worden DARPA, das ist ich sag mal in 100% Nähe zum US-Militär das sind die, die vor 15 Jahren die Grand Challenge und dann die Urban Challenge gefandet haben, das sind also die selbstfahrenden Autos, die damals vor 15 Jahren in der Wüste gefahren sind, hat funktioniert danach haben sie gesagt, na gut Wüste ist einfach dann fahrt mal wenigstens ein bisschen durch die Stadt hat auch funktioniert jetzt haben wir die Autos auf den Autobahn das funktioniert, 15 Jahre später ist das da funktionierend, wir können die Hände vom Lenkrad nehmen, die Autos fahren selber und die DARPA hat ein neues Projekt die heißt Robotic Challenge da geht es darum, zwei weinige stehende Roboter zu entwickeln die selbstständig Rescue tasks zu lösen, zum Beispiel durch Fenster klettern, zum Beispiel Türen öffnen und solche Nehmtags wie Wasser hinabschperren und so ja, das ist also meiner Meinung nach eine bedenkliche Entwicklung ähm ja das Problem ist ich bin ja selbst Machine Learning Entwickler, ich mach das ja aber was soll ich machen, soll ich jetzt mein Laptop zu klappen und sagen, ich mach's jetzt nicht mehr weil wenn ich das jetzt hier mache, dann geht die Welt unter, ich hab einfach überhaupt keine Einfluss darauf, das gibt andere Leute und ich bin nicht der Einzige, der das Risiko sieht es gibt mittlerweile namhafte Leute wie Elon Musk wer den kennt das ist der der selbst landende Raketen baut die jetzt gerade für die NASA die Supply machen für die Raumstation, das ist der der zum Mars fliegen will und das ist der der in der Nehmtätigkeit Tesla Motors gegründet hat die gerade alle Punkte einsammeln, die es in der Automobilindustrie so gibt und der hat zusammen mit Stephen Hawking und noch ein paar anderen Leuten in 100 Milliarden US Dollar Fond ins Leben gerufen der ausschließen soll das Artificial Intelligence also das heißt Machine Learning Machine Learning Verfahren gegen Menschen gerichtet werden so warum, naja weil da Elon Musk auch Investors und in einiger AI Artificial Intelligence Startups investiert ist, dort offensichtlich Sachen gesehen hat die nicht schön sind, gemerkt hat da wo Geld ist, geht die Entwicklung hin wer hat Geld, wer hat Interesse dass Maschinen selber Entscheidungen treffen und rumlaufen im Bodeneinsatz und genau genau die Gesichter wollte ich haben das bedrückt mich ja auch, deswegen wollte ich hier auf den Datenspuren mal darüber reden und ich kann aber nichts machen, ihr könnt wahrscheinlich auch nichts machen, aber jetzt haben wir wenigstens mal darüber gesprochen und bedanke ich mich für die Aufmerksamkeit und gute Party wünsche Test Hallo und zwar um als Denkernstoß das anzugeben ich habe da schon mehrmals drüber nachgedacht du sagst das ja immer mit einer schlimmen Mine, was dort Maschinen-Learning los ist ich sehe das nicht ganz so, weil warum denken, naja sieht man das nicht einfach als eine neue Entwicklungsebene es ist halt einfach Evolution und die Evolution der Maschinen gerade im Longshot denke ich halt darüber nach, dass wenn wir zu anderen Sternensystemen kommen wollen müssen das Maschinen machen und da sind wir biologisch lesen einfach nicht für fähig und so ein was weiß ich Installation im Weltraum, die überlebt halt auch mal ganz schnell ohne Probleme tausend Jahre etc. pp insofern kann man das auch mit diesen Gedanken Gang sehen, ich meine ja Termineter kommt und schießt uns alle tot das heißt deswegen noch lange nie, dass es auf der Erde nie weitergeht es ist vielleicht gar nicht so schlecht wenn manche Leute sie so diverse Regierungen und so weiter also in diesem Zusammenhang sehe ich das auch ein bisschen und möchte das einfach als Diskussionsansatz hier auch mit reinwerfen, danke danke für die Anmackung, das sehe ich ganz genauso dass es definitiv die Anwendungsfälle dafür gibt jeder der in der Pflege arbeitet und 100 Kilo schwere Leute bewegen muss der sagt, gibt es der nicht endlichen Roboter der das kann, das ist ganz klar es gibt Murphy's Law das sagt, wenn es 10 Möglichkeiten gibt irgendwas zu erreichen und es eine völlig bescheuert ist unser Untergang, dann wird es definitiv Leute geben, die die 10. Variante wählen und in dem Fall sehe ich das auch so natürlich gibt es gute Anwendungsfälle natürlich wird das zu unserem Vorteil sein und wir werden für Arbeit damit haben und es wird uns lästige Tätigkeiten abnehmen aber ich sehe es auch ganz klar es gibt ganz klar Interessen die wollen, dass es solche Geräte gibt hier wie ihnen hier oder wie die da oben und da weiß ich nicht ob man das also zulassen sollte, wie man es regulieren will habe ich keine Ahnung, weiß ich nicht aber es ist halt bedenklich meiner Meinung nach weil jetzt kommt der Punkt die Rechenkapazität verdoppelt sich und so weiter immer ständig und bei diesen neuronalen Netzen kommt es nur darauf an wie viel Kapazität man hat so und derzeit sind wir was weiß ich auf Google Warehouse-Niveau jetzt warten wir halt dieses Murz Law verdoppelt sich das, auf einmal ist das System von jetzt auf gleich in der Lage nicht Internet der Dinge, sondern auf einmal ist das Ding das Internet und dann steht man als Mensch mit seinem kleinen Gehirn daneben und sagt oh das ist genauso wie vor 15 Jahren mittlerweile der Film hier rauskam mit ihm sogar mit dem Predictive Policing mit wo die Kugeln kamen und dann haben sie die hochgenommen noch bevor die was getan haben morgen habt dann Talk hier auf den Datenspuren zu Predictive Policing also es ist halt alles eine Frage der Zeit und so sehe ich das bei dem Thema auch eine Frage ob der Mensch in der Lage ist das anzuhalten zu stoppen weiß ich nicht bin kein Fachmann da drin aber die Awareness soll man schaffen sage ich immer so schön gibt es noch weitere Fragen? ich bin der letzte Talk wir haben Zeit ich wohne hier drüben gleich ich habe keinen langen Heimweg ich glaube das hier ist eher ein Kommentar nicht mehr eine Frage aber vielleicht ist es eine Frage ist es nicht dass die Maschinen so begrenzt in ihren Möglichkeiten dass sie nur so viel machen können was sie ausgestattet sind wie zum Beispiel in deinem Beispiel was du gezeigt hast mit dem Mensch der lernt er kann gar nicht also der lernt zu laufen er kann nichts machen weil er ist einfach etwas in dem Bildschirm aber dann wenn wir irgendwo etwas bauen was eine eine Waffe halten könnte dann ist das nicht angst ja die sind ja Träger dafür also ich würde sagen es ist eher wir sollten nur Angst für sowas haben wenn wir eigentlich eben die Möglichkeit geben etwas Schlimmes zu tun genau da bin ich beim Punkt es wird Leute geben die das machen werden und dann ist genau die Frage an welcher Stelle sagt man dann das machst du jetzt bitte nicht letztlich ist eine Drohne alles Position gesteuert Raketen ab das ist alles ein autonomes System es ist ja theoretisch schon da nur simple genau was du sagst das kann nur das eine Drohne kann nur das so aber wie gesagt es gibt bessere Algorithmen mehr Platz und es wird cleverer als Beispiel dieses dieses Deep Learning ist in autonomen Fahrzeugen jetzt drin als Kamerasystem es unterscheidet zwischen Bus und Fußgänger Straßenbegrenzung und da ist frei da darf ich hin da darf ich nicht hin das ist ein Deep Learning Netzwerk das wurde von Mobile Eye entwickelt das sind Computer Vision Fachleute die haben das jetzt im Tesla drin Tesla macht das jetzt so in Serie vor 5 Jahren noch theoretisch da gab es noch Paper und langsam können wir es auf GPU wir haben die erste Implementierung auf GPU wir können das jetzt parallel machen so jetzt ist es da ich habe nur eine Frage zu dem Deep Learning ich habe keine leutechnisches Verständnis zu diesem Deep Learning ich verstehe überhaupt nicht wie das alles funktioniert aber hat man diesem riesigen Computer vorher die Aufgabe gegeben sag uns was für Gegenstände du dann nach siehst also in diesen ganzen Videos oder hat es sich sozusagen die Frage selbst gestellt ne genau die Frage die Frage die YouTube dem gestellt hat war unsere User labeln ihre Videos nicht also wenn man bei YouTube ein Video hoch lädt dann schreiben viel dann drunter me at the beach oder so und dann unten als Text noch Beach, Fun, Holiday oder so was YouTube möchte ist ein Computer Vision System später was draußen rumläuft im Altersheim steht und sagt eine alte Frau ein Teller, eine Blumenwasser sie läuft, sie ist hingefallen ja das möchten die Kontextverständnis also sagen die guckt ihr ganz YouTube einfach an und finde mal raus was da passiert trenne Vordergrund von Hintergrund, trenne Aktivität von Passivität von so was und finde Features die das beschreiben und was kam eben raus zum Beispiel in Katzengesicht, ihr seht es jetzt leider nicht mein Talk ist bei Github dann auch Datenspuren 215 da sieht man das dann noch besser und holt sie als Feature aus ne Katze also wenn ich menschliche Videos analysieren will dann muss ich offensichtlich wissen wie eine Katze aussieht ja und das hat es dann selber rausgefunden und gesagt ok jetzt kann ich jedes Video wo ich das sehe wo ich das sehe schreibe ich Katze ran als Label Katze, Katze, Katze Katze springt auf Tisch, Katze stilles Blumenwasum, Katze holt sich Essen, kannst dann selber labeln das war die Aufgabe ja also ich meine wenn sich das der Dalgurken nur die Videos selber als Reihen Content anguckt und den die Labels kommen daher und das die bereits vorhanden einfach bei den 2-3 Videos die sie finden nee, das ist ansoberweist also niemand hat dem jemals was gesagt und jetzt kommt der Trick wieder warum ich eigentlich dieses Pin Beispiel gezeigt habe wo jeder sagt es ist echt interessant zahlen zu vergleichen, aber was macht der Computer man sagt ihm man sagt also ein Video Bild das ist ein Pixel unterteilt breite mal höher so und jetzt sagt man ihm 4 Pixel nämlich mal oder 5 oder 6, nehm ich mal und dann sag ich ihm es gibt senkrechte Linien es gibt so Linien, es gibt Diagonalen es gibt so, na also sortiert Linien einfach und sagt ihm so und jetzt nimm mal ein YouTube Video und gucke an welcher Stelle du zum Beispiel eine senkrechte Linie findest geht dir die Pixel ab und das sind jetzt mittlerweile bei 4K echt viel, also die verarbeiten noch keine 4K, sondern das ist ein riesen Problem ja die verarbeiten ja 640, 480 oder was, dann geht das durch und guckt ah hier eine senkrechte Linie gefunden gut merke ich mir, wenn man eine senkrechte Linie ist gut und dann nehme ich noch eine Diagonallinie geht die durch und dann ah die beiden kombiniert das habe ich jetzt viel gefunden und so setzt sich also 0,3 mal eine senkrechte Linie plus 0,8 mal eine Diagonale plus ne ne ne ne zusammen ist dann auf einmal eine Katze denn es ist nichts anderes eine Katze gefilmt ist ja nichts anderes als das Zusammensetzen von irgendwelchen kleineren damit hat ja der Algorithmus trotzdem erst mal nur in Objektabstrahiert und Konzeptabstrahiert aber wie wie wird das dann gelabelt also wenn der Algorithmus letztlich dann rauskriegen soll das da ist eine Katze der Name Katze ist ja nur ein Deutschland Katze Katze würden wir in Deutschland labeln, im englischen Labels Kat, also dem Computer ist das Wurst gibt dem Ding dann eine Variable und da ist dann das und er findet es immer wieder also der Name Katze, den hat er jetzt natürlich nie selber gefunden also der hat jetzt nicht gesagt das ist eine Katze, sondern der hat gesagt das ist ein Ding, das ist offensichtlich wichtig in vielen YouTube Videos also nehme ich das jetzt in Suche immer danach weitere Fragen jemand da ist noch jemand zu diesem Bilderkennungssystem was in Kraftfahrzeugen verbaut wird hast du ja gesagt, das sind auch Learning-Systeme ist das so, dass die einmal zentral trainiert werden und dann das Ergebnis auf jedes Fahrzeugverteid wird oder lernt tatsächlich jedes Fahrzeug einzeln noch weiter nein, einmal gelernt und dann das System Deployed also das ist das was ich hier gezeigt habe das ist das jetzt hier na das hier das Ding wird einmal trainiert das kommt dann aus Auto per Software Update kein Problem und dann heißt man hier ein predictive Model und für alles was neu reinkommt kann dieses Ding eine Ausgabe geben gibt es noch weitere Fragen sonst ist jetzt Party Time vielen Dank für deinen Vortrag Dankeschön