 Herzlich Willkommen zum vierten Coding Video der zweiten Data Science Vorlesung zum Thema Deep Learning und Neural Networks. Dieses Video dient als Anti-Beispiel. Dieses Video soll Ihnen verdeutlichen, was passiert, wenn man blind einfach irgendetwas tut. Das Video dient wirklich nur dazu, Ihnen zu zeigen, was denn passiert, wenn man diesen ganzen Rattenschwanz an Projektsteuerung, an Datenexploration und vorherigem Nachdenken nicht ausführt. Also ich wiederhole das nochmal, das ist ein Anti-Video, wo Sie sehen können, was passiert, wenn ich das alles nicht beherzige. Ich bin jetzt hier jemand, der mal fünf Minuten gegoogelt hat und ich jetzt den nächsten großen Kuh landen möchte. Ich möchte Finanzdaten vorhersagen, und zwar mit KI und mit neuronalen Netzen und dann verkaufe ich das als das nächste große Ding, weil ich bin ja der Tollste und ich bin der Beste und der Größte und genau das machen wir hier auch. Wir lesen hier unsere Daten ein, das habe ich in irgendeinem Video von irgendeiner technischen Hochschule gesehen, dass man das einfach so machen kann. Ich habe auch gelernt, wie man von hier Hu hier Finanzdaten runterladen kann. Ich habe gesehen, wie man daraus logaritmierte Renditen berechnen kann, dass man hier ein bisschen Feature-Engineering machen kann. Das heißt, man kann hier noch aus dem Datum heraus ein Jahr, ein Monat und ein Tag extrahieren. Und natürlich ist es so, dass ich ja meinen Open Price vorhersagen möchte, weil ich möchte sofort morgen früh Geld verdienen. Das heißt, ich gehe hierher und möchte den nächsten Opening-Kurs vorhersagen, weil dann bin ich ja innerhalb von einem Tag reich und da gehe ich natürlich her. Ich muss natürlich so tun, wie wenn ich hier ein bisschen eine Ahnung hätte. Also gehe ich her und schaue mir doch mal diesen Korrelationsplot erst mal an. Dann habe ich in einem anderen Video gesehen, dass man reportingfähig voll die coolen Bilder machen kann. Und dann fügen wir das hier natürlich auch ein und schauen uns das an. Danach sehe ich hier, muss ich ja dem Prozedere doch ein bisschen folgen, machen wir ein bisschen Datensplitten, wir skalieren ein bisschen unsere Daten. Und ich habe ja gehört, Early Stoppings und Dropouts sind auch irgendwie ganz cool zu haben. Deswegen machen wir das hier ja auch so, also bastle ich mir hier einfach blinden Modell zusammen, packt da ein paar Dropout-Raten rein, kompliere das Modell, initiiere mein Early Stopping, packen ein bisschen Badge-Sizes mit rein und ja, dann schaue ich mir den Verlust danach an und mache natürlich sofort Prediction, damit ich am nächsten Tag handeln kann und gucke einmal, wie gut mein Modell hier performt hat. Das wird natürlich gigantisch performen, weil ich habe ja fünf Minuten gegoogelt und das Studium der Statistik und der Data Science und der Finanzmärkte interessiert mich ja nicht, weil ich will ja Quick Money machen hier und danach schauen wir uns das Ganze noch an, weil ich möchte auch jedem grafisch beweisen können, was für ein toller Hecht ich bin und danach machen wir hier nochmal dieselbe Übung wie der Dozent in diesen komischen Videos. Wir gehen her und lassen einfach mal den letzten Opening-Price fallen und prognostizieren das Ganze hier mit unserem eigenen Modell und ich hätte gesagt, wir fackeln hier nicht lange, liebe Leute, Zeit ist Geld, deswegen fangen wir hier an, ich muss mich mit diesen Inhalten hier auch gar nicht so wirklich befassen, weil der Code rechnet ja von alleine, also legen wir doch einfach mal los, hauen uns das durch und gucken mal, was dabei rauskommt. Wir sehen hier, dass die Returns mit den Preisen schon irgendwie sehr stark korreliert sind, ich muss mal das noch so einstellen, dass man das hier ein bisschen lesen kann, ja mit dem Volumen nicht so wirklich, ja. Ja, aber wir haben gute Korrelation mit den Lock Returns, ob das jetzt statistische Eigenschaften verletzt oder Scheinkorrelation ist, ist ja egal, wir wollen ja schließlich Geld verdienen. Hier sehen wir noch unsere richtig coole Matrix, die ich mir aus einem anderen Video abgeschaut habe, lassen Sie mich das noch mal richtig einstellen, dass Sie auch sehen können, wie coole ich Copy und Paste'n kann. Ja, wir sehen hier, unsere Lock Returns sind natürlich hochgradig korreliert mit allen möglichen, auch mit unseren Opening-Kursen und unsere zwei Zeitvariabeln hier sowieso, aber das macht ja nichts. Wir gucken jetzt hier mal weiter, was macht dieses Programm denn eigentlich noch? Oh, das fängt jetzt hier erst mal zum Trainieren an und es sieht so aus, wenn das doch ein bisschen dauern könnte. Ah, ich gehe mir da mal mal einen Kaffee holen, ich komme dann wieder, wenn dieses Ding mal fertig ist, damit ich morgen mein Geld an der Börse abholen kann. Na, wurde dann aber auch mal Zeit, ja, dass das Teil hier mal fertig wird, ja, wir wurden hier ausgestoppt bei Poche 109 und das ist auch so, wie der Kerl das in dem Video erzählt hat hier, das geht schön nach unten und konvergiert dann hier, sehen Sie mal, wir hätten hier gar keine 10-Iterationen gebraucht, sieht doch ganz schnieke aus. Machen wir das zu, gucken wir, dass wir fertig werden. Ich habe mir den neuen Porsche nämlich schon vorgestellt, gucken wir uns das hier an und sehen, ja, das sieht doch gar nicht so verkehrt aus, was wir hier gerechnet haben. Interessanterweise, das sieht doch eigentlich ganz cool aus, machen wir das doch mal zu und dann sind wir hier sogar schon fertig, Wahnsinn, das geht ja richtig schnell. Wir liegen hier zwar 83 Euro bei jedem Preis vorbei und ich werde wahrscheinlich morgen mein ganzes Geld an der Börse verlieren, weil das sehr redundant Auto korraliert ist und ich alles an statistischen Grundlagen vergessen habe, aber das Bildchen sieht gut aus. Zur Bauernfängerei und um Leute die sich noch nie mit einem Buch auseinander gesetzt haben, on social media zu konvinzen, da reicht das garantiert und nein, es tut es natürlich nicht. Was haben wir jetzt hier gemacht? Ich rolle das mal nochmal ordentlich auf und ich kann Ihnen auch genau erklären, warum da sehr gute Sachen dabei rauskommen. Ich lasse das Ding nochmal von Anfang an laufen und wir sehen hier allein schon mal, wir versuchen Preise damit zu erklären, indem wir hier Lock Returns und adjusted Closes und Low Price und High Preise reinschmeißen. Das ist alles Multikoliniarität. Das können Sie prinzipiell mal vergessen. Wenn Sie sich hier diese Korrelierungen ansehen, sehen Sie, dass das hier fast perfekte Korrelation sind oder gar keine Korrelation sind. Allein hier sollten Sie schon schreien, so aus einem Netzwerk zu füttern. Der trainiert jetzt hier fleißig. Das breche ich jetzt ab. Das müssen wir uns nicht nochmal antun. Der Grund ist, warum da so was Schönes dabei rauskommt ist, weil wir hier Multikoliniarität vorliegen haben, weil wir Autokorrelationen hochgradig vorliegen haben und die ganzen Dinge greifen, die wir hier in langwieriger Kleinstarbeit eben in dieser Vorlesung kennengelernt haben. Tun Sie mir den Gefallen. Lassen Sie solche Dinge hier bleiben. Widmen Sie sich den Finanzmärkten. Widmen Sie sich der Thematik und versuchen Sie egal, ob es hier nun um Aktien geht oder nicht sich nicht von irgendwelchen daher gelaufenen Menschen einfangen zu lassen. Hinterfragen Sie diese Dinge kritisch und bevor sie anfangen zu modellieren, muss Ihnen hier so was bewusst sein. Das ist die Domänexpertise. Ihnen muss bewusst sein, wenn Sie so eine Korrelationsmatrik sehen, dass da irgendwas nicht stimmen kann. Und das ist das perfekte Beispiel dafür, dass wir hier Gigo-Prinzip betreiben, garbage in, garbage out. Es kann nicht sein, dass hier irgendetwas Sinnvolles reinkommt oder rauskommt. Je nachdem, was Sie hier zu Tum pflegen, natürlich um irgendwelche Teilnehmer zu beeindrucken, die das noch nie gesehen haben, reicht das vielleicht, aber tun Sie sich den Gefallen, tun Sie Ihrem Geldbeutel den Gefallen, auf so was nicht herein zu fallen. Machen Sie Ihre Arbeit ordentlich, bleiben Sie sauber, bis da halten.