 Guten Tag zusammen. Ich darf Sie herzlich begrüßen zu unserem ersten Kapitel zur Zeitreinanalyse als Teilgebiet der angewandten Statistik. Sie sehen, die Zeitreinanalyse ist unser erster Stopp auf dem Weg in die aktuelle Forschung und dient uns als fundamentale Erkenntnis für alles Weitere. Was machen wir im Themenkomplex Zeitreinanalyse? Der Komplex ist relativ groß und wir werden uns auch nur mit einem Auszug aus der gesamten Zeitreinanalyse befassen können. Ich habe mir die Freiheit genommen, damit das Kapitel stochastische Prozesse und stochastische Differenzialgleichungen sie mathematisch nicht komplett erschlagen wird, hier direkt am Anfang fundamentale Begriffe zu definieren und eine mathematische Einführung derselben zu geben. Darunter fallen direkt das Wort Zufallsvariable, was ist ein Raum, was ist ein Maß und weitere. Wir werden uns dann anschließend damit befassen, wie kann ich denn eine Zeitreihe definieren, wie kann ich eine Zeitreihe grafisch darstellen, was ist denn eine Zeitreihe überhaupt und was bringt mir das denn alles, bevor wir uns mit den Konzepten befassen, die man normalerweise mit einer Zeitreihe oder in der Zeitreinanalyse beobachten kann. Und zwar hier in diesem Fall, der für uns besonders wichtig sein wird, die Autokorrelation, die Tests von Autokorrelationen und dann natürlich im Anschluss die Pythonische Implementierung der Autokorrelation. Was in Kürze gesagt bedeutet, wie ist eine Zufallsvariable mit sich selbst im Zeitablauf korreliert und wie kann ich das darstellen? Das ist das Kernthema dieses Kapitels neben der Definition einiger mathematischer Begrifflichkeiten, die wir im späteren Verlauf des Kurses noch benötigen werden. Bevor wir nun aber über Zeitreihen, Finanzen und weitere damit verbundene Konzepte sprechen können, habe ich es mir zur Aufgabe gesetzt, eine Wiederholung bzw. eine erweiterte Einführung des Begriffs der Zufallsvariablen zu geben, da ich nicht weiß, wie ihr Vorwissensstand ist und diesen auch nicht einfach voraussetzen kann. Ich habe als Dozent das Problem, dass der Begriff der Zufallsvariablen sowie der Begriff der Zeitreihe fundamental für alles weitere, was wir hier machen ist. Es gibt sicher viele Dozenten, die das von vielen Konzepten behaupten, aber in diesem Fall ist es nun mal so, dass wir nichts programmieren können, nichts berechnen können, nichts schätzen können, gar nichts machen können, bis wir eigentlich verstanden haben, was ist denn eigentlich eine Zeitreihe, was ist eine Zufallsvariable und wie funktionieren die denn? Ich kann Ihnen auch versprechen, dass im weiteren Kursverlauf der Theorieanteil nach unten gehen wird und wie mehr praktische Applikationen machen werden und der Praxisanteil und der Angewandteanteil wesentlich steigen wird. Bevor wir uns allerdings der praktischen Implementation widmen können, müssen wir oder sollten wir uns mit mathematischen Begriffen auseinandersetzen, die diesen ganzen Konzepten, die wir dann in Code umwandeln werden, eben unterliegt. Wir fangen zunächst einmal an mit der formalen Definition einer Zufallsvariablen, werden dann gleich feststellen, dass wir ein paar Begriffe mehr dazu verstehen müssen, um die formale Definition einer Zufallsvariablen überhaupt greifen zu können. Weswegen wir noch den Mengenbegriff, Abbildungen, mathematische Strukturen, Siegmal, Gebrennmaße und Räume einführen werden, die insbesondere wichtig sind für stochastische Zufallsprozesse, aber auch für fraktale und weitere Konzepte, die wir hier behandeln werden. Kommen wir doch jetzt sofort zum Eröffnungshammer der Veranstaltung und zwar zur formalen Definition einer Zufallsvariablen. Als Zufallsvariablen bezeichnet man eine messbare Funktion von einem Wahrscheinlichkeitsraum in einen Messraum. Es sein, dass Triple Omega Sigma P ein Wahrscheinlichkeitsraum und das Paar Omega Strich Sigma Strich ein Messraum. Eine, dem Pärchen Sigma und Sigma Strich messbare Funktion X, die Omega auf Omega Strich abbildet, heißt dann eine Omega Strich Zufallsvariable auf Omega. Das hat jetzt natürlich jeder verstanden. Ist ja natürlich trivial, kann sich jeder selbst herleiten, versteht man natürlich auch sofort. Genau aus diesem Grund gehen wir jetzt erstmal her und lernen einige Begriffe, die notwendig sind, um diese Definition überhaupt begreifen zu können. Diese Definition ist formal allgemein, sehr hoch, aber unglaublich notwendig, wenn wir uns später den stochastischen Zufallsprozessen widmen. Sie werden kaum Literatur zu diesem Thema finden, indem das keine Grundvoraussetzung ist, weswegen wir uns jetzt einfach mal damit befassen werden. Und um diese Definition von Zufallsvariablen zu verstehen, müssen wir eben einige weitere Begriffe einführen und diese eben auch verstehen. Hier fängt die geistige Flexibilität, die ich in Eingangs erwähnt habe, durchaus schon an. Und bevor wir mit irgendeinem mathematischen Konstrukt beginnen, bevor wir an irgendetwas anderes denken, stellen wir uns doch erstmal die Frage, was ist denn eigentlich eine Menge? Jeder von ihnen hat schon mal das Wort Menge gehört, um den Kurs gerecht zu werden, eine Menge Daten, eine Menge Geld, eine Menge Bücher, aber was genau ist denn eigentlich eine Menge? Nun, wir definieren Menge erst mal so wie der Erfinder, nenne ich es mal, oder derjenige, der sich hauptsächlich damit befasst hat, der Schöpfungsvater Georg Kantor, sich eine Menge vorgestellt hat und zwar in der Mengenlehre befasst man sich mit der Zusammenfassung von mathematischen Objekten. Ein mathematisches Objekt kann so gut wie alles sein, stellen sie sich bildhaft einfach mal eine Menge Äpfel vor, eine Menge Datenpunkte, eine Menge Geldscheine oder was auch sonst immer in ihrer Fantasie ihnen positiv zuspricht. Kantor sagt, unter einer Menge verstehen wir jede Zusammenfassung M, von bestimmten wohl unterschiedenden Objekten klein M unsere Anschauung oder unseres Denkens, welche die Elemente von M genannt werden, also die Elemente einer Menge sind eben diese Anschauungsobjekte unseres Denkens zu einem Ganzen. Das klingt jetzt etwas kryptisch, Sie sehen, ich habe da noch ein Sternchen hingemacht, weil diese Definition schon überholt ist im eigentlichen Sinne, hier gibt es Ausnahmen davon, Paradoxien und Theoreme, die das noch erweitern, die lassen wir hier aber erst mal beiseite, die interessieren uns erst mal gar nicht. Wir definieren eine Menge und eine Menge ist genau das, was da steht, die Zusammenfassung von mathematischen Objekten zu einem Ganzen. Das ist ganz platt gesprochen, wir nehmen einen Sack, stopfen da Äpfel rein und dann haben wir einen Sack voll Äpfel, eine Menge Äpfel und wir sagen zu diesem Sack, dann das ist eine Menge Äpfel, eine Menge von Äpfeln, eine Menge von Geldscheinen, eine Menge von verschiedenen Anzahlen von Objekten, das ist eine Menge. Georg Kantor ist hier quasi Schöpfungsvater der Mengenlehrer. Kommen wir zunächst einmal zu einer formalen Definition einer Menge, die ein bisschen greifbarer ist und weniger vergeistigt. Ich habe hier das Element-Pretikant noch mal dazu gemalt. Ich gehe allerdings davon aus, dass die meisten von Ihnen Ingenieurstechnische Fächer belegt haben und somit dieses Zeichen schon mal gesehen haben. Man kann formal eine Menge in verschiedenen Arten definieren und zwar zum einen einmal in eine aufzählenden Notation, die einfach nur sagt, eine Menge, welche aus den Elementen x1 bis xn besteht, enthält das Element a, also das a ist jetzt erst mal ein Element, was wir so noch nicht kennen, genau dann enthält, wenn a mit einem der xk übereinstimmt und es ist unten formal nochmal dargestellt, dass das a ist genau dann Element dieser Menge x1 bis xn, wenn das a entweder dem x2 gleich ist oder eben einem dieser Elemente dieser Menge. Also eigentlich genau das, was oben drüber in Text steht. Wir können unten uns ein Beispiel angucken und zwar, wir haben die Zahlen 1, 2, 3, 4 und 5. Die Menge dieser Zahlen 1, 2, 3, 4 und 5, das sind unsere x1 bis x5 und die bilden eine Menge, die Zahlen 1 bis 5 und wir haben jetzt eine Zahl a und wir möchten testen, ist diese Zahl in dieser Menge und diese Menge enthält das Element a genau dann, wenn a entweder 1 ist, 2 ist, 3 ist, 4 ist oder 5 ist. Das ist eigentlich ziemlich eingänglich und ich denke, bis hierhin sollte von Ihnen noch niemand Probleme bekommen. Es gibt natürlich noch eine beschreibende Notation, die dann eben eine Menge der x für das Prädikat p von x anzeigt, das bedeutet, dass halt auch unter einer Funktion das Element a genau dann in diese Menge gehört, wenn eben der Funktionswert des Elementes a eben in dieser Menge der x ist und quasi der Funktionswert der Menge a, der Funktionswert des Elementes a einem Funktionswert des Elementes x, welches wiederum sich in dieser Menge befindet entspricht. So, das war jetzt vielleicht etwas kryptisch. Wir haben Elemente, die eine Menge zugeordnet werden können, wenn ein Element a quasi einem Element x der Menge entspricht und dasselbe gilt natürlich auch für Funktionswerte derselben. Ein Funktionswert eines Elementes a ist in dieser Menge, wenn der Funktionswert von a gleich einem Funktionswert von x ist. Wer steht hier erst mal noch nicht? Sie merken, ich habe jetzt relativ oft das Wort Menge verwendet. Es wird besser, das verspreche ich Ihnen. Sollte das bisher unerträglich sein, können Sie sich ja ein natürlich nicht alkoholisches Getränk einflößen jedes Mal, wenn ich als Dozent das Wort Menge benutzen. Machen wir weiter mit dem Mengenbegriff. Die Mengenlehre erlaubt quasi die Zusammenfassung von Elemente in Mengen. Stellen Sie sich vor, Sie haben jede Menge Äpfel auf Ihrem Tisch liegen. Sie nehmen ein Korb und packen diese Äpfel in den Korb und sagen, dieser Korb ist meine Menge von Äpfeln. Dann sind alle Äpfel, die in diesem Korb liegen, Elemente dieser Menge. So, es gibt natürlich noch weitere Betrachtungen in der Mengenlehre. Teilmengen, Schnittmengen, Vereinigungsmengen, Differenzen und Komplimente und die sogenannte Potenzmengen und wahrscheinlich noch ein paar andere auch, aber das sind diejenigen, die wir uns hier weiter anschauen werden, insbesondere am Ende die Potenzmenge. Wenn wir uns nun den Teilmengen zuwenden, können wir formal sagen, dass eine Menge A eine Teilmenge einer Menge B ist, wenn jedes Element von A gleichzeitig auch Element von B ist. Wenn wir uns jetzt an unseren Apfelkorb zurück erinnern, können wir den genau anschauen und feststellen, dass unser großer Korb mit Äpfeln grüne Äpfel hat und rote Äpfel hat. Wenn sie natürlich eine kindheitsbedingte Abneigung gegen grüne Äpfel haben, weil die sauer sind, interessiert sie natürlich nur noch der Anteil der Äpfel, die rot sind. Deswegen ist es dennoch so, dass ihr Korb mit Äpfeln aus roten sowie den grünen Äpfeln besteht und der Anteil der roten Äpfel einfach nur ein Teil des Gesamten ist. Das funktioniert beim Mengen ganz genau so. Weitere Konzepte sind hier die Vereinigung, Schnitt und Komplement von Mengen. Die Vereinigung ist hier das Zusammenfassen zweier Mengen. Ich merke mir das immer grundsätzlich so, wenn das Symbol nach oben offen ist, ist das wie der Kübel, den sie im Sandkasten hatten und mit einer Schaufel Sand oben rein schaufeln können, der füllt sich quasi. Deswegen werden die Mengen vereinigt zusammengenommen und der Vereinigungsoperator unten sagt ihnen eigentlich nur, dass diese Elemente eben nun zu einer neuen Menge zusammengefasst werden. Das heißt hier links grauschatiert bildet eine neue Menge aus zwei Mengen. Was ist ein Beispiel dafür? Sie können hergehen und sagen, ich habe meinen Korb mit Äpfeln und ich stelle einen zweiten Korb mit Äpfeln daneben und kippe das in ein großes Fass. Dann habe ich eine Vereinigung. Bei den Schnittmengen ist es so, dass nur die Elemente, welche in beiden Mengen vorhanden sind, beachtet werden. Elemente, die nur in A oder nur in B alleinig vorkommen, werden ignoriert. Der Schnitt ist wie eine Plätzchenform. Das ist meine neue Brücke, die ich mir dazu immer ausdenke. Das sieht aus wie ein Ausstecherchen. Wir nehmen nur diese Elemente, die in A als auch in B vorhanden sind. Sozusagen die Schnittmenge. Deswegen nennt sich das auch so. Und wir haben noch das Komplement. Das Komplement sagt mir alle Elemente, die nicht in A sind, sind das Komplement zu A. Nehmen wir wieder unseren Kreis, der hier weiß leuchtet. Das sind alle die Elemente, die nur in A vorhanden sind, aber sonst nirgendwo sonst. Und das Komplement ist quasi alles das, was nicht A ist. Nehmen wir unseren Apfelkorb zurück. Wenn unser Apfelkorb A ist und nur in unserem Apfelkorb grüne Äpfel vorhanden sind, aber auf dem Tisch außenrum noch rote Äpfel liegen, dann können wir sagen, nur die grünen Äpfel sind A und alles andere ist nicht A, also das Komplement von A. Kommen wir nun, nachdem wir gelernt haben, wir können Mengen in verschiedener Art und Weise aufteilen, zur formalen Definition einer Potenzmenge. Die Potenzmenge ist hier ein Gedankenkonstrukt, was im Vergleich zu den zuvor genannten Mengen-Einteilungen, der nicht einmal wirklich relevant ist. Eine Potenzmenge ist quasi ein Grundverständnis, was sie erlangen müssen, um die weiteren Konzepte verstehen zu können. So, wir fangen mal mit dem sehr kryptischen Begriff an, die Menge aller Mengen einer beliebigen Menge x, welche die leere Menge und x selbst enthält, nennt sich Potenzmenge p von x, puh. Das habe ich mir gerade auch gedacht. Es ist natürlich auch so, dass Mengen andere Mengen enthalten können, das haben wir gerade gelernt. Und jetzt betrachten wir eine Menge, welche Mengen enthält und zwar so viele Mengen, wie man beliebig viele Teilmengen von x bilden kann, inklusive der leeren Menge und x selbst. So, das ist natürlich noch der zweite kleine Hammer neben der Ausgangsdefinition, die wir heute hatten. Deswegen schauen wir uns doch dieses Bild mal an. Ich habe das Ihnen hier grafisch dargestellt, um Ihnen einfach das deutlich zu machen, was eine Potenzmenge ist. Und ich finde, bevor wir uns Definitionen ansehen, in denen das Wort Menge sechsmal vorkommt, ist eine Grafik immer besser wie Worte. Sie sehen ganz oben die Menge der Elemente a, b und c. In der zweiten Reihe darunter sehen Sie die Kombination von möglichen Teilmengen. Die Menge a, b ist in a, b und c enthalten. Man kann natürlich auch Mengen bilden, die nur ein einziges Element enthalten. Also ist die Menge nur das Element a enthalten, ist eben auch eine Menge und somit eine Teilmenge von a, b und damit wiederum eine Teilmenge von a, b und c. Und die leere Menge wird hier eben mit reingerechnet. So, und diesen ganzen, ich nenne das mal fast Kreis, den Sie hier sehen, zusammengenommen bildet eine Potenzmenge. Also die Potenzmenge von x enthält hier eben diese ach Elemente von a, b und c. Nun, wir haben gerade sehr viel über Mengen gelernt. Wir haben das Wort Menge auch sehr oft gehört. Ich fasse das nochmal kurz zusammen. Mathematische Objekte können zusammengefasst werden. Eine Zusammenfassung solcher Objekte, der Regel ist in das Zahlen, Variablen oder eben auch Funktionen, bezeichnet man als Menge, können unterteilt werden und die Menge aller möglichen Mengen, die so eine Menge eben haben kann an Teilmengen, nennt sich Potenzmenge. Wir fahren jetzt einfach fort, nachdem wir auch schon gehört haben, es gibt mathematische Funktionen. Ich denke, das sollte Ihnen an eine Ingenieursfakultät nicht neu sein. Ich werde trotzdem nochmal den Funktionsbegriff einführen, weil wir fahren nun mit der Frage fort, was ist denn eigentlich eine Funktion? Und was haben Funktionen denn mit Mengen zu tun? Wir machen weiter mit einer formalen Definition, einer Funktion oder einer sogenannten Abbildung. Eine Funktion oder Abbildung stellt eine Relation zwischen zwei Mengen her. Eine Funktion f ordnet jedem Element x einer Definitionsmenge d, genau ein Element y, einer Zielmenge z zu. Das heißt, wir haben hier zwei Informationen. Das zwei Elemente miteinander verbunden werden, x und y und zwei Mengen d und z. Das heißt, wir haben zwei Sachen und zwar eine Funktion bildet Elemente einer Menge d auf Elemente einer anderen Menge z ab. So, das bedeutet, wir nehmen ein Element x aus einer Definitionsmenge d, geben diesem x eine Funktion und die Funktion sagt, okay, liebes x, du gehörst zu Element y aus der Zielmenge z. Mathematisch gesehen ist eine Funktion eine Abbildung. Und zwar, es wird unterschieden zwischen Bild und dem sogenannten Urbild. Das Bild eines Elementes x aus d ist der Funktionswert f von x. Der Funktionswert f von x ist nichts anderes wie das y aus der Zielmenge z. Daher sagen wir hier auch, das Bild einer Funktion ist die Menge der Bilder aller Elemente aus d. Das heißt, wenn wir nicht nur ein Element betrachten, also nicht nur ein x aus d, sondern die gesamte Menge, dann sehen wir, dass die Funktion eine gesamte Menge in eine andere abbildet. Daher steht hier unten auch, das Bild einer Funktion ist eine Teilmenge der Zielmenge und wird Bildmenge genannt. Das Urbild eines Elements y aus z ist die Menge aller Elemente aus d, deren Bild y ist. So, es klingt jetzt unglaublich kryptisch und ich habe schon wieder sehr oft das Wort Menge verwendet. Was bedeutet das denn jetzt? Ein Element x aus unserer Definitionsmenge hat einen Funktionswert f von x. Ich denke, das haben sie alle schon mal gehört, das muss ich, denke ich, auch nicht weiter erläutern. Was ich jedoch erläutern sollte und was ich auch erläutere, ist, dass ich nicht nur einzelne Elemente einem Funktionswert zuordnen kann, sondern jedem Element aus der Definitionsmenge kann ich einen Funktionswert zuordnen. Und hier ist das Ganze rückwärts dargestellt. Die Elemente, auf die abgebildet wird, also mein y aus z, hat ein Urbild und zwar mein x. Mein x ist das Urbild von y. Das sind andere Begriffe und eine etwas exaktere Darstellungsweise, die das Wort Menge eben mitverwenden und ich bin mir nicht sicher, in wie vielen Vorlesungen, Veranstaltungen das so gehandhabt wird. Mir ist es persönlich ein Anliegen, das bei Ihnen so einzuführen. Dann tun Sie sich später wesentlich leichter, sich die Konzepte, die wir hier im Kurs durchnehmen werden, vorstellbar zu machen. So, wir haben gerade gelernt, dass wir Elemente einer Menge über Funktionen in andere Mengen abbilden können. Jetzt ist es allerdings auch so, dass es nicht nur eine Art der Abbildung gibt und dass wir hier verschiedene Dinge beachten müssen. Das erste ist die sogenannte injektive Funktion oder Injektivität, nennt sich auch Linkseindeutigkeit, bedeutet in diesem Fall, dass aus meiner Definitionsmenge, aus meinem x heraus, jedes Element, was in d enthalten ist, auf y abgebildet werden kann und dort eine Entsprechung findet. Wie Sie hier im Bildchen unten sehen können, werden die Zahlen 1, 2, 3, also das Element 1 zum Beispiel aus der Menge x auf das Element d der Menge y abgebildet über eine Funktion. Was Sie auch sehen können ist, dass nicht jedes Element der Zielmenge, also nicht jedes Element von y, ein Urbild in x hat. Das bedeutet Injektiv. Wir können jetzt weitermachen und sagen, es gibt sujektive Funktionen, eine Sujektion nennt sich auch rechtstotale Funktion, und die sagt mir, dass für jedes Element in y Mindestens ein Urbild in x vorhanden ist. Das heißt, dass für das Element d, b und c mindestens eine Entsprechung in x vorhanden ist. Was wir hier allerdings im Vergleich zur Injektiven Funktion sehen können, ist, dass nicht nur ein Element aus x auf ein Element von y abbildet und in y welche übrig bleiben können, sondern dass zwei Elemente aus x auf das selbe Element in y abbilden. Der letzte Typ an Funktionen, den ich Ihnen hier zeigen kann, ist die biaktive Funktion, und wer wo bei biaktion ein Eindeutigkeit bedeutet. Das heißt, Injektivität und Sujektion gleichzeitig. Das ist quasi ein Vorgriff zum mathematischen Strukturen, wo Biaktion auftreten können und unternahmen wie Isomorphismus und Homo-Morphismen, wenn man topologische Räume betrachtet, darauf zurückgreift, das machen wir hier allerdings nicht. Es ist nur, sollte Ihnen dieser Beriff mal über den Weg laufen oder sollte Ihnen schon über den Weg gelaufen sein, hier machen wir es nicht. Um wieder auf den Punkt zurückzukommen, Biaktivität oder Biaktion bedeutet Ein-Eindeutigkeit. Das ist auch was, was in der Programmiertechnik und auch in den Datenwissenschaften von hohem Wert ist, Ein-Eindeutigkeit herzustellen. Jeder von Ihnen, der schon mal eine Datenbank von innen gesehen hat, wird den Wert von Ein-Eindeutigkeit sowieso zu schätzen wissen. Ein-Eindeutigkeit im mathematischen Sinne hier bedeutet, dass jedem Element aus x genau ein Element aus y geordnet wird und dass jedes Element aus y genau ein Urbild in x hat. Das heißt, die 1 aus x wird dem d aus y zu geordnet, die 2 dem b, die 3 dem c und die 4 dem a und nicht wie vorher, dass das c alleine bleibt oder dass 3 und 4 auf dasselbe Element in y zeigen. Das bedeutet, Biaktion ist hier besonders wichtig, weil Biaktion Ein-Eindeutigkeit suggeriert und das bedeutet, dass jedes Element aus x ein Element aus y bekommt. Was ich Ihnen hier noch dargestellt habe ist die sogenannte Verkettung. Das ist denke ich wieder was, was die meisten von Ihnen sicher schon mal gesehen haben in der Schule oder auch im Verlauf Ihres Studiums. Eine Verkettung sagt nichts anderes, dass ich Funktionen auch nacheinander ausführen kann. Ich habe zwei Funktionen, eine Funktion f mit der Menge a in die Menge b ab und eine Funktion g, die aus derselben Menge b in die Menge c abbildet. Das bedeutet, dass der Erwertebereich der ersten Funktion mit dem Definitionsbereich der zweiten Funktion übereinstimmt oder auch als Teilmengen enthalten ist und wenn das gegeben ist, können Sie das verketten. Sie haben hier den sogenannten Verkettungsoperator, das ist dieser lustige Kringel zwischen g und f. Das heißt, Sie haben hier g wird verkettet mit f, und das bedeutet, dass die Menge a direkt in die Menge c abgebildet wird und dass das Element x auf den Funktionswert der Verkettung zwischen g und f abgebildet wird, also g von f von x. Was heißt das genau? Das bedeutet, dass ich, wenn ich wieder in den Dreischritt zurückfahre, mein x erst aus der Menge a in die Menge b abbilde in die Menge c überführe. Das heißt, ich kann Funktion auch miteinander kombinieren so dass das Argument einer Funktion eine andere Funktion ist. Das ist jetzt mathematisch relativ uninteressant für uns, sondern eher in Hinsicht auf unsere Programmierung wenn es darum geht Funktionen zu iterieren oder recurrente Funktionen zu bauen indem ich eine Funktion nicht nur sagen ausführe und sagen kann ich nehme g von f von x sondern ich nehme f von f von x und führe diese Funktion einfach zweimal aus. Deswegen habe ich das ja einfach nochmal dargestellt, weil wir später darauf zurückkommen werden. Nun, wir haben uns jetzt bisher darauf beschränkt Funktion eher allgemein zu betrachten. Wir werden hier im Kurs allerdings viele weitere Funktionen und Eigenschaften ansprechen. Wichtige Beispiele für diese Funktionstypen sind lineare Funktionen beispielsweise bei der linearen Regression Potenzfunktionen die nicht unbedingt exponential sind, die habe ich hier separat aufgelistet, also auch Exponential- und Logarithmusfunktionen gerade auch weil Exponentialfunktionen wie wir es hier in der Covid-19 Zeit ja als allemal per Media lernen für Wachstums Vorgänge wichtig sein wird deswegen werden wir die hier in unserem Kurs auch noch brauchen trigonometrische Funktionen also Sinus- und Cosinusfunktionen wir werden keine weiteren brauchen außer Sinus und Cosinus das reicht um im Kapitelsignal Analyse Ergebnisse zu erzielen und wir werden, sobald wir auch in das Thema Fraktale reingehen um die komplexwertigen Funktionen nicht drumherum kommen, aber wir werden zu gegebenen Zeitpunkt darauf zurückkommen. Eigenschaften für variablen Funktionen Grafen, die wir hier benutzen oder verwenden werden sind vor allem Symmetrie, Stetigkeit, Differenzierbarkeit und Integrierbarkeit und für die Funktionstypen und Eigenschaften die wir hier brauchen und die ich anspreche werde ich nochmal darauf eingehen sollten wir die tatsächlich im Detail benötigen es geht nun darum, dass sie schon mal hören und gehört haben auf welcher Aspekte ich hier besonderen Wert lege und auf welcher Aspekte sie stoßen können wenn sie in der dazugehörigen Literatur tiefer einsteigen. Wenn wir nun schon beim Thema Einsteigen sind fahren wir doch fort mit der Definition von mathematischen Begriffen, die unbedingt nötig sein werden um spätere Kapitel zu verstehen und die Literatur zu verstehen und um allgemein Horizont zu erweitern. Ich verspreche Ihnen, es wird später praktischer. Wir fahren jetzt erstmal fort und reden über mathematische Strukturen. Eine mathematische Struktur ist eine Menge mit bestimmten Eigenschaften also nicht nur eine Menge, sondern eine Menge, die gewisse Eigenschaften hat welche sich aus der Relation der Elementen selbst das nennt sich dann Struktur erster Stufe oder aus Relation der Teilmengen Struktur zweiter Stufe ergeben. Das heißt, wir betrachten nicht nur Mengen als willkürliche Zusammenfassung von mathematischen Objekten, sondern wir unterstellen nun, dass die Menge gewisse Eigenschaften vorweist oder die Elemente oder die Teilmengen zueinander und nennen das eine mathematische Struktur. Diese Festlegung ab wann welche Eigenschaften denn als Eigenschaften zählen und ab wann wir von einer mathematischen Struktur das geschieht mittels Aktionen und lässt sich in größere Typen und Heilgebiete einteilen. Ich hab jetzt hier nur zwei Stück mal aufgeführt zum einen die algebraische Struktur da gehören Gruppen und Ringe dazu und zum anderen Relationale Strukturen also Ordnungsstrukturen und topologische Struktur. Mehr hab ich im Moment noch zu mathematischen Strukturen gar nicht zu sagen wir kommen da später noch mal drauf wir fahren jetzt erstmal fort und sagen ok wir wissen was eine Menge ist wir wissen was Teilmengen sind und wir wissen was Elemente sind und jetzt bringen wir das doch mal zusammen und sagen eine Menge denn Elemente alles am Teilmenge in einer gemeinsamen Grundmenge sind bezeichnet man als Mengensystem das klingt jetzt wieder sehr kryptisch deswegen machen wir es erstmal nochmal formal ist x eine Grundmenge so heißt jede Teilmenge a der Potenzmenge ein Mengensystem über x so das hilft den meisten wahrscheinlich auch nicht weiter wir gehen einfach davon aus wir haben eine Menge x das ist unser Körbchen mit Äpfel und wir haben Teilmengen das sind die grünen Äpfel die roten Äpfel oder Äpfel in einer Farbe die es im realen Leben nicht gibt das können sie sich jetzt aussuchen und die Substanzen sie konsumieren auf die Substanzen will ich an dieser Stelle gar nicht weiter eingehen das überlasse ich Ihnen ich kann Ihnen natürlich nur davon abraten als Dozent logischerweise kümmern wir uns wieder um unsere Mengensysteme ich wiederhole es nochmal ist x eine Grundmenge so heißt jede Teilmenge der Potenzmenge ein Mengensystem über x das bedeutet jedes Element der Potenzmenge ist ein sogenanntes Mengensystem über x Siegmaringe, Dinkinsysteme die Potenzmenge selbst topologische Systeme oder die sogenannte Siegmar Algebra über die wir als nächstes sprechen müssen nun um unsere zoologische Tour durch mathematische Grundbegriffe fortzusetzen sprechen wir jetzt erstmal über eine Siegmar Algebra die Siegmar Algebra wird auch Siegmar Mengen Algebra abgeschlossenes Mengensystem Siegmar Körper oder Borelschermenge genannt und ist ein Mengensystem wir haben gerade gelernt ein Mengensystem ist eine Teilmenge eine Grundmenge die in der Potenzmenge enthalten ist ein Hoch auf den Begriff Menge aber um es runter zu kürzen eine Potenzmenge enthält alle möglichen Kombinationen von Teilmengen die eine Grundmenge x haben kann also merken wir eine Siegmar Algebra ist eine Teilmenge der Grundmenge und für was benutze ich Siegmar Algebra für was brauche ich da schon wieder einen neuen Begriff Siegmar Algebra werden als Definitionsbereiche für sogenannte Maße verwendet Maße führen wir später noch ein und die werden dafür genutzt die Maße die über Siegmar Algebra definiert werden um Mengen ein abstraktes Volumen oder eine Wahrscheinlichkeit zuzuordnen so damit kann man schon wieder relativ viel anfangen wir merken uns jetzt erstmal Siegmar Algebra sind Definitionsbereiche für Maße und damit kann man abstrakte Volumen oder Wahrscheinlichkeiten zuordnen das bedeutet, dass man die Größe in Anführungszeichen eine Menge messbar machen möchte so Siegmar Algebra sind deswegen auch Grundlage des Maß- oder Wahrscheinlichkeitsraums und bilden nach dem Weihnacht Tarski Baradoks und die Grundlage zur Volumenbestimmung und ist auch die Grundlage für rastische Prozesse insbesondere in der Finanzmathematik wie wir es später noch kennenlernen werden wow, das klingt jetzt schon wieder richtig gigantisch, wir kommen aber noch dazu für was das denn eigentlich alles gut ist und wir werden es auch durchrechnen und wir werden es auch richtig gut verstehen, lernen mit der Zeit so, kommen wir zunächst einmal zur formalen Definition einer Siegmar Algebra wir haben hier wieder drei Omega eine nicht leere Menge unser IP von Omega die Potenzmenge dieser Menge dieser erste Satz sagt eigentlich nur wir haben ein Korb und in diesem Korb liegt was drin und wir haben eine Potenzmenge die mir die ganzen Kombinationen von Teilmengen als Menge ausgibt so ein Mengensystem A was eine Teilmenge dieser Potenzmenge ist, das heißt ein Element dieser Potenzmenge ist eine Menge A und die A ist eine Teilmenge von Omega also eine Menge von Teilmengen von Omega heißt Siegmar Algebra auf oder über Omega wenn drei Bedingungen erfüllt sind ok, das klingt jetzt etwas bewirrend ich fange nochmal von vorne an ein Mengensystem A, was eine Teilmenge der Potenzmenge ist heißt Siegmar Algebra auf oder über Omega wenn Bedingungen erfüllt sind so, was sind das denn für Bedingungen das heißt, dass die Teilmenge die Grundmenge selbst enthält und das A stabil ist bezüglich der Komplementbildung das heißt dass wenn ich eine Teilmenge der Teilmenge habe also das Blockschrift A Element Kursiv A das auch das Komplement von diesem Blockschrift A in diesem A Kursiv enthalten sein muss und A ist stabil bezüglich abzählbarer Vereinigungen das heißt, ich habe jetzt ganz ganz viele Teilmenge in Blockschrift A1, 2 bis N und die sind auch Teilmengen dieses kursiven As das bedeutet dann natürlich auch, dass die Vereinigungen das heißt, die Menge die zustande kommt, wenn ich die A1, A2, A1 zusammennehme ebenfalls in A enthalten sind das waren jetzt jede Menge As ich formuliere es nochmal anders und versuche das runterzubrechen wir haben gelernt die Potenzmenge enthält alle Kombinationen von Teilmengen die eine Grundmenge besitzen kann wir haben auch gelernt dass eine Menge aus anderen Mengen bestehen kann daraus folgt natürlich auch, dass die Potenzmenge aus Mengen besteht, die wieder selbst Mengen enthalten können Sie merken, das Wort Menge ist Ihr neues Lieblingswort und ich fasse es aber nochmal zusammen ein Mengensystem das ist unser kursives A was eine Teilmenge der Potenzmenge ist und 3 Bedingungen erfüllen muss unser Mengensystem unsere Teilmenge enthält die gesamte Menge und enthält auch Komplimente und abzählbare Vereinigung die 3 Bedingungen, wenn sauber erfüllt sind dann nennt man A dieses Mengensystem A Algebra wir lassen das erst mal noch stehen ich habe später ein Beispiel für Sie wo man das noch sehr deutlich sehen kann was damit denn genau gemeint ist wir kommen aber zunächst einmal zu dem Begriff Maas wir haben gerade gelernt, Maße werden über Siegmar Algebra definiert die Siegmar Algebra gibt den Definitionsbereich eines Maases aber was ist denn eigentlich ein Maas außer bei den Bayern was zum trinken fangen wir mal hier an ein Maas in der Mathematik stellt eine Funktion dar die Teilmenge in einer Grundmenge zahlen zuordnet welche als Maas für die Größe dieser Menge interpretierbar ist sowohl Definitionsbereich eines Maases als auch Zuordnung selbst müssen gewisse Voraussetzungen erfüllen so okay das hilft uns jetzt auch nicht weiter wir haben gelernt es gibt verschiedene mathematische Objekte die können wir in Mengen zusammenfassen diese Mengen können wir in Teilmengen aufteilen und jetzt ist es aber so, dass wir nicht nur von Äpfeln reden wollen oder von Bienen oder Obstarten ihrer Wahl sondern wir möchten interpretierbare Zahlen als ich sage es mal Saloppvolumenersatz oder Größenersatz dieser Menge zuordnen damit wir damit arbeiten können ich möchte nicht sagen die Menge Omega besteht aus 3 roten Äpfeln und 2 blauen Äpfeln sondern ich möchte sagen die Anzahl der Elemente ist 5 zum Beispiel und dazu müssen wir Maße einführen um Mengen messbar machen zu können und der Definitionsbereich eines Maases ist die sogenannte Sigma Algebra wie wir sie gerade kennengelernt haben die Sigma Algebra ist ein Mengensystem was eben diese 3 Bedingungen erfüllen muss und auf diese Sigma Algebra können wir Maße anwenden was dazu genutzt werden kann den Mengen Größen zuzuordnen so, wenn Sie sich jetzt fragen der Einzige der hier irgendwelche Bierkrüge und Substanzen zu sich nimmt bist du lieber Dozent das muss ich jetzt offiziell einfach mal verneinen aber ich möchte Ihnen auch zeigen für was benötigen Sie das denn überhaupt ich schmeiß hier mit Begriffen um mich rum Sie bekommen hier den Ein nach dem anderen um die Ohren gehauen und ich möchte Ihnen aber auch mit auf den Weg Ihnen für was Sie das denn eigentlich brauchen Maße bilden hier die Grundlagen moderner Integralbegriffe zum Beispiel das Lebesque Integral ist so der Standard den wir hier bei uns eben nehmen als Erweiterung des Riemannschen Integralbegriffes und Maße bilden hier eben die Grundlage das heißt was wir hier lernen sind grundlegende Begriffe die in alle Bereiche der Mathematik ausdehnbar sind zudem ist es so, nachdem wir hier auch angewandte Statistik betreiben wollen es ist auch so, dass in der Stochastik seit der Aktionatisierung durch Kolmogorov Wahrscheinlichkeitsmaße verwendet werden um Zufallsereignissen eines Ergebnisraumes Wahrscheinlichkeiten zuzuordnen das heißt einen Hinblick auf unsere Zufallsvariablen und auf unsere Zeitrein und auf unsere Modellierung wenn wir den Begriff Wahrscheinlichkeit verwenden muss uns bewusst sein dass es Wahrscheinlichkeitsmaße sind die über irgendwelchen Mengen definiert werden müssen und genau das machen wir hier ich führe Sie quasi Schritt für Schritt dahin zu verstehen was ist eine Wahrscheinlichkeit was ist ein Maß und wofür verwende ich das Ganze denn überhaupt nachdem wir jetzt sehr viele Formeln und ganz viele Begriffe gesehen haben und davon gehört haben ist es an der Zeit uns das einfach mal ganz salopp als Bildchen anzugucken Sie sehen links Ihre 3 Kreise ein hellgrauen und ein dunkelgrauen und ein ganz dunkelgrauen in der Mitte Sie sehen der graue Ring außen bildet die Grundmenge und die 2 anderen Ringen sind Teilmenge der grauen Ring enthalten sind und was wir jetzt machen ist folgendes wir nehmen Zahlen von 0 bis unendlich und ordnen die den Mengen zu und sagen ok die Zahl 5 ist die Größe des dunkelgrauen Kreises in der Mitte also die dunkelgraue Menge in der Mitte hat die Zahl 5 damit können wir sagen ok meinen Wegen können wir es interpretieren ist den 5 Elemente da drin enthalten oder das Volumen ist 42 können Sie sich was aussuchen das hängt vom Maß ab was Sie hier grafisch sehen können ist die Kreise sind unsere Mengen die hellgraue Menge außen besteht aus zwei Teilmengen und den Komplementen und wir gehen nun her und ordnen diesen Mengen Zahlen zu was Sie an diesem Zahlenstrahl ablesen können jetzt habe ich natürlich gesagt Definitionsbereiche für Maße sind die Siegmalgebrinnen und wir können damals Lustige Pfeilchen aus Kreisen auf andere Pfeilchen machen das hilft uns aber nichts wir müssen das ja irgendwie formal mal zusammen bringen und in einen Guss gießen deswegen sprechen wir jetzt erstmal darum was ist eine formale Definition eines Maßes und hier haben wir wieder unser A sei A eine Siegmalgebra über eine nicht leeren Grundmenge Omega das heißt es existiert eine Funktion Mühe die diese Siegmalgebra abbildet auf das Intervall von 0 bis unendlich und diese Funktion die das tut nennen wir Maß sofern folgende Bedingungen erfüllt sind bevor wir über die Bedingungen sprechen spring ich nochmal eins zurück wir sehen hier nochmal unsere Mengen und wir sehen die Teilmengen dieser großen Menge außen rum sagen wir wir haben diesen grauen Kreis den großen Teilmengen aus dem dunkel grauen und dem ganz dunkel grauen und das ist unsere Siegmalgebra und nun nehmen wir diese Siegmalgebra und ordnen diesen Mengen Zahlen zu die quasi ein Volumen oder eine Größe implizieren so und das geschieht über die Funktion Mühe die Funktion Mühe nennen wir Maß wenn folgende Bedingungen erfüllt sind und zum ein ist es so eine leere Menge kein Maß es hat den Wert 0 also wenn wir das Maß als Größe interpretieren eine leere Menge in der nichts drin ist kann auch keine Größe haben deswegen ist es so dass das Maß eine leere Menge eben 0 ist dann haben wir die sogenannte Siegma Additivität so die jeder Folge Paarweiser des jungter Mengen aus A zuordnet das Maß also die Größe der Vereinigungen aller dieser Mengen gleich die Summe der Einzelmaße ist es macht auch irgendwo Sinn nehmen wir einfach mal beispielsweise an das A1 hat die Größe 1 das A2 hat auch die Größe 1 und das A3 hat auch die Größe 1 dann ist es natürlich so dass wenn die erste Menge 1 groß ist die zweite Menge 1 groß ist und die dritte Menge 1 groß ist ist auch bitte so sein sollte dass wenn ich diese 3 Mengen in einen Topf schmeiße wir bei der Größe 3 rauskommen und das gilt natürlich hier auch egal ob wir erst die Mengen zusammenfassen also die erste Menge, die zweite Menge die dritte Menge, in eine neue Menge packen und darauf das Maß berechnen oder ob wir die Maße zuerst berechnen und diese dann zusammenzählen es sollte am Ende das Maß 3 rauskommen und hier mit den Paarweisen des jungten Mengen in der Sigma-Attitivität dargestellt ist der dritte Punkt den wir hier erfüllen müssen ist die sogenannte Nicht-Negativität es bedeutet einfach nur dass ein Maß positiv sein muss wenn wir vorher schon definiert haben dass eine leere Menge 0 ist also dass eine leere Menge wo nichts drin ist sozusagen den Wert 0 hat macht das absolut keinen Sinn einen Negativ-Maß zu definieren was heißt das denn was heißt denn das Maß die Größe einer Menge ist minus 5 das macht keinen Sinn deswegen müssen wir das mathematisch hier ausschließen ich fasse das jetzt einfach nochmal zusammen wir haben eine Sigma Algebra eine Sigma Algebra ist ein Mengensystem was ein Teil der Potenzmenge ist um gewisse Eigenschaften erfüllt wie die die ich Ihnen vorher genannt habe und wir nehmen jetzt eine Funktion die wir Maß nennen und wir nehmen diese Funktion und wenden sie auf die Sigma Algebra an um den Teilmengen der Sigma Algebra Werte zwischen 0 und unendlich zuzuordnen die wir als Größe interpretieren können dieses Maß können wir anwenden wenn die leere Menge die Größe 0 bekommt wenn der Zusammenschluss von Mengen vor und nach Anwendung des Maßes identisch sind das heißt wenn ich eine Menge nehme die hat die Größe 1 und rechne noch eine Menge drauf die die Größe 1 hat soll 2 rauskommen egal ob ich erst die Maße der Einzelmengen bestimme oder ob ich das Maß der zusammengefassten Menge benutze und das Maß soll natürlich nicht negativ sein weil negative Größen und negative Volumina sind irgendwie gruselig die machen wir hier nicht genau bringen wir doch die ganzen Konzepte mal in Zusammenhang wir sehen es existieren mathematische Objekte und diese Objekte lassen sich zu Mengen zusammenfassen ich denke das ist soweit eben noch klar Korb, Äpfel, Menge von Äpfeln und so also es gibt mathematische Objekte die lassen sich zu Mengen zusammenfassen im nächsten Schritt haben wir gelernt es gibt sogenannte Potenzmengen also das sind Mengen von Mengen und zwar aller möglichen Kombination von Teilmengen die eine gewisse Grundmenge aufzuweisen hat diese Elemente von Mengen lassen sich anhand einer Zuordnungsvorschrift sogenannte Funktion aufeinander abbilden und man kann natürlich Mengen mittels Maßen mit Größen versälen und Mengen mit bestimmten Eigenschaften haben eine mathematische Struktur so ich habe jetzt ein verlauter Übereifer die Mengensysteme übersprungen deswegen hole ich das jetzt schnell nach es gibt zudem Mengensysteme und es gibt Siegmalgebrennen welche ein Mengensystem ist sofern gewisse Bedingungen erfüllt sind diese Siegmalgebrennen dienen als Grundlagen für Maße und diese Maße sind Funktionen die es erlauben eine Grundmenge zahlen zuzuordnen und diese Elemente können entweder Einzel-Elemente sein oder eben wieder Mengen oder sogar Mengen von Mengen wie wir in diesem Bild gesehen haben so toll jetzt erzählt er mir seit einer knappen Stunde was über mathematische Begriffe über Mengen, über Maße und Strukturen und eigentlich hat er mal zufallsvariablen angefangen was zum machen wir hier eigentlich kommen wir mal zum Pudelskern und zwar für was brauchen wir das alles und wofür die ganzen Konzepte wohl das Wort Raum da noch nicht mal vorgekommen ist weil wir haben ursprünglich mal gehört in der Definition einer zufallsvariablen kommt das Wort Wahrscheinlichkeitsraum vor wir haben jetzt ganz viel geredet das Wort Raum relativ häufig in den Mund zu nehmen also stellen wir uns jetzt einfach mal die Frage was ist ein Raum überhaupt wozu brauche ich das und wofür ich euch denn eigentlich hin fangen wir doch deswegen einfach mal an zu sagen was ist ein Raum wir sind jetzt hier nicht bei Star Trek sondern leider noch in der Mathematik und dann fangen wir an mal ganz zerlaub hinzustellen was ist denn ein Raum ein Raum ist eine Menge mathematische Objekte mit einer Struktur wir haben vorher gelernt eine mathematische Struktur ist eine Menge mit gewissen Eigenschaften die über Aktionen definiert sind und jetzt stellen wir fest ein Raum ist eine solche Menge die über eine mathematische Struktur verfügt also ein Raum ist eine Menge mathematischer Objekte mit einer gereden Struktur Beispiele hierfür ich denke das kennen Sie aus den Ingenieurswissenschaften sind Vektoren in einem Vektoraum oder andere mathematische Objekte wie Reale oder komplexe Zahlen Zahlen, Tupel, Matrizen und Funktion ich denke das hat jeder von Ihnen schon mal in der Hand gehabt damit hat jeder von Ihnen schon mal gearbeitet aber jetzt wissen wir, dass diese ganzen Objekte auch irgendein Zuhause brauchen die müssen ja irgendwo wohnen und sie wohnen in sogenannten mathematischen Räumen und wenn diese ganzen mathematischen Objekte bilden Mengen und wenn die Mengen eine Struktur hat dann leben sie in einem Raum was ich Ihnen jetzt hier abgebildet habe wird eigentlich erst richtig interessant so fähren wir im Kapitel Fraktale ankommen ich habe es Ihnen hier allerdings schon mal abgebildet weil gerade in Ingenieurswissenschaften sehr viel damit gemacht wird und auch einfach für Sie zur Übersicht dass ein Raum nicht nur irgendein Raum ist, sondern dass es auch Hierarchien gibt in den Räumen und wir fangen hier mal von unten an einer Topologie ein topologischer Raum ist so der allgemeinste Begriff von Raum den wir kennen und ein topologischer Raum kann zugleich ein metrischer Raum sein kann zugleich ein nomierter Raum sein und kann auch ein Skonar Produkt sein, muss aber nicht sein allerdings ist es anders drum nicht so ein Skalarprodukt ist zwangsläufig also ein koalgliedischer Raum ist zwangsläufig ein nomierter Raum ist zwangsläufig ein metrischer Raum und muss zwangsläufig ein topologischer Raum sein so können Sie diese Grafik hier lesen wenn Sie mit diesen Raumbegriffen noch nicht viel anfangen können das macht nichts wir werden die Pö-Apö kennenlernen so am Rande beziehungsweise nicht Pö-Apö wir fangen mit dem topologischen Raum eigentlich sofort an und stellen uns die Frage was ist denn ein topologischer Raum ich habe ja gesagt ein topologischer Raum ist ein sehr allgemeine Definition eines Raumes und ein Raum haben wir gelernt ist eine Menge mit einer gegebenen Struktur also fangen wir mal an ein topologischer Raum ist ein Mengensystem bestehend aus Teilmengen einer Grundmenge die offen oder offene Mengen werden und folgende Aktion erfüllen das heißt wir lernen gerade dass eine Menge offen sein kann darauf gehe ich in einer Minute ein wir reden jetzt erstmal nochmal über die Aktionen die erfüllt werden müssen damit ein topologischer Raum überhaupt existieren kann also ich fange nochmal an ein topologischer Raum ist ein Mengensystem bestehend aus Teilmengen einer Grundmenge und diese Teilmenge müssen offen sein und folgende Aktion erfüllen so die leere Menge und die Grundmenge sind offen die Durchschnittschnitte oder der Durchschnitt endlich vieler offener Mengen ist offen und die Vereinigung vieler offenen Mengen ist offen das ist effektiv eine Adaption von der Sigma-Attitivität die wir vorher hatten und der Basiseigenschaft einer Sigma Algebra dass die stabil gegenüber Komplimenten und Schnitten sind und das sehen wir hier auch bei den topologischen Räumen ein topologischer Raum ist wie gesagt ein Mengensystem weil es aus Teilmengen eine Grundmenge besteht die offen sind und quasi eine offene Grundmenge eine offene leere Menge haben müssen und im Durchschnitt auch wieder offen sein müssen das bedeutet ich bilde ein Durchschnitt oder eine Vereinigung offener Mengen und dieser Durchschnitt oder diese Vereinigung muss wieder offen sein man nennt dann M eine Topologie auf Omega und das Paar ich nenne mal diesen Kringel O und Omega einen topologischen Raum Uff was heißt das denn jetzt was heißt denn eigentlich offen hier kam jetzt ganz ganz oft das Wort offen vor was bedeutet denn im mathematischen Sinne offen eine offene Menge der in Elemente nur von Elementen dieser Menge umgeben sind daher kein Element auf ihrem mathematischen Rand liegt so, wir sehen Mengen diesen zusammen und in dieser Zusammenheit von diesen Elementen der Menge ist es so, dass auf dem mathematischen Rand nichts liegen darf so, das hilft uns jetzt relativ wenig nehmen wir mal einen euklidischen Raum errennen und sagen U ist eine Teilmenge des enddimensional euklidischen Raumes und diese Teilmenge ist offen falls gilt, dass für jedes Element aus dieser Teilmenge eine reale Zahl existiert die größer Null sein soll so, dass jeder Punkt Y dieses Raum ist dass ein Abstand zu X kleiner ist als eben diese reale Zahl so, das klingt schon wieder sehr kryptisch wir haben eine Teilmenge aus Rn und jedes Element dieser Teilmenge soll bitte eine reale Zahl besitzen die ein Abstand zu anderen Elementen darstellt und jeder Punkt des gesamten Raumes dessen Abstand kleiner ist wie diese reale Zahl möge bitte in dieser Teilmenge liegen und ansonsten eben nicht ja das klingt jetzt doch sehr einleuchten sehr trivial kann sich jeder herleiten versteht auch natürlich jeder deswegen machen wir noch ein Satz mehr und sagen erstmal was soll das denn was ist denn ein Rand ein Rand einer Teilmenge U eines topologischen Raumes T ist eine Differenzmenge zwischen Rn und U ok jetzt wird es langsam richtig weird ich merke schon sie drehen die Augenbrauen nach oben aber wir haben es gleich der Kern steht nämlich in den Klammern Kompliment einer Menge ist offen damit ein Kompliment haben wir gelernt ist alles das was nicht in dieser Menge liegt und wenn das was nicht in dieser Menge liegt offen sein soll muss es ja natürlich eine reale Zahl die die Grenze irgendwie markiert wenn wir jetzt unten dieses hübsche Eierbildchen angucken ist die Grenze in dem Fall der Rand blau angemalt und wie man den Rand bezeichnet und wie man es mal darstellen kann habe ich ihn drunter geschrieben wenn sie sich jetzt das rechte Bildchen anschauen dann sehen wir den Punkt X der ist innerhalb dieser Menge und wir sehen das innerhalb dieser Menge das ist die reale Zahl und wir sehen der ist komplett in diese Menge enthalten interessant wird es dann natürlich was passiert wenn so ein Punkt Y auf dem Rand liegt was wir hier jetzt erstmal ausschließen wir möchten das nicht wir möchten dass es einen Bereich gibt in dem das Kompliment offen ist aber es einen Rand zu unserer Menge gibt so einen Rand brauchen wir deswegen weil wir irgendwo her wissen müssen wo fängt denn unsere Menge an wo hört unsere Menge denn wieder auf und genau deswegen definieren wir einen Rand und ich springe hier gerade in der Folie nochmal zurück und genau deswegen definieren wir hier eine reale Zahl Y und Große Null die uns die Grenze quasi aufzeigt und da hier kommen wir auch zum Begriff offen das heißt mit diesem topologischen Raum der aus einem Mengensystem offener Teilmengen besteht haben wir eine Möglichkeit einen Raum so allgemein wie möglich zu definieren so für was benötigen wir das denn jetzt wir benötigen das um eine ganz spezielle Art von Sigma Algebra aufzusetzen welche wir spätestens in den stochastischen Prozessen wiedersehen werden und die dort eine sehr wichtige Rolle einnimmt und zwar die Boralsche Sigma Algebra und die Boralsche Sigma Algebra ist effektiv nichts anderes wie eine Sigma Algebra nur dass sie sich auf topologische Räume bezieht da sieht man hier daran gegeben sein topologische Raum welcher aus dem Pärchen Omega und unserem O besteht wobei O das Mengensystem der offenen Mengen ist so das bedeutet in diesem Fall dass O unsere Sigma Algebra ist denn heißt die von O erzeugte die Boralsche Sigma Algebra das schreibt man mit so einem fracturierten B ich nenne das jetzt mal B von X und B von X ist definiert als die Algebra über den Mengensystem O eines topologischen Raumes die Idee hinter der Sigma Algebra ist und bleibt dieselbe die Sigma Algebra dient als Definition für Maße und wenn wir jetzt natürlich in diesem Raum irgendwas Messen oder Größenangaben machen sollen dann brauchen wir eine spezielle Art von Sigma Algebra und das ist unsere Boralsche Sigma Algebra die wir benutzen um gewisse Definitionsmengen von topologischen Räumen zu bilden entfernen wir uns jetzt von den topologischen Räumen und gehen wieder in Richtung unserer Definition einer Zufallsvariablen des Maßes also machen wir jetzt einfach mal die freche Unterscheidung zwischen einem Maßraum und einem Messraum das sind schlicht zwei verschiedene Dinge die sehr oft aufeinander gebracht werden so um diesen Unterschied mal rauszukristallisieren fangen wir erstmal an mit dem Satz eine Teilmenge von Omega die in der Sigma Algebra liegt wird messbar genannt für solche eine Teilmenge die Algebra liegt heißt Mühe dieser Teilmenge das Maß der Menge so was bedeutet denn das jetzt wir haben gelernt es gibt Mengen sogenannte Grundmengen unsere Omega die aus Teilmengen besteht und so eine Teilmenge kann man auch als Mengensystem betrachten und das Mengensystem was gewisse Eigenschaften erfüllt nämlich dass es die Grundmenge selbst die leere Menge enthält und zudem die Sigma Attitivität vorweist nennt sich Sigma Algebra und diese Sigma Algebra dient als Definitionsmenge für Maße und Maße sind Funktionen die Mengen Zahlen zuordnen so daher gehen wir her und sagen das Trippel Omega Grundmenge Sigma Algebra und Mühe das Maß wird Maßraum genannt und benötigt ein Maß dieser Maßraum dient dazu den Teilmengen und dem Raum selbst Größen zuzuordnen klingt auf einmal ziemlich logisch und macht auch irgendwo her Sinn und das Paar Omega und Sigma Algebra heißt Messraum und benötigt kein Maß es ist auch hier in der Definition das Messraum ist kein Maß enthalten das ist der große Unterschied zwischen einem Maßraum und einem Messraum das ist eine Feinheit aber man möge sie bitte beachten so wir nähern uns langsam aber mit großen Schritten unsere Definition der Zufallsvariable Sie sehen, wir haben jetzt schon sehr viel gelernt uns fehlen allerdings noch ein paar kleine Begriffe bevor wir diese Definition voll und ganz verstehen können und zwar, ich führe jetzt nochmal einen neuen Raum ein der für uns von enormer Bedeutung ist und zwar der Wahrscheinlichkeitsraum der Wahrscheinlichkeitsraum ist der Raum den wir in den stochastischen Prozessen benötigen werden und der in der Statistik grundlegend ist ich definiere den hier einfach mal kurz ein Wahrscheinlichkeitsraum ist ein Maßraum aus einer Grundmenge Omega Sigma Algebra Sigma und einem Maß, das nennen wir einfach mal P was ein Maßraum ist haben wir gerade gelernt und wir gehen einen Schritt weiter und sagen unsere Grundmenge Omega ist eine nicht leere Ergebnismenge eines Zufallsexperimentes wir haben unsere Sigma als Sigma Algebra daran ändert sich erstmal nichts und P ist ein Maß was wir im weiteren als Wahrscheinlichkeitsmaß bezeichnen einfach nur weil die Zahlen die dieses Maß den Elementen das Ergebnisraum ist zuordnet zwischen 0 und 1 liegen und als Wahrscheinlichkeit interpretiert werden können und zudem gilt dass die Wahrscheinlichkeit das ein Element des Ergebnisraums auftritt gleich eins sein muss zudem gilt die Sigma Attitivität das bleibt bestehen aber ein Wahrscheinlichkeitsraum dient dazu Wahrscheinlichkeiten ein Zuhause zu geben wir machen Zufallsexperimente und die Ergebnismenge dieses Zufallsexperimentes ist unsere Grundmenge Omega welche über eine Sigma Algebra und ein Wahrscheinlichkeitspass Wahrscheinlichkeitsmaß P bearbeitet werden kann unser P, unser Wahrscheinlichkeitsmaß ordnet den Teilmengen der Sigma Algebra Werte zwischen 0 und 1 zu und dem gesamten Ergebnisraum den Wert 1 Puh das war jetzt schon wieder ganz schön viel wenn wir uns jetzt allerdings das Bildchen angucken Sie haben ja schon gemerkt ich bin auch ein großer Fan von Bildchen wenn wir uns unten das Rad anschauen machen wir ein Zufallsexperiment Sie können an diesem Rad drehen und Sie haben die Möglichkeit die Zahlen 1, 2 oder 3 zu erhalten je nachdem welche dieser Flächen an dem Zeigerchen stehen bleibt dies führt zu einem Ergebnisraum welcher aus 3 einzelnen Elementen besteht und zwar den Zahlen 1, 2 und 3 wenn wir jetzt rechts daneben uns die Potenzmenge anschauen sehen wir, wir haben die Menge 1, 2 und 3 ok, wir haben die leere Menge die ist mit dabei, der leeren Menge wird der Wert 0 zugeordnet und wir haben alle Kombinationen der Zahlen 1, 2 und 3 damit drin was heißt wir sehen in diesem Fall, dass die Sigma Algebra auch die Potenzmenge ist in diesem Fall und wir sehen, dass diesen Mengen über das Maß P Werte zwischen 0 und 1 zugeordnet wird fangen wir hier an bei der leeren Menge die leere Menge bekommt per Definition den Wert 0 zugeordnet der Ergebnisraum Omega bekommt definitorisch den Wert 1 und alle anderen Werte bekommen einfach eine andere Zahl zugeordnet die man als Wahrscheinlichkeit ansehen kann wenn wir uns jetzt diesen Kreis dieses Rad genauer ansehen können sehen wir, dass das Kreissegment die Zahl 1 und die Zahl 2 in dem Divers ein Viertel des gesamten Kreises ist also es ist in diesem Fall hier auch sinnvoll der Menge die nur die Zahl 1 enthält genauso wie der Menge die nur die Zahl 2 enthält die Wahrscheinlichkeit ein Viertel zuzuordnen und denjenigen Teilmengen welche natürlich die Zahl 1 und 2 enthalten ein halb und 1 und 2 den halben Kreis einnehmen Sie sehen langsam wie sich diese ganzen Begriffe die wir jetzt uns mühsam erarbeitet haben wie die sich zusammenfügen wir haben ein Zufallsexperiment dieses Zufallsexperiment erzeugt ein Ergebnisraum und alle möglichen Kombinationen der Ergebnisse zusammengefasst als Potenzmenge bilden hier die Sigma Algebra welche über ein Maß mit Zahlen versehen werden können die wir als Wahrscheinlichkeit interpretierbar wahrnehmen können das bedeutet wenn ich Ihnen jetzt hier sage Sie drehen an diesem Rad und die Wahrscheinlichkeit dass Sie eine 1 aus diesem Drehexperiment bekommen ist ein Viertel das sind Zahlen und Angaben mit denen können Sie etwas anfangen was mir wichtig war ist dass Sie überhaupt verstehen können wie es denn dazu kommt und wenn wir uns jetzt den Begriff der Zufallsvariable tatsächlich nochmal nähern möchten bleibt uns eigentlich nur noch offen die messbare Funktion zu definieren wenn wir die messbare Funktion angucken ist es so dass eine messbare Funktion eine Funktion ist die Längen- und Volumenbegriffe verallgemeinert davon Ihnen verlangt wird dass das Urbild gewisser Mengen wieder in einem bestimmten Mengensystem liegt noch mal langsam messbare Funktion verallgemeinert Längen- und Volumenbegriffe es wird verlangt dass das Urbild gewisser Mengen wieder in einem bestimmten Mengensystem liegt weil wir haben mal gelernt in einer Sigma Algebra ist der gesamte Ergebnisraum mit enthalten das heißt alle Ergebnisse und Zahlen die wir zuordnen können sind definiert die da dahergesagt klingen und vielleicht entzieht sich vielen von Ihnen auch die Bedeutung dieser Aussage aber die Tatsache dass wir alles definiert haben und alles messbar ist ist die Grundlage von dem was in den Ingenieurswissenschaften oder in der angewandten Finanzmathematik oder auch in anderen wirtschaftswissenschaftlichen Disziplinen überhaupt passieren kann ich fange jetzt hier erstmal damit an das nochmal ganz langsam durchzugehen messbare Funktionen verallgemeinert Längen- und Volumenbegriffe davon Ihnen verlangt wird dass das Urbild gewisser Mengen wieder in einem bestimmten Mengensystem zum Beispiel in der Sigma Algebra liegt das ist die Grundlage überhaupt maße anzuwenden und Funktionen oder sogenannte Abbildungen wie wir sie gelernt haben messbar zu machen ich fange jetzt einfach mal fort gegeben sein zwei Messräume und zwar aus dem Pärchen X1 und der Sigma Algebra 1 und X2 und Sigma Algebra 2 und das heißt je eine Grundmenge und eine Sigma Algebra auf diese Menge sowie eine Funktion die diese Mengen ineinander abbildet das heißt die Funktion f bildet X1 in X2 ab diese Funktion f heißt nun eine messbare Funktion wenn das Urbild jeder Menge A2 Element Sigma Algebra 2 unter f Element aus A1 ist das kommt Ihnen irgendwo her bekannt vor bei dem Begriff Bioaktivität und Söaktivität und Injektivität was wir da am Anfang gemacht haben wenn Sie da nochmal fort plättern stellen Sie fest das bei Bioaktivität ich gesagt habe wir greifen da mal ein bisschen vor und genau das haben wir jetzt gezeigt dass wir genau das machen können und wir messen können und es hat jetzt ein bisschen gedauert da gebe ich zu aber wir kommen nochmal zurück zu unserer formalen Definition einer Zufallsvariablen die wir ganz am Anfang dieses Videos vorgestellt haben und die lese ich jetzt nochmal ganz langsam vor und Sie versuchen im Kopf diese ganze Wirkungskette nach hinten mit zu verfolgen als Zufallsvariabler bezeichnet man eine messbare Funktion von einem Wahrscheinlichkeitsraum in einen Messraum es sein Sigma Omega um P ein Wahrscheinlichkeitsraum und Omega Strich Sigma Strich ein Messraum eine Sigma Sigma Strich messbare Funktion X die Omega ein Omega Strich abbildet heißt dann eine Omega Strich Zufallsvariabler auf Omega so wir brechen das jetzt einfach mal runter und zwar lernen wir jetzt nach diesen ganzen Begriffen mit diesen Begriffen umzugehen und bevor wir uns an Finanzzeit rein oder neuronale Netze und andere technische Spielereien trauen lernen wir jetzt erstmal Würfel wir fangen klein an und wir fangen nicht ganz so klein an wir nehmen sogar zwei Würfel z.B. wir werfen einen Würfel zweimal so Beispiel zweimalige Würfelwurf Omega ist hier unsere Grundmenge und das ist die Menge der 36 möglichen Ergebnisse die rauskommen können wenn ich 2 Würfel werfe und wir sprechen hier von ungezinkten Würfeln, fernen Würfeln darauf gehe ich jetzt erstmal gar nicht mehr ein das setze ich mal voraus und es ist so das Sigma ist hier die Sigma Algebra welche gleichzeitig die Potenzmenge unserer Grundmenge Omega darstellt und wenn wir jetzt nun ein Maß definieren was sich hier das Pärchen rauszieht in 1 und in 2 dann können wir sagen dass die Wahrscheinlichkeit für eines dieser Pärchen 1 zu 36 ist für alle Ents die eben zwischen 1 und 6 liegen das heißt wir haben jetzt auf eine sehr aufwendige wahrscheinlich aus Studentensicht übertrieben mit Laserkanonen auf spazenschießende Art und Weise gelernt die Wahrscheinlichkeit für einen Würfel darzustellen wir werden spätestens wenn wir zu den stochastischen Zufallprozessen kommen lernen dass diese Laserkanone durchaus für was gut sein kann was für ein Würfelspiel vielleicht übertrieben wirkt es ist für einen multiplen stochastischen dynamischen Prozess vielleicht sogar gerade angemessen so was machen wir nun weiter ich zeig Ihnen noch mal ein Beispiel diesmal schön mit Bildchen und fast keinen Formeln wir haben jetzt 2 mal Würfeln Würfeln einmal Würfeln noch einmal und ich möchte nun eine Abbildung schaffen in der ich die Summe von 2 Würfeln aus den Augenzahlen ableiten das heißt ich würfel einmal da kommt eine Zahl raus ich würfel noch mal, da kommt wieder eine Zahl raus wenn ich die beiden Zahlen addiere die Augenzahlen betrachte was kommt da dabei raus und Sie sehen das hier richtig schön dargestellt wenn ich 2 mal 1 Würfel kommt eine 2 raus wenn ich eine 1 ohne 2 Würfel kommt 3 raus und so sehen Sie hier alle möglichen Kombinationen der Summe nach abgebildet was Sie auch sehen unten ist, dass der Maßraum Omega Sigma P abgebildet wird auf Omega Strich Sigma Strich und die Wahrscheinlichkeitsmaße für die Summe das heißt Sie können hier ganz elegant Dinge ineinander überführen, abbilden tatsächlich Statistik betreiben zu können ist ja die Zufallsvariable ein Konzept was denjenigen von Ihnen die schon mal einen Statistikurs besucht haben durchaus bekannt ist mit diesen ganzen Grundlagen die wir jetzt gelernt haben können wir aber natürlich mit einem ganz anderen Hintergrund wissen mit einem ganz anderen Verständnis an den Begriff der Zufallsvariable herantreten und diese natürlich dann auch ganz anders interpretieren und anwenden zu können wir haben jetzt von ganz hoher Ebene vom Raumbegriff über Maße über Mengen gelernt was eine Zufallsvariable denn ist und jetzt gehen wir den Schritt weiter und erläutern erstmal die Attribute einer Zufallsvariable das heißt hier bewegen wir uns wieder in Richtung eines Standardstatistikurses wie Sie ihn vielleicht schon mal erlebt haben Grundlegend differenzieren wir auch in der Finanzwelt zwischen diskreten und stetigen Variablen was ist denn diskret eine Zufallsvariable wird als diskret bezeichnet wenn sie endlich viele oder abzählbar unendlich viele Werte annimmt bedeutet solange ich es zählen kann ein Mensch zwei Mensch, drei Menschen ein Geld zwei Geld, drei Geld ist es diskret und im Gegensatz dazu wenn ich eine stetige oder kontinuierliche Variable habe sprechen wir auch von einer reellen Zufallsvariable und die wird als stetig bezeichnet wenn sie eine Dichte besitzt also eine Dichte ist eine Verteilung die ist absolut stetig bezüglich ihres Lebeskmasses das erkläre ich Ihnen in diesem Kurs nicht das können Sie gerne googeln wenn Sie das genauer interessiert merken Sie sich einfach stetig bedeutet nicht abzählbar also da kann ich nicht sagen ein Geld, zwei Geld oder drei Geld und eine reelle Zufallsvariable also eine reelle Zufallsvariable ist eine stetige kontinuierliche Zufallsvariable besitzt eine Dichte gehen wir mal ein bisschen weiter und tiefer ins Detail und sprechen über weitere Kenngrößen einer Zufallsvariablen also grundlegend ist es so dass relativ wenige Funktionen zur Charakterisierung von Zufallsvariablen sowie die wesentlichen Eigenschaften die diese eben haben verwendet werden das ist sehr überschaubar die wichtigste dieser Funktion die zur Charakterisierung Beschreibung Darstellung suchen Sie sich ein hübsches Wort aus einer Zufallsvariable dienlich ist ist die Verteilungsfunktion eine Verteilungsfunktion gibt Auskunft darüber mit welcher Wahrscheinlichkeit die Zufallsvariable einen bestimmten Wert annimmt Verteilungsfunktion bedeutet auch dass ich ablesen kann welche Werte wie häufig auftreten oder mit welcher Wahrscheinlichkeit welcher Wert eintritt so wie es eben hier dasteht eine wichtige Unterscheidung ist jetzt wieder bei stetigen Zufallsvariablen wird diese durch die Wahrscheinlichkeitsdichte ergänzt bei der stetigen Zufallsvariable habe ich das Problem dass die Wahrscheinlichkeit das ein exakter Werteintritt gleich 0 ist weil ich ja im kontinuierlichen Bereich mich befinde und daher benötige ich die Wahrscheinlichkeitsdichte weitere Kennzahlen von Zufallsvariablen sind die sogenannten Momente der Erwartungswert die Varianz oder wenn man die höheren Momente betrachtet die Schiefe und die Kurthosis wir fahren jetzt mal fort und sprechen über den Erwartungswert einer Zufallsvariablen Sie sehen wir machen jetzt die gleichen Dinge die ein Standardstatistikkurs auch kann nur dass wir das allgemein auf einem viel höheren Niveau verstehen, interpretieren und wahrnehmen können so ich zeige Ihnen hier jetzt natürlich auch für was wir denn eine knappe stunde lang Begriffe gelernt haben die in ihrem Kopf wahrscheinlich noch eine weile Verwirrung stiften werden könnten ich bringe das jetzt das ganze mal zusammen auf einen Statistikkursniveau bevor wir dann tatsächlich mit echten Daten arbeiten können so der Erwartungswert wird entsprechend als Lebesque integral bezüglich des Wahrscheinlichkeitsmaßes definiert ja die Definition ist wie folgt ist X eine bezüglich dem Maß P integrierbare oder quasi integrierbare Zufallsvariablen auf einem Wahrscheinlichkeitsraum aus der Grundmenge Omega einer Sigma Algebra Sigma und einem Wahrscheinlichkeitspaß P mit den Werten die in dem Pärchen R Dach und der Borelchen Sigma Algebra über dem R Quer was definiert ist als die Reellenzahlen vereinigt mit minusunendlich bis unendlich so wird definiert, dass der Erwartungswert eigentlich nichts anderes ist wie das Wahrscheinlichkeitsintegral das Raum der Variablen X hat jetzt natürlich jeder verstanden ist auch trivial versteht man sofort ich erkläre es nochmal in Ruhe wir sehen hier wir haben die Reellenzahlen die hier vereinigt werden mit minusunendlich bis unendlich so dass auch wirklich alles vorhanden ist geben dem ganzen den anderen Namen und sagen ok die Kombination aller Teilmengen eine Sigma Algebra Eigenschaft erfüllen die packe ich hier in meine Borelchen Sigma Algebra und die Borelchen Sigma Algebra nämlich hier, weil zu dem Raum so wie wir ihn jetzt hier definiert haben eigentlich keine richtige Definition passt, sondern wie hier von der topologischen Raum ausgeht das bedeutet, wenn wir hier in einer Erwartungswert berechnen integriere ich über den gesamten Ergebnis Raum mit meinen Wahrscheinlichkeitsmaß P das bedeutet, dass ich hier wenn ich ein kleines Omega hier nehme als Elementareignis, wenn ich das betrachten möchte muss ich eben schauen welchen Wert hat dieses Elementareignis in X und mit welcher Wahrscheinlichkeit tritt dieser ein neben dieser allgemeinen Schreibweise die ich Ihnen hier gerade vorgestellt habe präsentiere ich Ihnen hier auch immer noch eine Matrix Schreibweise dazu schlicht aus dem Grund dass Programmieranwendungen wie Python oder insbesondere statistisch angehauchte Programmiersprachen wie R die im Data Science Bereich durchaus üblich sind mit Matrizen rechnen und hier kann man natürlich wie Sie hier sehen können den Erwartungswert von X als Vektor darstellen und werden wir auch später weiter verwenden um Ihnen jetzt natürlich mal an unserem Würfelbeispiel zu zeigen für was wir denn jetzt die ganze Zeit über diese Konzepte gesprochen haben habe ich hier nochmal ein Beispiel für Sie wir bleiben bei dem Würfelbeispiel und wir nehmen einfach an gegeben ein Wahrscheinlichkeitsraum der besteht aus einer Grundmerge Omega aus einer Sigma Algebra Groß Sigma Wahrscheinlichkeitsmaß P wobei der Ergebnisraum Omega definiert ist aus 3 Elementen nämlich Klein Omega 1, 2 und 3 Für die Sigma Algebra nehmen wir wieder die Potenzmenge von Omega an und das Wahrscheinlichkeitsmaß definieren wir hier auf einem diese Elemente und zwar mit einem Drittel für alle Laufindices i 1, 2, 3 das bedeutet die Wahrscheinlichkeit dass 1 diese Elemente vorkommt oder auftritt bei einem Drittel liegt der Erwartungswert dieser Zufallsvariablen ist jetzt hier unser X welchen allen Elementen das Ergebnisraum es eine reale Zahl zuordnet nehmen wir hier als Beispiel das Omega 1 in X den Wert 1 hat das Omega 2 2 und das Omega 3 3 dann können wir hier über den Erwartungsraum integrieren mittels unseres Wahrscheinlichkeitsmaßes und wir bekommen die Formulierung die denke ich in einem Standardstatistik Kurs gelehrt wird wir haben den Wert der Zufallsvariablen mit X Omega 1 ist 1 mal ein Drittel plus X Omega 2 1 Drittel und so weiter und kommen bei einem Erwartungswert von 2 raus d.h. wir haben jetzt aus Studentensicht mal eine Stunde lang ganz aufwändig gelernt wie man einen Mittelwert von 2 beim Würfeln ausrechnet herzlichen Glückwunsch willkommen im Wahlfach nein, so soll es natürlich nicht sein wir werden, wenn wir zu den stochastischen Zufallsprozessen derangehensweise als nützlich empfinden und durchaus benötigen weswegen ich damit ich diese ganzen Begriffe nicht auf einen Schlag einführen muss und nicht noch zusätzlich zu dem was bei den stochastischen Zufallsprozessen sowieso noch oben drauf kommt habe ich mich ja wie bereits gesagt dazu entschieden das mal zu splitten und sie schon mal am Anfang mit, ich nenne es jetzt mal sehr umgangssprachlich harten zu erwarten in Empfang zu nehmen wenn wir jetzt weitermachen können wir natürlich die Varianz einer Zufallsvariablen ebenfalls in der gleichen Art und Weise darstellen und zwar über ein Wahrscheinlichkeitsraum Omega Sigma P und X wo hier eine Zufallsvariable auf diesem Raum darstellt die Varianz ist hier definiert als die zu erwartende quadratische Abweichung dieser Zufallsvariablen zu ihrem Erwartungswert Müh den wir eine Folie vorher gerade berechnet haben und die Varianz X kann entweder als Wach von X geschrieben werden oder mit einem Sigma Quadrat von X ich persönlich bevorzuge hier die Sigma schreibweise gerade weil in der Risikomodellierung gibt es Value at Risk Modelle oder Vector Auto Regression Modelle was dieselben Schreibweisen Groß und Kleinschreibung verwenden und da ist einfach ein Sigma Quadrat von X schöner zu unterscheiden so was ist denn jetzt eine Varianz die Varianz ist auch wieder das Integral über unseren Ergebnisraum nach eben diesem Wahrscheinlichkeitsmaß allerdings als quadrierte Abweichung von der Realisierung der Variablen zum Erwartungswert das ist wieder genau dasselbe wie man die Realistik Vorlesung auch kennenlernt ich habe eine Variable die hat gewisse Werte ich berechne den Mittelwert dieser Werte und die Abweichung in dieser Werte zum Mittelwert Quadriert zusammengenommen gibt meine Varianz die Quadratur erfolgt hier für diejenigen die das noch nicht wissen aus dem simplen Grund um die Vorzeichen aufzuheben wenn ich eine Abweichung von plus 2 habe und zwar ja das einfach zusammenzählen würde hätte ich eine Varianz von null und die sagt mir nichts mehr die Quadratur gewichtet zudem höhere Abweichungen stärker und sorgt dafür dass die Vorzeichen fallen und somit nicht immer null rauskommt und ich tatsächlich eine Varianz erkennen kann auch hier werde ich euch oder ihnen die Matrix Schreibweise nochmal aufzeigen mit einer Verallgemeinerung der sogenannten Varianz Covariance Matrix die Matrizenschreibweise insbesondere bei der Varianz ist eine sehr elegante Darstellungsweise in der man die Covarianz direkt mit ablesen kann wir haben ja einen realen Zufalls Vektor x der T im Exponenten steht hier für die Transponierung das bedeutet es ist ein vertikaler Vektor mit meinen Zufallsvariablen mit zum Gehörigen Erwartungswert Vektor my das heißt ich habe zu jedem meiner Zufallsvariablen gleich einen Erwartungswert und man kann die Varianz hier verallgemeinern indem man eine symmetrische Varianz Co Variance Matrix bildet das bedeutet wenn sie die Formel hier unten ansehen dass sie zum einen die Differenzen genauso wie in der klassischen Definition eben multiplizieren und dann bekommen sie aber eine Matrize Sie bekommen eine Matrix die ihnen auf der Hauptdiagonalen eben die Schwankung der Variablen mit sich selbst abträgt das heißt die Hauptdiagonale der Varianz Co Variance Matrix ist die Varianz und alles was nicht auf der Hauptdiagonale liegt das heißt alles außen rum ist eben die Co Variance normalerweise ist es auch so dass hier nur eine halbe Matrix dargestellt wird weil wir eben eine symmetrische Matrix haben das heißt wir brauchen nur eine Hälfte was ich Ihnen hier mal dargestellt habe ist die Varianz 2er Gauscher Zufallsvariablen in 3D das heißt das ist um es mal wieder ein bisschen platt auszudrücken eine Fancier eine Darstellung einer Normalverteilung nur für 2 Variablen gleichzeitig in 3D geplottert solche Dinge können Sie natürlich tun wenn Sie zuvor genanntes beherrschen um das beherrschen zu lernen deswegen sind wir hier üben wir mal nochmal ich nenne es jetzt mal im Kinderplan Specken und zwar mit Würfeln wir haben ja vorher ein Beispiel gehabt wie wir den Erwartungswert berechnen können für unsere 3 kleinen Omegas anhand unseres Wahrscheinlichkeitsraum und der Wahrscheinlichkeit von einem Drittel und wir haben vorher ausgerechnet für die Realisierungen 1, 2 und 3 ist der Mittelwert 2 nun können Sie wie Sie hier unten sehen in die Varianzformel einsetzen indem Sie eben über den Ergebnisraum integrieren indem Sie das Wahrscheinlichkeitsmaß mit einem beziehen und eben die Quadraturen hier berechnen und dann kommen Sie in der letzten Zeile unten wieder bei einem Ergebnis raus was Sie in einem normalen Standardstatistik kurs fänden würden Sie nehmen einfach die Realisierung zum Beispiel hier für das Omega 1 gleich 1 und ziehen den Mittelwert von 2 davon ab und quadrieren das ganze und nehmen es mal die Wahrscheinlichkeit die diesem Ereignis eben zugeordnet wird somit kommen Sie bei einer Varianz von 2 Drittel am Ende raus um eine Varianz interpretieren zu können müssen Sie hier die Wurzel ziehen und die sogenannte Standardabweichung berechnen die Varianz ist ein dimensionsloses, quadriertes Maß und muss natürlich erst wieder ich sage jetzt mal ganz umgangssprachlich durch Wurzel auf einen interpretierbaren Boden zurückgeführt werden wir quadrieren natürlich vorher um die Vorzeichen los zu werden damit sich das ganze nicht auf 0 aufhebt und wir müssen natürlich nachdem wir das berechnet haben die Wurzel ziehen damit wir wieder ein interpretierbares eindimensionales Maß bekommen ich darf Sie herzlich beglückwünschen Sie haben den ersten Teil der mathematischen Grundlagen erfolgreich überstanden ich darf Sie auch auszeichnen Sie sind nun in der Lage eine Erwartungswert zu berechnen eine Varianz zu berechnen und ein Würfelspiel auf hohem Niveau darzustellen ich gehe jetzt einfach mal davon aus dass die Jubelstürme bei Ihnen zu Hause gering ausfallen deswegen fangen wir jetzt aber direkt mal an mit dem wegen Sie sich eigentlich in diesen Kurs eingeschrieben haben Zeitreinanalyse was ist denn eigentlich eine Zeitreihe und was versteht man unter Zeitreinanalyse wir haben ja bisher nur in Anführungszeit nur gelernt was ist denn eine Zufallsvariable aber was eine Zeitreihe ist und wie das Ganze zusammenhängt haben wir bisher noch nicht besprochen den direkten Zusammenhang zwischen Zufallsvariable stochastischen Prozessen und diesen ganzen mathematischen Thema-Tar, die wir gerade besprochen haben schiebe ich hier einfach in die stochastischen Prozesse um diese ganze Ballung an mathematischen Grund Themen ein bisschen zu entzehren wir beschäftigen uns jetzt wie gesagt mit der Frage was ist eigentlich eine Zeitreihe und was ist Zeitreinanalyse Zeitreinanalyse befasst sich mit der inferenzstatistischen Analyse von Zeitrein und der Vorhersage ihrer zukünftigen Entwicklung das klingt jetzt schon wieder so kryptisch effektiv ist es so wie analisieren Zeitrein und versuchen vorher zu sagen wo sie in Zukunft hinwandern werden um dazu müssen wir erstmal wissen was ist dann eigentlich eine Zeitreihe eine zeitlich geordnete Folge von Beobachtungen einer bestimmten Größe es ist keine Reihe im mathematischen Sinne und diese bestimmte Größe von der ich gerade gesprochen habe sind Wachstumskurven, Aktienkursen ihre Körpergröße wenn sie so möchten also je wehde Variable die sie finden können die ihre Werte über die Zeit verändert die einzelnen Zeitpunkte klein T werden zu einer Menge großes T von Beobachtungszeitpunkten zusammengefasst das heißt sie haben eine Beobachtungsgröße die sie interessiert die Körpergröße ihrer kleinen Schwester das Wachstum ihres neuen Hundes ihr Bauchumfang wenn sie hinher sind ihr Promille-Pegel über die letzten 2 Stunden oder je wehde andere Größe die sich über die Zeit verändert da können sie sich was aussuchen das können sie hernehmen und analysieren somit stellen wir fest dass Zeitreihen eine Zufallsvariable sind denn relle Realisationen sich im zeitlichen Ablauf einstellen das bedeutet wir haben eine Zufallsvariable und jede Realisation dieser Zufallsvariable findet an einem gewissen Zeitpunkt T-Start und die Aufreiung dieser Zeitpunkte gibt mir meine Zeitreihe und es ist ganz wichtig und es ist mir auch ein Riesenanliegen wenn sie sich in der Praxis nicht total blamieren möchten wenn sie auf einem gewissen beruflichen Niveau unterwegs sind es gilt Zeitreihen und Querschnittsdaten zu unterscheiden Querschnittsdaten bedeuten Stichtagsbezug wenn ich sie jetzt als Kursteilnehmer zum 20.05. einladen würde mit ihnen eine Befragung machen würde dann wäre das eine Querschnittsanalyse für das Querschnittsdaten wenn ich natürlich sie als Teilnehmer über mehrere Etappen an verschiedenen Zeitpunkten einladen würde hätten wir ein Panel das wäre dann die Kombination von Querschnitts- und Zeitreihendaten der große Unterschied ist wenn wir jetzt Regressionsmaße betrachten ein Quadriertes R zum Beispiel ist bei Querschnittsdaten irgendwas zwischen 0,3 während bei Zeitreihendaten die Werte signifikant höher liegen in der Regel wir haben jetzt sehr viel über Zufallsvariablen gesprochen mathematische Grundlagen was eine Zeitreihe definitorisch denn eigentlich ist und dass man über verschiedene Zeitpunkte samteln kann und es ist an der Zeit dass ich ihnen einfach einmal eine Zeitreihe zeige und zwar nicht nur irgendeiner sondern gleich eine Finanzzeitreihe mit der wir uns in diesem Kurs auch hauptsächlich befassen werden was sie hier sehen können ist die Preisserie der Tesla Aktie auf Tagesbasis vom Jahr 2011 bis heute und sie können hier sehen dass für jeden Tag ein Preis gestellt wurde ich habe für dieses Bild die Adjusted Closingpreise genommen welche um Kapitalmaßnahmen schon bereinigt wurden um das auf unsere Zufalls Variable zu übertragen habe ich zu jedem Tagesende also hier ist jeder Tag die Frequenz für den Zeitpunkt T einen Preis für diese Aktie bekommen wenn ich mir jetzt die letzten 10 Jahre diese Aktie grafisch anschaue sehe ich hier die Preisentwicklung der Variable Tesla Aktie über die letzten 10 Jahre abgetragen und das ein bisschen einfacher darzustellen hier sehen wir den Aktienkurs von Tesla über die letzten 10 Jahre in US Dollar wir sehen von 2011 bis 2013 es ist nicht sehr viel passiert dann gab es ein bisschen Zickzack und Hoch und wir sehen ganz schön den Hype um Tesla und natürlich auch den Rabiaten ich nenn es mal Abschmier durch die Corona Krise ich habe ihnen hier nochmal eine Zeitreihe dargestellt das ist wieder die Zeitreihe von Tesla nur dass ich ihnen diesmal hier das Volumen quasi das tägliche Handelsvolumen zu jedem Preis dazu geplottet habe die blaue Linie ist das Handelsvolumen das bedeutet die Masse beziehungsweise die Masse in Geld gemessen die an diesem Tag für diese Aktie gehandelt wurde die grüne Linie zeigt ihnen nur der Schlusskurs der am Tagesende festgestellt wurde und die blaue Linie zeigt ihnen das tatsächlich gehandelte Volumen dieser Aktie ich habe ihnen hier nochmals eine Zeitreihe aus dem Finanzgebereich aufgeplottet nenn ich das jetzt mal und zwar für Nestec 100 Composite Index und sie sehen hier, dass die Index Zeitreihe sehr ähnlich aussehen wie die eine Aktie der Unterschied ist, dass ein Index eine Komposition aus verschiedenen Aktien ist und dass der gewichtete Preis des Index quasi hier abgetragen ist im Bereich Finanzmarktanalytik werden wir auf Indizes und solche Dinge noch detaillierter zu sprechen kommen wenn wir jetzt natürlich wie auch Thema Diskurses ist Finanzzeitreihen oder Allgemeinzeitreihen oder sonstige Daten modellieren wollen, bietet sich natürlich klassischerweise aus der Statistik entnommen die Regression und das Ordinary Least Squares Verfahren an, da ich jetzt nicht weiß ob sie schon einen Grundlagenkursstatistik hatten oder nicht, stelle ich das einfach nur noch mal kurz vor will man nun eine Variable modellieren, bietet sich ein Regressionsmodell an, wie ich das bereits gerade gesagt habe und die einfachste Lösung für das klassische Regressionsmodell ist über das Ordinary Least Squares Verfahren also das Verfahren der kleinsten Quartate welches die quadrierten Abweichungen der modellierten also der geschätzten Daten zu den tatsächlich realen Beobachtungswerten minimiert das bedeutet wir machen eine Schätzung messen die Abweichung der Schätzung zu unseren realen Daten und versuchen das Modell so zu spezifizieren dass die Abweichungen, das heißt die Fehler die wir in dieser Messung machen oder in dieser Schätzung machen zu minimieren, das bedeutet wir wollen ein Fehler der minimiert ist und ein Regressionsmodell was dahin gehen optimiert ist genauer ausgedrückt wird die Summe der Fehlerquartrate oder auch Fehlerquadratsumme wenn wir exakt sein wollen der Residuenquadratsumme minimiert das heißt die minimale Summe der quadrierten Differenzen zwischen den Werten der Modellkurve und den Beobachteten also den realen Daten ums nochmal kurz zusammenzufassen wir bauen uns ein lineares Regressionsmodell um ein realen Datensatz zu beschreiben und der OLS Algorithmus spezifiziert uns dieses Modell in einer Art und Weise in dem die Residuenquadratsumme für die gegebenen Modellspezifikation minimiert wird das bedeutet allerdings nicht dass wenn wir ein lineares Modell nehmen was auf ein nicht linearer Datensatz oder ein nicht linearer Datenverhalt geschossen wird unbedingt gut sein muss das heißt nur das für die gewählte Spezifikation die Fehler minimiert werden anhand eines gegebenen Datensatzes warum ich hier auf Regression und OLS eingehe ist wenn wir später in die Data Science eintauchen tauchen diese standardklassischen statistischen Methoden wieder auf nur eben lernend in neuronalen Netzen oder Machine Learning Algorithmen neu aufgekocht daher habe ich Ihnen nicht nur das was Sie in einem Standardstatistik Kurs sehen werden dargestellt sondern die allgemeinste Form und die mathematisch zumindest höchste Form die ich gefunden habe ist nur ein Regressionsmodell und zwar in Vektoren schreibweise die wie Sie hier sehen können formal eine Minimierung darstellt was Ihnen hier auffallen wird wenn Sie schon mal einen normalen Statistik Kurs gemacht haben ist dass hier die Funktion die X annehmen soll nicht genauer spezifiziert worden ist das heißt die exakte Lösung dieses Minimierungsproblems hängt von der Modellfunktion ab die Sie in Endes wählen können oder sollen oder wollen das bedeutet diese Schreibweise die Sie hier sehen ist allgemein gültig für jede Form von Regressionsfunktionen oder Modellierungsfunktionen die Ihnen denn so einfällt um hier normal in Anführungszeichen mit Ihnen weiter machen zu können unterstelle ich jetzt einfach mal eine lineare Spezifikation eines multiplen Regressionsmodells das bedeutet wir haben einen linearen Zusammenhang verschiedener Variablen und verschiedener Parameter das bedeutet wir bekommen zunächst ein klassisches lineares Gleichungssystem so wie Sie es in den Ingenieurswissenschaften garantiert schon gesehen haben wo wir unser Y unseren realen Datenpunkt Y1 darstellen wollen durch verschiedene Parameter Beta und unsere X die da dazugehören Y1 in dem Fall das ist unser Störtherm, unser Fehler den wir für diesen Datenpunkt eben machen nachdem wir jetzt nicht nur eine Beobachtung haben sondern ganze T-Zeitpunkte haben nehmen wir hier unsere Tesla-Aktie da haben wir ein paar tausend hier von möchten wir natürlich jeden Punkt durch dieses Modell geschätzt wissen daher haben wir hier ein lineares Gleichungssystem um eben das ganze ein bisschen hübscher darzustellen zeige ich Ihnen hier auch die Matrix Schreibweise da jedes Programmierprogramm jede Lösung die sie programmatisch finden werden egal ob selbst geschrieben oder online so arbeiten wird deswegen habe ich Ihnen den Erwartungswert, die Varianz und eben auch hier das einfachste lineare gerade Modell in Matrizenform einmal dargestellt wenn wir jetzt unserem Regressionsmodell fortfahren habe ich ja gerade schon erwähnt dass wir in unserem lineare Gleichungssystem einen Fehlertherm haben den sogenannten Störtherm und über diesen Fehler den wir in unserer Schätzung machen sind gewisse Annahmen zu treffen und zwar der Störtherm muss white noise sein diese white noise Annahmen werden uns erneut einholen wenn wir auf die stochastischen Zufallprozesse zugehen aber bis dahin gelten erstmal folgende 3 Annahmen der Erwartungswert des Störtherms ist 0 für alle Zeitpunkte das ist einleuchtend weil was nützt Ihnen ein Modell in dem Sie erwarten einen Fehler zu machen der signifikant von 0 verschieden ist dann können Sie es eigentlich gleich lassen wenn wir natürlich annehmen dass unser Erwartungswert gleich 0 ist gilt als nächstes dass die Varianz unsere Störtherms das heißt die Quadriertenabweichungen unsere Störtherms von dessen Mittelwert möge doch bitte konstant sein über alle Zeitpunkte das nennt man auch homoskedastizität dass die Varianz unsere Störtherms über unterschiedliche Zeitpunkte hinweg konstant bleibt und als nächstes und das ist genauso wichtig zum ersten Punkt wollen wir natürlich nicht dass unsere Störtherme miteinander korreliert sind das heißt die Co-Varianz unsere Störtherms zu unterschiedlichen Zeitpunkten möge bitte auch 0 sein stellen Sie sich mal vor das wäre nicht so, das würde bedeuten dass wenn die miteinander positiv korreliert wären unsere Störtherme die über die Zeit hinweg wachsen würden Worst Case Szenario wäre ein Störtherm ein Fehler den wir beim Schätzen oder beim Modellieren machen der im Erwartungsmittel nicht 0 ist ungleiche Varianz hat und auch noch miteinander korreliert ist und wächst herzlich Willkommen auf den Finanzmärkten hier haben wir nämlich genau das Problem und dazu kommen wir später noch ich habe Ihnen auch hier erneut den Störtherm nochmal in Matrixform dargestellt und zwar einmal den Erwartungswert des Störtherm-Vectors möge bitte auch 0 sein genauso wie eben die Varianz Co-Varianz Matrix unserer Störtherm-Vectoren multipliziert mit der Einheitsmatrix bitte auch konstant sein möge also es ist für die klassischen Modelle sehr wichtig dass diese White Noise Annahmen erfüllt sind da sie sonst zu Miss Spezifikationen kommen ich zeige das am besten mal an diesem Bild hier das ist quasi ein Scatterplot zwischen den Volumen also dem Handelsvolumen des NASDAQ Index und Tesla und ich habe da mal genauso wie ich es Ihnen gezeigt habe ein MX plus B-Vektoren OLS Regressionsmodell reingelegt das ist die schwarze Linie und Sie sehen wie wunderbar das funktioniert wir können sofort das Traden anfangen wir sind reich oder auch eher nicht so zumindest für diesen Datensatz scheint das nicht unbedingt die richtige Spezifikation zu sein um es nochmal zu wiederholen der OLS Algorithmus träht mir diese Gerate in diese Punkte Wolke so rein dass die quadratischen Abweichungen der Punkte zu meiner Geraden die Quadratur erfolgt wie bei der Varianz auch zur Elimination von Vorzeichen der OLS Algorithmus träht mir die Gerade richtig rein, dass die Fehler Quadrate minimiert werden das bedeutet aber nicht dass die Gerade auch nur im Ansatz dazu geeignet wäre diesen Datensatz ordentlich zu beschreiben ist nun zum Kernthema der Zeitreinanalyse nämlich der Autokorrelation der große Unterschied zwischen Stichtagsdaten und Zeitrein ist die Autokorrelation ich habe vorher schon mal gesagt dass Zeitrein ein viel höheres R² aufweisen also ein viel höheres Bestimmtheitsmaß aufweisen wie Querschnittsdaten und das liegt aber daran dass Zeitrein autokorreliert sind das bedeutet dass die Zeitrein mit sich selbst oder von ihrer eigenen Vergangenheit abhängig sind aber fangen wir mal von vorne an unsere Ausgangslage ist wir schätzen eine Datenwolke mittels einer Schätzfunktion welche auf Fehler hinoptimiert wird das habe ich Ihnen gerade anhand unseres OLS Algorithmus gezeigt dass wir hier die Fehlerquadrate minimieren können für die Gerade die wir in diese Datenwolke legen ich habe auch gesagt dass wir da später im Data Science wieder brauchen dann nennt sich das Gradient Descentverfahren basiert aber effektiv auf denselben Grundlagen deswegen fangen wir hier aber erstmal noch mal klein an ich trage hier mal weiter vor da der Residuenvektor e keine beobachtbaren Größe ist also man kann den Residuenvektor nicht beobachten wenn ich den Residuenvektor perfekt bestimmen könnte dann könnte ich perfekt vorhersagen und dann würden sie wahrscheinlich irgendjemand anderem zuhören der diesen Kurs gibt nur mir nicht oder sie würden mir zuhören wenn ich 20.000 Euro dafür verlangen würde um zurück zum Thema zu kommen Größen waren bei Seite Residuen sind keine beobachtbaren Größen wir können diese Residuen nur schätzen oder approximieren indem wir eine Schätzung dazu heranziehen und wir haben hier unseren geschätzten Residuenvektor der nichts anderes ist wie unser Beobachteten Größen minus eben unsere Regression Spezifikation das bedeutet unsere Residuen ist nichts anderes wie unser realer Datenpunkt minus unsere Schätzung das haben wir eigentlich vorher schon mal gesagt das ist die Ausgangslage unser Schätzfehler ist unsere Schätzung minus der reale Wert und das Delta ist unser Fehler den wir eben machen zudem haben wir gesagt dass unser Epsilon T das ist unser Störtherm unser Fehler bitte normal verteilt sein soll mit einem Erwartungswert von 0 und konstanter Varianz für alle Zeitpunkte, das ist dir so genannte weit noise Erwartungswert von 0 homoskedastisch und normal verteilt so mögen wir bitte unsere Fehler normal und harmlos nun wir bevor wir weiter auf unseren Störthermen rummacken möchte ich ja nochmal eine Autokorrelation ganz einfach definieren als Autokorrelation versteht man eine zeitliche Abhängigkeit der Realisation einer Zufallsvariablen mit sich selbst bedeutet die realisierten Werte unsere Beobachtungen hängen von ihrer eigenen Vergangenheit ab kurz gesagt gestern beeinflusst morgen wenn gestern die Welt untergeht dann ist morgen nicht auf einmal irgendwie wieder das bedeutet Unabhängigkeit und keine zeitliche Abhängigkeit was unsere Modell als Grundannahme zugrunde liegt aber effektiv gerade wenn wir hier in dieser Covid 19 Situation sind würde wenn das Modell der Realität entsprechen würde es bedeuten, dass wenn gestern 500 Millionen Menschen sich mit einem Virus infiziert haben, morgen alle geheilt sind und wir wieder fröhlich durch den Koppeln würden dass das nicht so ist ist denke ich sehr einleuchtend, nenne ich das mal zumindest für die meisten von uns so, ich fahre nun mal fort wie messe ich denn Autokorrelation wie kann ich denn darstellen, dass eine Zeitreihe oder eine Realisation einer Zufallsvariable von sich selbst im Zeitablauf abhängt denn dieses hängt von ihrer Vergangenheit ab und gestern beeinflusst morgen, denn irgendwie in interpretierbaren Zahlen da und hierzu nimmt mir den sogenannten Autokorrelationskoeffizienten und hier steht unter der Modellbedingung sollte für die Korrelation der einzelnen Zeitpunkte unter Annahme eines Erwartungswerts von 0 und konstanter Varianz gelten, dass dieser ebenfalls 0 ist wir haben ja vorher bei den weit Neues Annahmen gesehen dass wir eine Korrelation der Störtherme über die Zeit von 0 haben wollen einen Erwartungswert von 0 und konstante Varianz Erwartungswert von 0 und konstante Varianz nennt man auch Stationarität also wir haben für unsere Störtherme eine Stationaritätsannahme und da dürfte es eigentlich keine Autokorrelation geben ok, wie prüfen wir das denn wir können den Autokorrelationskoeffizienten berechnen, der ist angelehnt an den klassischen Korrelationskoeffizienten den sie in einer Standardstatistikvorlesung sicher kennengelernt haben und zwar die Kovarianz geteilt durch die Standardabweichungen der Variablen mit dem fein aber doch gravierenden Unterschied dass wir hier nicht X und Y korrelieren wie bei Pravis-Pirsen, sondern möglich Variable zum Zeitpunkt T und noch eine Variable zum Zeitpunkt T-J und in diesem Fall um das spezifiziert da auszudrücken, betrachten wir zwar auch Variablen aber in dem Fall die Störtherme unserer Zufallsvariablen und was ich Ihnen bisher unterschlagen habe, ist, dass die Störtherme einer Zufallsvariablen ja wieder Zufallsvariablen selbst sind das bedeutet wir berechnen einen Korrelationskoeffizienten der Störtherme unter sich selbst zu unterschiedlichen Zeitpunkten und schauen das ist der Störtherm von gestern der Fehler, den ich gestern oder vor J-Perioden gemacht habe hat dieser Fehler von gestern einen Einfluss auf meinen Fehler, den ich heute mache das klingt jetzt vielleicht noch ein bisschen kryptisch klingt jetzt auch wie jemanden der noch nicht so tief in der Statistik drin ist, als nicht unbedingt so schlimm aber stellen Sie sich doch mal folgendes vor Sie bereiten sich auf eine Klausur vor und verrechnen sich eine Woche vor der Klausur, verrechnen Sie sich und in der Regel ist es so, Sie erkennen den Fehler und in der Klausur rechnen Sie es richtig stellen Sie sich jetzt doch einfach mal vor eine Woche vor der Klausur verrechnen Sie sich in den Übungsaufgaben und dieses verrechnen hat einen Einfluss auf die Prüfung, die Sie letzten Ende schreiben und beeinflusst den Fehler, den Sie in der Prüfung machen das wäre Autokorrelation wir können diese Annahme ob ein gewisser Datensatz autokorreliert ist oder nicht mit dem sogenannten empirischen Autokorrelationskoeffizienten J-Ortenung ich werde die Abkürzungen in den weiteren Skripten verwenden Autokorrelation Function ACF was hier nichts anderes ist wie einfach die Schätzung für den Autokorrelationskoeffizienten wenn wir gerade schon von Schätzung sprechen ich habe Ihnen hier mal für die Tesla Preise die Autokorrelation mit einem Lack von 42 berechnet Lack ist in dem Fall dieses Y die Anzahl der Perioden in die wir nach hinten gehen wenn wir uns jetzt die Tesla Preise ansehen sehen wir, wenn wir 42 Tage in die Vergangenheit gehen dass der Preis vor 42 Tagen also vor über einem Monat noch locker einen Einfluss von 0,7 bis 0,8 hat das ist massiv und der Einfluss der Vergangenheit auf die Tesla Preise nimmt auch ganz schwach ab, wie Sie hier sehen können und die Koeffizienten sind auch hoch signifikant dieses orange Band was Sie unten sehen ist die 5% Signifikanzniveau Schwelle und jeder Punkt, der über diesem Intervall liegt ist signifikant, das heißt in Finanzzeit bei Preiserien hoch signifikante Autokorrelation und zwar nicht nur eine Periode, zwei Periode sondern wie wir hier sehen sogar über ein Monat in die Vergangenheit zurück das heißt dieser Preis der hier zum Beispiel 40 Tage der Vergangenheit liegt, hat ein Einfluss von 0,8 in der Koalition auf diesen Preis heute wir stellen daher fest das Preise von Finanzinstrumenten hier am Beispiel der Tesla Aktie signifikant Autokorreliert sind und demnach auch nicht stationär sein können aber hier gibt es einen netten Trick unter Statistikern unter Finanzmarktpraktikern den ich persönlich für teilweise angebracht und teilweise sehr kritisch erachte und zwar das ist die Bildung von logaritmierten also von stetigen Renditen welche Stationarität erzeugen, das heißt wir bilden hier die ersten Differenzen und errechnen quasi die Wachstumsraten der Preise ich habe Ihnen hier die Formel mal dazu geschrieben also Renditen sind Wachstumsraten der Preise eines Finanzinstrumentes und wir logaritmieren das ganze um eben stetige Renditen zu erhalten wenn wir nicht ganz genau sind und ganz pinzig sind ist es nämlich so dass selbst wenn wir auf eine Tick-to-Tick-Basis in der Frequenz runtergehen dass abzählbar unendliche Beobachtungen sind und Preise beziehungsweise die Preisstellung an der Börse selbst im Nanosekundentakt des Crate ist wir aber durch die logaritmierung quasi eine Stetigkeit simulieren indem wir hier eben die ersten Differenzen bilden ich habe Ihnen hier einfach mal den Chart für Tesla und auch für den Nasdaq ein 100 Composite Index auf Return, auf Lock-Return-Basis dargestellt das bedeutet ich habe die Preisserie der beiden Instrumente genommen und die ersten Differenzen gebildet und Ihnen diese mal grafisch dargestellt das rote ist hier der Nasdaq und das grüne ist Tesla und wir sehen nachdem das hier eine tägliche Frequenz ist dass wenn wir den Negativbereich anschauen in 2012 Tesla an einem Tag minus 20% Rendite eingefahren hat und während der Corona-Krise glatt nochmal und das ist durchaus ordentlich also wenn Sie die Corona-Krise an der Börse in Bildchen beschreiben wollen sehen Sie hier einen Einbruch von minus 20% an einem Tag und das ist schon stattlich nenne ich das jetzt mal was Sie weiterhin machen können ist, dass Sie diese Renditen quadrieren durch die Quadratur der Renditen werden eben extrem Werte stärker ausgearbeitet und die Vorzeichen eben sich auf das sehen Sie hier in diesem Bild wenn ich nun hergehe und für Lock-Renditen die Autokorrelationskoeffizienten berechnen dann sehe ich, dass die verschwinden es kommt auf die Zeitreihe an es kann durchaus sein, dass da noch Autokorrelation übrig bleibt in diesem Bild ist das jetzt nicht zu sehen aber es kann schon sein, dass da 0,05 Bereich noch was da ist, aber die sind nicht mehr signifikant wenn man jetzt eine Zeitreihe nimmt und die Renditen berechnet wo nicht alle 0 werden oder noch welche übrig sind dann sind die nicht signifikant und können verworfen werden das heißt, was haben wir jetzt gelernt wir haben gelernt, Preise sind hochgradig autokorrolliert durch Bildung der ersten Differenzen also durch Berechnung der Wachsumsraten also der Renditen können wir eine stationäre Zeitreihe erzeugen indem wir eben eine Stetigkeit simulieren und wenn wir dadurch wieder ist der richtige Begriff Autokorrelationskoffizienten berechnen stellen wir fest, dass Wachsumsraten von Aktien, also die ersten Differenzen nicht mehr autokorrolliert sind was bedeutet denn jetzt eigentlich Autokorrelation für unsere Regressionsannahme wir hatten ja die Annahme, dass die Störtherme nicht miteinander korreliert sein dürfen über die Zeit hinweg und haben zudem unterstellt dass die Varianten bitte Konstanz sein mögen und was bedeutet das denn jetzt wir haben Regressionsannahmen in die Welt gesetzt die sind offiziell verletzt das haben wir gerade grafisch gesehen was bedeutet denn jetzt nun eine Verletzung der Regressionsannahmen ich fange jetzt hier mal mit der Homosgedastizität an eine Verletzung der Annahme der Homosgedastizität resultiert in nicht konstanten Varianten und nicht konstante Varianten bedeutet dass sich die Varianz über den Zeitablauf verändert und das nennen wir in der Statistik oder wir im Finanzmarktbereich oder auch wir hier in diesem Kurs als wir nennen das heterosgedastizität was bedeutet Varianz ändert sich das heißt Schwankung ändert sich im Zeitablauf zudem haben wir gelernt dass die Preise hochgradig autokorrolliert sind und wenn wir die ersten Differenzen bilden das heißt eine stationäre Zeitreihe wieder daraus machen die Renditen nicht mehr hochgradig autokorrolliert sind aber was wir jetzt noch nicht uns angeschaut haben ist was bedeutet das denn für die Varianten beziehungsweise für die Standardabweichungen wenn man es interpretierbar machen will und nachdem wir uns hier jetzt in der Finanzmarktforschung befinden oder auch in der Finanzanalyse wenn wir die Standardabweichungen einer Finanzzeitreihe beachten nennen wir das ganze Volatilität die Volatilität ist ein Maß dafür wie stark die Preise um ihren Mittelwert schwanken also wie die Statistische Standardabweichungen hat nur ein schickerer Name was Sie jetzt hier sehen können ist die Volatilitätszeitreihe der Tesla Preise das heißt ich bin hergegangen habe die Volatilität also die Standardabweichung unserer Tesla Preiserie berechnet und habe das zeitlich abgetragen wenn wir jetzt zurückgehen auf unsere Regressionsannahmen haben wir ja festgestellt wir wollen homoskedastzidät und wir wollen konstante Varianten haben das heißt auch konstante Standardabweichungen und ich weiß nicht wie gut ihr Augenmaß ist aber Konstanz sieht für mich ein bisschen anders aus, speziell im Zeitraum 2020 bis heute das ist für mich persönlich als Analyst auch ich nenn es jetzt mal richtig krass so was zu sehen, weil wir sind es gewöhnt Sprünge zu modellieren oder nicht linearitäten zu modellieren was 90 Grad nach oben reichende Kurve modellieren ist auch für uns was Neues um auf den Punkt zu kommen Sie sehen, dass die Volatilität über die Zeit einfach nicht konstant ist und zu jedem Zeitpunkt anders ist speziell in Krisen oder Panik getriebenen Zeiten wie in der Corona-Krise 2020 wo Sie sehen wie stark die Volatilität sich eigentlich verändert warum das so ist und was wir damit anfangen können das machen wir im nächsten Kapitel was ich Ihnen hier noch zeigen kann ist die Volatilitätszeitreihe der Renditen die Volatilitätszeitreihe der Renditen deshalb weil wir ja vorher gesagt haben wenn wir die Preise nehmen und daraus die ersten Differenzen bilden bekommen wir eine stationäre Zeitreihe und viele denken ok, damit sind wir wieder gut damit sind wir fein wir können unser Regressionsmodell wie gehabt benutzen das ist so nicht ganz richtig wenn Sie sich die Renditen anschauen und die Volatilität der Renditen sieht konstant auch irgendwie anders aus und Sie sehen wie massiv diese Ausschläge denn eigentlich sind wenn Sie sich die Wachstumsraten anschauen gerade in den Krisenzeiten gucken Sie sich das mal an hier sind knappe 4% Schwankungen an einem Tag das ist sehr viel was ich Ihnen noch zeigen möchte deswegen habe ich auch vorher die Renditen quadriert ist wenn Sie sich die rote Linie ansehen das ist die Schwankung der quadrierten Renditen sehen Sie, dass wir hier eine Devolatilisierung erreichen können, indem wir die Renditen einfach quadrieren ich habe Ihnen hier noch die Autokorrelationskoffizienten der Volatilitätszeitreihe der Tesla Preise abgetragen hier sehen Sie im Vergleich zur Autokorrelation der Tesla Preise selbst dass die Autokorrelationskoffizienten der Volatilitätszeitreihe deutlich schneller abnehmen wenn Sie sehen beim Tag 4042 ist der Einfluss der Volatilität auf die Volatilität heute nicht mehr signifikant dass die Volatilität eine andere Autokorrelationsdynamik vorweist wie die der Preise natürlich habe ich Ihnen hier auch noch die Autokorrelation bei der Volatilität der Lockrenditen dargestellt und Sie sehen, nachdem wir hier eine stationäre Zeitreihe haben hat selbst die Volatilität der logaritmierten Renditen keine Autokorrelation mehr wo liegt hier das Problem tiefer gehe ich hier mal im Kapitel Data Science noch darauf ein das Problem ist ich springe noch mal eine Folie zurück dass genau in dieser zeitlichen Abhängigkeit der Vergangenheit auf heute Informationen enthalten sind die wir nutzbar machen können weil ja die Vergangenheit ein Einfluss hat auf heute wenn die Vergangenheit ein Einfluss hat auf heute sind Informationen noch wichtig die heute determinieren, die heute bestimmen wenn wir die natürlich hier rausnehmen weil wir dann eine stationäre Zeitreihe bekommen und unsere einfacheren Modelle leichter anwenden können dann verlieren wir diese Informationen das ist gerade wenn wir Machine Learning Algorithmen verwenden extrem schade oder problematisch oder zu bedenken wenn wir Informationen wissendlich nur um hübschere Modelle zu bekommen oder einfacher Modelle mit denen man schöner rechnen kann die Frage ist bringen uns diese Modelle da noch was in der Praxis um von der Praxis mal wieder den Schwung in die Theorie zu machen kommen wir jetzt zum letzten Punkt und zwar wie teste ich den Autokorrelation wenn ich nur einen Lecker habe quasi die Frage hat gestern einen Einfluss auf heute kann ich den sogenannten Durban Watson Test verwenden diese Durban Watson Test testet allerdings nur ob ich Autokorrelation erster Ordnung vorliegen habe das heißt so wie ich Ihnen das gezeigt habe 42 Tage in die Vergangenheit zu gehen ist damit nicht möglich wenn Sie diese Teststatistik hier berechnen diese Teststatistik benutzt effektiv nichts anderes mir eine lineare Transformation in der der Autokorrelationskoeffizient mit einfließt können Sie sehen, dass Sie hier gewisse Intervalle haben wenn der Durban Watson Test etwa bei 0 liegt habe ich eine positive Autokorrelation wenn der Durban Watson Test in etwa bei 4 liegt eine negative Autokorrelation und bei 2 keine Autokorrelation in den Zwischenbereichen zwischen 0 und 4 und 4 und 2 ist dieser Test nicht eindeutig identifiziert oder nicht identifiziert sondern spezifiziert und ungenau weswegen Sie gucken sollten, dass Sie möglichst nah an diesen 3 Schwellen werden liegen um eine verwertbare Aussage treffen zu können wenn Sie jetzt natürlich Autokorrelation höhere Ordnung testen möchten quasi ist mein Rechenfehler den ich in der Übungsklausur vor 5 Monaten gemacht habe relevant für die Klausur dann können Sie sich ein Tests wie dem Preusch Godfrey Test versuchen diese erlaubt es Autokorrelation in höherer Ordnung zu testen wenn Sie zu dem Testen möchten ob Ihre Volatilität bzw. Ihre Varianz über den Zeitablauf konstant ist oder nicht als ein Test auf das vorhanden sein von Heterosgedastizität durchführen wollen könnten Sie den Preusch Baggan Test verwenden oder den Weit Test grundsätzlich ist zu sagen dass es statistische Tests gibt wie Sand am Meer es gibt nicht nur diese 3 Tests die ich Ihnen hier zeige es gibt eine ganze Varietät an Tests die Sie verwenden können die haben alle Vor- und Nachteile ich habe Ihnen aber einfach mal die bekanntesten und gängigsten hier rausgesucht damit sind wir mal mit unserer ersten Vorlesung fertig das erste Kapitel ist hiermit abgeschlossen Sie haben mathematische Grundlagen gelernt Sie haben gelernt was ist eine Zufallsvariable Sie haben Würfeln gelernt Sie haben die ersten beiden Momente Berechnen kennengelernt Sie haben Zeitreihen kennengelernt Autokorrelation und Tests auf Autokorrelation kennengelernt und jetzt ist es an der Zeit dass wir das ganze praktisch umsetzen Sie haben jetzt sehr viel Theorie gehört das Video ist auch etwas länger geworden lassen Sie sich davon bitte nicht erschlagen ich mache für die Implementierung in Python ein extra Video wo wir uns direkt auf den Code stürzen wo ich die ganzen Grafiken die ich Ihnen jetzt hier gezeigt habe wo Sie sich die selbst erzeugen können und wo Sie auch andere Zeitreihen benutzen können und diese Grafiken sich für andere Werte anschauen können also für die praktische Anwendung im Python existiert im Kurs an eines Video weil ich das auch in den anderen Kapiteln so machen werde, dass ich die Theorie und die praktische Implementierung in Python separieren möchte der Code ist dokumentiert und ich versuche ihn nach PEP 8 so schön wie möglich darzustellen, dass Sie ihn auch nachvollziehen können Hinweis zur Experimentierfreude gegen Ende tun Sie es einfach ich habe Ihnen Code zur Verfügung gestellt er ist Ihnen erlaubt verschiedenste Zeitreihen und verschiedenste Datensätze damit zu verwenden und er nicht nur für irgendein vorgefertigtes Beispiel funktioniert, sondern für alles Mögliche was Sie dem Code füttern also lege ich es Ihnen ans Herz weil wenn Sie Ingenieure sind spielen Sie damit rum machen Sie es vielleicht nicht ganz kaputt, Panzer Tape hilft da nicht und ich bedanke mich für Ihre Zeit und bis zum nächsten Video