 Jetzt wollen wir ein paar Liveabfragen stellen, ihr solltet euch ein paar Abfragen, Ideen überlegen und wenn wir gleich zu dem Punkt kommen, dann bitte ich euch, eure Hand zu heben. Und dann komme ich mit dem Mikrofon zu euch. Jetzt gebe ich wieder zurück zu Lukas und wir haben immer noch Übersetzungen. Genau und wenn ihr das hört, dann bedeutet das, dass ihr uns gefunden habt. Herzlichen Glückwunsch. Hört mal rein. Hat irgendjemand einen Vorschlag? Ja, da drüben? Nina? Es gibt schon eine Frage. Ist es möglich, alle zirkulären Stammbäume zu finden? Es ist auf jeden Fall möglich, einige zu finden. Alle zu finden, wird wahrscheinlich eine Zeitüberschreitung werfen. Am einfachsten geht es wahrscheinlich dann auch wieder über die Kinder, das heißt Item Child plus wieder das Item. Mit dem plus, das ist ähnlich wie mit dem Sternchen, was plus bedeutet, es muss mindestens ein Grad dazwischen sein. Ich werde es mal auf eins begrenzen, aber ich bin sogar ein bisschen pessimistisch, dass wir überhaupt eins finden. Und das mal schauen, ob wir da einen finden. Und das könnte eine Weile dauern. Aber ich glaube nicht, dass es eine gute Methode gibt, auf einen anderen Art zu machen. Es sei denn, ihr ladet die Datendumps oder RDF-Dumps runter, dann könnt ihr das lokal ohne Timeout machen. Ich glaube nicht, dass es hier viel zu optimieren gibt. Es sei denn, ich hätte irgendwie Grund zu der Annahme, dass Menschen, die zum Beispiel John heißen, e.g. Item zirkulären Stammbäume sind, dann könnten wir das ein bisschen runterfiltern. Aber selbst dann, ich fürchte, das wird nicht funktionieren. Ja, da ist das Timeout. Und da seht ihr, dass das Ding in Java geschrieben ist. Eine Sache, die wir mit diesem P40 Plus tun können, ist, dass wir mit einer mythischen Kreatur beginnen, z.B. König Arthur. Ich hoffe, ich kann ihn so finden. Ah, WD, nicht WDT, da ein legendärer Britischer oder valisischer König. Dann suchen wir einen Item, der definitiv ein echter Mensch ist und der ein Geburtsdatum hat. Und wir sagen, das Geburtsdatum sollte nach 1950 sein. Und das ist ein Date-Time, da so ein Datumzeitwert. Lass mal in 1980 sagen, das ist vielleicht effizienter. Keine Ergebnisse. Ich dachte, König Arthur hätte irgendwelche echten Nachkommen. Das war vielleicht dann eine andere Person aus der Mythologie. Lass mal anfangen mit irgendeinem beliebigen Ahn. Und diese Ahne ist auch eine Instanz von mythischer Charakter. Mal schauen, ob wir irgendwelche Personen aus der Mythologie haben, die Kinder haben, die nach 1950 geboren sind. Ich könnte aus dem Limit 1 wahrscheinlich also als Limit 1 sein, Limit 10 machen. Aber ich bin optimistisch. Es gibt Menschen hier, sogar britische Mitglieder des Parlaments. Es gibt einige, die ihre Familiengeschichte ins 15. oder 16. Jahrhundert zurückverfolgen können. Und es ist dann schwierig auszufinden, wo sie anfangen, verkehrt zu sein. Das funktioniert auch nicht so gut. Hat irgendjemand anders in der Zwischenzeit eine Idee ganz dahinten? Danke. Wir kennen alle dieses blödsinnige Spiel in Wikipedia, in dem man versucht, die Seite von Adolf Hitler zu finden, in dem man nur auf links klickt. Kann wir die Seiten finden, die direkt mit Adolf Hitler verknüpft sind auf Wikipedia? Das würde gehen. Eine lustige Geschichte hier ist, dass die erste Beispielabfrage, die wir hier haben, Katzen ist. Und warum Katzen und nicht Hunde? Der Grund dafür ist, dass das vierte Ergebnis hier der Hund von Adolf Hitler ist. Und deswegen nehmen wir lieber Katzen. Aber lasst uns mal nach irgendetwas suchen, wo das Item irgendeine Verbindung zu... Und uns ist völlig egal, welche Verbindung es ist. Lass uns einfach mal eine suchen, die irgendeine Verbindung zu Adolf Hitler haben. Und dann finden wir 920 Ergebnisse. Einige davon sind Sight Links. Das heißt, wir wollen auch, dass das Item irgendein Label hat. Das benutzt diesen Namespace. Und wir wollen das Englisch Label. Das heißt, wir filtern nach der Sprache des Labels. Die sollte Englisch sein. Dann wählen wir nur das Item und das Label aus. Und das ist hoffentlich immer noch relativ effizient. Jawohl. Der NSDAP-Mitgliedsnummer ist nur eine Eigenschaft. Aber ich vermute, dass es ein Beispiel dafür gibt. Jawohl. Er hat da Mitgliedsnummer 1. Oh, haben wir Hitler als Beispiel auf der Seite Todesursache? Ja, Vergiftung. Vergiftung, Erhängung, Blausäuer Vergiftung, Kopfschuss. Brauchen wir so viele Ergebnisse dafür? So viele Beispiele. Ja, Nazi-Partei, Clara-Hitler, ich weiß nicht, wer das ist. Die Olympischen Spiele, 1936. So findet man alles, was eine direkte Verbindung zu Hitler hat. Noch irgendwelche Beispiele? Hier vorne. Oder habe ich da hinten niemanden verpasst? Nein, okay. Kannst du die günstigsten Projekte öffentlicher Infrastruktur in Deutschland finden, zum Beispiel eine Brücke oder so? Ich vermute nicht, dass wir eine vollständige Datengrundlage haben. Aber lass uns mal ausverdienen. Lass uns mal mit einem teuren Beispiel beginnen. Wir nehmen ein sehr teures Beispiel, damit wir das Datenmodell sehen. Wie sieht ein Infrastrukturprojekt aus? Wie werden die Kosten modelliert? Jawohl, die Kosten sind hier in Euro. Es gibt eine Eigenschaft Kosten in Euro und hatte sowas wie Instanz eines Flughafens. Hier, wir könnten zum Beispiel schauen, was auch Flughafen gebaut wird, eine Eigenschaft. Ist der Flughafen Berlin Brandenburg eine Instanz in der Unterklasse von öffentlicher Infrastruktur? Das sieht nach dem falschen Item aus. Was ist das denn? Das ist nichts. Verlinkt irgendwas zu diesem Item? Nein, nichts. Ein internationaler Flughafen ist eine Unterklasse von Flughafen, was wiederum ein Unterklasse von Flugfeld ist. Das ist eine architektonische Struktur. Wir können nach architektonischen Strukturen suchen. Die Struktur wäre eine Instanz einer Unterklasse von architektonischer Struktur. Das hat einen Kostenwert. Wir sortieren nach absteigenden Kosten und begrechen es auf 10. Dann bekommen wir wahrscheinlich etwas mit sehr hohen Zahlen. Wir müssen zum Beispiel jenen, wo die Zahlen sehr hoch sind, weil wir die Währungen nicht umrechnen. Was passiert hier? Ich weiß nicht, warum das so lange braucht. Lass uns mal in der Zwischenzeit eine zweite Version ausprobieren, wo wir den Wikibase Quantitywert kosten und die Einheit Euro nehmen. Lass uns das einmal ausprobieren, ob das vielleicht ein bisschen besser funktioniert oder auch nicht. Hier gab es wieder eine Zeitüberschreitung. Das sieht so aus, als würden wir hier auch ein Timeout bekommen. Ich weiß nicht, ob wir einfach mal nach den teuersten Dingen überhaupt suchen können. Das kostet 55 Milliarden Euro. Was ist das? Power of Siberia, das ist eine Gas-Pipeline. Die Kosten stehen da in Euro? Das sind 15 Milliarden Euro, 8,7, 7,7, das ist der Kanal-Tunnel, der ist teuer. Der Brenner-Basistunnel, auch der ist teuer. Stuttgart 21. Es wird auch noch als teuer veranschlagt. Lass uns mal nach aufsteigenden Kosten suchen, weil das das ist, wonach du gesucht hast. Jetzt bekommen wir eine Menge Dinge, die keine Infrastrukturprojekte sind. Das ist The Hot and Energetic Universe, was offenbar ein Null-Budget-Film ist. Lass uns mal Ducktyping verwenden und anstatt von Infrastrukturprojekten sagen, dass es ein geografischer Ort hat, da schliefst dann eine Menge Dinge aus. Das hier hat Kosten, das war ein Projekt in Frankreich, wir waren jetzt auf Deutschland begrenzt, hier 400.000 Euro für einen Brunnen in Stuttgart. Zählt das? Vermutlich, dass es die Instanz von etwas ist, das hat noch nicht mal ein englisches Label, also das ist die Klasse aller Brunnen, die nach der Göttin Ceres benannt sind. Hier haben wir einige dieser billigen Projekte, was zum Beispiel dieser Platz, eine winzige Fußgängerbrücke, hat sogar ein Bild, so sieht die aus. Und die hat gekostet, was war das? 1,6 Millionen Euro. Und noch ein öffentlicher Platz. Dann binden wir das mal als billige öffentliche Infrastrukturprojekte. Und auch die öffentliche Infrastruktur, vielleicht den Anführungszeichen, weil wir nur sagen, es hat einen Ort und der ist in Deutschland. Ich werde das hinterherum schicken. Das hier hat nicht funktioniert, das auch nicht. Okay, irgendwelche weiteren Vorschläge. Oh, das sind schlechte Neuigkeiten. Ich habe eine Frage, ich habe gesehen, dass wir mit dem Abfrage-Dienster diese Trees zeichnen können, diese Bäume zeichnen können und Grafen zeichnen lassen können. Meine Frage wäre, alle Programmier-Design-Muster, die aber kopiert sind nach Struktur-Patterns und Struktur-Mustern und Bequemlichkeiten-Mustern, können wir da eine Struktur zeichnen? Wir können das auf jeden Fall versuchen. Okay. Wir schauen uns mal diese Design-Patterns an. Also, was für Unterklassen gibt es da? Also, wir haben irgendwie Software-Design-Patterns, das ist das, was wir suchen sozusagen. Also, wir wollen jetzt irgendwie ein Muster, ein Pattern finden und auch gerne das Label dafür und eben auch was für eine Art von Muster das ist. Und das Muster ist sozusagen eine Unterklasse von dieser Art von Muster und das ist wiederum eine Unterklasse von Software-Design-Patterns oder Software-Design-Muster. Und wir wollen das machen, im Graph aussehen. Okay, das sieht nicht so schlecht aus. Wir haben irgendwie strukturelle Muster, Verhaltensmuster, ein grundlegendes Muster und was wir jetzt auch dazu machen konnten. Wenn wir das machen, dann sehen wir irgendwie alle Verbindungen zu Software-Design-Matterns und dann haben wir praktisch eine hierarchische Struktur und es ist alles miteinander verbunden. Das funktioniert erstaunlich gut. Viel besser als ich dachte. Ich hatte erwartet, dass es wirklich kompliziert und hässlich wird. Ja, also das hat tatsächlich erstaunlich gut funktioniert. Das überrascht mich. Also das ist irgendwie so Software-Design-Patterns, die wir dann in einem Baum, in einem Baum sich darstellen. Gibt es noch irgendwas? Oder ich kann versuchen etwas zu optimieren? Nein. Ah, welche Städte haben sich beworben, darum den Eurovision Song Contest auszurichten, aber wurden nie ausgewählt? Okay, ich weiß nicht, ob das tatsächlich existiert, ob wir diese Daten haben, aber ich schau mir das mal an. Ich brauche ein Beispiel statt. Also jetzt schauen wir uns zum Beispiel mal den Eurovision Song Contest 2020 an. Jetzt schauen wir uns mal an, ob es da Daten gibt, wer nominiert war praktisch oder wer sich beworben hat. Also das ist alles nicht das, was wir suchen. Haben wir den Ort überhaupt? Wir haben einen Ort, aber wir haben keine anderen Länder und ich gehe davon aus, dass diese Information nicht beim Land wäre. Es kann sein, dass wir ein spezielles... Ja, also es würde nur um die Stadt gehen, weil es geht ja dahin, wo gewonnen wurde. Aber ich vermute, wir haben das nicht. Wir haben eine Liste von den Städten, die das ausgerichtet haben, aber wir haben leider keine strukturierten Informationen hier. Es gibt nur die ganzen Wikipedia-Artikel. Und da gibt es jetzt nur irgendwie eine Liste mit den ganzen Orten. Ich glaube, wir haben diese Liste nicht. Wir können das hinzufügen. Ich frage mich mal, ob wir das für die Olympischen Spiele haben. Haben wir Daten dazu, wer sich beworben hat, diese Spiele auszurichten? Okay, wir haben den Ort auf jeden Fall. Wir haben die Teile. Wir schauen mal, hat die Englische Wikipedia einen speziellen Artikel über den Auswahlprozess? Sieht nicht so aus. Ah, da. Da ist der Wikipedia-Artikel. Gibt es da interessante Informationen auf Wikidata? Nein, leider nicht. Okay, wir können also sehen, wann die Städte gebietet, geboten haben. Aber wir können leider nicht sehen, welche Städte sich da beworben haben. Wir schauen mal, bei 2012, da ist das gleiche Problem. Leider haben wir diese Daten nicht. Ist diese Abfrage durchgelaufen worden? Die Länder haben eine Frage von uns, von uns Übersetzungsengeln. Könnt ihr uns die Länder mit der Flagge mit den meisten Farben geben? Das machen wir jetzt. Wir schauen uns die Anzahl der Farben an. Und zwar holen wir uns praktisch Länder mit einer bestimmten Flagge. Diese Flagge hat Farben. Und dann gruppieren wir nach Land. Das ist ein bisschen wie SQL, mit so Aggregierungsfunktionen. Wir haben hier technische Probleme mit den Mikrofonen. Wir versuchen das eben zu lösen. Ich glaube, Sie haben jetzt ein Mikrofon ausgeschaltet. Wir schauen mal, was jetzt funktioniert. Ja, jetzt ist wieder ein Mikrofon an. Wir schauen mal, ob es jetzt funktioniert. Das tut uns leid. Das würde tatsächlich Spaß machen. Wir suchen für Länder mit Flaggen. Wir hoffen, dass die Flagge mit Farben sind. Und was Sie tun, ist das. Was will ich wissen? Ah, okay. Das ist sozusagen 14 Farben. Was war das? 8. 1, 2, 3, 4, 5, 6, 7, 8. Also, jetzt haben wir zusätzliche Flaggen. Wir haben nämlich nicht nach Land gefiltert. Das Problem ist, Länder sind kompliziert. Also, was ich gemacht habe, ist, ich habe eine vorbereitete Abfrage für Mitglieder der Vereinigten Nationen. Und die kopiere ich dann immer einfach rein, wenn ich Länder brauche. Und wir nennen das jetzt eben Staaten. Weil jetzt interessieren uns halt nur die Staaten Flaggen. Und jetzt muss ich natürlich dann auch gruppieren, also aggregieren nach Staat. Und eben die ganzen variablen Namen verändern. Und dann wird es hoffentlich funktionieren. Und wir werden etwas ausfinden. Die Vereinigten Nationen haben die meisten Farben. Schauen wir uns mal die Flagge an. Ich glaube, das liegt daran, dass es verschiedene Flaggen hat, die alle irgendwie gleich wichtig sind. Und dass wir praktisch die Anzahl der Farben dafür addieren. Aber wir schauen mal. Hm, scheint nicht zu sein. Wieso hat das 12 Farben? Es hat blau, rot, weiß und englisch als Farbe. Okay, jetzt suchen wir uns mal nur an die nicht doppelten Farben. Also praktisch jede Farbe wird einmal gezählt, egal wie oft sie vorkommt. Vielleicht hilft das. Aber ich weiß nicht. Ah. Okay, vielleicht gab es den Staat mehrmals? Ah. Weil es mehrmals vorkommen würde sozusagen. Und dann würde man bei der Aggregierungs-Sache dann praktisch addieren. Also das Ergebnis jetzt sieht sinnvoller aus. Zum Beispiel Südafrika hat sechs Farben. Südsudan hat auch viel. Und jetzt können wir noch was weiteres anschauen. Nämlich uns das Bild der Flagge ausgeben lassen. Und das sozusagen hier hinzufügen. Und jetzt können wir vielleicht es auch sehen oder nicht. Ah, okay, und jetzt können wir die Daten, die tatsächlich sehen. Ah. Hier sind sechs Farben oder vielleicht mehr? Ja. Und dann fünf Farben. Und ja, das sind tatsächlich die bunten Staatsflangen oder Länderflangen sozusagen. Okay, super. Ich werde das später auch noch tweaken. Und wir können die Bilderansicht als Standard Sicht sehen. Wir haben vielleicht noch Zeit für eine Frage. Wenn es eine kurze Frage ist. Ja, ich kann vielleicht nicht so schnell schreiben, aber wir können ja mal schauen. Ich habe es funktioniert. Und wenn ich dann wiederhole, ich sei einfach. Ja, es funktioniert. Ich weiß nicht, ob es funktioniert. Aber die kleinsten Bilder auf Wikipedia durch, also bei der, bei der durch oder geordnet von der Größe des Bildes. Das ist nicht möglich auf Wikidata, aber es ist vielleicht möglich auf Wikicomments. Kannst du nach Größe des Bildes suchen? Ich glaube, das ist möglich. Nee, anscheinend nicht. Du könntest wahrscheinlich innerhalb einer SQL-Frage, innerhalb einer SQL-Anfrage nach, file size, also nach Größe sortieren. Und ich habe zufällig später eine andere Vorlesung um 18 Uhr heute im S-Zimmer oder in der Bibliothek. Das ist jetzt gerade unklar. Und da werde ich euch zeigen, wie man SQL-Abfragen gegen Wikipedia wirft, sozusagen. Aber wenn du dich wirklich interessiert, kannst du auch einfach auf mich zukommen und wir können zusammen versuchen, das rauszufinden. Eine zusätzliche Idee, vielleicht eine kurze zusätzliche Idee, aber nee, wir sind jetzt auch wirklich fertig. Also wenn ihr weitere Fragen habt, dann kontaktiert mich einfach auf Twitter oder auf Wikidata Facts. Und ich werde schauen, ob ich euch helfen kann. Vielen Dank. Ja, vielen Dank, dass ihr heute bei uns in der Übersetzung wart. Das waren Toni und Waffle mit der ersten Übersetzung aus der Wikipack-HWG. Ich hoffe, es hat euch gefallen.