 They have a talk here with a very complicated title that I don't quite understand yet It's called interactively discovering implication a lot of knowledge and Viki data and They told me the point of the talk is that I will later understand what it means and I hope I will so good luck Thank you very much and have some applause Thank you very much. Um, do you hear me does it work? Hello, oh very good. Thank you very much and they are welcome to our talk about interactively discovering implication and knowledge and Viki data It is more or less Fun project we started for Finding rules that are implicit in Viki data and tailed just by the data. It has People and insert it into the Viki data database so far And we will start with the explicit knowledge so the explicit data in Viki data with max So, right What what is Viki data? Maybe you have heard about Viki data, then that's all fine maybe you haven't then surely you've heard of Wikipedia and Wikipedia is run by the Wikimedia Foundation and the Wikimedia Foundation has several other projects and one of those is Viki data and Viki data is basically a large graph that encodes Machine-readable knowledge in the form of statements and the statement basically consists of some entity that is connected or some some entities that are connected by a state by some property and These properties can then even have annotations on them So for example, we have Donna Strickland here and we encode that she has received a Nobel Prize in physics last year by this property awarded and This has been a qualifier time 2018 and also for chap pulse amplification and All in all we have some 890 million statements and wiki data that connect 71 million items using 7,000 properties So but there's also a bit more so We also know that Donna Strickland has field of work optics and also field of work lasers So we can use the same property to connect some entity with different other entities And we don't even have to to have knowledge that connects to entities. We can have her date of birth, which is 1959 1999 no, 1959 yes and This is then just a plain date and not an entity and now coming to from the explicit knowledge then We we have some more we have Donna Strickland has received a Nobel Prize in physics and Also Marie Curie has received a Nobel Prize in physics and we also know that Marie Curie has a Nobel Prize ID That starts with fish and then 1903 and some some random numbers that basically are this ID and Then Marie Curie also has received a Nobel Prize in chemistry in 1911 So she has another noble ID that starts starts with camp and has 1911 there and Then there's also Francis Arnold to receive the Nobel Prize in chemistry last year Will come to the German überset zone fun interactively discovering implicational knowledge and wiki data From Maximilia Marx and Tom Hanika Live from 36 in cause communication Congress in Leipzig All talks on Congress were in life between German and English And in a wider language For further details and information like the streams can be used visit c3 lingo.org We are looking for your feedback Before took with hashtag Hashtag c3t your translator for these in talks in pascalina So we call the people who don't satisfy this implication we call those counter examples and Well, if you look at the data on the video and you say it's a little bit And the greatest of them You won't find any counter examples because then you can't get an example because it's just too big So that means we need a way to Automatically that to find When we this wissen hätten Then entail does vielleicht fehlende oder falsche information Und wir wollen das darstellen in einem weg der einfach zu verstehen und Eindeutig ist so dass es nicht lang dauert ist Aufzuschreiben und eine kurze darstellung hat also keine komplexes sind tags keine Quantum Keine zwagel keine deskript keine beschreibungs logik Und wir wollen auch etwas was am berechenbar bis ist auf echter hardware in kurzer zeit also Unser herangehensweise ist To extract what is called propositional implications. So just logical formulas of propositional logic That are an implication in the form of this Was also ist formale Begriffsanalyse Das geht an tom was ist formale begriffsanalyse das vor den 80ern entwickelt von von kein die willy und ganter heißen und es geht um verbandstheorie verbandstheorie ist ein Uneindeutiger Name es geht um zwei dinge einerseits geht es um ordnungen Ich mag steaks ich mag pudding ich mag steaks mehr als pudding und Es geht hier geht es um bestimmte ordnungen diese ordnungen können benutzt werden um bestimmte logiken zu beschreiben zum beispiel wenn es regnet wird es nass das was die damals benutzt haben ist genannt formale kontext was ist genannt wird Was aus einem objekt z besteht und allen matributs set und einer verbindung die inzidenz genannt wird also welches objekt hat welcher attribute Hier ist ein kleines beispieler der rechten seite die objekte sind Tiere der platypus das ist Das lustige tier aus australien die schwarze fitfe ist eine spinne die dacke ist ein nennt hat ist katze und manche haben ribute Memo Wenn und hier kann man Regeln herausziehen wenn immer wir ein Säugetier haben das giftig ist dann legt es aya Aber wir haben den Vigidata wir haben ein grafen der sehr viele explizite ist als das und können nicht mal den binaire grafen von vigidata speichern Also verpelt Wir schlagen ein algorithmus vor wie man aus einem experten diese informationen gewinnen kann Und der algorithmus ist relativ einfach also wir haben den algorithmus wir haben ein experten in dem fall vigidata Der algorithmus nimmt notiz von counter von gegenbeispielen und von implikation und am Anfang haben wir keine gegenbeispiele und Alles was der algorithmus macht ist der fragt den experten ist diese implikation war ist es zum beispiel war dass wenn eine Ein tier ein säugetier ist und giftig ist legt es dann aya So wir können jetzt den experten also vigidata fragen wir können anfragen stellen und es kann das beantworten Und wenn der experte also vigidata keine gegenbeispiele findet dann sagen wir dass es richtig dass es eine richtige aussage Oder aber wenn es nicht richtig ist Dann kann es sagen nein dass es nicht war hier ist ein gegenbeispiele Und das ist also etwas was man durch ein beispiel wiederlegt Also in die straße nass ist heißt das nicht unbedingt dass es dass es geregnet hat könnte auch zum beispiel der reinigungsservice gewesen sein Wir benutzen also vigibeta vigidata als einen experten aber wir wollen auch ein menschen ein menschlichen experten in einbeziehen Also wir fragen zuerst den vigidata expert experten nach einer regel Und nach dat nach dem fragen wir den menschlichen experten und dann sagt er entweder ja das stimmt oder nein dieses beispiel kennt dieses gegenbeispiele kennt expert Experte vigidata aber nicht Und das kann man darstellen als hier ist ein mathematisches bild dass es nicht so vorsichtig und hier auf dem auf der einen seite können wir sehen dass es Exploration auf vigidata stattfindet und exploration bei einem menschen und wir können diese zwei miteinander verbinden Damit das funktioniert brauchen wir ein weg um Vigidata als einen formalen kontext zu sehen Also wir haben wir haben die Vernehm die items als objekte und die eigenschaften als attribute und haben eine incidence relation und wir haben also am ende Ein kontext der 71 million Zeilen und sieben tausend spalten hat aber das ist kein problem wir nehmen davon wir nehmen davon ein eine teilmenge Die tatsächlich miteinander verbunden sind Also es macht zum beispiel keine keinsin eine eigenschaft zu verbinden die Luft die raum schiff fahrt mit Löffeln verbindet aber wie definieren wir die Wie definieren wir die incident Das hängt sehr stark davon ab welche eigenschaften wir aussuchen Wir wollen zum beispiel die richtung von den statements in Mit einbeziehen zum beispiel haben wir kind und eltern Is the child of the that that should be something different than the is a child and we want the size the skin from be Etwas anderes ist als b ist das kind von a Und wir wollen auch kennzeichen mit einbeziehen Zum beispiel ist wofür man ein Begriff ein preis für etwa für eine sache kriegt ist etwas anderes als ob man ein preis für eine andere sache kriegt und ist dann gibt es noch unterklassen und die eine formale hieraschie darauf Fallt zum beispiel etwas zu gewinnen dass ein anderer preis es bedeutet auch den preis selber zu gewinnen Also gibt es auch implikation In der hinsicht Um zu sehen wie wir das tatsächlich machen lassen sein beispiel anziehen das ist dann das dwicklen das ist Das das eschchen Einer von den leuten die ein Physik preis im letzten jahr gewonnen haben und war das ist der dritte der hat auch ein Physik Nobelpreis letztes jahr gewonnen Wir haben also all die statements hier und dieser Quantos sagt mit Und ich denke nicht dass der quanto auf diesem statement hier ist aber das ist nicht wichtig Wir tun also all die entitäten in diesen kleinen grafen also wer am strickland moro und eschken und auch anold und cubby Dann haben wir hat gewonnen und dann Sortieren wir das nach den unterschiedlichen preisen die die leute gewonnen haben und dann ist dem ersten ist Physik Nobelpreis im zweiten ischemin Nobelpreis im dritten ist einfach Irgendein Nobelpreis dann haben wir Hat preis gekriegt Und dann noch was die was das arbeitsfeld war Und wenn wir uns das fürs dwicklen angucken sie hat ein Nobelpreis in physik dann hat sie ein Nobelpreis gewonnen sie Hat es mit dem roh zusammengewonnen und sie arbeitet in laser aber nicht in radioaktivität Für moro hat er den physik Nobelpreis gekriegt und den Nobelpreis Eschken hat ihnen physik gekriegt Und ein Nobelpreis und hat es mit moro und gekriegt und aber den lasers aber nicht in radioaktivität Arnold hat einen preis in chemie und ein Nobelpreis Und marie curie hat einen physik und den chemie und hat ein Nobelpreis gewonnen Und hat in radioaktivität Gearbeitet aber damals gab es noch keine laser und deswegen wird es kriegt sie dieses fällt nicht Also diese tabelle hier ist eine darstellung von unserem formalen kontext Und wir haben ein tool gebaut mit dem man all diese dinge machen interaktiv machen kann Und tom wird euch zeigen wie das funktioniert Hier seht ihr erstes screenshots von diesem tool bitte macht keine kommentare zu den Grafficken wir arbeiten noch daran wir arbeiten gerade an der grafik auf der letzten seite seht ihr mehrere Felder Space Launchers This can you can explore the first for Defineered the bryches in for the idea explodierend kund Und ihr könnt eines davon auf der rechten seite aussuchen Und außerdem die eigenschaften an den ihr interessiert seid in vigi data auf der rechten seite Kündchen so Der erste schritt im spiel ist das das spiel Fragen wird ist es war dass jedes objekt in vigi data diese diese statements haben wird Ja das Das ist dann nicht unbedingt war für alle und Und Failed also also we checked this application was heißt dass es nicht war so viel brauchen also Wir werden dann gefragt ist es war dass jeder subjekt dass ein card make work hard auch ein Vieh und ein operator hat und hier sagt figi data dann es gibt 26 items die da die dem nicht Entsprechend ist Die also die card network property eigenschaft haben aber nicht die andern Also 26 statements Fehlen aber vielleicht stimmt das ja das ist auch okay Und dann können könnt ihr sagen ja ich denke dass das war ist oder nein Ich werde das nicht akzeptieren Die nächste frage ist alles was ein operator ist hat das auch ein fee oder ein card network Das ist wahrscheinlich nicht war Es gibt mehr als 1000 items die dem nicht entsprechen also wir können das auch nicht akzeptieren Operator and the card network so Mastercard Alles was ein operator oder ein card network als eigenschaft hat ist es war dass das auch ein Ein preis hat Es gibt wie gedat hat 23 items die dem nicht entsprechen There's missing data Aber hier ist ein hinweis darauf dass es dass es fehlende daten in vigi datia gibt die also vigi data wissen sollte aber nicht weiß Also wir können jetzt sagen nein wir wählen nicht es nicht zu akzeptieren sondern wir akzeptieren es und wir machen weiter und weiter Und das ist jetzt die letzte Frage ist es war das alles was ein preis und ein Carton network hat ist es auch ein operator und Wenn man vigi data fragt dann sagt das es gibt keine gegenbeispiele also soweit wie es Bekannt ist ist das eine valide aussage Für mich klingt das sinnvoll und Fertig also werde ich das akzeptieren Und damit habt ihr das das erkundungsspiel gewonnen Also habt ihr wissen gewonnen also welche implication in vigi data sind war oder auch nicht war aus eurem gesichtspunkt aus Show you some how much does your opinion of the world the next The next point for design is to take a fever to be in the fern entscheidates is Eure Sichtspunkt von der welt von dem von vigi data also zu welten Und darüber wird max euch mehr erzählen So last mich nur kurz zusammenfassend was wir bisher gemacht haben wir haben eine neue ad entwickelt um Eigenschaften in vigi data zu erkunden Die hauptidee ist es wenn man an diese implication schaut die man kriegt Dann und man sieht Dinge die Falsch sind aber Richtig sein sollten Oder ungewollt sind dann In die dann zeigt das an dass es fehlende statements und objekte in vigi data gibt Manchmal lernt man auch etwas über die welt In schlimmsten fall lernt man dass die welt komplizierter ist als man das gedacht hat und so ist das leben aber diese implikation können euch helfen vigi data zu verbessern So was kommt als nächstes Was im moment nicht im exploration game drin ist ist konfigurierbar und Filterbare Gegenbeispiele sein im moment kriegt man einfach nur eine liste von einer zufälligen anzahl von gegenbeis spielen Und man will vielleicht diese liste durchsuchen nach etwas dass man erkennt Und man will vielleicht auch sagen das hier soll ein gegenbeisbild sein Domain spezifisches skalieren von Eigenschaften im moment haben wir nur ein sehr grundlegende Unterstützung für das Also im moment kann man nicht die Tollen Dinge machen wo man sagt man will etwas als ein eine eigenschaft betrachten und Vergleich von dem eigenen wissen gegen vigi data Und also eine möglichkeit zu sehen was weiß ich was bei und das mit vigi data zu vergleichen und wenn ihr noch mehr Ideen für Für features habt ihr lasst uns sagt uns bescheid hier ist das hier ist der link zu dem tool als sagt uns bescheid Und viel spass damit und wenn ihr irgendwelche fragen habt dann ist jetzt die zeit sie zu fragen Which microphones now So wir werden jetzt die mikrofone wechseln so dass ich dieses mikrofon euch geben kann wenn einer von euch fragen an unsere speaker hat gibt es da irgendwelche fragen Vielen dank für den talk ich wollte fragen erste frage was ist die interessanteste implikation die ihr gefunden habt das hätte ein guten wake-up slide gegeben Was ist die interessanteste implikation bis jetzt also das einfachste was man erwarten würde alles was ins all geschossen wurde von menschen also was Dort gelandet ist hat auch ein start hat auch ein start ein abschusszeitpunkt Right now the game only helps you in moment hat hilft das spiel nur implikation zu finden Plan dir auch zu erlauben Daten einzufügen Gibt es pläne wo ich ein einfaches interface habe Weil es würde das den prozess vereinfacht Ja, das ist die idee hinter diesem konfigurierbaren und filterbaren Gegenbeispiel wir werden vermutlich kein Implizit explizit interface machen um daten in vigi dat hat einzufügen aber etwas vereinfacht ist aber ja daten in zufügen ist definitiv geplant Wouldn't it be nice to do this in other languages too? Wer es nicht nett das auch in anderen sprachen zu machen Actually it's a language independent so Genau genommen ist es sprachunabhängig wir benutzen vigi data via vist vigi data ist sprachunabhängig es hat nur Eigenschaften und objekte also welcher sprach auch immer ihr benutzt es sollte Übersetzt werden in die sprache die benutzt wenn es ein label zu diesem zu dieser sprache gibt also wenn Vig data in dieser sprach verfügbar ist dann sind wir es auch Not natürlich wird das tool auch irgendwann übersetzt Danke für den talk ich habe eine frage im moment finde die er fehlende daten Glaubt ihr auch in der lage zu sein mit dem gleichen Herangehensweise falsche daten zu finden Genau genommen tun wir das ja schon vigi data gibt uns gegen beispiele für etwas was wir schon was ihr dachten wäre Richtig das gibt uns ja ein hinweis auf falsche daten Dann fehlt vermutlich eine eigenschaft von einem item Okay Der die horizontaler axel in der inzidenz matrix sind 7000 sind 7000 spalten Aber es sind ja eigentlich viel mehr spalten Ja natürlich wenn man mehr scaling macht hat man auch mehr mehr spalten Aber sieben tausend sind schon viel zu groß um das tatsächlich zu berechnen Wie viele wären es wenn man alle argumenten multipliert alle argumenten multipliziert Keine ahnung wahrscheinlich ein paar million Habt ihr nachgedacht über ein rekursives system wie zum beispiel Beispiele die von anderen gegenbeispielen falsifiziert fern Account example Verstehe ich leider nicht wie kann ein gegenbeispel durch ein gegenbeispel falsifiziert fern Vielleicht ein beispiel sagt Das katzen katzen golden hara haben können Aber wir sehen ein anderes beispiel dass das keine katze ist Okay Eigenschaft Etwas katzenartiges zu sein fehlt nein So was haben wir gerade nicht in betracht gezogen Aussagen logik hat keine Keine Widersprüche man kann nur durch widersprüche falsifizieren aber wir Will we have we missing the rubber not thinking of your größer is not thinking harm in the process What is the actual the actual a process from filter Also you have this input felt here this ingabe felt here and a pop pre-definied Und dann gibt es noch ein paar klassen für gruppen von einschaften wie zum beispiel Raum All und familie Zum beispiel für all ist es nicht so groß Es dauert paar stunden aber es ist nicht so aber das könne machen aber für familie ist es viel zu groß es sind 40 oder 50 einschaften also Geht das nicht Ich sehe keine weiteren fragen Hat jemand noch eine frage sonst können wir das machen und sind wir sehr pünktlich Vielleicht könnt ihr uns Erzählen wo man euch findet für weitere Fragen Irgendwo her irgendwo haben herun lau laufen Und es gibt decknummern hier auf den slides also ruft uns einfach an vielen dank bitte