 Deshalb kommen wir zu einem Dare Talks, auf die ich mich am meisten freue, weil ich beide diese Projekte im letzten Jahr extrem gefeiert habe. Zum einen, wer von euch etwas von Open Shufa mitbekommen, deshalb seid ihr hier richtig, fast alle. Wer von euch hat denn mitgemacht bei Open Shufa? Hm, immerhin, ein paar Leute hier im Saal. Finde ich total großartig, vielleicht können wir diesen verdammten Algorithmus mal Reverse engineern. Arne ist ja dran mit seinen Leuten. Und das zweite, was ich richtig gefeiert habe, waren die offenen Gesetze. Plötzlich ist da ein Portal, wo alle Gesetze drin sind. Und genau so fand ich das. Also, machen wir es schnell jetzt. Der nächste Talk, Court in die Akten von Stefan Wehrmayer, Walter Palmezhofer und Arne Semsrod. Einen großen Applaus. Ja, guten Morgen. Schön, dass so viele Leute so früh am Morgen hergekommen sind. Zu unserem Talk, Court in die Akten, ein Talktitel, den ich super lustig finde. Aber ich glaube, da bin ich der Einzige, zumindest auf dem Panel. Einer, noch niemals finde ich es lustig. Egal, wir machen einen kleinen Talk zur angewandten Heckeretik, vor allem über den Einsatz daraus, nämlich öffentliche Datennützen, private Datenschützen. Und wir haben zwei Projekte mitgebracht, die glaube ich in sehr unterschiedlicher Art damit umgehen, die beide mit privaten Unternehmen zu tun haben, die sich aber verhalten, als ob sie Behörden werden. Zumindest in bestimmten Teilen. Nicht in dem Teil, wo es um Transparenz geht, aber in den anderen Teilen. Und wir haben zwei unterschiedliche Rangensweisen versucht, um diese beiden Unternehmen zu knacken. Und wir fangen an mit oben Schufer und danach geht es um offene Gesetze. Und danach haben wir hoffentlich ein bisschen Zeit, um noch drüber zu quatschen und zu diskutieren. Offene Daten bei der Schufer sind natürlich ein sehr sensibles Thema. Private Datenschützen und öffentliche Daten nutzen. Das Beides kommt, glaube ich, sehr interessant zusammen bei der Schufer. Die Schufer hat Daten über fast 70 Millionen Leute in Deutschland und hat Daten zu sehr sensiblen Informationen, natürlich Finanzinformationen, dann vor allem Kreditausfälle, solche Sachen über sehr viele Menschen, wahrscheinlich die meisten Menschen hier im Saal. Und ganz viele Menschen, die nicht so viel mit der Schufer zu tun haben, denken tatsächlich, dass die Schufer eine Behörde sei. Aber die Schufer ist ein Unternehmen, das auch die Berechnungsmethoden von den sogenannten Schuferscores nicht offen lebt. Also man redet ja so von den Schuferscores, die die Wahrscheinlichkeit berechnen sollen, zumindest nach der jemand einer Kreditforderung nachkommt oder nicht. Und es gibt tatsächlich nicht nur ein Schuferscore pro Person. Es gibt sehr viele, knapp so 16 Scores, die die Schufer pro Person berechnet. Und wie sie aber auf diese Scores kommt, das ist ein Geschäftsgeheimnis. Das ist auch schon gerichtlich so festgestellt worden vom Bundesgerichtshof. Die Schufer muss diese Berechnungsmethoden hinter diesem Score nicht offen legen. Was die Schufer nicht verhindern kann, ist, dass Leute diesen Schuferscore reverse-engineieren. Das ist nämlich legal und das haben wir versucht mit Open Shufa, Open Shufa ein gemeinsames Projekt von der Open Knowledge Foundation und Algorithm Watch. Und die Idee dahinter ist, diesen Schuferscore, diese Berechnungsmethode zu reverse-engineieren. Wir haben im Frühjahr dazu ein Crowdfunding gemacht. Viele von euch haben da Geld für gespendet. Wir danken euch sehr herzlich dafür, das hat es uns ermöglicht, diese Arbeit anzufangen. Wir hatten ein Werbevideo dafür, haben dafür Nico Semsrott gewinnen können. Sehr sympathischer Kerl. Super Video auch. Und die Idee von Open Shufa war, oder ist auch weiterhin, dass alle Menschen eine Selbstauskunft über sich nach der DSGVO bzw. danach davor nach einem Bundesdatenschutzgesetz anfragen können, die dann per Post bekommen und über eine App, die wir entwickelt haben, die dann einscannen, anonymisieren oder pseudonymisieren können und uns wiederum dann spenden können. Das haben auch ziemlich viele Leute gemacht über Selbstauskunftnet, erst mal ihre Selbstauskunft angefragt und uns das dann gespendet. Wir waren erst mal so die Reaktionen darauf. Die Shufa war nicht so fröhlich über dieses Projekt. Die haben gleich zu Beginn dieses Crowdfundings einen großen Banner auf ihre Website gestellt und haben gesagt, der Open Shufa-Kampagne ist irreführend und gegen Sicherheit und Datenschutz in Deutschland. Das war super. Vielen Dank an die Shufa dafür. Die Shufa hat nämlich auf ihrer Startseite auf Shufa.de einen Riesenbanner Open Shufa gehabt. Deswegen, um darauf zu linken. Das hat uns noch mal ganz schön viel Traffic gebracht. Das war super. Überhaupt hat sich die Shufa in diesem ganzen Prozess sehr, sehr kooperationsunwillig gezeigt. Es gab ziemlich viele Journalisten, die versucht haben, zu recherchieren, einzelnen Fällen hinterherzugehen und dann die Shufa damit zu konfrontieren. Hier zum Beispiel ein Bericht von einem Journalisten der Welt, der ziemlich eindrücklich bewiesen hat, wie denn die Shufa mit Journalisten umgeht. Die machen wirklich in so gut wie jedem Fall, wo Journalisten versuchen, über die Berichterstattung zu machen, massiv Druck, die versuchen, in der letzten Sekunde Berichterstattung zu verhindern. Die kommen mit solchen Fake News vorwürfen und so ein Zeug. Und insofern zeigt sich, glaube ich, allein dadurch schon ganz gut, dass die Shufa da einiges zu verbergen hat. Und was wir da ein bisschen an die Öffentlichkeit bringen konnten, das erzählt Walter. Ja, hallo. Wir haben im Februar aufgerufen, dass die Daten angefragt werden und haben in Mai angefangen, die Daten dann zu sammeln und jetzt mal zurückkommen auf das größere Thema mit privaten Datenschützen, öffentlichen Nützen. Hier braucht es quasi private Daten, dass man die Daten die öffentlich sein sollten. Und das ist aus unserer Sicht in dieses Scoring und die Gewichtung nachgebaut werden kann, damit man das dann rausfindet. Und das war jetzt insgesamt, gab es 100.000 Anfragen an so Auskunftsdateien. Das war jetzt nicht nur die Shufa, wir haben halt mit der Shufa angefangen und das heißt, dass die Makels oder Unternehmen in dem Bereich und es ja wohl andere Unternehmen gibt, die noch schlechtere Daten verwenden oder noch kaputere Scoring-Mechanismen haben und die noch weniger bekannt sind. Und wir fangen mit der Shufa an, hören aber da nicht auf. Und jetzt nochmal das, das ist das Schöne, was in anderen Ländern heißt, das ist der Mai-Date. Wir möchten sie ja auch ein Data nennen, wo man halt dann, wenn man sich bewusst ist, was die Daten sind, spenden kann, damit man in diesem Datenpool was für die Gemeinschaft rausfinden kann. Das ist der Übergang vom Privaten zu öffentlichen Daten. Und so haben wir eben dann im Laufe von einem halben Jahr ca. 3000 Shufa-Datenspenden bekommen. Da gab es dann kleine Probleme mit denen und zwar wir hatten einen Medienbruch, das heißt, wenn die Leute angefragt haben mit der Shufa, haben sie die Auskunft per Post nach Hause geschickt bekommen und mussten die dann quasi mit unserer App digitalisieren, einscannen, schwerzen, wenn sie es wollten und da gegen eine gewisse Datenqualität verloren. Das war der erste Fall, da hat man Medienbruch und dann hat man Datenbruch. Deine Datenbruch war ganz einfach, dass die Leute, die mitgemacht haben, quasi so bessere demografische Durchschnittswahl als unser Pendel hier. Also es waren 85% Männer. Es waren auch der Altersdurchschnitt eher jungen und urban und Techafin. Das hat man dann perfekt gehabt. Und das andere war am 25. Mai dieses Jahr gab es die DSGVO. Ab dem Zeitpunkt gab die Shufa dann weniger Daten hier. Das ist relativ witzig in dem Sinn, weil wenn sie ein Unternehmen in Deutschland geben hätte sollen, dass sich auf die DSGVO vorbereiten hätte sollen, sollte wer es wahrscheinlich dieses Unternehmen gewesen, oder? Das ist eines der großen Unternehmen, die persönliche Daten haben und die haben es quasi verpeilt, der muss sich die Weihnachtsbosskarte über irgendwas rausschicken kann. Das lag auch daran, dass der hessische Datenschutzbeauftragte dazu wenig nachgegangen ist, aus unserer Sicht. Das heißt, die Shufa hatte da ca. 7 Monate lang einen Freilauf Daten nicht zu liefern, die sie eigentlich liefern hätten sollen. Das war ein Problem, wie wir weniger Daten spenden hatten oder von diesen 3000 nicht alle verwenden konnten. Das ist das Datensample über was wir jetzt sprechen. Wir haben das Datenschutz also die von das ursprüngliche Ziel, dass wir 5000 perfekte Datensätze hätten, wo wir das wirklich schön nachrechnen könnten. Mit einem nachmodellierten Shufomodell, das sind wir noch nicht, aber wir haben ein paar lustige Feindings in Daten gefunden. Das war jetzt mal so, wie die Auskunft war vor der DSGVO. Das war relativ übersichtlich, da sieht man verschiedene Brancheskurs und das war dann ab dem 25. Nein, das war eher mager. Das ist ein Schritt war, was sind die harten Faktoren, die da reinkommen und das sind immer so variablen, wo wir dachten, die könnten zutreffen. Da sind jetzt zwei Ausreißer dabei, die möchte ich kurz näher zeigen. Das eine ist ein Insolvenzverfahren und das zweite ist Zwangsfeindungen. Die haben einen relativ harten Einfluss, das ist eine logaritmetische Skala, das heißt, ohm ist hunden, unten ist null und das zweite Strichel unter null ist dann bei 90. Das heißt, wenn es runter geht, geht es wirklich runter. Und wie diskutieren kann für Kreditwürdigkeit, wo die Sinn machen? Wir haben das Problem an Sicht 95% vom Score erreichen circa ¾ Leute und in diesem Fünf-Bereich von den Scores oder für 75% der Leute wird dann halt entschieden, bekommt man ein Mitvertrag oder bekommt man ein Handyvertrag. Obwohl das Score relativ hoch ist und die Variablen, die dafür herangezogen werden um diesen Feinheiten zu berechnen ist das unsere Sicht arschwammig bzw. wir haben auch oft gesagt, dass der Datenfehler wahrscheinlich drinnen sind. Ein Fall war zum Beispiel, es gibt schlechtes Kurs ohne negativ Merkmale. Das betraf jetzt zum Beispiel 20 Leute, die überhaupt keinen negativen Eintrag hatten und einen negativen Score bekommen. Hochgerechnet auf die deutsche Bevölkerung betrifft, würde das ca. 100.000 Leute betreffen. Die Sache ist an November selber nie Probleme gehabt hat mit einer Finanzierung oder Zurückzahlung und wird man auch nicht daran denken, was drinnen ist. Weil man denkt, man hat eigentlich alles richtig gemacht und das ist jetzt 100.000 aus meiner Sicht ist das relativ eine hohe Zahl. Nächste Schritt wäre es gibt der angeblich genaues Kurs ohne Daten, das heißt 75% der Leute haben weniger als 3 Datenmerkmale. Das ist jetzt für eben ob man Mitwohnungen bekommt oder nicht. Relativ dünne Suppe, würde ich mal sagen und dann drittenteil war noch es gibt verschiedene Versionen für das Kurs. Das heißt es gibt einen Bankenskur, da gibt es eine Version 1, da gibt es eine Version 2, da gibt es eine Version 3, man weiß nicht welche Banken genau welche Score wir anfragen und was das dann auch bedeutet. Es gibt dann quasi Diskriminierung zwischen den verschiedenen Scorewerden und aus meiner Sicht diese Scoreversionen zeigen schön auf was im Hintergrund passiert. Also es gibt Unternehmen nicht offizielles Modell drauf und dann verwendet sich jemand dritter der sagt ja da ist das Score, deswegen kriegst du A oder B nicht. Und das ist quasi so eine Kette die halt intransparent ist und jeder in die der Kette sagt der erste sagt ich sammle ja nur die Daten, ich mache gar nichts damit. Der zweite sagt ja ihr habt die Daten von dem bekommen berechnet dann, das geben wir aber nicht zu wie das berechnet und der dritte sagt ja ihr habt nichts berechnet ihr behaltet mir nur die Berechnung und bewertet dann ob der Konsument oder die Konsumente in das Produkt haben kann. Das ist ein großen Problem weil in der Kette auch Fehler passieren ein Beispiel ist z.B. jemand bezahlt den Kredit zurück und dann nachdem er den Kredit zeitgemäß und ohne Probleme zurück bezahlt hat die Zurückbezahlung in der Kette nicht reportiert wird. Wenn die Person das nächste mal wenn ein Kredit anfragt dann sagt das System, hey Alter du hast ja nur ein Kredit laufen deswegen kriegst du eine negative Bewertung weil du schon einen Laufen hast. Und keiner in der Kette ist zuständig und keiner der sich darin informieren möchte hat dann Zugriff das nachvollziehen kann und das für Daten sind sich abgespeichert und das ist einer der großen Kreditpunkte dass man dann bezahlen muss für das dass man reinschauen müsste dass man negativ bewertet wird wer irgendeiner in der Kette am Bock schossen hat. Das ist im Prinzip eigentlich eine Art von Wegelagerei aus meiner Sicht. Dann haben wir noch z.B. die Variablen Altergeschlecht und Umzüge war spannend bei Alter und Geschlecht gibt es ein Hinweis darauf dass es Diskriminierung gibt wo Leute ja nichts dafür können dass sie A jung sind oder B männlich das war noch eine Umzüge weil die negativ einwirken also die Anzahl der Umzüge kann man sich anschauen dass die Grafige öfters man umzieht dass du gehst runter und da gibt es einen Unterschied ob ich umziehen muss weil ich quasi von Problemen davon lauf oder weil ich einen Vertreterjob hab wo ich quasi meine Firma minötig dass ich halt alle drei Monate quasi in einem anderen Bundesland bin und die Person die jetzt Vertreter war kann sich aber nicht dagegen wehren und sagen hey Alter meine Umzüge sind quasi alle nach Bayern muss oder was auch immer da hatte ich schon selber Pech und eine eines der schönsten anderen Finings war noch wir sehen hier drei Muster und das ist auf der einen Seite die Anzahl der Kreditkarten mit die Anzahl der Bankkonten und dann die Anzahl der Mobilfunkverträge und wir sehen hier sehr schön überall der Peak also der beste Score ist bei der Zahl 2 das heißt wenn man 2 Kreditkarten hat 2 Bankverbindungen und 2 Handyverträge dann ist das Score wahrscheinlich am höchsten jetzt würde ich natürlich nie sagen dass man den Score so geben könnte weil das würde in dem Raum ja auch keiner machen aber man könnte sagen 2 ist besser als 1 das gleiche wird es aber in umziehen sollte man halt schauen dass man wenn man nur temporär wohin sieht das vielleicht auch nicht meldet sondern es ignoriert, anderer Trick wenn man halt ein Kind hat ist das anscheinend positiver das dauert natürlich meistens nebenbei gab es seit nobem 30. Oktober eine Vorstellung von einer Studie Verbrauchergerechtes Cohen vom Sachverständigenrat des Justizministeriums das ist insofern interessant wie die relativ klare Aussage gemacht haben, dass eigentlich die Kriterien mal die Gewichtung offen gelegt werden sollten dass auch das Ministerium das eigentlich dafür zuständig ist und es gab da harte Aussagen dazu die dann nur verstärkt worden sind durch die frechenden Rundfunk und Spiegel online, das am 28. November rausgekommen ist die haben die Datenanlöse publiziert und es war ein relativ gutes Medienecho und die Schufe hat sie auch wieder ausgezeichnet mit neunseitigen Schreiben woraus sie aber nicht zitiert werden wollte das ist halt Schufe das war jetzt noch ein Minister in Bale vor der Schufe auf zum Meer Transparenz und das war im Detail Transparenz beim Scoring und was das dann bewirkt hat war die Ankündigung zu dieser elektronischen Auskunft die jetzt dann erfolgen sollte, dass jeder benutze dann wenn er die Auskunft stellt ab 2019 ein Brief nach Hause geschickt bekommt mit einem Code, wo er dann online einen Score abfragen kann einmalig jetzt wenn wir schon mal dabei sind dass wir das einmalig machen können dann könnte man sagen wenn das schon einmal funktioniert könnte man ein Account dazugeben dass man das regelmäßig machen kann abfragen könnte unter die Möglichkeit hat die Daten zu korrigieren und dass wenn eigentlich unsere Forderungen das werden wollen das Transparenz erst wie wird der berechnet was sind die merkmalige Wichtungen und wie kann man seinen Datenbestand anschauen oder dass man Notification bekommt hey Alter du hast einen negativen Score bekommen wegen von Firma A dass ihr A das weiß und B falls das falsch sein sollte ihr reale Möglichkeit habt diesen zu verbessern das wäre eine intensiver Arbeit bis das mit den ganzen Firmen an den Strand kriegt dass irgendwie in dieser Verarbeitungskette der Fehler dann ausgebügelt wird das war jetzt mal kurz was wir hoffen was in Zukunft kommt wir sagen immer Schufer ist der Anfang und nicht das Ende und wir werden dranbleiben und das Ganze läuft hoffentlich in den Finanzdaten gibt wir haben noch eines Leid zur Schufer meine Lieblingsleid hier raus die Frage ist natürlich wie kann man die Schufer dazu kriegen in Zukunft wieder mehr Daten rauszugeben die geben jetzt nicht alle Daten raus die sie über einzelne Personen haben sondern tatsächlich nur Daten die sie anderen geben und wir gehen davon aus dass eigentlich die Schufer viel mehr raus geben müsste nach der DSGVO und es gibt glaube ich zwei Wege die Schufer dazu zu zwingen mehr Infos wieder rauszugeben das eine ist eine Klage auf Basis von DSGVO das andere ist natürlich eine gesetzliche Verpflichtung deswegen ist auch wichtig dass die Ministerin Bali das jetzt gefordert hat wir hoffen, dass da was kommt und das wird jetzt ein richtig smoother Übergang das wird dann nämlich ein Gesetz idealerweise und dieses Gesetz würde dann auch noch mehr werden und ja, gut, ne? und auch dafür haben wir was parat Stefan genau, offene Gesetze am Anfang wurde ja schon gesagt Gesetze, wo findet man die eigentlich wenn man nach einem Gesetz im Internet sucht dann findet man die auf unterschiedlichen Seiten zum Beispiel Buser oder De Jure die offizielle Seite heißt gesetzeiminternet.de da ist das im Internet ganz wichtig sonst weiß man ja gar nicht genau wo man UL eingebt und das ist eine Seite, wo da findet man alle Bundesgesetze und Verordnungen und zwar in der aktuellen Version sozusagen einigermaßen aktuell es dauert manchmal ein paar Tage, bis da die aktuelle Version erscheint aber wie tritt eigentlich ein Gesetz in Kraft wie kommt das eigentlich dahin und da habe ich das jetzt mal für das Publikum aufbereitet normalerweise wenn man sucht Gesetzgebungsvorhaben Gesetzgebungsprozess dann findet man da solche Floatshots ein Git Remote Prozess quasi darzustellen also es gibt dann quasi ein Branch von den Ministerien das ist der Referentenentwurf der geht dann an die Bundesregierung die das im Bundeskabinett beschließt und das geht dann an den Bundestag dann gibt es zwischen Bundestag und Bundesrat vielleicht da ein paar Commits, diese Remotes tauschen also ein paar Commits aus und dann geht das wenn das dann beschlossen wurde im Bundestag dann unterschreibt das die Bundesregierung also Gezeien sozusagen und dann geht das an den Bundespräsidenten der das auch nochmal unterzeichnet und dann wird das in den Production Release Branch der Bundesrepublik Deutschland gemirkt und wird dadurch quasi Gesetz dadurch tritt das erst ins Kraft erst wenn es auf diesem Production Release Branch ist es tatsächlich in Kraft getreten vorher ist das noch nicht passiert bisschen ist jetzt aber die Frage wo ist denn dieser Production Release Branch ja wo ist das Gitlock dafür und das Gitlock für diese Commits auf dem Branch das ist das Bundesgesetzblatt das Bundesgesetzblatt auch BGBL nicht zu wechseln mit dem bürgerlichen Gesetzbuch BGB ist das Verkündungsblatt der Bundesrepublik Deutschland es heißt auch Verkündung und nicht Verkündigung Verkündung das ist das religiöse Prophezeiungen und Gesetze die werden werden verkündet alles anders wird verkündigt und dort tritt es dann auch erst in Kraft wenn es quasi ausgedruckt und dort veröffentlicht wird das sieht dann zum Beispiel so aus dass das erste Bundesgesetzblatt der BRD am 23. Mai 1949 dort wurde das Grundgesetz dann veröffentlicht und heutzutage sieht das leider immer noch genauso aus und zum Beispiel so das ist jetzt ein Beispiel das Gesetz zur Einführung des Rechts ist auf Ehe Schließung für Personen gleich ein Geschlechts das ist ein sogenanntes Artikelgesetz und diese Artikelgesetze die im Bundesgesetzblatt veröffentlicht werden die verändern bestehende Gesetze das heißt es ist sozusagen ein Patch wenn man sich das hier anguckt dann steht da das bürgerliche Gesetzbuch in der Fassung der Bekanntmachung von Sononon wird ist wie voll geändert dem Paragrafen 1309 und da unten steht dem Paragraph 750 Absatz 1, Satz 1 wird wie folgt gefasst die Ehe wird von 2 Personen verschiedenen oder gleichen Geschlechts auf Lebenszeit geschlossen also ich als Nerd denke immer das ist furchtbar kompliziert zu lesen, ich weiß ja gar nicht was der Kontext ist und ich kenne das ja eher so und das macht auch für mich viel mehr Sinn weil dann sehe ich halt irgendwie was wurde hinzugefügt was ist weggekommen aber die Problematik das ist das quasi Menschen lesbar ist leider noch eine andere offene Gesetze hat sich eher mit den rechtlichen Problematiken befasst denn das Bundesgesetzblatt wenn man das im Internet sucht dann findet man die Seite bgbl.de und die sieht folgendermaßen aus hatte noch so ein schön 2006 Glossy Reflektion, finde ich sehr gut und wenn man sich das genauer anguckt, dann sieht ich sich als erstes das hier Bundesanzeigerverlag aha, das ist also wem gehört der denn, was ist das denn Bundesanzeigerverlag ist mittlerweile ein privater Verlag das er hat mal den Bund gehört wurde 1998 aber teil privatisiert 2006 wurde er dann vollständig privatisiert und er gehört zu DUMOR Mediengruppe die DUMOR Mediengruppe, sie kennen das vielleicht von der Billiner Zeitung, den Billiner Kurier dem Express in Köln oder Hamburger Mopo, also alles Qualitätsblätter und diese DUMOR Mediengruppe, die bringt auch unsere Gesetze heraus wenn man dann ein bisschen auf der Webseite weiterklickt dann findet man den kostenlosen Bürgerzugang kostenlos finde ich immer super klicke ich sofort drauf und dann grüßt mich erstmal so ein großes grünes ein großer grüne Box und da drin steht die elektronische Version des Bundesgesetzplatzes genießt generell Datenbankschutz nach §87a folgende Urheberrechtsgesetz das heißt der Bundesanzeigerverlag beansprucht Datenbankschutzrecht auf die Sammlung der Bundesgesetzblätter die er veröffentlicht jedes einzelne Gesetzblatt ist ein amtliches Werk nach §5 Urheberrechtsgesetz und genießt kein urheberrechtlichen Schutz aber die Sammlung dieser Gesetzblätter könnte man sagen dass das ein Leistungsschutzrecht ein Datenbankleistungsschutzrecht ist der Datenbankschutz und der wird auf jeden Fall hier sehr explizit und auch ganz oben auf der Seite direkt unübersehbar vom Bundesanzeigerverlag beansprucht wenn man dann so ein bisschen weiter versucht sich die durch die Gesetzesblätter dazu klicken, merkt man es gibt keine Suche man merkt es gibt kein OCR von PDFs vor 1998 da sind das dann alles einfach nur Bilder die PDFs sind gegen Copy und Paste und Ausdrucken geschützt weil also wir wissen wie man das vielleicht wegbekommt aber der normale Nutzer der vielleicht einfach schnell um das rauskopie und pasten will sagt dann der eine oder andere PDF-Reader das geht jetzt nicht weil da irgendwie man Passwort eingeben muss und die Gesetze seiten selbst enthalten auch Werbung im Futter also nicht für McDonald's sondern da steht dann hier auf BGBL.de könnt ihr das alles hier angucken und da ist noch ein Logo vom Bundesanzeigerverlag also am privaten Unternehmen ich finde es ein bisschen unwürdig für unsere Gesetze wenn er im Futter dann noch extra was draufgetan wird was hat nichts mit dem Gesetzgebungsprozess selbst zu tun hatten aber man bekommt das natürlich auch anders man kann tatsächlich beim Bundesanzeigerverlag ein Online-Archiv im halbjahres Abonnement abschließen das kostet dann schlappe 99 Euro pro halbes Jahr dann bekommt man auch eine Suche die Dokumente sind auf einmal ausdruckbar es lassen sich Textstellen entnehmen wie sie so schön sagen also der Copy und Paste das ganze gibt es auch als E-Mail Newsletter, wenn ein Bundesgesetzbad rauskommt dann kostet dann auch das halbjahres Abonnement damit man dieses Gesetzbad per E-Mail bekommt 108 Euro etwas seltsam, wir wollten es genauer wissen wie hat denn der Bundesanzeigerverlag dort, wie ist er denn da rangekommen an diese Privatisierung und wir haben versucht diesen Vertrag anzufragen dass der Vertrag mit dem Bundesanzeigerverlag die Anfrage findet auf Frag den Staat und da ist ganz interessant ihr seht, es ist viel geschwärzt also quasi fast die Hälfte würde ich sagen wir haben da Widerspruch eingelegt das läuft noch die Begründung für diese Schwerzungen die Schwerzungsstellen da geht es um die Laufzeit des Verlages das in Kraft treten des Vertrags das in Kraft treten des Vertrags wurde geschwärzt und wie die urheberrechtliche Position dieser Gesetzbetter ist das konnten wir gar nicht herausfinden das wurde vom Bundesjustizministerium geschwärzt und da heißt es dann die Geheimhaltungsinteressen wegen der unmittelbaren Auswirkung auf die wirtschaftliche Situation des Bundesanzeigerverlages unsere Reaktion war diese Bundesgesetzblätter alle auf offene Gesetze zu veröffentlichen Hura das haben wir zusammen mit Johannes Filter Arne und ich gemacht eine Seite da könnt ihr die Bundesgesetzblätter durchsuchen ihr könnt sie auch herunterladen es gibt Textversion und damit das Justizministerium das auch findet haben wir auch das noch im Internet veröffentlicht also unter offenegesetze hier der Startup-Page-Feature-Vergleich der kostenlose Bürgerzugang hat überall Nein wir haben überall Ja die Dokumente sind druckbar wir stellen Tar Balls für die Gesetzbetter über Jahre aber auch für das gesamte BGBL1 und auch die BGBL2-Version zur Verfügung das sind dann 6 Gigabyte PDFs wenn ihr die runterladen wollt dann werden wir sagen freie Verweiterverwendung alles in Ordnung wir haben auch stabile Links BGBL hat leider keine stabilen Links auf seine PDFs das sind alle Session-Links da kann man nicht mehr direkt darauf verweisen wir haben RSS-Feeds eine kleine API und natürlich alle Funktionen kostenlos die Reaktion die Reaktion wurde sehr gut aufgenommen habe ich auch gerade hier gehört und auch die Hura-Community hat das sehr gut aufgenommen dass sich da jetzt so etwas ergeben hat offenbar gab es da sehr lange Stillstand in der Rechts-Community und sie haben das sehr wohlwollend aufgenommen und jetzt kurz vor Weihnachten hat auch Frau Bali, da ist sie schon wieder gesagt, dass sie also die FAZ-Titelt Bali nimmt du-more-Verlag das Gesetzblatt weg das klingt jetzt sehr hart aber es ist schon länger eine E-Verkündung also eine elektronische Verkündung des Bundesgesetzblattes geplant das ist allerdings erst ab 2021 der Fall das bedeutet, dass dann das Gesetz nicht mehr ausgedruckt werden muss damit es im Krafttritt, sondern dann muss es nur noch online veröffentlicht werden aber was neu war in dem Artikel dass auch die bestehenden Bundesgesetzblätter durchsuchbar und online dann zur Verfügung gestellt werden vom Gesetz, also von der Regierung selbst vom Staat und das ist auf jeden Fall ein Fortschritt ich hoffe, wir haben dazu beigetragen die Regierung da zu forcieren ganz interessant ist auch, dass die Julius GmbH, die erste war diesen Tweet von dem FAZ-Reporter die Julius GmbH, die macht ungefähr das gleiche nur mit Urteilen und die müsste man sich auch mal genauer angucken also wie geht es weiter wir warten auf eine Klage wir sind gar nicht sicher, weil eigentlich finden wir nicht, dass wir was falsch gemacht haben aber wir gucken mal, wie das beim Bundesanzeiger Verlag aufgenommen wird oder ich liege da schon was im Briefkasten wir werden das BGBL noch ein bisschen weiter aufräumen wir haben festgestellt, es ist auf der BGBL Seite selbst, da sind Metadaten auch nicht vollständig, auf falsch Datumsangaben sind korrupt, das heißt Datum funktioniert gar nicht, kann man gar nicht pasen und natürlich gibt es noch sehr viele andere Gesetzes- und Amtsblätter also es gibt noch zum Beispiel das gemeinsame Ministerialblatt das auch noch sehr wichtig ist für die Bundesverordnungen aber es gibt noch viele andere auf vielen verschiedenen Ebenen, auf Länderebene und auch auf Gemeinderebene dort gibt es auch Amtsblätter und die sind wahrscheinlich alle viele in den Händen von privaten Verlagen oft sind sie öffentlich verfügbar in irgendeiner Form oft muss man aber auch dafür zahlen und da sollten wir gemeinsam weiter daran arbeiten, dass so was verfügbar wird da könnt ihr auch gerne selber aktiv werden ansonsten war das jetzt Openschufer und offene Gesetze der Open Knowledge Foundation Deutschland die Klammer ist so ein bisschen dass wir versuchen die Regeln, die sehr alteingesessene Unternehmen uns versuchen aufzuoktreuieren ein bisschen aufzubrechen, die Schufer und auch der Bundesanzeigeverlag sind sehr alte traditionelle Unternehmen das wurde schon immer ausgedruckt das wurde schon immer so erfasst aber ich glaube wir haben einen neuen Anspruch an Transparenz und auch an Durchsuchbarkeit und Wendbarkeit und das versuchen wir bei der Open Knowledge Foundation ein bisschen voranzubringen, vielen Dank in anderen Räumen waren die immer schon an Dankeschön für den Talk sehr interessant, ich bin mal kurz dazu gestoßen wir haben noch 10 Minuten für Q&A bitte an den Mikrofon anstellen Mikrofon Nummer 2 bitte es gab Anfang Mitte des Jahres ging um das durch die DSGVO das gesamte Geschäftsmodell der Schufer betroffen sein könnte ich habe jetzt nicht verfolgt wie es sich weiterentwickelt hat, ist da noch was draus geworden hat mittlerweile ein Datenschutzbeauftragter gesagt, nee ist alles okay oder es gibt die Schufer noch also zuständig für die Schufer ist der hessische Datenschutzbeauftragte in einer Konsequenz gegen die Schufer vor, wie es machen müsste aus unserer Sicht ich glaube, wäre die Schufer in einem anderen Bundesland angesiedelt, dann säßt es jetzt ein bisschen anders aus tatsächlich die eine Veränderung die es gab durch den Datenschutzbeauftragten ist eben diese elektronische Auskunft also die Schufer hat vorher nur Post zugesandt hat jetzt zugesichert an den Datenschutzbeauftragten dass sie es ab Januar dann aber auch wirklich per E-Mail machen beziehungsweise per Post ein Zugangscode ist gar nicht per E-Mail ein Zugangscode per Post und dann bei denen online das ist so die eine Veränderung und tatsächlich was so alles weiter angeht haben wir bisher nicht gehört, dass der Datenschutzbeauftragte in Hessen Probleme damit hätte im Gegenteil, wir haben eher gehört dass der ein Problem mit oben Schufer hatte da muss man ja sagen, das Geschäftsmodell der Haupteinnahmequelle der Schufe ist nicht, dass die persönliche Einzelpersonen nötig, dass sie den online Zugang haben, sondern den machen ja Datenverkauf von Firmen Danke, Mikrofon Nummer 2 nochmal Ich wollte mal fragen, wie das Status ist, sammelt ihr für oben Schufer noch Daten? Aufgrund dieser wirklich sehr sehr verkürzten Auskünfte, die es zur Zeit gibt bringt uns das nicht so viel also die Auskünfte die halt einige Menschen derzeit bekommen besteht tatsächlich dann teilweise nur aus einer Zeile oder noch nicht mal und das sind dann keine Daten, die dann sinnvoll in unser Modell derzeit einfügen kann, deswegen pausiert es gerade, wir hoffen aber dass wenn wir ordentlich Druck aufgeübt haben auf die Schufer und da wieder ordentliche längere Auskünfte kommen, wir damit dann wiederum was anfangen können. Wir hoffen es wird überflüssig, weil es Justizministerium eingreifen wird. Mikrofon Nummer 1 bitte Hallo, ich habe auch eine Frage an die Macherform oben Schuferprojekt und zwar habt ihr ja nun da eine Menge sehr wichtiger persönlicher Daten bekommen und dann ist ja auch die Datenschutzgrundverordnung in Kraft getreten und ich würde gerne mal in einem Blog in eurer eigenen Erfahrung haben wie ihr damit umgegangen seid selber Datenschutzkomplein zu sein. Also wir hatten eine rechtliche Unterstützung die Daten gingen auch nur jetzt dann zwei Medien Unternehmen raus extern die da mitgearbeitet hat aber auch Knowledge Foundation oder Algorithm Watch und zum Partner. Genau, das ist der Datenschutzbeauftragte Nico Herting der hat das übernommen man muss nochmal zu den Daten dazu sagen wir waren nicht interessiert an den Namen oder so, die waren in der Regel nicht dabei es sei denn Leute haben beim uploaden Fehler gemacht und ausversehen ihre Daten also ihren Namen und so sehr einfach identifizierbare Daten mitgeschickt das heißt idealerweise haben wir diese Daten überhaupt nicht, das heißt natürlich nicht wenn man so ein Schufersblatt hat dass das komplett anonym ist also es ist natürlich eine bestimmte Detailtiefe dass man mit bestimmten Verfahren sicherlich das rückschließen kann auf einzelne Leute wir veröffentlichen diese Daten zum Beispiel auch nicht das ist sicherlich also ein es wurde häufig an uns rangetragen auch von anderen Forschern, dass sie gerne mit diesem Datensatz arbeiten würden das machen wir derzeit aber so nicht das geht einfach nicht mit diesem Datensatz wir haben noch eine Frage aus dem Internet habt ihr vor die Gesetzesblätter als Code Patch Version zu veröffentlichen beziehungsweise arbeitet ihr an einem maschinenlesbaren Datenformat für Gesetzesänderungen also momentan haben wir uns nur auf die rechtliche Problematik des ganzen gestütz es gab mal ein Projekt namens BundesGit was tatsächlich versucht hat die Bundesgesetze auf GitHub zu versionieren diese Nachversionierung ich habe das selber gemacht und das war sehr viel Handarbeit zu Reverse-Engineeren wie diese Komiz zustande kommen wir haben aber hier so ein Legal Hack Day gehabt so ein Hack Workshop in so einer Assembli und wir haben mal geguckt ist es möglich diese Patche aus den Bundesgesetzblättern zu extrahieren mit neuren Natural Language Processing Sachen wie man die PDFs auseinandernehmen und dann zu gucken kann man herausfinden welcher Paragraf da wie angepasst wurde leider gibt es halt sehr viele Varianten wie das da stehen kann wenn man das von Hand macht dann dauert das sehr lange und es ist sehr viel Aufwand es gibt da Seiten die machen das zum Beispiel Buse und wir würden das jetzt das BundesGit vielleicht gibt es da nochmal ein Neustart aber das ist kompliziert und das werde ich ja gerne nicht so sagen von Reverse-Engineered wie Open Shufa sondern dass das auch vom Gesetzgeber selber so passiert dass man da herausfinden kann was hat sich dann wirklich geändert das würde wahrscheinlich auch den Gesetzgebungsprozess vereinfachen die Leute tippen das immer noch alles in Wörterteilen ein und sagen wir würden das jetzt gerne so ändern anstatt das Gesetz selbst zu ändern und sozusagen zu versionieren wird dann diese Änderungsgesetze gemacht wird sich das irgendwann mal ändern ich habe mir ein paar Juristen gesprochen die sehen das jetzt in absehbarer Zeit nicht also auch diese E-Verkündung wird eher so weiter laufen wie wir das in den aktuellen menschlichen lesbaren Patchen gesehen haben also gibt glaube ich nicht so viel Fortschritt es sei denn wir machen das wirklich selbst es ist aber viel Aufwand man muss aber schon dazu sagen wir sind natürlich die Einzigen die diese Art hassen auch die Verwaltung hasst es und auch Bundestagsabgeordnete hassen das gut wie niemanden der diese altergebrachte Form eigentlich wirklich gut findet es gibt ein Projekt im Justizministerium das heißt E-Gesetzgebung alles E und die arbeiten ein bisschen daran aber wenn ich das richtig verstanden habe geht es da darum vor allem Plug-in für Word zu schaffen super Mikrofon Nummer 2 nochmal bitte mich interessiert wo die Daten wo die Gesetze herkommen die auf offene Gesetze dann jetzt gelandet sind hat die jemand von Hand aus diesem Bürgerzugang gekratzt und dann zusätzlich noch OCR die die nicht schon OCR waren und wenn das so ist habt ihr die Werbung raus entfernt also ist ja keine Werbung mehr drin aber wo das jetzt genau herkommt das können wir leider jetzt nicht sagen und wir haben noch Zeit für eine Frage Mikrofon 1 bitte Hi guter Vortrag ich war gerade in den Lightning Talks und habe gehört von einem Projekt um Gerichtsentscheid zu veröffentlichen habt ihr das auch schon irgendwie mitbekommen oder arbeitet ihr mit dem zusammen Open Legal Data es gibt da glücklicherweise in diesem Bereich einige wirklich coole Leute die versuchen nicht eben nur Gesetze sondern auch Urteile an die Öffentlichkeit zu bringen und wir sind da schon in Gesprächen wie man sich da so verklagen lassen könnte super herzlichen Dank nochmal nochmal für die Speaker