 Ich bin André. Ich bin von der Wikimedia Foundation und eine Sache, die ich gerade versuche, rauszufinden, ist, wie man Aktivitäten misst. Menschen im Tech-Teil unserer Community. Ihr wisst wahrscheinlich, dass Wikimedia ein riesiges Projekt ist, mehr als 900 Websites. Es gibt viele Bereiche, wo man was zu beitragen kann, im technischen Sinne. Im Moment versuchen wir da so ein bisschen Überblick zu gewinnen. Und selbst das ist schwierig. Es ist eine komplizierte Sache. Und ich würde in diesem Talk kurz zeigen, was wir bis jetzt schon implementiert haben und was wir noch implementieren wollen. Und vielleicht noch einen kleinen anderen Abriss zu der Problem- und der Komplexität. Das ist mehr so ein Fall, das ihr interessiert seid, oder vielleicht wollt ihr auch mit Technica Matrix oder Statistik ein bisschen spielen. Was wir jetzt gerade haben, ist hauptsächlich zum Thema Git Code Repositories. Und wir benutzen dazu hauptsächlich Garrett für unser Code Review. Wir haben da unsere eigene Instanz, Garrett.wikimedia.org. Und unser Ding hier ist wikimedia.bitter.dio. Wenn ihr schon mal Elastix-Search, das Gewarner gesehen habt, dieses Standard-Ding, das werdet ihr schon mal gesehen haben. Das Ganze ist komplett FOSS. Das ist ein Projekt der Linux Foundation. Könnt ihr finden unter chaos.community, chaos.doubles. Die Corebase ist öffentlich auf GitHub. Und wenn irgendein anderes FOSS-Projekt das für sich selbst nutzen möchte, könnt ihr das machen, kein Problem. Wir haben das gehostet von Bitter. Das kann auch jeder selbst machen, der ein paar Statistiken über sein FOSS-Projekt haben möchte. Und es gibt noch Dokumentationen zu dem Thema Community Metrics bei mediawikimedia.org. Ich glaube, ich habe hier sogar Screenshots, denn ich vertraue dem Internet bei Konferenzen pauschal nicht. Ich könnte es euch theoretisch auch live zeigen. Also das ist die GitHub-Seite des Chaos-Projektes, des Linux Foundation. Das hier ist, ich hoffe, der Zoom ist ausreichend. Wikimedia.bit.io. Das ist die Überblick-Seite. Dort seht ihr hier oben Navigation. Und ihr kriegt ein paar grundlegende Statistiken über die aktivsten Leute im GitHub-Repository, welche Organisationseinheiten vertreten sind. Hier seht ihr Wikimedia-Foundation, individuelle, einzelne Individuen. Hallo Welt, Wikimedia Deutschland. Das ist die Contributor-Base, die wir haben, sortiert nach Organisationen. Und hier unten haben wir noch einen großen Haufen mehr Statistik-Gits-Garret-Mailing-List. Wir indexieren einen Haufen Zeug. Wir indexieren auch unseren Issue-Tracker, also ein bisschen, das ist Fabrikator. Und Zusammenfassung davon gibt es auf mediawikimedia.org. Wenn ich jetzt zum Beispiel zu Garrett rüber gehe, auf die Überblick-Seite, wenn wir benutzen Garrett für unser Code-Review, dann gibt es da eher spezifischere Statistiken. Und das Ding ist Elastic Search, beziehungsweise Kibana basiert. Wenn ihr also auf irgendeinen Wert klickt, dann könnt ihr auch nach diesem Wert filtern. Wenn wir jetzt also die Pitchart hier nehmen und ich nur die Zahlen für unabhängige Freiwillige haben will, klick ich drauf und die Zahlen ändern sich. Natürlich ein bisschen geringer. Und hier oben sieht man dann, dass ein Filter angewendet wurde. Mit dem Kram kann man dann weitermachen. Hier kann man noch filtern nach Code-Repository, zum Beispiel media-wiki-core, ich da draufklicke, wird es nochmal gefiltert, danach. Und so kann man immer tiefer in der Statistik rum bohren, bis man das gefunden hat, was man haben möchte. Da ich nur 15 Minuten habe, es gibt noch viel, viel mehr Zeug, was man daraus finden kann. Zum Beispiel über Reviews und Patches in Garrett, wie lange Patches offen waren und der Median davon. Hier ist ein ganzes Kram, den man vielleicht wissen will, um rauszufinden, wie rund das Projekt läuft in Sachen, sowohl das Hinzu-Zins von Freiwilligen und auch des Feedbacks für Freiwillige, warum es Code-Reviews und auch Engagement, dass man denen dann gerne geben möchte. Genauso Bereiche, wo man sich vielleicht verbessern könnte. In der Wikimedia Foundation haben wir zum Beispiel offensichtlich die Engineering-Teams. Und manche von denen sind die Maintainer für gewisse Code-Repots, sodass man das dementsprechend nach Repos filtern kann und dann sehen kann, wie sich zum Beispiel, oder man kann sehen, dass Patches von Freiwilligen oft länger im Review hängen, als welche von persönlich bekanntem Mitarbeiter kommen. So Sachen, die man halt schon annehmen kann. Aber jetzt hat man richtige Daten dafür. Es gibt doch ein paar Einschränkungen. Zum Beispiel benutze ich persönlich im Allgemeinen nicht die Git-Statistik, denn Garrett ist wo der Code-Review passiert. Und was, wenn ein Patch einmal in Garrett vorgeschlagen wurde, der akzeptiert und gemerged wurde, ins Git-Repot, da sieht man das auch im Git. Aber weil unsere komplette Software Open-Sources, ziehen wir natürlich auch ein Haufen Git-Kram aus anderen App-Stream-Projekten, denn wir benutzen viele Software, die woanders erfunden oder maintained wird. Die Git-Statistik enthält auch Aktivität, die wir importiert haben über das Repo von anderen Firmen, die wir aber nicht durchgeführt haben. Es gibt noch ein paar mehr Einschränkungen. Ich hoffe, die sind alle hier aufgelistet auf der Community-Metrics-Seite von MediaWiki. Irgendwann musste ich mal eine Sektion eines Dinge, die ich überraschen könnten, einführen. Die Seite hat auch ein paar Beispiele in Richtung, wie kann ich die häufigsten Fragen, die so von interessierenden Leuten kommen oder Leute, die mit uns arbeiten? Oder ein jährlichem Report, wie machst du das am besten? Willst du wissen, wie viele Freiwillige du dieses Jahr in der Codebase hattest und so weiter? Also, das ist was wir haben. Das waren hier die Screenshots, weil es das Wi-Fi zickt. Und dann die Frage, was ist Patchwork? Spoiler, im Prinzip alles andere. Denn das war jetzt das Thema Git und Git Repos und Code Review durch Garrett. Aber es gibt noch viel, viel mehr Zeug, was vor uns so läuft in Sachen technische Weiträge zum Code. Es gibt GitHub. Wir haben ein paar Projekte, die nicht das Wikimedia-Git und Garrett benutzen, denn sie wollen lieber GitHub haben. Es läuft ein bisschen anders und es gefällt ihnen besser so. Wir tracken einiges davon, aber wir müssen zuerst unseren Weg, diese ganzen Repos zu finden, verbessern. Denn sie sind nicht alle unter derselben Organisationseinheit eingeordnet. Und zu dem kommt, was ich euch gerade gezeigt habe. Dann definieren wir hier in einer öffentlichen JSON-Datei, was indexiert wird. Das wird auch von der Community-Metrex-Seite aus verlinkt. Und wir definieren grundlegend, was wird indexiert. Das ist eine langen Liste, wie ihr sehen könnt. Auch ein paar Mailing-Listen. Es gibt viel Code, der viel Auffilm-Wiki ist, in den Wikisite. Es gibt viele Gatches, zum Beispiel kleine JavaScript-Dinger. Und die sind relativ häufig. Zum Beispiel Wikimedia-Comments oder das Englisch oder das deutsche Wikimedia. Die haben viele kleine Gatches, standardsmäßig freigeschaltet. Was manche Sachen einfacher macht, zum Beispiel ein häufiger Gadget-of-Comments, ist eine Kategorie zu einem Foto oder einer Kategorie hinzufügen. Also einfach, wenn man das Gadget benutzt und das standardmäßig an. Es gibt Lua-Module, es gibt Vorlagen, zum Beispiel für die Infoboxen, die man in vielen Artikeln sieht, die an der Seite. Wenn du also ein Wikimedia-Artikel für eine Person anguckst, das sind alles Templates, Vorlagen, die alle on-Wiki vorgehalten werden. Das ist jetzt how-to-track, das man Oberwieger kriegt. Und dann gibt es noch ungefähr 130 Wikimedia-Extensions, die deployend sind. Aber wenn man sich nur die Homepage-Extensions anguckt, dann sind es mehr als 2000. Es gibt ziemlich viel Code da draußen. Und dieser Code wird manchmal tatsächlich per Copy und Paste einfach auf einer Wikis Seite geladet. Nach dem Motto, hier, probiert das, müsste laufen. Was vielleicht nicht das beste Versöhnungssystem ist, wenn es um Code-Mainteness geht, aber es ist quick and dirty, es existiert. Eine andere Möglichkeit ist, dass uns teilweise nicht bekannt ist, wo die Code-Repos leben. Wir haben z.B. Sachen wie 2Forge, da ist das ein Cloud-Service. Man kann seine eigenen Helfer-Tools irgendwo hosten, die andere Leute auch benutzen können. Auf einer Cloud-Service-Plattform, 2Forge heißt sie. Ein Beispiel ist Pageviews. Wenn man sehen möchte, wie welche Seiten die beliebtesten sind auf irgendeinem Wiki, dann ist das eine Möglichkeit von tausenden dieser Tools. Die Regeln sind natürlich, dass der Source gepubliziert werden muss, aber es ist teilweise relativ schwer sicherzustellen, dass das passiert. Bei den meisten Repos, die wir kennen, haben wir ein Index. Manche kennen wir halt nicht, was ein Problem ist, was wir lösen. Also, in letzter Zeit alleine schon eine Nummer davon zu bekommen, was wir messen können, was wir denn haben, wie viel wir denn haben, ist halt schon schwierig. Deswegen habe ich also ein Diagramm erstellt, um es zu visualisieren, was für ein interessanter Aufgabe es ist. Ich weiß nicht, ob irgendjemand das versteht. Schwarz heißt quasi, das existiert nicht, das heißt, da gibt es nichts zu messen. Grün heißt, es wird gemessen. Gelb heißt, es ist schwierig, aber es würde gehen mit so ein paar schwierigen Sachen. Da könnte man dann APIs benutzen, um die Nummern aus den Wikis zu bekommen. Man könnte auch Name Spaces benutzen. Rot heißt, dass es extremst schwierig ist. Wir würden das irgendwann gerne hinbekommen, aber es wird schwierig sein. Wir würden das gerne hinbekommen irgendwann später mal. Die Nummern, die man hier sieht, sind manchmal richtige Nummern. Manchmal sind das auch nur so ungefähre Abschätzungen. Darüber, wie viele Gegenstände, Repositories, über wie viele wir denn da reden. Hier zum Beispiel heißt es 270.000 Einträge, Teile von Einträgen in diese Sache. Das ist was die Datenbasis of Hive sagt. Wir glauben dem noch nicht ganz, aber das ist halt auch unsere Aufgabe für die nächsten paar Monate. Um bessere Daten herzubekommen und wo unsere Developer überhaupt sind. An Code Repositories haben wir ungefähr 200 bis 400 in Garret pro Monat. Mittlerweile haben wir auch ungefähr 500 bis 600 Menschen, die an Gadgets und Extensions arbeiten pro Jahr. Für ganz viele andere Dinge wissen wir es aber immer noch nicht. Und das will ich über die nächsten paar Monate oder Jahre auch verbessern. Aber ja, das ist eigentlich alles. Ich hoffe, es war interessant, falls ihr irgendwelche Fragen habt. Fühlt euch nicht gezwungen, mich anzusprechen. Das sind ein paar Links, wo man nicht ansprechen kann, wie man nicht ansprechen kann. Falls ihr mich nicht erreichen könnt, könnt ihr mich auch auf der Community Matrix erwischen. Da gibt es eine Diskussionsseite. Da könnt ihr zum Beispiel auch Ideen, Fragen, was auch immer unterbringen. Na ja, danke.