 Hallo, herzliches Loh auch von meiner Seite, ich bin Florian, ich bin hauptsächlich für das operative Gesellschaft bei Transcribuss zuständig und kümmere mich ja so ein bisschen als Mädchen für alles darum, dass die ganzen Prozesse bei Transcribuss und vor allem die Software am Laufen bleibt. Wir sind sehr stark gewachsen in den letzten Jahren und dementsprechend gibt es hier immer sehr viel zu tun. Aber jetzt schauen wir uns mal kurz an, was Transcribuss überhaupt ist und was hinter Transcribuss steckt. Ja, Transcribuss ist eine KI-gestützte Plattform, das werden Sie wahrscheinlich mittlerweile schon gesehen haben, wie die Zeitraum und müssen wir Arbeit mit historischen Dokumenten zu erleichtern versucht. Also wir geben unser Bestes die Werkzeuge bereitzustellen, die Arbeit mit solchen sehr wertvollen Qualen im Endeffekt auch erleichtert und als Plattform diese Tools zur Verfügung stellt, um genau eben jene Quellen zu erschließen, ganz nach dem Motto gemeinsam Geschichte entschlüsseln, das ist unsere Vision. Wir wollen eben die Plattform sein, die ist ermöglicht historische Quellen zu erschließen und diese zugänglich zu machen. Was steckt hinter Transcribuss, beziehungsweise wer steckt hinter Transcribuss? Wutbrünglich hat sich Transcribuss aus zwei EU geförderten Projekten entwickelt, das eine nannte sich Transkrypterium, das zweite war das Read-Projekt. Der Read-Name steckt immer noch in der Genossenschaft, das ist jene Gesellschaftsform, die wir bei der Gründung 2019, nach dem Ende der EU-Projekte, als die Best oder vielversprechendste Gesellschaftsform ausgesucht haben und auch wie uns wahrscheinlich der Erfolg mittlerweile recht gibt, vielleicht auch eine gute Entscheidung getroffen haben. Mittlerweile gibt es 180 Genossenschaftsmitglieder in mehr als 30 Ländern, dem Grunde die Genossenschaft hinter Transcribuss, die Read-Coop, also die Read-Genossenschaft darstellen, das Mitgliederwachstum ist beeindruckend, also vor allem in den letzten zwölf Monaten haben wir wieder sehr viele Mitglieder dazu gewonnen, die sich zusammensetzen, vor allem aus Universitäten und auf anderen Institutionen, die Gedächtnisarbeit leisten, aber auch viele private Mitglieder, das heißt, jeder private Person und jeder private Mensch sozusagen kann Transcribuss beitreten und auch Teil von Transcribuss werden und als Genossenschaft dementsprechend ein Teil von Transcribuss sein. Hier sieht man auch mal kurz, wie sind es die Mitglieder vor allem aus institutionellen Ebene zusammensetzen, wir haben wie gesagt sehr viele Universitäten, aber auch Organisationen aus Regierungskreisen, aber auch Bibliotheken, auch viele Unternehmen, die Transcribuss im Einsatz haben und wie gesagt eben sehr viele private Member und Mitglieder, die an unserer gemeinsamen Vision glauben, gemeinsam Geschichte zu entschlüsseln und dementsprechend haben wir mittlerweile vielleicht jetzt die 223 noch aus, bereits an die fast schon 200 Mitglieder weltweit. Wie gesagt, wir fühlen uns sehr als Gemeinschaft, hier ist ein nettes Foto von der letzten Anwenderkonferenz in Transcribuss, die wir 2022, also vor knapp einem Jahr in Innsbruck hatten, sehr nette und bunter Haufen an Anwenderinnen und Anwender von Transcribuss, die man hier auf dem Foto sieht. Vielleicht etwas konkreter zu Transcribuss nun, was macht Transcribuss aus? Es ist, Transcribuss ist mittlerweile ein bisschen mehr als reine Texterkennung, wofür Transcribuss hauptsächlich bekannt ist. Unsere Vision ist gemeinsam Geschichte zu entschlüsseln, damit man Geschichte erstmal entschlüsseln kann, gibt es eine ganze Kette, Sachen, die man erledigen muss um Quellen zugänglich zu machen und auch zu erschließen. Zu meinen müssen Materialien und Quellen erstmal digital verfügbar sein und dadurch hat sich bereits zu Projektzeiten, als es noch ein EU-Projekt war, eine Notwendigkeit ergeben, eine schnelle und komfortable Lösung zu haben, um mobil zu scannen. Daraus hat sich das Scantent entwickelt, vielleicht kennen es einige von ihnen schon. Das ist eine mobile Scan-Lösung, die verwendet werden kann, um mit dem Smartphone Materialien zu scannen, ganz einfach mit jedem beliebigen Smartphone, kann man das Smartphone auf das Scantent auflegen und damit scannen. Gibt dazu auch eine App, genannt sich DocScan, die genau dafür entwickelt wurde. Und dann natürlich gibt es den Kern von Transcribuss, also die Transcribuss-Plattform, die versucht auf einen ganzen Spektrum an verschiedenen Werkzeugen bereitzustellen, von der Transcription eben über die Ratenerfassung und auf die Anotation von historischen Materialien und aber auch, und das ist eines der Kernstücke von Transcribuss, das Training und das sehr einfache Training mit mittlerweile bei wenigen Klicks von künstlicher Intelligenz. Das heißt, man kann künstliche Intelligenz mit Transcribuss trainieren, um genau die Materialien, mit der man, Entschuldigung, mit der man befasst ist zu trainieren, diese künstlichen Netzwerke kann man dann verwenden, um genau jenes Material, also jene Handschrift zum Beispiel, mit der man gerade sich auseinandersetzen ist, zu erkennen. Und wie gesagt, die automatische Texterkennung ist dann die logische Folge des Trainings. Das heißt, wenn man so ein Modell trainiert hat, dann kann man das selber in Grün hausenmal, zigtausendmal anwenden und eben jene Materialien, an denen man interessiert ist, entschlüsseln. Ganz neu und dafür, da werde ich später auch noch ein bisschen tiefer darauf eingehen, wie Sie jetzt auch Transcribuss-Sites, das ist eine Lösung zum Veröffentlichen von den Materialien. Auf der einen Seite gibt es ja das Erschließen von Materialien im Sinne von Erkennen des Texts, aber auch das Zugänglichmachen von solchen Materialien ist ein sehr großes Bedürfnis, das wir erkannt haben und auch versucht haben, eine Lösung dafür zu bieten, diese nennt sich dann eben Transcribuss-Sites. Da kann man relativ einfach mit ein paar wenigen Klicks, vielleicht eine halbe Stunde circa, eine eigene Website aufsetzen, in der man eben jene historischen Materialien, mit denen man beschäftigt ist, online stellen und vor allem durch Suche baumachen kann. Das bedeutet, man kann wirklich relativ einfach eine Website aufsetzen und jedem und jeder die Möglichkeit geben, die Materialien, wie zum Beispiel ein historisches, historische Korrespondenz oder mal ein Paargebuch von historischen Persönlichkeits-Sites super machen, auch digitale Editionen sind dadurch möglich und diese eben zugänglich machen. Jetzt ganz kurz zu den Hauptfeaturen oder Hauptfunktionen von Transcribuss, wie gesagt die automatische Transkription von Handgeschriebenen, Handgeschriebenen, aber auch gedruckten Dokumenten ist eines der Fernmerkmale von Transcribuss und dafür nötig ist natürlich das Training von Modellen, wie bereits erwähnt. Was mit Transcribuss zusätzlich möglich ist, ist die Zusammenarbeit, das heißt man kann die eingesetzten Materialien in Transcribuss auch mit anderen Nutzerinnen in der Plattform teilen und dementsprechend auch gemeinsam an jenen Materialien arbeiten und diese zugänglich machen. Ein weiterer Aspekt natürlich ist die Durchflugbarkeit, das heißt eine Volltext-Suche über jene historischen Materialien ist manchmal ein sehr was Feines. Man kann dementsprechend mit sehr leichtungsfähigen Cools, die man in der Plattform von Transcribuss finden kann, den Volltext von erschlossenen Materialien suchen und dementsprechend auch sehr interessante Erkenntnisse gewinnen von den historischen Materialien. Es gibt natürlich auch noch weitere Anwendungsfälle, wie zum Beispiel das Tagging, also die Auszeichnung vom Material, bedeutet die Anreicherung mit Metadaten, wenn man zum Beispiel alle Personen in dem historischen Text kennzeichnen oder markieren will, dann kann man das tun. Gleiches gilt für die Struktur, das heißt wenn man alle Überschriften oder alle Bilder in einem Dokument kennzeichnen will, kann man das ebenso machen. Natürlich gibt es auch eine Reihe von Exportfunktionen in Transcribuss oder dann wir später von meinen Kolleginnen noch mehr im Detail hören. Ja, meine Kolleginnen, das war das Stichwort, jetzt würde ich gerne zu meiner Kollegin Helene das Wort übermitteln und melde mich dann später wieder. Danke Florian. Ja, wir haben ja jetzt vom Florian schon gehört, was Transcribuss ist, was Transcribuss alles kann und ich werde jetzt einen Einblick geben und mit ihnen gemeinsam anschauen, was neu bei Transcribuss ist. Transcribuss ist im vergangenen Sommer auf Transcribuss als Web App umgestiegen und hat damit auch ein neues Interface bekommen, also eine neue Benutzeroberfläche. Schauen wir gerade, dass das geht mit den Folien weitergehen. Danke. Recht sind wir hier den Expert Client, denn kennen vielleicht einige von ihnen, der kombiniert sehr viele verschiedene Funktionen, ist aber wegen der ziemlich komplexen Oberfläche vor allem für Anfängerinnen und Anfänger ihr schwer zu bedienen. Links sehen Sie jetzt die neue Web-basierte Transcribuss-Plattform, die hat jetzt ein sehr klares Design, das einfach zu bedienen ist und auch schneller erlernt werden kann. Dort werden auch Schritt für Schritt die wichtigen Funktionen vom Expert Client hinzugefügt und auch wenn der Expert Client bestehen bleibt, die neuen Funktionen und Technologien wird es jetzt nur in der nächsten Generation der Web App geben. Das ist da auch ganz spannend. Die nächste Folie. Die Web App können Sie unter dem eingefügten Link hier finden, das ist app.transcribuss.eu, die Folien bekommen Sie ja danach auch noch und mittlerweile ist das neue Interface, also die neue Benutzeroberfläche, auch schon in zwölf verschiedenen Sprachen verfügbar. Datenschutz schreiben wir auch sehr groß. Alle Daten sind auf unseren eigenen Servern in Innsbruck in Österreich gespeichert. So, was ist jetzt der Vorteil von Transcribuss, von der Transcribuss Web App? Zum einen ist kein Download erforderlich. Sie können sich also entweder von zu Hause, vom Laptop oder auch beispielsweise wenn sie in einem Archiv oder Bibliothek oder der Universität in einem Standbezir sind, sich mit ihren persönlichen Zugangsdaten einlocken und an ihren Dokumenten arbeiten. Dazu ist die Web App auch schnell und intuitiv. Ich habe selber das erste Mal Transcribuss Expert an der Uni in meinem Master verwendet und ich kann mir erinnern, dass sie von der Benutzeroberfläche etwas eingeschichtet war und mit der neuen Web App haben wir jetzt eine Plattform, die eben benutzerfreundlich gestaltet ist, nicht ganz so einschichtend und leicht zu navigieren, auch leicht zu erlernen und leicht zu benutzen ist. Transcribuss wird jetzt auch noch besser nutzbar für die Zusammenarbeit und auch die Kollaboration mit anderen Nutzerinnen und Nutzern und es wird noch einfacher gemeinsam an Projekten und an historischen Dokumenten zusammenzuarbeiten. Im neuen Interface von Transcribuss gibt es vier Hauptarbeitsbereiche, die sehen Sie jetzt hier auch im Navigationsmenü von Transcribuss. Grundsätzlich ist der Ansatz hier wie auch überhaupt bei der neuen Transcribuss Web App ein holistischer oder ganzheitlicher Ansatz. Als erstes sehen wir da den Transcribuss Desk, dort wird gearbeitet. Also dort werden Dokumente hochgeladen, in Kollektionen sortiert, Seiten werden transkribiert und durchsucht. Auf der nächsten Folie sehen wir dann auch, wie das in der neuen Web App aussieht. Von hier satt man dann auch die Zugriffe auf die Dokumente, auf die Kollektionen und wie Sie oben rechts auch sehen, auf die anderen Arbeitsbereiche. Im Models Arbeitsbereich, da findet quasi die Transcribuss Magie statt. Hier werden die Modelle trainiert und verwaltet. Und im Screenshot von der Models Seite auf der nächsten Folie können wir auch sehen, dass wir diesen Arbeitsbereich wirklich umgestaltet haben. Das ist der Bereich, wo es eine Übersicht über die Modelle gibt und wo die Modelle auch zur Texterkennung oder Lehrerkennung trainiert werden können. Dann, was neu kommt, ist Transcribuss Sites. Man kann sich das vorstellen wie ein Content Management System, wo Sie Ihr Material einfach und unkompliziert als Webseite veröffentlichen können. Und die Webseite können Sie auch personalisieren mit Farben, mit Bildern etc. und können damit Ihre Arbeit und die transkripten Dokumente mit der Öffentlichkeit teilen. Genaures wird Ihnen dazu noch mein Kollege Florian dazu erzählen. Für nächstes Jahr haben wir auch schon etwas Spannendes geplant und zwar Transcribuss Connect. Wir haben vor kurzem die 150.000 User-Marke geknackt und wollen unseren User und Userinnen unseren Transcribuss Nutzerinnen eine Möglichkeit geben, sich auch untereinander besser zu vernetzen. Und gerade beim Erforschen von Nischen-Themen kann man auch auf bestimmte Probleme kommen, die natürlich Leute kennen, die in ähnlichen Bereichen zu tun haben. Und Transcribuss Connect wird dann eine Möglichkeit sein, dass man sich quasi mit Gleichgesinnten zusammen tun und austauschen kann. Nachdem wir jetzt gesehen haben, warum der Wechsel zu Transcribuss Web wichtig war oder passiert ist und wie die Plattform strukturiert, geht es kurz auf die Grundlagen näher ein. Wir haben ja eben den Desk Arbeitsbereich gesehen und damit man effektiv und effizient mit den Dokumenten in Transcribuss arbeiten kann, möchte ich kurz erklären, wie diese verwaltet werden. Zunächst sehen wir hier die Kollektionen, das sind Folder, in denen die Dokumente gespeichert werden. Normalerweise ist eine Kollektion ein Projekt und jede Kollektion hat einen Namen, eine ID. Innen Kollektionen befinden sich dann die Dokumente, wie sie hier sehen können. Und hier können sie beliebig viele verschiedene Dokumente hochladen. Innen Dokumenten sind dann die Images, also die Bilder von den Seiten der jeweiligen Dokumente. Ein Dokument kann also nur eine Seite beinhalten, wie beispielsweise ein Brief oder wenn sich ein Buch handelt, können das auch hunderte von Bildern sein. Hier ist es eben wichtig, dass man sich diese Struktur oder dass man versteht, wie diese Struktur funktioniert, wie Seiten, Dokumente und Projekte eingeteilt werden, damit man eben auch die eigene Arbeit mit Transcribuss besser planen und besser strukturieren kann. Ich habe jetzt auch nochmal einen Screenshot eingefügt, damit man die Organisationsstruktur sieht in der neuen Web App. Man sieht links oben eben die Kollektion, das ist dann Portfolios, Transcribuss Demo, dann haben wir auch das Dokument, das ist dann Newspaper, also die Zeitschrift, Zeitungsbeispiel und in diesem Dokument sind dann die verschiedenen Seiten der Zeitung zu sehen. Es gibt auch neue Möglichkeiten zur Verwaltung von Dokumenten. Sie können jetzt Verknüpfungen mit anderen Kollektionen erstellen. Das Dokument bleibt dabei in der Hauptsammlung drin, scheint aber auch in den verknüpften Kollektionen auf und kann von dort aus, von dort aus, aufgerufen werden. Weiteres können jetzt auch Dokumente gelöscht, verschoben oder kopiert werden. Falls ein Dokument aus dem Sinn gelöscht wird, keine Sorge, gelöschte Dokumente werden jetzt nicht sofort entlang, sondern sind noch bis zu 14 Tage im Papierkopf aufbewahrt und dann kann man sie entweder wiederherstellen oder endgültig löschen. Wenn Sie mit den Dokumenten in Transcribuss arbeiten, sieht das ungefähr so aus. Wir haben ja auch eben einen Screenshot eingefügt vom Editor. Da gibt es links die Textregion mit dem Bild vom Text und rechts sieht man dann die Transkription des Textes. Im Prinzip sieht dann eben so das aus, dass man ein Bild hat und die Transkription, die man dann bearbeiten kann. Transcribuss schafft es also, wie wir auch auf der nächsten Folie dann sehen, dass es vom Bild zum Maschin lesbaren Text kommt, sodass man quasi mit historischen Dokumenten bzw. mit den Inhalten auch leichter arbeiten kann. Und damit Transkribuss vom Bild zum Lesbaren Text kommt, führt Transkribuss eine Texterkennung durch. Wenn wir die Texterkennung starten, gibt es in Wirklichkeit zwei Schritte, auch wenn wir nun auf eine Schaltfläche klicken. Es gibt zuerst die Layout-Erkennung, um die Linien und Textbereiche zu erkennen und dann die eigentliche Texterkennung. Das heißt, wenn man die Dokumente durch die Standardtexterkennung laufen lässt, basieren zwei Sachen, auf der nächsten Folie ganz schön mit den Bildern abgebildet. Zum einen ist eigentlich die Standardtexterkennung, das ist Layout und Text. Im Prinzip werden aber zwei Schritte durchgeführt als Layout und Texterkennung separat. Die können grundsätzlich auch als zwei getrennte Schritte durchgeführt worden werden, vor allem wenn ein komplexes Layout, wenn das Dokument ein komplexes Layout hat. Dann auf die nächste Folie bitte. Damit ein Bild richtig transkribiert werden kann, wird das Dokument in Textregionen segmentiert und in Seilen und in Baselines. Das ist wichtig, damit Transkribuss bzw. die Texterkennungsmodelle den Text richtig erkennen, damit quasi klar ist, was ist Text, was steht in einer Zeile. Es gibt also zwei Elemente, die Textregion und die Zeile. Das sehen wir dann auch auf der nächsten Folie nochmal genauer. Da haben wir zum einen links den grünen Bereich, das ist die Textregion, das Rechteck und die schließt quasi den Text, die umschließt den Text. Dann sieht man oben die Baseline, das ist einer der wichtigsten Bezugspunkte für die Texterkennung, das ist eine Polylinie und die verläuft entlang der Unterseite von der Textzeile. Und dann sehen wir auch im weißen Bereich dann noch den Texteditor, wo dann die Transkription der jeweiligen Zeile zu sehen ist. Also eine Baseline wird das eigene Zeile im Texteditor dann auch angezeigt. Dann die nächste Folie bitte. Genau, also ein Textmodell ist also auf einer bestimmten Menge an Daten, Bilder und Transkriptionen trainierter KI Algorithmus, der die wahrscheinlichste Zeichenabfolge für jede segmentierte Textzeile erkennen kann. Was bedeutet das jetzt für uns? Das bedeutet, dass die Texterkennungsmodelle von Transkribus Bilder von Handschrift oder gedruckten Text von gedruckter Schrift im Text umwandeln können. Und dieser Text, der ist lesbar und durchsuchbar und den können wir in verschiedenen Formaten exportieren. Allerdings ist es so, dass jede Handschrift unterschiedlich ist. Deshalb gibt es kein allgemeines Modell für Handschriften, aber mit Transkribus gibt es zwei Möglichkeiten, trotzdem einfach und relativ schnell an einen transkribierten Text zu kommen. Zum einen erstens die Nutzung eines öffentliches Modells zur Texterkennung, das bereits von einem Transkribus Team oder von der User Community für ähnliche Schriften trainiert wurde. Zweitens gibt es die Möglichkeit, dass man ein eigenes HDR, also Handwritten Text Recognition Modell trainiert, für die Erkennung von einer bestimmten Handschrift oder Schriftart, die man braucht. Also es gibt diese zwei Möglichkeiten, um Texterkennungsmodelle zu nutzen und da schauen wir uns jetzt den Workflow genauer an. Also als erstes, der erste Schritt ist das Dokument hochzuladen. Da schauen wir dann, wenn es hochgeladen ist, ob es bereits ein geeignetes öffentliches Modell gibt. Also geeignet heißt es gibt ein Modell für das Skript oder für die Sprache. Wenn ja, also wenn es ein geeignetes Modell gibt, kann man dieses dann einfach verwenden. Je nach Ausmaß des Materials braucht es dann ein bisschen, da kann man dann auch den Text im Text versehen, durchsuchen, dazu erklärt Miriam später auch noch mehr meine Kollegin und natürlich kann es eben auch exportiert werden. Wenn nein, wenn kein öffentliches Modell vorhanden ist oder wenn das öffentliche Modell nicht gut funktioniert, kann man in dem Fall eben ein eigenes Modell trainieren. Das bedeutet, dass der Workflow etwas komplexer wird, aber auch, dass die Ergebnisse wesentlich zuverlässiger und genauer sein werden. Jetzt gehen wir mal davon aus, es ist ein geeignetes Modell vorhanden, wie gehen wir dann vor? Das wäre dann die nächste Folie bitte. Danke schön. Genau, also der erste Schritt, wie vorher erwähnt, ist eben die Dokumente zuerst hochzuladen. Dazu wird dann im Desk-Arbeitsbereich eine Kollektion, also der Abschnittkollektion geöffnet, eine Kollektion geöffnet und dann sieht man auch schon, dass man die Dokumente hochladen kann. Da können Sie dann entweder Bilder oder PDF-Dateien auswählen und hochladen. Denen können Sie dann einen Titel geben und klicken Sie Submit, um dann die Bilder hochzuladen. Dann sind die Dokumente alle in Transcriptus hochgeladen. Jetzt können Sie entweder das Dokument oder einzelne Seiten auswählen und dann klicken Sie auf Recognize, da haben wir auch eine Bildschirmaufnahme eingefügt. Nachdem Sie auf Recognize geklickt haben, öffnet sich ein neues Fenster, da sehen wir dann noch auf der nächsten Folie genauer. Und in dem Fenster ist dann eine Auflistung von allen Modellen. Da können Sie dann das Modell wählen, das für Ihre Unterlagen am besten geeignet ist. Dann klicken Sie auf Start Recognition und die Texterkennung wird gestartet. Den Status von einem Job können Sie in der Schaltfläche Jobs überprüfen und wenn der Auftrag oder der Job abgeschlossen ist, dann öffnen Sie die Seite, also das Dokument erneut und das Ergebnis, also die Transkription von der automatischen Texterkennung wird dann angezeigt. Der Schritt mit dem Auswählen von Modellen war eben zuerst vielleicht ein bisschen schwer zuvor zu stellen, deswegen sehen wir da jetzt noch einmal eine Bildschirmaufnahme. Insgesamt haben wir bereits 159 öffentliche Modelle, da ist von Deutschkurrent über Karolingische Minuskul und sogar Ottoman Türk ist wirklich einiges dabei. Sie können dann die Modelle nach Sprache, Typ oder Name filtern, das sehen wir dann auch auf der nächsten Folie noch genauer. Hier können Sie dann am Modell wählen, das am ehesten Ihren Material entspricht und das Modell wählen Sie dann doch klicken aus. Wenn Sie auf das Modell klicken, haben wir dann noch einen Screenshot auf der nächsten Folie, der das noch genauer zeigt, dann sehen Sie auch rechts weitere Informationen zum Modell, wie zum Beispiel die Größe der Trainingsdaten oder auch die Zeichenfehlerrate, kurz CER. Die Leistungsfähigkeit vom Modell, also wie gut das Modell funktioniert, hängt von mehreren Sachen ab, zum einen von den Daten, die während des Trainings gesehen werden, also die Trainingsdaten und die Validierungsdaten. Für ein gutes Ergebnis bedeutet das dann, dass Ground Truth Seiten korrekt und genau transkribiert sein sollten, also dass die Seiten mit denen trainiert werden, mit denen trainiert wird, dass sie korrekt transkribiert sind. Zweitens wird auf der Grundlage des Abstands zwischen einer perfekten Transkription und dem markanten Text eine bestimmte Character Errorate, also der Prozentsatz der Zeichen, die vom Text Modell falsch transkribiert wurden erstellt. Das bedeutet, beispielsweise bei einer Character Errorate, also bei einer Fehlerquote 5%, bedeutet das, dass im Vergleich zur manuellen Transkription, zur richtigen Transkription, also den Ground Truth Seiten fürs Training, dass da fünf von hundert Wörtern von der automatischen Texterkennung falsch erkannt wurden. Also quasi wichtig ist dabei zu sehen, dass das Ground Truth oder dass die Trainingsdaten auch korrekt sind, um ein gutes Ergebnis zu bekommen. Das Ergebnis kann auch gesteigert werden, wenn man beispielsweise Smart Search und Language Model anklickt bei Start Recognition. Smart Search macht den Text besser durchsuchbar und Language Model bedeutet, dass nicht nur der optische Text quasi berücksichtigt wird, sondern auch die Sprache, in der der Text geschrieben ist. Eine neue Technologie, die wir da haben bei den Modellen, sind die Supermodels und was bei denen neu und beeindruckend ist, ist, dass sie sehr große und allgemein vielseitig verwendbare Modelle sind. Das heißt für uns, dass man für verschiedene Schriften und Sprachen und auch für gemischtes Material ein Modell verwenden kann und was vorher nicht möglich war. Und das Ziel ist dabei, dass eben diese Supermodels, diese Supermodelle ein gutes Ergebnis zeigen, auch wenn es nicht mit einem spezifischen Material trainiert wurde. Das erste Supermodel oder Supermodell ist bereits verfügbar. Das ist der Text Titan One. Der ist in sechs verschiedenen Sprachen trainiert worden und dieses Supermodel kann man dann auch einfach in der Übersicht der öffentlichen Modelle in Transcribos auswählen. So, jetzt sind wir auch einiges an Info durchgegangen, wie die neue Web App aufgebaut ist, wie die Dokumente verwaltet werden und ich übergebe jetzt an meine Kollegin, die Miriam und Miriam wird dann erklären, was man alles mit den Transcribten machen kann. Danke schön. Genau, danke. Also wir sind jetzt quasi im Workflow so weit gekommen, dass wir den erkannten Text haben und können damit jetzt weiterarbeiten. Zum Beispiel, also weil das vorher auch kurz in den Fragen aufgekommen ist, natürlich kann man dann den erkannten Text einfach korrigieren. Je nachdem was man dann damit machen möchte, man das außerhalb der Plattform den Text verwenden möchte, würde sich das natürlich anbieten. Aber man kann den Text nicht nur korrigieren, sondern man kann ihn auch weiter anotieren bzw. kann man die Dokumente anotieren. Dafür gibt es nämlich zwei verschiedene Arten von Tags, die man vergeben kann. Es gibt die Struktur Tags und die Text Tags und wie man sich bei den Struktur Tags schon denken kann, verwendet man die, um bestimmte Elemente der Struktur im Dokument zu markieren. Im Bild hier sieht man zum Beispiel, dass da das Tag-Heading vergeben wurde oder dann im unteren Bereich ein ganzer Bereich als Paragraph gezeigt wurde und das kann man also, das kann man dann direkt im Bild machen. Also im Dokumenten-Editor auf der linken Seite, im Layout-Bereich die bestimmte Form auswählen und dann mit rechts klick auf Strukturtypen hinzufügen klicken und diese Strukturtypen, das sind die Struktur Tags, die man vergeben kann. Man sieht in dem Bild rechts auch, dass man in dem Konfigurationsbereich gibt es einen eigenen Bereich für die Tags, wo man zwischen Struktur oder Struktur Tags und Text Tags hin und her wechseln kann und man sieht dann auch schon ein paar vorgegebene Tags wie eben Paragraphen, Heading, Seitennummer und so weiter und die kann man natürlich aber auch noch anpassen. Also man kann die Konfigurationen personalisieren oder man kann auch ganz eigene Tags hinzufügen und dann gibt es eben noch eine andere Art von Tags, die man vergeben kann und zwar Text Tags, um eben inhaltliche Elemente in der Transkription zu markieren. Also da arbeitet man dann wirklich im Text-Editor und kann verschiedene Tags, Tags vergeben und dann auch noch andere Attribute hinzufügen. Man sieht zum Beispiel hier in dem Beispiel, in dem Beispielbild wurde Austria als Ortsname oder als Ort getaggt und man könnte dann, da gibt es dann noch verschiedene Attribute, man könnte die Wicked Art ID direkt hinzufügen, man könnte dann bei Place Name zum Beispiel auch noch etwas eingeben bei Country, in dem Fall jetzt nicht wirklich, aber man kann da eben das auch ganz schön personalisieren und für die Tags-Tags muss man im Text-Editor das Wort oder die Wörter, die man taggen möchte, markieren und dann eben auch über Rechtsklick das entsprechende Tag auswählen. Genau und dann kann man im Workflow natürlich auch noch weitergehen, wenn man jetzt den erkannten Tags zum Beispiel hat und einfach durchsuchen möchte. Dann gibt es verschiedene Suchmöglichkeiten oder Suchfunktionen. Man kann natürlich als einmal um sich generell in der Interface zurechtzufinden, beziehungsweise seine Arbeit zu koordinieren, kann man natürlich nach Dokumenten oder nach Collections suchen, das kann man machen indem man den Namen eingibt oder die Dokumenten oder Collection ID und dann kann man natürlich auch nach Tags suchen oder die Tags, die man vergeben hat, durchsuchen und was dann aber eben eigentlich wahrscheinlich wichtigsten ist, dass man auch den Text durchsuchen kann. Man kann also beim Text, wenn wir weitergehen in der Präsentation, gibt es zwei verschiedene Möglichkeiten. Man kann natürlich die Volltext-Suche nutzen und damit eben Wörter oder auch Phrasen innerhalb der Transkriptionen suchen und man kann da natürlich auch die Unscharfsuche nutzen oder davon profitieren und dann gibt es eben auch noch die Möglichkeit diese Smart Search Technologie zu verwenden, die wir schon angesprochen haben. Dafür muss man nur wissen, dass man das bereits vor der Texterkennung starten muss oder anmarkieren muss in der Erkennungsübersicht. Jetzt schaue ich, ob ich die nächste Folie gehen kann. Genau, da haben wir nochmal einen Überblick zu Smart Search, wo eben diese Funktion oder dieses Tool funktioniert etwas anders als die Volltext-Suche. Es werden nämlich dann für jedes erkannte Wort der automatischen Transkription mehrere Alternativen gespeichert und das heißt, eben das muss man ein bisschen planen, wenn man das verwenden möchte, weil das eben im Nachhinein dann nicht mehr geht, dass man das noch dazuschaltet, sondern das muss man noch vormachen, weil dann nur so diese verschiedenen Alternativen eben auch gespeichert und im Nachhinein durchsucht werden können. Wir sehen jetzt hier ein Beispiel, wo das auch sehr hilfreich ist, wenn nämlich zum Beispiel die Character Array von dem verwendeten Modell nicht so gut ist. Also zum Beispiel hier das Modell, das verwendet wurde, hat eine Character Array von 20 Prozent, also ziemlich hohe und dann haben wir nach dem Namen Tomaso hier gesucht und Smart Search findet diesen Namen dann auch, wie man in der Vorschau hier sieht, obwohl im erkannten Text wurde das falsch transkribiert, das wurde dominato transkribiert. Das heißt, mit der Volltext Suche würde man jetzt diesen Namen so nicht finden, aber weil da eben für den Namen bzw. für die Erkennung von dominato verschiedene Alternativen gespeichert wurden, hat Smart Search das trotzdem gefunden. Also das kann dann recht hilfreich sein, auch wenn man ein Modell hat, was doch nicht so gut funktioniert, aber man muss es eben bereits vorher dazu schalten in der Erkennung. Genau, und dann gehen wir nochmal eine Schritt weiter im Workflow, wenn wir jetzt zu Frieden sind mit der Bearbeitung unseres Materials. Wir haben den Text erkann, wir haben eventuell Text vergeben, wir haben vielleicht Text korrigiert und möchten jetzt dann das Material exportieren, damit wir es auch außerhalb der Transkribusplattform verwenden können. Und dann muss man im Interface die bestimmten Seiten oder man kann auch das ganze Dokument auswählen und auf Export klicken und da hat man dann verschiedene Exportmöglichkeiten bzw. es gibt eben wie schon angesprochen verschiedene Formate, die man wählen kann. Es gibt, man kann einfach die Bilder wieder exportieren, da gibt es auch die Möglichkeit, das als Metster 3 herunterzuland, damit man auch die Informationen zu den Metadaten erhält und dann gibt es zwei verschiedene XML Exportformate, die man eventuell auch brauchen könnte, zum Beispiel eben nicht nur den Text und die Transkriptionen herunterzuladen, sondern auch Informationen zum Layout und den Koordinaten der Textregionen und Zeilen zu erhalten. Und dann gibt es auch noch die Standard Exportformate, also man kann auch Word Dateien exportieren, da kann man zum Beispiel dann auswählen, dass man keine Text dabei haben möchte oder dass man alle Text mit herunterladen möchte oder nur ausgewählte Text und natürlich kann man auch das Material als PDF Dateien herunterladen, da kann man auch wieder verschiedene Optionen wählen, zum Beispiel kann man das Bild und die Textebene gemeinsam eben exportieren und dann darin, damit man dann darin suchen kann. Aber man kann natürlich auch wählen, dass man nur Bilder exportiert und dann die Seiten mit Text zusätzlich dazu erhält und darin dann auch Text oder Artikel hervorheben, also das geht auch. Jetzt vielleicht schon ganz kurz als Ausblick oder weil das sicher auch in den Fragen vorkommen wird, als nächstes wird der Excel Export angestrebt, beziehungsweise das folgt als nächstes dann in Web Interface für eben zum Beispiel Tabellen oder auch Tags und TI Export ist natürlich auch etwas, was notwendig sein wird. Im Moment sind diese Exportformate eben noch nur in der Desktop App oder im Export Client möglich. Genau und dann gehen wir jetzt damit schon über zum Bereich Modell Training. Wie schon eben angekündigt, es gibt ja jetzt eben nicht nur die Möglichkeit eigene Textmodelle oder HTL Modelle, also Handwritten Text Recognition Modelle zu trainieren, sondern es gibt jetzt auch noch weitere Möglichkeiten und zwar kann man, also wie das bei den Textmodellen man sich schon denkt kann, trainiert man die, um eben Text automatisch erkennen zu können, aber es gibt eben jetzt auch noch die Baseline Modelle, wo man die Baselines der eigenen Dokumente trainieren kann und zwei weitere Funktionen, wo man sogenannte Fields Modelle trainieren kann und Tabellenmodelle, wo es um das Training von Textregionen geht oder einzelnen Feldern. Und bevor wir jetzt wirklich so den Trainingsprozess anschauen, möchten wir noch ganz kurz ein paar Begriffe eingehen bzw. ganz grundlegend diese Begriffe erklären. Also das ist jetzt wirklich sehr vereinfacht dargestellt, aber weil wir uns halt in diesem Gebiet befinden, wollen wir da kurz darauf eingehen. Also wahrscheinlich ist es auch schon ja schon klar, aber wir befinden uns jetzt eben in diesem Bereich des Maschinellen-Lernens und das wiederum ist eben ein Teilgebiet der künstlichen Intelligenz oder der Forschung dazu. Das heißt, es befasst sich dabei dann eben mit der Entwicklung von Algorithmen oder Modellen, die es dem Computer dann ermöglichen, selbstständig aus den Daten zu lernen, ohne dass wir oder dass man selbst eben explizit für jede spezifische Aufgabe den Computer sozusagen programmieren müsste. Und da ein weiterer wichtiger Begriff, den wir auch immer oder der eigentlich immer vorkommt, wenn wir da über das Training sprechen, ist eben diese Begriff der KI-Modelle oder der Algorithmen. Und das sind eben diese Algorithmen, die während des Trainingsprozesses von so einem Maschinellen-Lernsystem entstehen. Also das heißt, sie sind das Ergebnis dieses Prozesses und verkörpern dabei das Worbene Wissen. Und das heißt, in Transcribus, solche HDR-Modelle zur Texterkennung, sind eben aber auch alle anderen Modelle, die man trainieren kann, sind genau als solche Ergebnisse zu verstehen, die man dann direkt verwenden kann. Und ganz wichtig auch noch in diesem Atemzug ist ja eben auch dieser große Vorteil von Transcribus, dass man solche Modelle eben auch selbst trainieren kann und damit dann ähnliches Material erkennen lassen kann. Und dafür braucht man sogenannte Ground-Truth-Daten oder Ground-Truth-Material. Und das ist eine Bezeichnung oder so bezeichnet man eben in der Statistik, aber auch im Maschinellen-Lernen die korrekten und verifizierten Daten, die man zum Training eines KI-Modells benötigt. Das heißt, das Modell muss ja, um etwas lernen zu können, auch einen Input haben, auf dem es aufbauen kann. Und im Grunde werden bei dem Trainingsvorgang eigentlich die Daten, die man als Ground-Truth-Material vorgibt, sozusagen statistisch nachgebildet oder repliziert. Und in der Ground-Truth in Transcribus heißt also, vor allem, das sind alle Seiten, die korrekt transkribiert sind und die man selbst korrekt transkribiert hat. Danke für das Bild noch oder die Beispiele. The Ground-Truth sind also alle markierte Daten, auf denen das Modell-Training aufbauen kann, sodass das Modell später dann bei der Erkennung solche Muster erkennen kann, die die Markierungen vorhersagen können. Also was man sich merken kann, einfach alle Seiten, die korrekt transkribiert sind und dieses Ground-Truth Material wird dann beim Training noch einmal aufgeschlüsselt in das Training-Set und das Validierung-Set. Und beim Training-Set, das sind eben die Menge an Beispielen für die Anpassung der Parameter des Modells oder einfacher gesagt, das Training-Set sind einfach die Daten, auf denen das Wissen des neuronalen Netzs dann beruht oder einfach alle Seiten, auf denen das Modell trainiert wird. Und das Validierung-Set dagegen ist dann die Menge an Beispielen, die eine objektive Bewertung des Modells ermöglichen, um die Parameter während des Trainings dann zu optimieren oder auch wieder für einfacher gesagt das Validierung-Set in alle Seiten, auf denen das Modell seine Genauigkeit testen kann. Und wir empfehlen da immer schon oder wir sagen, dass ein gutes Validierung-Set beim Training in Transkribus ungefähr 10 Prozent des Trainings-Sets enthalten sollte und auch alle Beispiele. Also das heißt, wenn man zum Beispiel Material hat mit mehreren Händen, also mehreren Schreibern oder Schreiberinnen, dann sollten die auch alle im Validierung-Set enthalten sein, damit das Training dann eine repräsentative Abschätzung machen kann und die Ergebnisse besser werden. Jetzt würden wir uns einmal anschauen, wie man dann Textmodelle trainiert bzw. was dabei zu beachten ist. Und zwar ist es wichtig eben, dass man vor dem Training dieses Ground Truth Material vorbereiten muss oder erstellen muss und abhängig, das ist immer abhängig von der Dokumente, die man hat. Also vor allem ist die Unterscheidung zu treffen zwischen gedruckten Material oder handgeschriebenen Material. Aber wir empfehlen immer, dass man auf jeden Fall zwischen 25 und 75 Seiten oder ca. 5000, 15.000 Wörter braucht, um einmal mit einem Training zu starten. Und wenn man nur gedrucktes Material hat, dann kann man auch mit etwas weniger Seiten schon beginnen. Da braucht es dann weniger Material. Und im Prinzip hat man in Transcribos zwei Optionen, wie man dieses Material vorbereiten kann. Entweder man nimmt einfach eine komplett manuelle Transkription der Seiten vor, also gibt den Text wirklich ganz manuell ein oder wenn es möglich ist, also wenn schon ein Modell verfügbar ist, eben innerhalb dieser öffentlichen Modelle, dass auf ähnlichen Material trainiert wurde, dann kann man das ja auch schon anwenden und dann eben diese automatisch erstellte Transkription selbst nochmal korrigieren, so dass man auf jeden Fall am Schluss eben das den komplett korrigierten Text zur Verfügung hat. Und wenn wir dann weitergehen, genau, was muss man jetzt achten, wenn man Ground Truth Material vorbereitet? Es ist sehr wichtig, dass man hier ganz genau arbeitet, denn die Genauigkeit des trainierten Modells hängt dann eben, also die Ergebnisse des Modells hängen dann davon ab, was im Ground Truth Material vorgegeben ist. Das heißt, je besser diese Daten sind, desto besser wird am Ende auch das Modell sein. Das heißt, man sollte wirklich genau transkribieren, was in Original oder im Scan eben geschrieben steht und dabei auch Fehler oder Interpunktionen berücksichtigen und man sollte auch so konsistent wie möglich arbeiten, zum Beispiel wenn man was Abkürzungen betrifft oder verschiedene Schreibweisen, zum Beispiel sollte man sich vorher schon überlegen, ob man ein langes oder kurzes S verwendet und dann nicht im Ground Truth Material immer diese Transkription abwechseln vornehmen, sondern eben so konsistent wie möglich dabei sein und dafür macht das auch Sinn oder das empfehlen wir auch ein eigenes Dokument aufzusetzen, wo man alle diese redaktionellen Entscheidungen wirklich beschreibt und festhält, vor allem wenn man auch mit verschiedenen Personen arbeitet, im Team zusammenarbeitet. Und dann, was man auch noch machen kann, Wörter, die man gar nicht lesen kann oder die irgendwie ja aus sonst einem Grund unleselig sind, kann man mit dem Tag an Clear oder Gap versehen, denn beim Training in der Konfiguration kann man dann diese Zeilen, die diese Texten, diese Tags enthalten, kann man beim Training auslassen. Das heißt, das hilft dabei, dass da dann nichts Falsches gelernt wird oder Verwirrendes für das Modell entsteht. Und man kann das sonst auch einfach so machen, dass man die Zeile einfach auslässt, denn leere Zeilen werden beim Training auch nicht berücksichtigt. Und wenn man dann, dass die eine Seite so bearbeitet hat, also den Text komplett korrigiert hat, dann kann man ja empfehlen wir diese Seiten im Ground Truth Status zu speichern. Also man kann für die Seiten beim Speichern auch verschiedene Status Begriffe verwenden. Und da gibt es die Möglichkeit, Ground Truth zu verwenden. Das hat keine Auswirkungen auf das Training an sich, aber es hilft einem selber dabei zu wissen, welche Seiten oder welche Dokumente kann ich wirklich für das Training dann verwenden. Und dann ist auch noch, weil ich es auch schon angesprochen habe, eine Frage, wie man mit Abkürzungen umgeht. Wenn wir noch eine Seite weitergehen, eine Folie weitergehen, dann haben wir noch eine Auflistung, wie man Abkürzungen behandeln kann in der Transkription. Es ist nämlich so, dass das Modell Abkürzungen basierend auf dem, was es eben beim Training der Ground Truth Seiten gelernt hat, wiedergeben wird. Das heißt, es gibt dann da drei verschiedene Optionen. Wenn, Florin, kannst du noch die Folie weiter. Danke. Genau, es gibt drei verschiedene Optionen. Entweder man transkript die Abkürzungen einfach genauso wie sie im Text stehen, dann muss man sich keinen weiteren Gedanken machen und hält aber dann halt auch die Abkürzungen im Text, der dann erkannt wird. Oder man kann auch die Tag Funktion hier nutzen und Abkürzungen als Abbreviation oder mit dem AppRef Tag versehen, der schon vorgegeben ist und dann die Erweiterung der Abkürzungen als Attribut im Angeben. Dann hat man die auch gespeichert. Oder was man auch machen kann, ist dann die Erweiterung direkt im Text-Editor zu transkribieren. Also zum Beispiel etc. zu transkribieren und wenn die Abkürzungen da häufig vorkommen und recht einfach sind, dann lernt das Modell normalerweise auch diese zu transkribieren. Genau, also bei Abkürzungen hat man ein paar verschiedene Optionen. Und genau, jetzt zur Übersicht, wo oder wie man im Transkribus Interface dann das Training starten kann, wenn man das Ground Truth Material fertig vorbereitet hat. Dafür muss man dann eben auf den Abschnitt Models wechseln und dann auf diesen plus Zeichen train a new model und Text recognition model auswählen oder Text Erkennungsmodell, wenn man es auf Deutsch eingestellt hat und dann die jeweilige Collection auswählen, in der die Ground Truth Transkriptionen gespeichert sind. Und dann kann man weitergehen. Genau, dann wird man durch das Training die Trainingskonfiguration geleitet. Das sieht dann so aus wie unten im Bild und da muss man dann eben zuerst einmal die Trainingsdaten auswählen, also die Seiten eben, die man als Ground Truth abgespeichert hat oder die korrekt transkribiert sind und dann im nächsten Schritt auch die Validierungsdaten oder die Seiten, auf denen das Modell die Genauigkeit testet und diese 10% haben wir schon gesagt. Vor allem ist es ganz praktisch, also man muss das nicht manuell auswählen, sondern es gibt die Möglichkeit automatisch 10, 5 oder 2% das Training Set als Validierung Set auswählen und man kann aber natürlich auch manuell die Validierungsseiten auswählen. Und dann muss man noch den Namen des Modells, eine kurze Beschreibung und die Sprache für das Modell angeben und dann nochmal eine Überblickseite und dann kann man wirklich auf Starten klicken und dann wird das Modelltraining gestartet. Auf der nächsten Folie sehen wir auch noch eine Übersicht zu den verschiedenen erweiteren Optionen, die es noch gibt, da werden wir jetzt nicht genauer darauf eingehen, aber das Help Center oder der Artikel im Help Center dazu ist hier direkt verlinkt und dann kann man sich das genauer durchlesen und dann auf der nächsten Folie sehen wir nochmal eine Übersicht, wie das Modell, also wie das dann aussieht, wenn das Modell fertig trainiert ist oder wie man das auswählen kann. Also auf der linken Seite oder im linken Bild sieht man die Übersicht der verschiedenen Modelle und wenn man dann auf private Modelle wechselt, hat man die Übersicht seiner eigenen oder eigens trainierten Modelle und rechts sieht man dann, dass es auch eine, man kann hier auf die Beschreibung klicken, Show Description und erhält dann die Beschreibung des Modells und auch noch ein paar wichtige Daten wie die Character Errorade und die Größe, also wie viele Seiten trainiert wurden und so weiter. Und jetzt haben wir hier noch ein paar wichtige Anmerkungen gesammelt, also was gut ist zu wissen beim Training von Textmodellen. Also wenn man dann das Modell auf Handdriften anwenden möchte oder die erkennen möchte, die das Modell noch nie gesehen hat, also Seiten die es nicht kennt oder eben die schwer entzifferbare so ganz gekritzelte Notizen zum Beispiel enthalten, dann muss man natürlich mit wesentlich schlechteren Erkennungsergebnissen rechnen. Allerdings wenn man jetzt ein allgemeineres Modell trainieren möchte, kann man dem etwas entgegenwirken, indem man eben zum Beispiel die Anzahl der Trainingsdaten erhöht, also sprich Ground Truth Seiten erhöht und wenn man das zum Beispiel sogar verdoppeln kann, dann kann man auch schon mit einer 20 bis 25 Prozent geringeren Fehlerrate oder Character Errorade rechnen. Aber was auch noch wichtig zu erwähnen ist, ist, dass Modelle dann im Nachhinein nicht durch die Korrektur des Texts alleine verbessert werden, also wenn man die anwendet und dann den erkannten Text einfach korrigiert, dann werden die Modelle leider nicht verbessert, sondern man muss dafür dann immer ein neues Training starten und dabei eben mehr Ground Truth Material hinzufügen. Und was aber auch noch helfen kann, in dem Fall ist das vorhandene Modelle, also sowohl eigene Modelle, die man schon trainiert hat, oder auch öffentliche Modelle, die vielleicht ähnliches Material betreffen, die können als Ausgangspunkt verwendet werden, als sogenannte Space Model oder Basismodell, um dann beim Training die erforderliche Menge an neuen Daten, also das heißt an mehr Ground Truth Material zu reduzieren. Genau. Und dann gehen wir noch, schauen wir uns noch kurz an, wie man mit dem Layout in Transcribus arbeiten kann, oder wie man mit der Layout Erkennung umgehen kann, beziehungsweise dann auch im eigene Baseline Modelle trainieren kann. Wir haben das ja schon gehört, dass in einem ersten Schritt, wenn man jetzt einfach nur die Texterkennung auswählt, also ein Modell auswählt, in einem ersten Schritt eigentlich auch eine Layout Erkennung stattfindet, also das heißt, dass zuerst Zeilen und dann die dazu gehörigen Textregionen erkannt werden und erst dann im zweiten Schritt sozusagen die eigentliche Texterkennung stattfindet. Und wenn man jetzt eben die Layout Erkennung, wenn man damit nicht so zufrieden ist, dann gibt es auch noch verschiedene Möglichkeiten, wie man da mit Transcribus umgehen kann. Auf der nächsten Folie sehen wir noch mal kurz, was es sich hier handelt, nämlich genau um die Baseline, also die Linie rechts oben, wenn wir jetzt eben von Zeilen sprechen oder vom Baseline Training. Und wir haben dann auf der nächsten Folie noch mal einen Überblick dazu, was man eben machen kann oder beziehungsweise was für Optionen es gibt zur Erkennung dieser Baselines. Also man kann da einerseits öffentliche Modelle, öffentliche Layout Modelle anwenden. Man kann die erweiterten Einstellungen bei dieser Layout Erkennung anpassen und man kann dann, wenn das alles gar nichts hilft sozusagen auch, oder wenn man bestimmt das Material hat, ein eigenes Baseline Modell trainieren. Der erste Schritt genau wäre dabei eben einmal eines der öffentlichen Modelle zu testen oder alle drei öffentlichen Modelle zu testen. Wir haben die hier aufgeführt, die sind, wenn man in diesen Erkennungsfenster von Texterkennung auf Layout wechselt und dann nach den öffentlichen Modellen filtert, dann zieht man diese Übersicht und kann einmal probieren, ob eines dieser Modelle vielleicht besser funktioniert, als die standardmäßige Layout Erkennung. Wenn das nicht so gut funktioniert, dann kann man die erweiterten Einstellungen noch verändern. Das hat man vorher in der Folie vorher eben kurz noch gesehen. Genau, danke. Die erweiterten Einstellungen kann man hier öffnen und dann gibt es verschiedene Parameter, die man eben konfigurieren kann, wo wir jetzt auch nicht so genau darauf eingehen können leider, aber dafür gibt es auch eine ziemlich genaue Anleitung im Help Center, wo auch die ganzen verschiedenen Parameter erklärt werden und im Normaler Weise kann man die standardmäßigen Werte sowieso zulassen. Wenn das aber eben auch nichts bringt, sozusagen, dann kann man, also wenn die weder die öffentlichen Modelle noch die verschiedenen erweiterten Einstellungen dann zu einem besseren Ergebnis der Layout Erkennung führen, dann kann man eben auch ein eigenes Baseline Modell für seine Dokumente trainieren. Dabei muss man allerdings beachten, dass alle Seiten für dieses Modell zumindest ein ähnliches Layout haben müssen, weil es werden ja nur die Baselines trainiert und nicht der Text und deswegen genau muss das zusammenpassen. Auf der nächsten Folie sehen wir so einen Überblick, wie das aussehen kann, zum Beispiel, also links die markierten Stellen, da sieht man, wenn man damit wäre man wahrscheinlich nicht zufrieden bei der Layout Erkennung, weil da teilweise Zeilen gar nicht erkannt werden oder man möchte zum Beispiel bestimmte Zeilen nicht erkannt haben, wie da eben ganz unten, diese Zeile ganz unten, dann kann man eben ein eigenes Baseline Modell trainieren und das sieht dann eben so aus wie auf der rechten Seite, dass man genau, dass die Zeilen dann durchgehend oder manche Zeilen gar nicht erkannt werden, genau. Also, dass man da kann man dann diese Erkennung personalisieren, so wie man das haben möchte. Und für das Training eines Baseline Modells braucht man unsere Empfehlung nach mindestens 50 Seiten von auch wieder ground truth Material, also von korrekt segmentierten Layout und dafür kann man dann entweder auch wieder alle Zeilen ganz von neu auf manuell einzeichnen oder man kann die automatische Layout Erkennung anwenden eben separat und dann diese Erkennung korrigieren oder was man eben auch machen kann, wie im Vorher im Beispiel auch gesehen, man kann Zeilen auch nur für die Abschnitte einzeichnen, die dann auch wirklich transkribiert werden soll. Und was da auch noch gut zu wissen ist, dass für das Baseline Training auch noch kein Text erforderlich ist. Also, da muss man noch gar keine Texterkennung durchgeführt haben, weil man das ja dann meistens dafür machen oder dafür nutzen möchte, dann die Scans mit einem eigenen Baseline Modell zu erkennen, bevor man dann wirklich die Texterkennung durchführt. Genau, und hier sehen wir jetzt auch mal so einen Überblick, wie die Konfiguration für das Baseline Training aussieht. Es hat dann immer die, ja mehr oder weniger sollte das immer gleich aussehen. Man muss wieder die Trainingsdaten und die Validierungsdaten auswählen. Dann kann man noch verschiedene Einstellungen vornehmen zum Einrichten des Modells. Da ist beim Baseline Training das die Epochen und die Lernrate, wo wir aber eben auch sagen, dass man einfach mal die standardmäßigen Werte zuerst übernehmen soll. Und erst wenn man sich genauer vielleicht damit beschäftigen möchte, kann man auch im Help Center noch einmal nachlesen, was das genau, was diese Parameter genau bedeuten und wie man das vielleicht ändern könnte. Genau, also zu Beginn einfach mal die Standardwerte übernehmen und wenn das Training dann vollendet ist, dann kann man eben dieses individuelle Modell auf die eigenen Dokumente anwenden und es erscheint dann im Layout-Bereich in der Liste der privaten Baseline Modelle, wie man hier sieht. Und man hat dann auch eine Character-Arrow-Rate, bzw. eine Genauigkeitsrate in Prozent. Genau, und damit sind wir jetzt mit diesem Teil fertig und ich übergebe wieder an Florian. Vielen Dank. Ja, sehr ausführlicher Teil, vielleicht kurz zur Erklärung. Wir sagen hier so viel wie möglich in der Präsentation her, weil es ein sehr ausführliches, ausführlicher Thematik ist. Es gibt zuerst sehr viele Tools, wie sie vielleicht mittlerweile gesehen haben. Diese, alle in der Software herzuzeigen, wäre schwierig. Nachher versuche ich aber, weil wir die Frage auch im Chat gehabt haben, noch mal direkt in die Software hineinzuspringen und dann schauen wir es konkret ein paar Sachen an, auch um um Fragen einzugehen. Ich glaube, wäre es ganz sinnvoll, wenn wir dann die Software öffnen und dann können wir uns das direkt in der Software anschauen, auch schnell mal eine Newscase durchspielen, wie man sein Dokument hoch erkennt, kann oder eben auch, wie das Training funktioniert. Dafür nehmen wir uns gerne später noch, ich schätze mal, zehn Minuten. Und weil es jetzt schon so kompliziert war, noch ein komplizierteres Thema bei Seite, ein sehr spannendes Thema, Field und Table Models, das ist eine sehr neue Entwicklung, Beitranskribus, das gerade auch noch erst in der öffentlichen Beta-Version verfügbar ist, aber sehr viele, sehr interessante Möglichkeiten eröffnet, wie man mit historischen Materialien arbeiten kann. Wenn wir uns hier zum Beispiel diese Seite ansehen, dann ist das schon ein relativ kompliziertes Layout. Hier den Text Erkennung allein wird sehr bedingt sinnvoll sein. Man bekommt dann einfach eine Wurst an Text, kann damit aber wenig anfangen. Wenn man jetzt die ganzen Felder extrahieren will, da braucht man aber eine gewisse Intelligenz, um zu wissen, wo steht denn jetzt der Ort oder wo steht der Jahrgang? Und jetzt mit den Field Models haben wir eine neue Technologie eingeführt, bei dem man eben genau diese Modelle trainieren kann, um die Struktur der Materialien zu erkennen. Wie in diesem Fall zum Beispiel haben wir ein Modell trainiert, das ausschließlich den Ort, den Namen und den Jahrgang in dem Dokument gesunden hat und auch aus solchen ausgezeichnet hat. Unsere Modelle sind sehr vielseitig und wassatil. Rein theoretisch kann man jedes Objekt, das kommt aus dem Object Recognition Bereich, kann man rein theoretisch auch Bilder damit erkennen. Ich werde gleich als immer verschiedene Anwendungsfälle und Anwendungs-Szenarien eingehen, die man mit Fieldborders abdecken kann. Was auf Fieldmodelle können eben genau trainiert werden, um solche Fields, es kommt natürlich aus dem Englischen sehr allgemeiner Begriff, also Felder zu erkennen. Diese Felder sind zurzeit nichts anderes als Textregionen, die ein Strukturdeck haben. Das heißt, hier haben wir eine Textregion, die den Strukturdeck Ort hat, dann haben wir eine, die den Strukturdeck Name hat und die weitere, die den Strukturdeck Jahrgang hat. Und genau diese Felder kann man manuell erst mal erzeugen, um später ein Modell zu trainieren, um eben solche zu erkennen. Wir haben mittlerweile einiges und Testfällen durchgespielt. Da hat sich herausgestellt, dass meistens bereits 50 Seiten und das ist im Gegensatz zur Texterkennung relativ schnell erstellt. Das heißt, wenn wir zurückspringen oder wir haben hier auch hier ein Bild, man hat 50 Seiten und will alle Ortnahmen auszeichnen, dann hat man relativ schnell auf 50 Seiten die Textregion gezeichnet und die jeweilige Textregion als solche getagt. Bedeutet, hier hat man relativ schnell die Möglichkeit Trainingsdaten zu erzeugen und dementsprechend auch ein Modell für genau seinen eigenen Anwendungsfall zu trainieren. Man kann diese Trainings auf zwei verschiedene Wege starten. Zum einen mal direkt auf dem Desk heraus, aber auch über die Model-Section kann man die Fieldmodelle starten. Das mehrstufige Prozesse wird jetzt nicht ganz im Detail darauf eingehen, wie die verschiedenen Schritte aussehen. Das geht dann in der Software selbst relativ intuitiv. Genau. Aber jetzt zu einigen Anwendungsfällen, wo man konkret sieht, was kann man mit den Fieldmodellen machen? Inzipiell mal ganz generischer Fall. Man mag nur Textregionen erkennen. Es gibt aber historische Materialien. Es ist ja natürlich verständlich. Es gab keine, es gab schon, aber es gab manchmal schon Fälle, wo das strukturiertes Reiben auf Papier nicht sehr konsequent durchgezogen wurde. Das heißt, es wurde auf verschiedene Stellen am Papier geschrieben. Es gibt Randvermerke, es gibt Marginalien, es gibt Zeitnummern, es gibt andere Vermerke, die irgendwo am Papier gemacht wurden, die man auch erkennen wollen wird. Und dementsprechend kann man auch hier einfach ein Modell trainieren, das alle Textregionen erstmal auszeichnet. Dann gibt es den Anwendungsfall für Zeitungen. Zeitungen haben ein sehr interessantes Layout. Es gibt sehr viel Text, das auf sehr kleinen Raum gepackt wird. Auch hier kann man mit Fieldmodellen zum Beispiel die einzelnen Absätze, wie in diesem Fall, trainieren und dann erkennen. Weitere Anwendungsfälle sind Formulare, historische Formulare wie hier zum Beispiel. Kann man ganz schön sehen, dass man verschiedene Fälle trainiert hat, in diesem Fall zum Beispiel um den Namen, Vornamen oder auf Religion oder Beruf. Also prinzipiell jedes, ich denke, der tägliche Feld, wie hier zum Beispiel das Feld Kinder, könnte rein theoretisch auch trainiert werden, wenn man das dann in die Trainingsdaten hier eingegeben hätte. Weitere Fälle sind auch mehr daltige Layouts. Das heißt, gibt es immer und wieder natürlich, dass man mehrere Spalten auf seinem Material hat und diese dann auch trainieren können will. Mit Fieldmodels kann man relativ schnell, wie hier zum Beispiel hat man so ein Layout, dann kann man relativ schnell diese Textregionen zeichnen, zum Beispiel auch hier noch die Überschrift als eigene Textregion auszeichnen und dann mit schön strukturiert alle Felder auf dem Material erkennen. Das war ein ganz kurzes Fieldmodel. Wie gesagt, zurzeit noch in der öffentlichen Beta-Version. Das heißt, es dauert wahrscheinlich noch ein paar Wochen, bis diese wirklich auf der Produktiv-Version, also auf ein Punkt, das Kribus verfügbar sein werden. Nichtsdestotrotz kann man sie jetzt schon ausprobieren und auch selbst sein eigenes Fieldmodel trainieren, um zu sehen, wie diese neue Technologie auch angewendet werden kann. Weitere sehr interessanter Fall sind Tabellenmodelle. Sehr viele historische Dokumente wurden in Tabellenform geschrieben. Auch dieses Beispiel hier, um diese Tabellenform auf extrahirn zu können, gibt es jetzt die Tabellenmodelle in Transkribus, mit denen man Tabellen zeichnen kann, zu meinen hier. Können wir später vielleicht nur ganz kurz im Editor anschauen, wie man so eine Tabelle zeichnet, was man hierfür machen muss, um so ein Tabellenmodell zu trainieren, bis im Grunde eine Tabelle im Tabellen-Editor zeichnen und dann diese Trainingsdaten zu verwenden, um ein Tabellenmodell zu trainieren, wo der Output dann eben jener sein wird, dass man eine Tabelle schön strukturiert mit allen Spalten und allen Zeilen erkannt haben wird. Und mit dem X-Waxboard, da hatten wir vorher auch die Frage in den Chats, kann man dann strukturiert all jene Daten in Axlesheet oder ein CSV exportieren, dann dementsprechend auch in den Datenbank überführen bzw. die Möglichkeiten sind hier fast schon grenzenlos, dass man die Daten strukturiert in Tabellenform extrahirn kann und dann auch analysieren oder eben mit Transcriber-Sites, wie man es kurz noch anschauen werden, zur Verfügung stellen und besuchbar machen. Was können diese Modelle, wie funktionieren diese? Im Grunde lernen diese Modelle Zeilen zu erkennen und Spalten zu erkennen. Das heißt, sie erkennen nicht die Tabelle als solche, aber sie lernen, wo Spalten sind, wo Zeilen sind, sehen wir auch gleich in einem Beispiel noch mal und legen diese dann übereinander, sodass eine Tabelle herauskommt. Rein theoretisch kann man auch um Tabellenmodell trainieren, dass nur Spalten enthält oder nur Zeilen. Gibt es auch Fälle, wo dies durchaus sinnvoll ist. Es gibt auch keine allgemeine Modelle, dadurch dass die Technologie sehr neu ist, gibt es noch keine Public Models. Bedeutet, vorerst kann man diese Modelle erst mal funktionieren und auf sein eigenes Material anpassen. Die Trendzeichen müssen nicht zwangsläufig im Material vorhanden sein. Bedeutet, es muss nicht eine Tabelle im Material sein, aber der Text kann trotzdem in Tabellenform auf das Papier geschrieben worden sein, ohne dass es wirklich in den horizontalen oder vertikalen Trennstrich zwischen den verschiedenen Spalten und Zeilen gibt. Und man kann auch Tabellenmodelle trainieren, wo es unterschiedliche Tabellen auf ein und denselben Seiten gibt, dafür wird es etwas mehr Trainingsmaterial notwendig. Jetzt sehen wir uns an, was das Ganze bedeutet. Hier sehen wir zum Beispiel, haben wir genauso ein Beispiel von der Tabelle, wo es keine Horizontalen bis auf die Kopfzeile keine Horizontalen und auch keine vertikalen Trennlinien gibt. Rots dem ist der Text bzw. das Material in Tabellenform erfasst. Was man hier dann machen kann, die ist zum einen Text ein Zeilenmodell trainieren oder im Spaltenmodell oder man zeichnet gleich eine vollwertige Tabelle oder Teilen und Spalten gleichermaßen erkannt werden. Und wie in diesem Beispiel sieht man dann hier, zum Beispiel hat man ein Output im Material dann als ganz fertige Tabelle. Ob die Tabellen schief oder gerade sind, ist dann eigentlich egal. Bedeutet, wenn man die Tabelle schön zeichnet im Trainingsmaterial, kann das Modell genau lernen, wo die Spalten sind, wie Zeilen zeichnet werden sollen und kann auch Schiefe oder Verzogene Tabellen machen. Es gibt auch mehrzeilige Zellen zum Beispiel. Es ist unabhängig, ob die Spalten oder Zeilen jetzt mehrere oder eine Tabelle haben. Solange das Modell visuell beurteilen kann, dass das jetzt eine Zeile ist, indem man genau solche Trainingsdaten beim Modell Training zur Verfügung stellt, kann man auch eben mehrzeilige Zellen trainieren. Das Erstellen von den Trainingsdaten, also den Ground Truth Daten, basiert wie gesagt im Layout Editor. Da kann man relativ einfach, ähnlich wie in der Textregion, eine Tabelle zeichnen, in der man Spalten und Zeilen hinzufügt und diese Tabellen, sofern Tabellen vorhanden sind, kann man dann mit den jeweiligen Dokumentzeiten einen Tabellmodell trainieren. Wir haben so ein grobe Übersicht, also für Tabellen braucht es relativ wenig Trainingsdaten und Handführungszeichen. Für eine einfache Tabelle wie Niese hier zum Beispiel reichen meist schon 10 bis 20 Seiten aus an Trainingsdaten und man kann ein eigenes Tabellmodell trainieren. Soll es etwas komplexer werden, dann kann es schon mal 30 bis 50 Seiten sein und wie gesagt, wenn es jetzt mehr Tabellen auf einer und derselben Seite sind, was durchaus vorkommt, sollten es schon mehr als 50 Seiten sein. Ja hier ist natürlich die Grenze oben offen, je nachdem wie kompliziert das Material ist, muss man mehr und mehr Trainingsdaten hinzugeben. Der Trainingsprozess schaut wieder sehr ähnlich aus wie beim Texttraining oder beim Field-Modell-Training und auch beim Baseline-Modell-Training. Hier ist immer ein geführter Prozess mit mehreren Schritten, wo man zunächst das Trainingsmaterial auswählt, dann auch das Validationmaterial festlegt und dementsprechend dann das Modell beschreibt, dem Modell Namen gibt und schließlich noch eine Übersicht sehen kann, was das Modell alles reinfließen sollte und dann das Modelltraining starten kann. Noch mal kurz zusammenfassen, es braucht etwa 40 bis 60 Seiten an Trainingsmaterial für Table- und Field-Models, je nachdem bei Table-Models tendenziell etwas weniger bei Field-Models je nach den Feldern kann es auch schon ausreichend sein, dass man mal mit 20 bis 30 Seiten startet und dann iterativ das Modell auch verbessern versucht. Die Trainingsdaten werden mit dem Layout Editor vorbereitet, das können wir uns dann jetzt noch mal konkret anschauen und der Workflow mit den Tabellen funktioniert top-down, das bedeutet, bevor man eine Texterkennung denkt, sollte man erst mal die Fields erkennen, das heißt man erkennt erst mal den O, den Namen und den Jahrgang, nachher kann man eventuell dediziert, ob man die Baselines erkennen, was nicht immer zwingend notwendig ist, manchen Fällen kann das schon von Vorteil sein, wenn man auch noch einen weiteren Schritt einschiebt, indem man nur die Baselines erkennt und im letzten Schritt erkennt man dann den Text in den kannten Feldern und ja ideale Weise, weil das Plattform bzw. die Field- und Table-Models vorerst nur mal auf Beta verfügbar sind, dass wir eben testen können, sehr viel Feedback bekommen, das ist natürlich gut, wenn sie die Modelle Haus probieren und uns Feedback dazu geben, denn so versuchen wir eigentlich ständig die Modelle zu verbessern und auch das User, die User Experience, also ihr Erlebnis mit Traskribus zu verbessern. Genau, jetzt ganz kurze Exkurs zum neuen Credits- und Abo-Modell, das jetzt im Dezember dann wahrscheinlich kommen wird, beziehungsweise sicher kommen wird, das natürlich für alle relevant ist. Bis jetzt Patrascribus eine Plattform, die hauptsächlich sich über das Verkaufen von Qualit-Paketen finanzieren konnte, wie gesagt, wir sind eine Genossenschaft, müssen schauen, dass wir die Software als solche, die ständig weiterwärxt und wie Sie sehen, immer mehr Hustbereiche erstellt, auch nachhaltig aufstellen, dazu haben wir uns eben jetzt in den letzten Monaten, also mehr als zwölf Monaten eigentlich schon dazu entschlossen, auf ein Abo-Modell umzustellen, das aber eigentlich ein Vorteil sein soll, damit jeder und jede die Plattform weiterhin nutzen kann und trotzdem eine faire Nutzung der Plattform, hier sehen Sie zum Beispiel die Organisations- und Scholar- und Individualpläne, die kommen werden, bedeutet die Umstellung, kurz, ich bin mal ausverrückt, die Umstellung wird im Dezember kommen, was bei der Umstellung ganz wichtig ist, wir legen sehr großen Wert auf das Thema Genossenschaft. Unsere Genossenschaft ist genau jener institutionelle Rahmen, den Patrascribus braucht. Wir agieren wie Non-Profit, bedeutet alle Gewinne, die wir erwirtschaften, werden wiederum in die Plattform remestiert und es gibt keine Gewinnausschüttung, die per Statuten ausgeschlossen ist, das heißt, jeder Euro oder Interastribus fließt, fließt auch Interastribus, um Interastribus besser zu machen und Interastribus vielseitiger zu machen und alle Funktionen, die Interastribus bietet, auch hoffentlich noch verlässlicher zu machen. Was wir weiterhin versucht haben, ist die Plattform kostenlos zu lassen, die wird auch immer kostenlos sein und damit der Vorteil für jeden und jede, jede eigentlich noch größer ist, haben wir auch eine weitere Umstellung vor, das bedeutet jede Nutzerin und jeder Nutzer, auch jene, die auf einem individuellen Plan sind, ich glaube die Meyers bilden mir heute Streicher, die werden umgestellt von dem, zur Zeit bekommen auf 500 Credits, sobald man sich anmeldet, zu dem individuellen Plan, bei dem man monatlich 100 Credits, bedeutet 100 Zeiten monatlich erkennen kann. Zu meinen haben wir hier versucht, alle Nutzerinnen und Nutzer, die laufend Interastribus arbeiten zu belohnen, das bedeutet, pro Jahr bekommt man 1200 Zeiten, die man erkennen kann, gegenüber einmalig 500 und gleichzeitig wird das Ausnutzen schwieriger, weil man 500 Zeiten, die man jetzt bekommt, relativ schnell umgehen kann, indem man den zweiten Account aufsetzt. Das heißt, hier werden wir versuchen die Plattform Ferra zu gestalten und gleichzeitig das Nutzererlebnis zu verbessern, indem man größere Mengen, also mehr Seiten verarbeiten kann. Und das Event, ja das letztendliche Ziel ist, dass die gesamte Plattform profitieren wird, dass es nachhaltiger wird und dass auch der Zugang zu verschiedenen Funktionen besser gemanagt wird. Dazu zeigt ja ausschließlich, dass verwendende Texterkennung eine Bezahlfunktion ist in Zukunft für das ein bisschen anders sein. Das heißt, speziellere Funktionen wie Field und Table Models werden erst im Stolarplan, wenn wir noch mal zurück springen, verfügbar sein. Das heißt, solche Funktionen, die sehr rechnintensiv sind, die auch sehr viel in Entwicklung kosten, die werden erst ab einem bezahlten Plan verfügbar sein. In unserer Meinung immer noch relativ verschwinglich ist, wenn man wirklich mit Transcribos arbeitet und Qualen erst liest. So viel dazu, was aber immer noch sehr wichtig für uns ist, woher kommen wir und das ist die Forschung. Hier versuchen wir so viel zurückzugeben wie möglich. Wir haben da ein Transcribos-Stubendium Programm mit dem Programm. Das haben wir relativ früh eingeführt nach der Gründung, also bereits im Herbst 2020. Da haben wir mittlerweile circa 300 Projekte und das Lütztor. Wir suchen so gut wie möglich Projekte von Studierenden und Studierenden zu unterstützen und sie mit kostenlosen Credits zu versorgen, damit sie ihre Masterarbeiten, Forschungsarbeiten zielbringend durchführen können und mit Transcribos solche Qualen erfließen. Da haben sich sehr, sehr schöne Projekte ergeben und sehr interessante Forschungsansätze aus den verschiedensten Bereichen von Rechtswissenschaften über klassische Digital Humanities bis hin zu Wirtschaftswissenschaften haben wir wirklich sehr breite Spektrum an Projekten, die wir dadurch unterstützen konnten. Ganz kurz noch zu Transcribos-Sites. Das veröffentliche mit Transcribos ist auch ein Feature, das zurzeit nur auf der öffentlichen Britta-Version verfügbar ist, aber wahrscheinlich im Mittebezimmer auch auf die App, also auf die öffentlich verfügbare Produktivversion von Transcribos, gelanscht wird. Mit Transcribos-Sites bieten wir hier die Möglichkeit, ihre Kollektion in Transcribos öffentlich verfügbar und auch tuk-tukbar zu machen. Das bedeutet mit relativ wenigen Klicks, also mit einem Festlegung von einem Projekttitel, dass dann der Name der Transcribos-Site Website sein wird und dem Aussuchen der Kollektion kann man schon auf Create Sites klicken und man hat eine eigene Transcribos-Site aufgesetzt. Es gibt dann auch einige weitere Optionen, also es funktioniert relativ ähnlich wie gängige Content Management-Systeme wie etwa WordPress oder Doomler oder andere Content Management-Systeme, wo man eine Website auch mit wenigen Klicks aufsetzen kann. Der Unterschied hier ist aber, dass man gleichzeitig Quellen verfügbar machen kann. Wie gesagt, das Hauptziel ist die Zugänglichmarkung von Quellen mit einer intuitiven Anzeige eben genau wie Transcribos und Text und Bild, das verknutzt ist, das heißt, wenn man hier nach dem Wort Amsterdam sucht zum Beispiel, dann findet man das Wort Amsterdam in dieser Quelle und sieht genau, wo dieser steht. Entschuldigung. Und wie gesagt, die Volltext-Zuche durch alle Dokumente ist ein sehr großer Vorteil, mit dem man Quellen sehr gut zugänglich machen kann und den breiten Publikum, die sehr wertvolle Arbeit in der Erschliessung zeigen kann. Kurz um jetzt zur Frage runde endlich zu kommen, wo es dann wirklich interessant wird, wir haben sehr viele Kanäle über die sie uns erreichen können. Wir haben das Help-Center, das wir heute schon einige Male gehört haben. Wir haben die Info-Ad-Adresse, wo wir täglich nutzende Nachrichtenversuchen zu beantworten und nach besten Wissen und Gewissen versuchen auf jede einzelne E-Mail, die wir bis dato bekommen haben, zu antworten. Das kann natürlich manchmal etwas länger dauern. Wir sind immer noch ein relativ überschaubares Team. Versuchen nach wirklich besten Standards, aber trotzdem immer noch im Rahmen der Möglichkeiten zu antworten und wie gesagt, jedem und jeder weiter zu helfen mit allen Problemen, die auftauchen können, wie man vielleicht mit dem ganzen Feature-Umpfern sehen kann. Reskribus kann sehr viel. Wenn man sehr viel kann, dann kann auch immer wieder mal etwas nicht funktionieren. Aber wir sind, wie gesagt, sehr bemüht, das zu ändern und Reskribus immer weiter stabil zu machen und gleichzeitig aber auch die Feature am Umfang zu erhöhen. Ja, jetzt würde ich vielleicht zu den Fragen übergehen. Vielleicht kurze Frage, Miriam, wie wollen wir das machen? Magst du ein paar Fragen aus dem Chat vorlesen? Ansonsten hast du das vielleicht ein bisschen vorbereitet und die wird in der Zwischenzeit ganz kurz den Prozess durchspielen, weil wir die Frage vorher konkret gehabt haben, wie man in Reskribus selbst mit den Quellen arbeiten kann. Ich habe das schon versucht, vorzubereiten in der Zwischenzeit. Schauen wir mal, wie das gehen kann. Jetzt hier ist ein Demo-Account, hier ist vielleicht ein bisschen mehr los wie bei Ihnen, wenn Sie jetzt gerade erst mit Reskribus angefangen haben. Trotzdem würde ich jetzt mal den Prozess ganz kurz durchspielen, der so notwendig ist, um erstmal die Dokumente hochzuladen und dann aber auch zu erkennen. Wir haben hier, wie gesagt, die Startseite. Hier kann man dann alle Dokumente sehen, die sich erst kürzlich geöffnet haben. Was aber viel wichtiger ist, sind dann die Collections. Hier sehen wir zum Beispiel, ich habe einige Collections oder eben Sammlungen. Wir können auch hier oben auf Deutsch umstellen. Da sieht man das vielleicht ein bisschen besser. Wir können auf die Sammlungen wechseln und mal eine neue Sammlung anlegen. Sie haben standardmäßig immer schon eine eigene Sammlung, wenn wir jetzt sagen die Webinar-Sammlung, bei der wir jetzt den Prozess mal durchspielen erstellen wir jetzt. Und jetzt sind wir eben in eben jener Sammlung. Hier können Sie dann einfach auf Upload klicken und auswählen, was Sie hochladen möchten. Sie können entweder nur Bilder hochladen, aber auch PDF-Dateien. Das können Sie ganz selbst entscheiden. Da gibt man dann Dokumenten im Titel. Dann nennen wir das einfach Webinar-Dokument, weil wir schon bei dem Thema sind und suchen unsere Daten aus. Ich habe hier schon mal eine Daten vorbereitet. Jetzt nehmen wir einfach vielleicht mal 20 Bilder, laden diese jetzt schnell hoch und haben, es dauert jetzt vielleicht einen kleinen Moment, bis alle Bilder hochgeladen sind, aber sollte relativ schnell funktionieren. Sobald alle Bilder hochgeladen sind, werden diese in Dokum, in Rescribos als Dokument erstellt und stehen ihnen dann zur Verwendung zur Verfügung. Jetzt warten wir noch ganz kurz auf die letzten paar Bilder. Es sind nicht mehr viele, die letzten drei. Und dann sollte auch schon, genau, jetzt sehen wir, jetzt haben wir einen Create-Document-Job gestartet, das Dokument wird jetzt in Rescribos erstellt und angelegt. Wir können jetzt die Jobstabelle schließen und vielleicht auch hier mal auf die Jobstabelle auch mal schauen. Hier sieht man, auf welcher Seite gerade das Dokument erstellt wird. Das sind bereits auf Seite 14, das heißt, wenn wir jetzt neu laden, dann sollte das Dokument schon erstellt sein, hat 20 Sekunden gedauert. Jetzt kommen wir nochmal zurück vielleicht zur Sammlungsübersicht. Hier sehen wir nochmal alle Sammlungen und die Webinar-Sammlung, die ich gerade erst erstellt habe ist die erste. Hier sehen Sie jetzt zum Beispiel alle Bilder. Noch mal zurück zur Logik, ganz am Anfang, als Elena das erklärt hat. Wir haben ja jetzt die Sammlung und in der Sammlung gibt es die Dokumente. Hier gibt es das Dokument, das ich gerade hochgeladen habe. Der Name wurde ganz einfach vom ersten Bild übernommen. Den kann ich rein, theoretisch auch nochmal ändern. Webinar-Dokument und dann auch weitere Metadaten, sofern nötig hier Eintragen für dieses Dokument. Jetzt ist die Frage, was mag ich jetzt machen? Schaue ich mir mal an. Sie können in ihre Quellen natürlich besser als ich. Hier gibt es räusische Schriften, kann sein, dass es ein öffentliches Modell gibt, mit dem ich diese Schriften erkennen kann. Dann kann man zwei verschiedene Ansätze fahren. Zum Ersten, ich würde mal probieren, welches Modell gut funktionieren kann. Bedeutet, ich öffne jetzt, wenn wir hier über diesen Button oder auch hier herunten, kann man die Erkennung starten, die automatische Transkription und schaue in den Public Models, ob es Modelle für Deutsch gibt. Hier empfehlen sich gleich schon die ersten zwei Impolen in Modelle, also den German Giant. Das ist das größte Deutschmodell, das auch sehr vielseitig ist. Schriften aus dem 16. bis 21. Jahrhundert umfasst und auf ca. 15 Millionen Wörtern trainiert wurde, das sind, ich will jetzt nichts falsches sagen, aber über 100.000 Seiten sollten das sein, die hier als Trainingsdaten verwendet wurden oder eben der Textitan, der ist noch einmal größer, da sind die Trainingsdaten schon im hoch sechsstelligen Seitenbereich. Jetzt würde ich, weil es das Standardmodell ist und am meisten kann man ganz einfach mal den Textitan verwenden und die Erkennung damit starten. Das kann jetzt etwas länger dauern, je nachdem, wie die Schlange gerade ist. Aber ich glaube, dass die Erkennung ist gerade schon losgegangen. In der Zwischenzeit vielleicht gehen wir auf eine kurze Frage ein, wenn du schon was hast, Mirin. Ja, bzw. vielleicht kann man kurz die Jobs-Tabelle anschauen oder die Jobsübersicht. Das passt glaube ich ganz gut gerade. Hier oben hat man immer den Atem für die Jobs. Dann kann man zu meinen, wenn man raufklickt, eine Pumpaktübersicht von den Jobs sehen oder eben auch die komplette Jobs-Tabelle öffnen, wo man alle Jobs und was ist ein Job? Das ist im Grunde eine Aufgabe, die auf den Interesse-Grivers-Server und Servern für sie erledigt wird, wie hier zum Beispiel die Erkennung von dieser einen Seite. Was war die konkrete Frage dazu jetzt, Mirin? Es war eh keine Frage. Ich habe mir nur gedacht, es wäre gut, das auch vorzuzeigen, damit man weiß, wo man diese Jobsübersicht findet. Genau. Wie findet man hier? Man sieht jetzt, dass der Coding läuft hier noch. Was man vielleicht dazu sagen kann, der Text, die dadurch dadurch, dass er so viel größer ist, ist etwas langsamer als der Erkennung mit herkömmlichen Modellen. Faustregel, so eine A4-Seite, erkennt man in ca. 20 Sekunden mit einem herkömmlichen Standardmodell, mit dem Text-Ditan, also mit dem Supermodel kann das schon mal eine eineinhalb Minuten dauern, bis so eine Seite erkennt ist. Schauen wir nochmal, ob das schon fertig ist. Ja, in eine Minute und zehn Sekunden hat es jetzt für diese spezielle Seite gedauert. Jetzt können wir sehen, hier sieht man farblich auch gekennzeichnet hat sich der Status verändert. Diese Seite ist jetzt alles, wenn man hier öffnet, in Progress, also in Bearbeitung erkannt und kann hier anschauen, was das Erkennungsergebnis ist. Die Schrift ist glaube ich, muss man kurz lesen. Ja, so, recht gut erkannt worden. Also es gibt definitiv einige Fehler, die man hier sofort erkennen kann. Trotzdem, glaube ich, kann man davon ausgehen, dass der Text-Ditan eine relativ gute Arbeit geleistet hat. Aber hier zum Beispiel haben wir ein schönes Beispiel, wo das Layout nicht ganz hingehaut hat. Also wenn man hier schaut, hier dieses Wort, das ich als Laie jetzt nicht lesen kann, wurde nicht ganz von der Layout-Erkennung erkannt. Was man hier jetzt zum Beispiel machen kann, ist, die Textregion vergrößern und dann eben auch die Baseline verlängern. Ich mache das jetzt nicht schön, kann man aber schön machen und dann eine neue Erkennung starten. Da wird beim nächsten Mal, wenn man das dann auch speichert, beim nächsten Mal die Erkennung auch dieses Wort erkennen. Hier wurde ja nur ein Weh erkannt, aber hier ist glaube ich noch ein Buch, da haben wir vor dem Weh, der einfach ausgelassen wurde, weil die Baseline nicht richtig erkannt wurde. Genau, jetzt kann man dann hier im Textregitor Text korrigieren, beichern und wenn man dann, dass man mit dem Modell zufrieden ist, dann werde nächste Schritt mehr Seiten damit erkennen. Sind jetzt mehr Seiten erkannt, sagen wir 25, wie wir empholen haben für den Textmodell, kann man dann auch hergehen und eigenes Textmodell damit trainieren. Das würde wie folgt aussehen, ich speichere jetzt mal diese Seite, mache dasselbe mit mehr Seiten. Wenn ich das mit mehr Seiten machen will, dann empfiehlt sich, dann werden wir wieder in die Sammlung hineingehen. Die Erkennung von mehreren Seiten, wenn man diese auswählt, jetzt sagen wir mal, ich erkenne die ersten zehn Seiten, wähle dieses so aus und barte die Erkennung über den Erkennungsbutton hier oben, wähle wieder den Text, die dann aus und kann die Erkennung jetzt für diese neuen Seiten starten, die ich gerade ausgewählt habe. Anschließend würde ich diese korrigieren, beichern und sobald ich speichere, kann ich eben auch den Status senden und sagen, dass sind jetzt Trainingsdaten. Beichere diese, wenn wir jetzt wieder zurückgehen, das Dokument, sehen wir, hat sich die Farbe wieder geändert. Jetzt sehe ich, dieses Dokument ist erst mal, diese Seite vom Dokument ist erst mal als Trainingsdaten deklariert, diese kann ich für das Trainings Training verwenden, würde ich jetzt für diese 20 Seiten zum Beispiel machen, beichern und damit dann das Modell trainieren. Und dieses Modell wird dann wahrscheinlich für diese Handschrift, die speziell in diesem Dokument vorkommt, wahrscheinlich noch etwas besser funktionieren, als jetzt erst mal der Ausgangstext mit dem Text Titan, da das Modell natürlich sehr viel generischer ist und mit dieser speziellen Schrift wahrscheinlich nicht vertraut ist. Trotzdem kann man hier relativ schnell und relativ zügig Trainingsdaten erzeugen und diese dann auch für ein eigenes Modell Training verwenden und dann wie gesagt für größere Mengen einsetzen. Vielleicht kannst du nochmal ganz kurz den Text-Editor zeigen, also für diese erkannte Seite jetzt und jetzt bin ich mich sicher, auf jeden Fall, es kann ja auch vorkommen, dass im Text-Editor die Rechtschreibprobleme quasi angezeigt werden, also im erkannten Text, genau, ja genau. Das kann man ausschalten, genau. Es gibt Fälle, wenn man jetzt mit zeitgenössischem Englisch arbeitet oder auch Deutsch, da ist es ganz fein, wenn man eine Rechtschreibkorrektur hat, nichtsdestotrotz kann das sehr lastig sein. Es gibt dafür eine einfache Einstellung, die Rechtschreibprüfung hier in den Einstellungen kann man auch ausstellen und dann sehen wir, ist die Rechtschreibprüfung nicht mehr vorhanden und man muss nichts mit dem roten Wellenlinien vorliebt nehmen. Genau und vielleicht auch ganz kurz, was wir noch hier vorzeigen können, ist, wie man die Reihenfolge der Regionen oder der Zeilen verändern kann. Also die Frage war im Expert-Klein, da kann man die Regionen auch besser ordnen. Also da gibt es auch die Funktion, das automatisch zu machen. Die gibt es jetzt in der Web App noch nicht, aber man kann die Reihenfolge natürlich trotzdem ändern. Genau. Hier sehen wir ja all diese grünen Bereiche, wie wir vorher besprochen haben, sind Textregionen, die in diesem konkreten Fall gibt es 3. Jetzt nehmen wir mal an, Region 2 müsst ihr eigentlich nach Region 3 stellen. Dann gibt es hier das Layout Panel, wo ich diese Regionen eben auswählen kann, wie hier zum Beispiel, sobald ich draufklicke, dann sehe ich, das ist Region 3, das ist jetzt Region 2 und kann sie eigentlich recht einfach bei drag and drop neu anordnen. Dann ist jetzt diese Region nach Region 2 angeordnet. Genau dasselbe kann man auch für Zeilen machen. Wenn ich jetzt davon ausgehe, dass diese Zeile eigentlich die zweite Zeile in dieser Region ist, dann kann ich diese auch einfach nach unten ziehen und habe diese wiederum so angeordnet, wie sie jetzt nur zum Herz eigentlich sein sollte. Natürlich aber nicht ist. Genau. Dann gibt es noch ein paar Fragen in dem Frage- und Antwortbereich. Eine von ganz am Anfang zum Zusammenarbeiten mit Profiscannerfirmen, dass man die gescannten Seiten dann automatisch in Transkribus hochladen kann. Das ist das erste Gespräch, aber noch wisst wirklich konkrete Zusammenarbeit in dem Sinne. Wenn die Wege sich öffnen, dann jederzeit gerne. Wir sind, wie gesagt, sehr operativ eingestellt, dadurch, dass wir eine Genossenschaft sind, gibt es immer das relativ einfache Möglichkeit für jeden Genossenschaftsmitglied zu werden. Und dementsprechend können wir so die Partnerschaften auch ja konkretisieren, verstärken und dann gemeinsam im Grunde die Geschichte entschlüsseln. Dann war eine Frage zum neuen individuellen Modell. Also nein, das wird der große Unterschied sein. Die 100-monatlichen Seiten werden immer, so wie bei einem Free-Bit-Abo mit dem Smartphone, ablaufen. Das bedeutet, man bekommt monatlich 100 Seiten. Wenn diese nicht ausgenutzt, dann kann man sie nicht ins nächste Monat mitnehmen. Aber man bekommt halt wieder 100 neue Seiten pro Monat. Dann vielleicht nochmal 100 Seiten. Also ganz kurz, die Tests werden ganz normal über die 100 Seiten abgerechnet. Das heißt, wenn ich jetzt mal diese eine Seite teste, dann ist es für uns natürlich schwierig zu beurteilen, war das jetzt eine Testerkennung oder keine Testerkennung. Dementsprechend kostet es hier auch einfach ein Credit pro Seite. Okay, dann war eine Frage zu den Images auf Ordner-Ebene. Noch kann man das nicht machen. Es funktioniert im Expert-Klein, kann man ganze Ordner importieren, aber immer nur auf einer Ebene. Das bedeutet Ordner-Tektoniken. Das heißt, Ordner-Sprukturen mit mehr als einem Ordner innerhalb eines anderen Ordners, kann man zurzeit mittels Kribus nicht abbilden. Okay, dann war die Frage zur Tabelle. Das ist vielleicht auch ein gutes Beispiel. Schauen wir, ob wir, dann speichern wir das kurz nicht. Hier, hier haben wir eine Tabelle oder ein tabellenähnliches Struktur zumindest. Wie man eine Tabelle zeichnet, kann ich auch ganz kurz zeigen. Hier gibt es zu meinen Textregionen cool. Hiermit würde ich manuell eine Textregion zeichnen. Wenn ich hier aus, dann kann ich sagen, hier gibt es eine Textregion. Hier habe ich erstmal meine Textregionen an diesem Dokument ausgezeichnet. Dann speichere ich jetzt kurz mal die Textregionen und dann können wir uns die Tabellen anschauen. Jetzt wie zeichne man eine Tabelle, machen wir mal einen oberen Teil der Tabelle, sagen wir, das ist jetzt eine Tabelle, dann zeichne ich erstmal den groben Tabellenkörper und im nächsten Schritt muss man dann die Tabelle in Spalten und Zeilen auftrennen. Am schnellsten geht es mit zwei Shortcuts. Im Grunde mit A, da kann man horizontal die Tabelle trennen. Jetzt muss ich sie vorerst auswählen, also ich wähle die Tabelle aus, dann rücke ich A, dann sieht man diesen Strich, der erscheint. Mit diesem Strich kann ich die Tabelle dann in kleinere Spalten und Zeilen aufteilen. Dann habe ich jetzt zum Beispiel hier zwei Zeilen und mag dasselbe jetzt mit den Spalten machen. Dafür brügt man die Taste H, ist auch hier nochmal festgehalten. Brügt man die Taste V und dadurch kann ich dann die Spalten erstellen. Klick hier durch, schon habe ich die Tabelle gezeichnet. Jetzt damit die Tabelle noch editierbar ist, würde ich noch die Baselines hineinzeichnen. Jetzt zoomen wir vielleicht mal, wenn etwas klein ist, wäre besser. Jetzt habe ich zum Beispiel hier auch schon die Baselines gezeichnet. Das Ganze kann natürlich automatisch erfolgen. Ich mag es jetzt nochmal zu der Demonstrationszwecke so und wenn ich dann die Baselines hineinzeichne, dann sehen sie auf der rechten Seite auch schon wie Tabellenstruktur angelegt wird. Das heißt, nur Tabellenzellen, wo auch Baselines enthalten sind, werden rechts im Text oder da angezeigt. Das heißt, ich zeichne das jetzt so. Dann gibt es hier noch eine Vertikale oder zwei Vertikale, Baselines hier derselbe. Das ist jetzt nicht schön. Es geht eher nur zur Veranschaulichung. Dann gibt es hier noch und jetzt nur zur Veranschaulichungszwecke. Hier gibt es auch hier noch Baselines und sehen Sie hier auf der rechten Seite, entsteht schon die Tabelle, in der ich dann jede Zeile, die ich links in der Tabelle angelegt habe, auch editieren kann. So habe ich jetzt die Tabelle erzeugt. Sehen Sie, wenn ich jetzt hier hineinklicke, dann wird auch jeweils die Zeile markiert, die ich ausgewählt habe und umgekehrt. Wenn ich jetzt auf diese Zeile klicke, dann sehe ich, diese Zeile ist im Text-Editor gemeint. Ich kann das Ganze speichern. Dann gibt es noch eine kleine, relativ versteckte, aber sehr, sehr hilfreiche Funktion. Diese kann man so auswählen, wenn man die Steuerungstaste drückt, dann kann man eine ganze Tabelle markieren. Mit Steuerung C, also in der normalen Kopierung, in Bezug auf Tabellen, kopieren und auf die nächste Seite kopieren. Wenn ich jetzt Steuerung V drücke, dann kann ich genau eine und derselbe Tabelle hier einfügen. Das ist jetzt natürlich jetzt nicht die gleiche Tabelle auf diesem Blatt. Wer ist aber der Fall, dann habe ich relativ schnell genau die gleiche Tabelle kopiert. Meistens muss man die dann noch ein wenig zurechtziehen, dann ist vielleicht diese bald etwas anders und diese ist etwas anders und etwas verschoben. Sollteig ist die Zeile etwas höher, aber so kann man dann relativ schnell eine Tabelle von einer Seite zur nächsten kopieren und kann recht schnell Tabellen aufsetzen. Das Ganze kann man dann im Endeffekt speichern. Sobald man mal 20, 30 Seiten beisammen hat, gibt man diese in Tabellentraining und kann dann wirklich in Massenverarbeitung Tabellen erkennen und dann auch exportieren. Genau. Oft war jetzt nicht zu lang, so ausführlich genug zu machen. Genau, es war noch eine Frage zu den Server-Daten, also wie lange Daten auf den Servern gespeichert werden oder wie lange man selber Zugriff hat. Wenn nenziell eigentlich unbegrenzt, das heißt, solange die Daten so sind, was für was verfügbar sind, liegen sie auch auf den Servern. Sobald sie die Daten löschen, werden sie natürlich auch von den Servern entfernt. Bedeutet, wie Miriam vorher kurz erklärt hat, wenn wir jetzt hergehen und zum Beispiel das Dokument, das wir gerade angelegt haben, löschen, das kann man entweder hier machen oder auch hier, wenn man es mehrere Dokumente jetzt bearbeiten, exportieren, löschen, wie auch immer will, hat man immer hier oben auch die Stapelverarbeitung oder eben für das einzelnen Dokument kann ich sagen, ich lösche jetzt dieses Dokument. Dadurch wird das Dokument in den Bierkopf verschoben. Hier wird das 14 Tage gespeichert, nachdem 14 Tage rum sind, wird es auch hier rausgelöscht und ist dann im Grunde entfernt. Ich kann innerhalb dieser 14 Tage das Dokument aber auch wieder herstellen, das heißt, wie Miriam vorher gesagt hat, man muss sich nicht sorgen, dass das Dokument dann sofort weg ist, sobald man es wieder hergestellt hat, ist das Dokument auch verfügbar mit allen Versionen. Versionen ist, glaube ich, auch ein weiteres Stichpunkt, den wir vorher kurz behandelt haben. Wenn man hier oben klickt, rechts oben, dann sieht man alle Versionen, die ich gespeichert habe. Bei jedem mal, wo ich Speichern geklickt habe bzw. wo ein Job ausgeführt wurde, hat es eine neue Version hergestellt. Wie zum Beispiel hier die erste Version, die erstellt wurde, ist die Dexter-Kennung mit dem Text-Titan gewesen. Klicke ich hier rauf, dann sehe ich wieder genau jene Version, die der Text-Titan geliefert hat. Klicke ich dann auf die nächste Version, dann sehe ich die Version, sobald die Regionen noch so waren. Klicke ich auf die letzte Version, dann sehe ich die Version, die ich zuletzt gespeichert habe. Ich kann theoretisch immer wieder hergehen, sagen, jene Version war eigentlich die Version, die ich jetzt weiter bearbeiten will, diese neu speichern. Und jetzt ist die oberste Version, jene Version, die ich von hier geholt habe und wieder gespeichert habe. Gleichzeitig kann ich Versionen aber auch immer löschen, sagt die letzte Version, gefällt mir jetzt gar nicht, kann diese löschen und bin jetzt wieder auf der Version vorher. Dann vielleicht nur ganz kurz, weil die Frage war, wie man Seitenüberschriften zum Beispiel markieren würde. Dazu braucht es eben jene Struktur-Tags, die man vorher bei den Fieldmodellen gesehen hat, jene wie jetzt zum Beispiel für diese Region Strukturtypen, kann man so zuhören. Ja, jetzt zum Beispiel nur, weil es eine neue Collection ist, erstmal Absatz und Überschrift, aber Überschrift ist ja genau gefragt. Ich kann ein Überschrift zuweisen und somit hat, auch wenn das jetzt keine Überschrift ist, hat jetzt diese Region den Strukturtyp Überschrift. Mache ich das für viele Seiten, wie gesagt, 20, 30 bis 40 Seiten für Fieldmodelle, mache ich das auf all diesen Seiten und zeichne immer dieses Feld als Überschrift aus, dann wird das Modell auch lernen, dass das eine Überschrift ist, auch wenn es keine wäre. Das heißt so, wie ich das Modell verniere, wird es dann auch später das Material erkennen. Genau, langsam sind wir sicher, glaube ich, dann zu einem Abschluss. Ja, vielleicht ganz kurz können wir noch zeigen, wie man Collections teilen kann oder beziehungsweise andere Benutzerinnen hinzufügen kann, damit mehrere Leute arbeiten können. Genau, also wenn ich hier jetzt zurückfühle auf Sammlungsebene gehe, sehe ich hier meine Webinar Sammlung und habe hierher oben den User Manager. Hier kann ich andere Nutzerinnen und Nutzer hinzufügen, indem ich diese mit der gesamten E-Mailadresse suche, auf Add klicke und diese dann hinzufüge, wie zum Beispiel in einer Beispielnutzer. Wenn diese suchen, sagen das jetzt nun Transcriber. Also die Rolle Transcriber ist eine Rolle, bei der ausschließlich Text bearbeitet werden kann. Diese Rolle kann auch für eine Job starten. Deutet, wenn ich jemand zu meiner Collection hinzufüge als Transcriber, kann diese Person nur transklivieren, wie die Rolle auch schon sagt und keine Texterkennung starten. Kann diese dann hinzufügen. Genau, jetzt sieht man hier diese E-Mailadresse als Prescriber hinzugefügt und kann unter diese Collection mit dieser Person geteilt. Was ich dann auch sehen kann, ist hier über die Fertigkeit, alle Aktionen, die ausgeführt wurden. In den Dokumenten, hier sieht man zum Beispiel, ich habe auf Seite 1, 1, 1 und zweimal auf Seite 17 eine Speicheraktion durchgeführt und sehe, was jeweils Transcribers passiert ist, beziehungsweise welche Aktionen durchgeführt wurden. Genau. Vorhin vielleicht noch weitere Fragen ansonsten, weil wir hatten jetzt relativ intensiven Nachtmittag mit sehr viel Input. Wir sind natürlich immer sehr froh, Feedback zu bekommen. Wir haben auch immer wieder Tippfehler drinnen, wie ich gerade sehe, die wir definitiv versuchen, auszubessern. Wie Sie sehen, ist die Übersetzung noch nicht zu 100% verfügbar. Dort arbeiten wir auch daran. Aber ich habe bereits gesagt, wir haben ein sehr breites Spektrum als Sprachen, dass wir abdecken und versuchen, dass Tribus so vielen Personen wie möglich auch international verfügbar zu machen. Aber dadurch, dass es halt sehr vielseitig ist, ist es auch nicht immer möglich, alle Übersetzungen und alle Features immer perfekt zu haben. Wie gesagt, wir geben uns sehr Mühe. Und bei Fragen sind wir immer verfügbar und versuchen natürlich so schnell wie möglich zu antworten. In diesem Sinne würde ich mich dann bedanken. Das war, glaube ich, sehr gut. Weil die Frage kam, die Präsentation kommt auch noch mal als Download. Das Webinar haben wir aufgezeichnet. Deshalb haben wir auch die Mikrofonialift umgeschaltet, damit wir die Aufzeichnung schön sauber auf YouTube hochstellen können, damit auch im Nachgang die Präsentation noch mal angeschaut werden kann und das Webinar noch mal zur Verfügung stehen wird. Genau. Gibt es von Eurer Seite noch etwas zu sagen, Miriam oder Helene, oder habe ich irgendetwas vergessen? Irgendetwas vergisst man immer. Ich hoffe, es war. Ja, genau Miriam hat den Link zu den Folien auch von hier in den Chat eingestellt, aber wir können gerne auch noch mal E-Mail im Nachgang schicken. Ja, in diesem Sinne würde ich sagen, einen schönen Abend noch. Viel Spaß beim Arbeiten mit uns Tribus. Es wird nicht immer Spaß machen, aber im Endeffekt hoffen wir, dass das ergeben wird.