 Seit dem letzten Video zur eigentlichen Texterkennung wissen Sie, wie man grundsätzlich Dokumente im Transkribus Expert Client automatisch transkribiert. Den Schlüssel zum Erfolg sprich zu einer möglichst fehlerfreien Erkennung stellen aber die verwendeten Modelle dar. Hierbei gibt es drei Varianten. Sie können selbst ein Modell trainieren, jemand kann ein Modell mit einer Collection Teilen, in der sie Mitglied sind oder sie können ein sogenanntes Public Model verwenden. Sehen wir uns nun die Vor- und Nachteile dieser Varianten an. Ein eigenes Modell wird trainiert, in dem eine händische Transkription, die sie für einen Teil der Seiten angefertigt haben, dem Modell als Trainingsdaten zur Verfügung gestellt werden. Damit wären wir auch schon bei den Vorteilen. Wenn selbst trainiert das Modell, kann genau auf die in Ihren Dokumenten verwendete Hand- oder Druckschrift trainiert werden. Das Modell lernt also genau diese zu erkennen und in Maschinenlesbahntext umzuwandeln. Idealerweise weisen die Ergebnisse der späteren Texterkennung niedrige Character Errorates auf. Generell lässt sich sagen, dass selbst trainierte Modelle mit möglichst homogenen Dokumenten am besten funktionieren. Dies ist meist bei Dokumenten der Fall, die entweder aus der gleichen Zeit oder vom gleichen Schreiber stammen. Doch auch, wenn sich die Handschrift mehrerer Personen in den Dokumenten befinden, liefert Transkribos gute Ergebnisse, wenn genügend Trainingsmaterial für jede Handschrift enthalten ist. Somit bietet die Möglichkeit, eigene Modelle trainieren zu können den Vorteil, diese sehr gut an das eigene Material anpassen zu können, um sehr gute Ergebnisse zu erzielen. Auf der anderen Seite der Medaille steht aber auch einiges an Fleißarbeit und Mühe. Die Erstellung von sauberem Trainingsmaterial, also die händische Transkription, kann einiges an Zeitaufwand bedeuten. So ist dies bei umfangreichen Projekten mit großen Korporar, oft nur dank vieler fleißiger Hände, durch sogenanntes Crowdsourcing möglich. Zusätzlich kann die Transkription von historischen Handschriften auch als hohe Kunst angesehen werden. Viele Menschen können alte Schriften wie etwa die deutsche Kurentschrift oder Sütterlin gar nicht mehr lesen, geschweige denn sauber transkribieren. Genau hier kann Transkribos aber wiederum mit einer Lösung aufwarten, den öffentlich zugänglichen Modellen, die sogenannten Public Models. Public Models stellen einen schnellen und einfachen Einstieg in die automatische Transkription von Handschriften dar. Anders als selbst trainierte Modelle können Public Models sofort verwendet werden. Haben sie also Schriftstücke, die zu einem bereits existierenden öffentlichen Modell passen, macht es Sinn einen Probelauf zu starten. So können Sie mit ein paar wenigen Seiten einmal schauen, welcher Ergebnisse mit einem Public Model für Ihr Material erzielt werden kann. Zum Stand der Aufzeichnung dieses Videos sind bereits mehr als 80 verschiedene Modelle öffentlich frei verwendbar. Viele weitere sind bereits am entstehen. Auf unserer Website readcoop.eu können Sie sich zunächst einmal einen guten Überblick zu den Modellen verschaffen und diese nach verschiedenen Kriterien durchsuchen und filtern. Außerdem können Sie hier die Modelle auch sehr gut testen. Laden Sie einfach eine Beispielseite Ihres Materials hoch und Transkribos liefert Ihnen eine Transkription Ihres Materials mit dem jeweiligen Modell. So können Sie vorab schon einmal recht gut beurteilen, wie gut das Modell für Ihr Material funktioniert. Nehmen wir zum Beispiel das Modell German Current M2. Wir bezeichnen es immer als den Current 1000 Sassar. Dieses Modell wurde auf Basis eines sehr großen Korpuses aus den verschiedensten Current, Sütterlin und Frakturschriften trainiert. German Current M2 kann diese Schriften auch von Schreibern, die überhaupt nicht in den Trainingsdaten des Modells enthalten waren, vom Standweg meist relativ gut erkennen. Doch wie funktioniert nun die Anwendung eines öffentlichen Modells auf Ihr Dokument? Öffnen Sie zunächst Ihr Dokument, wie in den vorherigen Videos beschrieben. Klicken Sie auf den Reiter Tools und im Abschnitt Text Recognition auf Run. Nutzen Sie im erscheinenden Dialogfeld die Schaltfläche Select HDR Model. Oben links können Sie auswählen, welche Modelle angezeigt werden sollen. Wählen Sie hier Public Models. Nun zeigt Ihnen Transkribos alle Public Models an. Bei der Auswahl sollten Sie darauf achten, dass Ihre Dokumente zum gewählten Modell passen. Achten Sie auf die Sprache, die Schrift, die Epoche und den Stil. Am besten haben Sie aber bereits eines der Modelle auf unserer Website readcorp.eu ausgewählt, angesehen und getestet. Je besser ein Public Model zu Ihren Dokumenten passt, desto besser später die Ergebnisse. Wählen Sie nun aus der Liste das gewünschte Modell aus und klicken Sie auf OK. Wählen Sie nun den Bereich aus, für den das gewählte Modell genutzt werden soll und bestätigen Sie den Start der Erkennung. Und das war's schon. Jetzt wissen Sie, wie Modelle in Transkribos funktionieren. Toben Sie sich ruhig mit den Public Models etwas aus, um Ihr Material automatisch zu transkribieren. Wie das mit eigenen Modellen funktioniert, zeigen wir Ihnen im nächsten Video über selbst trainierte Modelle.