 Okay, gut, ja, und das Projekt, ja, beschreibt TransTribus als ein Tool für ambitionierte Hobbyforscher und Forscherinnen und private Webprojekte. Schauen wir uns das mal an. Für die Vorstellung an die, Sie haben es ja schon in der Ankündigung gehören auch in der Präsentation, also im Programm, dass das jetzt kein Vortrag wird für Spezialisten, sondern genau das Gegenteil, ich will zeigen, dass man TransTribus auch als Heimatforscher live verwenden kann. Bis genau das mit dem, was ich in den Netz zeigen werde, nicht mit diesem großen Projekt mit dem Falt von Will, kann und will, das will ich gar nicht kann. Ich habe wieder den institutionellen Intergrant, noch irgendwelche Projektgelder oder Fördergelder in 100.000 Euro, und ich will einfach zeigen, dass TransTribus auch für den Heimatforscher irgendwo in der Nähe für Innsbruck geeignet ist, um seine Dokumente aufzuarbeiten. Dafür muss man kein Genies sein, was Technik angeht, sondern es reicht, wenn man sich, wir haben die Computer etwas umgehen kann und sich da einarbeitet. Ich sage immer auch zu meinen Studierenden, wo ich diese Vorlesung oder diese Praktika zur TransTribus mache. TransTribus ist genial, aber derjenige TransTribus verwendet nicht. Also wenn ich ein CD-Spieler einschalte, Musikabspiele, bin ich kein Musiker. Und sie müssen jetzt, wenn sie TransTribus verwenden, kein Genies sein. Das macht TransTribus für sie. Das ist einfach anzuwenden, man muss es ein paar Stunden investieren, aber man kann es dann wirklich auch aus Leih verwenden. Und darum will ich Ihnen heute einen Beispiel, das ich wirklich privat gemacht habe, nicht um eine Funktion aus Wissenschaftlern, Akademie der Wissenschaften, sondern aus jemandem, der aus Niederbayern kommt, in der Nähe von Pazar. Aus diesem Ort war ein Kloster, war das Kloster Alterspark. Und mit dieser Geschichte beschäftige ich mich schon seit über 20, 30 Jahren. Und TransTribus hat mich da wirklich weit nach vorne gebracht, weil ich sehr, sehr viele Gälen erschließen konnte, die vorher nicht zugänglich waren. Das kann aber wirklich jeder oder jede von Ihnen auch machen. Es ist relativ günstig, wenn Sie, wie ich, etwas Website programmieren können, können Sie es das meiste selber machen. Man muss nur ein paar Tausend Euro investieren, um Theory und Search, Installation integriert zu können. Es kann aber sicher durch irgendwelche Fördergelder abdecken. Es ist ja nicht viel, aber ansonsten kann man das wirklich selbst in die Wegeleitung nach umsetzen. Genau. Also, das ist das Kloster, wenn Sie mal in der Gegend sind. Bis in Niederbayern üblich ist, haben wir natürlich auch eine ganz gute Brauerei. Also, das kann ich nur empfehlen. In der Nähe verpasst Sie also ungefähr 20 Kilometer von Schelling, also bis zu österreichischen Grenzen. Ja, und was ich da vor zwei Jahren angefangen habe, war eben sehr Webseite zu programmieren oder zu podieren, wie man eigentlich besser sagt, damit Inhalten zu füttern. Ich kann mich da relativ gut selber helfen. Also, alles, was Sie da sehen, habe ich selber gemacht. Wie Sie vielleicht wissen, wenn man wissenschaftliche oder textliche Inhalte für eine Webseite darstellen will, ist es umso wichtiger, sehr viele Bilder einzubauen. In der Webseite wird nur angenommen, wenn man sich schön ausschaut. Die Inhalte können noch so gut und so wichtig sein, die Webseite nur schön sein. Nun, was war das Tipp aus meiner Erfahrung? Ja, mit welchen Wellen beschäftigt man sich dann, wenn man in diesem Bereich, also in der Historie sich bewegt, zum Beispiel Traditionsbücher, also diese Vorform von Urkunden, Privilegienbücher, Urkunden, Barre und so weiter und so weiter. Also das sind die typischen Amtsbücher, Chroniken, alles, was man zum Beispiel auch in der Geschichte seiner Stadt, seinem Ort, in der Namensforschung oder auch eben in der Geschichte eines Großes sich beschäftigen muss, mit diesen Wellen. Und diese Wellen können, mit meinem Fall zum Beispiel, aus von 1130 bis ins 19. Jahrhundert, große Pampereiten. Also wenn Sie hier Modelle trainieren für Transpibos, müssen Sie verschiedene Modelle für verschiedene Zeit trainieren, sonst funktioniert das natürlich nicht. Ja, also diese Teile dieser Webseite habe ich in eingeteilt, in Forschung natürlich, damit auch wirklich wissenschaftliche Artikel publiziert werden können zur Baugeschichte, die Musikgeschichte, das ist eine Alterspaßung. Dann digitalisierte, alle mittelallführlichen Handschriften, das Alterspaß sind über eine AAAF-Schnittstelle mit der Bayerischen Straßenpartie verbunden, also ich kann das alles auf der Webseite anziehen. Das ist ein anderes Thema, aber AAAF ist ein Stichwort, das Sie sich vielleicht merken sollten, wenn Sie das vorhaben. Aber ein Bereich, speziell für die Heimatforschung, wo ich nicht so großen Wert darauf lege, dass es alles richtig zetiert ist oder wo wissenschaftlich ist, sondern aus wirklich lokaler Forscher ihre Publikationen veröffentlicht werden. Was dann für uns jetzt heute sehr interessant wird, ist dieser Bereich Gloster Allersburg Digital Cut. Hier ist eben diese Read&Search Umgebung eingebissen. Und alle diese Bereiche, die Sie mit der Geschichte des Glosters beschäftigen, habe ich jetzt unabhängig von Read&Search schon mit Transpribos bearbeitet. Viele Sachen mit diesem Print-Modell, Transpribos Print, das sind Drucker aus dem 17. und 18. und 19. Jahrhundert, wo OCR ihnen überhaupt nichts bringt, weil es wahnsinnig fehlerhaft ist. Aber dieses Print-Modell arbeitet wirklich hervorragend. Sie kennen sich ja auch diese Ausgaben aus dem 18. Jungen Barock Ausgaben zur Geschichte, Aufarbeitung von Urkunden und sonstigen Sachen. Wie gesagt, mit OCR haben Sie hier keine Schatten. Transpribos Print ist hervorragend. Und das alles, was hier zur Geschichte, diese ganzen Kapitel zur Geschichte, Sie sehen auch das älteren Quellen, sind mit diesem Print-Modell bearbeitet worden, ohne dass ich irgendwas trainieren musste. Das funktioniert von Haus aus wirklich sehr gut. Dann habe ich jetzt zwei Beispiele mit einem Auch- und Transpribos-Kanz-Energie-Spaunderer, aber jetzt extensiv arbeiten kann. Das ist eine Chronik, zum Beispiel, von diesem Abt Wolfgang, ungefähr 1540, angefertigt worden, in dieser frühen Form der Pursidium, Purenzschrift, Entschuldigung, die Pursidium-Purenzschrift. Und da gibt es schon eine Übertragung aus dem 19. Jahrhundert in Latein. Das habe ich mit Transpribos Print eingestellt. Und habe das dann hergenommen, um Crown-Troos für das Modell für diesen Abt zu verwenden. So wenig Arbeit. Wir müssen nicht selbst übertragen. Verwenden sich Quellen, die es schon gibt im Druck. Wie gesagt, die Chronik existiert in einer Transcription, aus dem Jahr 1860, glaube ich. Das lad ich in Transpribos, verwende das dann, um Crown-Troos zu erstellen. Und bekommt dann in dem Fall ein wirklich super Abendes Arbeit des Handschriften-Transcriptions-Modell für diesen Abt und diese Zeit. Weil der Chronik das Abtier hat, Höger war es ähnlich. Das ist ein Misch-Amts-Profen, etwa 1.000 Seiten mit allen großen Besitzungen und so weiter. Aber die ersten 100 Seiten ist der Chronik des Ghosters. Die gab es schon als Transcription. Und mit dieser Transcription habe ich dann mein sehr erfolgreiches Höger-Modell trainiert. Mit dem kann ich, glaube ich, 10 verschiedene Amtsbücher dieses Ghosters mehr oder weniger fehlerfrei überdrehen. Also nutzen Sie vorhandene Ressourcen, bevor Sie anfangen, selbst Transcription. Das könnte ich jetzt so weiterführen. Da gibt es noch viele Kapitel, die da auf diese Art bearbeitet wurden. Nur noch einen Tipp, wenn Sie in dieser Art forschen, das hat jetzt mit Transpribos nichts zu tun. Ich weiß jetzt zum Beispiel, Ghoster Allersbach, der wird seit Generationen dazu geforscht. Es gibt mehrere Personen mit mir, die daran forschen und es führt welche gebliebenen Zukunft. Alle fangen immer wieder an, sich die Namen herauszuschreiben, die Namen der Mönche, der Angestellten und so weiter. Diese Ortsbezeichnungen, die hat man sehr viele Besitzungen, mit den verschiedenen Schallweisen von 12 bis zum 18. Jahrhundert. Jeder bedient wieder von Neu. Warum? Legen Sie sich eine Tatangang mit Mönchen mit Orten an, füllen Sie die Ständig auf und stellen Sie das online zur Verfügung. Hier die Kolleginnen und Kollegen werden sehr dankbar sein für die Selbstarbeit. Ist nicht viel dahinter, aber ist sehr effektiv. Ja, und dann diese Installation, die kennen Sie vielleicht schon. Der oberen Teil ist meine Webseite, Ghoster Allersbach. Über diese iFrame Einbindung ist, wie den Search eingebunden. Sie sehen, man hat ein Bild aus Allersbach verwendet, aus einer Allersbach Handschrift. Wir haben die Farben auch etwas angepasst, das Logo eingebunden. Also man erkennt eigentlich nicht, dass das nicht auf meiner Webseite ist, sondern es ist wirklich eine sehr super Lösung, wie wir das machen. Also ich würde auch beraten, davon auch den Profis unter Ihnen selbst zu programmieren. Das hat keinen Sinn. Also, Read&Search hat schon seine Berechtigung. Und was das kann, können Sie niemals selber umsetzen. Zumindest nicht für den Preis. Ja, hier meine Modelle, eine kleine Aushalt, die ich in den letzten zwei Jahren ungefähr so trainiert habe. Das beginnt mit dem Liebertraditionen. Der ist ungefähr 1120, 30, 40. Und die ältesten Eintragungen in Latein natürlich und geht bis 1350. Dann eine große Herausforderung sind die Rechnungsbücher. Das gelostet. Aber eine wahnsinnig lohnende Quelle, wenn Sie das mal nicht angeschaut haben. Rechnungsbücher sind für alle Disziplinen eine wirkliche Herausforderung vom Lesen. Wir verstehen hier, aber die Inhalt bringen wahnsinnig viel Neues zur Brust der Geschichte oder zur Wortsgeschichte und so weiter. Wolf Komades habe ich in der KIA geht jetzt funktioniert und auch bei KIA Thürger ist das Modell dann auch diese späteren Rechnungsbücher. Historische Renner und so weiter und so weiter. Ich bin immer etwas skeptisch mit der Angabe der Charakter AeroRate. Sie sehen, dass diese Werte ja eigentlich ganz gut sind. Aber wenn Sie schauen, wie viele Wörter das ich trainiert habe, sind es natürlich sehr wenige. Ich glaube, die großen Parentmodelle haben irgendwo bei 5 Millionen so in der Größenordnung, 3, 4, 5 Millionen so in der Größenordnung. Ich komme im besten Fall ungefähr an 400.000. Ja, natürlich funktionieren meine Modelle dann auf diese. Ich schränke die Anzahl sehr gut und habe Testung an die Polizei. Aber es hat keine Breitenwirkung. Aber das muss es auch nicht haben. Es ist wichtig, dass diese Modelle disziplinieren für ihre anländungsfälle gut funktionieren. Vielleicht auch noch eine Sache, eine Erfahrung von mir zum Training von Modellen. Ich habe das größtend gehört von einer Spezialistin für künstliche Intelligenz. Garbage in, Garbage out. Ich weiß nicht, ob Sie den Ausdruck kennen. Umso geringer die Anzahl der Wörter disziplinieren. Umso perfekter muss das Trainingsmaterial sein. Also wenn Sie 5 Millionen Wörter trainieren, ist das vollkommen egal, ob Sie dann Fehler drinnen haben. Sie spielen in der Größenzahl von Wörtern keine Rolle. Wenn Sie hier nur mit 50.000 Wörtern arbeiten und haben ein schlampiges Trainingsmaterial, wird das Modell nicht richtig funktionieren. Garbage in, Garbage out. Wenn Sie im Müll trainieren, kommt Müll raus. Umso weniger Wörter, umso genauer müssen Sie das tun. Auch besonders, wenn Sie Baselines zum Beispiel anlegen. Ich sehe oft, dass die Baselines viel zu kurz sind als vor Enden und die Wörter weitergehen. Alles nach der Baseline wird es trainiert. Also seien Sie da wirklich korrekt und nehmen Sie sich Zeit für das Ding. Ja, hier ein Beispiel. Aus diesem Liebertraditionen wird diese Ansichten funktionieren, muss ich Ihnen auch nicht erklären. Sie sind ja alle Transkribus-Profis. Nur mal zu sehen, mit was Transkribus hier zu kämpfen hat. Ich weiß nicht, ob Sie das lesen können. Also man kann es natürlich grundsätzlich nur lesen, wenn man Latein kann, weil ohne Latein Ketten ist, ist das etwas schwierig. Aber ich will Sie nur mal erklären. Sie sehen da das erste Wort Noverli. Mit diesem Auswahlungszeichen. Das Mittelalterlicher Latein, besonders in dieser Form, ist wie Stehnung, mehr oder weniger. Es ist fast alles abgekürzt. Also Reflexionen am Ende sind sehr oft abgekürzt. Also Noverind, Omnes, Christi, Viteles, Gott, Queda, Nobelysphere. Also fast jedes zweite oder dritte Wort ist abgekürzt. Es ist für Transkribus aber kein Problem, das zu lernen. Ich bin kein Latein-Spezialist, aber ich kann das soweit lesen und korrekt übertragen. Wenn ich das dann übertragen habe und trainiert habe, wird es in allen späteren Sachen, wo ich das Modell anwende, korrekt ausgeschrieben. Also natürlich kann Transkribus kein Latein und versteht keine Lateingrammatik. Aber sie versteht die Abkürzungen. Und sie versteht, wie ich auch gesehen habe, wo ich das eigentlich erklären habe, dass Zusammenhänge erkannt werden. Zu wissen im Latein, dass Adjektive von diesem Moment die gleiche Änderung haben muss, je nach Geschlecht. Die Abkürzungen sind hier in diesen Büchern aber sehr uneinheitlich. Transkribus erkennt aber trotzdem, wie diese Wörter hintereinander vorkommen, wie sie es richtig übertragen muss. Also wie gesagt, ich kann es nicht erklären. Ich verstehe diese gar nicht. Ich kann noch feststellen, dass es sehr gut gemacht wird. Ja, das nächste Modell ist dann etwas später. Das ist, ja, 1350, wenn ich mich nicht richtig erinnere. Das ist um die Zeit. Lieberbriefe Legiorum ist jetzt soweit keine große Herausforderung. Schöne Schrift, die man schön lesen kann, auch mit diesen Abkürzungen, aber gut handelt da. Also wenn ich Bilder mit dieser ähnlichen Schrift sozusagen uploade, habe ich eine Arrow Rate von ja, bestimmt unter drei Prozent. Eine gewisse Herausforderung hat dann gewählende wie diese hier. Das ist ein Urbar, also eine Besitzverzeichnis mit zwei Spalten, auch wieder mit vielen Abkürzungen, mit besonderen Zeichen für Währung zum Beispiel, mit Solidi, Denari, Pfund und so weiter. Sie können sich hier wahnsinnig viel Arbeit sparen, wenn Sie zu Beginn schon vielleicht mit 50 Seiten oder noch weniger Seiten trainieren. Wie immer wieder vorkommen in Abkürzungen werden sich fortgelehnt. Also wenn Sie wollen, dass Pfund aus LB, Lateinisch-Lumbum geschrieben wird, die Scheiben sind zehn Seiten, da macht Transkribus das immer richtig. Das ist wirklich eine Arbeitsersparnis. Genauso mit Gewichtsangaben oder bei der Währung, wie du angegeben ob dieser Regensburger, Wiener Währung, eine Innsbruckwährung ist, so bestimmte Abkürzungen lernen Transkribus wirklich extrem schnell. Das sehen ja diese Bezeichnungen. Wenn Sie Transkribus sagen, dass diese Lateinischen Zahlen, dass sie die in arabischen Zahlen haben wollen, auch kein Problem. Sie müssen es nur konsequent trainieren. Hier dann diese Frühe, die ich schon gesagt habe, diese Chronik, diese Hörgabronik in der 1660, ist für jemanden, der Korrent gut lesen kann, natürlich keine große Herausforderung für mich schon. Also ich bin Mittelalter Spezialist und habe Korrent lesen mit Transkribus gelehrt, sage ich Ihnen ganz ehrlich. Also ich habe es in der Schule nicht gehabt, wie ich habe bei der Magisterarbeit einmal ganz kurz gebraucht. Wenn ich ein Energister, das konnte ich dann halbwegs übertragen. Aber wenn Sie dann einmal ein paar Hundertzeiten Korrektur gelesen haben, Transkribus, dann lernen Sie korrekt. Nicht nur die Maschine, sondern Sie selber auch. Das ist kein Witz, meine ich wirklich ehrlich. Ich habe mit Günther Mühbläger schon mal darüber gesprochen. Transkribus ist die beste Möglichkeit, diese Schrift zu lernen. Ja, dann ein Beispiel auch, wie ich vorher erwähnt habe, von diesen Rechnungsbügern. Wir sehen etwa 1450. Natürlich sind Rechnungsbücher grundsätzlich mal was Uninteressantes. Ja, das sind nur die einnahmenen Ausgaben und die Sinanzverhalten einer Institution. Aber es werden sehr oft Personenname genannt, Beschreibungen, wie bestimmt die Bauten auszuführen waren, Verträge mit Handwerkern, wo Bücher gekauft wurden, wie der Maler geheißt hat usw. Also Daten, die man normalerweise nicht finden kann, findet man eben in diesen Rechnungsbügern. Dass das für Transkribus eine Herausforderung sein könnte, glaube, sehen Sie schon an dem Bild. Verschiedene Sachen. Das Erste, was auffällt, sind natürlich diese Striche. Und das mag Transkribus grundsätzlich gar nicht, natürlich. Das sind Separators. Man würde lauter geteilte Zeilen bekommen. Vielleicht zum Hintergrund diese größtartige Verpflichtung bei einer jährlich stattfindenden Visitation der Rechnungsbücher, dem Vater ab vorzulegen und der Vater ab in seiner großen, großen Eifer hat sich dann so abgehakt, durchgestrichen. Das hat diese Seite korrekt. Und dann kommen diese Striche her. Aber ich kann Ihnen nicht sagen, nach ein paar Seiten Training war das überhaupt kein Problem. Das war nie ein Problem, komischerweise. Ich habe gefürchtet, dass es nicht geht. Aber ich habe doch ungefähr 100 Seiten, wo ich dann trainiert habe, spielte das keine Rolle. Das würde ich einfach nicht mehr tun. Das nächste Problem ist natürlich bei dieser Schrift. Sehr schlamppig geschrieben. Extrem viele Abkürzungen. Natürlich auch im Latein wieder buneinheitlich. Also der Schreiber des Rechnungsbuches ist nicht lang Gedanken über die lateinische Plamatik immer. Sondern der hat einfach geschrieben, um wenn er die Änderung nicht wusste, hat er irgendwie so einen Haken. Ich mache irgendwas. Transkribus hat trotzdem kein Problem damit. Obwohl es inkonsistent ist. Warum das so ist, ich kann es Ihnen nicht erklären. Dann müssen Sie die Spezialisten hier fragen. Die wissen da mehr darüber als ich. Ich kann Ihnen nur sagen, dass es funktioniert. Ja, jetzt komme ich zu einem Kapitän der ersten Monaten meiner Tätigkeit mit Transkribus. Ich hoffend, die Kollegin Innsbruck haben es nicht gehört, wie oft ich das lucht habe. Ehrlich ernst gemeint, aber trotzdem. Sie sehen, glaube ich, schon das Problem. Wahrscheinlich haben Sie das alle schon mal gehört. Aus irgendwelchen Gründen teilt diese Lehranalyse die Zeilen auf. Sondern in diesem Fall für mich völlig unverständlich herum. Es gibt schon Sachen, wo es Sinn macht, wenn es tabellenartige Strukturen sind. Dann macht es Sinn, dass die Zeilen aufteilt. Aber hier, vielleicht können Sie mich sagen, ich kann es nicht erklären. Aber zur Verteidigung der Kollegin Innsbruck, muss ich sagen, dass noch Günther Müllbläber dann den einfachen Tipps gegeben hat, bei den Voreinstellungen einzustellen, ignore separators. Wichtig. Ich habe eine der wichtigsten Transkribusregeln. Das hat mich monatlich gekostet meiner Zeit, weil ich es nicht gewusst habe. Wenn Sie das eingeben, ich denke, das ist eigentlich dafür gedacht, in tabellartigen Strukturen diese Linien, diese wirklichen Trendlinien zu ignorieren. Aber komischerweise nimmt er auch größere Abstände zwischen den Wörtern, als separator war. Bitte einfach diese Einstellermachen bei die Options, ignoriere diese Zeilen-Renner, dann funktioniert das perfekt. Oder auf jeden Fall um einiges besser. Hier habe ich das dann gemacht. Ignore separators. Und Sie sehen, dass es dann auch wieder nicht perfekt ist. Das ist wieder dieses Global aus dem letzten Beispiel, dass er eigentlich zweispaltig ist. Und hier sollte er diesen separator, diesen space nicht ignorieren. Aber jetzt ignoriert er natürlich. Was macht man dann? Ja, dann macht man sich die Arbeit, dass wir diese zwei Spalten wirklich per Hand einzeichnet, dass sie Text-Rechens einzeichnet. Und dann macht man das nochmal ein bisschen besser. Aber ich wünsche viel Spaß dabei, dies bei 10.000 Seiten hat zu warten, die Text-Rechens einzizeigen. Aber das zeige ich, dass man mir das besser tut. Aber Sie sehen auch hier gibt es immer noch Probleme. Also dieses Teil, den ich farbig gemacht habe, wird dieses Schlesst, das heißt D, also fitinage, fennig sozusagen, oft nicht in eine Zeile gewirkt. Immer noch, obwohl jetzt alles eingestellt ist, bestmöglich eingestellt, das riskiert. Ja, was macht man dann? Wir brauchen zwei Lösungen. Zum einen eine Lösung, diese Text-Rechens festzulegen. Das haben wir vorher schon gehört, wie das geht. Mit Peter Paler ist es eine. Und das zweite ist, was jetzt seit zwei, drei Wochen glaube ich, was das geht, mit Baseline-Training. Baseline-Training ist wirklich etwas hervorragendes, was all diese Probleme per Seite schickt. Es funktioniert hervorragend. Mit wenig Trainingsaufwand. Ich habe es jetzt in den letzten drei Wochen wirklich intensiv probiert. Und es sind fast alle Layout-Probleme, die ich vorher sehr intensiv hatte, gelöst worden damit. Ja, hier ein Beispiel dafür. Das ist ein Rechnungsbuch wieder, so wie ich es vorher schon erwähnt hatte, aus dem Jahr 1563. Und das ist eine Vorbereitung für ein Forschungsprojekt, das ich jetzt beantrage habe. Neben für diese Rechnungsbrüder, Sie haben schon gemerkt, dass ich das sehr überzeugt bin für diese Quelle und begeister bin. Wir versuchen jetzt diese Rechnungsbrüder automatisiert auswerten zu können. Ich bin für diesen Transcribersteil zuständig und ich muss diese Daten so strukturiert wie möglich erzeugen, damit ihr dann ohne großen Aufwand in ein Textformat wahrscheinlich in TI weiterarbeiten könnt. Sie sehen hier schon, wir haben bestimmte Struktur-Elemente, oben die immer diese Jahresangabe, dann diese sogenannten Kunden bezieht ja nicht. Das sind einfach Zusammenfassungen wie in einem Kunden daraus zu glauben, alles was sie an Benzin ausgegeben haben, die Essen ausgegeben haben, was also so größere Überschriften. Und der andere Teil, es sind die einzelnen Buchungen. Jede Einzahlung, jede Ausgabe ist da als einzelne Buchungen und beginnt immer mit Item. Flateinisch, also kann man das übersetzen und folgen wir es oder so in die Richtung. Was ich geschafft habe, dass ich diese Jahresangaben aus Struktur-Elemente erkannt habe, die heißen auch hier, das sind mit hier getagt. Auch diese Kunden sozusagen, die habe ich mit Headline getagt und dann diese größeren Zusammenhänge, das sind dann die Postingsgabe heißen. Das habe ich behandtein gezeichnet und wenn man das so macht, kann man das exportieren und bekommt wirklich, wenn ich es jetzt in Excel importieren würde, zeilweise schön aufgelistet eine komplette Buch. Also ideale Voraussetzung. Aber nur wenn sie natürlich vorher diese Arbeit machen. In dem Fall funktioniert es ganz gut, weil die Strukturen ja doch gut erkenntlich sind. Etwas, was ich nicht geschafft habe, dass ich diese großen Planen bereiche, also diese Einzel Buchungen unterteilen kann. Das geht nicht. Also ich bekomme eine Block mit diesen Einzel Buchungen, aber keine Einzel. Das Problem dabei ist, dass die optisch nicht gut zum unterscheiden sind. Also die anderen natürlich schon, das ist eine größere Schrift. Kein Problem, das zu erkennen. Die Kunden sind meistens weiter unten angeordnet. Die übt sich immer oben, also das ist gut unterscheidbar. Aber bei den anderen Angaben reicht es nicht für die KI, das zu unterscheiden. Das muss dann noch behandelt werden. Ja, ich habe so ein kleines Video aufgezeichnet, mit welcher Besitzer funktioniert. Wie kann man die Wiedergabe starten? Ja, genau. Sie sehen hier, wie ich dieses Base du Pala, glaube ich, ist der richtige Ausdruck starte. Im Seitenbereich eingebe ich, wie wichtig ist das zu sagen, dass die Erkrankte Regionen rectangles sind. Also sonst bekommen sie ganz schräge Sachen und ist auch gut, dass sie sagen, dass sie bestimmt die Bröse haben müssen. Ja, und dann, wenn es gestartet wird, kommt wirklich das so aus der Maschine raus. Nach etwa 50 Seiten drängt es nicht viel. Was ich dann allerdings machen muss, dass ich diese einzelnen Buchungen noch behandt und erteile. Sie sehen, diese hellblauen Bereiche, die will ich er einzeln haben. Und das kann man mit dem horizontalen Trainer eigentlich sehr schnell machen. Das Star pro Seite, Sie sehen es in ein paar Sekunden. Spargeln, aber dann die Arbeit, das händisch in den Text-Files unterteilen zu müssen. Ja, im nächsten Schritt, wenn ich das... Ja, genau, ich komme jetzt noch... Ein Tipp noch. Machen Sie diese Unterteilung bitte niemals, wenn die Base-Line schon vorhanden sind und Text fahren müssen. Sie werden es nicht schaffen, die Linien so einzuzzeichnen, dass sie nicht mindestens zwei Textbereiche haben und die werden dann verdoppelt. Also Sie haben da wahnsinnig viel Nacharbeit. Also diese Unterteilung der Text-Ridgens bitte immer machen, bevor sie die Texte oder die Base-Lines eingetragen haben. Ja, das nächste Schritt kommt eben da an diese Base-Line-Erkennung. Sie sehen, das funktioniert ganz gut. Ich habe überhaupt keine Probleme mehr, bis auf eine einzige Sache, die ich nicht verstehe. Ja, oder meine KI ist eine Ehre, darum sage ich immer eher. Sie können gerne auch Sie denken. Sie sehen, immer in der obersten Bereich, diese Base-Line werden falsch gemacht. Detail ist immer auf. Ich habe mittlerweile 500 Seiten trainiert für dieses Base-Line-Modell. Man macht das immer falsch. Weiß ich nicht, was es liegt. Es ist eigentlich klar, dass das zusammengehört. Ja, aber grundsätzlich, das sieht, es geht flott. Dieses Rechnungsbuch hat insgesamt eine Fuziatur 500 Seiten und nachdem diese Layer-Erkennung läuft... Ja, das sind zwei Tage Arbeit, das komplette Ding zu übertragen und dann vielleicht nach einem Tag zum Projekturlesen. Das ist ein riesengroßer Fortschritt. Auch vielen Dank dafür, dass das da öfflich zur Verfügung steht. Gut, dann gehe ich weiter. Ja, Sie sehen jetzt auch hier diese Textübertragen mit meiner Modelle, die ich trainiert habe. Die Jahreszahl, wie gesagt, hat das Problem mit der Base-Line-Erkennung, aber ansonsten finde ich mir nach diesen zwei Seiten maximal einen Fehler. Und das im Vergleich zu großen Modellen mit wirklich wenig Trainingsaufwand. Es liegt aber auch ganz schwer natürlich an der Vokabulare zu verwenden wird. Rechnungsbücher verwenden immer die gleichen Ausdrücke. Es geht immer jedes Jahr um das Getreide, um das Obst und um die Kühe, was verkauft worden ist. Ich würde mir schätzen, 95 Prozent des Vokabulares wiederholt sich. Darum funktionieren auch diese Modelle mit wenig Wirt und sehr gut. Ich habe dieses Modell auch angewandt. Auf einem Testament, dieses Schreibers, das gleichen Schreibers können wir uns vergessen, funktioniert nicht. Und mit dem Rechnungsbüger fast keine Fehler. Also es hängt schon sehr stark davon ab, welche Wörter da vorkommen, wenn sie das Vokabular bei der Erkennung berücksichtigen. Gut, ja, und so schaut es dann aus, wenn ich es exportiere, ohne irgendwelche Nachhabe. Die machen Wirt-Exporten, das Wirt probiere ich einfach in der Echsel. Das kommt so raus. Zeilig wird Zeile, so kann die Leute da mit TI schön weiterarbeiten und auch die ganzen Währungsangaben und so alles automatisiert weiterprozessieren. Wirklich eine schöne Sache. Hier habe ich es zum Beispiel auch probiert. Diese Strukturerkennung, da wird es natürlich schwieriger. Das sind diese älteren Rechnungsbüger. Diese Überschriften sind noch zu erkennen, weil die Schrift größer ist. Aber die anderen Bereiche da, ja, da glaube ich, muss ich noch sehr viel mehr Seiten trainieren. Das ist einfach schwer unterscheidbar, weil die Schrift ineinander gehen und es alles überschneidet und so weiter. Da wird es dann schon schwierig. Ja, das ist diese Auswahl an Quellen, die ich ja schon transkribiert habe. Die stehen auf der Webseite alterspach.de zur Verfügung. Sie können sich das gerne mal anschauen. Ja, und wie es für ein niederbayerisches Geoster, wie ich Anfang schon erwähnt habe, wenn ich zum Schluss auch mal aufgreifen will. Praxator können sich vielleicht der Brauer. Praxatorio ist die Brauerei. Das ist wichtig für uns. Und wenn man dann diese Digitalsearchung-Gibbung hat und mal noch den Brauer sucht, finde ich mir natürlich auch diese zahlreichen Hinweise auf diese Brautätigkeit. Der Mittelalter von den Bahnen ist natürlich ein wichtigsten. Unsere älteren Brauerei ist und sie bedeuten das. Mit Transkribus konnte ich nachweisen, dass die Alterspach-Brauerei nicht erst 1268, sondern 1261 gewöndet worden ist. Weil in dieser Quelle hier eben da an dieser Stelle Praxator steht und da geht es um den Gloster-Brau. Hätte ich ohne Transkribus nicht gesagt. Danke. Gut, herzlichen Dank für diesen Einblick, wie man mit Transkribus das Glosterleben erschließen kann und ja mit eben sehr einfachen Mitteln und auch im Rahmen sehr kleiner Projekte mitunter. Was eben für Heimatforscher oder Forscherinnen zum Beispiel interessant sein kann. Gibt es Fragen zu dem Vortrag? Ja, ich hätte eine Frage in Bezug auf die Rechnungsbücher, für die ich mich natürlich auch sehr interessiere. Gloster Neuburg, da liegen ja noch tausende Seiten im Archiv, die bis jetzt unbearbeitet sind und die haben wir auch in Transkribus einmal begonnen, aber noch nicht die Ressourcen gefunden, die zu bearbeiten. Aber haben Sie da auch schon daran gedacht, dann die einzelnen Teileneinträge zu anotieren und zu normalisieren für die weitere Bearbeitung? Ich verwende Transkribus wirklich nur dann, wenn es vom Arbeitsaufwand weniger ist, als wenn man es dann im Nachhinein bearbeiten kann. Und solche Texteingriffe sind dann für Spezialisten in dem Bereich viel einfacher zu behandeln, als würde ich diesen Transkribus händisch machen würde. Also muss man wirklich aufpassen, wo es schneller geht, wo es einfacher geht. Also in dem Fall, das müsste man sich wahrscheinlich mal anschauen. Gut, weitere Fragen oder alle Fragen beantwortet. Gut, vielleicht nur ein kurzer Kommentar. Bei den Überschriften, wenn ich es richtig verstanden hab, der Sofira zum Schluss, der ist nicht mit den Detailer reingegangen. Ah, jetzt mit dem neuen Baselintraining, nicht, oder? Ja, es kann sein, wegen der starken Begung, also dass das dann nicht ausreichend generalisiert hat. Wie viel hast du Ground Truth gemacht für das? 500 Seiten und das ist dann quasi immer sehr ähnlich, das er überschriftet. Okay, und das hat es nicht verstanden. Ja, ja, das wahrscheinlich liegt an der Begung und ja, das schafft er dann nicht zu generalisieren. Ist ja, ja, nur jetzt Interesse halber als ob man es gelegen haben. Gut, dann, wenn es keine weiteren Fragen mehr gibt. Ach, da ist noch eine Frage, ja. Klappt das, ja. Ich habe eine Frage, es ist ja vor allem private Projekte, die nicht finanziert werden und haben sie andere Historiker auch die transkrippieren und wie bringt man vor allem ältere Historiker dazu, Transkrippler oder solche Programme zu verwenden? Ja, wie kann man die motivieren? Haben sie da irgendwelche Ratschläge? Ja, das sind jetzt mal rund zwei Sachen, wo man sagen muss, also wenn die älteren Kollegen aus der Wissenschaft sind, ist es immer ein Problem, weil die unter Edition ganz was anderes verstehen. Ich sage immer, wir wollen keine kritischen Editionen machen, sondern wir machen eine Edition, die auch fehlerhaft ist. Wir wollen noch niemanden Konkurrenz machen. Also das ist eine ganz andere Herangehensweise, also wenn es um die Wissenschaft vergeht. Bei den Kollegen aus der Heimatforschung ist es schon schwierig. Ich habe aber auch schon Workshops gemacht für eben diesen Personenkreis, wo man ganz tief anfängt in den Voraussetzungen langsam vorwärts kommt und so weiter. Und dann funktioniert das schon. Aber die Hemmschwell ist natürlich schon größer. Man muss über einfach Zeit nehmen dafür. Danke. Gut, also dann darf ich die die leicht verdeckte Werbung für die Workshops vom Robert jetzt ganz explizit machen. Also wenn sie Kolleginnen und Kollegen haben, die sie motivieren möchten, dann schließen sie sich vielleicht einmal mit Robert Kurz. Vielleicht geht es ja eine gemeinsame Veranstaltung mal aus, weil im Wesentlichen geht es darum, die Leute zusammenzubringen und dann kann sich da auch viel bewegen. Gut, gibt es sonst noch eine Frage? Ja, vielleicht darf ich noch was dazu sagen. Also es ist, glaube ich, schon schwierig, als Einsteiger mit dem extra Kleinen zurechtzukommen. Also ich weiß vor fünf, sechs Jahren, ich habe lang gebraucht, bis ich mich immer unten habe, damit zu arbeiten. Aber mit dem Leid ist es doch um einiges besser geworden. Auch mit den Tutorials. Man muss da einfach noch lesen. Genau, ja, aber es ist halt dann nicht jeder, das war gleich die Berührungsangst mit Leid abbaut, also die soziale Komponente ist schon auch mit unterwichtig. Gut, dann gibt es sonst noch Fragen, Kommentare, Anregungen. Ansonsten würde ich sagen, begeben wir uns in die Pause und Robert, du kriegst natürlich auch noch eine Tasse. Und ich glaube, rein physikalisch kann man da ein Bier einfüllen. Ob der Hallraum reicht, weiß ich nicht, aber... Gut, Dankeschön.