 Noch mal der nächste Vortrag, Barrierefreizugriffe für Lisa und Hecker. Es geht um Barrierefreizlösungen, wir stellen einige vor und wir erinnern die vom David Sinn. Vielen Dank für die Einleitung, erstens Anfang, ich gehe über Barrierefreiz-Eingabe-Methoden für Hecker, Lisa und Schreiber. Worum geht es? Es gibt Menschen, die haben z.B. Karpatone, Symptome, unterschiedliche Krankheiten. Wenn man so etwas hat, dann könnt ihr möglicherweise keine normalen Computer-Tastatur oder Maus oder Festigandentage-Stream benutzen. Aber Technologie ermöglicht es euch trotzdem mit diesen Geräten zu interagieren. Nur mit anderen Methoden. Und es ist sehr viel wert für diese Geräte, weil wenn man mit einem Gerät interagieren kann, dann kann man Sachen selber machen und mit anderen aus dem Welt zu kommunizieren. Darum ist es eine wichtige Methode und eine wichtige Sache. Darum ist es wichtig für mich. Ich bin eine System-Sicherheitsperson. Ich habe Cybersecurity in Colombia studiert und ich bin CTO in einem Start-up mit dem Namen Office Secure. Ich habe 2014 angefangen medizinische Probleme zu bekommen. Und als Resultat kann ich nur ein paar Tausend Mal in der Tastennabdrücke am Tag zu machen. Das hört sich viel an, aber wenn ihr Worte pro Minute eintippt, dann braucht es genau 30 Minuten, um die 15.000 Charaktere zu bekommen. Also im Endeffekt konnte ich ungefähr ein schneller Programm in einer halben Stunde halten und danach kann ich meine Hände nicht mehr benutzen. Das ist zum Beispiel eine Kleinigkeit, die Türen öffnet und Essen für mich vorzureiten. Das heißt, ich muss sehr gut darauf aufpassen, wie ich meine Hände benutze. Und ich habe ein Programm, das ihr jetzt seht, zu anschauen, wie viele Tastendrufe ich mache am Tag. Ich habe sehr viel Pair-Programming. Ich melde mich mit anderen Leuten in einem System an. Und ich nutze auch sehr viel Sparacherkennung. Ich habe einen Vortrag über Sprachprogrammierung gegeben bei der HOPE-11-Konferenz. Es könnte ich da anschauen. Wenn ich über eingabt Methoden rede, dann sind es zum Beispiel ergonomische Testaturen, Augenverfolgung, wo der Computer schaut, wohin man mit seinen Augen schaut oder wo man mit seinen Kopf zeigt und daraus Inputs macht, dann ist das auch eine Lösung. Es gibt immer den Unterschied zwischen angepassten für eine personenoptimierten Input-Methoden und Standardmethoden. Vielleicht habt ihr von Stephen Hawking gehört. Er ist ein sehr bekannter Professor. Er hat mit ALS diagnostiziert, als er 21 war. Und seine Fähigkeiten reduzierten sich über die Jahrzehnte. Er hat viele unterschiedliche Kommunikations-Mechanismen genutzt. Am Anfang veränderte sich seine Sprache. Er konnte damit nur zu seinen Familien und Freunden kommunizieren. Und später hat er mit einem menschlichen Interpretator gearbeitet, wo er dann seine Augenbraugen hebt, um unterschiedliche Buchstaben zu wählen. Computer waren sich diese Zeitpunkte noch nicht so weit, wie sie jetzt sind. Und später hat er einen Taste mit einer Hand genutzt, wie Morsecode, damit aus unterschiedlichen Worten auszählten, 14 Millen Worte pro Minute. Und später konnte er jetzt in der Hand kommen und nicht mehr bewegen. Das heißt, ein Team mit Ingenieuren arbeitet zusammen mit ihm. Und sie versuchten, Brainscans zu machen. Aber das war in den 80ern, und da war das alles noch nicht so weit. Und sie konnte noch nicht so viel tun. Also haben sie basically in effect ein spezielles Software erstellt, die Muskelbewegung in seiner Backe genutzt. Und das haben sie zusammen mit Raten genutzt, wie z.B. auf seinem Handy. Aber anstelle von, dass er da rumgezweibt hat. Also das ist eine, eine, eine Sammlung an hochkomplizierten, hochspezialisierten Input-Mechanismen. Eine andere wichtige Person ist Professor Sang Mokli. Ich habe ihn echt getroffen, als ich damals noch ein bisschen mehr Bart hatte, als ich herzuteilge habe. Und er ist ein Professor in der National University in South Korea. Und manche nennt ihn den Koreanischen Stephen Hawking. Und was er benutzt, ist dieses orange Gerät in der Nähe des Universums. Das ist ein Zip-N-Puff-Maus. Also er kann reinblasen und ein bisschen bewegen. Und das sieht nicht wie ein Maus auf dem Android-Grade vor ihm. Und es bewegt ihn cursor und klickt, wenn er Luft einsaugt und so weiter. Also, das ist eine Spracherkennung, ermöglicht ihm standard Android-Hardware benutzen. Er hat immer noch Zugang zu E-Mail-Anwendungen, Web-Browsern und Web-Browsers und Karten und alles was auf einem normalen Android-Grade funktioniert. Er kann viel mehr machen als Stephen Hawking. Stephen Hawking konnte mit einer Mensch, mit einem Menschenkommission sehr langsam teilen. Das ist mein Afghanistan-Dreat. Aber es zeigt auch, wie weit die Technologie vorangeschritten ist. Also, was macht gute Performance? Also, ein wichtiger Punkt ist Performance. Keine Typos, keine Latente. Ich möchte nicht schwächen und fünf Sekunden später Worte erscheinen. Das dauert zu lange. Sondern wenn man sich, wenn man korrigieren muss. Stephen Hawking hat 15 Minuten pro Sekunde und ein normaler Mensch hat 155. Je mehr man Informationen, man übertragen kann, desto besser. Und für Innovationen und Übertragungen und das, was ich von mir selber gelernt habe, ist es wichtig, dass komplett komplett ist, kann ich alles damit machen. So Stephen Hawking hat z.B. sein orange Mouth-Inputsgerät sehr stark. Aber es kann damit nicht alles machen. Zum Beispiel, wenn er einen Anruf hat, dann funktioniert das nicht. Das heißt, er muss jemanden hoffen, der den Anruf annehmen, das heißt, wenn man nicht Vollständigkeit hat, kann man nicht unabhängig sein. Konsistenz ist auch sehr wichtig, derselben Art und Weise, wie wir Muskel-Erinnerungen haben, wenn wir tippen, haben wir auch eine Erinnerung für unterschiedliche Sachen, die wir machen. Aber wenn man immer was anderes machen muss für dieselbe Aktion, dann ist das viel schwerer. Und zuletzt, die Kostümassierung. Die Lernkurve ist für Beginner sehr wichtig, aber für Experten Benutzung zu optimieren ist noch wichtiger. Jemand, der ein solches Interface benutzt, wird besser dran. Ein Gründer, z.B. ein Screenreader, und die erhöhen die Geschwindigkeit die ganze Zeit. Es gibt Menschen, die haben 15-mal schnellere Sprache als ein normaler Mensch. Das kann man als normalerweise nicht hören. Aber er hat so oft benutzt, dass er ein Experte darin wurde, diese Software zu benutzen. Zum Beispiel ökonomische Tastaturen, beispielsweise. Sie sind wie eine normalen Tastaturen, ein bisschen langsamer, wenn man sie lernt, aber wenn man sie kann, dann ist man sehr genau, sehr kringler, tänzt, man drückt. Und der Computer bekommt sofort das Signal ein relativ hoher Trupport. Gut von einem normalen Tastatur sein kann. Das heißt, es sind tolle, tolle Geräte, komplett kompatibel mit normalen Tastaturen. Wenn man nur ein spezielles Tastatur braucht, dann hat man Glück. Ich möchte über zwei Sachen reden über Computer und auch Android-Geräten. Wir starten mit Android. Die eingebaute Erkennung ist ziemlich gut. Google hat so viel Daten gesammelt von so vielen Ressourcen, da sind sie noch besser als seine sehr große Genauigkeit. Die Barrierefreiheit ist teils teils. Man kann das Android-Gerät nicht komplett mit Sprache steuern. Ja, ich nehme oft diese Stifte, denn meine Fingern werden, das kann sie nicht mehr nutzen, und das ist nicht sehr effektiv. Deswegen nehme ich diese Stifte, der leichteste, den ich gefunden habe. Die sind 12 Gramm, und der andere ist ... Sie sieht man die Android-Spracherkennung. Man muss einen Knoff drücken, und dann muss man einfach nur anfangen zu sprechen. Es ist sehr akkurat und sehr schön. Als ich bei Google gearbeitet habe, habe ich mit dem Team gesprochen. Warum macht ihr das auf dem Server nicht auf den Geräten? Sie haben gesagt, die Geräte sind alle sehr verschieden, und es ist schwierig für sie auf dem Gerät, das zufriedenständig zu machen. Es gibt Latents. Dieses Jahr nutze ich diese Spracherkennung nochmal, und es wurde so viel schneller. Sie haben jetzt auch ein Modell für Spracherkennung auf dem Gerät, was Sie eingeschalten haben. Auf der anderen Seite sehen wir das Interface um Sprachenzirken. Ich sah diese Beta-Version davon, bevor es veröffentlicht wurde, und ich fand es ziemlich schlecht, denn es gab keine Komplettheit. Wir sehen hier, ich zeige die Beschriftungen, und ich kann auf die drücken, und da gibt es ein Twitter-Webber, aber da gibt es keine Nummer, und deswegen gibt es ein Problem in dem Design des Barriere-Falls-Schnittstöne. Nur ein Teil dessen ist verfügbar, und außerdem, die Google-Spracherkennung öffnet meine neue Verbindung alle 30 Sekunden, und wenn du länger sprichst, dann wirst du immer unterbrochen. Später haben Sie ein Update breitgestellt, und da sind viele dieser Vollständigkeitsprobleme gelöst, und man kann auf einem Grid Dinge auswählen. Aber die Probleme mit dem Server und Experten nutzen, wenn ich das Mausgrid aufm Mausgrid nutze, dann muss ich da sagen, und es gibt da viele Latents, aber das ist besser als nichts. Ich möchte das gleiche Feature, um etwas zu auszuwählen, gibt es auch in der Desktop-Version, man kann es halt mit seiner Tastatur oder anderen Eingabber-Geräten nutzen, und diese Art ist vollständig. Ich möchte noch ein weiteres Beispiel geben, wie ich das nutze, und ich versuche, Japanisch zu lernen, und da gibt es ein paar Websites, die man da nutzen kann. Die Buttons, um auf die nächste Seite zu wechseln, oder ich möchte aufhören, die ändern sich ständig, weil das HTML dynamisch generiert wurde. Ich nutze ein Programm, das heißt Banki, und es hat Shortcuts wie 1, 2, 3, 4. Man kann es mit dem Android-Gerät synchronisieren und den Stiften nutzen. Hier seht ihr einen Graph, wie ich es nutze. Wenn ich Sparer kann und jeden Tag nutze, ich nutze es dann qualifizieren. Das Gleiche mit vielen Bayerischen Freiheitsschnittstellen. Es ist nie perfekt, aber es ist das Beste, was man machen kann. Was ich gerne machen möchte, ist Bücherlesen, und ich mag die Friedes. Man kann kaum andere Eingabegeräte ihm zufügen, aber für Android-Geräte, gibt es ja auch E-Book-Lese-Anwendungen. Da kann man auch Mikrofone und Sensoren hinzufügen. Ich habe zwei Applikationen erstellt, die eine heißt Voice Next Page. Es ist eine Spracherkennung, die auf der Software Silvius ist. Es erkennt Befehle wie nächste Seite, oder folgende Seite. Man findet es im Play Store. Es ist ziemlich kompliziert, eine Bayerische Freiheitsapp für Android zu bauen, aber es ist ganz gut geworden. Ich zeige euch ein Beispiel dieser App. Das ist auf der linken Seite. Hier seht ihr die nächste Seite. Ich sehe, dass der Server läuft. Ich klick auf Start, und dann wechselt es zu einer Android-Lese-App. Nächste Seite. Nächste Seite. Nächste Seite. Nächste Seite. Nächste Seite. Nächste Seite. Vorgene Seite. Zentrum. Zentrum. Stopp Listening. So, zu hören. Es war eine Demonstration von dieser Anwendung, und ich nutze es sehr oft. Ihr könnt es gerne downloaden, wenn ihr wollt. Die andere ist, heißt, Link Next Page. Ich habe diese Idee von einer Forschungspapier. Ich habe ihren QR-Code nicht genutzt, aber es ist eine tolle Idee. Die Anwendung erkennt Augenzwinker und durch die Kamera. Wir brauchen keine Netzwerke. Wir brauchen keine Netzwerke. Wir brauchen keine Netzwerke. Das ist die Gesichtserkennungs-Software von Google. Das läuft. Ja, sagt mir Bescheid, wenn ihr das gerne ausprobieren wollt. Das größte Problem damit mit der Implementierung. Man braucht halt zwei Geräte. Das ist das größte Problem damit. Man braucht halt zwei Geräte. Das war einfach so zu erstellen, und ich nutze sowieso zwei Geräte. Ja, ein Gerät sende ich auf mein Gericht, und das andere, wenn ich die Augen trinke, dann erkennt die Anwendung. Das ist das größte Problem damit. Das ist das größte Problem damit. Man erkennt die Anwendung, dass ich mit den Augen zwinge. Wenn ich zurückgehen möchte, dann zwinge ich mit dem linken Augen. Wenn ich mich schnell nach vorne gehen möchte, dann zwinge ich mit dem rechten Augen und lasse es. Es gibt ein paar falspositive Fehler. Es gibt ein paar falspositive Fehler. Es gibt ein paar falspositives Fehler. Es erkennt, wenn man die Seite fehlerhaft identifiziert, dann hat er ein falsches Problem. Es gibt halt ein paar Grenzen. Es ist ein großer Fehler von mir. Das ist genug über Android-Devises. Das sind Desktopcomputer. Wenn ihr ein Desktopcomputer benutzt, das hotspatem libertätisch pflegst. Das ist das größte Problem der Gymnasie. Schau dir, wenn du ein Browser für native Apps nötigst und nötigst, dann ist es okay, wenn du einfach ein basices Ding nötigst, aber wenn du es kompliziert machen kannst, dann ist es definitiv ein Sprach-Coding-System zu benutzen. Manche können auch mit eiltracken, z.B. der Maus, ich benutze das nicht, aber ich spritze ein Trackball mit sehr wenig Kraft. Manche scrollen auch hoch und runter mit dem Summen, aber das benutze ich auch nicht. Es gibt eine Reihe von Vorträgen über Voice-Coding. Emily Schier hat auch einen Vortrag im Team darüber, wie meine Ambassador mitarbeitet. Und per Jahr habe ich auch auf einer Voice-Coding-Vortrag gehalten, der ist nur noch um dir nicht aktuell, aber immer noch interessant. Es gibt unterschiedliche Voice-Coding-Systems, der Grundsprache ist ein Dragonfly, es ist ein Grammar-Standard, der Castor ist, wenn ihr viele unübliche Wörter euch erinnern wollt, dann ist es sehr ... India ist, wie du originally used Dragon zu arbeiten auf der Linux-Machine, ursprünglich wie Talon ist ein Schoss-Source-Programm, sehr stark ist die Besonderung von MacOS und Talon hat früher Dragonfly und benutzt und ist bloß jetzt eine Sache von Facebook. Und Sirius ist das, dass ich erregt habe, die Modelle sind nicht so akkurat, aber es gibt ein nice Architecture, wo es Kleinserver gibt, so dass es leichter ist, mit kleinen Servern das machen, einfache eigene Sachen zu erstellen. Und das neueste ist Kaldi Active Grammar, das ist sehr ... als App-Source, sehr ... kontrikubierbar. Darum werde ich jetzt ein bisschen darüber reden. Für Voice-Coding, sehr careful how you use your voice, wie ihr eure Sprache benutzt, sprecht normal. Ich bin nicht besonders gut ertragen, wenn ich mich Sprach erinnern, freche ich anders. Ich benutze meine Sprache und meine Stimme zuviel, ein bisschen drauf aufpassen. Microsoft Hardware ist wichtig, also ein gutes Mikrofon, was ihr in euer Gesicht halten könnt. Ist auch wichtig. Und eure Sprache ... Grammar ist auch wichtig. Wenn ihr ein Wort benutzt und das System erkennt es nicht, benutzt einfach ein anderes Wort. Und es ist vollständig, wenn wir jede Taste benutzen und das Wichtigste für ... Anpassbarkeit ist, ihr könnt Chaining machen. Das heißt, ihr könnt mehrere Befehle nacheinander senden. Und es ist eine riesige, riesige Geschwindigkeit zu verbessern. Ich benutze Wim und T-Mux und ... Ich habe mit vielen Leuten zusammen, aber in der Verwandlung ... Ich hab ein paar Cheats. Aber ja, let's just do a quick mit Sprache. Lernrend Space Lace Enter Inter Race Up Tab Word Print Fox Scratch Nope Code Standard Charlie Oscar Uniform Tango Space Langle Langle Space Quote Sentence Hello Voice Coding Bang Scratch Six Delta India NeuGolf Bang Backslash Neu Quote SemiColonAct Skyfox Mike Romeo Neu Oscar Space Number Zero SemiColonAct Wim Save and Quit Golf Plus Plus Space Hotel Hotel Tab Minus Oscar Space Hotel Hotel Enter Point Slash Hotel Hotel Enter Desk Write To Man ist ein kleines Beispiel, wie die Sprachcoding funktioniert. Ihr könnt es benutzen, um in jeder oder mehr Sprachen zu sehen. Ihr könnt welche Sachen auf eurem Desktop verändern. Es ist sehr stark. Es ist auch einiges daran arbeiten. Der Programmierer heißt auch David. Ich bin auch David. Er spielt und sagt, das ist ein Kaldiaktivgrammar. Ich habe in vielen Jahren nicht mehr mit einer Legislatur geschrieben und Kaldiaktivgrammar wurde vollständig immer von den vorherigen Versionen entwickelt. David hat nur eine sehr grobe Mit-Sache integrieren. Und er hat Kaldiaktivgrammar irgendwie zum Laufen gebracht und benutzt es weiter. Um es weiter zu entwickeln. Ich mag das Projekt. Ich habe noch nicht viel dazu gebracht, aber ich habe ein bisschen hardware Ressourcen beigesteuert, damit es besser trainieren kann. Aber ich möchte euch auch ein Video zeigen, wie David dieses Software benutzt. Also, die andere Sache mit David ist, dass er ein Sprachfehler hat oder ein sehr starker Akzent und da muss es schwer für den normalen Sprachnennungs-Software ihn zu verstehen. Ich könnte wahrscheinlich auch hier schwer verstehen, aber er versteht, was der Mensch das Software denkt. Oh, ich muss euch noch diesen Ton später schreiben. Tab. Nr. 1. Symbol-Kamersprach. Nr. 1, 0, 1. Komplett-Line. Ctrl-Shift-Enter. Text. Teamwork-Assignment. Apostrophe. Ctrl-Enter-Enter-Tonetimes. Nr. 1, Nr. 1. Nr. 1. Heps CD. Wir haben das gehört und ihr könnt das auch von der Webseite zeigen werden. Nr. 1. Eine andere Sache, die ich euch hier noch zeigen möchte ist, dass David dieses Summen zum Skrollen implementiert hat. Natürlich habe ich OBS da ausgescheißen. Aber er ist so. Und er versteht das und scrollt runter. Etwas, was ich meinem Trackball machen kann, aber er benutzt seine Stimme dafür. Das ist ziemlich cool. Ja, ich bin so weit. Große ... Ihr müsst komplett sein, konsistenz sein und ihr müsst es verändern können. Wenn ihr das selbe Ergebnis habt und eure Produkte werden. Das heißt, das System muss für Profis Design sein. Für E-Book-Reading. Mein Ziel ist, dass jeder lesen können soll. Selbst wenn er motorische Probleme hat. Damit die Seiten wechseln kann. Ja, die Android Nacherkennung ist gut. Silvia ist gut für kurze Experimente und OSNX-Page. Schaut euch auch die Active Grammar an, wenn ihr wirklich einen Bedarf dafür habt. Zuletzt habe ich die Webseite Woxhub.io da könnt ihr die ganze Software benutzen oder die Software sehen und so. Schaut euch an und viele Leute, die mir ein kleines Video geholfen haben, hat insbesondere den Professor Sonny Mokli, der mich nach Korea eingeladen hat und dort Fotos gezahlt. Ja, David Zuro, der mir auch sehr viel geholfen hat. Vielen Dank. Ja, ich möchte jeden daran erinnern, dass ihr fragen stellen könnt im IRC oder bei Twitter. Da könnt ihr den Hashtag rc3two nutzen. Danke für deinen Talk, David. Das war wirklich super. Ich glaube, wir haben ein paar Fragen von den Engeln und ich habe ein bisschen Zeit mit diesem Sprachsystem gebracht, was einem sagen kann, was ein Bild zu sehen ist und Ja, ich konzentriere mich auf Eingabe, Barrierefreiheit, aber es gibt auch, im anderen Weg gibt es auch sehr viele Verbesserungen. Wir haben ein paar Minuten übrig für Fragen. Deine Anwendung sieht toll aus, hast du ein paar Statistiken, wie viele Menschen es nutzen? Ich habe Nein. Diese Anwendung wurde schon beworben nur auf einem Poster in den Wissenschaften beworben. Es kennen noch nicht so viele Leute, aber ich hoffe, dass mit diesem Talk es mehr Leute kennenlernen. E.g. Kannst du gleichzeitig Sport treiben und auch Programmieren? Spracherkennung ist das Mikrofon sehr sensibel. Es gibt Latents und dann wird die Befehle ausgeführt. Ich kann nicht sagen, wie viele Wörter pro Minute ich sagen kann, aber vielleicht 300 oder 400. Eine andere Frage gibt es Hinweise für Autoren, wie sie ihre Inhalte bei ihre Formatik machen können. Es gibt sehr gute Wörter, wenn man eine Webseite macht, wie man sie bei Rehe freigeschaltet. Sie konzentrieren sich mehr auf Menschen mit einer Sehbehinderung. Mit Menschen, die sonst nicht mit der Seite interagieren könnten. Duolongo, z.B. Barrierefreiheitstags auf dem Next Button hinterlegt und wenn sie das nutzen würden, könnte ich das auch nutzen an meiner Anwendung. Konsistenz ist sehr wichtig und Integrierung mit existierenden APIs für Barrierefreiheit ist sehr wichtig. Wir können nicht jedes Programm mit Spracherkennung steuern und wir müssen uns in der Mitte treffen. Es gibt andere Frage und es gibt ähnliche Ansätze wie Stenografie. Sehr gute Fragen. Die erste Frage, die jeder uses, ist die NATO Phonetic Alphabet für Spellletters z.B. Alpha Bravo Charlie. Wir nutzen ein spezielles Alphabet für verschiedene Buchstaben werden ersetzt. Das Spracherkennungssystem erkennt das nicht immer. Manche Wörter ändere ich, dass es funktioniert. Diese Grammatiken sind in der gleichen Format. Sie sind in Pfeifen geschrieben. Man kann eine Grammatik für eine Anwendung übertragen auf eine andere Anwendung und es funktioniert. Man muss viel verändern. Verschiedene Benutzahl ihre Wörter ändern. Eine andere Frage ist, gibt es eine Community die du empfehlen kannst für Barrierefreiheit und das ist ein tolles Forum für Spracherkennungssoftware alle Entwickler die solche Software schreiben sind dort. Das ist eine tolle Ressource. Von VoxHop.io werde ich einen Link setzen. Da könnt ihr mal reinschauen und generelle Frage für Barrierefreiheit Ich kann für alle die Meldung von Google über Barrierefreiheit und das hängt von deiner Community ab. Wenn du dich über Barrierefreiheit da gibt es halt Ressourcen oder wenn es um Desktopanwendung Barrierefreiheit geht oder noch eine Frage gibt es rechtliche Fragen wenn du ein e-book in Audio eine Audio-Version als e-books breitstest wenn du ein Screenwriter nutzt der den Inhalt eines e-books ausliest Meistens gibt es Fair use Ausnahmen für das Urheberrecht auch für die USA und man kann für persönliche Zwecke eine Kopie erstellen und das ist immer noch unter den Fair use-Klausen wenn du es kommerziell gestalten möchtest und Geld verdienen möchtest wenn du ein Streamer bist dann vielleicht gibt es Probleme aber sonst nicht wir denken ja, das ist es Danke vielmals für deinen Talk das war sehr sehr interessant und wir haben viel gelernt und danke fürs zuhören Bleibt da mal rein