Loading...

SUBSCRIBE8: Spracherkennung für Podcasts (Georg Holzmann, Ben Zimmer)

995 views

Loading...

Loading...

Transcript

The interactive transcript could not be loaded.

Loading...

Loading...

Rating is available when the video has been rented.
This feature is not available right now. Please try again later.
Published on Oct 16, 2016

Automatisierte Spracherkennung galt lange als der "Heiliger Gral" um Podcasts durchsuchbar und in Archiven auffindbar zu machen.
In den letzten Jahren haben Internet Giganten wie Google, IBM, Microsoft und Facebook viel Geld investiert und ihre Spracherkennungssysteme stark verbessert. Jedoch sind immer noch viele verschiedene Bausteine und Algorithmen notwendig, um die Resultate dieser System sinnvoll für Podcasts oder Rundfunkaufzeichnungen einzusetzen.
Dieser Vortrag präsentiert die vollautomatische Integration verschiedener Spracherkennungssysteme in Auphonic und Podigee.

1. Spracherkennung mit Auphonic

Auphonic segmentiert Audiodateien anhand von Sprecher-, Musikwechsel, Sprachpausen und schickt Stimmsegmente zu Spracherkennungssysteme (Google, Wit.ai, IBM).
Danach werden die Text-Resultate mit Zeitstempel versehen und inhaltlich strukturiert.

2. Darstellung und Nachbearbeitung der Ergebnisse mit Podigee

Podigee stellt die Spracherkennungsergebnisse im Web dar.
Der Podigee Web Player zeigt den generierten Text direkt im Audio Player und bietet eine Suchfunktion, um anhand der Transkripte in der Audio Datei zu navigieren.
Weiters wird ein Web Editor präsentiert, mit dem man automatisiert erstellte Transkriptionen händisch nachbearbeiten kann.


Ben Zimmer, Auphonic

Loading...

to add this to Watch Later

Add to

Loading playlists...