Zero Resource Speech Recognition
Selbstlernende und intelligent agierende Maschinen können im Alltag hilfreiche Begleiter sein. Zum Lernen gehört dabei auch das Auffinden von wiederkehrenden Strukturen in gegebenen Daten. Solche Daten können beispielsweise die Aufnahmen von Mikrofonsignalen sein.
Ziel des "unüberwachten Lernens" ist, Strukturen zu finden dessen Vorhandensein und Aufbau vorab noch nicht bekannt ist. Im Rahmen unserer Forschungsarbeiten beschäftigen wir uns insbesondere mit dem Auffinden wiederkehrender Muster in Aufnahmen gesprochener Sprache, wie z. B. Worten, Silben, Phonemen also um das unüberwachte Lernen der Struktur gesprochener Sprache. Ein weiteres Beispiel ist die Detektion von akustischen Ereignissen wie z. B. Klopfen, Lachen, Klatschen.
Die Forschungsarbeit findet im Rahmen des DFG-Schwerpunktprogrammes "Autonomes Lernen" und in Kooperation mit der "Machine Learning for Signal Processing Group, CMU, USA" statt.
Präsentationen:
Aktuelle Themen:
- Unüberwachte Segmentierung von Zeichen- oder Phonemsequenzen sowie Zeichen- und Phonemegraphen (latticen)
- Unüberwachtes Lernen von akustischen Einheiten zum maschinellen Spracherwerb
- Unüberwacht gelernte Merkmalsextraktionsverfahren basierend auf neuronalen Netzen oder Manifold Learning
- Clustering von Aussprachevariationen zum unüberwachten Erlernen eines Aussprachelexikons
- Unüberwachtes Training einer Grapheme-to-Phoneme-Komponente zur Vermeidung von Aussprachelexika
Ansprechpartner

