Wie Computer Geräusche automatisch erkennen können, damit beschäftigt sich Janek Ebbers vom Fachgebiet Nachrichtentechnik der Universität Paderborn. Bei einem internationalen Wettbewerb hat er sich nun mit seinem wissenschaftlichen Ansatz in einem Teilnehmerfeld aus über 400 Forscherinnen und Forschern behauptet und den 5. Platz belegt.
Der Wettbewerb findet seit 2013 unter dem Namen „Detection and Classification of Acoustic Scenes and Events“ (DCASE) statt und versammelt Wissenschaftlerinnen und Wissenschaftler aus der ganzen Welt, die ihre Verfahren zur automatischen Erkennung von akustischen Ereignissen vergleichen. So handelt es sich bei den akustischen Ereignissen z. B. um das Zuschlagen einer Tür, das Geräusch eines Lüfters oder etwa das Bellen eines Hundes. Die hierbei angewendeten Methoden werden auch als „Deep Learning“-Verfahren bezeichnet und stammen aus dem Bereich der Künstlichen Intelligenz. Bei dem Verfahren erhält ein Computer sogenannte Trainingsdaten, um innerhalb eines eigenständigen Lernprozesses irgendwann zur richtigen Lösung zu kommen, wie in diesem Fall die Identifizierung eines bestimmten Geräusches. Die besondere Herausforderung der Aufgabe bestand für Ebbers und die anderen Forscher darin, dass nur ein geringer Teil der Trainingsdaten von Menschen mit der richtigen Bezeichnung eines Geräusches versehen wurden, während die überwiegende Mehrzahl der Daten mit automatisiert erstellten und damit möglicherweise fehlerbehafteten Bezeichnungen versehen waren. Ebbers erfolgreicher Ansatz zeichnete sich durch eine geschickte Netzarchitektur sowie intelligente Methoden zur Vervielfältigung von Daten aus.
„Das ist eine herausragende Platzierung in einem internationalen Teilnehmerfeld. Sie bestätigt wieder, dass man an der Universität Paderborn nicht nur sehr gut studieren, sondern auch international konkurrenzfähig forschen kann“, freut sich Prof. Dr. Reinhold Häb-Umbach, Leiter des Fachgebiets Nachrichtentechnik. Intelligente Systeme zur automatischen Erkennung von Sprache und Geräuschen sind mittlerweile im heutigen Alltag fest verankert und finden z. B. in Produkten wie Amazon Echo Anwendung. An der Universität Paderborn setzen sich Wissenschaftlerinnen und Wissenschaftler mit diesen Technologien auseinander. So fördert die Deutsche Forschungsgemeinschaft (DFG) aktuell ein Projekt von Häb-Umbach, in dem es mithilfe eines von ihm entwickelten Verfahrens möglich ist, Störgeräusche sowie Halleffekte innerhalb der automatischen Spracherkennung zu minimieren.