Achtung:

Sie haben Javascript deaktiviert!
Sie haben versucht eine Funktion zu nutzen, die nur mit Javascript möglich ist. Um sämtliche Funktionalitäten unserer Internetseite zu nutzen, aktivieren Sie bitte Javascript in Ihrem Browser.

Bildinformationen anzeigen

Digitiale Sprachsignalverarbeitung

Quelle-Filter-Modell zur Sprachproduktion

Kurzbeschreibung

Die Veranstaltung führt in die grundlegenden Techniken und Theorien zur digitalen Sprachsignalverarbeitung ein. Schwerpunkt des ersten Teils der Vorlesung liegt im Themengebiet "Hören und Sprechen", welches sich mit psychologischen Effekten der Geräuschwahrnehmung und der Spracherzeugung beschäftigt. Anschließend werden zeitdiskrete Signale und Systeme, sowie deren rechnergestützte Verarbeitung besprochen. Die nichtparametrische Kurzeitanalyse von Sprachsignalen, die Sprachcodierung und die IP-Telefonie sind weitere Themen.

Vorlesungsinhalte

  • Sprechen und Hören
    • Spracherzeugung: menschliche Sprechorgane, Lautklassen, Quelle-Filter-Modell, Vocoder
    • Grundlagen Schallwellen
    • Hören: menschliches Hörorgan, Psychoakustik und Physiologie des Hörens, Lautheit, Verdeckung, Frequenzgruppen
  • Zeitdiskrete Signale und Systeme
    • Grundlagen: Elementare Signale, LTI-Systeme
    • Transformationen: Fouriertransformation zeitdiskreter Signale, Diskrete Fouriertransformation, FFT
    • Realisierung zeitdiskreter Filterung im Frequenzbereich: Overlap-Add, Overlap-Save
  • Statistische Sprachsignalanalyse
    • Grundlagen Wahrscheinlichkeitsrechnung
    • Kurzzeitanalyse von Sprachsignalen: Spektrogramm, Cepstrum
  • Schätzung von Sprachsignalen
    • Optimale Filterung
    • LPC-Analyse
    • Spektrale Filterung zur Rauschunterdrückung: spektrale Subtraktion, Wiener Filterung
    • Adaptive Filterung: LMS Adaptionsalgorithmus, Echokompensation
  • Sprachcodierung
    • Codierung im Zeitbereich: Signalformcodierung, parametrische Codierung, hybride Codierverfahren
    • Codierung im Frequenzbereich
    • Amplitudenquantisierung: gleichförmige Quantisierung, Quantisierung mit Kompandierung (µlaw, alaw)

Fachliche Kompetenzen

Die Studierenden sind nach dem Besuch der Lehrveranstaltung in der Lage, Digitale Signale, speziell Audiosignale, im Zeit- und Frequenzbereich zu analysieren, Sprachsignale effizient zu repräsentieren und weit verbreitete Algorithmen zur Sprachsignalanalyse und Verarbeitung im Frequenz- oder Zeitbereich zu implementieren.

Fachübergreifende Kompetenzen & Methodische Umsetzung

Die Studierenden können Effekte in echten Signalen durch theoretisches Wissen erklären,können theoretische Ansätze durch systematische Betrachtung untersuchen und sind durch die fundierte Betrachtung der Inhalte in der Lage, sich selbst weiterzubilden.

Methoden

  • Vorlesungen mit Tafeleinsatz und Präsentation
  • Abwechselnd theoretische und praktische Präsenzübungen mit Übungsblättern und Rechnern und
  • Demonstrationen von echten Systemen in der Vorlesung

Literaturempfehlungen

  • P. Vary, U. Heute, W. Hess: Digitale Sprachsignalverarbeitung : Teubner Verlag 1998 : Gutes Lehrbuch
  • J.R. Deller, J.G. Proakis, J.H.L. Hansen: Discrete-Time Processing of Speech Signals : IEEE Press, 2000 : Allgemein Sprachsignalverarbeitung, enthält auch Kapitel über Spracherkennung
  • Oppenheim, Schafer: Digitale Signalverarbeitung : Gutes Buch zur digitalen Signalverarbeitung

Einordnung

  • Veranstaltung für Master Studierende
  • ECTS: 6
  • Sprache: Deutsch / Englisch
  • Semester: Sommersemester

 

Einordnung

  • Veranstaltung für Master Studierende
  • ECTS: 6
  • Sprache: Deutsch oder Englisch
  • Semester: Sommersemester

Die Universität der Informationsgesellschaft