Di­gi­tal Speech Si­gnal Pro­ces­sing

Modul
Module

Verarbeitung digitaler Signale
Digital Signal Processing

Veranstaltungsnummer /
Course ID

 L.048.92041

Koordinator /
Coordinator

Schmalenströer, Jörg, Dr.-Ing.

Typ /
Type

2 V / 2 Ü 
2 L / 2 E

Arbeitspensum / 
Workload

Präsenzphasen / Time of attendance:  60h
Selbststudium / Self-study:  120h
Ges. Arbeitspensum / Total workload:  180h

Leistungspunkte / 
Credits

6

Modulseite /
Module Homepage

http://nt.upb.de/index.php?id=dssv

Zeitmodus /
Semester

Sommersemester
summer semester

Kurzbeschreibung / Short Description

Die Veranstaltung führt in die grundlegenden Techniken und Theorien zur digitalen Sprachsignal-verarbeitung ein. Schwerpunkt des ersten Teils der Vorlesung liegt im Themengebiet „Hören und Sprechen“, welches sich mit psychologischen Effekten der Geräuschwahrnehmung und der Spracherzeugung beschäftigt. Anschließend werden zeitdiskrete Signale und Systeme, sowie deren rechnergestützte Verarbeitung besprochen. Die nichtparametrische Kurzeitanalyse von Sprachsignalen, die Sprachcodierung und die IP-Telefonie sind weitere Themen.

The course introduces the basic techniques and theories of digital speech signal processing. A focal point of the first part of the lecture is the topic “Listening and Speaking”, which is concerned with psychological effects of human sound perception and speech production. Subsequently, time dis-crete signals and systems, as well as computer based data processing are discussed. Further topics are non-parametric short-time analysis of speech signals, speech coding and IP-phones.

Inhalt / Content

Sprechen und Hören

  • Spracherzeugung: menschliche Sprechorgane, Lautklassen, Quelle-Filter-Modell, Vocoder
  • Grundlagen Schallwellen
  • Hören: menschliches Hörorgan, Psychoakustik und Physiologie des Hörens, Lau-theit, Verdeckung, Frequenzgruppen

Zeitdiskrete Signale und Systeme

  • Grundlagen: Elementare Signale, LTI-Systeme
  • Transformationen: Fouriertransformation zeitdiskreter Signale, DFT, FFT
  • Realisierung zeitdiskreter Filterung im Frequenzbereich: Overlap-Add, Overlap-Save
Statistische Sprachsignalanalyse
  • Grundlagen Wahrscheinlichkeitsrechnung
  • Kurzzeitanalyse von Sprachsignalen: Spektrogramm, Cepstrum
Schätzung von Sprachsignalen
  • Optimale Filterung
  • LPC-Analyse
  • Spektrale Filterung zur Rauschunterdrückung
  • Adaptive Filterung: LMS Adaptionsalgorithmus, Echokompensation
Sprachcodierung
  • Signalformcodierung, parametrische Codierung, hybride Codierverfahren
  • Codierung im Frequenzbereich
  • Amplitudenquantisierung: gleichförmige Quantisierung, Quantisierung mit Kompandierung (μlaw, alaw)
Listen and talk
  • Generating voice: human vocal tract, source filter model, vocoder
  • Acoustic waves
  • Listen: human ear, psycho acoustics and physiology of listening, loudness, acoustic occlu-sion, frequency groups
Time-discrete signals and systems
  • Basics: Elementary signals, LTI systems
  • Transformations: Fourier transformation of time-discrete signals, DFT, FFT
  • Time-discrete filtering in frequency domain: Overlap-Add, overlap-Save
Statistical speech signal analysis
  • Basics in theory of probabilities
  • Short-run analysis of speech signals: Spectrogram, cepstrum
Estimation of speech signals
  • Optimal filters
  • LPC analysis
  • Spectral filtering for noise suppression: spectral subtraction, Wiener filter
  • Adaptive Filters: LMS adaptation algorithm, echo compensation
Speech coding
  • Time domain coding: signal shape coding, parametric coding, hybride coding tech-niques
  • Frequency domain coding
  • Amplitude quantization: uniform quantization, quantization with companders (μlaw, alaw)

Lernergebnisse und Kompetenzen / Learning outcomes and competences

Fachkompetenz / Domain competence:

Die Studierenden sind nach dem Besuch der Lehrveranstaltung in der Lage,
  • Digitale Signale, speziell Audiosignale, im Zeit- und Frequenzbereich zu analysieren,
  • Sprachsignale effizient zu repräsentieren und
  • Weit verbreitete Algorithmen zur Sprachsignalanalyse und Verarbeitung im Frequenz- oder Zeitbereich zu implementieren.
After attending the course, the students will be able to
  • analyze digital signals, e.g., audio signals, in the time or frequency domain,
  • represent audio signals efficiently and
  • implement widely-used algorithms for speech analysis and speech processing in the frequency or time domain.
Fachübergreifende Kompetenzen / Key qualifications:

Die Studierenden
  • können Effekte in echten Signalen durch theoretisches Wissen erklären,
  • können theoretische Ansätze durch systematische Betrachtung untersuchen und
  • sind durch die fundierte Betrachtung der Inhalte in der Lage, sich selbst weiterzubilden
The students
  • are able to explain effects in real signals based on the theoretical knowledge,
  • are able to investigate theoretical approaches by a systematic analysis and
  • are, due to the precise treatment of the contents, in a position to continue their learn-ing themselves

Methodische Umsetzung / Implementation

  • Vorlesungen mit Tafeleinsatz und Präsentationen,
  • Abwechselnde theoretische und praktische Präsenzübungen mit Übungsblättern und Rechnern und
  • Demonstrationen von echten Systemen in der Vorlesung

  • Lectures using the blackboard and presentations,
  • Alternating theoretical and practical exercise classes with exercise sheets and com-puter and
  • Demonstration of real technical systems in the lecture hall.

Inhaltliche Voraussetzungen / Prerequisites

Vorkenntnisse aus dem Modul Höhere Mathematik
Prior knowledge fom the module Higher Mathematics

Kombinationshinweise - Überschneidungen / Overlapping modules

Keine / None

Prüfungsmodalitäten / Assessments

Mündliche Prüfung / oral exam

Unterrichtssprache / Teaching Language

Deutsch oder Englisch / German or English

Lernmaterialien, Literaturangaben / Teaching Material, Literature

Bereitstellung eines Skripts; Hinweise auf Lehrbücher; Matlab Skripte

Allocation of a script; information on textbooks ; matlab scripts