Go to page
 

Bibliographic Metadata

Title
Contributions to generalized model-based spectral enhancement of speech signals
AuthorChinaev, Aleksej
ParticipantsHäb-Umbach, Reinhold ; Martin, Rainer
PublishedPaderborn, 2018
Edition
Elektronische Ressource
Description1 Online-Ressource (ix, 232 Seiten : Diagramme)
Institutional NoteUniversität Paderborn, Dissertation, 2017
Annotation
Tag der Verteidigung: 01.12.2017
Defended on2017-12-01
LanguageGerman ; English
Document TypesDissertation (PhD)
URNurn:nbn:de:hbz:466:2-30440 
DOI10.17619/UNIPB/1-294 
Files
Beiträge zur generalisierten modellbasierten spektralen Sprachsignalentstörung [2.98 mb]
Links
Reference
Classification
Abstract (German)

Mit zunehmender Digitalisierung unserer Gesellschaft wachsen auch Anforderungen an die Systeme zur Verarbeitung von zeitdiskreten Sprachsignalen bezüglich ihrer Leistungsfähigkeit, Robustheit und Effizienz. Begründet in der physikalischen Natur eines Sprachsignals findet die Sprachsignalverarbeitung oft im Zeit-Frequenz-Bereich statt, wo die psychoakustischen und statistischen Modelle in die Signalverarbeitungskette leichter integriert werden können als im Zeitbereich. Häufig müssen hier die gestörten Sprachsignale vom additiven Rauschen entstört werden, das als eine prominente Störung in vielen technischen Bereichen auftritt. Dabei werden Systeme zur spektralen Sprachsignalentstörung modular aus verschiedenen Systemkomponenten aufgebaut. Während solche Systeme stationäres Rauschen gut unterdrücken können, stellt sich das spektrale Entfernen nichtstationärer Störungen als eine sehr herausfordernde Aufgabe dar, die immer noch Gegenstand moderner Forschung ist. In zwei Hauptteilen der vorliegenden Arbeit werden mit unterschiedlichen Zielsetzungen sechs Schätzverfahren entwickelt, die als Bausteine eines Systems zur spektralen Sprachsignalentstörung verwendet werden.

Abstract (English)

The ongoing digitalization of our society has led to an increase in establishing new requirements on the digital signal processing concerning their performance, robustness and efficiency. Based on the physical nature of speech, the speech signals are often processed in the time-frequency domain, where the psychoacoustic and statistical models can be more easily integrated into the signal processing chain as compared the time domain. An important processing task here is denoising of signals disturbed by additive noise invariably occurring in many technical fields. A conventional spectral speech enhancement system for signal denoising usually consists of different modules. While stationary noise can be efficiently suppressed by such systems, removal of nonstationary noise has been known to be a very demanding task, whose solution is still a challenging topic of modern research. Development of modules being able to remove nonstationary noise, are carried out in two main parts of this thesis.

License
CC-BY-License (4.0)Creative Commons Attribution 4.0 International License