Mit zunehmender Digitalisierung unserer Gesellschaft wachsen auch Anforderungen an die Systeme zur Verarbeitung von zeitdiskreten Sprachsignalen bezüglich ihrer Leistungsfähigkeit, Robustheit und Effizienz. Begründet in der physikalischen Natur eines Sprachsignals findet die Sprachsignalverarbeitung oft im Zeit-Frequenz-Bereich statt, wo die psychoakustischen und statistischen Modelle in die Signalverarbeitungskette leichter integriert werden können als im Zeitbereich. Häufig müssen hier die gestörten Sprachsignale vom additiven Rauschen entstört werden, das als eine prominente Störung in vielen technischen Bereichen auftritt. Dabei werden Systeme zur spektralen Sprachsignalentstörung modular aus verschiedenen Systemkomponenten aufgebaut. Während solche Systeme stationäres Rauschen gut unterdrücken können, stellt sich das spektrale Entfernen nichtstationärer Störungen als eine sehr herausfordernde Aufgabe dar, die immer noch Gegenstand moderner Forschung ist. In zwei Hauptteilen der vorliegenden Arbeit werden mit unterschiedlichen Zielsetzungen sechs Schätzverfahren entwickelt, die als Bausteine eines Systems zur spektralen Sprachsignalentstörung verwendet werden.
Bibliographic Metadata
- TitleBeiträge zur generalisierten modellbasierten spektralen Sprachsignalentstörung / von Dipl.-Ing. Aleksej Chinaev ; erster Gutachter: Prof. Dr.-Ing. Reinhold Häb-Umbach, zweiter Gutachter: Prof. Dr.-Ing. Rainer Martin
- Author
- Participants
- Published
- EditionElektronische Ressource
- Description1 Online-Ressource (ix, 232 Seiten : Diagramme)
- Institutional NoteUniversität Paderborn, Dissertation, 2017
- AnnotationTag der Verteidigung: 01.12.2017
- Defended on2017-12-01
- LanguageGerman ; English
- Document TypesDissertation (PhD)
- URN
- DOI
- Social MediaShare
- Reference
- IIIF
The ongoing digitalization of our society has led to an increase in establishing new requirements on the digital signal processing concerning their performance, robustness and efficiency. Based on the physical nature of speech, the speech signals are often processed in the time-frequency domain, where the psychoacoustic and statistical models can be more easily integrated into the signal processing chain as compared the time domain. An important processing task here is denoising of signals disturbed by additive noise invariably occurring in many technical fields. A conventional spectral speech enhancement system for signal denoising usually consists of different modules. While stationary noise can be efficiently suppressed by such systems, removal of nonstationary noise has been known to be a very demanding task, whose solution is still a challenging topic of modern research. Development of modules being able to remove nonstationary noise, are carried out in two main parts of this thesis.
- The PDF-Document has been downloaded 80 times.