Zur Seitenansicht
 

Titelaufnahme

Titel
Beiträge zur generalisierten modellbasierten spektralen Sprachsignalentstörung / von Dipl.-Ing. Aleksej Chinaev ; erster Gutachter: Prof. Dr.-Ing. Reinhold Häb-Umbach, zweiter Gutachter: Prof. Dr.-Ing. Rainer Martin
AutorChinaev, Aleksej
BeteiligteHaecconius, Jacobus In der Gemeinsamen Normdatei der DNB nachschlagen ; Martin, Rainer In der Gemeinsamen Normdatei der DNB nachschlagen
ErschienenPaderborn, 2018
Ausgabe
Elektronische Ressource
Umfang1 Online-Ressource (ix, 232 Seiten : Diagramme)
HochschulschriftUniversität Paderborn, Dissertation, 2017
Anmerkung
Tag der Verteidigung: 01.12.2017
Verteidigung2017-12-01
SpracheDeutsch ; Englisch
DokumenttypDissertation
URNurn:nbn:de:hbz:466:2-30440 Persistent Identifier (URN)
DOI10.17619/UNIPB/1-294 
Dateien
Beiträge zur generalisierten modellbasierten spektralen Sprachsignalentstörung [2.98 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Mit zunehmender Digitalisierung unserer Gesellschaft wachsen auch Anforderungen an die Systeme zur Verarbeitung von zeitdiskreten Sprachsignalen bezüglich ihrer Leistungsfähigkeit, Robustheit und Effizienz. Begründet in der physikalischen Natur eines Sprachsignals findet die Sprachsignalverarbeitung oft im Zeit-Frequenz-Bereich statt, wo die psychoakustischen und statistischen Modelle in die Signalverarbeitungskette leichter integriert werden können als im Zeitbereich. Häufig müssen hier die gestörten Sprachsignale vom additiven Rauschen entstört werden, das als eine prominente Störung in vielen technischen Bereichen auftritt. Dabei werden Systeme zur spektralen Sprachsignalentstörung modular aus verschiedenen Systemkomponenten aufgebaut. Während solche Systeme stationäres Rauschen gut unterdrücken können, stellt sich das spektrale Entfernen nichtstationärer Störungen als eine sehr herausfordernde Aufgabe dar, die immer noch Gegenstand moderner Forschung ist. In zwei Hauptteilen der vorliegenden Arbeit werden mit unterschiedlichen Zielsetzungen sechs Schätzverfahren entwickelt, die als Bausteine eines Systems zur spektralen Sprachsignalentstörung verwendet werden.

Zusammenfassung (Englisch)

The ongoing digitalization of our society has led to an increase in establishing new requirements on the digital signal processing concerning their performance, robustness and efficiency. Based on the physical nature of speech, the speech signals are often processed in the time-frequency domain, where the psychoacoustic and statistical models can be more easily integrated into the signal processing chain as compared the time domain. An important processing task here is denoising of signals disturbed by additive noise invariably occurring in many technical fields. A conventional spectral speech enhancement system for signal denoising usually consists of different modules. While stationary noise can be efficiently suppressed by such systems, removal of nonstationary noise has been known to be a very demanding task, whose solution is still a challenging topic of modern research. Development of modules being able to remove nonstationary noise, are carried out in two main parts of this thesis.

Lizenz
CC-BY-Lizenz (4.0)Creative Commons Namensnennung 4.0 International Lizenz