TY - THES AB - Mit der zunehmenden Nutzung und Verbreitung von automatischen Spracherkennungssystemen steigen auch die Anforderungen an eben diese Systeme im Hinblick auf Robustheit gegenüber Nachhall und Hintergrundstörungen. Im besonderen Maße gilt dies für Freisprechsysteme. Zwar erhöhen diese den Bedienungskomfort für die Nutzer, sorgen aber auch dafür, dass das Sprachsignal auf verschiedene Arten gestört werden kann. Da das Training des akustischen Modells eines automatischen Spracherkennungssystems oftmals mit ungestörten Sprachsignalen durchgeführt wird, sorgen Nachhall und Hintergrundstörungen dafür, dass es während der Erkennung zu einer statistischen Diskrepanz zwischen den gespeicherten Modellen und den beobachteten Merkmalsvektoren kommt. Als Konsequenz dieser Fehlanpassung lassen sich steigende Wortfehlerraten des Erkenners beobachten. Aber auch wenn bereits auf Merkmalsvektoren von verrauschten und verhallten Sprachsignalen trainiert wurde, kommt es zu Verschlechterungen der Erkennungsergebnisse. Diese lassen sich auf die Verletzung der so genannten ”conditional-independence” Annahme, auf welche die ”Hidden Markov Modell”-basierte Spracherkennung fußt, durch die, durch den Nachhall bedingten, verstärkten zeitlichen Korrelationen der Merkmalsvektoren zurückführen. Um diese Probleme adressieren zu können, wird in dieser Arbeit eine detaillierte (statistische) Analyse der Auswirkung von Nachhall und Hintergrundstörungen auf das Sprachsignal und schlussendlich auf die Merkmalsvektoren, welche für die Erkennung verwendet werden, durchgeführt. Daraus wird dann ein neuartiges Beobachtungsmodell, welches die Merkmale des verrauschten und verhallten Sprachsignals mit denen des ungestörten Sprachsignals und denen der Hintergrundstörung in Beziehung setzt, entwickelt ... AU - Leutnant, Volker CY - Paderborn DA - 2016 DP - Universität Paderborn LA - eng N1 - Tag der Verteidigung: 19.05.2015 N1 - Fakultät für Elektrotechnik, Informatik und Mathematik der Universität Paderborn, Univ., Dissertation, 2015 PB - Veröffentlichungen der Universität PY - 2016 SP - 1 Online-Ressource (iv, 258 Seiten) T2 - Fakultät für Elektrotechnik, Informatik und Mathematik TI - Bayesian estimation employing a phase-sensitive observation model for noise and reverberation robust automatic speech recognition UR - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-24155 Y2 - 2026-01-14T15:15:55 ER -