TY - THES AB - Trotz des Fortschritts im Bereich Quellentrennung, Sprachsignal-Verbesserung und automatischer Spracherkennung ist das Problem robuster Verarbeitung realistischer Meetings ungelöst. Die meiste Forschung im Bereich Quellentrennung konzentriert sich entweder auf spektrale Merkmale um einkanalige Aufnahmen zu trennen oder räumliche Merkmale um mehrkanalige Aufnahmen zu trennen. Die Integration von räumlichen und spektralen Merkmalen in einem gemeinsamen Konzept kann die automatische Spracherkennung signifikant verbessern und die Generalisierbarkeit verbessern, da neuronale Netze von den sehr großen Datensätzen profitieren wohingegen die probabilistischen Modelle besser auf unbekannte Situationen reagieren können. Deshalb liegt der Fokus der vorliegenden Arbeit auf der Integration von zwei verhältnismäßig unabhängigen Forschungsrichtungen, nämlich einkanaliger Quellentrennung basierend auf neuronalen Netzen und mehrkanaliger Quellentrennung basierend auf probabilistischen grafischen Modellen. Diese Arbeit stellt ein generelles Gerüst zur Integration räumlicher und spektraler Merkmale dar in dem neuronale Netze und probabilistische grafische Modelle sich ergänzen um den State-of-the-Art im Bereich blinder Quellentrennung von verhallten und verrauschten Mischungen zu definieren. The Kernergebnisse sind (1) eine kaskadierte Integration bei der ein neuronales Netz ein probabilistisches grafisches Modell initialisiert liefert bereits substantielle Verbesserungen, (2) räumliche Merkmale können zum unüberwachten Training neuronaler Netze zur Quellentrennung verwendet werden, (3) die enge Integration, bei der eine gemeinsame Lösung beider Modalitäten gefunden wird, führt zu den geringsten Wortfehlerraten und bester Generalisierbarkeit zu ungesehenen realistischen Aufnahmen. AU - Drude, Lukas CY - Paderborn DA - 2020 DO - 10.17619/UNIPB/1-1074 DP - Universität Paderborn LA - ger N1 - Tag der Verteidigung: 18.12.2020 N1 - Universität Paderborn, Dissertation, 2020 PB - Veröffentlichungen der Universität PY - 2020 SP - 1 Online-Ressource (v, 143 Seiten) T2 - Institut für Elektrotechnik und Informationstechnik TI - Integration of neural networks and probabilistic spatial models for acoustic blind source separation UR - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-38332 Y2 - 2026-01-15T05:05:46 ER -