Zur Seitenansicht
 

Titelaufnahme

Titel
Mehrkanalige Sprachsignalverbesserung durch adaptive Lösung eines Eigenwertproblems im Frequenzbereich / Ernst Warsitz
AutorWarsitz, Ernst In der Gemeinsamen Normdatei der DNB nachschlagen
Erschienen2009
HochschulschriftPaderborn, Univ., Diss., 2008
SpracheDeutsch
DokumenttypDissertation
URNurn:nbn:de:hbz:466-20090327039 Persistent Identifier (URN)
Dateien
Mehrkanalige Sprachsignalverbesserung durch adaptive Lösung eines Eigenwertproblems im Frequenzbereich [6.49 mb]
zusammenfassung [14.84 kb]
abstract [12.01 kb]
Links
Nachweis
Klassifikation

Deutsch

Bei der Sprachkommunikation kann der Komfort für die Kommunikationsteilnehmer durch die Verwendung von Freisprecheinrichtungen erheblich gesteigert werden. Hierbei ergibt sich jedoch das Problem, dass Störgeräusche in der Umgebung des Sprechers ebenfalls von dem entfernten Mikrophon mit erfasst werden. Beim Einsatz von Mikrophongruppen ist es nun möglich, akustische Wellen räumlich abzutasten und mit der anschließenden strahlformenden Signalverarbeitung (Beamforming) Signale aus einer bestimmten Raumrichtung gegenüber Signalen aus anderen Einfallsrichtungen zu verstärken. Dadurch können in einer Freisprechsituation Störgeräusche gedämpft und somit das Sprachsignal des Zielsprechers verbessert werden.

In dieser Arbeit werden Algorithmen zum adaptiven Beamfoming basierend auf der Lösung eines Eigenwertproblems im Frequenzbereich entwickelt und untersucht. Das betrachtete Eigenwertproblem entsteht aufgrund eines Optimierungskriteriums, welchem die Maximierung des Signal-zu-Rauschleistungsverhältnisses (Max-SNR) am Beamformer-Ausgang zugrunde liegt. Die Lösung des Eigenwertproblems kommt hierbei in zwei Beamformer-Strukturen zum Tragen: zum einen als Filter-and-Sum-Beamformer (FSB) und zum anderen als Generalized Sidelobe Canceller (GSC).

Der FSB weist eine schnelle Adaption auf und ermöglicht somit ein Folgen eines sich bewegenden Sprechers. Die einhergehenden Signalverzerrungen beim Einsatz des Max-SNR-Kriteriums pro Frequenzkomponente werden mittels neuartiger Nachfilterverfahren deutlich reduziert.

Eine höhere Störgeräuschunterdrückung im Vergleich zum FSB ist mit einem GSC möglich, wobei die Sprecherposition als nahezu konstant angenommen wird. Für die GSC-Struktur werden neuartige Realisierungen des Fixed Beamformers sowie der sprachblockierenden Matrix vorgestellt, welche ebenfalls auf der Lösung eines Eigenwertproblems im Frequenzbereich basieren.

Die in dieser Arbeit vorgelegten Beamforming-Verfahren zeichnen sich durch ihre blinden Adaptionseigenschaften aus. Dies bedeutet, dass keine explizite Positionsbestimmung des Sprechers notwendig ist und die geometrische Anordnung der Mikrophone unbekannt sein kann. Des Weiteren ist die Adaption auch bei starken permanent aktiven stationären Störungen möglich.

English

The comfort in using speech communication equipments can be considerably increased with hands-free devices. In this case however, the problem arises that also background noise is captured by the microphone. By using a microphone array, the spatial sampling of the acoustical waves is possible. The subsequent signal processing (beamforming) can then amplify signals arriving from the desired direction of the speaker in contrast to signals coming from other directions. Thus it is possible to enhance the desired speech signal.

In this thesis algorithms for adaptive beamforming based on the solution of an eigenvalue problem in the frequency domain are developed and evaluated. The eigenvalue problem is a result of the maximization of the signal-to-noise ratio (Max-SNR) at the output of the beamformer. Two alternative beamformer structures are presented: a filter-and-sum beamformer (FSB) and a generalized sidelobe canceller (GSC).

The FSB shows fast adaptation behaviour and is therefore well suitable to follow a moving speaker. The speech distortion coming along with the Max-SNR criterion, applied separately for every frequency bin, is reduced significantly by some novel post filter methods.

Higher noise suppression in comparison to the FSB can be achieved by the GSC, when the speaker position is nearly constant. For the GSC structure novel realizations of the fixed beamformer and the blocking matrix, also based on the solution of the eigenvalue problem in the frequency domain, are proposed.

The beamforming methods presented here are characterized by their blind adaptation properties. This means that no speaker localization is necessary and the geometrical assembly of the microphones need not to be known. Furthermore, adaptation is possible even in presence of strong permanent active stationary noises.