Bibliographic Metadata
Bibliographic Metadata
- TitleMatrix and tensor decomposition methods for joint blind source separation : theory and application to functional imaging data / von M.Sc. Isabell Lehmann ; Erster Gutachter: Prof. Dr. Peter Schreier, Zweite Gutachterin: Prof. Dr. Tülay Adali
- Author
- Degree supervisor
- Published
- Description1 Online-Ressource (xiv, 165 Seiten) : Illustrationen, Diagramme
- Institutional NoteUniversität Paderborn, Dissertation, 2025
- AnnotationTag der Verteidigung: 05.11.2025
- Defended on2025-11-05
- LanguageEnglish
- Document TypesDissertation (PhD)
- Keywords (GND)
- URN
- DOI
Links
- Social MediaShare
- Reference
- IIIF
Files
Classification
Zusammenfassung
Das Problem der gemeinsamen blinden Quellentrennung (Joint Blind Source Separation, JBSS), d. h. der gemeinsamen Schätzung verborgener Quellen aus mehreren beobachteten Datensätzen, ist von hoher Relevanz in vielen Fachdisziplinen, unter anderem in der Sprachverarbeitung und der biomedizinischen Signalverarbeitung. Beispielsweise können die in biomedizinischen Datensätzen gefundenen Quellen Biomarker für die Erkennung von Erkrankungen wie Schizophrenie liefern. Verschiedene Matrix- und Tensorzerlegungsmethoden sind entwickelt worden, um JBSS zu erzielen, d. h. unter der Annahme eines generativen Modells die wahren zugrunde liegenden Quellen bis auf Permutations- und Skalierungsmehrdeutigkeiten wiederherzustellen und die Quellen über Datensätze hinweg korrekt anzuordnen. Die Analyse unabhängiger Vektoren (Independent Vector Analysis, IVA), eine Erweiterung der sehr bekannten Analyse unabhängiger Komponenten (Independent Component Analysis, ICA) für mehrere Datensätze, erreicht JBSS durch Maximierung der Unabhängigkeit von Quellen innerhalb eines Datensatzes und Maximierung der Abhängigkeit von Quellen über Datensätze hinweg. Des Weiteren gibt es die Kanonische Korrelationsanalyse für mehrere Datensätze (multiset Canonical Correlation Analysis, mCCA), welche ursprünglich entwickelt wurde, um Variablen zu identifizieren, die über mehrere Datensätze hinweg maximal korreliert sind, sogenannte kanonische Variablen. Da die Korrelation von mehr als zwei kanonischen Variablen auf unterschiedliche Weise quantifiziert werden kann, wurden verschiedene mCCA-Optimierungsfunktionen vorgeschlagen. Die fünf bekanntesten sind sumcor, maxvar, minvar, genvar und ssqcor. Obwohl mCCA in seiner Formulierung kein generatives Modell festlegt, können wir durch die Annahme des JBSS-Modells untersuchen, unter welchen Bedingungen die von mCCA geschätzten kanonischen Variablen den wahren Quellen entsprechen. Die Bedingungen, unter denen eine Methode JBSS erzielen kann, werden allgemein als Quellenidentifikationsbedingungen bezeichnet. Unter der Annahme, dass das JBSS-Modell die zugrunde liegende Physik der Daten beschreiben kann, müssen die Quellenidentifikationsbedingungen einer JBSS-Methode erfüllt sein, um die geschätzten Quellen interpretieren zu können, d. h. ihnen eine physikalische Bedeutung zuordnen zu können. Daher ist es wichtig, diese Bedingungen zu kennen. Die Quellenidentifikationsbedingungen von IVA und mCCA-maxvar für JBSS wurden in der Literatur bereits hergeleitet. In dieser Arbeit erweitern wir den Stand der Literatur, indem wir die Quellenidentifikationsbedingungen von mCCA-sumcor herleiten und beweisen und theoretische Überlegungen zu den Bedingungen von mCCA-minvar, mCCA-genvar und mCCA-ssqcor diskutieren. Wir unterstützen die vorgestellten theoretischen Bedingungen mit numerischen Ergebnissen. Wir stellen außerdem die Zusammenhänge zwischen wichtigen Matrix- und Tensorzerlegungs-methoden für JBSS her. Die Kenntnis über die Zusammenhänge verschiedener Methoden und über ihre Quellenidentifikationsbedingungen trägt dazu bei, Klarheit darüber zu schaffen, welche Methoden für welche Anwendungen nützlich sein können. Noch wichtiger als die verborgenen Quellen zu identifizieren ist in einigen Anwendungen, beispielsweise der Präzisionsmedizin, die Beziehung zwischen verschiedenen (Matrix-)Datensätzen zu verstehen. Dies ist bei hochdimensionalen und verrauschten Datensätzen eine Herausforderung. Wir schlagen eine neuartige Methode zur Identifizierung der Beziehungsstruktur zwischen mehreren Datensätzen mithilfe von JBSS vor, die beschreibt, welche Untergruppen von Datensätzen ähnliche zugrunde liegende Quellen haben und wie diese Untergruppen zusammenhängen. Anschließend demonstrieren wir den Erfolg der vorgeschlagenen Methode in Simulationen. Abschließend verwenden wir JBSS-Methoden für die Analyse von realen funktionellen Magnetresonanztomographie (fMRT)-Daten und von funktionellen Ultraschall (fUS)-Daten. Wir zeigen, dass die JBSS-Methoden eine Datenfusion der fMRT-Daten durchführen und potenzielle Biomarker für Schizophrenie identifizieren können. Zudem identifiziert die vorgeschlagene Methode eine sinnvolle Beziehungsstruktur zwischen den fMRT-Datensätzen. Schließlich zeigen wir, dass JBSS-Methoden aktive Gehirnregionen in fUS-Daten identifizieren können, die ähnlich zu denen sind, die mit der als Goldstandard geltenden Analysemethode gefunden wurden, allerdings unter weniger strengen Annahmen.
Abstract
The problem of Joint Blind Source Separation (JBSS), i.e., the joint estimation of latent sources from multiple observed datasets, occurs in many areas like speech processing and biomedical signal processing, among others. For example, the latent sources found in biomedical datasets may provide biomarkers for the detection of disorders like schizophrenia. Several matrix and tensor decomposition methods have been developed to achieve JBSS, i.e., assuming a generative model, to recover the true underlying sources up to permutation and scaling ambiguities and to correctly align the sources across datasets. Independent Vector Analysis (IVA), a multiset extension of the well-known Independent Component Analysis (ICA), achieves JBSS by maximizing independence of sources within a dataset and maximizing dependence of sources across datasets. There also exists multiset Canonical Correlation Analysis (mCCA), which was originally developed to identify variables that are maximally correlated across multiple datasets, called canonical variables. As correlation between more than two canonical variables can be quantified in different ways, different mCCA objective functions have been proposed, with the commonly known ones being sumcor, maxvar, minvar, genvar, and ssqcor. While mCCA does not specify a generative model in its formulation, by assuming the JBSS model, we can study under which conditions the canonical variables estimated by mCCA recover the true sources. The conditions under which a method is able to achieve JBSS are more generally known as source identification conditions. Assuming the JBSS generative model matches the underlying physics of the data, the source identification conditions of a JBSS method must be satisfied to interpret the estimated sources, i.e., to attach physical meaning to them. Therefore, it is important to be aware of these conditions. The source identification conditions of IVA and mCCA-maxvar for JBSS have been derived in prior work. In this thesis, we extend the literature by deriving and proving the source identification conditions of mCCA-sumcor and discussing theoretical considerations for those of mCCA-minvar, mCCA-genvar, and mCCA-ssqcor. We substantiate the proposed theoretical conditions with numerical results. We also establish the connections between an important set of matrix and tensor decomposition methods for JBSS. Understanding how different methods are connected and knowing their source identification conditions helps clarify which methods can be useful in which applications. In some applications, for example, precision medicine, more important than identifying latent sources is understanding how different (matrix) datasets are related, which is challenging when datasets are high-dimensional and noisy. We propose a novel method for identifying the relationship structure among multiple datasets using JBSS, which describes which subsets of datasets have similar latent sources and how these subsets of datasets are related, and verify the success of the proposed method in simulations. Finally, we apply JBSS methods to real-world functional Magnetic Resonance Imaging (fMRI) and functional Ultrasound (fUS) datasets. We show that the JBSS methods can perform data fusion of multi-task fMRI data and identify potential biomarkers for schizophrenia, and that the proposed method identifies a meaningful relationship structure among the multi-task fMRI datasets. Lastly, we show that JBSS methods estimate active brain networks in fUS data that are similar to those found by the gold standard analysis method, under less strict assumptions.
Content
License/Rightsstatement

