TY - THES AB - In dieser Arbeit betrachten wir zwei Soft-Clustering Methoden: Fuzzy K-Means Clustering und modellbasiertes Clustering mittels Gaußmixturen. Im Gegensatz zum populären K-Means Clustering gibt es für diese beiden Ansätze kaum Algorithmen, die Garantien für die Güte der berechneten Clusterings bieten. Im ersten Teil der Arbeit präsentieren wir die allerersten Approximationsalgorithmen für das Fuzzy K-Means Problem: Wir zeigen, dass die sogenannte Superset-Sampling Technik auf das Fuzzy K-Means Problem angewendet werden kann. Darüber hinaus zeigen wir, dass sich eine Kernmenge für das Fuzzy K-Means Problem berechnen lässt. Wir nutzen diese Kernmengen-Konstruktion auch, um einen weiteren Approximationsalgorithmus für das Fuzzy K-Means Problem herzuleiten. Darüber hinaus betrachten wir verschiedene Varianten des Fuzzy K-Means Problems und verallgemeinern all diese Ergebnisse. Der zweite Teil dieser Arbeit dreht sich um den modellbasierten Clustering Ansatz, genauer gesagt, die Maximum-Likelihood-Methode für das Schätzen von Gaußmixturen. Als erstes vergleichen wir den klassischen Expectation-Maximization Algorithmus mit einer seiner randomisierten Varianten. Zweitens beschäftigen wir uns mit dem Problem, eine vernünftige initiale Lösung für den Expectation-Maximization Algorithmus für Gaußmixturen zu finden. Wir präsentieren zwei neue Initialisierungsmethoden und versuchen damit die Lücke zwischen den einfachen, aber eher unzuverlässigen Methoden und komplizierten Methoden, deren Qualität stark von den gewählten Hyperparametern abhängt, zu schließen. Drittens analysieren wir einen Spezialfall des Problems, der auch schlicht als das Soft-Clustering Problem bekannt ist. AU - Bujna, Kathrin CY - Paderborn DA - 2017 DO - 10.17619/UNIPB/1-226 DP - Universität Paderborn LA - eng N1 - Tag der Verteidigung: 04.10.2017 N1 - Universität Paderborn, Dissertation, 2017 PB - Veröffentlichungen der Universität PY - 2017 SP - 1 Online-Ressource (229 Seiten) T2 - Fakultät für Elektrotechnik, Informatik und Mathematik TI - Soft clustering algorithms: theoretical and practical improvements UR - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-29759 Y2 - 2024-10-03T14:05:45 ER -