Automated machine learning for multi-label classification / Marcel Wever ; [Reviewers: Prof. Dr. Eyke Hüllermeier, Prof. Dr. Axel-Cyrille Ngonga Ngomo]

Wever, Marcel Dominik

Titelaufnahme

Titel
Automated machine learning for multi-label classification / Marcel Wever ; [Reviewers: Prof. Dr. Eyke Hüllermeier, Prof. Dr. Axel-Cyrille Ngonga Ngomo]
Autor
Wever, Marcel Dominik
Beteiligte
Hüllermeier, Eyke ; Ngonga Ngomo, Axel-Cyrille
Erschienen
Paderborn, 2022
Umfang
1 Online-Ressource (xii, 185 Seiten) : Diagramme
Hochschulschrift
Universität Paderborn, Dissertation, 2021
Anmerkung
Tag der Verteidigung: 03.11.2021
Verteidigung
2021-11-03
Sprache
Englisch
Dokumenttyp
Dissertation
URN
urn:nbn:de:hbz:466:2-40614
DOI
10.17619/UNIPB/1-1302

Links

Social Media

Share
Nachweis
Universitätsbibliothek Paderborn
IIIF
IIIF-Manifest

Dateien

Automated machine learning for multi-label classification [pdf 7.72 mb]
RIS

Klassifikation

Besondere Sammlungen → Veröffentlichungen der Universität → Fakultät für Elektrotechnik, Informatik und Mathematik
Besondere Sammlungen → Veröffentlichungen der Universität → Fakultät für Elektrotechnik, Informatik und Mathematik → Institut für Informatik
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Informatik, Informationswissenschaft, allgemeine Werke
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Datenverarbeitung; Informatik
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Computerprogrammierung, Programme, Daten

Zusammenfassung

Das Ziel des automatisierten maschinellen Lernens (AutoML) ist es, zugeschnitten auf einen gegebenen Datensatz, Algorithmen des maschinelle Lernens (ML) zu wählen, zu konfigurieren und in Form von ML-Pipelines zu kombinieren. Für überwachte Lernaufgaben, insbesondere binäre und multinomiale Klassifikation, auch als Single-Label-Klassifikation (engl.: single-label classification; SLC) bezeichnet, haben solche AutoML-Ansätze vielversprechende Ergebnisse geliefert. Die Aufgabe der Multi-Label-Klassifikation (engl.: multi-label classification; MLC), bei der Datenpunkte nicht nur mit einem sondern einer Menge von Klassenlabels assoziiert werden, hat bisher deutlich weniger Aufmerksamkeit erhalten. Im Kontext von MLC ist die datenspezifische Auswahl und Konfiguration von Multi-Label-Klassifikatoren selbst für Experten auf diesem Gebiet eine Herausforderung, da es sich um ein hochdimensionales Optimierungsproblem mit hierarchischen Abhängigkeiten über mehrere Ebenen hinweg handelt. Während der Raum von ML-Pipelines für SLC bereits sehr viele Kandidaten umfasst, übertrifft die Größe des MLC-Suchraums die des SLC-Suchraums um ein Vielfaches.Im ersten Teil dieser Arbeit wird ein neuartiger AutoML-Ansatz für SLC-Aufgaben entwickelt, der ML-Pipelines optimiert, die aus maximal zwei Algorithmen bestehen. Außerdem untersuchen wir, wie gut Ansätze, die den Stand der Technik im Bereich AutoML für SLC-Aufgaben bilden, mit der erhöhten Komplexität des AutoML Problems für MLC skalieren.Im zweiten Teil wird untersucht, wie Methoden für SLC und MLC flexibler konfiguriert werden können, um die zur Verfügung stehenden Daten besser zu generalisieren, und wie die Effizienz von ausführungsbasierten AutoML-Systemen mit Hilfe von Laufzeitvorhersagen für ML-Pipelines gesteigert werden kann.

Abstract

Automated machine learning (AutoML) aims to select and configure machine learning algorithms and combine them into machine learning pipelines tailored to a dataset at hand. For supervised learning tasks, most notably binary and multinomial classification, aka single-label classification (SLC), such AutoML approaches have shown promising results. However, the task of multi-label classification (MLC), where data points are associated with a set of class labels instead of a single class label, has received much less attention so far. In the context of multi-label classification, the data-specific selection and configuration of multi-label classifiers are challenging even for experts in the field, as it is a high-dimensional optimization problem with multi-level hierarchical dependencies. While for SLC, the space of machine learning pipelines is already huge, the size of the MLC search space outnumbers the one of SLC by several orders.In the first part of this thesis, we devise a novel AutoML approach for single-label classification tasks optimizing pipelines of machine learning algorithms, consisting of two algorithms at most. Furthermore, we investigate how well AutoML approaches that form the state of the art for single-label classification tasks scale with the increased problem complexity of AutoML for multi-label classification.In the second part, we explore how methods for SLC and MLC could be configured more flexibly to achieve better generalization performance and how to increase the efficiency of execution-based AutoML systems.

Inhalt

Inhalt des Werkes

Statistik

Das PDF-Dokument wurde 145 mal heruntergeladen.

Lizenz-/Rechtehinweis

Creative Commons Namensnennung 4.0 International Lizenz

Publizieren

Besondere Sammlungen

Digitalisierungsservice

Hilfe

Impressum

Datenschutz

Publizieren

Besondere Sammlungen

Digitalisierungsservice

Hilfe

Impressum

Datenschutz

Titelaufnahme