Titelaufnahme
Titelaufnahme
- TitelMachine Learning for Sequential Data: Unraveling the Challenges Associated with Feature Encoding, Output Decoding, and Distribution Shifts / Matthew Caron ; Oliver Müller, Markus Weinmann
- Autor
- Gutachter
- Erschienen
- Umfang1 Online-Ressource (vii, 72 Seiten) Diagramme
- HochschulschriftKumulative Dissertation Universität Paderborn, Dissertation, 2025
- AnmerkungTag der Verteidigung: 28.05.2025
- Verteidigung2025-05-28
- SpracheEnglisch
- DokumenttypDissertation
- Schlagwörter (GND)
- URN
- DOI
Links
- Social MediaShare
- Nachweis
- IIIF
Dateien
Klassifikation
Zusammenfassung
Das Verstehen und Vorhersagen sequentieller Muster stellt eine zentrale Herausforderung in vielen maschinellen Lernverfahren dar. Im Gegensatz zu statischen Daten, bei denen einzelne Beobachtungen unabhängig voneinander sind, entwickeln sich sequenzielle Daten über die Zeit hinweg und erfordern Modelle, die Abhängigkeiten zwischen vergangenen und zukünftigen Beobachtungen erfassen können. Viele bestehende Methoden tun sich jedoch schwer damit, zeitliche Abhängigkeiten abzubilden, strukturierte Ausgaben zu erzeugen oder ihre Leistung unter veränderten Datenbedingungen aufrechtzuerhalten, insbesondere dann wenn Modelle realweltlicher Variabilität ausgesetzt sind. Diese kumulative Dissertation adressiert diese Herausforderungen durch Methoden, die die Verarbeitung sequentieller Daten in maschinellen Lernmodellen verbessern. Konkret werden Encodingsstrategien für verschiedene Datentypen – d. h. numerische, textuelle, spatio-temporale und ereignisbasierte Daten – vorgestellt sowie Decodingtechniken entwickelt, die strukturierte und konsistente Ausgaben ermöglichen. Darüber hinaus wird ein Evaluierungsrahmen zur Erkennung und Abschwächung von Verteilungsverschiebungen eingeführt, der dazu beiträgt, die Modellleistung auch außerhalb kontrollierter Umgebungen sicherzustellen. Die Beiträge basieren auf acht Forschungsartikeln aus unterschiedlichen Anwendungsfeldern wie Finanzen, Markenbewertung, Logistik und Sportanalytik. Insgesamt liefert die Arbeit praxisorientierte Erkenntnisse für den Aufbau robuster, generalisierbarer und anwendungsnaher maschineller Lernsysteme zur Analyse sequentieller Daten.
Abstract
Understanding and predicting sequential patterns is a key challenge in many machine learning tasks. Unlike static data, where each observation is independent, sequential data evolves over time and requires models that can capture dependencies between past and future observations. Yet, many existing methods struggle to capture temporal dependencies, generate structured outputs, or maintain performance as data conditions change, particularly when models are exposed to real-world variability. This cumulative thesis addresses these challenges by presenting methods to improve how machine learning models process sequential data. Specifically, it introduces encoding strategies for different data types – i.e., numerical, textual, spatio-temporal, and event-based – and proposes decoding techniques that ensure structured and consistent outputs. In addition, the work develops an evaluation framework to detect and mitigate distribution shifts, helping models maintain performance beyond controlled settings. The contributions are based on eight research articles spanning domains such as finance, branding, logistics, and sports analytics. Together, they offer practical insights into building robust, generalizable, and effective machine learning systems for sequential data.
Inhalt
Statistik
- Das PDF-Dokument wurde 12 mal heruntergeladen.