TY - THES AB - In den letzten Jahren ist das Linked Data Web zu einer größe von mehreren Milliarden Fakten angewachsen, die über tausende Wissensbasen verteilt sind. Die aktuelle englische Version der DBpedia Wissensbasis beschreibt beispielsweise 4.58 Millionen Dinge. Eine direkte Konsequenz der Verfügbarkeit dieser großen Menge an Daten im Resource Description Framework ist der wachsende Bedarf an effektiven und effizienten Link Discovery Algorithmen, die die Verbindungen zwischen den Wissensgraphen erstellen. Zu diesem Zweck wurden in den letzten Jahren mehrere Ansätze, die vor allem Algorithmen des maschinellen Lernens - von Wahrscheinlichkeitsmodellen bis zu genetischer Programmierung - verwenden, um die angestrebte Effektivität zu erreichen. Durch die schiere Größe der Wissensbasen wird neben der Generierung akkurater Links die Zeiteffizienz zu einer Herausforderung. Die meisten dieser Frameworks basieren auf atomaren oder komplexen Link Specifications, um Kandidaten für einen Link zu identifizieren. Diese Arbeit behandelt die Herausforderung der Erstellung zeiteffizienter Linking Algorithmen. Wir präsentieren mehrere Ansätze, die schnelles und skalierbares LD ermöglichen. Wir unterscheiden dabei zwei Untermengen: (1) Ansätze zur Optimierung der Effizienz atomarer LSs und (2) Ansätze zur schnelle Ausführung komplexer Ähnlichkeiten und LSs. Die Entwicklung der erste Untermenge wird durch das Fehlen von schnellen Ansätzen zum Verknüpfen von Ereignisdaten und der derzeitigen Performanz von semantischen Ähnlichkeiten für Zeichenketten in LD frameworks motiviert. Die zweite Menge besteht aus zeiteffizienten LD Ansätzen, die mit Zeit- und Speicherbeschränkungen umgehen können, sowie Planungsalgorithmen, die globales Wissen über die Ausführung von LSs verwenden und bisher fehlten. AU - Georgala, Kleanthi CY - Paderborn DA - 2021 DO - 10.17619/UNIPB/1-1185 DP - Universität Paderborn LA - eng N1 - Tag der Verteidigung: 28.05.2021 N1 - Universität Paderborn, Dissertation, 2021 PB - Veröffentlichungen der Universität PY - 2021 SP - 1 Online-Ressource (xxii, 147 Seiten) T2 - Institut für Informatik TI - Time-efficient link discovery for data-driven applications UR - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-39444 Y2 - 2025-06-19T22:41:13 ER -