TY - THES AB - Die Wissensextraktion ist ein wesentlicher Bestandteil in vielen Forschungsanwendungen. Unser erster Beitrag basiert auf Ensemblemethoden für die Erkennung von Entitäten und erreicht eine Reduzierung der Fehlerrate um 40%. Wir stellen unsere Ergebnisse mit Fox zur Verfügung, ein Framework, das einen Wissensgraphen mit maschinenverarbeitbaren Standards als Ausgabe serialisiert. Wir schlagen Cetus vor, ein auf Muster basierender Ansatz für die Extraktion von Entitätstypen und für das Befüllen von Wissensgraphen. Wir präsentieren unsere Untersuchungen zu holistischen Ansätzen für das verlinkten von Entitäten und schlagen unser Referenzframework für diese Kernaufgaben vor. Wir stellen Ocelot vor, ein Ansatz für die Extraktion von vordefinierten Relationen basierend auf distributionaler Semantik und einer Baumgeneralisierung. Unser Ansatz verallgemeinert Muster in Dependenzbäumen von hoher Qualität und extrahiert Relationen aus Text mit diesen Baumgeneralisierungen. Mit unserem Scms Ansatz erleichtern wir die semantische Datenintegration in Content-Management-Systemen. Unser Ansatz unterstützt Inhalte zu semantisieren und damit eine effizientere Entscheidungsfindung. Wir berichten über unseren Ansatz Leopard, der für die Vorhersage und Validierung von Attributen sowie für die Befüllung von Wissensgraphen entwickelt wurde. Unser Ansatz unterstützt dabei die Genauigkeit und Vollständigkeit von Wissensgraphen zu verbessern. Leopard kombiniert eine Vielzahl von Wissens- und Textextraktionsmethoden und nutzt Quellen sowohl aus dem mehrsprachigen Web der Dokumente, als auch dem mehrsprachigen Web der Daten, unter Einbeziehung von Rankingverfahren. Abschließend skizzieren wir unsere Teilnahme an der Open Knowledge Extraction Challenge. AU - Speck, René CY - Paderborn DO - 10.17619/UNIPB/1-2123 DP - Universität Paderborn LA - eng N1 - Tag der Verteidigung: 08.11.2024 N1 - Universität Paderborn, Dissertation, 2024 PB - Veröffentlichungen der Universität PY - 2024 SP - 1 Online-Ressource (xxiii, 203 Seiten) Illustrationen, Diagramme T2 - Institut für Informatik TI - Knowledge extraction for the data web UR - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-53312 Y2 - 2026-01-12T14:51:42 ER -