Neural Entity Linking for Question Answering over Knowledge Graphs / Daniel Vollmers ; 1. Reviewer Prof. Dr. Axel-Cyrille Ngonga Ngomo (Department of Computer Science Paderborn University), 2. Reviewer Prof. Dr. Ricardo Usbeck (Institute of Information Systems Leuphana University Lüneburg) ; Supervisors Prof. Dr. Axel-Cyrille Ngonga Ngomo, Dr. Hamada Mohamed Abdelsamee Zahera

Vollmers, Daniel

Titelaufnahme

Titel
Neural Entity Linking for Question Answering over Knowledge Graphs / Daniel Vollmers ; 1. Reviewer Prof. Dr. Axel-Cyrille Ngonga Ngomo (Department of Computer Science Paderborn University), 2. Reviewer Prof. Dr. Ricardo Usbeck (Institute of Information Systems Leuphana University Lüneburg) ; Supervisors Prof. Dr. Axel-Cyrille Ngonga Ngomo, Dr. Hamada Mohamed Abdelsamee Zahera
Autor
Vollmers, Daniel
Gutachter
Ngonga Ngomo, Axel-Cyrille ; Usbeck, Ricardo
Erschienen
Paderborn, 2026
Umfang
1 Online-Ressource (xviii, 185 Seiten) : Diagramme, Illustrationen
Hochschulschrift
Universität Paderborn, Dissertation, 2026
Anmerkung
Tag der Verteidigung: 13.05.2026
Verteidigung
2026-05-13
Sprache
Deutsch
Dokumenttyp
Dissertation
Schlagwörter (GND)
Paderborn
URN
urn:nbn:de:hbz:466:2-58027
DOI
https://doi.org/10.17619/UNIPB/1-2566

Links

Social Media

Share
Nachweis
Universitätsbibliothek Paderborn
IIIF
IIIF-Manifest

Dateien

Neural Entity Linking for Question Answering over Knowledge Graphs [Pdf 33.96 mb]
RIS

Klassifikation

Besondere Sammlungen → Veröffentlichungen der Universität → Heinz Nixdorf Institut (HNI)
Besondere Sammlungen → Veröffentlichungen der Universität → Fakultät für Elektrotechnik, Informatik und Mathematik
Besondere Sammlungen → Veröffentlichungen der Universität → Fakultät für Elektrotechnik, Informatik und Mathematik → Institut für Informatik
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Informatik, Informationswissenschaft, allgemeine Werke
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Computerprogrammierung, Programme, Daten

Zusammenfassung

Eine der zentralen Anwendungen des Internets besteht weiterhin in der gezielten Suche nach korrekten Informationen und der Erkundung neuer oder bislang unbekannter Themen. In diesem Zusammenhang spielen Suchmaschinen und verwandte Anwendungen, die als Antwort auf Benutzeranfragen relevante Dokumente, wie beispielsweise Webseiten abrufen, seit Langem eine zentrale Rolle in der Forschung. Das Informationsbedürfnis der Nutzenden ist jedoch häufig komplexer und erfordert die Integration von Informationen aus mehreren Quellen, etwa bei der Ermittlung des günstigsten Angebots für ein Auto oder bei der Beantwortung faktischer Fragen wie Welche Museen befinden sich in Paderborn? Diese Arbeit beschäftigt sich mit dem Forschungsbereich Question Answering. Jüngste Fortschritte im Zusammenhang der Entwicklung großer Sprachmodelle (Large Language Models, LLMs), die auf umfangreichen Textkorpora trainiert werden, haben dieses Forschungsfeld grundlegend verändert. Obwohl LLMs den aktuellen Stand der Technik darstellen, neigen sie zu Halluzinationen, das heißt, sie erzeugen Antworten, die nicht immer faktisch korrekt oder auf verlässlichem Wissen beruhen. Diese Einschränkung ist besonders problematisch angesichts der weit verbreiteten Desinformation im Internet. Zur Bewältigung dieses Problems bietet das anreichern von LLM prompts durch Informationen aus vertrauenswürdigen Wissensquellen, wie Textkorpora, Datenbanken oder Wissensgraphen (Knowledge Graphs, KGs), einen vielversprechenden Ansatz. In diesem Retrieval-Augmented-Generation (RAG)-Paradigma werden zunächst Information aus Wissensquellen abgerufen und dem Modell als zusätzlicher Input zur Verfügung gestellt, um die faktische Genauigkeit zu verbessern. Im Fall von Wissensgraphen wird diese Aufgabe als Question Answering über Wissensgraphen bezeichnet (KGQA). Um Fragen basierend auf den Informationen eines Wissensgraphen zu beantworten, können Semantic Parsing Verfahren angewandt werden, welche eine natürlichsparachliche Frage in eine ausführbare SPARQL Query übersetzen. In diesem Kontext konzentriert sich die Arbeit auf die Erforschung und Anwendung von neuronalen Entity Linking Verfahren, für das Forschungsthema Question Answering über Wissensgraphen (KGQA). Es werden Methoden zur kontextuellen Erweiterung, zur Extraktion fehlender Schlüsselwörter und zum robusten Retrieval entwickelt, um die Identifikation von Entitäten, Relationen und Typen (ERL) zu verbessern. Darüber hinaus wird analysiert, wie ERL die Gesamtleistung von KGQA-Systemen beeinflusst.

Abstract

One of the primary uses of the Internet remains the search for accurate information and the exploration of new or unfamiliar topics. Search engines and related applications, which retrieve relevant documents such as web pages in response to user queries, have long been central to information retrieval research. However, the information need of users is often more complex and requires the integration of information from multiple sources, for instance, to search for cost-effective car offers or to answer factual questions such as Which museums are located in Paderborn?. This thesis investigates the task of question answering (QA). Recent advances in large language models (LLMs) trained on vast textual corpora have transformed this field. Although LLMs represent the current state of the art, they are prone to hallucinations, generating responses that are not always factually correct or grounded in reliable information. This limitation is especially problematic given the widespread availability of misinformation online. To address this issue, a promising strategy is to ground LLM predictions in trusted knowledge sources such as text corpora, databases, or knowledge graphs (KGs). In this retrieval-augmented generation (RAG) paradigm, external information is retrieved and provided to the model to improve factual accuracy. When specifically leveraging knowledge graphs, this task is referred to as Knowledge Graph Question Answering (KGQA). This task can be solved by applying a semantic parsing approach to translate natural language questions into executable SPARQL queries. In this context, this thesis explores the application of neural entity linking approaches for question answering over knowledgegraphs (KGQA). We develop methods for contextual augmentation, absent keyphrase extraction, and robust retrieval to enhance entity, relation, and type linking (ERL) and analyze how ERL performance affects overall KGQA effectiveness.

Inhalt

Inhalt des Werkes

Statistik

Das PDF-Dokument wurde 13 mal heruntergeladen.

Lizenz-/Rechtehinweis

Creative Commons Namensnennung 4.0 International Lizenz

Publizieren

Besondere Sammlungen

Digitalisierungsservice

Hilfe

Impressum

Datenschutz

Titelaufnahme