Die Natural Language Processing (NLP)-Gemeinschaft hat in letzter Zeit herausragendeFortschritte erzielt, die durch die Veröffentlichung verschiedener Architekturen künstlicher neuronaler Netze (NN) katalysiert wurden. NN-basierte Ansätze haben sich als effektiv erwiesen, da sie die Qualität der automatisiert erstellten Lösungen für eine große Zahl von NLP-Aufgaben (Belinkov and Glass, 2019) deutlich erhöht haben. Trotz dieser bemerkenswerten Fortschritte stellt der Umgang mit Entitäten immer noch eines schwierige Herausforderung dar, da sie in den Trainingsdaten nur selten zu vorkommen.Entitäten lassen sich in zwei Gruppen einteilen: Eigennamen und Gattungsnamen. Eigennamen werden auch als Named Entities (NE) bezeichnet und entsprechen den Namen vonPersonen, Organisationen oder Orten, z. B. John, WHO oder Kanada. Gattungsnamen beschreiben Klassen von Objekten, z. B. Löffel oder Krebs. Beide Typen von Entitäten können in einem Wissensgraphen (KG) gefunden werden. In jüngster Zeit wurden KGs erfolgreich bei der Lösung von NLP-Aufgaben genutzt, wie z. B. Natural LanguageInference (K M et al., 2018) und Question Answering (Sorokin and Gurevych, 2018). Dagegen haben sich nur wenige Arbeiten mit der Anwendung von KGs für die maschinelle,neuronale Übersetzung (NMT) oder der Generierung von natürlicher Sprache (NLG)beschäftigt, als mit dieser Arbeit begonnen wurde. Darüber hinaus ist die Mehrsprachigkeit bei diesen beiden Problemen weiterhin ein offenes Forschungsgebiet (Young et al.,2018). In dieser Arbeit konzentrieren wir uns auf die Verwendung von KGs für die maschinelleÜbersetzung und die Generierung von Texten, um die durch Entitäten verursachtenProbleme zu behandeln und folglich die Qualität automatisch generierter Texte zu verbessern. Zuvor wird in dieser Arbeit die Disambiguierung...
Bibliographic Metadata
- TitleKnowledge graphs for multilingual language translation and generation / a dissertation presented by Diego Campos Moussallem ; [Reviewers: Prof. Dr. Axel-Cyrille Ngonga Ngomo, Paderborn University, Prof. Dr. Sören Auer, Leibniz Universität Hannover, Prof. Dr. Jens Lehmann, Universität Bonn]
- Author
- Participants
- Published
- Description1 Online-Ressource (ix, 76 Seiten) : Diagramme
- Institutional NoteUniversität Paderborn, Dissertation, 2020
- AnnotationTag der Verteidigung: 04.05.2020
- Defended on2020-05-04
- LanguageEnglish
- Document TypesDissertation (PhD)
- URN
- DOI
- Social MediaShare
- Reference
- IIIF
The Natural Language Processing (NLP) community has recently seen outstanding progress, catalysed by the release of different Neural Network (NN) architectures. Neuralbasedapproaches have proven effective by significantly increasing the output quality of a large number of automated solutions for NLP tasks (Belinkov and Glass, 2019). Despite these notable advancements, dealing with entities still poses a difficult challenge as they are rarely seen in training data. Entities can be classified into two groups, i.e., proper nouns and common nouns. Proper nouns are also known as Named Entities (NE) and correspond to the name of people, organizations or locations, e.g., John, WHO, or Canada. Common nouns describe classes of objects, e.g., spoon or cancer. Both types of entities can be found in a Knowledge Graph (KG). Recent work has successfully exploited the contribution of KGs in NLP tasks, such as Natural Language Inference (NLI) (KM et al.,2018) and Question Answering (QA) (Sorokin and Gurevych, 2018). Only a few works had exploited the benefits of KGs in Neural Machine Translation (NMT) when the work presented herein began. Additionally, few works had studied the contribution of KGs to Natural Language Generation (NLG) tasks. Moreover, the multilinguality also remained an open research area in these respective tasks (Young et al., 2018). In this thesis, we focus on the use of KGs for machine translation and the generation of texts to deal with the problems caused by entities and consequently enhance the quality of automatically generated texts. Before handling entities in translation or generation, the first research challenge of this thesis lies in the disambiguation of entities. Some entities are highly ambiguous, e.g., Kiwi can be a fruit or bird. However, once they are disambiguated, their translations are found in multilingual KGs. ...
- The PDF-Document has been downloaded 74 times.