Knowledge graphs for multilingual language translation and generation / a dissertation presented by Diego Campos Moussallem ; [Reviewers: Prof. Dr. Axel-Cyrille Ngonga Ngomo, Paderborn University, Prof. Dr. Sören Auer, Leibniz Universität Hannover, Prof. Dr. Jens Lehmann, Universität Bonn]

Campos Moussallem, Diego

Titelaufnahme

Titel
Knowledge graphs for multilingual language translation and generation / a dissertation presented by Diego Campos Moussallem ; [Reviewers: Prof. Dr. Axel-Cyrille Ngonga Ngomo, Paderborn University, Prof. Dr. Sören Auer, Leibniz Universität Hannover, Prof. Dr. Jens Lehmann, Universität Bonn]
Autor
Campos Moussallem, Diego
Beteiligte
Ngonga Ngomo, Axel-Cyrille ; Auer, Sören ; Lehmann, Jens
Erschienen
Paderborn, 2020
Umfang
1 Online-Ressource (ix, 76 Seiten) : Diagramme
Hochschulschrift
Universität Paderborn, Dissertation, 2020
Anmerkung
Tag der Verteidigung: 04.05.2020
Verteidigung
2020-05-04
Sprache
Englisch
Dokumenttyp
Dissertation
URN
urn:nbn:de:hbz:466:2-37381
DOI
https://doi.org/10.17619/UNIPB/1-980

Links

Social Media

Share
Nachweis
Universitätsbibliothek Paderborn
IIIF
IIIF-Manifest

Dateien

Knowledge graphs for multilingual language translation and generation [Pdf 1.27 mb]
RIS

Klassifikation

Besondere Sammlungen → Veröffentlichungen der Universität → Fakultät für Elektrotechnik, Informatik und Mathematik
Klassifikation (DDC) → Naturwissenschaften und Mathematik → Naturwissenschaften → Naturwissenschaften und Mathematik

Zusammenfassung

Die Natural Language Processing (NLP)-Gemeinschaft hat in letzter Zeit herausragendeFortschritte erzielt, die durch die Veröffentlichung verschiedener Architekturen künstlicher neuronaler Netze (NN) katalysiert wurden. NN-basierte Ansätze haben sich als effektiv erwiesen, da sie die Qualität der automatisiert erstellten Lösungen für eine große Zahl von NLP-Aufgaben (Belinkov and Glass, 2019) deutlich erhöht haben. Trotz dieser bemerkenswerten Fortschritte stellt der Umgang mit Entitäten immer noch eines schwierige Herausforderung dar, da sie in den Trainingsdaten nur selten zu vorkommen.Entitäten lassen sich in zwei Gruppen einteilen: Eigennamen und Gattungsnamen. Eigennamen werden auch als Named Entities (NE) bezeichnet und entsprechen den Namen vonPersonen, Organisationen oder Orten, z. B. John, WHO oder Kanada. Gattungsnamen beschreiben Klassen von Objekten, z. B. Löffel oder Krebs. Beide Typen von Entitäten können in einem Wissensgraphen (KG) gefunden werden. In jüngster Zeit wurden KGs erfolgreich bei der Lösung von NLP-Aufgaben genutzt, wie z. B. Natural LanguageInference (K M et al., 2018) und Question Answering (Sorokin and Gurevych, 2018). Dagegen haben sich nur wenige Arbeiten mit der Anwendung von KGs für die maschinelle,neuronale Übersetzung (NMT) oder der Generierung von natürlicher Sprache (NLG)beschäftigt, als mit dieser Arbeit begonnen wurde. Darüber hinaus ist die Mehrsprachigkeit bei diesen beiden Problemen weiterhin ein offenes Forschungsgebiet (Young et al.,2018). In dieser Arbeit konzentrieren wir uns auf die Verwendung von KGs für die maschinelleÜbersetzung und die Generierung von Texten, um die durch Entitäten verursachtenProbleme zu behandeln und folglich die Qualität automatisch generierter Texte zu verbessern. Zuvor wird in dieser Arbeit die Disambiguierung...

Abstract

The Natural Language Processing (NLP) community has recently seen outstanding progress, catalysed by the release of different Neural Network (NN) architectures. Neuralbasedapproaches have proven effective by significantly increasing the output quality of a large number of automated solutions for NLP tasks (Belinkov and Glass, 2019). Despite these notable advancements, dealing with entities still poses a difficult challenge as they are rarely seen in training data. Entities can be classified into two groups, i.e., proper nouns and common nouns. Proper nouns are also known as Named Entities (NE) and correspond to the name of people, organizations or locations, e.g., John, WHO, or Canada. Common nouns describe classes of objects, e.g., spoon or cancer. Both types of entities can be found in a Knowledge Graph (KG). Recent work has successfully exploited the contribution of KGs in NLP tasks, such as Natural Language Inference (NLI) (KM et al.,2018) and Question Answering (QA) (Sorokin and Gurevych, 2018). Only a few works had exploited the benefits of KGs in Neural Machine Translation (NMT) when the work presented herein began. Additionally, few works had studied the contribution of KGs to Natural Language Generation (NLG) tasks. Moreover, the multilinguality also remained an open research area in these respective tasks (Young et al., 2018). In this thesis, we focus on the use of KGs for machine translation and the generation of texts to deal with the problems caused by entities and consequently enhance the quality of automatically generated texts. Before handling entities in translation or generation, the first research challenge of this thesis lies in the disambiguation of entities. Some entities are highly ambiguous, e.g., Kiwi can be a fruit or bird. However, once they are disambiguated, their translations are found in multilingual KGs. ...

Inhalt

Inhalt des Werkes

Statistik

Das PDF-Dokument wurde 193 mal heruntergeladen.

Lizenz-/Rechtehinweis

Creative Commons Namensnennung 4.0 International Lizenz

Publizieren

Besondere Sammlungen

Digitalisierungsservice

Hilfe

Impressum

Datenschutz

Titelaufnahme