INSPIRE: Insight to scientific publications and references: Verteilte Berechnung von Bibliometriken auf großen Datenmengen / vorgelegt von Adrian Wilke ; Betreuer Wolfgang Reinhardt, Gutachter Professor Dr. Johannes Magenheim, Juniorprofessor Dr. Christian Plessl

Wilke, Adrian

Titelaufnahme

Titel
INSPIRE: Insight to scientific publications and references : Verteilte Berechnung von Bibliometriken auf großen Datenmengen / vorgelegt von Adrian Wilke ; Betreuer Wolfgang Reinhardt, Gutachter Professor Dr. Johannes Magenheim, Juniorprofessor Dr. Christian Plessl
Autor
Wilke, Adrian
Beteiligte
Reinhardt, Wolfgang ; Magenheim, Johannes ; Plessl, Christian
Erschienen
Paderborn, 2013
Ausgabe
Elektronische Ressource
Umfang
1 Online-Ressource (vii, 115 Seiten) : Illustrationen, Diagramme
Hochschulschrift
Universität Paderborn, Univ., Masterarbeit, 2013
Anmerkung
Tag der Abgabe: 30.04.2013
Datum der Abgabe
30.4.2013
Sprache
Deutsch
Dokumenttyp
Masterarbeit
URN
urn:nbn:de:hbz:466:2-28348
DOI
10.17619/UNIPB/1-88

Links

Social Media

Share
Nachweis
Universitätsbibliothek Paderborn
IIIF
IIIF-Manifest

Dateien

INSPIRE: Insight to scientific publications and references [pdf 2.22 mb] RIS

Klassifikation

Besondere Sammlungen → Veröffentlichungen der Universität → Fakultät für Elektrotechnik, Informatik und Mathematik → Institut für Informatik
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Informatik, Informationswissenschaft, allgemeine Werke
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Systeme
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Datenverarbeitung; Informatik
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Computerprogrammierung, Programme, Daten
Klassifikation (DDC) → Informatik, Informationswissenschaft, allgemeine Werke → Informatik, Wissen, Systeme → Spezielle Computerverfahren

Zusammenfassung

Die vorliegende Arbeit behandelt die Berechnung von Literaturempfehlungen für wissenschaftliche Publikationen. Dazu wird ein Softwaresystem entwickelt, mit dem eine automatische Zitationsanalyse durchgeführt werden kann. Dies umfasst die Untersuchung eines unterliegenden Dokumentennetzwerkes durch die Kombination verschiedener Ansätze der Bibliometrie. Die Ergebnisse der Zitationsanalyse hängen von der Menge und Qualität der unterliegenden Datenbasis ab. Diese wird durch ein Dokumentennetzwerk repräsentiert und besteht im Wesentlichen aus Publikationen und Referenzierungen zwischen diesen. Um diese Datenbasis aufzubauen, werden im Vorfeld Daten verschiedener Formate verarbeitet. Zunächst findet eine Extraktion von Volltexten aus PDF-Dateien statt. Aus den Volltexten werden anschließend Metadaten zu Publikationen und Metadaten zu Referenzen der Literaturverzeichnisse extrahiert. Dieser Extraktionsvorgang verwendet externe Open Source Anwendungen. Da die Datenqualität der Extraktion gering ist, findet eine zusätzliche Nachbearbeitung der extrahierten Daten statt. Die redundant vorliegenden Metadaten werden dabei in ein integriertes Format zusammengeführt. Extrahierte Metadaten zu Publikationen und Referenzen werden anschließend genutzt, um ein Dokumentennetzwerk aufzubauen. Eine passende Lösung zur Datenhaltung wird im Vorfeld durch einen Benchmark ermittelt. Aus dem vorbereiteten Dokumentennetzwerk kann abschließend eine Publikation gewählt werden, für die Literaturempfehlungen ermittelt und präsentiert werden. Da die benötigten Berechnungen zeitintensiv sind und als Grundlage mehrere Hunderttausend Dokumente dienen, werden sie verteilt in einem Rechnercluster durchgeführt. Für die verteilten Berechnungen findet dabei das Hadoop Framework Verwendung.

Inhalt

Inhalt des Werkes

Statistik

Das PDF-Dokument wurde 72 mal heruntergeladen.

Detailsuche

Bibliotheken

Projekt

Impressum

Datenschutz

Publizieren

Besondere Sammlungen

Digitalisierungsservice

Hilfe

Impressum

Datenschutz

Titelaufnahme