Datentransformation

Workflow

Die Datentransformation beruht zu einem großen Teil auf dem Webservice XTriples. XTriples wurde an der Digitalen Akademie in Mainz entwickelt. Der Webservice ermöglicht es nach der Übergabe eines XML Dokumentes mit sogenannten Statements aus den XML Tags RDF Tags zu erzeugen. Hierbei wird die URI einer XML-Ressource bzw. einer Dateneinheit in dieser Ressource als Subjekt angesehen. Diesem Subjekt können nun über Prädikate kontrollierter Vokabulare Objekte zugewiesen werden.

Für die Erzeugung des RDF braucht es eine XTriples Konfiguration. Diese beruht in der Regel auf einem Datenmodell. Die Konfiguration zu dem Datenmodell, welches für die FMRD-Daten erstellt wurde, sieht folgendermaßen aus:

In einem Statement wird dem Subjekt, hier die URI mit der Münznummer, über ein Prädikat der entsprechenden Ontologie ein Objekt zugeordnet. Auf diese Weise baut sich der RDF-Datensatz nach dem Schema des Datenmodells zusammen. Unter folgendem Link können Sie XTriples live ausprobieren. Durch das Betätigen des Links wird das obige Skript als HTTP GET Request an XTriples übergeben und gibt als Ergebnis RDF zurück. Das Ergebnis ist hierbei auf fünf Münzen begrenzt, damit die Anfrage nicht zu lange dauert:

Live Abfrage

In der Pipeline ist dieser Schritt skriptbasiert. Im Skript 7_Zu_RDF.ipynb wird zunächst die in der Datenextraktion erzeugt CSV-Datei in XML konvertiert. Dieser Schritt ist nötig, um die Münzdaten an XTriples übergeben zu können. Anschließend wird das XML-Dokument über einen HTTP GET Request an XTriples übergeben und das Ergebnis der Transformation als muenzdaten_als_RDF.rdf abgespeichert. Dies sind die Schritte die nötig sind, um Fundmünzdaten aus einem PDF in RDF skriptbasiert zu überführen. Ein übergeordnetes Skript namens 0_Pipeline.ipynb führt die Skripte hintereinander aus und komplettiert die Pipeline. Auf der Seite Abfrage und Visualisierung wird anhand eines Beispiels gezeigt, wie die Daten abgefragt und visualisiert werden können.

Literaturverweise:

T. Schrade, Geisteswissenschaftliche Fachdatenrepositorien im Semantic Web. In: DHd 2016. Modellierung, Vernetzung, Visualisierung. Konferenzabstracts (Leipzig 2016) 232–235.