Die Entwicklung des sog. "Semantic Web" seit dem Jahr 2000 brachte mit der Einführung logischer Methoden der semantischen Datenmodellierung und der Vernetzung von Daten als "Linked (Open) Data" im World Wide Web einen tiefgreifenden technischen Wandel. Dieser bestimmte auch die Konzeption unserer Virtuellen Forschungsumgebung WissKI. So wurde zunächst aus Bordmitteln unter Mitarbeit studentischer Hilfskräfte eine neue Version der Stellenkatalog-Datenbank mit dem WissKI-System geschaffen. Basis der Modellierung ist die für die Dokumentation des Kulturerbes geschaffene Referenzontologie CIDOC CRM, die weltweit in zahlreichen Projekten eingesetzt wird. Auf der Basis unserer Implementation Erlangen CRM in OWL, der "Web Ontology Language", die in WissKI zur Verfügung steht, wurde die Modellierung der Globusdaten als Erweiterungsontologie in OWL vorgenommen. Diese Ontologie ist hier abrufbar und kann z.B. mit dem speziellen Editor Protégé (Stanford) inspiziert, visualisiert und bearbeitet werden.
Das Datenmodell wurde in Form sog. Ontologiepfade (Folgen von class - property - class - ...) mit Hife des Pathbuilder-Moduls von WissKI definiert. Im konkreten Fall sind die modellierten Objekttypen geographische Regionen, Toponyme, Inschriften, historische Lesungen, Miniaturen und Kommentare (s.a. die Einführung), für die WissKI automatisch Datenerfassungs- und Abfrageformulare generiert. Durch die Einbettung der Ontologie und der Stellenkatalog-Datenbank sowie der Bilder in WissKI ist die Publikation aller Daten als Linked Open Data (LOD) unmittelbar gegeben. Sämtliche Datensätze (Instanzen), die den Inhalt der Stellenkatalog-Datenbank bilden, werden hier als LOD in der Form einer RDF/OWL Datei publiziert. Die Datensätze sind auch über eine Frageschnittstelle ("Endpunkt") mit der Abfragesprache SPARQL in der Form von Tripeln (Subjekt - Prädikat - Objekt) zugänglich. Mit CRM als Basis wird Interoperabilität möglich: Wenn es ähnliche Stellenkataloge für andere Karten gibt, rückt eine Vielzahl von Vergleichsverfahren für Texte und Bilder in greifbare Nähe und eine neue Qualität komparativen Arbeitens wird möglich.
Beispiel für eine SPARQL-Anfrage, die einen Zugriff auf alle Einträge in der Tripel-Datenbank der Form (Subjekt - Prädikat - Objekt) mit einer Mengenbeschränkung auf 100 Ergebnisse ermöglicht:
Eingabe in https://behaim.wisski.data.fau.de/wisski/endpoint/default :
PREFIX ecrm: <http://erlangen-crm.org/120111/>
PREFIX behaim: <https://behaim.wisski.data.fau.de/sites/default/files/ontology/behaim-klassen.owl>
SELECT * WHERE {
?s ?p ?o .
} LIMIT 100
The development of the so-called "Semantic Web" since the year 2000 brought a profound technical change with the introduction of logical methods of semantic data modeling and the networking of data as "Linked (Open) Data" in the World Wide Web. This also determined the conception of our Virtual Research Environment WissKI. Thus, initially a new version of the place catalog database was created with the WissKI system from local resources with the collaboration of student assistants. The modeling basis is the reference ontology CIDOC CRM, which was created for the documentation of cultural heritage and is used in many projects worldwide. Based on our implementation Erlangen CRM in OWL, the "Web Ontology Language", which is available in WissKI, modeling of the globe data was created as an extension ontology in OWL. This ontology is available here and can be inspected, visualized, and edited e.g. with the special editor Protégé (Stanford).
The data model was defined in the form of so-called ontology paths (sequences of class - property - class - ...) with the help of the Pathbuilder module of WissKI. In the actual case, the modeled object types are geographic regions, toponyms, inscriptions, historical readings, miniatures and annotations (see also the introduction ), for which WissKI automatically generates data input and query forms. By embedding the ontology and the place catalog database as well as the images in WissKI, the publication of all data as Linked Open Data (LOD) is immediately given. All datasets (instances) that form the content of the place catalog database are published here as LOD in the form of a RDF/OWL file. The records are also accessible via a query interface ("endpoint") using the SPARQL query language in the form of triples (subject - predicate - object). With CRM as a basis, interoperability becomes possible: If similar place catalogs exist for other maps, a variety of comparison methods for texts and images comes within reach and a new quality of comparative work becomes possible.Example of a SPARQL query providing access to all entries in the triple database of the form (subject - predicate - object) with a set limit of 100 results:
Enter in https://behaim.wisski.data.fau.de/wisski/endpoint/default:
PREFIX ecrm: <http://erlangen-crm.org/120111/>
PREFIX behaim: <https://behaim.wisski.data.fau.de/sites/default/files/ontology/behaim-klassen.owl>
SELECT * WHERE {
?s ?p ?o .
} LIMIT 100