Forschung: Semantische Modellierung | Research: Semantic Modeling

3. Forschung: Semantische Modellierung | Research: Semantic Modeling

(for English please scroll down)

Die Blakemore und Harley zugeschriebene These, dass letztlich alle Karten kognitive Karten sind, ist grundlegend für unsere Forschung (s.a. Görz (2009)). Die Strukturierung räumlichen Wissens nach kognitiven Kriterien, d.h. nach Strategien der Wahrnehmung, des Gedächtnisses, des assoziativen Schließens und Lernens, gilt vor allem für in erster Linie für die - zumindest qualitative - Georeferenzierung, die das zugrundeliegende Prinzip für die Organisation und Darstellung aller Arten von Informationen in Karten. Orientierungspunkte, Gebäude, Personen, historische oder fiktive Ereignisse werden an bestimmten Orten wahrgenommen, werden mit ihnen assoziiert und memoriert und entsprechend wieder abgerufen. Geschichte und Geschichten sind im Raum verankert; Episoden werden in räumliche Beziehungen abgebildet. Dabei haben kognitive Beziehungen Vorrang vor geographischer Präzision.

Der Behaim-Globus ist ein herausragendes Beispiel für eine übergreifende (qualitative) georeferenzierte Organisation des zeitgenössischen Wissens, welche eine neue Dimension für die semantische Erschließung eröffnet. Ein einfacher Zugang zum "kognitiven Mapping" lässt sich durch eine systematische Untersuchung der Fragen nach dem "Wo", "Was" und "Wann" erreichen. So können die Elemente, die für eine epistemologische Organisation des räumlichen Wissens notwendig sind, identifiziert werden. Für jede algorithmische Verarbeitung ist eine formale qualitative Darstellung von (abstrakten) Regionen und ihren relativen Positionen zueinander, aber auch von Richtung, Orientierung und Entfernung erforderlich.

Mit dem Ziel einer semantischen Repräsentation des visuellen Inhalts des Globus wurde in einem ersten Schritt ein Katalog aller visuell relevanten Orte auf seiner Oberfläche und ihrer Verbindungen untereinander erstellt, der aus Annotationen von benannten Orten, Miniaturen und transkribierten Inschriften besteht. Das Datenmodell für diesen Katalog basiert auf einer das CIDOC CRM erweiternden Domänen-Ontologie mit kognitiven Parametern, d.h. einer systematischen Klassifizierung aller visuellen Objekttypen und Objekteigenschaften, die geographische (z.B. Kontinent, Fluss, Siedlung) und nicht-geographische (z.B. Fahne, Herrscher, Festung, sowie Lesungen der Inschriften) Elemente und Beziehungen repräsentieren und in bestimmten Positionen auf den zugehörigen Kartenbildern verankert sind. Spezielle Ortsverzeichnisse ("Gazetteers") unterstützen die Identifizierung historischer geographischer Orte.

Ein konzeptionelles Modell oder "formale Domänen-Ontologie" stellt ein gemeinsames Verständnis des begrifflichen Kerns einer Domänentheorie und damit die Semantik eines Gegenstandsbereichs durch terminologisch kontrollierte Verknüpfung von Konzepten und Eigenschaften dar. Die Einträge des Stellen-Katalogs sind strukturierte Beschreibungen, die auf systematische Weise entlang der den von der Ontologie vorgegebenen Pfaden aufgebaut sind und die zusammen einen Wissensgraphen aufspannen. Für die Modellierung wird normalerweise ein zweistufiger Ansatz gewählt, denn jede Domänen-Ontologie verwendet generische Konzepte und Eigenschaften für Zeit und Raum, Ereignisse, Akteure, Prozesse, usw., die grundlegend für die konzeptionelle Modellierung sind. Diese werden in sog. "Referenzontologien" gebündelt, so dass Domänen-Ontologien für unterschiedliche Zwecke "eingesteckt" werden können, wobei die domänenspezifischen Konzepte als Spezialisierungen der generischen Konzepte abgeleitet werden. Auf diese Weise bieten allgemein verwendete Referenzontologien eine Grundlage für die semantische Interoperabilität. Das "Konzeptuelle Referenzmodell" CRM von ICOM-CIDOC ist eine (ISO-) standardisierte Referenzontologie für die Dokumentation des kulturellen Erbes, die die Modellierung auf der Basis von Ereignissen (was-wer-wo-wann) unterstützt.

Die Entwicklung des sog. "Semantic Web" seit dem Jahr 2000 brachte mit der Einführung logischer Methoden der semantischen Datenmodellierung und der Vernetzung von Daten als "Linked (Open) Data" im World Wide Web einen tiefgreifenden technischen Wandel. Daher wurde die aktuelle Modellierung der Globusdaten als Erweiterungsontologie der Referenzontologie CIDOC CRM in OWL vorgenommen (s. Abschnitt 4. Semantische Datenbank sowie Görz und Scholz 2013 / (2014)).

Letztlich besteht ein Zweck der formalen Klassifikation und semantischen Auszeichnung von Objekten darin, ihre Beschreibungen für das automatische Schließen zugänglich zu machen. Logisches Schließen muss hinzukommen, wenn es um zusammengesetzte Anfragen nach Objektklassen und ihren partiellen Beschreibungen und mit komplexen merkmalslogischen Kombinationen geht, z.B. Überprüfungen auf Widerspruchsfreiheit oder automatische Objektklassifikation. "Intelligente" Suche erfordert sowohl inhaltliche Schlußfolgerungen innerhalb von Hierarchien von Konzepten und Eigenschaften als auch formallogisches Schließen. Schließlich kann auf diese Weise implizit dargestelltes Wissen gefunden und damit explizit gemacht werden und es können mit diesen Mitteln Geltungsansprüche und Begründungen in die Verarbeitung einbezogen werden. Die Frage nach einer formallogischen Repräsentation kognitiver Kategorien, insbesondere für die Repräsentation qualitativen räumlichen Wissens und räumlichen Schließens hat nur Sinn, wenn es im Forschungskontext komplexe Anfragen an eine kartographische Datenbasis gibt, die mit anderen Mitteln nur durch unvertretbar hohen Ressourceneinsatz oder überhaupt nicht beantwortbar sind. Zum räumlichen Schließen gibt es verschiedene formale Ansätze für qualitative Theorien des geographischen (euklidischen) Raums, die effizient durch spezielle Datentypen für sog. Constraint-Löser repräsentiert werden können; ihre Integration in einen allgemeinen beschreibungslogischen Rahmen ergibt ein System für hybrides Schließen (vgl. auch Pellet-Spatial, Stocker (2009)) zur Bearbeitung komplexer räumlicher Anfragen über dem Stellenkatalog des Globus. In diesem Kontext haben wir in einer Machbarkeitsstudie (Jelinek (1997) und Deang (2000)) anhand einer beschreibungslogischen Variante der Behaim-Ontologie inklusive der genannten kognitiven Kategorien bestimmte Anfragen erprobt: Mit deiktischen Fragen wird nach räumlichen Eigenschaften bekannter Objekte gefragt. Bei iterativen Fragen sind die Objekte unbekannt und müssen anhand bestimmter räumlicher Eigenschaften identifiziert werden; solche räumlichen Eigenschaften sind topologische (z.B. Nachbarschaft, Grenzen, das Innere und Äußere von Regionen), mengenbasierte (z.B. Durchschnitt, Enthaltensein oder Gleichheit) oder metrische (z.B. Richtung und Entfernung).

Fortsetzung | Next: 4. Semantische Datenbank | Semantic Database

Sitemap .

3. Research: Semantic Modeling ^

The thesis attributed to Blakemore and Harley that ultimately all maps are cognitive maps is fundamental to our research (see also Görz (2009)). Structuring spatial knowledge according to cognitive criteria, i.e., strategies of perception, memory, associative reasoning, and learning, applies primarily to - at least qualitative - georeferencing, which is the underlying principle for organizing and representing all kinds of information in maps. Landmarks, buildings, people, historical or fictional events are perceived in specific locations, are associated and memorized with them, and are recalled accordingly. History and stories are anchored in space; episodes are mapped into spatial relationships. So, cognitive relationships take precedence over geographic precision.

The Behaim globe is an outstanding example of an overarching (qualitative) georeferenced organization of contemporary knowledge, which opens up a new dimension for semantic indexing. A simple approach to "cognitive mapping" can be achieved by systematically investigating the questions of "where", "what", and "when". In this way, the elements necessary for an epistemological organization of spatial knowledge can be identified. For any algorithmic processing, a formal qualitative representation of (abstract) regions and their relative positions to each other, as well as direction, orientation, and distance, is required.

With the goal of a semantic representation of the visual content of the globe, the first step was to create a catalog of all visually relevant locations on its surface and their interconnections, consisting of annotations of named locations, miniatures, and transcribed inscriptions. The data model for this catalog is based on a domain ontology extending the CIDOC CRM with cognitive parameters, i.e., a systematic classification of all visual object types and object properties representing geographic (e.g., continent, river, settlement) and non-geographic (e.g., flag, ruler, fortress, as well as readings of inscriptions) elements and relationships, anchored in specific positions on the associated map images. Special gazetteers assist in the identification of historic geographic locations.

A conceptual model or "formal domain ontology" represents a common understanding of the conceptual core of a domain theory and thus the semantics of a subject area through terminologically controlled linking of concepts and properties. The entries of the place catalog are structured descriptions built in a systematic way along the paths provided by the ontology, which together span a knowledge graph. A two-step approach is usually adopted for modeling, because each domain ontology uses generic concepts and properties for time and space, events, actors, processes, etc., which are fundamental for conceptual modeling. These are bundled into so-called "reference ontologies" so that domain ontologies can be "plugged in" for different purposes, with domain-specific concepts derived as specializations of the generic concepts. In this way, commonly used reference ontologies provide a basis for semantic interoperability. ICOM-CIDOC's "Conceptual Reference Model" CRM is an (ISO) standardized reference ontology for cultural heritage documentation that supports modeling based on events (what-who-where-when).

The development of the so-called "Semantic Web" since 2000 brought a profound technological change with the introduction of logical methods of semantic data modeling and the interconnection of data as "Linked (Open) Data" on the World Wide Web. Therefore, the current modeling of globe data was done as an extension ontology of the reference ontology CIDOC CRM in OWL (see section 4. Semantic Database as well as Görz und Scholz (2013)).

Ultimately, a purpose of formal classification and semantic labeling of objects is to make their descriptions accessible for automatic reasoning. Logical reasoning must be included when dealing with compound queries for object classes and their partial descriptions and with complex feature-logical combinations, e.g., consistency checks or automatic object classification. "Intelligent" search requires both content-based reasoning within hierarchies of concepts and properties and formal logical reasoning. Finally, implicitly represented knowledge can be found in this way and thus made explicit, and validity claims and justifications can be covered in processing by these means. The question of a formal-logical representation of cognitive categories, especially for the representation of qualitative spatial knowledge and spatial reasoning, only makes sense if there are complex queries to a cartographic database in the research context, which can only be answered by either unjustifiably high resource usage or not at all by other means. For spatial reasoning, there are various formal approaches to qualitative theories of geographic (Euclidean) space that can be efficiently represented by special data types for so-called constraint solvers; their integration into a general descriptive logic framework yields a system for hybrid reasoning (cf. also Pellet-Spatial, Stocker (2009)) for processing complex spatial queries over the place catalog of the globe. In this context, we tested certain queries in a feasibility study (Jelinek (1997) and Deang (2000)) using a description-logic variant of the Behaim ontology including the aforementioned cognitive categories: deictic questions ask about spatial properties of known objects. With iterative queries, the objects are unknown and must be identified based on certain spatial properties; such spatial properties are topological (e.g., neighborhood, boundaries, the interior and exterior of regions), set-based (e.g., average, containedness, or equality) or metric (e.g., direction and distance).

Fortsetzung | Next: 4. Semantische Datenbank | Semantic Database

Sitemap .

Arbeitsgruppe Digital Humanities, FAU Erlangen-Nürnberg

Last modified: Tue Jan 17 16:40:00 CET 2023