Semantische Interoperabilität
57
sich damit die erforderlichen komplexen Beziehungen
nicht abbilden lassen. Hier können Ontotogien mit
ihren umfangreichen Möglichkeiten der Wissensre-
präsentation und ihren Schlussfolgerungsmechanis-
men (Inferenz) weiterhelfen. Dabei sind die Schluss-
folgerungsmechanismen entscheidend, denn sie
ermöglichen letztendlich den Vergleich und damit die
Interoperabilität. Ohne sie bleiben Ontotogien rein
akademisch. Eine geschickte Modellierung erlaubt
auch bei komplexen Modellen automatisierte Trans-
formationen im Datenbestand.
Bezogen auf die Semantik von Datenbanken gelten
die angeführten Methoden gleichermaßen für die
strukturelle Ebene (Klassenmodell) und die Werte-
ebene (Objektbeschreibung). Dies soll nachfolgend an
den beiden Beispielen zu ADeX und zur Zeitansprache
deutlich gemacht werden.
ADeX verwendet ein Meta-Modell, in dem vor allem
die Begriffe definiert sind. Im Beispiel (Abb. 8) soll dies
vereinfachend durch die Module (Generelle Angaben,
Georeferenz, Typ/Zeit, Aktivität) dargestellt werden.
Dieses Meta-Modell kann nun zur Beschreibung der
bestehenden Original-Datenstrukturen angewandt
werden und man erhält beispielsweise die Modelle A,
B und C als eine vereinheitlichte Sichtweise auf die
Originaldaten. Aus diesen Modellen wurde ADeX als
Pivot-Modell abgeleitet und damit gilt das Meta-
Modell mit seiner Semantik natürlich auch für ADeX.
Diese einheitliche Sicht ist Voraussetzung, um Trans-
formationen zu finden, die die jeweilige Original-
datenstruktur in die ADeX-Datenstruktur abbilden. Im
Beispiel werden die Module aus Modell B einfach
übernommen, bei Modell C trifft man eine Auswahl
(„Aktivitäten" weglassen) und bei Modell A wird
neben der Auswahl noch ein Verbund (Join) von
„Generelle Angaben" und „Georeferenz" mit
„Typ/Zeit" erforderlich.
Das Beispiel Zeitansprache (Abb. 9) soll Probleme ver-
deutlichen, die mit unterschiedlich definierten kon-
trollierten Vokabularen einhergehen. Der Begriff
Bronzezeit beschreibt, allgemein und vergröbert,
einen Zeitraum, in dem Bronzegegenstände herge-
stellt und genutzt wurden. Auch wenn man eine
ungefähre Vorstellung über diesen Zeitraum hat, so
lässt sich dies nur anhand absoluter Zahlen konkreti-
sieren, wenn man sich auf gewisse Regionen
beschränkt. Bronzezeit fand eben in Nordeuropa spä-
ter als in Mitteleuropa statt. Dies führt aber dazu, dass
der Attributwert „Bronzezeit" in einem Datensatz aus
Nordeuropa gegebenenfalls anders zu bewerten ist
als in einem Datensatz aus Mitteleuropa. Es ist also in
diesem Fall wichtig, dass die Zeitstellung in ihrem
regionalen Kontext betrachtet wird. Dies lässt sich im
Text eines wissenschaftlichen Artikels leicht nachvoll-
ziehen, in einer überregionalen Sammlung von
Datensätzen muss es explizit berücksichtigt, das heißt
modelliert werden.
Eine Lösung kann es sein, die Begriffe der benutzten
Zeitansprachen regional zu differenzieren und mit
absoluten Datierungen zu versehen. Auf die Frage
nach dem Beginn der Bronzezeit bekommt man dann
eine regional abhängige Antwort. Gleichzeitig wird
deutlich', dass man auch die Anfragen sorgfältig for-
mulieren muss. Bei der Suche nach vergleichbaren
Stücken zu einer auf 2000 v. Chr. dendrodatierten
Holzfigur aus Mitteleuropa kann man einerseits nach
Bronzezeit suchen und liegt damit in Nordeuropa um
mindestens 200 Jahre später, oder man sucht nach
2000 v. Chr. und kommt in Nordeuropa in den Bereich
der Steinzeit. Beide Fragen sind berechtigt!
Übrigens, mit den bei Thesauri üblichen Strukturen
kommen wir hier nicht viel weiter. Bilingualität oder
Synonyme (Bronzezeit = bronsälder) helfen eben nur
dann weiter, wenn die Bezeichner wirklich für densel-
ben Begriff, also für exakt dieselbe Bedeutung stehen,
und das ist in unserem Beispiel eben nicht der Fall.
Das „Simple Knowledge Organization System"
(SKOS) beispielsweise erlaubt in seiner Basisvariante
zwar Mehrsprachigkeit, Über- und Unterbegriffe und
Assoziationen, aber für die Beschreibung fachbezoge-
ner, eigener Beziehungen sind Erweiterungen erfor-
derlich wie zum Beispiel die „eXtension for Labels"
(SKOS-XL). Aufgrund seiner wachsenden Verbreitung
bei der (standardisierten) Modellierung kontrollierter
Vokabulare ist es vermutlich lohnenswert, diesen
Ansatz auch hinsichtlich semantischer Interoperabili-
tät weiter zu verfolgen, wobei vor allem den für das
Zusammenarbeiten wichtigen Schlussfolgerungsme-
chanismen entsprechende Aufmerksamkeit zukom-
men sollte.
57
sich damit die erforderlichen komplexen Beziehungen
nicht abbilden lassen. Hier können Ontotogien mit
ihren umfangreichen Möglichkeiten der Wissensre-
präsentation und ihren Schlussfolgerungsmechanis-
men (Inferenz) weiterhelfen. Dabei sind die Schluss-
folgerungsmechanismen entscheidend, denn sie
ermöglichen letztendlich den Vergleich und damit die
Interoperabilität. Ohne sie bleiben Ontotogien rein
akademisch. Eine geschickte Modellierung erlaubt
auch bei komplexen Modellen automatisierte Trans-
formationen im Datenbestand.
Bezogen auf die Semantik von Datenbanken gelten
die angeführten Methoden gleichermaßen für die
strukturelle Ebene (Klassenmodell) und die Werte-
ebene (Objektbeschreibung). Dies soll nachfolgend an
den beiden Beispielen zu ADeX und zur Zeitansprache
deutlich gemacht werden.
ADeX verwendet ein Meta-Modell, in dem vor allem
die Begriffe definiert sind. Im Beispiel (Abb. 8) soll dies
vereinfachend durch die Module (Generelle Angaben,
Georeferenz, Typ/Zeit, Aktivität) dargestellt werden.
Dieses Meta-Modell kann nun zur Beschreibung der
bestehenden Original-Datenstrukturen angewandt
werden und man erhält beispielsweise die Modelle A,
B und C als eine vereinheitlichte Sichtweise auf die
Originaldaten. Aus diesen Modellen wurde ADeX als
Pivot-Modell abgeleitet und damit gilt das Meta-
Modell mit seiner Semantik natürlich auch für ADeX.
Diese einheitliche Sicht ist Voraussetzung, um Trans-
formationen zu finden, die die jeweilige Original-
datenstruktur in die ADeX-Datenstruktur abbilden. Im
Beispiel werden die Module aus Modell B einfach
übernommen, bei Modell C trifft man eine Auswahl
(„Aktivitäten" weglassen) und bei Modell A wird
neben der Auswahl noch ein Verbund (Join) von
„Generelle Angaben" und „Georeferenz" mit
„Typ/Zeit" erforderlich.
Das Beispiel Zeitansprache (Abb. 9) soll Probleme ver-
deutlichen, die mit unterschiedlich definierten kon-
trollierten Vokabularen einhergehen. Der Begriff
Bronzezeit beschreibt, allgemein und vergröbert,
einen Zeitraum, in dem Bronzegegenstände herge-
stellt und genutzt wurden. Auch wenn man eine
ungefähre Vorstellung über diesen Zeitraum hat, so
lässt sich dies nur anhand absoluter Zahlen konkreti-
sieren, wenn man sich auf gewisse Regionen
beschränkt. Bronzezeit fand eben in Nordeuropa spä-
ter als in Mitteleuropa statt. Dies führt aber dazu, dass
der Attributwert „Bronzezeit" in einem Datensatz aus
Nordeuropa gegebenenfalls anders zu bewerten ist
als in einem Datensatz aus Mitteleuropa. Es ist also in
diesem Fall wichtig, dass die Zeitstellung in ihrem
regionalen Kontext betrachtet wird. Dies lässt sich im
Text eines wissenschaftlichen Artikels leicht nachvoll-
ziehen, in einer überregionalen Sammlung von
Datensätzen muss es explizit berücksichtigt, das heißt
modelliert werden.
Eine Lösung kann es sein, die Begriffe der benutzten
Zeitansprachen regional zu differenzieren und mit
absoluten Datierungen zu versehen. Auf die Frage
nach dem Beginn der Bronzezeit bekommt man dann
eine regional abhängige Antwort. Gleichzeitig wird
deutlich', dass man auch die Anfragen sorgfältig for-
mulieren muss. Bei der Suche nach vergleichbaren
Stücken zu einer auf 2000 v. Chr. dendrodatierten
Holzfigur aus Mitteleuropa kann man einerseits nach
Bronzezeit suchen und liegt damit in Nordeuropa um
mindestens 200 Jahre später, oder man sucht nach
2000 v. Chr. und kommt in Nordeuropa in den Bereich
der Steinzeit. Beide Fragen sind berechtigt!
Übrigens, mit den bei Thesauri üblichen Strukturen
kommen wir hier nicht viel weiter. Bilingualität oder
Synonyme (Bronzezeit = bronsälder) helfen eben nur
dann weiter, wenn die Bezeichner wirklich für densel-
ben Begriff, also für exakt dieselbe Bedeutung stehen,
und das ist in unserem Beispiel eben nicht der Fall.
Das „Simple Knowledge Organization System"
(SKOS) beispielsweise erlaubt in seiner Basisvariante
zwar Mehrsprachigkeit, Über- und Unterbegriffe und
Assoziationen, aber für die Beschreibung fachbezoge-
ner, eigener Beziehungen sind Erweiterungen erfor-
derlich wie zum Beispiel die „eXtension for Labels"
(SKOS-XL). Aufgrund seiner wachsenden Verbreitung
bei der (standardisierten) Modellierung kontrollierter
Vokabulare ist es vermutlich lohnenswert, diesen
Ansatz auch hinsichtlich semantischer Interoperabili-
tät weiter zu verfolgen, wobei vor allem den für das
Zusammenarbeiten wichtigen Schlussfolgerungsme-
chanismen entsprechende Aufmerksamkeit zukom-
men sollte.