DE102009017082A1

DE102009017082A1 - Verfahren und Vorrichtung zum Generieren einer Datenbank für eine Datenbankabfrage, sowie ein Suchverfahren und eine Suchvorrichtung zur Datenbankabfrage

Info

Publication number: DE102009017082A1
Application number: DE102009017082A
Authority: DE
Inventors: Gero BÄSE; Mario Dr. Döller
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2009-04-15
Filing date: 2009-04-15
Publication date: 2010-11-04
Also published as: EP2419840A1; CN102395968A; CN102395968B; KR101662561B1; WO2010118931A1; US9213738B2; US20120041974A1; KR20120022957A

Abstract

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Generieren einer Datenbank. Hierbei werden Informationswerte mit Hilfe von Knoten und gerichteten Kanten, die Abhängigkeiten zwischen zwei Knoten bzw. Informationswerten beschreiben, in Form eines gerichteten Graphen zur Datenbankabfrage aufgebaut. Durch Verwendung einer Pfaddistanz, die eine Anzahl an gerichteten Kanten zwischen einem ausgewählten Knoten und einem Zieltupel, bestehend aus zwei mit einer gerichteten Kante verbundenen Knoten und der dazugehörigen gerichteten Kante, beschreibt, kann eine Reduktion einer Komplexität bei einer Datenbankabfrage und somit eine Beschleunigung der Datenbankabfrage erzielt werden. Die Erfindung umfasst ferner ein Suchverfahren und eine Suchvorrichtung zur Abfrage der beschriebenen Datenbank. Die Erfindung ist beispielsweise einsetzbar bei Überwachungseinrichtungen oder in medizinischen Datenbanken. Ferner kann die Erfindung für Datenbanken eingesetzt werden, die dynamisch erweitert werden, beispielsweise durch neue Ereignisse in der Überwachungseinrichtung.

Description

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Generieren einer Datenbank für eine Datenbankabfrage. Ferner betrifft die Erfindung ein Suchverfahren und eine Suchvorrichtung zum Abfragen einer Datenbank.
Informationswerte, wie Flugdaten oder Börsenkurse, werden heute mittels Datenbanken einem Benutzer zur Verfügung gestellt. Hierzu gibt es eine Vielzahl von Datenbanksprachen, mit denen die jeweilige Datenbank strukturiert beschrieben und abgefragt werden kann. Ein Vertreter zur Beschreibung von Datenbanken mit semantischen Relationen ist beispielsweise RDF/OWL (RDF – Resource Description Framework, OWL – Web Ontology Language) [1, 2]. Hierbei werden Informationswerte in Form von Knoten beschrieben, wobei jeweils zwei Knoten und eine gerichtete Kante zwischen den zwei Knoten als RDF-Tripel bezeichnet werden. Dabei repräsentieren die zwei Knoten ein Subjekt und ein Objekt und die gerichtete Kante ein Prädikat. Hierbei definiert das Prädikat im Allgemeinen eine semantische Relation zwischen dem Subjekt und dem Objekt. Dies soll an einem Beispiel gemäß 1 näher erläutert werden. Dabei repräsentiert der Knoten B das Subjekt ”Person”, der Knoten A das Objekt ”Mario” und die gerichtet Kante a das Prädikat ”hat Namen”. Somit liest sich das RDF-Tripel ”BaA” zu ”Person hat Namen Mario”. Eine Verkettung solcher RDF-Tripels führt zu einer Graphenstruktur, die einen gerichteten Graphen wiedergibt, siehe bspw. 1. Triples sind in 1 fett umrandet.
Zur Abfrage eines Informationswertes der Datenbank gemäß RDF/OWL kann eine Abfragesprache SPARQL (SPARQL – SPARQL Protocol and RDF Query Language) [3] dienen. Hierzu wird ausgehend von einem vorgebbaren Knoten, also einem bestimmten In formationswert, ein oder mehrere RDF-Tripels der Datenbank gesucht, siehe bspw. in 1 die fett umrandeten RDF-Tripels (BaA, HjJ, IkK). Zur Abfrage dieser RDF-Tripels, also einer semantischen Anfrage, wird ein gesuchter subgraph durch Angabe aller involvierten RDF-Tripels realisiert. Um die oben genannten drei RDF-Tripels anzugeben müssen daher Ketten von RDF-Tripels umfassend die in 2 umrandeten RDF-Tripels spezifiziert werden. Diese Vorgehensweise bedingt, dass eine derartige semantische Datenbankabfrage komplex und zeitaufwendig ist, da bereits bei Stellen der Datenbankabfrage eine umfangreiche Kenntnis der Struktur der Datenbank von Nöten ist.
Daher ist es eine Aufgabe der Erfindung ein Verfahren und eine Vorrichtung zum Generieren einer Datenbank für eine Datenbankabfrage, sowie ein Suchverfahren und eine Suchvorrichtung zum Abfragen einer Datenbank anzugeben, die eine Reduktion der Komplexität bei der Datenbankabfrage ermöglichen.
Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst. Weiterbildungen der Erfindung sind den abhängigen Ansprüchen zu entnehmen.
Die Erfindung betrifft ein Verfahren zum Generieren einer Datenbank zum Bereitstellen von Informationswerten mittels Knoten und von Abhängigkeiten der Informationswerte mittels gerichteter Kanten für eine Datenbankabfrage, wobei durch die Knoten und durch die gerichteten Kanten die Datenbank in Form eines gerichteten Graphen gebildet wird,
bei dem folgende Schritte durchgeführt werden:

a) Einlesen einer Beschreibungsvorschrift, die die Zuordnung von jeweils zwei Informationswerten mit der dazugehörigen Abhängigkeit angibt;
b) Erstellen des jeweiligen Knotens für den jeweiligen Informationswert und der jeweiligen gerichteten Kante für die jeweilige Abhängigkeit;
c) Erzeugen des gerichteten Graphen ausgehend von einem vorgebbaren Knoten der Knoten auf Grundlage der Beschreibungsvorschrift, wobei jeweils zwei der Knoten und der die jeweiligen Knoten verbindende gerichtete Kante als Tripel gekennzeichnet werden;
d) Bestimmen von zumindest einem Pfad von dem vorgebbaren Knoten zu einem in der Datenbankabfrage zu ermittelnden Tripel;
e) Generieren einer jeweiligen Pfaddistanz des jeweiligen Pfades, wobei die jeweilige Pfaddistanz eine Anzahl an gerichteten Kanten von dem vorgebbaren Knoten zu dem zu ermittelnden Tripel angibt, wobei die jeweilige Pfaddistanz bei der Datenbankabfrage ausgehend von dem vorgebbaren Knoten ausgewertet werden kann.

Durch das Verfahren wird eine Reduktion der Rechenleistung bei der Suche nach bestimmten Tripel erreicht, da durch die Angabe der Pfaddistanz eine Reduktion der zu untersuchenden Knoten erreicht wird.
Ferner ist eine Vorrichtung zum Generieren einer Datenbank zum Bereitstellen von Informationswerten mittels Knoten und von Abhängigkeiten der Informationswerte mittels gerichteter Kanten für eine Datenbankabfrage Teil der Erfindung, wobei durch die Knoten und durch die gerichteten Kanten die Datenbank in Form eines gerichteten Graphen gebildet wird, bei dem die Vorrichtung folgende Mittel umfasst:

a) Erstes Mittel zum Einlesen einer Beschreibungsvorschrift, die die Zuordnung von jeweils zwei Informationswerten mit der dazugehörigen Abhängigkeit angibt;
b) Zweites Mittel zum Erstellen des jeweiligen Knotens für den jeweiligen Informationswert und der jeweiligen gerichteten Kante für die jeweilige Abhängigkeit;
c) Drittes Mittel zum Erzeugen des gerichteten Graphen ausgehend von einem vorgebbaren Knoten der Knoten auf Grundlage der Beschreibungsvorschrift, wobei jeweils zwei der Knoten und der die jeweiligen Knoten verbindende gerichtete Kante als Tripel gekennzeichnet werden;
d) Viertes Mittel zum Bestimmen von zumindest einem Pfad von dem vorgebbaren Knoten zu einem in der Datenbankabfrage zu ermittelnden Tripel;
d) Fünftes Mittel zum Generieren einer jeweiligen Pfaddistanz des jeweiligen Pfades, wobei die jeweilige Pfaddistanz eine Anzahl an gerichteten Kanten von dem vorgebbaren Knoten zu dem zu ermittelnden Tripel angibt, wobei die jeweilige Pfaddistanz bei der Datenbankabfrage ausgehend von dem vorgebbaren Knoten ausgewertet werden kann.

Mit Hilfe der Vorrichtung ist das Verfahren zum Generieren einer Datenbank implementierbar.
Des Weiteren ist Teil der Erfindung ein Suchverfahren zur Ermittlung eines Informationswertes in einer Datenbank, wobei die Datenbank gemäß Verfahren zum Generieren einer Datenbank generiert werden kann, bei dem folgende Schritte durchgeführt werden:
Erzeugen einer Datenbankabfrage mittels eines Suchmusters umfassend eine Angabe des vorgebbaren Knotens, der Pfaddistanz und des zu ermittelnden Tripels;
Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster angegebene Pfaddistanz bei der Durchsuche berücksichtigt wird;
Bereitstellen zumindest einer der Informationswerte zumindest eines der Tripel, das die Vorgabe des Suchmusters erfüllt.
Durch das Suchverfahren wird eine Reduktion der Rechenleistung bei der Suche nach bestimmten Tripel in der Datenbank erreicht, da durch die Angabe der Pfaddistanz eine Reduktion der zu untersuchenden Knoten erreicht wird.
In einer Weiterbildung des Suchverfahrens werden bei dem Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt, die eine Pfaddistanz von maximal der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen. Hierdurch kann eine weitere Reduktion der Rechenleistung zum Durchführen der Datenbankabfrage erzielt werden, da eine Anzahl an zur Suche zu berücksichtigenden Tripel weiter reduziert wird.
Zudem kann die Rechenleistung zum Durchführen der Datenbankabfrage noch weiter reduziert werden, wenn bei dem Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt werden, die eine Pfaddistanz von genau der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen.
In einer vorteilhaften Weiterbildung des Suchverfahrens wird ein Wert Null für die Pfaddistanz in dem Suchmuster derart verarbeitet wird, dass diese Pfaddistanz auf zumindest eine maximale in der Datenbank vorkommende Pfaddistanz gesetzt. Dies ermöglicht eine Vollsuche aller Knoten und Tripel der Datenbank unabhängig von der maximalen vorkommenden Pfaddistanz.
Schließlich ist Teil der Erfindung eine Suchvorrichtung zur Ermittlung eines Informationswertes in einer Datenbank, wobei die Datenbank gemäß der Vorrichtung zum Generieren einer Datenbank generiert ist, die folgende Einheiten aufweist:
Erste Einheit zum Erzeugen einer Datenbankabfrage mittels eines Suchmusters umfassend eine Angabe des vorgebbaren Knotens, der Pfaddistanz und des zu ermittelnden Tripels;
Zweite Einheit zum Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster angegebene Pfaddistanz bei der Durchsuche berücksichtigbar ist;
Dritte Einheit zum Bereitstellen zumindest einer der Informationswerte zumindest eines der Tripel, das die Vorgabe des Suchmusters erfüllt.
Mit Hilfe der Suchvorrichtung ist das Suchverfahren implementierbar. Weitere Vorteile, auch für Weiterbildungen der Suchvorrichtung sind den jeweils korrespondierenden Merkmalen des Suchverfahrens entnehmbar.
In einer Weiterbildung der Suchvorrichtung ist ferner die zweite Einheit derart ausgebildet, bei dem Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von maximal der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen.
Zusätzlich oder alternativ dazu kann die zweite Einheit ferner derart ausgebildet sein, bei dem Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von genau der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen.
In einer vorteilhaften Weiterbildung der Suchvorrichtung ist ferner die zweite Einheit derart ausgebildet, dass ein Wert Null für die Pfaddistanz in dem Suchmuster derart verarbeitbar ist, dass diese Pfaddistanz zumindest auf eine maximale in der Datenbank vorkommende Pfaddistanz einstellbar ist.
Die Erfindung und ihre Weiterbildungen werden anhand von Figuren näher erläutert.
Es zeigen:
1 Eine Struktur einer Datenbank mit Kanten und Knoten gemäß einem Standard RDF/OWL (Stand der Technik);
2 Eine Anzahl von RDF-Tripels der Datenbank, die bei der Abfrage dreier RDF-Tripels zu berücksichtigen sind (Stand der Technik);
3 Eine Struktur einer Datenbank gemäß einem Ausführungsbeispiel der Erfindung;
4 Ablaufdiagramm zur Erstellung der Datenbank gemäß 3;
5 Ablaufdiagramm zur Abfragen der Datenbank.
Elemente mit gleicher Funktion und Wirkung sind in den Figuren mit denselben Bezugszeichen versehen.
3 und 4 zeigen ein Ausführungsbeispiel der Erfindung. Dabei soll im Rahmen einer Überwachungsanwendung in einem Gebäude eine Datenbank für eine semantische Annotierung von zeitlichen und räumlichen Zuordnungen einer Person zu einem oder mehreren Räumen erstellt werden. 3 zeigt dabei Knoten und gerichtete Kanten, die jeweils bestimmte Informationswerte bzw. Abhängigkeiten aufnehmen können. In 3 werden dabei folgende Bezugszeichen verwendet:

A:: Knoten für den Informationswert IA = Name
B:: Knoten für den Informationswert IB = Person
C:: Knoten für den Informationswert IC = Position
D:: Knoten für den Informationswert ID = Zeitlich
E:: Knoten für den Informationswert IE = Örtlich
F: : Knoten für den Informationswert IF = Ort
G:: Knoten für den Informationswert IG = Name
a:: gerichtete Kante für Abhängigkeit aa = ”hat Name”
b:: gerichtete Kante für Abhängigkeit bb = ”hat Position”
c:: gerichtete Kante für Abhängigkeit cc = ”hat zeitliche Position”
d:: gerichtete Kante für Abhängigkeit dd = ”hat örtliche Position”
e:: gerichtete Kante für Abhängigkeit ee = ”hat befindet sich”
f:: gerichtete Kante für Abhängigkeit ff = ”hat örtliche Region”
g:: gerichtete Kante für Abhängigkeit gg = ”hat Name”

In einem Schritt STA wird das Verfahren mit den Schritten S1 bis S5 gestartet, um eine Datenbank DB zu erstellen.
Im Schritt S1 wird eine Beschreibungsvorschrift DEF, die die Zuordnung von jeweils zwei Informationswerten IA, IB mit der dazugehörigen Abhängigkeit aa eingelesen. Die Beschreibungsvorschrift DEF kann in Form eines Papierblatts oder als elektronische Datei ausgestaltet sein und beispielsweise mittels einer Beschreibungssprache XML (XML – eXtensible Markup Language) die jeweiligen Zuordnung darstellen. In diesem Beispiel beschreibt die Beschreibungsvorschrift die Zuordnungen wie sie bildhaft in 3 dargestellt sind.
Im Schritt S2 werden die jeweiligen Knoten A, G für den jeweiligen Infomationswert IA, ..., IG und die jeweiligen gerichteten Kanten a, ..., g für die Abhängigkeiten aa, ..., gg gebildet. Die Kanten sind gerichtet, da der Knoten, an dem die gerichtete Kante entspringt bspw. einem Subjekt, und der Knoten, an dem die gerichtete Kante endet einem Objekt entspricht, wobei die gerichtete Kante eine semantische Relation beider Kanten repräsentiert. Zwei Knoten, die mit einer gerichteten Kante verbunden sind, und die dazugehörige gerichtete Kante werden Tripel TA, TF bezeichnet.
In einem nächsten Schritt S3 wird dann ausgehend ein einem vorgebbaren Knoten AA = B ein gerichteter Graph TR aus den Knoten und gerichtete Kanten auf Basis der Beschreibungsvorschrift gebildet. Der vorgebbare Knoten AA stammt aus der Menge der Knoten und ist ein Ausgangspunkt für eine Datenbankabfrage.
Dabei kann das Ausführungsbeispiel in einer konkreten Ausprägung, also in einer Instanz, folgendermaßen lauten:

– Person = erste Person ”hat Name” Name = Werner
– Person = erste Person ”hat Position” Position = 15
– Position = 15 ”hat zeitliche Position” Zeitlich = 12:05 Uhr
– Position = 15 ”hat örtliche Position” Örtlich = 48°8' NB, 11°34' ÖL (NB = nördliche Breite, ÖL = östliche Länge)
– Örtlich = 48°8' NB, 11°34' ÖL ”hat örtliche Region” Ort = erster Raumabschnitt
– Zeitlich = 12:05 Uhr ”befindet sich” Ort = erster Raumabschnitt
– Ort = erster Raumabschnitt ”hat Name” Name = Eingangsbereich

Hierbei geht es um die Überwachung von großen Räumen in mehreren zu überwachenden Orten, d. h. Regionen. Jedes Mal wenn eine Person in eine Region tritt kann eine Instanz in der Datenbank angelegt werden. Allgemein existiert zumindest eine konkrete Ausprägung in der Datenbank DB.
In einem nächsten Schritt S4 wird ein Pfad PF1 von dem vorgebbaren Knoten AA zu dem bei der Datenbankabfrage zu ermittelnden Tripel TF gebildet. Im vorliegenden Ausführungsbeispiel gibt es von dem vorgebbaren Knoten AA zu dem Knoten F des Tripels TF folgende Pfade PF1, PF2:
PF1 = AA-b-C-c-D-e-F
PF2 = AA-b-C-d-E-f-F
Eine Länge der Pfade, d. h. eine Pfaddistanz, wird durch eine Anzahl an gerichteten Kanten in dem jeweiligen Pfad bestimmt. Im vorliegenden Beispiel ist die Pfaddistanz DIS des Pfads PF1 DIS1 = 3 und des Pfades PF2 DIS2 = 3.
In einer optionalen Erweiterung kann im Schritt S4 bei vorliegen mehrere Pfade der kürzeste Pfad bestimmt werden, der nachfolgend verwendet werden soll. In dem vorliegenden Beispiel sind jedoch beide Pfade gleich lang.
In einem nachfolgenden Schritt S5 wird den Tripeln TF die Pfaddistanz DIS hinzugefügt. Das Ablaufdiagramm gemäß 4 wird im Schritt END beendet.
Die Erfindung betrifft auch ein Suchverfahren zur Ermittlung eines Informationswertes in der Datenbank DB. Gemäß 5 wird diese Abfrage im Zustand STA gestartet.
In einem Schritt S6 wird eine Datenbankabfrage mittels eines Suchmusters erzeugt. Hierbei wird bei der Datenbankabfrage als Suchmuster QY anstelle eines vorgebbaren Pfades, wie es im Stand der Technik bei der Abfragesprache SPARQL der Fall ist, der vorgebbare Knoten, d. h. der dazugehörige Informationswert, die in der Suche zu berücksichtigende Distanz und das zu ermittelnde Tripel beschrieben, wie beispielsweise:
QY = ”(Person) [3] (Ort ”hat Name” Name)”
Das bedeutet, wie im Schritt S7 dargestellt, dass ausgehend von dem Informationswert (Person) mit einer Pfaddistanz von 3 das Tripel (Ort ”hat Name” Name) gesucht wird. Bei der Suche werden somit nur noch die Tripel berücksichtigt, die eine Pfaddistanz von drei aufweisen. Im Allgemeinen wird bei der Suche in der Datenbank die Pfaddistanz berücksichtigt. Ferner kann das Suchverfahren denjenigen Pfad bestimmen, der für die Suche am wenigsten komplex ist.
Als Ergebnis der Suche wird im Schritt S8 zumindest der eine Informationswert der durch die Suche ermittelten Tripels ausgegeben. Ferner können auch weitere Informationswerte des ermittelten Tripels und/oder die Abhängigkeit dargestellt werden.
Zudem können in dem Suchmuster spezielle Werteausprägungen für zumindest eines der Elemente des Tripels abgefragt werden. So lautet das Suchmuster QY bspw.
QY = ”(Person) [3] (Ort ”hat Name” Name = ”Eingangsbereich”)”
Hierbei werden diejenigen Orte in der Datenbank gesucht, die als spezifische Werteausprägung des Namens „Eingangsbereich” aufweisen.
Ferner können bei der Durchsuchung der Datenbank diejenigen Tripel berücksichtigt werden, die genau oder maximal der in dem Suchmuster angegebenen Pfaddistanz DIST von dem in dem Suchmuster angegebenen vorgebbaren Knoten AA Distanz aufweisen. Des Weiteren kann mit Hilfe eines Wertes Null in der in dem Suchmuster angegebenen Pfaddistanz DIST = 0 dem Suchverfahren mitgeteilt werden, dass alle Knoten der Datenbank zu durchsuchen sind.
Das Ablaufdiagramm gemäß 5 wird im Schritt END beendet.
Im Stand der Technik können die Tripel der einzelnen Typen mittels Tabellen abgelegt werden. Bei der Auswertung von Suchmustern, also von vorgebbaren Pfaden, müssen involvierte Tabellen miteinander verknüpft werden. Die Effizienz der Suche hängt im Wesentlichen von der Größe der Tabellen und der jeweiligen Selektivität ab.
Im Gegensatz dazu kann bei einer Implementierung der vorliegenden Erfindung eine Suche auf denjenigen Pfad begrenzt werden, der wenige Rechenschritte benötigt. Dies kann dann der Pfad sein, der am kürzesten ist, also die kleinste Pfaddistanz aufweist. In diesem Fall müssen weniger Tripel bearbeitet werden, um von dem vorgebbaren Knoten zur dem zu ermittelnden Tripel TF zu gelangen. Ferner kann sich ein Vorteil dadurch ergeben, dass bei der Bearbeitung der Tripel mittels Tabellen derjenige Pfad ausgewählt wird, der möglichst kleine Tabellen aufweist. In vorliegen Beispiel gemäß 3 ist bspw. eine Tabelle für den Knoten D und eine weitere Tabelle für den Knoten E erstellt werden. Die Tabelle für den Knoten D enthält eine große Anzahl von Einträgen und die Tabelle für den Knoten E nur eine dazu kleine Anzahl von Einträgen. Daher ist es bei der Verwendung von Tabellen zur Realisierung der Datenbank zweckmäßig den Pfad PF2 zu wählen, der über den Knoten E verläuft und den Knoten D nicht einschließt. Hierdurch wird eine Rechenkomplexität verringert.
Bei einer Abfrage gemäß dem Stand der Technik mittels SPARQL muss der das Suchmuster, also der vorgebbare Pfad vollständig angegeben werden. In diesem Fall ist eine Auswahl von Pfaden, die von dem vorgebbaren Knoten zu dem zu ermittelnden Tripel TF führen nicht möglich. Somit wird durch die Erfindung ermöglicht, dass das Suchmuster nur die zur Suche wesentlichen Elemente aufweist und das Suchverfahren auf Basis dieses Suchmustern den optimalen Pfad zur Auswertung der Suche bestimmen kann.
Ein weiterer Vorteil der Erfindung ist darin zu sehen, dass durch Angabe der Distanz in dem Suchmuster ein Detaillierungsgrad bei der Datenbankabfrage eingestellt werden kann. Je größer die Distanz von dem vorgebbaren Knoten ist, desto detaillierter ist der Informationsgrad. Somit kann mit Hilfe der Erfindung auch eine Qualität des zu ermittelnden Tripel TF bei der Datenbankabfrage angegeben werden.
In einer Erweiterung kann ein Wert Null für die Pfaddistanz angeben, dass die Suche ohne Beschränkung auf die Distanz durchzuführen ist. Dies ist vorteilhaft, da hierdurch die Möglichkeit eröffnet wird unabhängig von der Mächtigkeit der Datenbank, also ohne Kenntnis der maximal vorkommenden Pfaddistanz in der Datenbank, alle Tripel bei der Datenbankabfrage zu berücksichtigen.
Das Verfahren zum Generieren der Datenbank kann mit Hilfe von fünf Mittel M1, M2, M3, M4, M5 mit der Vorrichtung VOR durchgeführt werden. Ferner kann das Suchverfahren zur Ermittlung eines Informationswertes in der Datenbank mittels der Einheiten E1, E2 und E4 mit der Suchvorrichtung SVOR realisiert werden. Diese Mittel und/oder Einheiten sind in Hardware, Software oder in einer Kombination aus Hard- und Software durchführbar. Zudem können die Mittel und/oder die Einheiten mittels einer Rechnereinheit ausgeführt werden.
Literatur:

[1] „Resource Description Framework", http://en.wikipedia.org/wiki/Resource_Description_Framework, Stand 15.04.2009
[2] „Web Ontology Language", http://en.wikipedia.org/wiki/Web_Ontology_Language, Stand 15.04.2009
[3] „SPARQL Protocol and RDF Query Language", http://en.wikipedia.org/wiki/SPARQL, Stand 15.04.2009

ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Nicht-Patentliteratur

- Standard RDF/OWL [0022]

Claims

Verfahren zum Generieren einer Datenbank (DB) zum Bereitstellen von Informationswerten (IA, ..., IG) mittels Knoten (A, ..., G) und von Abhängigkeiten (aa, ..., gg) der Informationswerte (IA, ..., IG) mittels gerichteter Kanten (a, ..., g) für eine Datenbankabfrage, wobei durch die Knoten (A, ..., G) und durch die gerichteten Kanten (a, ..., g) die Datenbank (DB) in Form eines gerichteten Graphen (TRE) gebildet wird, bei dem folgende Schritte durchgeführt werden: a) Einlesen einer Beschreibungsvorschrift (DEF), die die Zuordnung von jeweils zwei Informationswerten (IA, IB) mit der dazugehörigen Abhängigkeit (aa) angibt; b) Erstellen des jeweiligen Knotens (A, ..., G) für den jeweiligen Informationswert (IA, ..., IG) und der jeweiligen gerichteten Kante (a, ..., g) für die jeweilige Abhängigkeit (aa, ..., gg); c) Erzeugen des gerichteten Graphen (TRE) ausgehend von einem vorgebbaren Knoten (AA) der Knoten (A, ..., G) auf Grundlage der Beschreibungsvorschrift (DEF), wobei jeweils zwei der Knoten ((A, B), (F, G)) und der die jeweiligen Knoten ((A, B), (F, G)) verbindende gerichtete Kante (a, g) als Tripel (TA, TG) gekennzeichnet werden; d) Bestimmen von zumindest einem Pfad (PF1, PF2) von dem vorgebbaren Knoten (AA) zu einem in der Datenbankabfrage zu ermittelnden Tripel (TG); e) Generieren einer jeweiligen Pfaddistanz (DIS1, DIS2) des jeweiligen Pfades (PF1, PF2), wobei die jeweilige Pfaddistanz (DPF1, DPF2) eine Anzahl an gerichteten Kanten (a, ..., k) von dem vorgebbaren Knoten (AA) zu dem zu ermittelnden Tripel (TG) angibt, wobei die jeweilige Pfaddistanz (DPF1, DPF2) bei der Datenbankabfrage ausgehend von dem vorgebbaren Knoten (AA) ausgewertet werden kann.
Vorrichtung (VOR) zum Generieren einer Datenbank (DB) zum Bereitstellen von Informationswerten (IA, ..., IG) mittels Knoten (A, ..., G) und von Abhängigkeiten (aa, gg) der Informationswerte (IA, ..., IG) mittels gerichteter Kanten (a, ..., g) für eine Datenbankabfrage, wobei durch die Knoten (A, ..., G) und durch die gerichteten Kanten (a, ..., g) die Datenbank (DB) in Form eines gerichteten Graphen (TRE) gebildet wird, bei dem die Vorrichtung folgende Mittel umfasst: a) Erstes Mittel (M1) zum Einlesen einer Beschreibungsvorschrift (DEF), die die Zuordnung von jeweils zwei Informationswerten (IA, IB) mit der dazugehörigen Abhängigkeit (aa) angibt; b) Zweites Mittel (M2) zum Erstellen des jeweiligen Knotens (A, ..., G) für den jeweiligen Informationswert (IA, ..., IG) und der jeweiligen gerichteten Kante (a, ..., g) für die jeweilige Abhängigkeit (aa, ..., gg); c) Drittes Mittel (M3) zum Erzeugen des gerichteten Graphen (TRE) ausgehend von einem vorgebbaren Knoten (AA) der Knoten (A, ..., G) auf Grundlage der Beschreibungsvorschrift (DEF), wobei jeweils zwei der Knoten ((A, B), (F, G)) und der die jeweiligen Knoten ((A, B), (F, G)) verbindende gerichtete Kante (a, g) als Tripel (TA, TG) gekennzeichnet werden; d) Viertes Mittel (M4) zum Bestimmen von zumindest einem Pfad (PF1, PF2) von dem vorgebbaren Knoten (AA) zu einem in der Datenbankabfrage zu ermittelnden Tripel (TG); d) Fünftes Mittel (M5) zum Generieren einer jeweiligen Pfaddistanz (DIS1, DIS2) des jeweiligen Pfades (PF1, PF2), wobei die jeweilige Pfaddistanz (DPF1, DPF2) eine Anzahl an gerichteten Kanten (a, ..., k) von dem vorgebbaren Knoten (AA) zu dem zu ermittelnden Tripel (TG) angibt, wobei die jeweilige Pfaddistanz (DPF1, DPF2) bei der Datenbankabfrage ausgehend von dem vorgebbaren Knoten (AA) ausgewertet werden kann.
Suchverfahren zur Ermittlung eines Informationswertes (IF) in einer Datenbank (DB), wobei die Datenbank (DB) gemäß Anspruch 1 generiert werden kann, bei dem folgende Schritte durchgeführt werden: Erzeugen einer Datenbankabfrage mittels eines Suchmusters (QY) umfassend eine Angabe des vorgebbaren Knotens (AA), der Pfaddistanz (DIST) und des zu ermittelnden Tripels (TG); Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster (QY) angegebene Pfaddistanz (DIST) bei der Durchsuche berücksichtigt wird; Bereitstellen zumindest einer der Informationswerte (IF) zumindest eines der Tripel (TR), das die Vorgabe des Suchmusters (QY) erfüllt.
Suchverfahren nach Anspruch 3, wobei bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt werden, die eine Pfaddistanz von maximal der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.
Suchverfahren nach Anspruch 3 oder 4, wobei bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt werden, die eine Pfaddistanz von genau der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.
Suchverfahren nach einem der Ansprüche 3 bis 5, bei dem ein Wert Null für die Pfaddistanz (DIST) in dem Suchmuster (QY) derart verarbeitet wird, dass diese Pfaddistanz (DIST) auf zumindest eine maximale in der Datenbank (DB) vorkommende Pfaddistanz (DISmax) gesetzt wird.
Suchvorrichtung (SVOR) zur Ermittlung eines Informationswertes (IF) in einer Datenbank (DB), wobei die Datenbank (DB) gemäß Anspruch 2 generiert ist, die folgende Einheiten umfasst: Erste Einheit (E1) zum Erzeugen einer Datenbankabfrage mittels eines Suchmusters (QY) umfassend eine Angabe des vorgebbaren Knotens (AA), der Pfaddistanz (DIST) und des zu ermittelnden Tripels (TG); Zweite Einheit (E2) zum Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster (QY) angegebene Pfaddistanz (DIST) bei dem Durchsuchen berücksichtigbar ist; Dritte Einheit (E3) zum Bereitstellen zumindest einer der Informationswerte (IF) zumindest eines der Tripel (TR), das die Vorgabe des Suchmusters (QY) erfüllt.
Suchvorrichtung (SVOR) gemäß Anspruch 7, das ferner die zweite Einheit (E2) derart ausgebildet ist, bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von maximal der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.
Suchvorrichtung (SVOR) gemäß Anspruch 7 oder 8, das ferner die zweite Einheit (E2) derart ausgebildet ist, bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von genau der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.
Suchvorrichtung (SVOR) gemäß einem der Ansprüche 7 bis 9, das ferner die zweite Einheit (E4) derart ausgebildet ist, dass ein Wert Null für die Pfaddistanz (DIST) in dem Suchmuster (QY) derart verarbeitbar ist, dass diese Pfaddistanz (DIST) zumindest auf eine maximale in der Datenbank (DB) vorkommende Pfaddistanz (DISmax) einstellbar ist.