EP2419840A1 - Method and device for generating an rdf database for an rdf database query and a search method and a search device for the rdf database query - Google Patents

Method and device for generating an rdf database for an rdf database query and a search method and a search device for the rdf database query

Info

Publication number
EP2419840A1
EP2419840A1 EP10712921A EP10712921A EP2419840A1 EP 2419840 A1 EP2419840 A1 EP 2419840A1 EP 10712921 A EP10712921 A EP 10712921A EP 10712921 A EP10712921 A EP 10712921A EP 2419840 A1 EP2419840 A1 EP 2419840A1
Authority
EP
European Patent Office
Prior art keywords
database
path distance
search
node
database query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
EP10712921A
Other languages
German (de)
French (fr)
Inventor
Mario DÖLLER
Gero BÄSE
Florian Markus Stegmaier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP2419840A1 publication Critical patent/EP2419840A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/2448Query languages for particular applications; for extensibility, e.g. user defined types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Definitions

  • the invention relates to a method and a device for generating a database for a database query. Furthermore, the invention relates to a search method and a search device for querying a database.
  • Information values are made available to users via databases today.
  • databases There are a variety of database languages with which the respective database can be described and queried in a structured manner.
  • a representative for describing databases with semantic relations is, for example, RDF / OWL (RDF - Resource Description Framework, OWL - Web Ontology Language) [1, 2].
  • RDF / OWL RDF - Resource Description Framework, OWL - Web Ontology Language
  • informational values in the form of nodes are described, with two nodes and one directed edge between the two nodes being referred to as RDF triples.
  • the two nodes represent a subject and an object and the directed edge a predicate.
  • the predicate generally defines a semantic relation between the subject and the object. This will be explained in more detail using an example according to FIG.
  • the node B represents the subject "person”
  • the node A represents the object "Mario”
  • the RDF triplet "BaA” reads "Person has name Mario”.
  • a concatenation of such RDF triplets leads to a graph structure which reproduces a directed graph, see, for example, FIG. 1. Triples are outlined in bold in FIG.
  • RDF / OWL can use a query language SPARQL (SPARQL - SPARQL Protocol and RDF Query Language) [3].
  • SPARQL SPARQL - SPARQL Protocol and RDF Query Language
  • a searched subgraph is realized by specifying all RDF triples involved. Therefore, to specify the above three RDF triplets, chains of RDF triplets including the RDF triplets framed in FIG. 2 must be specified. This approach requires that such a semantic database query is complex and time-consuming, since already in places of the database query an extensive knowledge of the structure of the database is needed.
  • the invention relates to a method for generating a database for providing information values by means of nodes and dependencies of information values by means ge ⁇ directed edges for a database query, the database is formed in the form of a directed graph through the nodes and the directed edges, where the following steps are performed:
  • the method achieves a reduction of the computing power in the search for specific triples, since a specification of the path distance achieves a reduction of the nodes to be examined.
  • a device for generating a database for providing information values by means of nodes and dependencies of the information values using directed edges for a database query is part of the invention, wherein the database is formed in the form of a directed graph by the nodes and by the directed edges the device comprises the following means:
  • the method for generating a database can be implemented.
  • part of the invention is a search method for determining an information value in a database, wherein the database can be generated according to methods for generating a database, in which the following steps are performed:
  • the search method achieves a reduction of the computing power in the search for specific triples in the database, since a specification of the path distance achieves a reduction of the nodes to be examined.
  • searching through the database for determining the database query takes into account those triples which have a maximum path distance of the path distance specified in the search pattern to the node specified in the search pattern.
  • the computing performance for performing the database query can be further reduced if, when searching the database for determining the database query, those triples are taken into account which have a path distance of exactly the path distance specified in the search pattern to the node specified in the search pattern.
  • a value zero for the path distance in the search pattern is processed such that this path distance is set to at least one maximum path distance occurring in the database. This allows a full search of all nodes and triplets of the database regardless of the maximum occurring path distance.
  • part of the invention is a search device for
  • Determining an information value in a database wherein the database is generated according to the device for generating a database, comprising the following units:
  • First unit for generating a database query by means of a search pattern comprising an indication of the predeterminable node, the path distance and the triple to be determined;
  • Second database for searching the database for determining the database query, wherein the path distance specified in the search pattern is taken into account in the search;
  • Third unit for providing at least one of the information values of at least one of the triples, which fulfills the specification of the search pattern.
  • search method can be implemented. Further advantages, also for further developments of the search device are the respective corresponding features of the search method removable.
  • the second unit is further configured in such a way as to search through the
  • Database for determining the database query to take into account those triples having a maximum path distance of the path distance specified in the search pattern to the predetermined in the search pattern node.
  • the second unit may be further configured to consider, when searching the database for determining the database query, those triples having a path distance from exactly the path distance specified in the search pattern to the node specified in the search pattern.
  • the second unit is further configured such that a value zero for the path distance in the search pattern can be processed such that this path distance can be set at least to a maximum path distance occurring in the database.
  • Figure 1 A structure of a database with edges and nodes according to a standard RDF / OWL (prior art);
  • FIG. 2 A number of RDF triplets of the database to be considered in retrieving three RDF triplets (prior art);
  • FIG. 3 shows a structure of a database according to an exemplary embodiment of the invention
  • FIG. 4 shows a flowchart for creating the database according to FIG. 3;
  • FIG. 5 Flow chart for querying the database.
  • FIGS. 3 and 4 show an exemplary embodiment of the invention.
  • a database is to be created for a semantic annotation of temporal and spatial allocations of a person to one or more rooms.
  • FIG. 3 shows nodes and directed edges which can each receive specific information values or dependencies.
  • the following reference symbols are used:
  • directed edge for dependency aa "has name”
  • a step STA the method is started with the steps S1 to S5 in order to create a database DB.
  • a description specification DEF is read in which the assignment of two information values IA, IB with the associated dependency aa.
  • the description specification DEF can be in the form of a paper sheet or as an electronic file and, for example, by means of a description language XML (XML - eXtensible Markup Language) represent the respective assignment.
  • XML XML - eXtensible Markup Language
  • the description rule describes the assignments as pictorially illustrated in FIG.
  • step S2 the respective nodes A,..., G are formed for the respective information value IA,..., IG and the respective directed edges a,..., G for the dependencies aa,..., Gg.
  • the edges are directed because the node where the directional edge originates, for example, a subject, and the node where the directional edge terminates corresponds to an object, where the directed edge represents a semantic relation of both edges.
  • Two nodes connected to a directed edge and the associated directed edge are called triple TA, TF.
  • the predeterminable node AA comes from the set of nodes and is a starting point for a database query.
  • a path PF1 is formed by the predeterminable node AA to the triple TF to be determined during the database query.
  • PFl AA-b-C-c-D-e-F
  • PF2 AA-b-C-d-E-f-F
  • a length of the paths i. a path distance is determined by a number of directed edges in the respective path.
  • step S4 if there are several paths, the shortest path can be determined to be used subsequently. However, in the present example, both paths are the same length.
  • step S5 the path distance DIS is added to the triplets TF.
  • step END The flow chart according to FIG. 4 is ended in step END.
  • the invention also relates to a search method for determining an information value in the database DB. According to FIG. 5, this query is started in state STA.
  • a database query is generated by means of a search pattern.
  • the search pattern QY is the predeterminable node instead of a predefinable path, as is the case in the prior art with the query language SPARQL.
  • the associated information value, the distance to be considered in the search, and the triplet to be determined such as:
  • step S7 that starting from the information value (person) with a path distance of 3, the triple (place "has name” name) is searched for. In the search thus only the triples are taken into account, the one
  • Path distance of three In general, searching the database takes into account the path distance. Furthermore, the search method may determine the path that is least complex for the search.
  • At least one information value of the triples determined by the search is output in step S8. Furthermore, further information values of the determined triple and / or the dependency can also be displayed. In addition, special value characteristics for at least one of the elements of the triple can be queried in the search pattern. This is the search pattern QY eg.
  • step END The flow chart according to FIG. 5 is ended in step END.
  • the triplets of the individual types can be stored by means of tables.
  • involved tables In the evaluation of search patterns, that is to say of specifiable paths, involved tables must be linked together. The efficiency of the search depends essentially on the size of the tables and the respective selectivity.
  • a search may be limited to the path that requires few computational steps. This can then be the path that is the shortest, that is, has the smallest path distance. In this case, fewer triples have to be processed in order to get from the predeterminable node to the triple TF to be determined. Furthermore, an advantage can result from the fact that in the processing of the triples by means of tables that path is selected which has the smallest possible tables.
  • a table for the node D and another table for the node E are created. The table for node D contains a large number of entries and the table for node E contains only a small number of entries. Therefore, when using tables to implement the database, it is expedient to choose path PF2, which passes over node E and does not include node D. This reduces computational complexity.
  • the search pattern that is to say the predefinable path
  • the search pattern must be completely specified. In this case, a selection of paths leading from the predeterminable node to the triple TF to be determined is not possible.
  • the invention makes it possible for the search pattern to have only the elements which are essential to the search, and the search method based on this search pattern can determine the optimum path for evaluating the search.
  • a further advantage of the invention can be seen in the fact that a degree of detail in the database query can be set by specifying the distance in the search pattern. The greater the distance from the predeterminable node, the more detailed the degree of information. Thus, with the aid of the invention, it is also possible to specify a quality of the triple TF to be determined in the database query.
  • a value of zero for the path distance may indicate that the search is to be performed without restriction to the distance. This is advantageous because this way the
  • the method for generating the database can be carried out with the aid of five means M1, M2, M3, M4, M5 with the device VOR. Furthermore, the search method for determining an information value in the database by means of the units El, E2 and E4 are realized with the search device SVOR. These means and / or units may be implemented in hardware, software or a combination of hardware and software. In addition, the means and / or the units can be executed by means of a computer unit.

Abstract

The invention relates to a method and a device for generating a database. To this end, information values are created by means of nodes and directed edges describing dependencies between two nodes or information values, respectively, in the form of a directed graph for the database query. By using a path distance describing a number of directed edges between a selected node and a target tuple, consisting of two nodes connected to a directed edge and the associated directed edge, a reduction of a complexity of a database query and thus an acceleration of the database query can be achieved. The invention further comprises a search method and a search device for querying the described database. The invention can be used, for example, for monitoring systems or in medical databases. Furthermore, the invention can be used for databases which are dynamically extended, for example by new events in the monitoring system.

Description

Beschreibungdescription
VERFAHREN UND VORRICHTUNG ZUM GENERIEREN EINER RDF-DATENBANK FÜR EINE RDF-DATENBANKABFRAGE, SOWIE EIN SUCHVERFAHREN UND EINE SUCHVORRICHTUNG ZUR RDF-DATENBANKABFRAGEMETHOD AND DEVICE FOR GENERATING AN RDF DATABASE FOR A RDF DATABASE INQUIRY, AS WELL AS A SEARCH METHOD AND A RDF DATABASE INQUIRY SEARCH ENGINEERING DEVICE
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Generieren einer Datenbank für eine Datenbankabfrage. Ferner betrifft die Erfindung ein Suchverfahren und eine Suchvor- richtung zum Abfragen einer Datenbank.The invention relates to a method and a device for generating a database for a database query. Furthermore, the invention relates to a search method and a search device for querying a database.
Informationswerte, wie Flugdaten oder Börsenkurse, werden heute mittels Datenbanken einem Benutzer zur Verfügung gestellt. Hierzu gibt es eine Vielzahl von Datenbanksprachen, mit denen die jeweilige Datenbank strukturiert beschrieben und abgefragt werden kann. Ein Vertreter zur Beschreibung von Datenbanken mit semantischen Relationen ist beispielsweise RDF/OWL (RDF - Resource Description Framework, OWL - Web On- tology Language) [1, 2] . Hierbei werden Informationswerte in Form von Knoten beschrieben, wobei jeweils zwei Knoten und eine gerichtete Kante zwischen den zwei Knoten als RDF-Tripel bezeichnet werden. Dabei repräsentieren die zwei Knoten ein Subjekt und ein Objekt und die gerichtete Kante ein Prädikat. Hierbei definiert das Prädikat im Allgemeinen eine semanti- sehe Relation zwischen dem Subjekt und dem Objekt. Dies soll an einem Beispiel gemäß Figur 1 näher erläutert werden. Dabei repräsentiert der Knoten B das Subjekt "Person", der Knoten A das Objekt "Mario" und die gerichtet Kante a das Prädikat "hat Namen". Somit liest sich das RDF-Tripel "BaA" zu "Person hat Namen Mario". Eine Verkettung solcher RDF-Tripels führt zu einer Graphenstruktur, die einen gerichteten Graphen wiedergibt, siehe bspw. Figur 1. Triples sind in Figur 1 fett umrandet .Information values, such as flight data or stock market prices, are made available to users via databases today. There are a variety of database languages with which the respective database can be described and queried in a structured manner. A representative for describing databases with semantic relations is, for example, RDF / OWL (RDF - Resource Description Framework, OWL - Web Ontology Language) [1, 2]. Here, informational values in the form of nodes are described, with two nodes and one directed edge between the two nodes being referred to as RDF triples. The two nodes represent a subject and an object and the directed edge a predicate. Here, the predicate generally defines a semantic relation between the subject and the object. This will be explained in more detail using an example according to FIG. Here, the node B represents the subject "person", the node A represents the object "Mario" and the directed edge a the predicate "has name". Thus, the RDF triplet "BaA" reads "Person has name Mario". A concatenation of such RDF triplets leads to a graph structure which reproduces a directed graph, see, for example, FIG. 1. Triples are outlined in bold in FIG.
Zur Abfrage eines Informationswertes der Datenbank gemäßTo query an information value of the database according to
RDF/OWL kann eine Abfragesprache SPARQL (SPARQL - SPARQL Pro- tocol and RDF Query Language) [3] dienen. Hierzu wird ausgehend von einem vorgebbaren Knoten, also einem bestimmten In- formationswert, ein oder mehrere RDF-Tripels der Datenbank gesucht, siehe bspw. in Figur 1 die fett umrandeten RDF- Tripels (BaA, HjJ, IkK) . Zur Abfrage dieser RDF-Tripels, also einer semantischen Anfrage, wird ein gesuchter subgraph durch Angabe aller involvierten RDF-Tripels realisiert. Um die oben genannten drei RDF-Tripels anzugeben müssen daher Ketten von RDF-Tripels umfassend die in Figur 2 umrandeten RDF-Tripels spezifiziert werden. Diese Vorgehensweise bedingt, dass eine derartige semantische Datenbankabfrage komplex und zeitauf- wendig ist, da bereits bei Stellen der Datenbankabfrage eine umfangreiche Kenntnis der Struktur der Datenbank von Nöten ist.RDF / OWL can use a query language SPARQL (SPARQL - SPARQL Protocol and RDF Query Language) [3]. For this purpose, starting from a predeterminable node, that is to say a specific formation value, one or more RDF triplets of the database searched, see, for example, in Figure 1, the bold rimmed RDF triplets (BaA, HjJ, IkK). To query these RDF triples, ie a semantic query, a searched subgraph is realized by specifying all RDF triples involved. Therefore, to specify the above three RDF triplets, chains of RDF triplets including the RDF triplets framed in FIG. 2 must be specified. This approach requires that such a semantic database query is complex and time-consuming, since already in places of the database query an extensive knowledge of the structure of the database is needed.
Daher ist es eine Aufgabe der Erfindung ein Verfahren und ei- ne Vorrichtung zum Generieren einer Datenbank für eine Datenbankabfrage, sowie ein Suchverfahren und eine Suchvorrichtung zum Abfragen einer Datenbank anzugeben, die eine Reduktion der Komplexität bei der Datenbankabfrage ermöglichen.It is therefore an object of the invention to specify a method and a device for generating a database for a database query, as well as a search method and a search device for querying a database, which enable a reduction in the complexity of the database query.
Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst. Weiterbildungen der Erfindung sind den abhängigen Ansprüchen zu entnehmen.This object is solved by the independent claims. Further developments of the invention can be found in the dependent claims.
Die Erfindung betrifft ein Verfahren zum Generieren einer Da- tenbank zum Bereitstellen von Informationswerten mittels Knoten und von Abhängigkeiten der Informationswerte mittels ge¬ richteter Kanten für eine Datenbankabfrage, wobei durch die Knoten und durch die gerichteten Kanten die Datenbank in Form eines gerichteten Graphen gebildet wird, bei dem folgende Schritte durchgeführt werden:The invention relates to a method for generating a database for providing information values by means of nodes and dependencies of information values by means ge ¬ directed edges for a database query, the database is formed in the form of a directed graph through the nodes and the directed edges, where the following steps are performed:
a) Einlesen einer Beschreibungsvorschrift, die die Zuordnung von jeweils zwei Informationswerten mit der dazugehörigen Abhängigkeit angibt;a) reading a description rule that indicates the assignment of two information values with the corresponding dependency;
b) Erstellen des jeweiligen Knotens für den jeweiligen Informationswert und der jeweiligen gerichteten Kante für die jeweilige Abhängigkeit; c) Erzeugen des gerichteten Graphen ausgehend von einem vorgebbaren Knoten der Knoten auf Grundlage der Beschreibungs¬ vorschrift, wobei jeweils zwei der Knoten und der die jewei- ligen Knoten verbindende gerichtete Kante als Tripel gekenn¬ zeichnet werden;b) creating the respective node for the respective information value and the respective directed edge for the respective dependency; c) generating the directed graph starting from a predeterminable node of the nodes on the basis of the description ¬ rule, in each case two of the nodes and of the respective node connecting directed edge are marked as triple ¬ marked;
d) Bestimmen von zumindest einem Pfad von dem vorgebbaren Knoten zu einem in der Datenbankabfrage zu ermittelnden Tri- pel;d) determining at least one path from the predeterminable node to a triple to be determined in the database query;
e) Generieren einer jeweiligen Pfaddistanz des jeweiligen Pfades, wobei die jeweilige Pfaddistanz eine Anzahl an ge¬ richteten Kanten von dem vorgebbaren Knoten zu dem zu ermit- telnden Tripel angibt, wobei die jeweilige Pfaddistanz bei der Datenbankabfrage ausgehend von dem vorgebbaren Knoten ausgewertet werden kann.e) Generating a respective path distance of the respective path, wherein the respective path distance indicates a number of ge ¬ directed edges of the predeterminable node to be determined triplets, wherein the respective path distance can be evaluated in the database query, starting from the predetermined node.
Durch das Verfahren wird eine Reduktion der Rechenleistung bei der Suche nach bestimmten Tripel erreicht, da durch die Angabe der Pfaddistanz eine Reduktion der zu untersuchenden Knoten erreicht wird.The method achieves a reduction of the computing power in the search for specific triples, since a specification of the path distance achieves a reduction of the nodes to be examined.
Ferner ist eine Vorrichtung zum Generieren einer Datenbank zum Bereitstellen von Informationswerten mittels Knoten und von Abhängigkeiten der Informationswerte mittels gerichteter Kanten für eine Datenbankabfrage Teil der Erfindung, wobei durch die Knoten und durch die gerichteten Kanten die Datenbank in Form eines gerichteten Graphen gebildet wird, bei dem die Vorrichtung folgende Mittel umfasst:Furthermore, a device for generating a database for providing information values by means of nodes and dependencies of the information values using directed edges for a database query is part of the invention, wherein the database is formed in the form of a directed graph by the nodes and by the directed edges the device comprises the following means:
a) Erstes Mittel zum Einlesen einer Beschreibungsvorschrift, die die Zuordnung von jeweils zwei Informationswerten mit der dazugehörigen Abhängigkeit angibt;a) First means for reading a description rule, which indicates the assignment of two information values with the corresponding dependency;
b) Zweites Mittel zum Erstellen des jeweiligen Knotens für den jeweiligen Informationswert und der jeweiligen gerichte¬ ten Kante für die jeweilige Abhängigkeit; c) Drittes Mittel zum Erzeugen des gerichteten Graphen ausgehend von einem vorgebbaren Knoten der Knoten auf Grundlage der Beschreibungsvorschrift, wobei jeweils zwei der Knoten und der die jeweiligen Knoten verbindende gerichtete Kante als Tripel gekennzeichnet werden;b) second means for creating the respective node for the respective information value and the respective court ¬ edge for the respective dependence; c) third means for generating the directed graph from a predeterminable node of the nodes on the basis of the description rule, wherein in each case two of the nodes and the directed edge connecting the respective nodes are identified as triples;
d) Viertes Mittel zum Bestimmen von zumindest einem Pfad von dem vorgebbaren Knoten zu einem in der Datenbankabfrage zu ermittelnden Tripel;d) fourth means for determining at least one path from the predeterminable node to a triple to be determined in the database query;
d) Fünftes Mittel zum Generieren einer jeweiligen Pfaddistanz des jeweiligen Pfades, wobei die jeweilige Pfaddistanz eine Anzahl an gerichteten Kanten von dem vorgebbaren Knoten zu dem zu ermittelnden Tripel angibt, wobei die jeweilige Pfad¬ distanz bei der Datenbankabfrage ausgehend von dem vorgebba¬ ren Knoten ausgewertet werden kann.d) fifth means for generating a respective path distance of the respective path, wherein the respective path distance indicating a number of directed edges of the predetermined node to the to be determined triples, wherein the respective path ¬ distance in the database query, starting evaluated by the vorgebba ¬ ren node can be.
Mit Hilfe der Vorrichtung ist das Verfahren zum Generieren einer Datenbank implementierbar.With the aid of the device, the method for generating a database can be implemented.
Des Weiteren ist Teil der Erfindung ein Suchverfahren zur Ermittlung eines Informationswertes in einer Datenbank, wobei die Datenbank gemäß Verfahren zum Generieren einer Datenbank generiert werden kann, bei dem folgende Schritte durchgeführt werden :Furthermore, part of the invention is a search method for determining an information value in a database, wherein the database can be generated according to methods for generating a database, in which the following steps are performed:
Erzeugen einer Datenbankabfrage mittels eines Suchmusters um¬ fassend eine Angabe des vorgebbaren Knotens, der Pfaddistanz und des zu ermittelnden Tripels;Generating a database query by means of a search pattern ¬ an indication of the specifiable node, the path distance and the to be determined triple;
Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster angegebene Pfaddistanz bei der Durchsuche berücksichtigt wird;Searching the database query database, taking into account the path distance specified in the search pattern in the search;
Bereitstellen zumindest einer der Informationswerte zumindest eines der Tripel, das die Vorgabe des Suchmusters erfüllt. Durch das Suchverfahren wird eine Reduktion der Rechenleistung bei der Suche nach bestimmten Tripel in der Datenbank erreicht, da durch die Angabe der Pfaddistanz eine Reduktion der zu untersuchenden Knoten erreicht wird.Providing at least one of the information values of at least one of the triples satisfying the specification of the search pattern. The search method achieves a reduction of the computing power in the search for specific triples in the database, since a specification of the path distance achieves a reduction of the nodes to be examined.
In einer Weiterbildung des Suchverfahrens werden bei dem Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt, die eine Pfaddistanz von maximal der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen. Hierdurch kann eine weitere Reduktion der Rechenleistung zum Durchführen der Datenbankabfrage erzielt werden, da eine Anzahl an zur Suche zu berücksichtigenden Tripel weiter reduziert wird.In a refinement of the search method, searching through the database for determining the database query takes into account those triples which have a maximum path distance of the path distance specified in the search pattern to the node specified in the search pattern. As a result, a further reduction of the computing power for performing the database query can be achieved since a number of triples to be considered for the search is further reduced.
Zudem kann die Rechenleistung zum Durchführen der Datenbankabfrage noch weiter reduziert werden, wenn bei dem Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt werden, die eine Pfaddistanz von genau der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen.In addition, the computing performance for performing the database query can be further reduced if, when searching the database for determining the database query, those triples are taken into account which have a path distance of exactly the path distance specified in the search pattern to the node specified in the search pattern.
In einer vorteilhaften Weiterbildung des Suchverfahrens wird ein Wert Null für die Pfaddistanz in dem Suchmuster derart verarbeitet wird, dass diese Pfaddistanz auf zumindest eine maximale in der Datenbank vorkommende Pfaddistanz gesetzt. Dies ermöglicht eine Vollsuche aller Knoten und Tripel der Datenbank unabhängig von der maximalen vorkommenden Pfaddistanz .In an advantageous development of the search method, a value zero for the path distance in the search pattern is processed such that this path distance is set to at least one maximum path distance occurring in the database. This allows a full search of all nodes and triplets of the database regardless of the maximum occurring path distance.
Schließlich ist Teil der Erfindung eine Suchvorrichtung zurFinally, part of the invention is a search device for
Ermittlung eines Informationswertes in einer Datenbank, wobei die Datenbank gemäß der Vorrichtung zum Generieren einer Datenbank generiert ist, die folgende Einheiten aufweist:Determining an information value in a database, wherein the database is generated according to the device for generating a database, comprising the following units:
Erste Einheit zum Erzeugen einer Datenbankabfrage mittels eines Suchmusters umfassend eine Angabe des vorgebbaren Knotens, der Pfaddistanz und des zu ermittelnden Tripels; Zweite Einheit zum Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster angegebene Pfaddistanz bei der Durchsuche berücksichtigbar ist;First unit for generating a database query by means of a search pattern comprising an indication of the predeterminable node, the path distance and the triple to be determined; Second database for searching the database for determining the database query, wherein the path distance specified in the search pattern is taken into account in the search;
Dritte Einheit zum Bereitstellen zumindest einer der Informationswerte zumindest eines der Tripel, das die Vorgabe des Suchmusters erfüllt.Third unit for providing at least one of the information values of at least one of the triples, which fulfills the specification of the search pattern.
Mit Hilfe der Suchvorrichtung ist das Suchverfahren implemen- tierbar. Weitere Vorteile, auch für Weiterbildungen der Suchvorrichtung sind den jeweils korrespondierenden Merkmalen des Suchverfahrens entnehmbar.With the help of the search device, the search method can be implemented. Further advantages, also for further developments of the search device are the respective corresponding features of the search method removable.
In einer Weiterbildung der Suchvorrichtung ist ferner die zweite Einheit derart ausgebildet, bei dem Durchsuchen derIn a further development of the search device, the second unit is further configured in such a way as to search through the
Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von maximal der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen.Database for determining the database query to take into account those triples having a maximum path distance of the path distance specified in the search pattern to the predetermined in the search pattern node.
Zusätzlich oder alternativ dazu kann die zweite Einheit ferner derart ausgebildet sein, bei dem Durchsuchen der Datenbank zur Ermittlung der Datenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von genau der in dem Suchmuster angegebenen Pfaddistanz zu dem in dem Suchmuster vorgegebenen Knoten aufweisen.Additionally or alternatively, the second unit may be further configured to consider, when searching the database for determining the database query, those triples having a path distance from exactly the path distance specified in the search pattern to the node specified in the search pattern.
In einer vorteilhaften Weiterbildung der Suchvorrichtung ist ferner die zweite Einheit derart ausgebildet, dass ein Wert Null für die Pfaddistanz in dem Suchmuster derart verarbeitbar ist, dass diese Pfaddistanz zumindest auf eine maximale in der Datenbank vorkommende Pfaddistanz einstellbar ist.In an advantageous development of the search device, the second unit is further configured such that a value zero for the path distance in the search pattern can be processed such that this path distance can be set at least to a maximum path distance occurring in the database.
Die Erfindung und ihre Weiterbildungen werden anhand von Fi- guren näher erläutert.The invention and its developments are explained in more detail with reference to figures.
Es zeigen: Figur 1 Eine Struktur einer Datenbank mit Kanten und Knoten gemäß einem Standard RDF/OWL (Stand der Technik) ;Show it: Figure 1 A structure of a database with edges and nodes according to a standard RDF / OWL (prior art);
Figur 2 Eine Anzahl von RDF-Tripels der Datenbank, die bei der Abfrage dreier RDF-Tripels zu berücksichtigen sind (Stand der Technik) ;Figure 2 A number of RDF triplets of the database to be considered in retrieving three RDF triplets (prior art);
Figur 3 Eine Struktur einer Datenbank gemäß einem Ausfuhrungsbeispiel der Erfindung;FIG. 3 shows a structure of a database according to an exemplary embodiment of the invention;
Figur 4 Ablaufdiagramm zur Erstellung der Datenbank gemäß Figur 3;FIG. 4 shows a flowchart for creating the database according to FIG. 3;
Figur 5 Ablaufdiagramm zur Abfragen der Datenbank.FIG. 5 Flow chart for querying the database.
Elemente mit gleicher Funktion und Wirkung sind in den Figuren mit denselben Bezugszeichen versehen.Elements having the same function and effect are given the same reference numerals in the figures.
Figuren 3 und 4 zeigen ein Ausfuhrungsbeispiel der Erfindung, Dabei soll im Rahmen einer Uberwachungsanwendung in einem Gebäude eine Datenbank für eine semantische Annotierung von zeitlichen und raumlichen Zuordnungen einer Person zu einem oder mehreren Räumen erstellt werden. Figur 3 zeigt dabei Knoten und gerichtete Kanten, die jeweils bestimmte Informa- tionswerte bzw. Abhängigkeiten aufnehmen können. In Figur 3 werden dabei folgende Bezugszeichen verwendet:FIGS. 3 and 4 show an exemplary embodiment of the invention. As part of a monitoring application in a building, a database is to be created for a semantic annotation of temporal and spatial allocations of a person to one or more rooms. In this case, FIG. 3 shows nodes and directed edges which can each receive specific information values or dependencies. In FIG. 3, the following reference symbols are used:
A: Knoten für den Informationswert IA=NameA: Information value node IA = Name
B: Knoten für den Informationswert IB=PersonB: Node for the information value IB = person
C: Knoten für den Informationswert IC=PositionC: node for the information value IC = position
D: Knoten für den Informationswert ID=ZeitlichD: node for the information value ID = time
E: Knoten für den Informationswert IE=OrtlichE: node for the information value IE = local
F: Knoten für den Informationswert IF=OrtF: Node for the information value IF = location
G: Knoten für den Informationswert IG=NameG: node for the information value IG = name
a: gerichtete Kante für Abhängigkeit aa="hat Name" b: gerichtete Kante für Abhängigkeit bb="hat Position" c: gerichtete Kante für Abhängigkeit cc="hat zeitliche Position" d: gerichtete Kante für Abhängigkeit dd="hat örtliche Position" e: gerichtete Kante für Abhängigkeit ee="hat befindet sich" f : gerichtete Kante für Abhängigkeit ff="hat örtliche Region" g: gerichtete Kante für Abhängigkeit gg="hat Name"a: directed edge for dependency aa = "has name" b: directed edge for dependency bb = "has position" c: directed edge for dependence cc = "has temporal position" d: directed edge for dependence dd = "has local position" e: directed edge for dependence ee = "has located" f: directed edge for dependence ff = "has local Region "g: directed edge for dependency gg =" has name "
In einem Schritt STA wird das Verfahren mit den Schritten Sl bis S5 gestartet, um eine Datenbank DB zu erstellen.In a step STA, the method is started with the steps S1 to S5 in order to create a database DB.
Im Schritt Sl wird eine Beschreibungsvorschrift DEF, die die Zuordnung von jeweils zwei Informationswerten IA, IB mit der dazugehörigen Abhängigkeit aa eingelesen. Die Beschreibungs- Vorschrift DEF kann in Form eines Papierblatts oder als elektronische Datei ausgestaltet sein und beispielsweise mittels einer Beschreibungssprache XML (XML - eXtensible Markup Language) die jeweiligen Zuordnung darstellen. In diesem Beispiel beschreibt die Beschreibungsvorschrift die Zuordnungen wie sie bildhaft in Figur 3 dargestellt sind.In step S1, a description specification DEF is read in which the assignment of two information values IA, IB with the associated dependency aa. The description specification DEF can be in the form of a paper sheet or as an electronic file and, for example, by means of a description language XML (XML - eXtensible Markup Language) represent the respective assignment. In this example, the description rule describes the assignments as pictorially illustrated in FIG.
Im Schritt S2 werden die jeweiligen Knoten A, ..., G für den jeweiligen Infomationswert IA, ..., IG und die jeweiligen gerichteten Kanten a, ... , g für die Abhängigkeiten aa, ... , gg gebildet. Die Kanten sind gerichtet, da der Knoten, an dem die gerichtete Kante entspringt bspw. einem Subjekt, und der Knoten, an dem die gerichtete Kante endet einem Objekt entspricht, wobei die gerichtete Kante eine semantische Relation beider Kanten repräsentiert. Zwei Knoten, die mit einer ge- richteten Kante verbunden sind, und die dazugehörige gerichtete Kante werden Tripel TA, TF bezeichnet.In step S2, the respective nodes A,..., G are formed for the respective information value IA,..., IG and the respective directed edges a,..., G for the dependencies aa,..., Gg. The edges are directed because the node where the directional edge originates, for example, a subject, and the node where the directional edge terminates corresponds to an object, where the directed edge represents a semantic relation of both edges. Two nodes connected to a directed edge and the associated directed edge are called triple TA, TF.
In einem nächsten Schritt S3 wird dann ausgehend ein einem vorgebbaren Knoten AA=B ein gerichteter Graph TR aus den Kno- ten und gerichtete Kanten auf Basis der Beschreibungsvorschrift gebildet. Der vorgebbare Knoten AA stammt aus der Menge der Knoten und ist ein Ausgangspunkt für eine Datenbankabfrage . Dabei kann das Ausfuhrungsbeispiel in einer konkreten Ausprägung, also in einer Instanz, folgendermaßen lauten: Person = erste Person "hat Name" Name = Werner - Person = erste Person "hat Position" Position = 15In a next step S3, a directed graph TR from the nodes and directed edges is then formed starting from a prescribable node AA = B on the basis of the description rule. The predeterminable node AA comes from the set of nodes and is a starting point for a database query. In this case, the exemplary embodiment in a concrete form, ie in an instance, may read as follows: Person = first person "has name" name = Werner - person = first person "has position" position = 15
Position = 15 "hat zeitliche Position" Zeitlich = 12:05 UhrPosition = 15 "has time position" Time = 12:05
Position = 15 "hat ortliche Position" Ortlich = 48° 8' NB, 11° 34' OL (NB=nordliche Breite, OL=ostliche Lange) - Ortlich = 48°8' NB, 11°34' OL "hat ortliche Region" Ort = erster RaumabschnittPosition = 15 "has local position" Local = 48 ° 8 'NB, 11 ° 34' OL (NB = north latitude, OL = east longitude) - Locally = 48 ° 8 'NB, 11 ° 34' OL "has local region "Place = first room section
Zeitlich = 12:05 Uhr "befindet sich" Ort = erster RaumabschnittTime = 12:05 o'clock "Location" = first section of the room
Ort = erster Raumabschnitt "hat Name" Name = Eingangsbe- reichPlace = first room section "has name" name = entrance area
Hierbei geht es um die Überwachung von großen Räumen in mehreren zu überwachenden Orten, d.h. Regionen. Jedes Mal wenn eine Person in eine Region tritt kann eine Instanz in der Da- tenbank angelegt werden. Allgemein existiert zumindest eine konkrete Ausprägung in der Datenbank DB.This involves monitoring large rooms in multiple locations to be monitored, i. Regions. Each time a person enters a region, an instance can be created in the database. In general, at least one specific form exists in the database DB.
In einem nächsten Schritt S4 wird ein Pfad PFl von dem vorgebbaren Knoten AA zu dem bei der Datenbankabfrage zu ermit- telnden Tripel TF gebildet. Im vorliegenden Ausfuhrungsbeispiel gibt es von dem vorgebbaren Knoten AA zu dem Knoten F des Tripels TF folgende Pfade PFl, PF2 :In a next step S4, a path PF1 is formed by the predeterminable node AA to the triple TF to be determined during the database query. In the present exemplary embodiment, there are the following paths PF1, PF2 from the prescribable node AA to the node F of the triple TF:
PFl = AA-b-C-c-D-e-F PF2 = AA-b-C-d-E-f-FPFl = AA-b-C-c-D-e-F PF2 = AA-b-C-d-E-f-F
Eine Lange der Pfade, d.h. eine Pfaddistanz, wird durch eine Anzahl an gerichteten Kanten in dem jeweiligen Pfad bestimmt. Im vorliegenden Beispiel ist die Pfaddistanz DIS des Pfads PFl DIS1=3 und des Pfades PF2 DIS2=3.A length of the paths, i. a path distance is determined by a number of directed edges in the respective path. In the present example, the path distance DIS of the path PF1 is DIS1 = 3 and the path PF2 is DIS2 = 3.
In einer optionalen Erweiterung kann im Schritt S4 bei vorliegen mehrere Pfade der kürzeste Pfad bestimmt werden, der nachfolgend verwendet werden soll. In dem vorliegenden Beispiel sind jedoch beide Pfade gleich lang.In an optional extension, in step S4, if there are several paths, the shortest path can be determined to be used subsequently. However, in the present example, both paths are the same length.
In einem nachfolgenden Schritt S5 wird den Tripeln TF die Pfaddistanz DIS hinzugefügt. Das Ablaufdiagramm gemäß Figur 4 wird im Schritt END beendet.In a subsequent step S5, the path distance DIS is added to the triplets TF. The flow chart according to FIG. 4 is ended in step END.
Die Erfindung betrifft auch ein Suchverfahren zur Ermittlung eines Informationswertes in der Datenbank DB. Gemäß Figur 5 wird diese Abfrage im Zustand STA gestartet.The invention also relates to a search method for determining an information value in the database DB. According to FIG. 5, this query is started in state STA.
In einem Schritt S6 wird eine Datenbankabfrage mittels eines Suchmusters erzeugt. Hierbei wird bei der Datenbankabfrage als Suchmuster QY anstelle eines vorgebbaren Pfades, wie es im Stand der Technik bei der Abfragesprache SPARQL der Fall ist, der vorgebbare Knoten, d.h. der dazugehörige Informationswert, die in der Suche zu berücksichtigende Distanz und das zu ermittelnde Tripel beschrieben, wie beispielsweise:In a step S6, a database query is generated by means of a search pattern. In this case, in the database query, the search pattern QY is the predeterminable node instead of a predefinable path, as is the case in the prior art with the query language SPARQL. the associated information value, the distance to be considered in the search, and the triplet to be determined, such as:
QY = "(Person) [3] (Ort "hat Name" Name)"QY = "(person) [3] (place" has name "name)"
Das bedeutet, wie im Schritt S7 dargestellt, dass ausgehend von dem Informationswert (Person) mit einer Pfaddistanz von 3 das Tripel (Ort "hat Name" Name) gesucht wird. Bei der Suche werden somit nur noch die Tripel berücksichtigt, die eineThis means, as shown in step S7, that starting from the information value (person) with a path distance of 3, the triple (place "has name" name) is searched for. In the search thus only the triples are taken into account, the one
Pfaddistanz von drei aufweisen. Im Allgemeinen wird bei der Suche in der Datenbank die Pfaddistanz berücksichtigt. Ferner kann das Suchverfahren denjenigen Pfad bestimmen, der für die Suche am wenigsten komplex ist.Path distance of three. In general, searching the database takes into account the path distance. Furthermore, the search method may determine the path that is least complex for the search.
Als Ergebnis der Suche wird im Schritt S8 zumindest der eine Informationswert der durch die Suche ermittelten Tripels ausgegeben. Ferner können auch weitere Informationswerte des ermittelten Tripels und/oder die Abhängigkeit dargestellt wer- den. Zudem können in dem Suchmuster spezielle Werteausprägungen für zumindest eines der Elemente des Tripels abgefragt werden. So lautet das Suchmuster QY bspw.As a result of the search, at least one information value of the triples determined by the search is output in step S8. Furthermore, further information values of the determined triple and / or the dependency can also be displayed. In addition, special value characteristics for at least one of the elements of the triple can be queried in the search pattern. This is the search pattern QY eg.
QY = "(Person) [3] (Ort "hat Name" Name=λΕingangsbereich") "QY = "(person) [3] (place" has name "name = λ input area") "
Hierbei werden diejenigen Orte in der Datenbank gesucht, die als spezifische Werteausprägung des Namens „Eingangsbereich" aufweisen .In this case, those locations are searched in the database which have a specific value expression of the name "input area".
Ferner können bei der Durchsuchung der Datenbank diejenigen Tripel berücksichtigt werden, die genau oder maximal der in dem Suchmuster angegebenen Pfaddistanz DIST von dem in dem Suchmuster angegebenen vorgebbaren Knoten AA Distanz aufwei- sen. Des Weiteren kann mit Hilfe eines Wertes Null in der in dem Suchmuster angegebenen Pfaddistanz DIST=O dem Suchverfahren mitgeteilt werden, dass alle Knoten der Datenbank zu durchsuchen sind.Furthermore, during the search of the database, those triples can be taken into account which have the exact or maximum distance of the distance DIST indicated in the search pattern from the predeterminable node AA specified in the search pattern. Furthermore, with the aid of a value zero in the path distance DIST = 0 specified in the search pattern, it is possible to inform the search method that all nodes of the database are to be searched.
Das Ablaufdiagramm gemäß Figur 5 wird im Schritt END beendet.The flow chart according to FIG. 5 is ended in step END.
Im Stand der Technik können die Tripel der einzelnen Typen mittels Tabellen abgelegt werden. Bei der Auswertung von Suchmustern, also von vorgebbaren Pfaden, müssen involvierte Tabellen miteinander verknüpft werden. Die Effizienz der Suche hängt im Wesentlichen von der Größe der Tabellen und der jeweiligen Selektivität ab.In the prior art, the triplets of the individual types can be stored by means of tables. In the evaluation of search patterns, that is to say of specifiable paths, involved tables must be linked together. The efficiency of the search depends essentially on the size of the tables and the respective selectivity.
Im Gegensatz dazu kann bei einer Implementierung der vorlie- genden Erfindung eine Suche auf denjenigen Pfad begrenzt werden, der wenige Rechenschritte benötigt. Dies kann dann der Pfad sein, der am kürzesten ist, also die kleinste Pfaddistanz aufweist. In diesem Fall müssen weniger Tripel bearbeitet werden, um von dem vorgebbaren Knoten zur dem zu ermit- telnden Tripel TF zu gelangen. Ferner kann sich ein Vorteil dadurch ergeben, dass bei der Bearbeitung der Tripel mittels Tabellen derjenige Pfad ausgewählt wird, der möglichst kleine Tabellen aufweist. In vorliegen Beispiel gemäß Figur 3 ist bspw. eine Tabelle für den Knoten D und eine weitere Tabelle für den Knoten E erstellt werden. Die Tabelle für den Knoten D enthält eine große Anzahl von Einträgen und die Tabelle für den Knoten E nur eine dazu kleine Anzahl von Einträgen. Daher ist es bei der Verwendung von Tabellen zur Realisierung der Datenbank zweckmäßig den Pfad PF2 zu wählen, der über den Knoten E verläuft und den Knoten D nicht einschließt. Hierdurch wird eine Rechenkomplexität verringert.In contrast, in one implementation of the present invention, a search may be limited to the path that requires few computational steps. This can then be the path that is the shortest, that is, has the smallest path distance. In this case, fewer triples have to be processed in order to get from the predeterminable node to the triple TF to be determined. Furthermore, an advantage can result from the fact that in the processing of the triples by means of tables that path is selected which has the smallest possible tables. In the present example according to FIG. 3 for example, a table for the node D and another table for the node E are created. The table for node D contains a large number of entries and the table for node E contains only a small number of entries. Therefore, when using tables to implement the database, it is expedient to choose path PF2, which passes over node E and does not include node D. This reduces computational complexity.
Bei einer Abfrage gemäß dem Stand der Technik mittels SPARQL muss der das Suchmuster, also der vorgebbare Pfad vollständig angegeben werden. In diesem Fall ist eine Auswahl von Pfaden, die von dem vorgebbaren Knoten zu dem zu ermittelnden Tripel TF führen nicht möglich. Somit wird durch die Erfindung er- möglicht, dass das Suchmuster nur die zur Suche wesentlichen Elemente aufweist und das Suchverfahren auf Basis dieses Suchmustern den optimalen Pfad zur Auswertung der Suche bestimmen kann.In the case of a query according to the prior art by means of SPARQL, the search pattern, that is to say the predefinable path, must be completely specified. In this case, a selection of paths leading from the predeterminable node to the triple TF to be determined is not possible. Thus, the invention makes it possible for the search pattern to have only the elements which are essential to the search, and the search method based on this search pattern can determine the optimum path for evaluating the search.
Ein weiterer Vorteil der Erfindung ist darin zu sehen, dass durch Angabe der Distanz in dem Suchmuster ein Detaillierungsgrad bei der Datenbankabfrage eingestellt werden kann. Je größer die Distanz von dem vorgebbaren Knoten ist, desto detaillierter ist der Informationsgrad. Somit kann mit Hilfe der Erfindung auch eine Qualität des zu ermittelnden Tripel TF bei der Datenbankabfrage angegeben werden.A further advantage of the invention can be seen in the fact that a degree of detail in the database query can be set by specifying the distance in the search pattern. The greater the distance from the predeterminable node, the more detailed the degree of information. Thus, with the aid of the invention, it is also possible to specify a quality of the triple TF to be determined in the database query.
In einer Erweiterung kann ein Wert Null für die Pfaddistanz angeben, dass die Suche ohne Beschränkung auf die Distanz durchzuführen ist. Dies ist vorteilhaft, da hierdurch dieIn an extension, a value of zero for the path distance may indicate that the search is to be performed without restriction to the distance. This is advantageous because this way the
Möglichkeit eröffnet wird unabhängig von der Mächtigkeit der Datenbank, also ohne Kenntnis der maximal vorkommenden Pfaddistanz in der Datenbank, alle Tripel bei der Datenbankabfrage zu berücksichtigen.Possibility opened regardless of the thickness of the database, so without knowing the maximum occurring path distance in the database, all triples to be considered in the database query.
Das Verfahren zum Generieren der Datenbank kann mit Hilfe von fünf Mittel Ml, M2, M3, M4 , M5 mit der Vorrichtung VOR durchgeführt werden. Ferner kann das Suchverfahren zur Ermittlung eines Informationswertes in der Datenbank mittels der Einheiten El, E2 und E4 mit der Suchvorrichtung SVOR realisiert werden. Diese Mittel und/oder Einheiten sind in Hardware, Software oder in einer Kombination aus Hard- und Software durchführbar. Zudem können die Mittel und/oder die Einheiten mittels einer Rechnereinheit ausgeführt werden. The method for generating the database can be carried out with the aid of five means M1, M2, M3, M4, M5 with the device VOR. Furthermore, the search method for determining an information value in the database by means of the units El, E2 and E4 are realized with the search device SVOR. These means and / or units may be implemented in hardware, software or a combination of hardware and software. In addition, the means and / or the units can be executed by means of a computer unit.
Literatur :Literature:
[1] „Resource Description Framework", hc tp : //en . wikipedia . org/ wiki/Resouree Deser iption ork, Stand 15.04.2009[1] "Resource Description Framework", hc tp: // en. Wikipedia.org/wiki/Resouree Deser iption ork, as of 15.04.2009
[2] „Web Ontology Language", http : / /en . wikipedia . org/wiki/Web Oncology Lanςiuage,[2] "Web Ontology Language", http://en.wikipedia.org/wiki/Web Oncology_Lan_saiage,
Stand 15.04.2009Stand 15.04.2009
[3] „SPARQL Protocol and RDF Query Language", hebp: //en. wikipedia.org/wiki /SPARQL, Stand 15.04.2009 [3] "SPARQL Protocol and RDF Query Language", hebp: // en. Wikipedia.org/wiki/SPARQL, as of 15/04/2009

Claims

Patentansprüche claims
1. Verfahren zum Generieren einer Datenbank (DB) zum Bereitstellen von Informationswerten (IA, ..., IG) mittels Knoten (A, ... , G) und von Abhängigkeiten (aa, ... , gg) der Informationswerte (IA, ..., IG) mittels gerichteter Kanten (a, ..., g) für eine Datenbankabfrage, wobei durch die Knoten (A, ..., G) und durch die gerichteten Kanten (a, ... , g) die Datenbank (DB) in Form eines gerichteten Graphen (TRE) gebildet wird, bei dem folgende Schritte durchgeführt werden: a) Einlesen einer Beschreibungsvorschrift (DEF) , die die Zuordnung von jeweils zwei Informationswerten (IA, IB) mit der dazugehörigen Abhängigkeit (aa) angibt; b)Erstellen des jeweiligen Knotens (A, ..., G) für den jewei- ligen Informationswert (IA, ..., IG) und der jeweiligen gerichteten Kante (a, ..., g) für die jeweilige Abhängigkeit (aa, ... , gg) ; c) Erzeugen des gerichteten Graphen (TRE) ausgehend von einem vorgebbaren Knoten (AA) der Knoten (A, ... , G) auf Grundlage der Beschreibungsvorschrift (DEF), wobei jeweils zwei der1. A method for generating a database (DB) for providing information values (IA, ..., IG) by means of nodes (A, ..., G) and dependencies (aa, ..., gg) of the information values (IA , ..., IG) by means of directed edges (a, ..., g) for a database query, whereby the nodes (A, ..., G) and the directed edges (a, ..., g) the database (DB) is formed in the form of a directed graph (TRE), in which the following steps are carried out: a) reading a description rule (DEF), which determines the assignment of two information values (IA, IB) with the associated dependency (aa ) indicates; b) Creation of the respective node (A,..., G) for the respective information value (IA,..., IG) and the respective directed edge (a,..., g) for the respective dependency (aa , ..., gg); c) generating the directional graph (TRE) from a predeterminable node (AA) of the nodes (A, ..., G) on the basis of the specification (DEF), wherein two of the
Knoten ((A,B), (F, G)) und der die jeweiligen Knoten ((A,B), (F, G)) verbindende gerichtete Kante (a, g) als Tripel (TA, TG) gekennzeichnet werden; d) Bestimmen von zumindest einem Pfad (PFl, PF2) von dem vor- gebbaren Knoten (AA) zu einem in der Datenbankabfrage zu ermittelnden Tripel (TG) ; e) Generieren einer jeweiligen Pfaddistanz (DISl, DIS2) des jeweiligen Pfades (PFl, PF2), wobei die jeweilige Pfaddistanz (DPFl, DPF2) eine Anzahl an gerichteten Kanten (a, ..., k) von dem vorgebbaren Knoten (AA) zu dem zu ermittelnden Tripel (TG) angibt, wobei die jeweilige Pfaddistanz (DPFl, DPF2) bei der Datenbankabfrage ausgehend von dem vorgebbaren Knoten (AA) ausgewertet werden kann.Nodes ((A, B), (F, G)) and the directed edge (a, g) connecting the respective nodes ((A, B), (F, G)) are identified as triples (TA, TG); d) determining at least one path (PF1, PF2) from the predeterminable node (AA) to a triple (TG) to be determined in the database query; e) generating a respective path distance (DIS1, DIS2) of the respective path (PF1, PF2), wherein the respective path distance (DPF1, DPF2) comprises a number of directed edges (a, ..., k) from the predeterminable node (AA) indicates the triplet (TG) to be determined, wherein the respective path distance (DPF1, DPF2) can be evaluated in the database query on the basis of the predefinable node (AA).
2. Vorrichtung (VOR) zum Generieren einer Datenbank (DB) zum Bereitstellen von Informationswerten (IA, ..., IG) mittels Knoten (A, ... , G) und von Abhängigkeiten (aa, ... , gg) der Informationswerte (IA, ..., IG) mittels gerichteter Kanten (a, ..., g) für eine Datenbankabfrage, wobei durch die Knoten (A, ... , G) und durch die gerichteten Kanten (a, ... , g) die Datenbank (DB) in Form eines gerichteten Graphen (TRE) gebildet wird, bei dem die Vorrichtung folgende Mittel umfasst: a) Erstes Mittel (Ml) zum Einlesen einer Beschreibungsvorschrift (DEF), die die Zuordnung von jeweils zwei Informationswerten (IA, IB) mit der dazugehörigen Abhängigkeit (aa) angibt; b) Zweites Mittel (M2) zum Erstellen des jeweiligen Knotens (A, ..., G) für den jeweiligen Informationswert (IA, ..., IG) und der jeweiligen gerichteten Kante (a, ..., g) für die jeweilige Abhängigkeit (aa, ... , gg) ; c) Drittes Mittel (M3) zum Erzeugen des gerichteten Graphen (TRE) ausgehend von einem vorgebbaren Knoten (AA) der Knoten2. Device (VOR) for generating a database (DB) for providing information values (IA, ..., IG) by means of nodes (A, ..., G) and dependencies (aa, ..., gg) of Information values (IA, ..., IG) by means of directed edges (a, ..., g) for a database query, wherein by the nodes (A, ..., G) and by the directed edges (a, ..., g), the database (DB) in the form of a directed graph (TRE), in which the device comprises the following means: a) First means (M1) for reading in a description specification (DEF), which specifies the association of two information values (IA, IB) with the associated dependency (aa); b) Second means (M2) for creating the respective node (A, ..., G) for the respective information value (IA, ..., IG) and the respective directed edge (a, ..., g) for the respective dependency (aa, ..., gg); c) Third means (M3) for generating the directed graph (TRE) from a predeterminable node (AA) of the nodes
(A, ..., G) auf Grundlage der Beschreibungsvorschrift (DEF), wobei jeweils zwei der Knoten ((A,B), (F, G)) und der die jeweiligen Knoten ((A,B), (F, G)) verbindende gerichtete Kante (a, g) als Tripel (TA, TG) gekennzeichnet werden; d) Viertes Mittel (M4) zum Bestimmen von zumindest einem Pfad (PFl, PF2) von dem vorgebbaren Knoten (AA) zu einem in der Datenbankabfrage zu ermittelnden Tripel (TG) ; d) Fünftes Mittel (M5) zum Generieren einer jeweiligen Pfaddistanz (DISl, DIS2) des jeweiligen Pfades (PFl, PF2), wobei die jeweilige Pfaddistanz (DPFl, DPF2) eine Anzahl an gerichteten Kanten (a, ... , k) von dem vorgebbaren Knoten (AA) zu dem zu ermittelnden Tripel (TG) angibt, wobei die jeweilige Pfaddistanz (DPFl, DPF2) bei der Datenbankabfrage ausgehend von dem vorgebbaren Knoten (AA) ausgewertet werden kann.(A, ..., G) on the basis of the description specification (DEF), whereby in each case two of the nodes ((A, B), (F, G)) and the respective nodes ((A, B), (F, G)) facing edge (a, g) are marked as triples (TA, TG); d) fourth means (M4) for determining at least one path (PF1, PF2) from the predeterminable node (AA) to a triple (TG) to be determined in the database query; d) fifth means (M5) for generating a respective path distance (DIS1, DIS2) of the respective path (PF1, PF2), wherein the respective path distance (DPF1, DPF2) comprises a number of directed edges (a, ..., k) of indicates the predeterminable node (AA) to be determined triple (TG), wherein the respective path distance (DPFl, DPF2) can be evaluated in the database query, starting from the predetermined node (AA).
3. Suchverfahren zur Ermittlung eines Informationswertes (IF) in einer Datenbank (DB) , wobei die Datenbank (DB) gemäß Anspruch 1 generiert werden kann, bei dem folgende Schritte durchgeführt werden: Erzeugen einer Datenbankabfrage mittels eines Suchmusters3. Search method for determining an information value (IF) in a database (DB), wherein the database (DB) can be generated according to claim 1, wherein the following steps are performed: generating a database query using a search pattern
(QY) umfassend eine Angabe des vorgebbaren Knotens (AA) , der Pfaddistanz (DIST) und des zu ermittelnden Tripels (TG) ; Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster (QY) angegebene Pfaddistanz (DIST) bei der Durchsuche berücksichtigt wird; Bereitstellen zumindest einer der Informationswerte (IF) zu- mindest eines der Tripel (TR) , das die Vorgabe des Suchmusters (QY) erfüllt.(QY) comprising an indication of the predeterminable node (AA), the path distance (DIST) and the triplet (TG) to be determined; Searching the database (DB) for determining the database query, taking into account the path distance (DIST) specified in the search pattern (QY) during the search; Providing at least one of the information values (IF) at least one of the triples (TR) that fulfills the specification of the search pattern (QY).
4. Suchverfahren nach Anspruch 3, wobei bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt werden, die eine Pfaddistanz von maximal der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.4. A search method according to claim 3, wherein when searching the database (DB) for determining the database query, those triples are taken into account which have a path distance of at most the path distance (DIST) specified in the search pattern (QY) to that in the search pattern (QY). have predetermined node (AA).
5. Suchverfahren nach Anspruch 3 oder 4, wobei bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage diejenigen Tripel berücksichtigt werden, die eine Pfaddistanz von genau der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.5. A search method according to claim 3 or 4, wherein when searching the database (DB) for determining the database query, those triples are taken into account which have a path distance of exactly the path distance (DIST) specified in the search pattern (QY) to that in the search pattern (D). QY) predetermined node (AA).
6. Suchverfahren nach einem der Ansprüche 3 bis 5, bei dem ein Wert Null für die Pfaddistanz (DIST) in dem Suchmuster (QY) derart verarbeitet wird, dass diese Pfaddistanz (DIST) auf zumindest eine maximale in der Datenbank (DB) vorkommende Pfaddistanz (DISmax) gesetzt wird.Search method according to one of claims 3 to 5, wherein a value zero for the path distance (DIST) in the search pattern (QY) is processed such that this path distance (DIST) to at least a maximum occurring in the database (DB) path distance (DISmax) is set.
7. Suchvorrichtung (SVOR) zur Ermittlung eines Informationswertes (IF) in einer Datenbank (DB), wobei die Datenbank (DB) gemäß Anspruch 2 generiert ist, die folgende Einheiten um- fasst :7. Search device (SVOR) for determining an information value (IF) in a database (DB), the database (DB) is generated according to claim 2, comprising the following units:
Erste Einheit (El) zum Erzeugen einer Datenbankabfrage mittels eines Suchmusters (QY) umfassend eine Angabe des vorgebbaren Knotens (AA) , der Pfaddistanz (DIST) und des zu ermit- telnden Tripels (TG) ;First unit (El) for generating a database query by means of a search pattern (QY) comprising an indication of the predeterminable node (AA), the path distance (DIST) and the triple (TG) to be determined;
Zweite Einheit (E2) zum Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage, wobei die in dem Suchmuster (QY) angegebene Pfaddistanz (DIST) bei dem Durchsuchen berücksichtigbar ist;Second unit (E2) for searching the database (DB) to determine the database query, the ones in the search pattern (QY) path distance (DIST) is considered in the search;
Dritte Einheit (E3) zum Bereitstellen zumindest einer der Informationswerte (IF) zumindest eines der Tripel (TR), das die Vorgabe des Suchmusters (QY) erfüllt.Third unit (E3) for providing at least one of the information values (IF) of at least one of the triples (TR) which fulfills the specification of the search pattern (QY).
8. Suchvorrichtung (SVOR) gemäß Anspruch 7, das ferner die zweite Einheit (E2) derart ausgebildet ist, bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Da- tenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von maximal der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.Search device (SVOR) according to claim 7, further comprising the second unit (E2), when searching the database (DB) for determining the database query, to consider those triples having a maximum path distance in the search pattern (QY) indicated path distance (DIST) to the specified in the search pattern (QY) node (AA).
9. Suchvorrichtung (SVOR) gemäß Anspruch 7 oder 8, das ferner die zweite Einheit (E2) derart ausgebildet ist, bei dem Durchsuchen der Datenbank (DB) zur Ermittlung der Datenbankabfrage diejenigen Tripel zu berücksichtigen, die eine Pfaddistanz von genau der in dem Suchmuster (QY) angegebenen Pfaddistanz (DIST) zu dem in dem Suchmuster (QY) vorgegebenen Knoten (AA) aufweisen.The search device (SVOR) according to claim 7 or 8, further comprising the second unit (E2), when searching the database (DB) for determining the database query, to consider triples having a path distance of exactly that in the search pattern (QY) indicated path distance (DIST) to the specified in the search pattern (QY) node (AA).
10. Suchvorrichtung (SVOR) gemäß einem der Ansprüche 7 bis 9, das ferner die zweite Einheit (E4) derart ausgebildet ist, dass ein Wert Null für die Pfaddistanz (DIST) in dem Suchmuster (QY) derart verarbeitbar ist, dass diese Pfaddistanz (DIST) zumindest auf eine maximale in der Datenbank (DB) vorkommende Pfaddistanz (DISmax) einstellbar ist. Search device (SVOR) according to one of claims 7 to 9, further comprising the second unit (E4) is designed such that a value zero for the path distance (DIST) in the search pattern (QY) is processable such that this path distance ( DIST) can be set at least to a maximum path distance (DISmax) occurring in the database (DB).
EP10712921A 2009-04-15 2010-03-23 Method and device for generating an rdf database for an rdf database query and a search method and a search device for the rdf database query Ceased EP2419840A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102009017082A DE102009017082A1 (en) 2009-04-15 2009-04-15 Method and device for generating a database for a database query, as well as a search method and a search device for database query
PCT/EP2010/053752 WO2010118931A1 (en) 2009-04-15 2010-03-23 Method and device for generating an rdf database for an rdf database query and a search method and a search device for the rdf database query

Publications (1)

Publication Number Publication Date
EP2419840A1 true EP2419840A1 (en) 2012-02-22

Family

ID=42124486

Family Applications (1)

Application Number Title Priority Date Filing Date
EP10712921A Ceased EP2419840A1 (en) 2009-04-15 2010-03-23 Method and device for generating an rdf database for an rdf database query and a search method and a search device for the rdf database query

Country Status (6)

Country Link
US (1) US9213738B2 (en)
EP (1) EP2419840A1 (en)
KR (1) KR101662561B1 (en)
CN (1) CN102395968B (en)
DE (1) DE102009017082A1 (en)
WO (1) WO2010118931A1 (en)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8683370B2 (en) 2010-03-01 2014-03-25 Dundas Data Visualization, Inc. Systems and methods for generating data visualization dashboards
CA2754520A1 (en) 2010-10-07 2012-04-07 Dundas Data Visualization, Inc. Systems and methods for dashboard image generation
CA2737148A1 (en) 2011-01-06 2012-07-06 Dundas Data Visualization, Inc. Methods and systems for providing a discussion thread to key performance indicator information
KR102104496B1 (en) * 2013-09-06 2020-04-24 삼성전자주식회사 Method and apparatus of searching data
CA2893912C (en) 2014-06-09 2022-10-18 Dundas Data Visualization, Inc. Systems and methods for optimizing data analysis
US9953065B2 (en) 2015-02-13 2018-04-24 International Business Machines Corporation Method for processing a database query
CN105955999B (en) * 2016-04-20 2019-04-23 华中科技大学 A kind of ThetaJoin inquiry processing method of extensive RDF graph
US10360240B2 (en) 2016-08-08 2019-07-23 International Business Machines Corporation Providing multidimensional attribute value information
US10311057B2 (en) 2016-08-08 2019-06-04 International Business Machines Corporation Attribute value information for a data extent
US20190288866A1 (en) * 2016-11-23 2019-09-19 Carrier Corporation Building management system having semantics-enabled building system data access
KR101997491B1 (en) * 2017-09-07 2019-07-08 호서대학교 산학협력단 Image annotation method implemented by mobile device
KR20210033770A (en) * 2019-09-19 2021-03-29 삼성전자주식회사 Method and apparatus for providing content based on knowledge graph

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059566A1 (en) * 2000-08-29 2002-05-16 Delcambre Lois M. Uni-level description of computer information and transformation of computer information between representation schemes
US20020174087A1 (en) * 2001-05-02 2002-11-21 Hao Ming C. Method and system for web-based visualization of directed association and frequent item sets in large volumes of transaction data
AU2002343740A1 (en) * 2001-11-16 2003-06-10 California Institute Of Technology Data compression method and system
US7702725B2 (en) * 2004-07-02 2010-04-20 Hewlett-Packard Development Company, L.P. Digital object repositories, models, protocol, apparatus, methods and software and data structures, relating thereto
EP1752919A1 (en) * 2005-07-29 2007-02-14 Amadeus s.a.s Method and system of building actual travel fares
US20080033993A1 (en) * 2006-08-04 2008-02-07 International Business Machines Corporation Database Access Through Ontologies With Semi-Automatic Semantic Mapping
KR100820746B1 (en) * 2007-01-22 2008-04-11 조선대학교산학협력단 Browsing system and method of information using ontology
US7890518B2 (en) * 2007-03-29 2011-02-15 Franz Inc. Method for creating a scalable graph database
US8244772B2 (en) * 2007-03-29 2012-08-14 Franz, Inc. Method for creating a scalable graph database using coordinate data elements
US20100241644A1 (en) * 2009-03-19 2010-09-23 Microsoft Corporation Graph queries of information in relational database
US9031933B2 (en) * 2013-04-03 2015-05-12 International Business Machines Corporation Method and apparatus for optimizing the evaluation of semantic web queries

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2010118931A1 *

Also Published As

Publication number Publication date
US9213738B2 (en) 2015-12-15
US20120041974A1 (en) 2012-02-16
CN102395968A (en) 2012-03-28
WO2010118931A1 (en) 2010-10-21
KR20120022957A (en) 2012-03-12
DE102009017082A1 (en) 2010-11-04
KR101662561B1 (en) 2016-10-06
CN102395968B (en) 2015-10-07

Similar Documents

Publication Publication Date Title
EP2419840A1 (en) Method and device for generating an rdf database for an rdf database query and a search method and a search device for the rdf database query
DE112015003406B4 (en) Lineage Summation
US20180039692A1 (en) Information Query Method And Device
DE112015005728B4 (en) Automatic finding of configuration elements
DE112016005536T5 (en) DETERMINING THE ORDER OF A CONSTRUCTION OF A NEURONAL NETWORK
DE102016223193A1 (en) Method and apparatus for completing a knowledge graph
DE112019001533T5 (en) EXTENSION OF TRAINING DATA FOR THE CLASSIFICATION OF NATURAL LANGUAGE
DE102016125767A1 (en) Discovery of a connected entity
DE112018006345T5 (en) GET SUPPORTING EVIDENCE FOR COMPLEX ANSWERS
DE112018005616T5 (en) BLOCK EXTRACTION OF DOCUMENT METADATA
EP2392120B1 (en) Method and sensor network for attribute selection for an event recognition
DE112013005993T5 (en) Method, apparatus and computer readable medium for optimal determination of data subsets
DE112018005725T5 (en) DATA DEIDENTIFICATION BASED ON DETECTION OF PERMITTED CONFIGURATIONS FOR DATA DEIDENTIFICATION PROCESSES
DE112012003541T5 (en) Automatic recognition of element lists within a web page
DE10149693A1 (en) Objects in a computer system
KR101987915B1 (en) System for generating template used to generate query to knowledge base from natural language question and question answering system including the same
DE112020001874T5 (en) DATA EXTRACTION SYSTEM
DE112008004025T5 (en) Analyze events
DE102012204167A1 (en) Advance approximated calculations
DE112020000554T5 (en) PROCEDURE FOR ACCESSING RECORDS OF A MASTER DATA MANAGEMENT SYSTEM
DE102017122489A1 (en) Nodes in a directed acyclic graph
DE202013012665U1 (en) Method for implementing structured and unstructured data in XML documents
US10996835B1 (en) Data preparation user interface with coordinated pivots
DE102006054671A1 (en) Global prefix tree generating method for e.g. online shopping website, involves acquiring global prefix tree with set of traversal paths, and transmitting response comprising global prefix tree to source
DE102015102034A1 (en) A method of analyzing results in a design automation workflow for electronic systems, computer system and computer program product

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20110927

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO SE SI SK SM TR

DAX Request for extension of the european patent (deleted)
RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: SIEMENS AKTIENGESELLSCHAFT

17Q First examination report despatched

Effective date: 20151028

REG Reference to a national code

Ref country code: DE

Ref legal event code: R003

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED

18R Application refused

Effective date: 20161026