DE102021202931A1 - Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse vonDaten - Google Patents

Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse vonDaten Download PDF

Info

Publication number
DE102021202931A1
DE102021202931A1 DE102021202931.0A DE102021202931A DE102021202931A1 DE 102021202931 A1 DE102021202931 A1 DE 102021202931A1 DE 102021202931 A DE102021202931 A DE 102021202931A DE 102021202931 A1 DE102021202931 A1 DE 102021202931A1
Authority
DE
Germany
Prior art keywords
node
processor
knowledge graph
representation
subgraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021202931.0A
Other languages
English (en)
Inventor
Evgeny Kharlamov
Trung Kien TRAN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102021202931.0A priority Critical patent/DE102021202931A1/de
Priority to CN202210295171.6A priority patent/CN115129881A/zh
Publication of DE102021202931A1 publication Critical patent/DE102021202931A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse von Daten, welche Schlüsselwörter umfassen, wobei die Vorrichtung einen Eingang (202) umfasst, wobei der Eingang (202) dafür ausgelegt ist, Schlüsselwörter der Daten auf numerische Darstellungen wenigstens eines ersten Knotens des Wissensgraphen und eines zweiten Knotens und eines dritten Knotens des Wissensgraphen abzubilden, wobei in dem Wissensgraphen Gewichte seinen Knoten zugewiesen sind, wobei in dem Wissensgraphen semantische Abstände Paaren seiner Knoten zugewiesen sind, wobei die Vorrichtung ferner wenigstens einen Prozessor (204) umfasst, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des ersten Knotens eine numerische Darstellung eines ersten Weges in dem Wissensgraphen zu bestimmen, der an dem ersten Knoten beginnt und an dem dritten Knoten des Wissensgraphen endet, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des zweiten Knotens und einer numerischen Darstellung des dritten Knotens eine numerische Darstellung eines zweiten Weges in dem Wissensgraphen zu bestimmen, der an dem zweiten Knoten beginnt und an dem dritten Knoten endet, wobei der wenigstens eine Prozessor (204) ferner dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des ersten Weges und in Abhängigkeit von der numerischen Darstellung des zweiten Weges eine numerische Darstellung eines Teilgraphen des Wissensgraphen zu bestimmen, der den ersten Weg und den zweiten Weg umfasst, wobei der wenigstens eine Prozessor (204) ferner dafür ausgelegt ist, Kosten in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Teilgraphen zu bestimmen, und wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von den Kosten zu bestimmen, ob die numerische Darstellung des Teilgraphen oder eine numerische Darstellung eines Referenz-Teilgraphen auszugeben ist, und wobei

Description

  • Hintergrund
  • Die Erfindung betrifft eine Vorrichtung und ein Verfahren zur automatischen Analyse von Daten.
  • Ein Wissensgraph (Knowledge Graph), KG, kann verwendet werden, um Daten automatisch zu analysieren. Ein Ergebnis einer Analyse von Daten kann automatisch aus Schlüsselwörtern in den Daten bestimmt werden, indem ein Teilgraph des KG gefunden wird, welcher eine Kostenfunktion optimiert.
  • Beschreibung der Erfindung
  • Die Vorrichtung, das Verfahren und das Computerprogramm gemäß den unabhängigen Ansprüchen verbessern die automatische Analyse weiter.
  • Die Beschreibung offenbart eine Vorrichtung zur automatischen Analyse von Daten, welche Schlüsselwörter umfassen, wobei die Vorrichtung einen Eingang umfasst, wobei der Eingang dafür ausgelegt ist, Schlüsselwörter der Daten auf numerische Darstellungen wenigstens eines ersten Knotens eines Wissensgraphen und eines zweiten Knotens des Wissensgraphen und eines dritten Knotens des Wissensgraphen abzubilden, wobei in dem Wissensgraphen Gewichte seinen Knoten zugewiesen sind, wobei in dem Wissensgraphen semantische Abstände Paaren seiner Knoten zugewiesen sind, wobei die Vorrichtung ferner einen Prozessor umfasst, wobei der Prozessor dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des ersten Knotens eine numerische Darstellung eines ersten Weges in dem Wissensgraphen zu bestimmen, der an dem ersten Knoten beginnt und an dem dritten Knoten des Wissensgraphen endet, wobei der Prozessor dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des zweiten Knotens und einer numerischen Darstellung des dritten Knotens eine numerische Darstellung eines zweiten Weges in dem Wissensgraphen zu bestimmen, der an dem zweiten Knoten beginnt und an dem dritten Knoten endet, wobei der Prozessor ferner dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des ersten Weges und in Abhängigkeit von der numerischen Darstellung des zweiten Weges eine numerische Darstellung eines Teilgraphen des Wissensgraphen zu bestimmen, der den ersten Weg und den zweiten Weg umfasst, wobei der Prozessor ferner dafür ausgelegt ist, Kosten in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Teilgraphen zuwiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Teilgraphen zu bestimmen, und wobei der Prozessor dafür ausgelegt ist, in Abhängigkeit von den Kosten zu bestimmen, ob die numerische Darstellung des Teilgraphen oder eine numerische Darstellung eines Referenz-Teilgraphen auszugeben ist, und wobei die Vorrichtung einen Ausgang umfasst, der dafür ausgelegt ist, die ausgegebene numerische Darstellung auf ein Ergebnis der Analyse abzubilden. Die Kostenfunktion ist vorzugsweise quadratisch, und sie minimiert nicht nur Knotengewichte, sondern auch semantische Abstände zwischen Paaren von Knoten, welche unabhängig von der Graphstruktur und vom Knotengewicht sein können. Der Teilgraph mit wenigstens einem Schlüsselwortknoten ist eine kohäsive Antwort, die das Ergebnis der automatischen Analyse der Schlüsselwörter umfasst.
  • Der wenigstens eine Prozessor kann ferner dafür ausgelegt sein, eine numerische Darstellung eines ersten Kandidatenweges in dem Wissensgraphen zu bestimmen, welcher am ersten Knoten beginnt und an einem letzten Knoten endet, wobei der wenigstens eine Prozessor ferner dafür ausgelegt ist, eine numerische Darstellung eines zusätzlichen Knotens des Wissensgraphen auszuwählen, welcher durch eine einzige Kante mit dem letzten Knoten verbunden und noch nicht Teil des ersten Kandidatenweges ist, wobei der wenigstens eine Prozessor ferner dafür ausgelegt ist, die numerische Darstellung eines zweiten Kandidatenweges in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges und in Abhängigkeit von einer numerischen Darstellung der einzigen Kante und in Abhängigkeit von der numerischen Darstellung des zusätzlichen Knotens zu bestimmen. Auf diese Weise wird der Kandidatenweg gleichzeitig um eine Kante und einen zusätzlichen Knoten verlängert.
  • Der wenigstens eine Prozessor kann ferner dafür ausgelegt sein, in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges eine Länge des ersten Kandidatenweges zu bestimmen und den zweiten Kandidatenweg nur zu bestimmen, falls die Länge kleiner als ein Schwellenwert ist. Dies garantiert eine maximale Suchtiefe und verringert die Rechenzeit.
  • Der wenigstens eine Prozessor kann ferner dafür ausgelegt sein, eine Kostenschranke für einen Kandidatenweg in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Kandidatenweges zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Kandidatenweges zu bestimmen, und wobei der Prozessor dafür ausgelegt ist, den ersten Weg und den zweiten Weg unabhängig von dem Kandidatenweg zu bestimmen, falls die Kostenschranke eine zweite Bedingung erfüllt. Die Kostenschranke gibt Kosten für den Teilgraphen an, welche aus der Betrachtung des Kandidatenweges resultieren werden. Dies verringert die Rechenzeit, da der Kandidatenweg bei der Berechnung nicht weiter betrachtet wird, falls er nicht zu einer kohäsiveren Antwort führt.
  • Der wenigstens eine Prozessor kann ferner dafür ausgelegt sein, in Abhängigkeit von Referenzkosten zu bestimmen, dass die erste Bedingung erfüllt ist, wenn die Kosten für den Teilgraphen kleiner als die Referenzkosten sind, und/oder dass die zweite Bedingung erfüllt ist, wenn die Kostenschranke größer oder gleich den Referenzkosten ist. Gemäß einem Aspekt ist die Antwort, welche der Teilgraph darstellt, umso kohäsiver, je niedriger die Kosten des Teilgraphen sind. Auf diese Weise wird der Teilgraph nur betrachtet, wenn er eine kohäsivere Antwort darstellt. Gemäß einem anderen Aspekt wird, falls die Kosten des Kandidatenweges bereits höher als die Referenzkosten sind, dieser nicht betrachtet. Auf diese Weise wird der Kandidatenweg nur betrachtet, falls er zu einer kohäsiveren Antwort führen wird.
  • Der wenigstens eine Prozessor kann dafür ausgelegt sein, die Referenzkosten in Abhängigkeit von einer numerischen Darstellung eines Referenz-Teilgraphen in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Referenz-Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Referenz-Teilgraphen zu bestimmen. Der Referenz-Teilgraph kann leer, d. h. null, in einer ersten Iteration oder ein in einer vorhergehenden Iteration bestimmter optimaler Teilgraph sein. Dies stellt eine Konvergenz gegen die kohäsivste Antwort sicher.
  • Der wenigstens eine Prozessor kann dafür ausgelegt sein, numerische Darstellungen von Kandidatenwegen in einer Menge von Kandidatenwegen nach ihrer jeweiligen Kostenschranke zu ordnen, wobei der Prozessor dafür ausgelegt ist, aus der Menge die numerische Darstellung des Kandidatenweges auszuwählen, welche eine vorbestimmte Position in der Reihenfolge hat. Der Kandidatenweg mit den niedrigsten Kosten wird vorzugsweise ausgewählt, indem die numerische Darstellung dementsprechend geordnet und ausgewählt wird.
  • Das Verfahren zur automatischen Analyse von Daten umfasst das Abbilden, durch einen Eingang, eines ersten Schlüsselwortes der Daten auf eine numerische Darstellung eines ersten Knotens eines Wissensgraphen, das Abbilden, durch den Eingang, eines zweiten Schlüsselwortes der Daten auf eine numerische Darstellung eines zweiten Knotens des Wissensgraphen, das Abbilden, durch den Eingang, eines dritten Schlüsselwortes der Daten auf eine numerische Darstellung eines dritten Knotens des Wissensgraphen, wobei in dem Wissensgraphen Gewichte seinen Knoten zugewiesen sind, wobei in dem Wissensgraphen semantische Abstände Paaren seiner Knoten zugewiesen sind, das Bestimmen, durch wenigstens einen Prozessor, in Abhängigkeit von der numerischen Darstellung des ersten Knotens, einer numerischen Darstellung eines ersten Weges in dem Wissensgraphen, der an dem ersten Knoten beginnt und an dem dritten Knoten des Wissensgraphen endet, das Bestimmen, durch den wenigstens einen Prozessor, in Abhängigkeit von der numerischen Darstellung des zweiten Knotens und einer numerischen Darstellung des dritten Knotens, einer numerischen Darstellung eines zweiten Weges in dem Wissensgraphen, der an dem zweiten Knoten beginnt und an dem dritten Knoten endet, das Bestimmen, durch den wenigstens einen Prozessor, in Abhängigkeit von der numerischen Darstellung des ersten Weges und in Abhängigkeit von der numerischen Darstellung des zweiten Weges, einer numerischen Darstellung eines Teilgraphen des Wissensgraphen, der den ersten Weg und den zweiten Weg umfasst, das Bestimmen, durch den wenigstens einen Prozessor, von Kosten in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Teilgraphen, das Bestimmen, durch den wenigstens einen Prozessor, in Abhängigkeit von den Kosten, ob die numerische Darstellung des Teilgraphen oder eine numerische Darstellung eines Referenz-Teilgraphen auszugeben ist, und das Abbilden, durch einen Ausgang, der ausgegebenen numerischen Darstellung auf ein Ergebnis der Analyse. Das wenigstens eine Schlüsselwort ist eine kohäsive Antwort, die das Ergebnis der automatischen Analyse der Schlüsselwörter umfasst.
  • Das Verfahren kann ferner das Bestimmen, durch den wenigstens einen Prozessor, einer numerischen Darstellung eines ersten Kandidatenweges in dem Wissensgraphen umfassen, welcher am ersten Knoten beginnt und an einem letzten Knoten endet, das Auswählen, durch den wenigstens einen Prozessor, einer numerischen Darstellung eines zusätzlichen Knotens des Wissensgraphen, welcher durch eine einzige Kante mit dem letzten Knoten verbunden und noch nicht Teil des ersten Kandidatenweges ist, das Bestimmen, durch den wenigstens einen Prozessor, der numerischen Darstellung eines zweiten Kandidatenweges in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges und in Abhängigkeit von einer numerischen Darstellung der einzigen Kante und in Abhängigkeit von der numerischen Darstellung des zusätzlichen Knotens. Auf diese Weise wird der Kandidatenweg gleichzeitig um eine Kante und einen zusätzlichen Knoten verlängert.
  • Das Verfahren kann ferner das Bestimmen, durch den wenigstens einen Prozessor, in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges, einer Länge des ersten Kandidatenweges und das Bestimmen des zweiten Kandidatenweges nur dann, falls die Länge kleiner als ein Schwellenwert ist, umfassen. Dies garantiert eine maximale Suchtiefe und verringert die Rechenzeit.
  • Das Verfahren kann ferner das Bestimmen, durch den wenigstens einen Prozessor, einer Kostenschranke für einen Kandidatenweg in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Kandidatenweges zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Kandidatenweges, und das Bestimmen, durch den wenigstens einen Prozessor, des ersten Weges und des zweiten Weges unabhängig von dem Kandidatenweg, falls die Kostenschranke eine zweite Bedingung erfüllt, umfassen. Die Kostenschranke gibt Kosten für den Teilgraphen an, welche aus der Betrachtung des Kandidatenweges resultieren werden. Dies verringert die Rechenzeit, da der Kandidatenweg bei der Berechnung nicht weiter betrachtet wird, falls er nicht zu einer kohäsiveren Antwort führt.
  • Das Verfahren kann ferner das Bestimmen, durch den wenigstens einen Prozessor, in Abhängigkeit von Referenzkosten, dass die erste Bedingung erfüllt ist, wenn die Kosten für den Teilgraphen kleiner als die Referenzkosten sind, und/oder dass die zweite Bedingung erfüllt ist, wenn die Kostenschranke größer oder gleich den Referenzkosten ist, umfassen. Gemäß einem Aspekt ist die Antwort, welche der Teilgraph darstellt, umso kohäsiver, je niedriger die Kosten des Teilgraphen sind. Auf diese Weise wird der Teilgraph nur betrachtet, wenn er eine kohäsivere Antwort darstellt. Gemäß einem anderen Aspekt wird, falls die Kosten des Kandidatenweges bereits höher als die Referenzkosten sind, dieser nicht betrachtet. Auf diese Weise wird der Kandidatenweg nur betrachtet, falls er zu einer kohäsiveren Antwort führen wird.
  • Das Verfahren kann ferner das Bestimmen, durch den wenigstens einen Prozessor, der Referenzkosten in Abhängigkeit von einer numerischen Darstellung eines Referenz-Teilgraphen in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Referenz-Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Referenz-Teilgraphen umfassen. Der Referenz-Teilgraph kann leer, d. h. null, in einer ersten Iteration oder ein in einer vorhergehenden Iteration bestimmter optimaler Teilgraph sein. Dies stellt eine Konvergenz gegen die kohäsivste Antwort sicher.
  • Das Verfahren kann ferner das Ordnen, durch den wenigstens einen Prozessor, numerischer Darstellungen von Kandidatenwegen in einer Menge von Kandidatenwegen nach ihrer jeweiligen Kostenschranke und das Auswählen, durch den wenigstens einen Prozessor, der numerischen Darstellung des Kandidatenweges aus der Menge, welche eine vorbestimmte Position in der Reihenfolge hat, umfassen. Der Kandidatenweg mit den niedrigsten Kosten wird vorzugsweise ausgewählt, indem die numerische Darstellung dementsprechend geordnet und ausgewählt wird.
  • Das Computerprogramm zur automatischen Analyse von Schlüsselwörtern umfasst computerlesbare Anweisungen, welche, wenn sie von einem Computer ausgeführt werden, bewirken, dass der Computer das Verfahren ausführt.
  • Weitere Ausführungsformen können aus der folgenden Beschreibung und der Zeichnung abgeleitet werden. In der Zeichnung zeigt
    • 1 einen beispielhaften Wissensgraphen,
    • 2 Aspekte einer Vorrichtung zur Analyse von Daten,
    • 3 Aspekte eines Verfahrens zur Analyse von Daten.
  • 1 zeigt einen beispielhaften Wissensgraphen, KG, 100.
  • Der KG 100 umfasst einen Knoten 102, einen Knoten 104, einen Knoten 106, einen Knoten 108, einen Knoten 110, einen Knoten 112, einen Knoten 114, einen Knoten 116, einen Knoten 118, einen Knoten 120, einen Knoten 122 und einen Knoten 124.
  • Eine Kante 126 des KG 100 beginnt am Knoten 102 und endet am Knoten 104. Eine andere Kante 128 des KG 100 beginnt am Knoten 108 und endet am Knoten 106. Eine andere Kante 130 des KG 100 beginnt am Knoten 108 und endet am Knoten 110. Eine andere Kante 132 des KG 100 beginnt am Knoten 114 und endet am Knoten 112. Eine andere Kante 134 des KG 100 beginnt am Knoten 116 und endet am Knoten 114. Eine andere Kante 136 des KG 100 beginnt am Knoten 118 und endet am Knoten 116. Eine andere Kante 138 des KG 100 beginnt am Knoten 118 und endet am Knoten 120. Eine andere Kante 140 des KG 100 beginnt am Knoten 112 und endet am Knoten 102. Eine andere Kante 142 des KG 100 beginnt am Knoten 104 und endet am Knoten 122. Eine andere Kante 144 des KG 100 beginnt am Knoten 106 und endet am Knoten 122. Eine andere Kante 146 des KG 100 beginnt am Knoten 108 und endet am Knoten 124. Eine andere Kante 148 des KG 100 beginnt am Knoten 118 und endet am Knoten 124.
  • Der KG 100 kann mehr oder weniger Knoten und/oder mehr oder weniger Kanten umfassen. In dem Beispiel stellt der KG 100 Wissen aus dem technischen Gebiet der Werkstoffkunde dar. Zur Analyse von Daten aus anderen technischen Gebieten können entsprechende KGs verwendet werden.
  • In dem Beispiel wird die Information auf die Knoten und die Kanten gemäß der folgenden Abbildung von Bezugszahlen von Knoten auf Schlüsselwörter und der folgenden Abbildung von Bezugszeichen von Kanten auf Schlüsselwörter abgebildet.
  • 102
    Zirconium dioxide (Zirconimdioxid)
    104
    Heavy metal oxide (Schwermetalloxid)
    106
    La2NiO4
    108
    Experiment 2
    110
    400w/cm^2
    112
    Zirconium oxide (Zirconiumoxid)
    114
    Stabilized zirconia (Stabilisiertes Zirconium)
    116
    YSZ
    118
    Experiment 1
    120
    700°C
    126
    subClass (UnterKlasse)
    128
    hasMaterial (hatMaterial)
    130
    hasPowerDensity (hatLeistungsdichte)
    132
    subClass (UnterKlasse)
    134
    Type (Typ)
    136
    has Electrolyte (hat Elektrolyt)
    138
    atTemperature (beiTemperatur)
    140
    subClass (UnterKlasse)
    142
    subClass (UnterKlasse)
    144
    Type (Typ)
  • Der KG 100 wird in dem Beispiel verwendet, um automatisch ein Ergebnis einer Analyse von Daten zu bestimmen, welche Schlüsselwörter enthalten. Die Erfindung ist nicht auf Schlüsselwörter beschränkt, welche für einen Menschen lesbar oder verständlich sind. Der Begriff „Schlüsselwort“ bezieht sich in diesem Zusammenhang allgemeiner auf ein beliebiges Symbol oder Muster in den Daten, welches mit einem entsprechenden KG analysiert werden kann. Ein Teilgraph 150, der ein beispielhaftes Ergebnis der Analyse darstellt, umfasst den ersten Knoten 102, den zweiten Knoten 104, den dritten Knoten 106, den sechsten Knoten 112, den siebenten Knoten 114, den achten Knoten 116, den elften Knoten 122 und die Kanten zwischen diesen Knoten. Der Teilgraph 150 in diesem Beispiel stellt die kohäsivste Antwort auf eine Anfrage dar, welche durch ein erstes Schlüsselwort „YSZ“ und ein zweites Schlüsselwort „La2NiO4“ repräsentiert wird.
  • Der KG 100 beschreibt Versuchsergebnisse von Festoxidbrennstoffzellen-Vorrichtungen und Eigenschaften zugehöriger Materialien. Jede Versuchseinheit, wie etwa Experiment 1 und Experiment 2, stellt ein Versuchssetting dar, welches festlegt, welche Materialien verwendet werden (hasMaterial), und für welche Komponenten der Vorrichtung (hasElectrolyte). Die Testbedingung (atTemperature) und das Ergebnis des Versuchs, wie etwa Leistungsdichte (hasPowerDensity), werden ebenfalls gemeldet.
  • Aspekte einer Vorrichtung 200 zur automatischen Analyse von Daten sind in 2 dargestellt.
  • Die Vorrichtung 200 umfasst einen Eingang 202, wenigstens einen Prozessor 204 und einen Ausgang 206. Der Eingang 202 stellt in dem Beispiel eine Schnittstelle für Schlüsselwörter aus den Daten bereit, welche zu analysieren sind. Der wenigstens eine Prozessor 204 ist dafür ausgelegt, den Teilgraphen 150 zu bestimmen. Der Ausgang 206 ist dafür ausgelegt, das Ergebnis der Analyse auszugeben. Das Ergebnis der Analyse wird in diesem Beispiel durch den Teilgraphen 150 dargestellt.
  • Der KG 100 kann in einem Speicher 208 in der Vorrichtung 200 gespeichert werden. Der KG 100 kann in einem Speicher gespeichert werden, welcher sich außerhalb der Vorrichtung 200 befindet. Datenverbindungen verbinden den Eingang 200 und den wenigstens einen Prozessor 204, den Ausgang 206 und den wenigstens einen Prozessor 204 und den Speicher 208 und den wenigstens einen Prozessor 204. Computerlesbare Anweisungen können in dem Speicher 208 oder einem anderen Speicher gespeichert sein. Der wenigstens eine Prozessor 204 ist in dem Beispiel dafür ausgelegt, die computerlesbaren Anweisungen auszuführen, um die Analyse der Daten gemäß dem Verfahren durchzuführen, welches nachfolgend unter Bezugnahme auf 3 beschrieben wird.
  • Das Verfahren zur automatischen Analyse von Daten wird für einen Wissensgraphen G = 〈V, E〉 beschrieben, wobei V eine Menge von n numerischen Darstellungen von Knoten v1, ..., vn ist und E ⊆ V × V eine Menge von m numerischen Darstellungen von Kanten ist, welche Beziehungen zwischen Einheiten darstellen, welche durch die Knoten dargestellt werden. In dem beispielhaften KG 100 ist n = 12 und m = 12.
  • Die Daten, welche automatisch analysiert werden, umfassen wenigstens ein Schlüsselwort. Das Verfahren wird für Daten beschrieben, welche g Schlüsselwörter k1, ..., kg umfassen.
  • Die Analyse basiert auf einer Anfrage Q = (k1, ..., kg}, welche die g Schlüsselwörter k1, ..., kg umfasst.
  • In einem Schritt 302 werden die Schlüsselwörter auf numerische Darstellungen von Knoten abgebildet. Im Beispiel werden die g Schlüsselwörter k1, ..., kg auf g numerische Darstellungen von Knoten v1, ..., vg abgebildet. Ein Schlüsselwort kann auf mehrere Knoten abgebildet werden. Gemäß einem Aspekt wird wenigstens eines der g Schlüsselwörter k1, ..., kg auf wenigstens eine numerische Darstellung von Knoten v1, ..., vg abgebildet.
  • „Numerisch“ kann sich in diesem Zusammenhang auf alphanumerische oder beliebige andere Formen oder Symbole zum Darstellen von Elementen eines KG auf eine Weise, welche von dem wenigstens einen Prozessor 204, z. B. einem Computer, verarbeitet werden kann, beziehen.
  • Es kann eine Schlüsselwortabgleichsfunktion verwendet werden, um ein Schlüsselwort auf einen beliebigen Knoten des Wissensgraphen abzubilden. Zum Beispiel wird in einem Wissensgraphen, der einen Knoten „YSZ“ und einen Knoten „4YSZ“ aufweist, das erste Schlüsselwort k1 = „YSZ“ basierend auf schriftlichen Annotationen, welche dieses Schlüsselwort umfassen, auf diese zwei Knoten abgebildet. Die Erfindung ist jedoch nicht auf irgendeine spezielle Abbildungsfunktion beschränkt.
  • In 3 sind eine eines ersten Schlüsselwortes k1 auf eine numerische Darstellung eines ersten Knotens v1 und eine eines zweiten Schlüsselwortes kg auf eine numerische Darstellung eines zweiten Knotens vg dargestellt.
  • In dem beispielhaften KG 100 umfasst die Anfrage g = 2 Schlüsselwörter, und das erste Schlüsselwort k1 = „YSZ“ wird auf die numerische Darstellung des Knotens 116 abgebildet, und das zweite Schlüsselwort k2 = „La2NiO4“ wird auf die numerische Darstellung des Knotens 106 abgebildet.
  • Gemäß einem Aspekt kann eine Funktion hits (Treffer):
    Figure DE102021202931A1_0001
    →2v verwendet werden, um eine Menge IK von Schlüsselwörtern auf eine Teilmenge der numerischen Darstellungen der Knoten des Wissensgraphen G abzubilden. Gemäß diesem Aspekt wird hits(ki) als Ki für 1 ≤ i ≤ g bezeichnet. Dabei sind Ki die numerischen Darstellungen einer Menge von Knoten, auf welche das Schlüsselwort abgebildet wird. Das Verfahren ist nicht auf diese Art und Weise des Abbildens beschränkt.
  • In einem Schritt 304 werden mehrere Wege in dem Wissensgraphen G bestimmt.
  • 3 zeigt das Bestimmen 304-1, in Abhängigkeit von der numerischen Darstellung des ersten Knotens v1, einer numerischen Darstellung eines ersten Weges p1 in dem Wissensgraphen G, der am ersten Knoten v1 beginnt und an einem dritten Knoten vc des Wissensgraphen G endet, und das Bestimmen 304-g, in Abhängigkeit von der numerischen Darstellung des zweiten Knotens vg und einer numerischen Darstellung des dritten Knotens vc, einer numerischen Darstellung eines zweiten Weges pg in dem Wissensgraphen G, der am zweiten Knoten vg beginnt und am dritten Knoten vc endet.
  • Der dritte Knoten vc ist ein gemeinsamer Knoten der beiden Wege. In dem beispielhaften KG 100 ist der dritte Knoten vc der Knoten 122.
  • Gemäß einem Aspekt umfasst der Schritt 304-1 zusätzliche Schritte, um den ersten Weg p1 iterativ zu bestimmen durch
    • - Bestimmen einer numerischen Darstellung eines ersten Kandidatenweges ptop in dem Wissensgraphen G, welcher am ersten Knoten v1 beginnt und an einem letzten Knoten ve endet, und
    • - Auswählen einer numerischen Darstellung eines zusätzlichen Knotens vi des Wissensgraphen, welcher durch eine einzige Kante mit dem letzten Knoten ve a verbunden und noch nicht Teil des ersten Kandidatenweges ptop ist, und
    • - Bestimmen der numerischen Darstellung eines zweiten Kandidatenweges p in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges ptop und in Abhängigkeit von einer numerischen Darstellung der einzigen Kante und in Abhängigkeit von der numerischen Darstellung des zusätzlichen Knotens vi. Auf diese Weise wird der erste Weg p1 vom ersten Knoten v1 aus iterativ verlängert.
  • Das Verfahren kann das Begrenzen einer Länge des ersten Kandidatenweges ptop umfassen. Gemäß einem Aspekt wird eine Länge des ersten Kandidatenweges ptop in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges bestimmt, und der zweite Kandidatenweg p wird nur bestimmt, falls die Länge kleiner als ein Schwellenwert d ist. Der Schwellenwert d ist ein Parameter, welcher gewählt werden kann, um die Länge zu begrenzen.
  • In einem Beispiel, das auf dem KG 100 basiert, umfasst der erste Kandidatenweg ptop die Knoten 116 und 114. In diesem Beispiel ist der Knoten 114 der letzte Knoten ve, der Knoten 112 ist der zusätzliche Knoten v1, und die Kante 132 ist die einzige Kante. Der zweite Kandidatenweg p umfasst in diesem Beispiel die Knoten 116 und 114 und 112.
  • Die numerische Darstellung des zweiten Weges pg kann auf ähnliche Weise bestimmt werden, beginnend am zweiten Knoten vg. Eine numerische Darstellung kann für jeden beliebigen anderen der mehreren Wege auf ähnliche Weise bestimmt werden, beginnend an einem der Knoten einer Teilmenge der Knoten, welche geeignet sind, Anfangsknoten zu sein.
  • In einem Schritt 306 umfasst das Verfahren das Bestimmen, in Abhängigkeit von der numerischen Darstellung des ersten Weges p1 und in Abhängigkeit von der numerischen Darstellung des zweiten Weges p2, einer numerischen Darstellung eines Teilgraphen T des Wissensgraphen G, der den ersten Weg p1 und den zweiten Weg p2 umfasst. Der Teilgraph ist in dem Beispiel definiert als T = V T , E T
    Figure DE102021202931A1_0002
    so dass: (1) T verbunden ist, (2) T sämtliche Abfrage-Schlüsselwörter abdeckt, d. h. VT ∩ Ki ≠ 0 für 1 ≤ i ≤ g, und (3) T für (1) und (2) minimal ist.
  • In dem beispielhaften KG 100 ist der Teilgraph T durch die Knoten 102, 104, 106, 112, 114, 116 und 122 und die Kanten 126, 132, 134, 140, 142, 144 definiert.
  • In einem Schritt 308 umfasst das Verfahren das Bestimmen von Kosten c(T) in Abhängigkeit von einer Summe v V T w t ( v )
    Figure DE102021202931A1_0003
    von Gewichten wt(v), die den Knoten v des Teilgraphen T zugewiesen sind, und in Abhängigkeit von einer Summe v i , v j V T , i < j s d ( v i , v j )
    Figure DE102021202931A1_0004
    von semantischen Abständen sd(vi, vj) zwischen Paaren von Knoten vi, vj des Teilgraphen T.
  • Das Verfahren erfordert keine spezielle Implementierung des Gewichts wt und des semantischen Abstands sd. Das Gewicht wt und die Art und Weise, wie der semantische Abstand sd bestimmt wird, können so gewählt werden, dass die Relevanz der Anfrage, die Zentralität in einer Graphstruktur, die Semantik in Annotationen usw. berücksichtigt werden. Edmund Ihler, 1991, The Complexity of Approximating the Class Steiner Tree Problem, in WG 1991, 85-96, https://doi.org/10.1007/3-540-55121-2_8, liefert ein Beispiel für das Gewicht wt. Gaurav Bhalotia, Arvind Hulgeri, Charuta Nakhe, Soumen Chakrabarti, and S.
  • Sudarshan, 2002, Keyword Searching and Browsing in Databases using BANKS, in ICDE 2002, 431-440, https://doi.org/10.1109/ICDE.2002.994756, liefert ein Beispiel für den semantischen Abstand sd. Kleine Gewichte repräsentieren Salienz, und ein kleiner semantischer Abstand repräsentiert Kohäsion. Die Berechnung des Gewichts wt und die des semantischen Abstands sd können unabhängig voneinander erfolgen. In dem Wissensgraphen werden Gewichte seinen Knoten zugewiesen. Gewichte von Knoten werden zum Beispiel im Voraus berechnet, z. B. unter Verwendung von normiertem pageRank.
  • In dem Wissensgraphen sind Kanten zum Beispiel vorausberechnete Beziehungen zwischen Knoten.
  • In dem Wissensgraphen werden semantische Abstände zum Beispiel für Paare seiner Knoten vorausberechnet.
  • Die Kosten c(T) werden zum Beispiel in Abhängigkeit von einem Produkt der Summen bestimmt, z. B. als c ( T ) = α v V T w t ( v ) + ( 1 α ) v i , v j V T , i < j s d ( v i , v j )
    Figure DE102021202931A1_0005
    wobei α ∈ [0,1] ein Parameter ist.
  • Das Verfahren umfasst einen Schritt 310 des Bestimmens, in Abhängigkeit von den Kosten c(T), ob die numerische Darstellung des Teilgraphen T oder eine numerische Darstellung eines Referenz-Teilgraphen Topt auszugeben ist.
  • Der Teilgraph T erfüllt die erste Bedingung zum Beispiel, wenn in Abhängigkeit von Referenzkosten c(Topt) für den Referenz-Teilgraphen Topt bestimmt wird, dass die erste Bedingung erfüllt ist.
  • Die erste Bedingung ist zum Beispiel erfüllt, wenn die Kosten c(T) für den Teilgraphen T kleiner als die Referenzkosten c(Topt) sind.
  • Der Referenz-Teilgraph Topt und die Referenzkosten c(Topt) sind in diesem Beispiel z. B. aus vorangegangenen Berechnungen verfügbar.
  • Falls die Kosten c(T) die erste Bedingung erfüllen, umfasst der Schritt 310 das Ausgeben der numerischen Darstellung des Teilgraphen T, und andernfalls umfasst er das Ausgeben der numerischen Darstellung des Referenz-Teilgraphen Topt.
  • Anschließend wird ein Schritt 312 ausgeführt.
  • Im Beispiel des KG 100 ist die numerische Darstellung, welche ausgegeben wird, diejenige für den Teilgraphen 150, welcher am kohäsivsten ist.
  • Im Schritt 312 wird die ausgegebene numerische Darstellung auf ein Ergebnis der Analyse ausgegeben. Das Ergebnis der Analyse kann die Schlüsselwörter umfassen, welche die Knoten und/oder Kanten des Teilgraphen Topt repräsentieren. In einem Beispiel umfasst das Ergebnis der Analyse das Schlüsselwort des gemeinsamen Knotens, d. h. des dritten Knotens vc. In dem beispielhaften KG 100 kann für die Anfrage, welche die Schlüsselwörter „YSZ“ und „La2NiO4“ umfasst, das Ergebnis der Analyse zum Beispiel nur das Schlüsselwort „Metalloxid“ umfassen, oder die folgenden Schlüsselwörter: La2NiO4, Typ, Metalloxid, YSZ, Typ, Stabilisiertes Zirconium, subClass, Zirconiumoxid, subClass, Zirconiumdioxid, subClass, Schwermetalloxid, subClass, Metalloxid.
  • Gemäß einem Aspekt kann eine Kostenschranke c(ptop) für den Kandidatenweg ptop bestimmt werden, und der erste Weg p1 und der zweite Weg p2 können unabhängig von dem Kandidatenweg ptop bestimmt werden, falls die Kostenschranke c(ptop) eine zweite Bedingung erfüllt.
  • Die Kostenschranke c(ptop) wird in dem Beispiel in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Kandidatenweges ptop zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Kandidatenweges ptop bestimmt. Die Kostenschranke c(ptop) ist eine Schätzung für die Kosten, welche für den Teilgraphen T resultieren werden, welcher den Kandidatenweg ptop enthält. Die Kostenschranke c(ptop) ist in dem Beispiel eine untere Schranke für die Kosten für den Teilgraphen T, denn wenn annimmt, dass für Gewichte oder semantische Abstände keine negativen Werte zulässig sind, weist der Teilgraph T dieselben oder mehr Kosten auf, als der Kandidatenweg ptop.
  • Eine untere Schranke für die Kosten wird in einem Beispiel für die Knoten des Kandidatenweges ptop bestimmt als c ¯ ( p t o p ) = α   c ¯ w t ( p t o p ) + ( 1 α ) c ¯ s d ( p t o p )
    Figure DE102021202931A1_0006
    Der erste Term wird gemäß einem Aspekt bestimmt als c ¯ w t ( p t o p ) = v V p t o p w t ( v ) + v V T \ V p t o p w t ( v )
    Figure DE102021202931A1_0007
    wobei die erste Summe die bekannten Knoten des Kandidatenweges ptop umfasst und die zweite Summe die unbekannten Knoten des restlichen Teilgraphen T, d. h. nach Ausschluss der bekannten Knoten, umfasst.
  • c ¯ w t ( p t o p )
    Figure DE102021202931A1_0008
    kann berechnet werden, indem ein gewichtetes Mengenüberdeckungsproblem formuliert und gelöst wird:
    Grundmenge von Elementen: Q\QK(Vptop )
    Mengen von Elementen: jedes Ø ⊂ Q' ⊆ (Q\QK (Vptop )
    unterliegt Bedingung: ∃v ∈ V, QK({v})\QK (Vptop ) = Q'
    Gewichte der Mengen: min v V : Q K ( { v } ) \ Q K ( V p t o p ) = Q ' w t ( v )  f u ¨ Q '
    Figure DE102021202931A1_0009
    wobei QK (Vptop ) = {ki ∈ Q: Vptop ∩ Ki ≠ ∅}.
  • Die untere Schranke c wt(ptop) wird in einem Beispiel geschätzt als: c ¯ w t ( p t o p ) = v V p t o p w t ( v ) + Q ' Q ' o p t min v V : Q K ( { v } ) \ Q K ( V p t o p ) = Q ' w t ( v )
    Figure DE102021202931A1_0010
    wobei Q' opt eine optimale Lösung für das gewichtete Mengenüberdeckungsproblem ist. Diese Lösung kann durch dynamische Programmierung berechnet werden.
  • Der zweite Term wird gemäß einem Aspekt bestimmt als c ¯ s d ( p t o p ) = ( 1 + | Q ' ' o p t | 1 + 2 | V p t o p | 1 2 ) v i , v j V p t o p   s . t . i < j s d ( v i , v j )
    Figure DE102021202931A1_0011
    wobei die Summe die bekannten Knoten des Kandidatenweges ptop umfasst,
    wobei Q'' opt eine optimale Lösung für ein insbesondere ungewichtetes Mengenüberdeckungsproblem ist:
    Grundmenge von Elementen: Q\QK(Vptop )
    Mengen von Elementen: jedes 0 c Q'' c (Q\QK (Vptop ))
    unterliegt Bedingung: ∃v ∈ V, QK({v})\QK (Vptop ) = Q"

    wobei |Q''opt | eine Anzahl von Mengen in Q'' opt ist und |Vptop l eine Anzahl von Knoten in ptop ist.
  • Gemäß dem Beispiel von 3 waren der Referenz-Teilgraph Topt und die Referenzkosten c(Topt) verfügbar. Alternativ dazu kann der Referenz-Teilgraph Topt verfügbar sein, und die Referenzkosten c(Topt) werden aus den Gewichten und semantischen Differenzen für die Knoten des Referenz-Teilgraphen Topt auf dieselbe Weise bestimmt, wie es für die Kosten c(T) beschrieben wurde.
  • Gemäß einem Aspekt kann das Verfahren in Schritt 304 das Ordnen der numerischen Darstellungen von Kandidatenwegen in einer Menge von Kandidatenwegen PQ nach ihrer jeweiligen Kostenschranke c(ptop) umfassen. Gemäß diesem Aspekt kann das Verfahren das Auswählen der numerischen Darstellung des Kandidatenweges aus der Menge PQ umfassen, welche eine vorbestimmte Position in der Reihenfolge hat.
  • Gemäß einem Aspekt des Verfahrens wird die numerische Darstellung, welche in Schritt 310 ausgegeben wird, gemäß den folgenden Anweisungen bestimmt:
    Figure DE102021202931A1_0012

    Figure DE102021202931A1_0013
    wobei das Verfahren PQ. insert() eine numerische Darstellung eines Knotens v oder eines Weges p zu PQ hinzufügt, und wobei das Verfahren PQ.pull() eine numerische Darstellung eines Weges p aus PQ auswählt. Der einzelne Knoten v wird für diesen Zweck auch als ein Weg p betrachtet.

Claims (15)

  1. Vorrichtung zur automatischen Analyse von Daten, welche Schlüsselwörter umfassen, wobei die Vorrichtung einen Eingang (202) umfasst, wobei der Eingang (202) dafür ausgelegt ist, Schlüsselwörter der Daten auf numerische Darstellungen wenigstens eines ersten Knotens des Wissensgraphen und eines zweiten Knotens des Wissensgraphen und eines dritten Knotens des Wissensgraphen abzubilden, wobei in dem Wissensgraphen Gewichte seinen Knoten zugewiesen sind, wobei in dem Wissensgraphen semantische Abstände Paaren seiner Knoten zugewiesen sind, wobei die Vorrichtung ferner wenigstens einen Prozessor (204) umfasst, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des ersten Knotens eine numerische Darstellung eines ersten Weges in dem Wissensgraphen zu bestimmen, der an dem ersten Knoten beginnt und an dem dritten Knoten des Wissensgraphen endet, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des zweiten Knotens und einer numerischen Darstellung des dritten Knotens eine numerische Darstellung eines zweiten Weges in dem Wissensgraphen zu bestimmen, der an dem zweiten Knoten beginnt und an dem dritten Knoten endet, wobei der wenigstens eine Prozessor (204) ferner dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des ersten Weges und in Abhängigkeit von der numerischen Darstellung des zweiten Weges eine numerische Darstellung eines Teilgraphen des Wissensgraphen zu bestimmen, der den ersten Weg und den zweiten Weg umfasst, wobei der wenigstens eine Prozessor (204) ferner dafür ausgelegt ist, Kosten in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Teilgraphen zu bestimmen, und wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von den Kosten zu bestimmen, ob die numerische Darstellung des Teilgraphen oder eine numerische Darstellung eines Referenz-Teilgraphen auszugeben ist, und wobei die Vorrichtung einen Ausgang (206) umfasst, der dafür ausgelegt ist, die ausgegebene numerische Darstellung auf ein Ergebnis der Analyse abzubilden.
  2. Vorrichtung nach Anspruch 1, wobei der wenigstens eine Prozessor (204) ferner dafür ausgelegt ist, eine numerische Darstellung eines ersten Kandidatenweges in dem Wissensgraphen zu bestimmen, welcher am ersten Knoten beginnt und an einem letzten Knoten endet, wobei der wenigstens eine Prozessor (204) ferner dafür ausgelegt ist, eine numerische Darstellung eines zusätzlichen Knotens des Wissensgraphen auszuwählen, welcher durch eine einzige Kante mit dem letzten Knoten verbunden und noch nicht Teil des ersten Kandidatenweges ist, wobei der wenigstens eine Prozessor (204) ferner dafür ausgelegt ist, die numerische Darstellung eines zweiten Kandidatenweges in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges und in Abhängigkeit von einer numerischen Darstellung der einzigen Kante und in Abhängigkeit von der numerischen Darstellung des zusätzlichen Knotens zu bestimmen.
  3. Vorrichtung nach Anspruch 2, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges eine Länge des ersten Kandidatenweges zu bestimmen und den zweiten Kandidatenweg nur zu bestimmen, falls die Länge kleiner als ein Schwellenwert ist.
  4. Vorrichtung nach einem der vorhergehenden Ansprüche, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, eine Kostenschranke für einen Kandidatenweg in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Kandidatenweges zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Kandidatenweges zu bestimmen, und wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, den ersten Weg und den zweiten Weg unabhängig von dem Kandidatenweg zu bestimmen, falls die Kostenschranke eine zweite Bedingung erfüllt.
  5. Vorrichtung nach einem der vorhergehenden Ansprüche, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, in Abhängigkeit von Referenzkosten zu bestimmen, dass die erste Bedingung erfüllt ist, wenn die Kosten für den Teilgraphen kleiner als die Referenzkosten sind, und/oder dass die zweite Bedingung erfüllt ist, wenn die Kostenschranke größer oder gleich den Referenzkosten ist.
  6. Vorrichtung nach Anspruch 5, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, die Referenzkosten in Abhängigkeit von einer numerischen Darstellung eines Referenz-Teilgraphen in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Referenz-Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Referenz-Teilgraphen zu bestimmen.
  7. Vorrichtung nach einem der vorhergehenden Ansprüche, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, numerische Darstellungen von Kandidatenwegen in einer Menge von Kandidatenwegen nach ihrer jeweiligen Kostenschranke zu ordnen, wobei der wenigstens eine Prozessor (204) dafür ausgelegt ist, aus der Menge die numerische Darstellung des Kandidatenweges auszuwählen, welche eine vorbestimmte Position in der Reihenfolge hat.
  8. Verfahren zur automatischen Analyse von Daten, welches umfasst: Abbilden (302-1), durch einen Eingang (202), eines ersten Schlüsselwortes der Daten auf eine numerische Darstellung eines ersten Knotens eines Wissensgraphen, Abbilden (302-g), durch den Eingang (202), eines zweiten Schlüsselwortes der Daten auf eine numerische Darstellung eines zweiten Knotens des Wissensgraphen (100), Abbilden, durch den Eingang (202), eines dritten Schlüsselwortes der Daten auf eine numerische Darstellung eines dritten Knotens des Wissensgraphen (100), wobei in dem Wissensgraphen Gewichte seinen Knoten zugewiesen sind, wobei in dem Wissensgraphen semantische Abstände Paaren seiner Knoten zugewiesen sind, Bestimmen (304-1), durch wenigstens einen Prozessor (204), in Abhängigkeit von der numerischen Darstellung des ersten Knotens, einer numerischen Darstellung eines ersten Weges in dem Wissensgraphen (100), der an dem ersten Knoten beginnt und an dem dritten Knoten des Wissensgraphen (100) endet, Bestimmen (304-g), durch den wenigstens einen Prozessor (204), in Abhängigkeit von der numerischen Darstellung des zweiten Knotens und einer numerischen Darstellung des dritten Knotens, einer numerischen Darstellung eines zweiten Weges in dem Wissensgraphen (100), der an dem zweiten Knoten beginnt und an dem dritten Knoten endet, Bestimmen (306), durch den wenigstens einen Prozessor (204), in Abhängigkeit von der numerischen Darstellung des ersten Weges und in Abhängigkeit von der numerischen Darstellung des zweiten Weges, einer numerischen Darstellung eines Teilgraphen des Wissensgraphen, der den ersten Weg und den zweiten Weg umfasst, Bestimmen (308), durch den wenigstens einen Prozessor (204), von Kosten in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Teilgraphen, Bestimmen (310), durch den wenigstens einen Prozessor (204), in Abhängigkeit von den Kosten, ob die numerische Darstellung des Teilgraphen oder eine numerische Darstellung eines Referenz-Teilgraphen auszugeben ist, und Abbilden (312), durch einen Ausgang (206), der ausgegebenen numerischen Darstellung auf ein Ergebnis der Analyse.
  9. Verfahren nach Anspruch 8, wobei das Verfahren ferner umfasst: Bestimmen (304-1), durch den wenigstens einen Prozessor (204), einer numerischen Darstellung eines ersten Kandidatenweges in dem Wissensgraphen, welcher am ersten Knoten beginnt und an einem letzten Knoten endet, Auswählen, durch den wenigstens einen Prozessor (204), einer numerischen Darstellung eines zusätzlichen Knotens des Wissensgraphen, welcher durch eine einzige Kante mit dem letzten Knoten verbunden und noch nicht Teil des ersten Kandidatenweges ist, Bestimmen, durch den wenigstens einen Prozessor (204), der numerischen Darstellung eines zweiten Kandidatenweges in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges und in Abhängigkeit von einer numerischen Darstellung der einzigen Kante und in Abhängigkeit von der numerischen Darstellung des zusätzlichen Knotens.
  10. Verfahren nach Anspruch 9, wobei das Verfahren ferner umfasst: Bestimmen (304-1), durch den wenigstens einen Prozessor (204), in Abhängigkeit von der numerischen Darstellung des ersten Kandidatenweges, einer Länge des ersten Kandidatenweges, und Bestimmen des zweiten Kandidatenweges nur dann, falls die Länge kleiner als ein Schwellenwert ist.
  11. Verfahren nach einem der Ansprüche 8 bis 10, wobei das Verfahren ferner umfasst: Bestimmen (304-1), durch den wenigstens einen Prozessor (204), einer Kostenschranke für einen Kandidatenweg in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Kandidatenweges zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Kandidatenweges, und Bestimmen, durch den wenigstens einen Prozessor (204), des ersten Weges und des zweiten Weges unabhängig von dem Kandidatenweg, falls die Kostenschranke eine zweite Bedingung erfüllt.
  12. Verfahren nach einem der Ansprüche 8 bis 11, wobei das Verfahren ferner umfasst: Bestimmen (310), durch den wenigstens einen Prozessor (204), in Abhängigkeit von Referenzkosten, dass die erste Bedingung erfüllt ist, wenn die Kosten für den Teilgraphen kleiner als die Referenzkosten sind, und/oder dass die zweite Bedingung erfüllt ist, wenn die Kostenschranke größer oder gleich den Referenzkosten ist.
  13. Verfahren nach Anspruch 12, wobei das Verfahren ferner umfasst: Bestimmen, durch den wenigstens einen Prozessor (204), der Referenzkosten in Abhängigkeit von einer numerischen Darstellung eines Referenz-Teilgraphen in Abhängigkeit von einer Summe von Gewichten, die den Knoten des Referenz-Teilgraphen zugewiesen sind, und in Abhängigkeit von einer Summe von semantischen Abständen zwischen Paaren von Knoten des Referenz-Teilgraphen.
  14. Verfahren nach einem der Ansprüche 8 bis 13, wobei das Verfahren ferner umfasst: Ordnen (304), durch den wenigstens einen Prozessor (204), numerischer Darstellungen von Kandidatenwegen in einer Menge von Kandidatenwegen nach ihrer jeweiligen Kostenschranke, und Auswählen, durch den wenigstens einen Prozessor (204), der numerischen Darstellung des Kandidatenweges aus der Menge, welche eine vorbestimmte Position in der Reihenfolge hat.
  15. Computerprogramm zur automatischen Analyse von Schlüsselwörtern, welches computerlesbare Anweisungen umfasst, die, wenn sie von einem Computer ausgeführt werden, bewirken, dass der Computer das Verfahren nach einem der Ansprüche 8 bis 14 ausführt.
DE102021202931.0A 2021-03-25 2021-03-25 Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse vonDaten Pending DE102021202931A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102021202931.0A DE102021202931A1 (de) 2021-03-25 2021-03-25 Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse vonDaten
CN202210295171.6A CN115129881A (zh) 2021-03-25 2022-03-24 用于数据的自动分析的装置、方法和计算机程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021202931.0A DE102021202931A1 (de) 2021-03-25 2021-03-25 Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse vonDaten

Publications (1)

Publication Number Publication Date
DE102021202931A1 true DE102021202931A1 (de) 2022-09-29

Family

ID=83192488

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021202931.0A Pending DE102021202931A1 (de) 2021-03-25 2021-03-25 Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse vonDaten

Country Status (2)

Country Link
CN (1) CN115129881A (de)
DE (1) DE102021202931A1 (de)

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHI, Yuxuan, et al. Keyword-based knowledge graph exploration based on quadratic group Steiner trees. IJCAI 2021, Montreal, 19-27 August 2021, Pages 1555-1562. - DOI: 10.24963/ijcai.2021/215
SHI, Yuxuan; CHENG, Gong; KHARLAMOV, Evgeny. Keyword search over knowledge graphs via static and dynamic hub labelings. In: Proceedings of The Web Conference 2020. S. 235-245. - DOI: 10.1145/3366423.3380110
WANG, Yanhao, et al. A survey of typical attributed graph queries. World Wide Web, 2021, 24. Jg., Nr. 1, S. 297-346. – DOI: 10.1007/s11280-020-00849-0, [Online 20.11.2020]

Also Published As

Publication number Publication date
CN115129881A (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
DE102012224488A1 (de) System, Verfahren und Programm zur Entnahme eines themenfremden Teils aus einem Gespräch
DE102019004300A1 (de) Verwendung eines dynamischen speichernetzwerks zum verfolgen digitaler dialogzustände und erzeugen von antworten
DE102018005611A1 (de) Automatische Paarbildung von Fonts unter Verwendung des asymmetrischen Metriklernens
DE112007000051T5 (de) Dreiteiliges-Modell-basiertes Verfahren zur Informationsgewinnung und -verarbeitung
DE102012204167A1 (de) Vorauslaufende genäherte Berechnungen
DE10131193A1 (de) Sitzungshistorien-basierte altersgerichtete natürlichsprachliche Dokumentensuche
DE112017007361T5 (de) Unterstützen von interaktivem textmining-prozess mit dialog in natürlicher sprache
DE102022201753A1 (de) Erweiterung Graph- basierter Kennzeichnungsregeln für schwach überwachtesTraining von auf maschinellem Lernen basierender Eigennamenerkennung
DE102013224331A1 (de) System und Verfahren zur Bereitstellung prädiktiver Anfragen
DE112020007405T5 (de) Verfahren zum Auffinden einer Gemeinschaft basierend auf einem unsicheren Graphen
DE10034694A1 (de) Verfahren zum Vergleichen von Suchprofilen
DE602004003609T2 (de) Lösung der Segmentierungsmehrdeutigkeit bei der Grammatikerstellung
DE102021124445A1 (de) Metamerkmal-trainingsmodelle für maschinenlernalgorithmen
DE112012006749T5 (de) Suchmethode
DE19849855C1 (de) Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem
DE102018007024A1 (de) Dokumentdurchsuchen mittels grammatischer einheiten
EP1008067A1 (de) Verfahren und system zur rechnergestützten ermittlung einer relevanz eines elektronischen dokuments für ein vorgebbares suchprofil
DE102021202931A1 (de) Vorrichtung, Verfahren und Computerprogramm zur automatischen Analyse vonDaten
EP3812949A1 (de) Konfigurierbarer digitaler zwilling
DE102019207061A1 (de) Verfahren zur Validierung von Systemparametern eines Energiesystems, Verfahren zum Betrieb eines Energiesystems sowie Energiemanagementsystem für ein Energiesystem
DE102021203300A1 (de) Computerimplementiertes Verfahren für Schlüsselwortsuche in einem Wissensgraphen
LU102312B1 (de) Eine ähnlichkeitsanalysemethode des negativen sequenzmusters basierend auf der biologischen sequenz, ein realisierungssystem und ein medium
EP3942372B1 (de) Verfahren zur validierung von systemparametern eines energiesystems, verfahren zum betrieb eines energiesystems sowie energiemanagementsystem für ein energiesystem
DE112018006331B4 (de) Testfallgenerierungsvorrichtung, Testfallgenerierungsverfahren und Testfallgenerierungsprogramm
DE102007044380A1 (de) Verfahren zum rechnergestützten Lernen eines probabilistischen Netzes

Legal Events

Date Code Title Description
R163 Identified publications notified