DE10318333A1 - Datenverarbeitungssystem - Google Patents

Datenverarbeitungssystem Download PDF

Info

Publication number
DE10318333A1
DE10318333A1 DE10318333A DE10318333A DE10318333A1 DE 10318333 A1 DE10318333 A1 DE 10318333A1 DE 10318333 A DE10318333 A DE 10318333A DE 10318333 A DE10318333 A DE 10318333A DE 10318333 A1 DE10318333 A1 DE 10318333A1
Authority
DE
Germany
Prior art keywords
processing system
data
data processing
input
class structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE10318333A
Other languages
English (en)
Inventor
Jürgen Prof. Dr. Angele
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ontoprise GmbH
Original Assignee
ontoprise GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ontoprise GmbH filed Critical ontoprise GmbH
Priority to DE10318333A priority Critical patent/DE10318333A1/de
Priority to PCT/EP2004/004136 priority patent/WO2004095313A1/de
Publication of DE10318333A1 publication Critical patent/DE10318333A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Die Erfindung betrifft ein Datenverarbeitungssystem (1) mit wenigstens einer Informationserzeugungseinheit zur Generierung oder Speicherung von einen Datenbestand bildenden Daten, mit wenigstens einer Rechnereinheit (4) zur Generierung eines Objektmodells, bestehend aus einer Klassenstruktur von Klassen, wobei die Daten mittels des Objektmodells strukturierbar sind, mit Mitteln zur Datenabfrage und mit einer Inferenzeinheit, in welcher zur Umsetzung von Datenabfragen mittels Regeln Elemente der Klassenstruktur und/oder Daten verknüpft werden. Als Ein-/Ausgabeeinheit ist ein Dialogsystem (6) vorgesehen, über welches natürlichsprachliche Satzsequenzen im Rahmen vorgegebener Komplexität als Eingabegrößen eingebbar sind, aus welchen die Datenabfragen selbsttätig abgeleitet werden.

Description

  • Die Erfindung betrifft ein Datenverarbeitungssystem gemäß dem Oberbegriff des Anspruchs 1.
  • Ein derartiges Datenverarbeitungssystem ist aus der DE 101 03 845 A1 bekannt. Dieses Datenverarbeitungssystem umfasst ein Rechnersystem mit Mitteln zur Speicherung von Daten und eine Abfrageeinheit zur Ermittlung von Ausgangsgrößen unter Zugriff auf die abgespeicherten Daten. Die Daten sind vorgegebenen Klassen zugeordnet, die Bestandteil wenigstens einer abgespeicherten, ein Objektmodell bildenden Klassenstruktur sind. Den Klassen sind Attribute zugeordnet, die innerhalb einer Klassenstruktur weitervererbt sind. Als Abfrageeinheit ist wenigstens eine Inferenzeinheit vorgesehen, mittels derer Regeln auswertbar sind, durch welche vorgegebene Klassen und/oder Attribute verknüpft sind.
  • Über die Abfrageeinheit können als Eingabegrößen Abfragebegriffe eingegeben werden, welche nicht nur von den abgespeicherten Daten gebildet sind, sondern auch von den Klassen oder Attributen der Klassenstruktur gebildet sein können.
  • Damit werden die Abfragemöglichkeiten gegenüber herkömmlichen Datenbanksystemen erheblich erweitert.
  • Nachteilig hierbei ist jedoch, dass dem Benutzer die abfragbaren Elemente der Klassenstruktur bekannt sein müssen, so dass dieser derartige Elemente über vorgegebene Eingabeformate eingeben kann, um eine Recherche in einem Datenbestand des Datenverarbeitungssystems durchführen zu können.
  • Der Erfindung liegt die Aufgabe zugrunde ein Datenverarbeitungssystem der eingangs genannten An bereitzustellen, mit welchem auf möglichst einfache Weise und umfassend Recherchen in Datenbeständen durchführbar sind.
  • Zur Lösung dieser Aufgabe sind die Merkmale des Anspruchs 1 vorgesehen. Vorteilhafte Ausführungsformen und zweckmäßige Weiterbildungen der Erfindung sind in den Unteransprüchen beschrieben.
  • Das erfindungsgemäße Datenverarbeitungssystem umfasst eine Informationserzeugungseinheit zur Speicherung oder Generierung von einen Datenbestand bildenden Daten, eine Rechnereinheit zur Generierung eines Objektmodells, bestehend aus einer Klassenstruktur von Klassen, wobei die Daten mittels des Objektmodells strukturierbar sind, Mittel zur Datenabfrage und eine Inferenzeinheit, in welcher zur Umsetzung von Datenabfragen mittels Regeln Elemente der Klassenstruktur und/oder Daten verknüpft werden. Als Ein-/Ausgabeeinheit ist ein Dialogsystem vorgesehen, über welches natürlichsprachliche Satzsequenzen im Rahmen vorgegebener Komplexität als Eingabegrößen eingebbar sind, aus welchen die Datenabfragen selbsttätig abgeleitet werden.
  • Die Informationserzeugungseinheit ist insbesondere von einer Speichereinheit zur Speicherung von Daten gebildet. Generell kann diese auch von Informationen generierenden Systemen wie zum Beispiel Sensoren gebildet sein. Die Mittel zur Datenabfrage können insbesondere von einer Suchmaschine gebildet sein, in welcher Suchausdrücke generiert werden.
  • Ein wesentlicher Vorteil des erfindungsgemäßen Datenverarbeitungssystems besteht darin, dass zur Durchführung von Recherchen in einem Datenbestand über das Dialogsystem natürlichsprachige Satzsequenzen eingegeben werden können. Ein Bediener des Datenverarbeitungssystems kann somit ohne Einhaltung vorgegebener Eingabeformate und ohne Kenntnis von Programmiersprachen mit frei formulierten Eingabegrößen Recherchen in dem Datenbestand durchführen.
  • Aus den als Eingabegrößen in das Dialogsystem eingegebenen Satzbegriffen werden in dem Dialogsystem selbsttätig Datenabfragen, insbesondere Suchausdrücke zur Durchführung von Abfragen in dem Datenbestand abgeleitet.
  • Wesentlich hierbei ist, dass dem Datenbestand ein Objektmodell mit einer Klassenstruktur, das heißt eine Ontologie zugeordnet ist. Mit der Klassenstruktur wird der Datenbestand in vorgegebener Weise strukturiert, wobei die Elemente der Klassenstruktur neben den Daten des Datenbestands selbst Suchbegriffe als Bestandteil von Datenabfragen, insbesondere Suchausdrücken bilden können.
  • Die Klassenstruktur ist dabei vorzugsweise derart ausgebildet, dass den einzelnen Elementen der Klassen Attribute und/oder Synonyme zugeordnet sind. Dadurch werden die Recherchemöglichkeiten erheblich erweitert.
  • Weiterhin können auch den Daten des Datenbestandes selbst Synonyme zugeordnet werden.
  • Wird beispielsweise zur Bildung eines Suchausdrucks ein bestimmter Begriff aus einer eine Eingabegröße bildenden Satzsequenz im Dialogsystem extrahiert, so wird dieser Begriff zunächst nicht nur mit den Daten oder den Elementen der Klassen, sondern auch mit den zugeordneten Synonymen verglichen, um diesen der Klassenstruktur zuzuordnen.
  • Damit wird erreicht, dass auch durch Eingabe von unscharfen Begriffen mit den Eingabegrößen dennoch Recherchen mit hoher Erfolgsquote durchgeführt werden.
  • Weiterhin können in den die Eingabegrößen bildenden Satzbegriffen Begriffe oder Relationen enthalten sein, die unscharfe Beziehungen wie zum Beispiel „kostengünstig", „wenig weit entfernt von" enthalten. Derartige Begriffe oder Relationen werden über Regeln, die zur Generierung von Suchausdrücken die nen, abgearbeitet und so in exakt definierte Beziehungen umgesetzt, anhand derer die Daten des Datenbestandes recherchiert werden.
  • Auch in diesem Fall können anhand vom Benutzer in den Eingabegrößen unscharf formulierter Begriffe und Beziehungen reproduzierbare Recherchenergebnisse erhalten werden. Bei den genannten Beispielen kann der eingegebene Begriff „kostengünstig" typischerweise in eine Regel „Preis kleiner als X" und die eingegebene Beziehung „wenig weit entfernt" in eine Regel „Distanz kleiner als Y" umgesetzt werden, wobei X und Y vorgegebene Größen sind.
  • Dabei ist insbesondere vorteilhaft, dass der Benutzer keinerlei Kenntnisse über die Funktion oder den Aufbau der Regeln haben muss, um die Recherchen durchzuführen.
  • Ein weiterer wesentlicher Vorteil des erfindungsgemäßen Datenverarbeitungssystems besteht darin, dass zur Vorgabe und Erweiterung von recherchierbaren Begriffen, die als Eingabegrößen vom Benutzer eingebbar sind, die Klassenstruktur mit den Attributen, Synonymstrukturen und Regeln applikationsspezifisch geändert und bei Bedarf erweitert werden kann, ohne dass hierbei Änderungen in dem zu recherchierenden Datenbestand vorgenommen werden müssen. Auf diese Weise wird die Benutzerfreundlichkeit des Datenverarbeitungssystems erheblich erweitert.
  • Weiterhin ist vorteilhaft, dass der Benutzer eine Folge von Eingabegrößen zur Durchführung einer Recherche eingeben kann, wobei die Historie dieser Folge in dem Datenverarbeitungssystem mit verfolgt und erfasst wird. Dadurch kann sich der Benutzer schrittweise in einem interaktiven Dialog über das Dialogsystem dem gewünschten Recherchenergebnis nähern.
  • Eine Beschränkung in der Form der Eingabegrößen ist lediglich dahingehend gegeben, dass die Satzsequenzen nur im Rahmen einer vorgegebenen Komplexität erfolgen können. Hierzu ist vorzugsweise im Dialogsystem eine Menge von zulässigen Satztypen abgespeichert, welche den Rahmen der zulässigen Eingabemöglichkeiten definiert.
  • Bei Eingabe einer unzulässigen Eingabegröße wird über das Dialogsystem eine Fehlermeldung ausgegeben, so dass der Benutzer die Eingabegröße ändern kann. Vorzugsweise wird mit der Fehlermeldung bereits ein Hinweis auf die Art des Fehlers ausgegeben, welche dem Benutzer einen Hinweis darauf gibt, in welcher Weise er die Eingabegröße abzuändern hat.
  • Ein weiterer Vorteil des erfindungsgemäßen Datenverarbeitungssystems besteht darin, dass die Implementierung des Objektmodells sowie des Dialogsystems unabhängig von der Speichereinheit ist, auf welcher der Datenbestand gespeichert ist. Damit können unterschiedlichste Informationsquellen wie Datenbanken an verschiedenen Standorten und insbesondere Informationen aus dem Internet als Datenbestand für das erfindungsgemäße Datenverarbeitungssystem genutzt werden.
  • Das erfindungsgemäße Datenverarbeitungssystem kann somit in den unterschiedlichsten Applikationen eingesetzt werden. Beispielsweise kann der Datenbestand von den Daten eines Unternehmens, insbesondere derer Produkte, Neuentwicklungen und Marketingdaten gebildet sein. Insbesondere kann der Datenbestand auch von Daten mehrerer Unternehmen gebildet sein.
  • Die Erfindung wird im Nachstehenden anhand der Zeichnungen erläutert. Es zeigen:
  • 1 Schematische Darstellung eines Ausführungsbeispiels des erfindungsgemäßen Datenverarbeitungssystems.
  • 2 Beispiel einer Klassenstruktur für das Datenverarbeitungssystem gemäß 1.
  • 1 zeigt ein Ausführungsbeispiel des erfindungsgemäßen Datenverarbeitungssystems 1. Das Datenverarbeitungssystem 1 weist im vorliegenden Fall als Informationserzeugungseinheiten zwei Speichereinheiten 2, 2' auf, auf welchen ein Datenbestand gespeichert ist. Weiterhin können als Informationserzeugungseinheiten Sensordaten liefernde Sensoren oder sonstige Daten liefernde Einheiten vorgesehen sein. Die Anzahl der Speichereinheiten 2, auf welchen der Datenbestand gespeichert ist, ist beliebig wählbar. Die Speichereinheiten 2 können von Datenbanksystemen, Filesystemen und dergleichen gebildet sein.
  • Im vorliegenden Fall besteht die erste Speichereinheit 2 aus einem Datenbanksystem eines Reisebüros, auf welchem als Datenbestand Daten über Reisen, insbesondere Flugreisen, gespeichert sind. Die zweite Speichereinheit 2' ist von dem Internet beziehungsweise von über das Internet zugänglichen Datenbanken gebildet, auf welchen weitere Daten des Datenbestands gespeichert sind.
  • Den Speichereinheiten 2, 2' ist ein Server 3 zugeordnet, über welchen ein Zugriff auf die in den Speichereinheiten 2, 2' gespeicherten Daten erfolgt.
  • Diesem Server 3 ist eine Rechnereinheit 4 zugeordnet. Die Rechnereinheit 4 weist ein Prozessorsystem auf, auf welchem ein erstes Software-Modul 5 implementiert ist, mittels dessen ein eine Ontologie bildendes Objektmodell generierbar ist. Weiterhin weist die Rechnereinheit 4 ein weiteres Software-Modul 5' auf, welches eine Suchmaschine zur Durchführung von Recherchen bildet. Die Suchmaschine bildet ein Mittel zur Datenabfrage.
  • Schließlich weist die Rechnereinheit 4 ein Dialogsystem 6 auf, welches die Funktion einer Ein-/Ausgabeeinheit aufweist. Hierzu weist das Dialogsystem 6 vorzugsweise ein nicht gesondert dargestelltes Terminal auf, über welches Daten ein- und ausgebbar sind. Weiterhin weist das Dialogsystem 6 ein eigenes Prozessorsystem auf. Alternativ kann das Dialogsystem 6 das Prozessorsystem der Rechnereinheit 4 nutzen. Generell kann damit das Dialogsystem 6 Bestandteil der Rechnereinheit 4 sein oder eine separate Einheit bilden.
  • Mittels des auf der Rechnereinheit 4 installierten Objektmodells erfolgt eine Strukturierung der Daten des Datenbestands. Wesentlich hierbei ist, dass die Strukturierung der Daten allein durch Vorgabe des Objektmodells erfolgt, so dass damit keine Eingriffe in die Strukturen des Datenbestands auf den Speichereinheiten 2, 2' notwendig sind.
  • Die in der ersten Speichereinheit 2 gespeicherten Daten sind von Reisedaten gebildet. Beispielsweise ist ein Datensatz für eine Flugreise durch Angabe des Start- und Zielflughafens, die Reisezeit sowie die Angabe des Preises definiert. Zudem können Angaben über ein eventuell mit der Flugreise gebuchtes Hotel enthalten sein.
  • Zur Strukturierung dieser Daten wird als Objektmodell ein geographisches Modell generiert, welches exemplarisch in 2 aufgeführt ist.
  • Das Objektmodell gemäß 2 weist eine hierarchische Klassenstruktur zur Bildung des geographischen Modells auf. Die hierarchische Struktur besteht aus Klassen und Unterklassen. Dabei ist der Klasse „Kontinente" die Klasse „Staaten" untergeordnet. Die Klasse „Regionen" ist der Klasse „Staaten" untergeordnet. Der Klasse „Regionen" ist die Klasse „Städte" untergeordnet.
  • Die Daten des in der ersten Speichereinheit 2 abgespeicherten Datenbestands werden dieser Klassenstruktur als sogenannte Instanzen zugeordnet.
  • Beispielsweise werden Reiseziele als Bestandteile des Datenbestandes dieser Klassenstruktur zugeordnet. Beispielsweise wird Las Palmas als Instanz der Klasse „Stadt" zugeordnet. Entsprechend der Klassenstruktur wird diese Instanz zudem der Region „Kanarische Inseln" als Instanz der übergeordneten Klasse „Regionen" zugeordnet. Weiterhin erfolgt die Zuordnung zur Klasse „Staat", in dem definiert wird, dass Las Palmas in Spanien als Instanz der Klasse „Staat" liegt. Schließlich erfolgt die Zuordnung, dass Spanien in Europa als Instanz der Klasse „Kontinent" liegt.
  • Das geographische Modell gemäß 2 beinhaltet als weitere Komponenten „Meere" und „Gebirge" als Landschaftsformen, die jeweils separate Klassen bilden können.
  • Den Klassen der Klassenstruktur können weiterhin Attribute zugeordnet werden, die innerhalb einer Klassenstruktur weitervererbt werden. Mit derartigen Attributen können bestimmten Klassen bestimmte Eigenschaften und Merkmale zugewiesen werden.
  • Als Spezialfall derartiger Attribute können Synonyme definiert werden. Die auf der Attributebene als sogenannte Meta-Attribute definierten Synonyme beziehen sich dabei auf eine gesamte Klasse und nicht nur auf einzelne, den Klassen zugeordneten Daten. Beispielsweise kann der Klasse „Staat" als Synonym das Meta-Attribut „Land" zugeordnet werden. Weiterhin kann der Klasse „Meere" als Synonym das Meta-Attribut „Ozeane" zugeordnet werden.
  • Weiterhin können Synonyme auch auf der Ebene von Instanzen, das heißt Daten definiert werden. Beispielsweise kann der Instanz „Kanarische Inseln", welches zur Klasse „Regionen" gehört, das Synonym „Kanaren" zugeordnet werden.
  • Als weitere Elemente des geographischen Modells sind in 2 „Klimaprofile" und „Längen- und Breitengrade" enthalten, die vorzugsweise als Attribute der Klasse „Städte" zugeordnet sind.
  • Die diesen Attributen zugeordneten Daten sind im vorliegenden Fall in der zweiten Speichereinheit 2' gespeichert. Vorzugsweise sind diese Daten über das Internet abrufbar.
  • Die auf diese Weise definierte Klassenstruktur ist nicht fest vorgegeben, sondern kann bei Bedarf erweitert und ergänzt oder sogar durch eine neue Klassenstruktur ersetzt werden. Da die Klassenstruktur über ein Software-Modul 5 definiert ist, kann die Klassenstruktur zur Strukturierung der gespeicherten Daten durch geeignete Programmierung auf einfache Weise geändert werden.
  • Die Durchführung von Datenrecherchen erfolgt anhand der beschriebenen Klassenstruktur mittels der Suchmaschine. Mittels der Suchmaschine werden Suchausdrücke generiert. Dabei werden zur Bildung der Suchausdrücke frei programmierbare Regeln verwendet, zu deren Auswertung die Suchmaschine eine Inferenzeinheit aufweist.
  • Jeder Suchausdruck wird durch eine vorgegebene Zahl von Regeln beschrieben, welche ein deklaratives System bilden. Dies bedeutet, dass die Regeln in der Inferenzeinheit unabhängig von deren Reihenfolge abarbeitbar sind.
  • Die einzelnen Regeln und damit auch die Suchausdrücke können auf einfache Weise bei Bedarf umprogrammiert und so geändert werden.
  • In der die Daten enthaltenden Speichereinheit 2, insbesondere dem jeweiligen Datenbanksystem ist durch einen Indizierer, beispielsweise einen Microsoft-Index-Server ein Index definiert, welcher angibt, welche Worte in den einzelnen Datenbeständen enthalten sind. Weiterhin können mit dem Indizierer selbsttätig Recherchen durchgeführt werden, bei welchen ermittelt wird, ob bestimmte Worte in Schriftstücken des Datenbestands enthalten sind. Damit können mittels des Indizierers die in der Suchmaschine generierten Suchausdrücke selbsttätig abgearbeitet werden. Hierbei wird mittels des Indizierers abgeprüft, in welchen Schriftstücken die Suchbegriffe des jeweiligen Suchausdruckes enthalten sind.
  • Die Suchausdrücke werden selbsttätig aus Eingabegrößen generiert, die über das Dialogsystem 6 in Form von natürlichsprachlichen Satzsequenzen eingegeben werden.
  • Die Satzsequenzen können unabhängig von bestimmten Eingabeformaten oder Programmiersprachen als in einem vorgegebenen Rahmen frei wählbarer Text in das Dialogsystem 6 eingegeben werden.
  • Hierzu ist in dem Dialogsystem 6 eine Menge von zulässigen Satztypen abgespeichert, mit welchem die Eingabegröße verglichen wird. Wird als Ergebnis des Vergleichs eine Eingabegröße als unzulässig erkannt, so wird dies dem Benutzer mittels einer Fehlermeldung angezeigt.
  • Bei Vorliegen einer gültigen Eingabegröße werden aus der entsprechenden Satzsequenz Suchbegriffe für die Suchausdrücke extrahiert und diese Regeln zugeordnet, welche den jeweiligen Suchausdruck bilden.
  • Mittels des Suchausdrucks sind dabei nicht nur die Daten des Datenbestands, sondern insbesondere auch die Elemente der Klassenstruktur abfragbar.
  • Insbesondere durch die Einbeziehung von Synonymstrukturen in die Recherche können somit auch unscharfe und ungenaue Angaben in den Eingabegrößen für die Recherche sinnvoll verwendet werden.
  • Mit den Regeln der Suchanfrage können insbesondere auch unscharfe Relationen in den Eingabegrößen sinnvoll verarbeitet werden.
  • Durch die auf diese Weise aus den Eingabegrößen abgeleiteten Suchanfragen kann der Benutzer auch mit allgemein und unscharf formulierten Anfragen Recherchen durchführen, um beispielsweise eine Reise zu buchen. Vorteilhaft hierbei ist, dass er nicht wie bei bekannten Datenbanksystemen ein bestimmtes Reiseziel exakt angeben muss sondern die Recherche unabhängig von den Datenformaten der im Reisebüro gespeicherten Daten durchführen kann.
  • Als Ergebnis auf eine Suchanfrage wird als Ausgabegröße vorzugsweise eine Teilmenge des Datenbestandes über das Dialogsystem 6 ausgegeben.
  • Dabei kann bei einer durchzuführenden Recherche von dem Benutzer eine Folge mehrerer Eingabegrößen in das Dialogsystem 6 eingegeben werden, wobei vorzugsweise auf jede Eingabegröße die Ausgabe einer entsprechenden Ausgabegröße erfolgt. In dem Dialogsystem 6 wird die Historie der Benutzereingaben dadurch erfasst, dass die Eingabegrößen der Folge mit UND-Verknüpfungen verknüpft werden. Auf diese Weise ist gewährleistet, dass während der Recherche ermittelte Informationen nicht verloren gehen.
  • Die Funktionsweise des Datenverarbeitungssystems 1 gemäß den 1 und 2 wird im Folgenden anhand von Beispielen erläutert.
  • Als erstes Beispiel wird als Eingabegröße von einem Benutzer folgende Satzsequenz eingegeben: „Ich möchte am 29.03. für eine Woche ans Meer fliegen".
  • In der Klassenstruktur gemäß 2 ist das Wissen über regionale Zusammenhänge beispielsweise durch Verknüpfung der Klassen „Staaten", „Regionen" und „Städte" einerseits sowie der Klasse „Meere" andererseits über Regeln definiert, so dass als Ausgabegröße auf die Eingabegröße als Elemente der Klasse „Staaten" eine Auswahl von Staaten angezeigt wird, die am Meer liegen.
  • Zweckmäßigerweise werden zudem über das Internet die aktuellen Temperaturwerte in den einzelnen Städten abgefragt, da die Eingabegröße impliziert, dass der Benutzer einen Badeurlaub buchen möchte. Dies setzt voraus, dass die Temperaturen in den Zielorten hinreichend hoch sind. Mit dieser Abfrage wer den Informationen von Sensoren, nämlich Temperaturwerte, abgefragt, wobei die Sensoren weitere Informationserzeugungseinheiten bilden.
  • Bei der Generierung der Ausgangsgrößen erfolgt ein Abgleich mit den im Datenbanksystem des Reisebüros vorliegenden Daten, insbesondere den aktuell verfügbaren Flug- und Reiseverbindungen. Damit werden mit den angegebenen Staaten als Ausgangsgrößen auch die verfügbaren Reiseverbindungen angezeigt.
  • Gibt darauf der Benutzer als weitere Eingabegröße ein: „Ich möchte aber nicht so weit weg", so wird dies zur Generierung einer Suchanfrage auf Regeln abgebildet, welche den unscharfen Begriff „nicht so weit" quantifizieren.
  • Dies kann beispielsweise dadurch erfolgen, dass in dem Datenbestand der ersten Speichereinheit 2 nach Flugreisen in die zuvor ausgewählten Staaten recherchiert wird, bei welchen die Flugzeit unterhalb eines vorgegebenen Grenzwerts liegt.
  • Alternativ können die Attribute „Längen- und Breitengrade" für Städte in den zuvor ausgewählten Ländern zur Bestimmung der Distanz von bestimmten Städten als Reiseziele in diesen Staaten bestimmt werden.
  • Dann wird dem Benutzer als Ausgabegröße eine Auswahl von Reisezielen in die zuvor ausgewählten Staaten angezeigt, deren Distanz unterhalb eines vorgegebenen Grenzwertes liegt.
  • Gibt daraufhin der Benutzer als weitere Eingabegröße ein: „Ich möchte doch weiter weg", so werden die Ergebnisse der vorigen Anfrage verwendet und auf der Basis der Ergebnisse der ersten Anfrage des Benutzers weiter entfernte Reiseziele als Ausgabegröße ausgegeben.
  • Gibt der Benutzer schließlich als weitere Eingabegröße ein: „Ich möchte auf die Kanaren", so wird anhand der im geographischen Modell definierten Synonymstrukturen erkannt, dass als Reiseziel die Region Kanarische Inseln gewünscht wird.
  • Anhand der daraufhin ausgegebenen Reiseziele auf den Kanarischen Inseln kann der Benutzer die gewünschte Buchung vornehmen, wobei je nach Ausbildung des Dialogsystems 6 dem Benutzer als Alternative eine Buchung einer Flugreise mit oder ohne Hotelbuchung angeboten werden kann.
  • Als zweites Beispiel wird von einem Benutzer als Eingabegröße formuliert: „Ich möchte im Urlaub klettern und baden".
  • Durch geeignete Synonymstrukturen erfolgt eine Zuordnung des Begriffs „Klettern" zu der Klasse „Gebirge" und eine Zuordnung des Begriffs „Baden" zu der Klasse „Meere".
  • Die aus der eingegebenen Satzsequenz abgeleitete Suchanfrage prüft, in welchen Regionen sowohl Meeresküsten als auch Gebirge vorhanden sind.
  • Als Ausgabegröße wird dem Benutzer eine geeignete Urlaubsregion angezeigt, beispielsweise Korsika.
  • Gibt der Benutzer als weitere Eingabegröße ein: „Gibt es etwas Ähnliches?", so wird anhand des hinterlegten geographischen Modells nach vergleichbaren Regionen recherchiert.
  • Ist beispielsweise die Klassenstruktur gemäß 2 dahingehend erweitert, dass neben der Klasse „Meere" auch die Klasse „Seen" vorgesehen ist, so kann über Regeln eine Ähnlichkeitsbeziehung zwischen den Klassen „Meere" und „Seen" definiert werden.
  • Dann kann als Ausgabegröße auf die zweite Anfrage dem Benutzer beispielsweise die Region des Gardasees als zu Korsika ähnliche Reiseregion angezeigt werden.
  • 1
    Datenverarbeitungssystem
    2
    Speichereinheit
    2'
    Speichereinheit
    3
    Server
    4
    Rechnereinheit
    5
    Software-Modul
    5'
    Software-Modul
    6
    Dialogsystem

Claims (18)

  1. Datenverarbeitungssystem mit wenigstens einer Informationserzeugungseinheit zur Speicherung oder Generierung von einen Datenbestand bildenden Daten, mit wenigstens einer Rechnereinheit zur Generierung eines Objektmodells, bestehend aus einer Klassenstruktur von Klassen, wobei die Daten mittels des Objektmodells strukturierbar sind, mit Mitteln zur Datenabfrage und mit einer Inferenzeinheit, in welcher zur Umsetzung von Datenabfragen mittels Regeln Elemente der Klassenstruktur und/oder Daten verknüpft werden, dadurch gekennzeichnet, dass als Ein-/Ausgabeeinheit ein Dialogsystem (6) vorgesehen ist, über welches natürlichsprachliche Satzsequenzen im Rahmen vorgegebener Komplexität als Eingabegrößen eingebbar sind, aus welchen die Datenabfragen selbsttätig abgeleitet werden.
  2. Datenverarbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, dass die Informationserzeugungseinheit von einer Speichereinheit zur Speicherung von Daten gebildet ist.
  3. Datenverarbeitungssystem nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass die Mittel zur Datenabfrage von einer Suchausdrücke generierenden Suchmaschine gebildet ist.
  4. Datenverarbeitungssystem nach einem der Ansprüche 1–3, dadurch gekennzeichnet, dass in dem Dialogsystem (6) eine Menge von zulässigen Satztypen abgespeichert ist, mit welcher die Eingabegrößen verglichen werden.
  5. Datenverarbeitungssystem nach einem der Ansprüche 1–4, dadurch gekennzeichnet, dass bei Eingabe einer unzulässigen Eingabegröße über das Dialogsystem (6) eine Fehlermeldung ausgegeben wird.
  6. Datenverarbeitungssystem nach einem der Ansprüche 1–5, dadurch gekennzeichnet, dass als Antwort auf wenigstens eine Eingabegröße eine Ausgabegröße generiert wird, welche über das Dialogsystem (6) ausgebbar ist.
  7. Datenverarbeitungssystem nach Anspruch 6, dadurch gekennzeichnet, dass als Antwort auf eine Folge von Eingabegrößen eine Ausgabegröße generiert wird, welche über das Dialogsystem (6) ausgebbar ist.
  8. Datenverarbeitungssystem nach Anspruch 7, dadurch gekennzeichnet, dass die Eingabegrößen einer Folge mittels UND-Verknüpfungen logisch verknüpft sind.
  9. Datenverarbeitungssystem nach einem der Ansprüche 6–8, dadurch gekennzeichnet, dass die Ausgabegrößen jeweils von einer Untermenge der in der Speichereinheit (2) gespeicherten Daten gebildet sind.
  10. Datenverarbeitungssystem nach einem der Ansprüche 1–9, dadurch gekennzeichnet, dass die Klassenstruktur den Klassen zugeordnete Attribute aufweist.
  11. Datenverarbeitungssystem nach einem der Ansprüche 1–10, dadurch gekennzeichnet, dass die Klassenstruktur den Klassen zugeordnete Synonymstrukturen aufweist.
  12. Datenverarbeitungssystem nach Anspruch 11, dadurch gekennzeichnet, dass die Synonymstrukturen als Meta-Attribute ausgebildet sind, welche vorgegebenen Klassen der Klassenstruktur zugeordnet sind.
  13. Datenverarbeitungssystem nach einem der Ansprüche 11 oder 12, dadurch gekennzeichnet, dass den Daten des Datenbestandes Synonyme zugeordnet sind.
  14. Datenverarbeitungssystem nach einem der Ansprüche 3–13, dadurch gekennzeichnet, dass die Regeln und/oder die Suchausdrücke veränderbar sind.
  15. Datenverarbeitungssystem nach einem der Ansprüche 1–14, dadurch gekennzeichnet, dass die Klassenstruktur veränderbar ist.
  16. Datenverarbeitungssystem nach einem der Ansprüche 1–15, dadurch gekennzeichnet, dass zur Bildung eines Suchausdruckes aus einer Eingabegröße in dieser enthaltene Begriffe Elementen der Klassenstruktur zugeordnet werden.
  17. Datenverarbeitungssystem nach Anspruch 16, dadurch gekennzeichnet, dass zur Bildung eines Suchausdruckes aus einer Eingabegröße in dieser enthaltene Begriffe Attributen oder Synonymstrukturen zugeordnet werden.
  18. Datenverarbeitungssystem nach einem der Ansprüche 16 oder 17, dadurch gekennzeichnet, dass zur Bildung eines Suchausdruckes aus einer Eingabegröße in dieser enthaltene Begriffe und/oder Relationen auf eine Menge von Regeln abgebildet werden.
DE10318333A 2003-04-19 2003-04-19 Datenverarbeitungssystem Ceased DE10318333A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10318333A DE10318333A1 (de) 2003-04-19 2003-04-19 Datenverarbeitungssystem
PCT/EP2004/004136 WO2004095313A1 (de) 2003-04-19 2004-04-19 Datenverarbeitungssystem für benutzerfreundliche datenbank-recherchen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10318333A DE10318333A1 (de) 2003-04-19 2003-04-19 Datenverarbeitungssystem

Publications (1)

Publication Number Publication Date
DE10318333A1 true DE10318333A1 (de) 2004-11-11

Family

ID=33154350

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10318333A Ceased DE10318333A1 (de) 2003-04-19 2003-04-19 Datenverarbeitungssystem

Country Status (2)

Country Link
DE (1) DE10318333A1 (de)
WO (1) WO2004095313A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1950672A1 (de) 2007-01-25 2008-07-30 Deutsche Telekom AG Verfahren und Datenverarbeitungssystem zum gesteuerten Abfragen strukturiert gespeicherter Informationen
US8706767B2 (en) 2004-02-23 2014-04-22 Sap Ag Computer systems and methods for performing a database access to generate database tables based on structural information corresonding to database objects

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005020203A1 (de) * 2005-04-28 2006-11-09 Ontoprise Gmbh Graphischer Regeleditor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
DE10103845A1 (de) * 2001-01-30 2002-08-08 Ontoprise Gmbh Rechnersystem

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002073331A2 (en) * 2001-02-20 2002-09-19 Semantic Edge Gmbh Natural language context-sensitive and knowledge-based interaction environment for dynamic and flexible product, service and information search and presentation applications

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
DE10103845A1 (de) * 2001-01-30 2002-08-08 Ontoprise Gmbh Rechnersystem

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PAJ von JP 05028185 A *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706767B2 (en) 2004-02-23 2014-04-22 Sap Ag Computer systems and methods for performing a database access to generate database tables based on structural information corresonding to database objects
EP1950672A1 (de) 2007-01-25 2008-07-30 Deutsche Telekom AG Verfahren und Datenverarbeitungssystem zum gesteuerten Abfragen strukturiert gespeicherter Informationen
DE102007004684A1 (de) 2007-01-25 2008-07-31 Deutsche Telekom Ag Verfahren und Datenverarbeitungssystem zum gesteuerten Abfragen strukturiert gespeicherter Informationen

Also Published As

Publication number Publication date
WO2004095313A1 (de) 2004-11-04

Similar Documents

Publication Publication Date Title
DE69834386T2 (de) Textverarbeitungsverfahren und rückholsystem und verfahren
DE60120822T2 (de) Meta-Dokument und Verfahren zum Verwalten von Meta-Dokumenten
DE102013205737A1 (de) System und Verfahren zum automatischen Erkennen und interaktiven Anzeigen von Informationen über Entitäten, Aktivitäten und Ereignisse aus multimodalen natürlichen Sprachquellen
DE60004385T2 (de) Verfahren und systeme um olap hierarchien zusammenfassbar zu machen
EP1311989B1 (de) Verfahren zur automatischen recherche
EP1877932B1 (de) System und verfahren zur aggregation und überwachung von dezentralisiert gespeicherten multimediadaten
DE112007000053T5 (de) System und Verfahren zur intelligenten Informationsgewinnung und -verarbeitung
EP1783633B1 (de) Suchmaschine für eine ortsbezogene Suche
DE102010049891A1 (de) Ersatz von maschinell vorgegebenen Stichworten von Webseiten durch manuelle Eingaben
DE102013003055A1 (de) Verfahren und Vorrichtung zum Durchführen von Suchen in natürlicher Sprache
WO2009030246A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
DE112010000947T5 (de) Verfahren zur völlig modifizierbaren Framework-Datenverteilung im Data-Warehouse unter Berücksichtigung der vorläufigen etymologischen Separation der genannten Daten
DE112018002047T5 (de) Dokumentenanalyse mit mehreren faktoren
DE102008005083A1 (de) Abrufen einer Information eines fallbasierten Schliessens aus Archivaufzeichnungen
DE69933123T2 (de) Zugriff auf eine semi-strukturierte datenbank
DE112018002626T5 (de) Verfahren und Systeme zur optimierten visuellen Zusammenfassung von Sequenzen mit zeitbezogenen Ereignisdaten
WO2000054167A2 (de) Such- und navigationseinrichtung für hypertext-dokumente
EP2193455A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
DE10318333A1 (de) Datenverarbeitungssystem
WO2009030248A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
WO2005050471A2 (de) Datenverarbeitungssystem und -vorrichtung
DE19952630B4 (de) Verfahren zum Erzeugen einer Auswahlmaske für den Abruf von Daten aus einer oder einer Vielzahl von Datenbanken mit Hilfe von Informationsobjekten
DE112021006602T5 (de) Verfeinern von abfrage-erzeugungsmustern
EP1064606B1 (de) Datenverarbeitungssystem und verfahren zum automatischen erstellen von inhaltsangaben von textdokumenten
DE10220094B4 (de) Datenverarbeitungssystem

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection