-
Die
Erfindung betrifft ein elektronisches Recherchensystem zur Suche
nach Informationen in elektronisch gespeicherten Daten. Sie bezieht
sich dabei auf ein Recherchensystem mit Benutzerschnittstellen,
welches die Suche von Informationen in einem gegebenenfalls umfangreichen
Datenbestand ermöglicht, welcher sowohl lokal als auch
in auf verteilt in einem Netzwerk angeordneten Datenspeichermitteln
gehalten sein kann.
-
Die
Suche von Informationen in umfangreichen elektronischen Datenbeständen
erfolgt nach dem Stand der Technik mit Hilfe von Katalogen, in denen
ein auf die in dem Datenbestand enthaltenen Informationen verweisender
Index gehalten wird. Darüber hinaus ist es bekannt, sich
bei der Suche nach Informationen Ontologien zu bedienen, welche
die Informationen in einer Klassenstruktur abbilden, die aus Klassen
und den Klassen zugeordneten, innerhalb der betreffenden Klassenstruktur
vererbten Attributen bestehen. Mit Hilfe von diesen Ontologien zugeordneten
Regeln sind dabei Schlussfolgerungen möglich, durch deren
Einsatz mittels geeigneter Inferenzeinheiten ein verbesserter Zugriff
auf die Informationen ermöglicht ist beziehungsweise ihr
Wiederauffinden in einem umfangreichen Datenbestand beschleunigt
wird.
-
Beispielsweise
ist aus der
EP 10 64
606 B1 ein der Recherche dienendes Datenverarbeitungssystem
bekannt, bei dem eine Vielzahl von Suchformulierungen als Knoten
und Kanten eines semantischen Netzwerks gespeichert sind, bei dem
die Knoten Suchanfragen enthalten, welche durch die Kanten im Sinne
einer Ontologie mit einem zugehörigen Regelwerk verknüpft
sind. Mit Hilfe dieses semantischen Netzwerks lassen sich beliebig
gestaltbare komplexe Suchanweisungen generieren, welche einen schnellen
Zugriff auf die Informationen eines Datenbestandes ermöglichen.
-
Ein
vergleichbarer Ansatz ist in der
DE 101 03 845 B4 beschrieben. Hier wird ein
flexibler Zugriff auf die Informationen dadurch ermöglicht,
dass die Informationen in einer Klassenstruktur mit Klassen und
innerhalb dieser Klassenstruktur vererbbaren Attributen abgebildet
sind und die Elemente dieser Klassenstruktur mit Hilfe eines Regelwerks
miteinander verknüpft werden, welches bei der Eingabe eines Abfragebefehls
zur Suche von Informationen auf die Klassenstruktur angewendet wird.
Hierdurch werden bei der Suche nach Informationen auch die diesen
Informationen zugrunde liegende Struktur und die zwischen den Elementen
dieser Struktur bestehenden logischen Beziehungen berücksichtigt,
so dass bereits eine relativ einfache Suchanfrage zu einem komplexen
Suchvorgang führt und folglich das bei diesem Suchvorgang
erhaltene Ergebnis auf einer breiteren Basis beruht.
-
Aufgabe
der Erfindung ist es, ein alternatives Recherchensystem zur Verfügung
zu stellen, dessen Schwerpunkt insbesondere im Erhalt eines zuverlässigen
und aussagekräftigen Suchergebnisses zu sehen ist, welches
einerseits möglichst alle relevanten Informationen enthält,
jedoch andererseits einen geringen Anteil bezüglich der
jeweiligen Suchanfrage nicht oder weniger relevanter Informationen
enthält. Darüber hinaus soll das dazu anzugebende
Recherchensystem mit den aus dem Stand der Technik bekannten Techniken
kombinierbar sein.
-
Die
Aufgabe wird durch ein Recherchensystem mit den Merkmalen des Hauptanspruchs
gelöst. Vorteilhafte Aus- beziehungsweise Weiterbildungen sind
durch die Unteransprüche gegeben.
-
Das
zur Lösung der Aufgabe vorgeschlagene elektronische Recherchensystem
besteht aus einer Verarbeitungseinrichtung mit Benutzerschnittstellen
zur Suche von elektronisch gespeicherten Informationen und aus als
Bestanteil der Verarbeitungseinrichtung ausgebildeten und/oder bezüglich
dieser extern angeordneten Datenspeichermitteln. In den Datenspeichermitteln
sind zumindest recherchierbare Informationen enthaltende Daten,
diese Informationen indexierende Daten und wenigstens eine, die Informationen
abbildende Klassenstruktur gespeichert. Innerhalb dieser Klassenstruktur
bilden die durch sie abgebildeten Informationen Instanzen, welche
Klassen angehören, denen jeweils innerhalb der betreffenden
Klassenstruktur vererbte Attribute zugeordnet sind. Die Elemente
der Klassenstruktur, nämlich die Klassen und die und die
zwischen ihnen nach einem Regelwerk herstellbaren Verknüpfungen
bilden eine Ontologie aus. Diese Verknüpfung erfolgt mittels
einer Inferenzeinheit, welche Bestandteil der genannten Verarbeitungseinrichtung
ist, auf der Grundlage von Regeln, die ebenfalls in den Datenspeichermitteln
hinterlegt sind. Die vorgenannten in den Datenspeichermitteln gespeicherten
Daten, aber insbesondere die die recherchierbaren Informationen enthaltenden
Daten können beispielsweise in einer Datenbankstruktur,
das heißt in Form von Datenbankeinträgen einer
jeweiligen Datenbank, gespeichert sein.
-
Erfindungsgemäß ist
bei dem elektronischen Recherchensystem in den Datenspeichermitteln
ein Regelwerk mit Regeln gespeichert, durch deren Anwendung auf
die mindestens eine Klassenstruktur ein für eine Anfrage
zur Informationssuche von der Verarbeitungseinrichtung ermitteltes
vorläufiges Suchergebnis mittels der Inferenzeinheit in
ein verfeinertes endgültiges Suchergebnis überführt
wird. Dem erfindungsgemäßen Recherchensystem liegt demnach
die Verfahrensweise zugrunde, zu einer Suchanfrage zunächst
ein vorläufiges Suchergebnis zu ermitteln und dieses dann
auf ontologischer Basis, nämlich mit Hilfe einer Klassenstruktur
und einem dieser Klassenstruktur zu diesem Zweck zugeordneten Regelwerk,
mittels der Verarbeitungseinrichtung, genauer gesagt, mittels deren
mindestens einer Inferenzeinheit, in ein endgültiges Suchergebnis
umzusetzen. Hierbei wird insbesondere die im Rahmen des vorläufigen
Suchergebnisses erhaltene Trefferzahl reduziert. Darüber
hinaus kann aber gegebenenfalls außerdem das nach dem vorläufigen
Suchergebnis gegebene Ranking der Treffer im Sinne einer Präzisierung
des Suchergebnisses verändert werden.
-
Vorzugsweise
ist das erfindungsgemäße Recherchensystem so ausgebildet,
dass es einem Benutzer ermöglicht, das zur Nachbearbeitung
des vorläufigen Suchergebnisses verwendete Regelwerk zur
Berücksichtigung eigener Präferenzen zu verändern.
Dies schließt für den Benutzer die Möglichkeit ein,
das für die Nachbearbeitung des vorläufigen Recherchenergebnisses
verwendete Regelwerk durch weitere Regeln zu ergänzen.
-
Entsprechend
einer besonders vorteilhaften Weiterbildung der Erfindung ist es
vorgesehen, dass die Daten zur Indexierung der in den Datenspeichermitteln gespeicherten
Informationen um zusätzliche, die Informationen betreffende
Metadaten und Annotationen ergänzt sind. Durch die Berücksichtigung solcher
Metadaten und Annotationen wird die Zuverlässigkeit mit
welcher in den gespeicherten Daten enthaltene Informationen wieder
gefunden werden erhöht. Zwar erhöht sich hierdurch
im Allgemeinen auch die Zahl der zu einer Suchanfrage gefundenen Treffer.
Jedoch wird das insoweit zunächst möglicherweise
relativ umfangreiche vorläufige Suchergebnis anschließend
entsprechend dem erfindungsgemäßen Grundprinzip
nachbearbeitet und so wieder auf die nach der zugrunde liegenden
Ontologie relevantesten Treffer reduziert. Dem Benutzer wird somit über
mindestens eine entsprechende Systemschnittstelle, vorzugsweise über
ein Display, ein Suchergebnis präsentiert, welches mit
hoher Wahrscheinlichkeit alle bezüglich seiner Suchanfrage
relevanten, in irgendeiner Form im System gespeicherten Informationen
enthält. Vorzugsweise erfolgt dabei die Erweiterung des
die im System abgespeicherten Information (Content) erweiternden
Indexes ebenfalls ontologiebasiert, das heißt durch Anwendung
eines im System hinterlegten Regelwerks auf die mindestens eine
die Informationen abbildende Klassenstruktur. Bei den genannten
Metadaten beziehungsweise Annotationen kann es sich beispielsweise
um maschinell lesbaren semantischen Content handeln, welcher Stichwörter
zu weiterführenden, die Informationen betreffenden Details
umfasst.
-
Gemäß einer
bevorzugten Ausbildungsform werden in den Datenspeichermitteln des
elektronischen Recherchensystems in Zuordnung zu der bereits angesprochenen
mindestens einen Klassenstruktur ferner Regeln abgespeichert, durch
deren Anwendung auf die mindestens eine Klassenstruktur eine an
das System gerichtet Anfrage zur Informationssuche von der bereits
genannten Inferenzeinheit oder einer anderen Inferenzeinheit der
Verarbeitungseinrichtung in eine erweiterte Suchanfrage überführt
wird, welche dann an die Verarbeitungseinrichtung zur Suche übergeben
wird. Eine Suchanfrage kann insbesondere dadurch erweitert werden, dass
der Suchanfrage automatisch weitere Suchbegriffe, hinzugefügt
werden, welche einen geringen semantischen Abstand zu den ursprünglich
in der Suchanfrage enthaltenen Suchbegriffen aufweisen. Auch diese
Form der Erweiterung einer Suchanfrage geschieht selbstverständlich
regelbasiert durch Anwendung hierfür in den Datenspeichermittel
des Systems gespeicherter Regeln.
-
Wie
bereits ausgeführt, können die die jeweiligen
Daten aufnehmenden Speichermittel unmittelbarer Bestandteil der
Verarbeitungseinrichtung beziehungsweise des eigentlichen Recherchensystems sein
oder aber in externen, im Zugriff der Verarbeitungseinrichtung befindlichen
Einheiten angeordnet beziehungsweise ausgebildet sein. Demgemäß werden
bei einer möglichen Ausbildungsform der Content beziehungsweise
die recherchierbaren Informationen und die sie indexierenden Daten
sowie die gegebenenfalls den Index erweiternden Annotationen und
Metadaten von einander räumlich getrennt gespeichert. Bei
einer entsprechenden Ausbildung sind beispielsweise nur die Daten,
welche die recherchierbaren Informationen indexieren und die sie
gegebenenfalls erweiternden Annotationen und Metadaten, in Speichermitteln
der Verarbeitungseinrichtung beziehungsweise des eigentlichen Recherchensystems als
solchem, das heißt als Bestandteil seiner Kernkomponenten
gespeichert. Diese Daten bilden hier einen Verweis auf die in externen
in Speichermitteln gehaltenen Daten mit den recherchierbaren Informationen.
Letztere können dabei beispielsweise in den Ressourcen
eines Netzwerks, also etwa in auf unterschiedlichen Servern gehaltenen
Datenbanken, gespeichert sein.
-
Das
erfindungsgemäße System kann insbesondere im Hinblick
auf die Übergabe von Suchanfragen über unterschiedliche
Benutzerschnittstellen von als solches bekannter Art verfügen.
Es weist vorzugsweise mindestens eine Tastatur zur Eingabe textbasierter
Suchanfragen auf. Ferner können diese Benutzerschnittstellen
ein Zeigegerät, wie eine Computer-Maus oder einen Griffel,
umfassen, welche eine durch eine grafische Benutzeroberfläche
unterstützte Eingabe von Suchanfragen ermöglichen. Denkbar
ist es hierbei zum Beispiel, dass die Suchanfrage durch die Aktivierung
von Checkboxen einer grafischen Benutzeroberfläche oder
dergleichen an das System beziehungsweise dessen Verarbeitungseinrichtung übergeben
wird.
-
Eine
weitere vorteilhafte Möglichkeit besteht darin, eine Suchanfrage
durch eine Spracheingabe zu übergeben. In diesem Falle
verfügt das System zur Entgegennahme von Kommandos und
Spracheingaben sowie deren Verarbeitung zumindest über
ein Mikrofon und eine Spracherkennungseinheit, welche insoweit als
erweiterter Bestandteil einer Schnittstelle zur Sprachsteuerung
des Systems aufgefasst wird.
-
Im
Sinne einer multimodalen Bedienbarkeit des Systems können
die vorgenannten oder einzelne der vorgenannten Benutzerschnittstellen
zur Eingabe von Suchanfragen selbstverständlich auch in
Kombination als Bestandteil des erfindungsgemäßen
Recherchensystem realisiert sein. Sie können insbesondere
auch Bestandteil eines mobilen Geräts für den
Zugriff auf ein Netzwerk beziehungsweise das Internet sein.
-
Als
bevorzugtes Ausgabemittel, das heißt Benutzerschnittstelle
für die Ausgabe von Suchergebnissen, beispielsweise in
Listenform, dient ein Bildschirm beziehungsweise Display. Dies schließt selbstverständlich
auch die Möglichkeit einer audiovisuellen Präsentation
von Suchergebnissen mit ein, bei welcher gegebenenfalls auch eine
Sprachausgabe von Suchergebnissen erfolgt.
-
Anhand
von Zeichnungen sollen nachfolgend nochmals einige Aspekte der Erfindung
verdeutlicht werden. In den zugehörigen Zeichnungen zeigen:
-
1 ein
Strukturschema einer möglichen Ausbildungsform des erfindungsgemäßen
Recherchensystems,
-
2:
ein Strukturschema einer gegenüber der 1 geringfügig
abgewandelten Ausbildungsform des erfindungsgemäßen
Recherchensystems.
-
Die 1 zeigt
ein Strukturschema für eine mögliche Ausbildungsform
des erfindungsgemäßen Recherchensystems. Das dargestellte
Schema veranschaulicht anordnungsbezogene Bestandteile des erfindungsgemäßen
Recherchensystems, deren strukturelle Beziehungen untereinander
und Aspekte des Ablaufs bei der Bearbeitung einer Suchanfrage durch
das System in einer gemischten Darstellung. Demnach verfügt
das anhand der Figur beispielhaft erläuterte Recherchensystem über
Benutzerschnittstellen der zuvor genannten Art, beispielsweise über eine
Tastatur oder über eine Spracheingabeeinheit, über
welche ein Benutzer des Systems mit diesem in Kontakt treten und
eine entsprechende Suchanfrage an das System richten kann. In der
Verarbeitungseinrichtung des Recherchensystems wird eine entsprechende
Suchanfrage zunächst interpretiert. Bei dem gezeigten Beispiel
wird die Suchanfrage im Zuge ihrer Aufbereitung und Interpretation
ontologiebasiert in eine erweiterte Suchanfrage überführt.
Dazu wendet eine nicht als Detail gezeigte Inferenzeinheit der Verarbeitungseinrichtung
ein zu diesem Zweck in Speichermitteln des Systems hinterlegtes
Regelwerk auf eine ebenfalls im System gespeicherte Klassenstruktur
aus Klassen und zugehörigen Eigenschaften an, welche die
mittels des Systems recherchierbaren Informationen im System abbildet.
Auf der Grundlage der insoweit erweiterten Suchanfrage werden die
als Daten im System abgespeicherten Informationen mit Hilfe sie
indexierender Daten gesucht, wobei der betreffende Index bei dem
dargestellten Beispiel noch um in Bezug zu den im System erfassten
Informationen stehende Annotationen und Metadaten erweitert ist.
Ergebnis dieses Suchlaufs ist ein erstes, als vorläufiges
Recherchenergebnis behandeltes Suchergebnis, vorzugsweise in Form
einer gerankten Liste von Treffern, welche die erweiterte Suchanfrage
erfüllen. Erfindungsgemäß wird jedoch
dieses vorläufige Ergebnis durch die Verarbeitungseinrichtung
beziehungsweise eine Inferenzeinheit der Verarbeitungseinrichtung
ontologiebasiert nochmals nachbearbeitet. Hierzu wird ein für
diesen Zweck im System hinterlegtes Regelwerk auf die die im System
gehaltenen Informationen abbildende Klassenstruktur angewendet.
Dabei werden die Elemente der Klassenstruktur, nämlich
die Klassen mit den von ihnen erfassten Instanzen und deren innerhalb
der Klassenstruktur vererbte Eigenschaften nach den im Regelwerk
enthaltenen Regeln miteinander und mit ihren Ausprägungen
in dem vorläufigen Suchergebnis verknüpft. Im
Ergebnis dessen werden beispielsweise Redundanzen und/oder Widersprüche
aufgelöst und so das vorläufige Suchergebnis in
ein präzisiertes endgültiges Suchergebnis mit
einer vorzugsweise bezüglich ihres Umfangs reduzierten
und gegebenenfalls neu gerankten Trefferliste überführt.
Dieses endgültige Suchergebnis wird dann dem Benutzer als
Antwort auf seine Suchanfrage über eine hierfür vorgesehene,
in der Abbildung nicht gezeigte Benutzerschnittstelle, insbesondere
ein Display, präsentiert. Bei der in der Figur gezeigten
Ausbildungsform kann ein Benutzer des Rechenchensystems das zu Nachbearbeitung
des vorläufigen Suchergebnisses dienende Regelwerk, sofern
er dies wünscht, verändern beziehungsweise gegebenenfalls
auch erweitern. Dies wird in der Zeichnung durch die untere, das das
Regelwerk symbolisierende Element mit der/den Benutzerschnittstellen
verbindende, beidseits mit einem Pfeil versehene Linie symbolisiert.
Demnach hat der Benutzer über die Benutzerschnittstellen
Zugriff auf dieses Regelwerk und kann dieses im Hinblick beispielsweise
auf die Berücksichtigung eigener Vorlieben bei der Nachbearbeitung
des vorläufigen Suchergebnisses modifizieren. Gegebenenfalls
kann diese Möglichkeit der Bearbeitung des Regelwerks außerdem
mit einer hier nicht gezeigten Benutzerverwaltung gekoppelt sein,
so dass sich der Benutzer beispielsweise zur Vornahme entsprechender Änderungen
am Regelwerk gegenüber dem System authentifizieren muss
und/oder ausgehend von einem Regelwerk mit Grundregeln für
unterschiedliche Benutzer des Systems mit unterschiedlichen Vorlieben verschiedene
Regelsätze für die Nachbearbeitung des vorläufigen
Suchergebnisses im System verwaltet werden können.
-
Die 2 zeigt
eine mit der Ausbildungsform nach der 1 grundsätzlich
vergleichbare Ausbildungsform des erfindungsgemäßen
Recherchensystems. Ein Unterschied zur 1 besteht
darin, dass bei der hier gezeigten Ausbildungsform die Daten, welche
die recherchierbaren Informationen enthalten und die sie indexierenden
Daten mit den ergänzenden Annotationen und Metadaten voneinander
räumlich getrennt gespeichert sind. Während der
Index und die ihn ergänzenden Daten in Datenspeichermitteln
der Verarbeitungseinrichtung selbst gespeichert sind, werden die
recherchierbaren Daten demgegenüber extern und gegebenenfalls
auch verteilt auf verschiedenen Ressourcen (beispielsweise Servern)
eines Netzwerks gehalten. Hierdurch verringert sich der Speicheraufwand
in der Kernkomponente, das heißt der Verarbeitungseinrichtung.
-
Die
Verarbeitungseinrichtung ist in beiden Figuren durch eine mehrere
Komponenten umfassende gestrichelte Linie symbolisiert. Dem Fachmann
ist hierbei klar – und entsprechendes ergibt sich auch aus
den Patentansprüchen – dass dabei die die Klassenstrukturen
und/oder die verschiedenen Regelwerke aufnehmenden Speichermittel
wahlweise Bestandteil der Verarbeitungseinrichtung oder der mit ihr
zusammenwirkenden Peripherie ausgebildet sein können beziehungsweise
als deren jeweilige Bestandteile aufgefasst werden können.
-
Bezugszeichenliste
-
- 1
- Verarbeitungseinheit
- 2
- Benutzerschnittstellen
- 3
- Daten
(recherchierbare Informationen enthaltende Daten)
- 4
- indexierende
Daten, Index
- 5
- Klassenstruktur
- 6
- Regelwerk
- 7
- Regelwerk
- 8
- Regelwerk
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- - EP 1064606
B1 [0003]
- - DE 10103845 B4 [0004]