DE3901485C2

DE3901485C2 - Verfahren und Vorrichtung zur Durchführung des Verfahrens zur Wiedergewinnung von Dokumenten

Info

Publication number: DE3901485C2
Application number: DE3901485A
Authority: DE
Inventors: Tetsuya Morita
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1988-01-20
Filing date: 1989-01-19
Publication date: 1995-05-24
Anticipated expiration: 2009-01-20
Also published as: JPH021057A; US5168565A; DE3901485A1

Description

Die Erfindung betrifft ein Verfahren zur Wiedergewinnung von Dokumenten nach dem Oberbegriff des Anspruchs 1 und eine Vorrichtung zur Durchführung dieses Verfahrens nach dem Oberbegriff des Patentanspruchs 24.

Herkömmliche Dokumenten-Wiedergewinnungssysteme können in Abhängigkeit von den verschiedenen Registrier- und Wiedergewinnungsverfahren in zwei Gruppen eingeteilt werden. Die beiden Gruppen sind das Thesaurus-System und ein mit freien Schlüsselworten arbeitendes System. Bei dem Thesaurus- Dokumenten-Wiedergewinnungssystem wählt die Bedienungsperson zum Zeitpunkt der Dokumentenregistrierung die Schlüsselworte aus, welche als geeignet angenommen werden und registriert die ausgewählten Schlüsselworte zusammen mit den bibliographischen Daten. Bei einer Dokumenten-Wiedergewinnung bestimmt die Bedienungsperson die Schlüsselworte, welche als geeignet angenommen worden sind, aus dem "Wortschatz" (Thesaurus-Gruppe von Schlüsselworten), um das Dokument wiederzugewinnen.

Bei dem mit freien Schlüsselworten arbeitenden Dokumenten- Wiedergewinnungssystem registriert die Bedienungsperson zum Zeitpunkt der Dokumenten-Registrierung nur die bibliophilen Daten und den Dokumenteninhalt. Zur Dokumenten-Wiedergewinnung benennt die Bedienungsperson lediglich die freien Schlüsselworte.

Das Thesaurus-Dokumenten-Wiedergewinnungssystem kann eine invertierte Datei haben, und es ist eine Dokument-Wiedergewinnung mit hoher Geschwindigkeit möglich. Jedoch gibt es die Schwierigkeit, daß eine große Speicherkapazität zum Speichern der Schlüsselworte erforderlich ist. Außerdem können die Schlüsselworte, welche von der Bedienungsperson zum Zeitpunkt der Vorlagen-Registrierung ausgewählt worden sind, sich als nicht geeignet herausstellen, und es gibt dann die Schwierigkeit, daß die Eignung der ausgewählten Schlüsselworte die Leistungsfähigkeit des Systems bestimmt. Ferner gibt es noch die Schwierigkeiten, daß sowohl die Indexierung (Klassifizierung) und ein Erneuern der Kennworte bei dem Thesaurus-System kompliziert und nicht notwendigerweise richtig sind.

Dagegen benötigt das mit freien Schlüsselworten arbeitende Dokumenten-Wiedergewinnungssystem nur eine kleine Speicherkapazität, um Schlüsselworte zu speichern. Darüber hinaus ist das Vorhandensein oder Nicht-Vorhandensein eines Dokumentes einschließlich des bestimmten Schlüsselworts übersichtlich, und eine Klassifizierung (Indexierung) der Schlüsselworte ist nicht notwendig. Dies System weist jedoch die Schwierigkeit auf, daß die Wiedergewinnungszeit lang ist, da mit Hilfe des benannten Schlüsselwortes auf das gesamte Dokument verwiesen wird; ferner ist das System nicht dazu geeignet, eine verschwommene Wiedergewinnung, wie beispielsweise Verarbeitungssynonyme durchzuführen.

Aus der US 4 554 631 ist ein auf Software basierendes System bekannt, welches einen Computer, einen Speicher, eine Anzeigeeinrichtung und eine Eingabeta statur zum Einsatz bringt. Bei diesem bekannten Systen wird jedes Abfrage- Schlüsselwort, das über die Eingabetastatur eingegeben wird, softwaremäßig aus einer Texte enthaltenden Datenbasis herausgezogen und an eine Datenbasis, die eine Schlüsselwortliste mit bestimmten Dokumenten zugeordneten Schlüssel worten enthält, angepaßt. Bei dieser Art von System sind bereits bei mittelgroßen Datenbanken mit Dokumenten große Rechenzeiten erforderlich, um bestimmte Dokumente auffinden zu können. Das System ist auch dazu in der Lage, seine Schlüsselwortliste an bestimmte Fragetechniken von Benutzerpersonen oder an die Häufigkeit, mit der ein gewünschtes Dokument aufgerufen wird, anzupas sen.

Aus der EP 0 032 194 A1 ist ein Verfahren bzw. eine Vorrichtung gemäß dem Oberbegriff des Patentanspruchs 1 bzw. des Patentanspruchs 24 bekannt, wobei hier jedoch die Wiedergewinnungsbedingungen ausschließlich auf das eigentlich gesuchte Dokument oder den gesuchten Text bezogen sind, der gespeichert oder wiedergefunden werden soll. Auch dieses Verfahren bzw. diese Vorrichtung sind nur äußerst zeitaufwendig zu betreiben bzw. zum Einsatz zu bringen, da die betreffenden Texte oder Dokumente, die aufgefunden werden sollen, sequentiell nach entsprechenden Suchwörtern oder Suchausdrücken abgesucht werden müssen.

Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren bzw. eine Vor richtung zur Dokumentenwiedergewinnung vorzuschlagen, das bzw. die schneller ist als die bekannten Verfahren bzw. Vorrichtungen und dabei nur relativ wenig Speicherplatz benötigt, wobei sowohl das erfindungsgemäße Verfahren als auch die erfindungsgemäße Vorrichtung dazu führen sollen, daß eine Datenverarbei tungsanlage lern- bzw. anpassungsfähig ist.

Diese Aufgabe wird durch ein Verfahren mit den im Patentanspruch 1 aufgeführ ten Merkmalen sowie eine Vorrichtung mit den im Patentanspruch 24 aufgeführ ten Merkmalen gelöst.

Zweckmäßige Verfahrensvarianten bzw. Ausführungsformen der Vorrichtung gehen aus den jeweiligen Unteransprüchen hervor.

Bei dem erfindungsgemäßen Verfahren bzw. der erfindungsgemäßen Vorrichtung zur Dokumenten-Wiedergewinnung braucht keine Klassifizierung (oder Indexierung) der Schlüsselworte vorgenommen zu werden, und eine Vorlagengewinnung kann mit einer hohen Geschwindigkeit mit Hilfe eines Vokabulars oder "Bildes" durchgeführt werden, das nahe bei demjenigen der Bedienungsperson liegt.

Gemäß einer bevorzugten Ausführungsform der Erfindung kann ein Vorlagen-Wiedergewinnungsverfahren bzw. -vorrichtung geschaffen werden, bei welchem die Vergleichsinformationen, welche in einer Schlüsselwort- Verbindungsstelle enthalten sind, dynamisch in Abhängigkeit von einer Benutzungshäufigkeit der Schlüsselworte geändert werden. Bei der erfindungsgemäßen Vorrichtung bzw. dem Verfahren zur Dokumenten-Wiedergewinnung wird die Vergleichsfunktion geändert, welche in der Schlüsselwort-Verbindungstabelle enthalten ist, aufgrund einer Lernfunktion, und das System ist unbeeinflußt von dem Vokabular oder "Bild" der Bedienungsperson, welche die Vergleichsfunktion anfangs eingibt, nachdem das erfindungsgemäße Verfahren bzw. die Vorrichtung eine vorherbestimmte Zeit in Benutzung ist.

Nachfolgend wird die Erfindung anhand von bevorzugten Ausführungsformen unter Bezugnahme auf die anliegenden Zeichnungen im einzelnen erläutert. Es zeigt

Fig. 1 ein Diagramm, anhand welchem das Arbeitsprinzip eines Verfahrens bzw. einer Vorrichtung zur Dokumenten-Wiedergewinnung gemäß der Erfindung erläutert wird,

Fig. 2 ein Blockdiagramm einer Ausführungsform der Vorrichtung zur Dokumenten- Wiedergewinnung gemäß der Erfindung,

Fig. 3A bis 3C ein zu registrierendes Dokument, dessen bibliograpische Information bzw. dessen Schlüsselworte,

Fig. 4 eine Ausführungsform einer Schlüsselwort-Verbindungstabelle,

Fig. 5 eine Schlüsselwort-Verbindungstabelle, vor der Registrierung des in Fig. 3A dargestellten Dokuments,

Fig. 6 eine Schlüsselwort-Verbindungstabelle nach der Registrierung des in Fig. 3A dargestellten Dokuments,

Fig. 7 eine Schlüsselwort-Verbindungstabelle, welche dadurch erhalten worden ist, daß Werte zu Beziehungswerten in der in Fig. 6 dargestellten Schlüsselwort- Verbindungstabelle in Abhängigkeit von einer Gruppe ausgewählter Schlüsselworte hinzugefügt werden,

Fig. 8 eine Schlüsselwort-Verbindungstabelle, die aus der in Fig. 6 dargestellten Schlüsselwort-Verbindungstabelle erhalten worden ist und indirekte Verknüpfungen und deren Beziehungswerte enthält,

Fig. 9 eine Ausführungsform einer Schlüsselwortlage mit Schlüsselwortverbindungen,

Fig. 10 eine Tabelle, welche die Schlüsselwort-Verbindungen in der in Fig. 9 dargestellten Schlüsselwortlage für drei Fälle wiedergibt, wobei verschiedene Formeln zum Berechnen von Beziehungswerten verwendet sind,

Fig. 11 ein Ablaufdiagramm einer Ausführungsform einer Arbeitsweise eines Computers zum Durchführen von Funktionen eines in Fig. 2 dargestellten Anforderungsprozessors,

Fig. 12 ein Ablaufdiagramm einer Ausführungsform einer Arbeitsweise eines Computers zum Ausführen von Funktionen eines in Fig. 2 dargestellten Kennwort- Beziehungs-/Relevanz-Kalkulators,

Fig. 14 ein Ablaufdiagramm einer Ausführungsform einer Arbeitsweise eines Rechners zum Durchführen von Funktionen eines in Fig. 2 dargestellten Sortierers,

Fig. 15 ein Ablaufdiagramm einer Ausführungsform einer Arbeitsweise eines Computers zum Durchführen von Funktionen der in Fig. 2 dargestellten Vorrichtung;

Fig. 16 eine Ausführungsform eines Netzmodelles von Schlüsselwort- Verbindungen,

Fig. 17 ein Diagramm zum Erläutern von Umwandlungen des Netzmodells vor und nach der Dokumenten-Registrierung und

Fig. 18 ein Diagramm einer Ausführungsform von gehäuft angeordneten bzw. zusammengeschlossenen Kennworten.

Zuerst wird allgemein das Verfahren der Dokumenten- Wiedergewinnung gemäß der Erfindung beschrieben. In Fig. 1 ist eine Schlüsselwort-Lage und eine Dokumenten- Datenbasis bzw. -bank dargestellt. Bei der Erfindung ist ein neuer Begriff verwendet, der nachstehend als eine "dynamische Schlüsselwort-Verbindung" bezeichnet wird.

In Fig. 1 entsprechen die jeweiligen Dokumente #1, #2, . . ., #N in einer Dokumenten-Datenbank 2 Schlüsselworten 3a, welche in den Dokumenten #1, #2, . . ., #N enthalten sind, durch eine invertierte Datei 4. Eine Schlüsselwort-Lage 3 ist aus den Schlüsselworten 3a und Schlüsselwort-Verbindungen 3b gebildet, welche durch eine Beziehungsinformation zwischen zwei Schlüsselworten 3a gebildet sind, welche durch die Schlüsselwort- Verbindung 3b miteinander verbunden sind. Die Beziehungsinformation enthält einen Beziehungsnamen, den Wert einer Beziehung, eine Beziehungsrichtung (Vorzeichen) u. ä. Beispielsweise weist die Beziehung "also known as", "synonym", "including same text", "IS-A relation", "IS-PART-OF relation" u. ä. auf. Der Wert der Beziehung (der nachstehend auch als ein Beziehungswert bezeichnet wird) bzw. die Beziehungsrichtung zeigen die Amplitude und Richtung der Beziehung sowie den Wert und die Richtungsänderung an, wenn der Benutzer einen Schlüsselwort-Zugriff durchführt. Da sich der Beziehungswert und die Beziehungsrichtung in Abhängigkeit von der Benutzungshäufigkeit (oder der Zugriffshäufigkeit), einem Daten-Satz u. ä. ändern, kommt die Schlüsselwortlage 3 als Ganzes allmählich dem Vokabular oder dem "Bild" bzw. der Vorstellung des Benutzers in Abhängigkeit von den häufig benutzten Schlüsselworten 3a und der Art, in welcher die Schlüsselworte 3a benutzt werden, allmählich nahe. Mit anderen Worten, eine dynamische Schlüsselwort-Verbindung wird nach und nach gebildet.

Im allgemeinen ist eine maximale Anzahl von Schlüsselwort- Verbindungen, welche N Schlüsselworte verbinden, (N ²-N)/2. In der vorliegenden Beschreibung verweist der Beziehungsname "also known as" auf Schlüsselworte, welche verschieden ausgesprochen werden, aber dasselbe Ding bedeuten, wie "optical character reader" (optischer Zeichenleser) oder "OCR". Außerdem verweist der Beziehungsname "synonym" auf Schlüsselworte, welche ähnliches bedeuten, wie "close" (nahe) oder "near" (nahe). Ferner weist die Beziehungsrichtung auf die Richtung hin, in welcher zwei Beziehungsnamen Bezug zueinander haben, wenn die zwei Beziehungsnamen beispielsweise durch eine IS-PART-OF-Beziehung Bezug zueinander haben.

Eine Beziehung zwischen zwei beliebigen Schlüsselworten 3a kann mit Hilfe der Information in dem Beziehungsnamen und dem Beziehungswert der Schlüsselwort-Verbindung (direkte Schlüsselwort-Verbindung) 3b bestimmt werden, welche tatsächlich in einer Schlüsselwortlage 3 existiert. Außerdem kann eine "Schlüsselwort-Relevanz", welche die Amplitude der Beziehung zwischen der von dem Benutzer bestimmten Schlüsselwortgruppe und jedem der Schlüsselworte anzeigt, die in dem Dokumenten-Wiedergewinnungssystem registriert sind, und eine "Textrelevanz", welche die Amplitude der Beziehung zwischen der von dem Benutzer bestimmten Schlüsselwortgruppe und jedem in der Dokumenten-Wiedergewinnungs vorrichtung registrierten Text anzeigt, als eine Funktion der vorstehend erwähnten Beziehung festgelegt werden. Wenn die Beziehung zwischen zwei beliebigen Schlüsselworten 3a, die Relevanz von Schlüsselworten und die Textrelevanz erhalten werden, kann der Benutzer die Schlüsselwortgruppe dementsprechend für den Gegenstand durch die Wechselwirkung zwischen dem Benutzer und dem Dokumenten-Wiedergewinnungs verfahren bzw. -vorrichtung verfeinern, wenn die Schlüsselwortgruppe richtig für das Dokument gewählt wird, welches wiederzugewinnen ist.

Die dynamische Schlüsselwortverbindung kann durch eine in Fig. 4 dargestellte Schlüsselwort-Verbindungstabelle verwaltet werden. In Fig. 4 gibt es M Schlüsselworte KW₁ bis KW_M in der Schlüsselwort-Verbindungstabelle; beispielsweise bezeichnet RI₁₂ die Beziehungsinformation zwischen den Schlüsselworten KW₁ und KW₂ und RI_1M die Beziehungsinformation zwischen den Schlüsselworten KW₁ und KW_M.

Als nächstes wird eine Ausführungsform des Dokumenten-Wiedergewinnungs verfahrens bzw. -vorrichtung (nachfolgend "-system" genannt) gemäß der Erfindung anhand von Fig. 2 beschrieben. Fig. 3A zeigt ein Dokument, welches in dieser Ausführungsform registriert wird, während Fig. 3B dessen bibliographische Information und Fig. 3A dessen Schlüsselworte wiedergibt.

Wenn ein Dokument 11, welches zu registrieren ist, eingegeben wird, extrahiert ein Schlüsselwort-Extrahiereinrichtung 10 Schlüsselworte aus der zu registrierenden Vorlage 11. Die extrahierten Schlüsselworte und das zu registrierende Dokument werden dann einem Dokumenteninformations-Manager 20, einer weiteren Einrichtung bzw. einem Schlüsselwort-Verbindungstabellen-Prozessor 30 und einer Einrichtung 40 zur Erzeugung invertierter Dateien bzw. einem invertierten Datei-Generator 40 zugeführt.

Der Dokumenten-Informations-Manager 20 speichert das zu registrierende Dokument 11 und die Schlüsselworte sowie die bibliographische Information des zu registrierenden Dokuments 11 in einer Datei 21 in Form einer Datenbank, welche leicht zugänglich ist, wenn die Dokumenten-Wiedergewinnung durchgeführt wird. Die Datei 21 entspricht der in Fig. 2 dargestellten Dokumenten-Datenbasis oder -bank 2.

Der Prozessor 30 erzeugt in Fig. 5 bis 8 dargestellte Schlüsselwort- Verbindungstabellen durch Tabellieren der notwendigen Schlüsselworte und der Schlüsselwortverbindungen (der Beziehungsinformation) und speichert diese Schlüsselwort- Verbindungstabellen in einer Datei 31. Die Datei 31 entspricht der in Fig. 1 dargestellten Schlüsselwortlage 3.

Der Inhalt der Datei 31 wird zu der dynamischen Schlüsselwortverbindung auf nachfolgend beschriebene Weise verfeinert. Das heißt, eine in Fig. 5 dargestellte Schlüsselwort- Verbindungstabelle hat Anfangswerte, bevor die Dokumenten- Registrierung eine in Fig. 6 dargestellte Tabelle wird, welche direkte Schlüsselwort-Verbindungen nach der Dokumenten- Registrierung zeigt. Eine in Fig. 7 dargestellte Tabelle wird als nächstes erhalten, indem indirekte Schlüsselwort- Verbindungen und deren Beziehungen hinzugefügt werden. Eine in Fig. 8 dargestellte Tabelle wird schließlich dadurch erhalten, daß Lernkoeffizienten hinzugefügt werden.

Wie später noch beschrieben wird, wird, wenn die endgültige Schlüsselwortgruppe in Fig. 7 "company R", "communication", "image" und "nerve cell" enthält, ein Lernkoeffizient "+5" zu Teilen in Fig. 7 hinzugefügt, welche schraffierten Teilen entsprechen, und ein Lernkoeffizient "+10" wird zu Teilen in Fig. 7 hinzugefügt, welche dunkel schraffierten Teilen in Fig. 8 entsprechen.

Die Anfangswerte in der in Fig. 5 dargestellten Schlüsselwort- Verbindungstabelle werden auf beliebige Werte gesetzt, die beispielsweise auf Erfahrung basieren. Die Wahrscheinlichkeit, daß "company R" ein "Unternehmen" ist, ist hoch, und der Beziehungswert wird daher anfangs auf "90" gesetzt. Jedoch kann "BTT" ein Firmenname oder eine Abkürzung für irgend etwas sein. Daher ist die Wahrscheinlichkeit, daß "BTT" ein "Unternehmen" ist, geringer als die Wahrscheinlichkeit, daß "company R" ein "Unternehmen" ist, und der Beziehungswert wird daher anfangs auf "50" gesetzt. Wie später noch beschrieben wird, kann eine unangebrachte Anfangseinstellung der Beziehungswerte durch eine Lernfunktion noch korrigiert werden, was in der vorliegenden Beschreibung später noch beschrieben wird. Mit anderen Worten, es gibt keine strengen Anforderungen bezüglich der Anfangseinstellung der Beziehungswerte.

Der Generator 40 erzeugt eine invertierte Datei, um die Kennworte entsprechend dem zu registrierenden Dokument 11 herzustellen und speichert die erzeugte invertierte Datei in einer Datei 41. Die Datei 41 entspricht der in Fig. 1 dargestellten invertierten Datei 4.

Eine Wähleinrichtung bzw. ein Dokumenten-Selektor 50 wird verwendet, um einen Dokumententext zu extrahieren, welcher dem geforderten Sachgebiet und einem geforderten Konzept des Benutzers durch Verwenden einer Schlüsselwortgruppe am nächsten kommt. Der Dokumenten-Selektor 50 stellt eine Liste von Schlüsselworten auf einer Anzeigeeinrichtung 70 bezüglich des Benutzers dar, welcher einen Zugriff von einer Eingabetastatur 60 aus hat. Der Benutzer wählt die Schlüsselworte, welche für das geforderte Sachgebiet benötigt werden, aus der Liste Schlüsselworte aus oder wählt freie Schlüsselworte, und gibt eine Anzeige-Wiedergewinnungsanforderung von der Eingabetastatur 60 aus ein. Der Selektor 50 hat einen Textrelevanz- Berechnungsteil 51 (der nachstehend der Einfachheit halber als ein Textrelevanz-Kalkulator bezeichnet wird), einen Schlüsselwort-Beziehungs- und -Relevanz-Berechnungsteil 52 (welcher nachstehend der Einfachheit halber als Kennwort- Beziehungs-/Relevanz-Kalkulator bezeichnet wird), einen Sortierer 53, einen Anforderungsprozessor 54 und eine Anzeige- Steuereinheit 55.

Zuerst überträgt der Prozessor 54 von der Tastatur 60 erhaltene Schlüsselworte an den Schlüsselwort-Beziehungs-/ Relevanz-Kalkulator 52, um so die Schlüsselworte, welche sich auf das empfangene Schlüsselwort beziehen, aus der Kennwort-Verbindungstabelle auszuwählen. Beispielsweise sind die Schlüsselworte "company R" und "communication" die erhaltenen Schlüsselworte, die an den Kalkulator 52 übertragen worden sind.

Der Kalkulator 52 extrahiert aus der in Tabelle 6 dargestellten Schlüsselwort-Verbindungstabelle die diesbezüglichen Schlüsselworte, welche sich auf "company R" und "communication" beziehen, und auch die Beziehungswerte. Mit anderen Worten, die in Fig. 6 dargestellte Schlüsselwort-Verbindungstabelle wird mit Hilfe der zwei Schlüsselworte "company R" und "communication" durchgesehen, und die Beziehungsinformation, wie ["company R", "BTT" (technischer Zusammenhang)], ["company R", "communication" (Untersuchung und Entwicklung)], ["company R", "nerve cell" (einschließlich desselben Textes)], ["company R", "enterprise" (Unternehmen) (IS-A)], ["company R", "image" (einschließlich desselben Textes)], ["communication", "nerve cell" (Synonym)] u. ä. werden erhalten.

Der Schlüsselwort-Beziehungs-/Relevanz-Kalkulator 52 berechnet den Wert der Beziehung zwischen zwei beliebigen Schlüsselworten aus dem Beziehungsnamen und der Beziehung der direkten Schlüsselwort-Verbindung, welche in der Schlüsselwortlage besteht, und speichert den berechneten Beziehungswert in der Schlüsselwort-Verbindungstabelle. Wenn keine direkte Beziehung zwischen den zwei beliebigen Schlüsselworten existiert, aber ein oder mehrere indirekte Beziehungen zwischen den zwei beliebigen Schlüsselworten über eine oder mehrere Schlüsselworte bestehen, wird in diesem Fall gesagt, daß eine "indirekte Schlüsselwort-Verbindung" besteht. Der Beziehungswert der indirekten Schlüsselwortbeziehung kann basierend auf der Berechnungsformel berechnet werden, die verwendet wird, um den Wert der Beziehung zwischen zwei beliebigen Schlüsselworten zu berechnen. Es wird dann gesagt, daß der Beziehungswert "0" ist, wenn eine direkte Schlüsselwortverbindung noch eine indirekte Schlüsselwort-Verbindung zwischen den zwei beliebigen Schlüsselworten besteht.

Als nächstes wird eine Form einer Formel zum Berechnen des Beziehungswerts einer Schlüsselwort-Verbindung beschrieben, welche zwei beliebige Schlüsselworte verbindet. Eine Beziehung R_REL [K_p, R_q] einer Schlüsselwort-Verbindung (p, q) zwischen zwei beliebigen Schlüsselworten K_p und K_q kann mit Hilfe eines Beziehungsnamens N_ÿ und eines Beziehungswerts S_ÿ einer Schlüsselwortverbindung (i, j) ∈ UC_ALL zwischen Schlüsselworten K_i und K_j definiert werden, welche in der Schlüsselwortlage vorhanden sind, wobei UC_ALL einen Satz Schlüsselwortverbindungen zwischen den Schlüsselworten K_i und K_j in der Schlüsselwortlage und K_p, K_q, K_i bzw. K_j Schlüsselworte p, q, i und j bezeichnen. Die folgende Formel (1) definiert die Beziehung K_REL [K_p, K_q]:

K_REL [K_p, K_q] = f [S_ÿ, N_ÿ, p, q] (1)

Die Funktion f [S_ÿ, N_ÿ, p, q], welche die Beziehung K_REL [K_p, K_q] festlegt, kann entsprechend verschiedenen Methoden erhalten werden, und eine Form dieser Methoden wird nachstehend beschrieben.

Fall (1)

Wenn eine direkte Schlüsselwortverbindung zwischen zwei Schlüsselworten K_p und K_q besteht, kann die Funktion f [S_ÿ, N_ÿ, p, q] durch die folgende Formel (2) beschrieben werden, wobei A_MP [N_ÿ] einen Wichtungskoeffizienten bezeichnet und sich in Abhängigkeit von dem Beziehungsnamen unterscheidet.

f [S_ÿ, N_ÿ, p, q] = S_ÿ × A_MP [N_ÿ] (2)

Beispielsweise kann der Wichtungskoeffizient A_MP [N_ÿ] folgendermaßen durch N_ÿ ausgedrückt werden:

(Fall N_ÿ ("also known as" (SETQ A_MP [N_ÿ] 1,0)) ("synonym" (SETQ A_MP [N_ÿ] 0,8)) ("antonym" (SETQ [N_ÿ] - 0,5))) .

Die folgende Feststellung bedeutet, daß "1,0" ersetzt wird durch A_MP [N_ÿ], wenn N_ÿ "also known as" ist, "0,8" wird ersetzt durch A_MP [N_ÿ], wenn N_ÿ "synonym" ist, und "-0,5" wird ersetzt durch A_MP [N_ÿ], wenn N_ÿ "antonym" ist.

Fall (II)

Wenn kein direktes Schlüsselwort zwischen den Schlüsselworten K_p und K_q besteht, aber eine oder mehrere indirekte Schlüsselwortverbindungen zwischen den zwei Kennworten K_p und K_q bestehen, kann die Funktion f [S_ÿ, N_ÿ, p, q] durch die folgende Formel (3) beschrieben werden, wobei C₁ bis C_n Zahlen von indirekten Schlüsselwortverbindungen bezeichnen, UC_k einen Satz von direkten Schlüsselwortverbindungen bezeichnet, welche indirekte Schlüsselwortverbindungen C_k darstellen, Σ eine Gesamtsumme der direkten Schlüsselwortverbindungen (i, j) einschließlich UC_k bezeichnet, und MIN einen Minimalwert der Beziehungswerte zwischen den n indirekten Schlüsselwortverbindungen C₁ bis C_n bezeichnet.

Fall (III)

Wenn keine direkte Schlüsselwortverbindung zwischen den zwei Schlüsselworten K_p und K_q besteht und keine indirekte Schlüsselwortverbindung zwischen den zwei Schlüsselworten K_p und K_q besteht, kann die Funktion f [S_ÿ, N_ÿ, p, q] durch die folgende Formel (4) beschrieben werden.

f [S_ÿ, N_ÿ, p, q,] = 0 (4)

Die Fälle (I), (II) und (III) sind in Fig. 10 für die Schlüsselwortlage mit den in Fig. 9 dargestellten Schlüsselworten- Verbindungen dargestellt. In Fig. 9 bezeichnen bis jeweils Schlüsselworte. Sie sind direkte oder indirekte Schlüsselwortverbindungen in einer Gruppe, welche aus den Schlüsselworten bis gebildet ist, und sie sind direkte oder indirekte Schlüsselwortverbindungen in einer Gruppe, welche aus den Schlüsselworten bis gebildet ist. Jedoch besteht keine direkte noch eine indirekte Schlüsselwort- Verbindung zwischen diesen zwei Gruppen. In Fig. 10 ist [K_p, K_q] der Einfachheit halber durch [p-q] bezeichnet.

Nunmehr wird die Bedeutung der Formel (II) bis (IV) hinsichtlich der Berechnung der Beziehungswerte der Schlüsselwort- Verbindung zwischen zwei beliebigen Schlüsselworten beschrieben. Die Schlüsselwort-Lage ist eine Ausführung eines Graphen der Schlüsselwortverbindungen mit der Beziehungsinformation zwischen den Schlüsselworten in Form einer Anordnung oder Tabelle. Der Graph ist normalerweise nicht ein kompletter Graph. Mit anderen Worten, nicht alle Schlüsselworte haben notwendigerweise eine Schlüsselwortverbindung zu allen verbleibenden Schlüsselworten. Folglich ist es möglich, einen imaginären kompletten Graphen zu betrachten, der eine Schlüsselwortverbindung als eine Beziehung zwischen zwei beliebigen Schlüsselworten hat. Dies ist ein Äquivalent zum Berechnen des Beziehungswertes der Schlüsselwort-Verbindung zwischen den zwei beliebigen Kennworten mit der indirekten Schlüsselwort-Verbindung durch Benutzen der Verbindungsinformationen, welche in der Schlüsselwort- Lage besteht.

Wenn folglich eine direkte Schlüsselwortverbindung (p, q) zwischen zwei beliebigen Schlüsselworten K_p und K_q besteht, kann der Beziehungswert der direkten Schlüsselwortverbindung (p, q) aus der Formel (2) dadurch erhalten werden, daß Wichtungskoeffizienten einfach mit dem Beziehungswert S_ÿ multipliziert werden, wobei die Wichtungskoeffizienten in Abhängigkeit von dem Beziehungsnamen N_ÿ unterschiedlich sind.

Wenn andererseits eine Anzahl indirekter Schlüsselwortverbindungen bestehen, kann deren Beziehungswert aus der Formel (3) für jede der indirekten Schlüsselwortbeziehungen berechnet werden, und es wird ein optimaler Wert aus den berechneten Werten erhalten. Der Term (S_ÿ×A_MP [N_ÿ])^-1 ist eine inverse Zahl des Beziehungswerts K_REL [K_i, K_j] einer bestimmten direkten Schlüsselwortverbindung (i, j), welche in dem Satz UC_k enthalten ist. Der Bewertungswert der indirekten Schlüsselwort-Verbindung C_k zwischen den Schlüsselworten K_p und K_q wird dadurch erhalten, daß der Term (S_ÿ×A_MP [N_ÿ])^-1 für alle die direkten Schlüsselwortverbindungen (ÿ) UC_k addiert wird. Der Dimension des Bewertungswertes ist 1/(Beziehungswert). Der Bewertungswert wird für alle die n indirekten Verbindungen C₁ bis C_n berechnet, und eine umgekehrte Zahl eines Minimalwertes der berechneten Bewertungswerte wird als der Beziehungswert K_REL [K_i, K_j] der indirekten Schlüsselwortverbindung erhalten.

Wenn die in Fig. 6 dargestellte Beziehungsinformation indirekte Schlüsselwortverbindungen sind, und der Wichtungskoeffizient der Einfachheit halber mit "1,0" angenommen wird, wird die in Fig. 7 dargestellte Schlüsselwort-Verbindungstabelle erhalten. Die in Fig. 7 dargestellte Tabelle zeigt die indirekten Schlüsselwortverbindungen und deren Beziehungswerte, die aus Fig. 6 erhalten worden sind.

In Fig. 7 werden sechs indirekte Schlüsselwortverbindungen erzeugt. Diese sechs indirekten Schlüsselwortverbindungen entsprechen dem vorstehend beschriebenen Fall (II) und werden aus der Formel (III) berechnet. Beispielsweise sind die Berechnungsschritte für die indirekte Schlüsselwortverbindung zwischen den Schlüsselworten "enterprise" und "communication" die folgenden:

Mit anderen Worten das folgende sind Beispiele der Wege zwischen den Schlüsselworten "enterprise" und "communication"

(1) "enterprise" → "company R" → "communication"
(2) "enterprise" → "BTT" → "communication"
(3) "enterprise" → "company R" → "BTT" → "communication"
(4) "enterprise" → "company R" → "nerve cell" → "communication"
(5) "enterprise" → "BTT" → "company R" → "communication"

Der Beziehungswert der indirekten Schlüsselworteverbindungen wird größer, wenn eine Anzahl dazwischenliegender Schlüsselworte in dem Weg zwischen den zwei Schlüsselworten "enterprise" und "communication" kleiner wird. Folglich kann erwogen werden, daß der oben angegebene Weg (1) oder (2) das Minimum (MIN ) der umgekehrten Zahl der Formel (3) ist. Die berechneten Werte für die zwei Wege (1) und (2) werden folgende:

(1) "enterprise " company R" communication".
Folglich gilt: Σ (S_ÿ × A_MP[N_ÿ])^-1 = 1/90 + 1/30 = 4/90 .
(2) "enterprise" "BTT" communication".
Somit gilt: Σ (S_ÿ × A_MP[N_ÿ])^-1 = 1/50 + 1/40 = 9/200 .

Daher ergibt sich:
K_REL ["enterprise", "communication")
= (MIN Σ (S_ÿ × A_MP[N_ÿ])^-1)^-1
= 90/40 = 22,5 .

Zusätzlich extrahiert der Schlüsselwort-Beziehungs-/Relevanz- Kalkulator 52 die diesbezüglichen Schlüsselworte, welche sich auf "company R" und "communication" beziehen und extrahiert auch die Beziehungswerte aus der in Fig. 7 dargestellten Schlüsselwort-Verbindungstabelle und berechnet die Relevanz der Worte. Zuerst werden die zwei Schlüsselworte "company R" und "communication" benutzt, um die in Fig. 7 dargestellte Schlüsselwort-Verbindungstabelle durchzusehen, um neue Beziehungsinformationen zu extrahieren, welche sich auf die zwei bestimmten Schlüsselworte beziehen. Die neun Beziehungsinformationen sind ["company R", "BTT" (technischer Zusammenhang, 50)], ["company R", "communication" (Untersuchung und Entwicklung 30)], ["company R", "nerve cell" (einschließlich demselben Text, 80)], ["company R", "enterprise" (IS-A, 90)], ["company R", "image" (einschließlich demselben Text, 80)], ["communication", "BTT" (Untersuchung und Entwicklung, 40)], ["communication", "nerve cell" (Synonym, 20)], ["communication", "enterprise" (indirekt, 22,5)] und ["communication", "image" (indirekt, 21,8)]. Eine beliebige Schlüsselwort-Relevanz kann mit Hilfe dieser Beziehung erhalten werden. In Fig. 7 ist die indirekte Beziehungsinformation durch Schraffieren angezeigt.

Als nächstes wird nunmehr das Verfahren zum Berechnen der Schlüsselwort-Relevanz beschrieben. Eine Relevanz KC des Schlüsselworts K_p kann durch die folgende Formel (5) beschrieben werden, wobei K_CLISTS einen Satz Schlüsselwortgruppen bezeichnet, für welche die Berechnung der Schlüsselwort- Relevanz durchzuführen ist, und Σ bezeichnet eine Gesamtsumme von K_REL, wenn die Schlüsselworte, welche in K_CLISTS enthalten sind, durch K_q ersetzt werden. Dieser Satz K_CLISTS wird durch den Benutzer bestimmt.

In dem Fall, wo K_CLISTS = ("company R", "communication") ist, kann die Relevanz KC des Schlüsselwortes "BTT" folgendermaßen berechnet werden:

KC [BTT, ("company R", "communication")]
= K_REL [K_p, K_q]
= K_REL [BTT, company R] + K_REL [BTT, communication]
= 50 + 40 = 90 .

Genauso kann die Relevanz KC der Schlüsselworte "nerve cell", "enterprise" und "image" berechnet werden, um KC [nerve cell, ("company R", "communication")] = 100, KC [enterprise, ("company R", "communication")] = 112,5 und KC [image, ("company R", "communication")] = 101,8 zu erhalten.

Der Sortierer 53 sortiert die Gruppe der diesbezüglichen Schlüsselworte, welche aus dem Kalkulator 52 in einer Folge, die von dem diesbezüglichen Schlüsselwort mit dem größten Beziehungswert beginnt und bis zu dem diesbezüglichen Schlüsselwort mit dem kleinsten Beziehungswert reicht, erhalten werden. Die sortierte Gruppe der diesbezüglichen Schlüsselworte wird der Tabellen-Steuereinheit 55 zugeführt. Die Tabellen-Steuereinheit 55 gibt die Gruppe der diesbezüglichen Schlüsselworte an die Anzeigeeinrichtung 50 ab, wo sie von dem Benutzer überwacht werden.

Auf diese Weise kann der Benutzer das geforderte Sachgebiet und Konzept in der Schlüsselwortgruppe durch den wechselweisen Betrieb zwischen dem Benutzer und dem Dokumenten-Wiedergewinnungssystem beeinflussen. Die Schlüsselwortgruppe wird durch Wiederholen des wechselseitigen Betriebs verfeinert, und die endgültige Schlüsselwortgruppe wird erhalten. Beispielsweise wählt der Benutzer die Schlüsselworte "company R", "communication", "image" und "nerve cell" als die endgültige Schlüsselwortgruppe aus, und diese endgültige Schlüsselwortgruppe wird zusammen mit der Dokumenten-Auswahlanforderung an den Anforderungsprozessor 54 geliefert.

Wenn der Prozessor 54 die Dokumenten-Auswahlanforderung erhält, überträgt der Prozessor 54 die Schlüsselwortgruppe an den Textrelevanz-Kalkulator 51. Gleichzeitig instruiert der Anforderungsprozessor 54 den Schlüsselwort-Verbindungsprozessor 52, die Beziehungswerte zu addieren, welche zu der endgültigen Schlüsselwortgruppe Bezug haben. Mit anderen Worten, die Beziehungswerte aller Schlüsselwortverbindungen, welche zu den Schlüsselworten Beziehung haben, welche in der Schlüsselgruppe, die erhalten worden ist, wenn die Vorlagen- Auswahlanforderung empfangen worden ist, enthalten sind, werden zu dem Lernkoeffizienten von beispielsweise +5 addiert, um so die Schlüsselwort-Verbindungstabelle zu erneuern. Wenn die vorhandene Schlüsselwort-Verbindungstabelle diejenige ist, welche in Fig. 7 dargestellt ist, und die bestimmte Schlüsselwortgruppe, die vier Schlüsselworte "company R", "communication", "image" und "nerve cell" enthält, wird die in Fig. 8 dargestellte Schlüsselwort-Verbindungstabelle dadurch erhalten, daß der Lernkoeffizient "+5" zu den Beziehungswerten der Schlüsselwort-Verbindungen addiert wird, welche zu diesen vier Schlüsselworten einen Bezug haben. Der Lernkoeffizient "+5" wird addiert, wenn nur eines der Schlüsselworte an den Enden der Schlüsselwortverbindung bestimmt ist, und der Lernkoeffizient "+10" wird addiert, wenn beide Schlüsselworte an den Enden der Schlüsselwortverbindung bestimmt werden.

Wenn die Schlüsselwort-Verbindungstabelle erneuert wird, wird auch eine neue Schlüsselwortverbindung, welche vor der Dokumenten-Wiedergewinnung nicht existiert, erzeugt. Der neuen Schlüsselwortverbindung wird ein Beziehungsname "access" (Zugriff) und ein vorherbestimmter Anfangswert von beispielsweise "50" als der Beziehungswert gegeben.

Der Textrelevanz-Kalkulator 51 benutzt die empfangene Schlüsselwortgruppe und die in Fig. 7 dargestellte Schlüsselwort- Verbindungstabelle, um die Textrelevanz für das zu registrierende Dokument 11 zu berechnen, und überträgt das berechnete Ergebnis an den Sortierer 53. Beispielsweise kann die Textrelevanz dadurch berechnet werden, daß eine Gesamtsumme der Beziehungswerte zwischen den ausgewählten Schlüsselworten und den in der Datei 21 gespeicherten Schlüsselworten erhalten wird und die Gesamtsumme normiert wird. Wenn die ausgewählten Schlüsselworte beispielsweise "company R", "communication", "image" und "nerve cell" sind, wird die Textrelevanz für diese vier ausgewählten Schlüsselworte und das in Fig. 3A dargestellte, zu registrierende Dokument folgendermaßen berechnet. Das heißt, die vier ausgewählten Schlüsselworte werden verwendet, um die in Fig. 7 dargestellte Schlüsselwort- Verbindungstabelle durchzusehen, und die Beziehungswerte "80" für ["company R", "nerve cell"], "80" für ["company R", "image"], "30" ["communication", "company R"], "20" für ["communication", "nerve cell"], "80" für ["image", "company R"], "80" für ["image", "nerve cell"], "80" für ["nerve cell", "company R"] und "80" ["nerve cell", "image"] werden erhalten. Die Beziehungswerte werden addiert, um die Gesamtsumme "530" (= 80 + 80 + 30 + 20 + 80 + 80 + 80 + 80) zu erhalten. Wenn außerdem die ausgewählten Schlüsselworte, wie "company R", "image" und "nerve cell" selbst in der in Fig. 3C dargestellten Schlüsselwortgruppe des zu registrierenden Dokuments 11 enthalten sind, wird "100" zu den Beziehungswerten jeder dieser drei ausgewählten Schlüsselworte hinzuaddiert. Die Gesamtsumme "530", welche mit "100×3" addiert worden ist, wird dadurch normiert, daß durch vier geteilt wird, welches die Anzahl an ausgewählten Schlüsselworten ist. Folglich ist der normierte Wert "207,5" (=[530+ (100×3)]/4). Die Textrelevanz wird auf diese Weise für alle die registrierten Texte berechnet, dann sortiert, um auf der Anzeigeeinrichtung 70 dargestellt zu werden.

Folglich werden gemäß der in Fig. 2 dargestellten Ausführungsform das zu registrierende Dokument 11, welches durch den Schlüsselwort-Extraktionsteil 10 und dessen bibliographische Information 12 erhalten worden ist, in den Dokumenten- Informationsmanager 20 eingegeben. Außerdem liefert der Schlüsselwort-Extraktionsteil 10 das zu registrierende Dokument 11 und die daraus extrahierten Schlüsselworte an den Schlüsselwort-Verbindungstabellen-Prozessor 30 und an den Generator 40 für die invertierte Datei. In dem Prozessor 30 wird eine neue Beziehungsinformation zu der Schlüsselwort- Verbindungstabelle addiert, was auf der Beziehung, wie beispielsweise "including same text" basiert. Wenn beispielsweise die Schlüsselwort-Verbindungstabelle vor der Dokumentenregistrierung so ist, wie in Fig. 5 dargestellt und der in Fig. 3A dargestellte Dokumententext registriert ist, wird die Kennwort-Verbindungstabelle so, wie in Fig. 6 dargestellt. In Fig. 6 werden drei neue Verbindungen hinzugefügt. Diese drei neuen Verbindungen sind ["company R", "nerve cell" (einschließlich desselben Textes, 80)], ["company R", "image" (einschließlich desselben Textes, 80)] und ["nerve cell", "image" (einschließlich desselben Textes, 80)]. Andererseits werden in dem umgekehrten Datei-Generator 40 die entsprechenden Beziehungen zwischen den neuen Schlüsselworten und den registrierten Dokumententexten zu der invertierten Datei hinzugefügt.

In dem Dokumenten-Auswählteil 50 erhält der Anforderungsprozessor 54 zuerst die Anzeige- und Wiedergewinnungsanforderungen von dem Benutzer. Im Falle der Schlüsselwort-Anzeigeanforderung werden die Ergebnisse, welche von dem Kalkulator 52 erhalten worden sind, in dem Sortierer 53 sortiert, und die Anzeigesteuereinheit 55 stellt eine Liste von Schlüsselworten auf der Anzeigeeinrichtung 70 dar. Andererseits werden im Falle der Text-Anzeigeanforderung die Ergebnisse, welche von dem Kalkulator 51 erhalten worden sind, in dem Sortierer 53 sortiert, und die Anzeigesteuereinheit 55 stellt eine Liste von Texten auf der Anzeigeeinrichtung 70 dar. Wenn der Benutzer eine Anzahl Schlüsselworte bestimmt, wird zuerst eine Schlüsselwortliste mit einer strengen Beziehung zu den benannten Schlüsselworten auf der Anzeigeeinrichtung 70 dargestellt. Aus diesem Grund kann der Benutzer wieder Schlüsselworte aus der dargestellten Liste auswählen. Durch Wiederholen einer solchen Operation zum Auswählen der Schlüsselworte kann der Benutzer nach und nach die Schlüsselwortgruppe verfeinern, die sich für das Dokument eignet, welches wiederzugewinnen ist.

Der Betrieb des in Fig. 2 dargestellten Dokumenten-Auswählteils 50 kann mittels eines Computers durchgeführt werden, und nunmehr wird die Arbeitsweise eines solchen Computers beschrieben. In Fig. 11ist eine Ausführungsform eines Betriebs eines Computers zum Durchführen der Funktionen des in Fig. 2 dargestellten Anforderungsprozessors 54 dargestellt. In Fig. 11 wird beim Schritt S1 unterschieden, ob eine Anforderung von der Eingabetastatur 60 aus eingegeben ist oder nicht. Wenn das Ergebnis beim Schritt S1 ja wird, wird beim Schritt S2 unterschieden, ob die Anforderung eine Anforderung zum Berechnen der Schlüsselwort-Relevanz ist oder nicht. Wenn das Ergebnis beim Schritt S2 ja ist, wird beim Schritt S3 der Kalkulator 52 instruiert, eine Liste der Schlüsselwort- Relevanz an den Sortierer 53 zu liefern. Beim Schritt S4 werden dann an den Kalkulator 52 die Wiedergewinnungsbedingungen, wie beispielsweise die Schlüsselworte, transferiert.

Wenn das Ergebnis beim Schritt S2 nein ist, wird beim Schritt S5 unterschieden, ob die Anforderung eine Anforderung zum Berechnen der Textrelevanz ist oder nicht. Wenn das Ergebnis beim Schritt S5 ja ist, wird beim Schritt S6 der Kalkulator 52 instruiert, die Liste der Schlüsselwort-Relevanz an den Textrelevanz-Kalkulator 51 zu liefern. Es wird dann bei dem Schritt S4 weitergemacht.

Wenn das Ergebnis beim Schritt S5 nein ist, wird beim Schritt S7 unterschieden, ob die Anforderung eine Anforderung zum Anzeigen des Inhalts des Dokumententextes ist oder nicht. Beim Schritt S8 wird die Dokumentennummer an die Anzeige- Steuereinheit 55 übertragen, wenn das Ergebnis beim Schritt S7 ja ist. Wenn dagegen das Ergebnis beim Schritt S7 nein ist, wird beim Schritt S9 unterschieden, ob die Anforderung eine Endanforderung ist oder nicht. Das Verfahren ist beendet, wenn das Ergebnis beim Schritt S9 ja ist; jedoch wird beim Schritt S10 eine Nachricht an die Anzeige-Steuereinheit 55 geliefert, einen Anforderungsfehler auf der Anzeigeeinrichtung 70 anzuzeigen, wenn das Ergebnis beim Schritt S9 nein ist.

In Fig. 12 ist eine Form einer Arbeitsweise eines Computers zum Durchführen der Funktionen des in Fig. 2 dargestellten Schlüsselwort-Beziehungs-/Relevanz-Kalkulators 52 dargestellt. In Fig. 12 wird beim Schritt S11 unterschieden, ob eine Eingabe von dem Anforderungsprozessor 54 festgestellt wird oder nicht. Wenn das Ergebnis beim Schritt S11 ja ist, wird beim Schritt S12 unterschieden, ob der festgestellte Eingang die Anforderung zum Berechnen einer Textrelevanz ist oder nicht. Wenn das Ergebnis beim Schritt S12 ja ist, wird beim Schritt S13 die Textrelevanz für alle Schlüsselworte auf der Basis der Schlüsselwort-Verbindungstabelle und der Wiedergewinnungsbedingungen, welche die Schlüsselworte einschließen, berechnet. Dann wird beim Schritt S14 die Textrelevanz für alle Schlüsselworte an den Sortierer 53 geliefert.

Wenn jedoch das Ergebnis beim Schritt S12 nein ist, wird beim Schritt S15 unterschieden, ob der festgestellte Eingang die Anforderung zum Berechnen der Schlüsselwortrelevanz ist oder nicht. Wenn das Ergebnis beim Schritt S15 ja ist, wird beim Schritt S26 die Schlüsselwortrelevanz für alle Schlüsselworte auf der Basis der Schlüsselwort-Verbindungstabelle und der Wiedergewinnungsbedingungen, welche die Schlüsselworte einschließen, berechnet. Beim Schritt S17 wird dann die Schlüsselwortrelevanz für alle Schlüsselworte an den Textrelevanz- Kalkulator 51 geliefert.

Wenn das Ergebnis beim Schritt S15 nein ist, wird beim Schritt S18 eine Nachricht der Anzeigesteuereinheit 55 zugeführt, einen Anforderungsfehler auf der Anzeigeeinrichtung 70 anzuzeigen.

In Fig. 13 ist eine Form einer Betriebsweise eines Computers zum Berechnen der Funktionen des in Fig. 2 dargestellten Textrelevanzkalkulators beschrieben. In Fig. 13 wird beim Schritt S21 unterschieden, ob ein Eingang von dem Schlüsselwort-Beziehungs-/ Relevanz-Kalkulator 52 festgestellt ist oder nicht. Wenn das Ergebnis beim Schritt S21 ja ist, wird beim Schritt S22 die Textrelevanz für jeden der registrierten Dokumententexte auf der Basis der Schlüsselwort-Relevanzliste und der aus der Datei 41 ausgelesenen umgekehrten Datei berechnet. Zusätzlich wird beim Schritt S23 eine Liste von Sätzen der Dokumenten-Textnamen und von Textrelevanzen an den Sortierer 53 geliefert, so daß diese Liste von dem Sortierer 53 an die Anzeigesteuereinheit 55 als eine Relevanzliste von Texten geliefert wird, welche in ihrer Reihenfolge in Abhängigkeit von der Größe der Textrelevanz sortiert werden.

In Fig. 14 ist eine Form einer Betriebsweise eines Computers zum Durchführen der Funktionen des in Fig. 2 dargestellten Sortierers 53 dargestellt. In Fig. 14 wird beim Schritt S31 unterschieden, ob ein Eingang von dem Kalkulator 52 festgestellt ist oder nicht. Wenn das Ergebnis beim Schritt S31 ja ist, werden beim Schritt S32 die Schlüsselworte in Abhängigkeit von der Größe der Schlüsselwortrelevanz in einer Folge sortiert, um so eine Liste der Schlüsselworte zu bilden, welche in der Folge der Schlüsselwortrelevanz angeordnet sind. Beim Schritt S33 wird dann diese Liste der Anzeigesteuereinheit 55 zugeführt.

Wenn dagegen die Entscheidung beim Schritt S31 nein ist, wird beim Schritt S34 unterschieden, ob eine Eingabe von dem Textrelevanz-Kalkulator 51 festgestellt ist oder nicht. Wenn das Ergebnis beim Schritt S34 ja ist, werden beim Schritt S35 die Dokumententexte in Abhängigkeit von der Größe der Relevanz der Texte in einer Reihenfolge sortiert, um eine Liste der Dokumententexte zu schaffen, welche in der Reihenfolge der Textrelevanz angeordnet sind. Beim Schritt S36 wird dann diese Liste der Anzeigesteuereinheit 55 zugeführt.

In Fig. 15 ist eine Form einer Arbeitsweise eines Computers zum Durchführen der Funktionen der in Fig. 2 dargestellten Anzeigesteuereinheit 55 dargestellt. In Fig. 15 wird beim Schritt S41 unterschieden, ob eine Eingabe von dem Sortierer 53 festgestellt ist oder nicht. Wenn das Ergebnis beim Schritt S41 ja ist, wird beim Schritt S42 unterschieden, ob der festgestellte Eingang die Liste der Schlüsselworte ist oder nicht, welche in der Reihenfolge der Schlüsselwort-Relevanz angeordnet sind. Beim Schritt S43 werden die Schlüsselwortrelevanz und die Schlüsselwortnamen auf der Anzeigeeinrichtung 70 dargestellt, wenn das Ergebnis beim Schritt S42 ja ist.

Wenn dagegen das Ergebnis beim Schritt S42 nein ist, wird beim Schritt S44 unterschieden, ob der festgestellte Eingang die Liste der Dokumententexte ist oder nicht, welche in der Reihenfolge der Textrelevanz angeordnet sind. Beim Schritt S45 werden dann die Relevanz von Texten und die Dokumententextnamen auf der Anzeigeeinrichtung 70 angezeigt, wenn das Ergebnis beim Schritt S44 ja ist.

Beim Schritt S46 wird eine Fehlernachricht an der Anzeigeeinrichtung 70 dargestellt, wenn das Ergebnis beim Schritt S44 nein ist. Wenn das Ergebnis beim Schritt S41 nein ist, wird beim Schritt S47 unterschieden, ob ein Eingang von dem Anforderungsprozessor 54 festgestellt ist oder nicht. Wenn das Ergebnis beim Schritt S47 ja ist, wird beim Schritt S48 auf der Anzeigeeinrichtung 70 der Inhalt des Vorlagentextes angezeigt, welcher der Vorlagennummer entspricht, welche von dem Anforderungsprozessor 54 empfangen worden ist.

Als nächstes wird im einzelnen die dynamische Schlüsselwortverbindung beschrieben, welche einen wesentlichen Teil der vorliegenden Erfindung darstellt. Ein Netzmodell mit der dynamischen Schlüsselwortverbindung ist ein nicht-gerichteter Graph, in welchem Schlüsselworte als Knotenpunkte Key 1 bis Key 4 so, wie in Fig. 16 dargestellt, genommen werden, und die Beziehungsinformation zwischen den Schlüsselworten als Bogen A12, A13, A14, A23 und A34 genommen werden, welche die Knotenpunkte Key 1 bis Key 4 verbinden. Die Beziehungsinformation enthält den Beziehungsnamen und den Beziehungswert. Das Netz selbst hat eine Lernfunktion infolge einer Selbststeuerung der Beziehungsinformation, welche unabhängig von äußeren Anregungen auftritt.

Der Beziehungswert zeigt die Amplitude der Beziehung an, und dieser Beziehungswert ändert sich in Abhängigkeit von der Zugriffshäufigkeit der Schlüsselworte (Knotenpunkte), welche durch Schlüsselwortverbindungen (Bogen) verbunden sind. In Fig. 17 ist die Umwandlung des Netzwerks vor und nach der Dokumentenregistrierung dargestellt.

Der Benutzer bestimmt das Schlüsselwort, wenn die Dokumentenwiederauffindung durchgeführt wird. Das Dokumenten-Wiederauffindungssystem ist eine Art Datenbasis-Managementsystem, welches einen Zugriff zu dem Schlüsselwort macht und es anzeigt und gleichzeitig einen konstanten Lernkoeffizienten zu dem Beziehungswert der Schlüsselwortverbindung hinzufügt, welche mit dem Schlüsselwort verbunden ist. Dieser konstante Lernkoeffizient, welcher zu der Schlüsselwortverbindung hinzugefügt worden ist, kann abhängig von der Datenbeziehung sein, um so in Abhängigkeit von dem Beziehungsnamen verschiedene Werte hinzuzufügen. Es ist natürlich auch möglich, eine Anzahl Schlüsselworte zu bestimmen, und ähnliche Verarbeitungsvorgänge für alle Schlüsselwortverbindungen durchzuführen, welche mit dem Schlüsselwort verbunden sind, zu welchem der Zugriff erfolgt ist.

Wenn der Beziehungswert einen voreingestellten Maximalwert überschreitet, werden die Beziehungswerte aller Schlüsselwortverbindungen normiert. Dies kann dadurch erreicht werden, daß beispielsweise einfach ein konstanter Wert von den Beziehungswerten subtrahiert wird. Folglich erhöht sich der Mittelwert der Beziehungswerte der Schlüsselwortverbindungen, welche mit den Schlüsselworten verbunden sind, zu welchen der Zugriff erfolgt ist, häufig nach und nach, während der Mittelwert der Beziehungswerte der Schlüsselwortverbindungen, welche mit den Schlüsselworten verbunden sind, zu welchen kaum ein Zugriff erfolgt, nach und nach abnimmt.

Bei einer Dokumenten-Wiedergewinnung ist es möglich, mit Hilfe eines Schlüsselworts, welches mit dem Schlüsselwort verbunden ist, welches durch den Benutzer durch eine indirekte Schlüsselwortverbindung verbunden ist, welche einen Beziehungswert hat, der größer als ein vorherbestimmter Wert ist, eine verschwommene Bezugnahme herzustellen.

Das Dokumenten-Wiedergewinnungssystem kann erforderlichenfalls eine "Abfall"-Sammlung der Schlüsselworte bzw. eine Löschung unerwünschter Speicherinhalte durchführen, um die Schlüsselworte zu löschen, welche nicht oder selten benutzt werden, um so die erforderliche Speicherkapazität für die Schlüsselworte zu verringern. Bei einer solchen "Abfall"- Sammlung können diese Schlüsselworte gelöscht werden, welche Schlüsselwortverbindungen mit solchen Beziehungswerten haben, bei welchen eine Gesamtsumme der Beziehungswerte, ein Maximalwert der Beziehungswerte oder ein Mittelwert der Beziehungswerte kleiner als ein vorherbestimmter Wert ist. Eine derartige "Abfall"-Sammlung kann durch das Zusammenwirken des Sortierers 53 und der Anzeigesteuereinrichtung 55 entsprechend einer "Abfall"-Sammlungsanforderung durchgeführt werden, welche in dem Anforderungsprozessor 54 verarbeitet worden ist.

Eine Anzahl Schlüsselworte kann gesammelt bzw. zusammengefügt werden, wenn die Beziehung dieser Schlüsselworte "also known as" und/oder "synonym" sind, die Beziehungswerte extrem groß sind und die Schlüsselwortverbindungen einen vollständigen Graphen bilden. Einer Menge, welche durch die gesammelten Schlüsselworte gebildet ist, kann dann ein Mengenname gegeben werden. Die Verwendung solcher Mengen macht die Verwaltung der Schlüsselworte effizient, da das Innere jeder Menge diesbezüglich in Form einer Liste beschrieben werden kann. Fig. 18 zeigt eine Form der gesammelten Schlüsselworte. Eine Menge 100 wird aus Schlüsselworten 101 bis 105 gebildet, welche durch Schlüsselwortverbindungen C verbunden sind. Eine Schlüsselwortverbindung CX kann mit einem (nicht dargestellten) Schlüsselwort verbunden sein, um die Menge 100 mit diesem Schlüsselwort zu verbinden, oder die Schlüsselwortverbindung CX kann mit einer anderen (nicht dargestellten) Menge verbunden sein, um die Menge 100 mit dieser anderen Menge zu verbinden.

Die "Abfall"-Sammlung und die Mengenbildung bzw. -ansammlung sind wirksame Mittel, um eine schlagartige Zunahme bei den Kombinationen der Schlüsselworte zu verhindern. Die Dokumenten- Textnamen einschließlich der Schlüsselworte können im vorhinein in Form einer Liste vorbereitet werden. Die Notwendigkeit einer adaptiven, invertierten Datei kann durch die Größe einer Gesamtsumme der Beziehungswerte der Schlüsselwortverbindungen festgelegt werden, welche mit den Schlüsselworten verbunden sind. Die adaptive, invertierte Datei kann mit Hilfe einer frei verfügbaren Zeit erzeugt werden, nachdem der Benutzer einen neuen Text eingibt, indem ein Wiedergewinnungsprogramm parallel zu einem Hauptprogramm läuft.

Als nächstes wird ein automatischer Indizierungs-Trägeralgorithmus und ein Dokumentenregistrierungs-Algorithmus beschrieben. Zuerst wird auf einen in Fig. 17 dargestellten Text Bezug genommen, welcher zu registrieren ist, und Schlüsselworte , und , welche verwendet werden, werden aus der Gruppe Schlüsselworte extrahiert, welche in der vorliegenden Schlüsselwortlage enthalten sind. Dann überprüft der Benutzer die extrahierten Schlüsselworte , und und gibt ein neues Schlüsselwort ein, das zusätzlich zu registrieren ist, wenn der Benutzer beurteilt, daß das neue Schlüsselwort erforderlich ist. In diesem Fall braucht der Benutzer nicht die Klassifizierung (Indexierung) des neuen Schlüsselworts zu bestimmen und reicht einfach aus, das neue Schlüsselwort einzugeben. Andererseits ist es natürlich auch möglich, automatisch die extrahierten Schlüsselworte , und anzuzeigen und den Benutzer die Beziehung des neuen Schlüsselworts bezüglich der angezeigten Schlüsselworte und bestimmen zu lassen.

Das Dokumenten-Wiedergewinnungssystem beurteilt, daß das neue Schlüsselwort zu den extrahierten Schlüsselworten , und Bezug hat und setzt das neue Schlüsselwort in die Nähe der extrahierten Schlüsselworte , und , welche zueinander Bezug haben, wie in Fig. 17 dargestellt ist. Danach werden neue Schlüsselwortverbindungen zwischen dem neuen Schlüsselwort und den extrahierten Schlüsselworten , und gebildet, welche bezug miteinander haben.

Es ist wünschenswert, daß die Schlüsselwortverbindung sehr von dem Vorlagentext abhängt, da die Bezugnahme auf den Vorlagentext auf den Schlüsselworten basiert. Entsprechend dem dynamischen Schlüsselwort-Verbindungsverfahren, das bei der Erfindung angewendet wird, ist die Klassifizierung (Indexierung) der Schlüsselworte nicht eindeutig und ändert sich dynamisch, da es von dem registrierten Dokumententext abhängt. Außerdem ist es möglich, eine Schlüsselwortverbindung zu bilden, welche dem Vokabular oder dem Bild bzw. der Vorstellung des Benutzers nahe kommt, und der Benutzer kann daher interaktiv ein geeignetes Schlüsselwort auswählen, da das Dokumenten-Wiedergewinnungssystem die Lernfunktion hat, und die Schlüsselwortlage von selbst lernt. Ferner ist es möglich, die Abhängigkeit des Dokumenten-Wiedergewinnungssystems von der Bedienungsperson, welche anfangs die Schlüsselworte registriert, vollständig auszuschließen, und es gibt keine Notwendigkeit, die Klassifizierung (Indexierung) der Schlüsselworte zu bestimmen. Daher schafft die vorliegende Erfindung ein benutzerfreundliches Vorlagen-Wiedergewinnungssystem.

Durch das Erzeugen eines Schwellenwerts bezüglich der Schlüsselwortrelevanz ist es möglich, für die Dokumenten- Wiedergewinnung die Schlüsselworte zu benutzen, welche eine Schlüsselwortrelevanz haben, die größer als der Schwellenwert ist. Zusätzlich ist die Registrierung und die Wiedergewinnung des Dokuments bei der Erfindung im Vergleich zu den herkömmlichen Systemen, wie dem Thesaurus-Dokumenten-Wiedergewinnungssystem, das die feste Schlüsselwortklassifizierung (Indexierung) hat, erheblich flexibler und leichter. Dies bedeutet, daß das Verarbeiten der Synonyme, eine verschwommene Verarbeitung u. ä. bei der Erfindung mit hoher Geschwindigkeit durchgeführt werden kann.

In der beschriebenen Ausführungsform wird der wiedergewonnene Dokumententext auf der Anzeigeeinrichtung 70 dargestellt. Jedoch ist die Einrichtung zum Ausgeben des wiedergewonnenen Dokumententextes nicht auf die Anzeigeeinrichtung 70 beschränkt; vielmehr kann der wiedergewonnene Dokumententext in einem Drucker oder sowohl in einem Drucker als auch auf einer Anzeigeeinrichtung ausgegeben werden.

Wenn die registrierten Dokumente von der Dokumenten-Datenbasis aus wiedergewonnen werden, können ein oder eine Anzahl registrierter Dokumente den von dem Benutzer eingegebenen Wiedergewinnungsbedingungen genügen. Bei der beschriebenen Ausführungsform ist jedoch der Einfachheit halber angenommen, daß ein registriertes Dokument den Wiedergewinnungsbedingungen genügt.

Claims

1. Verfahren zur Wiedergewinnung von Dokumenten, um ein oder eine Anzahl registrierter Dokumente aus einer Dokumenten-Datenbasis entsprechend bestimmter Wiedergewinnungsbedingungen, welche ein oder eine Anzahl benannter Schlüsselworte einschließen, wiederzugewinnen, bestehend aus den folgenden Schritten:

a) mittels einer Extrahiereinrichtung (10) werden Schlüsselworte aus jedem der zu registrierenden Dokumente extrahiert;
b) eine Einrichtung (40) erzeugt mit den Dokumenten und den von der Extrahiereinrichtung (10) extrahierten Schlüsselworten eine invertierte Datei, die eine Beziehung zwischen den extrahierten Schlüsselworten und jedem der Dokumente aufzeigt;
c) eine Speichereinrichtung (21, 31, 41) speichert die invertierte Datei, die extrahierten Schlüsselworte und die Dokumente als registrierte Dokumente in Form einer Dokumenten-Datenbasis;
d) über eine Eingabeeinrichtung (60) werden mittels eines oder einer Anzahl bestimmter Schlüselworte die Wiedergewinnungsbedingungen für ein oder eine Anzahl der registrierten Dokumente festlegt;
e) eine Wähleinrichtung (50) wählt über die invertierte Datei das oder die Anzahl registrierter Dokumente aus, die den Wiedergewinnungsbedingungen genügen, und
f) eine Ausgabeeinrichtung (70) gibt das oder die Anzahl mittels der Wähleinrichtung ausgewählter registrierter Dokumente aus,
gekennzeichnet durch die folgenden Schritte:
g) eine weitere Einrichtung (30) generiert aus den extrahierten Schlüsselworten eine Schlüsselwort-Verbindungstabelle (Fig. 4), die Beziehungs informationen enthält, die zwischen jeweils zwei der insgesamt extrahierten Schlüsselworte bestehen;
h) die Speichereinrichtung (21, 31, 41) speichert die Schlüssel wort-Verbindungstabelle in der Dokumenten-Datenbasis und
i) die Wähleinrichtung (50) wählt über die invertierte Datei registrierte Dokumente aus, indem mit Hilfe eines oder einer Anzahl bestimmter Schlüsselworte über die Schlüsselwort-Verbindungstabelle (Fig. 4) auf die invertierte Datei Bezug genommen wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeich net, daß die weitere Einrichtung (30) eine Schlüsselwort-Verbindungstabelle (4) derart erzeugt, daß die Bezie hungsinformationen einer Beziehung zumindest jeweils einen Beziehungsnamen und jeweils einen Wert enthalten, wobei der Wert der Beziehung eine Amplitude der Beziehung anzeigt.

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Amplitude der Beziehung davon abhängt, ob zwei beliebige Schlüsselworte unmittelbar durch eine direkte Schlüsselwortverbindung oder indirekt durch eine indirekte Schlüsselwortverbindung über ein oder eine Anzahl Schlüsselworte außer den zwei beliebigen Schlüsselworten verbunden sind.

4. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß der Wert einer Beziehung K_REL [K_p, K_q] einer Schlüsselwortverbindung (p, q) zwischen zwei beliebigen Schlüsselworten K_p und K_q als K_REL [K_p, K_q] = f [S_ÿ, N_ÿ, p, q] mit Hilfe eines Beziehungsnamens N_ÿ und eines Beziehungswerts S_ÿ einer Schlüsselwortverbindung (i, j) ∈ UC_ALL zwischen Schlüsselworten K_i und K_j definiert wird, welche in einer Schlüsselwortlage existieren, wobei UC_ALL einen Satz Schlüsselwortverbindungen zwischen den Schlüsselworten K_i und K_j in der Schlüsselwortlage und K_p, K_q, K_i bzw. K_j Schlüsselworte p, q, i und j bezeichnen.

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Funktion f [S_ÿ, N_ÿ, p, q] = S_ÿ × A_MP [N_ÿ] verwendet wird, wenn eine direkte Schlüsselwortverbindung zwischen den zwei Schlüsselworten K_p und K_q besteht, wobei A_MP [N_ÿ] einen Richtungskoeffizienten bezeichnet, welcher in Abhängigkeit von dem Beziehungsnamen verschieden ist.

6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Funktion verwendet wird, wenn keine direkte Schlüsselwortverbindung zwischen den zwei Schlüsselworten K_p und K_q aber eine oder mehr indirekte Schlüsselwortverbindungen zwischen den zwei Schlüsselworten K_p und K_q bestehen, wobei C₁ bis C_n Nummern von indirekten Schlüsselwortverbindungen bezeichnen, UC_k einen Satz direkter Schlüsselwortverbindungen bezeichnet, welche indirekte Schlüsselwortverbindungen C_k darstellen, Σ eine Gesamtsumme der direkten Schlüsselwortverbindungen (i, j) einschließlich UC_k bezeichnet und MIN einen Minimalwert der Beziehungswerte zwischen den n indirekten Schlüsselwortverbindungen C₁ bis C_n bezeichnet.

7. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Funktion f [S_ÿ, N_ÿ, p, q] = 0 verwendet wird, wenn keine direkte Schlüsselwortverbindung zwischen den zwei Schlüsselworten K_p und K_q besteht, und keine indirekte Schlüsselwortverbindung zwischen den zwei Schlüsselworten K_p und K_q besteht.

8. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Amplitude der Beziehung davon abhängt, ob zwei beliebige Schlüsselworte unmittelbar durch eine direkte Schlüsselwortverbindung oder indirekt durch eine indirekte Schlüsselwortverbindung über ein oder eine Anzahl Schlüsselworte außer den zwei beliebigen Schlüsselworten miteinander verbunden sind, und ob der Wert der Beziehung, welche in der Schlüsselwort-Verbindungstabelle (Fig. 4) enthalten ist, sich in Abhängigkeit von der direkten Schlüsselwortverbindung dynamisch jedesmal dann ändert, wenn ein Dokument in der Speichereinrichtung (21, 31, 41) registriert wird.

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß der Wert der Beziehung, welche in der Schlüsselwort- Verbindungstabelle (Fig. 4) enthalten ist, ferner dynamisch in Abhängigkeit von der indirekten Schlüsselwortverbindung verändert wird.

10. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß der Wert der Beziehung, welcher in der Schlüsselwort- Verbindungstabelle (Fig. 4) enthalten ist, ferner dynamisch in Abhängigkeit von einer Benutzungshäufigkeit der Schlüsselworte verändert wird.

11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß ein Lernkoeffizient in Abhängigkeit von der Benutzungshäufigkeit der Schlüsselworte zu dem Wert der Beziehung addiert wird.

12. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die Beziehungsinformationen, welche in der Schlüsselwort- Verbindungstabelle (Fig. 4) enthalten sind, von den Anfangswerten ausgehend in Abhängigkeit von einer Benutzungshäufigkeit der Schlüsselworte dynamisch verändert werden.

13. Verfahren nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, daß Beziehungsinformationen, welche in der Schlüsselwort- Verbindungstabelle (Fig. 4) enthalten sind, jedesmal dann erneuert werden, wenn ein bestimmtes registriertes Dokument wieder aufgefunden wird, wobei das Erneuern der Schlüsselwort-Verbindungstabelle (Fig. 4) ein Hinzufügen von Beziehungsinformationen einer neuen Schlüsselwortverbindung einschließt.

14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß die weitere Einrichtung (30) eine Schlüsselwort-Verbindungstabelle (Fig. 4) erzeugt, welche Beziehungsinformationen enthält, welche zumindest einen Beziehungsnamen und einen Wert einer Beziehung der Schlüsselwortverbindung einschließen, wobei der Wert der Beziehung eine Amplitude der Beziehung anzeigt, und die weitere Einrichtung (30) einen vorherbestimmten Beziehungsnamen dem Beziehungsnamen und einen vorherbestimmten Wert der Beziehung der neuen Schlüsselwortverbindung zuordnet.

15. Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß die Wähleinrichtung (50) einen Anforderungsprozessor (54) zum Verarbeiten von Anforderungen einschließlich einer Dokumenten-Wiedergewinnungsanforderung von der Eingabeeinrichtung (60), einen ersten Berechnungsteil (52), welcher mit der Speichereinrichtung (21, 31, 41) verbunden ist, um eine Schlüsselwort-Relevanz zu berechnen, welche die Amplitude der Beziehung zwischen einer Gruppe bestimmter Schlüsselworte von der Eingabeeinrichtung (60) aus und jedes der in der Speichereinrichtung (21, 31, 41) registrierten Schlüsselworte entsprechend der von dem Anforderungsprozessor verarbeiteten Anforderung anzeigt, einen zweiten Berechnungsteil (51), welcher mit der Speichereinrichtung (21, 31, 41) verbunden ist, um eine Textrelevanz zu berechnen, welche die Amplitude der Beziehung zwischen der Gruppe bestimmter Schlüsselworte von der Eingabeeinrichtung (60) aus und jedes der Dokumente, welche in der Speichereinrichtung (21, 31, 41) registriert sind, entsprechend der in dem Anforderungsprozessor (54) verarbeiteten Anforderung anzeigt, und eine Steuereinrichtung (55) aufweist, um Information einschließlich des registrierten Dokuments von der Speichereinrichtung (21, 31, 41) aus zu steuern, welche in die Ausgabeeinrichtung (70) in Abhängigkeit von Berechnungsergebnissen auszugeben ist, welche in den ersten und zweiten Berechnungsstellen (52, 51) enthalten sind.

16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, daß der zweite Berechnungsteil (51) die Textrelevanz berechnet, indem eine Gesamtsumme der Werte der Beziehungen zwischen den bestimmten Schlüsselworten und den in der Speichereinrichtung (21, 31, 41) registrierten Schlüsselworten erhalten wird, und indem die Gesamtsumme normiert wird.

17. Verfahren nach Anspruch 15, dadurch gekennzeichnet, daß ferner ein Sortierer (53) zum Sortieren der Berechnungsergebnisse vorgesehen ist, welche der Steuereinrichtung (55) von den ersten und zweiten Berechnungsteilen (52, 51) aus zugeführt werden, wobei der Sortierer (53) die Berechnungsergebnisse in Abhängigkeit von dem Wert der Beziehung in einer entsprechenden Reihenfolge sortiert.

18. Verfahren nach Anspruch 17, dadurch gekennzeichnet, daß der Sortierer (53) und die Steuereinrichtung (55) entsprechend einem von dem Anforderungsprozessor (54) verarbeiteten Befehl zur Beseitigung eines unerwünschten Speicherinhalts zusammenarbeiten, wobei der Befehl aus der Speichereinrichtung (21, 31, 41) die Schlüsselworte löscht, welche Schlüsselwortverbindungen mit solchen Beziehungswerten haben, bei denen eine Gesamtsumme der Beziehungswerte, ein Maximalwert der Beziehungswerte oder ein Mittelwert der Beziehungswerte kleiner als ein vorherbestimmter Schwellenwert ist.

19. Verfahren nach einem der Ansprüche 1 bis 18, dadurch gekennzeichnet, daß eine Anzahl Schlüsselworte so angehäuft wird, daß die Schlüsselwort-Verbindungen einen vollständigen Graphen bilden.

20. Verfahren nach einem der Ansprüche 1 bis 19, dadurch gekennzeichnet, daß die Wähleinrichtung (50) das eine oder eine Anzahl registrierter Dokumente mit einer Beziehungsinformation auswählt, deren Wert größer als ein Schwellenwert ist.

21. Verfahren nach Anspruch 20, dadurch gekennzeichnet, daß die Wähleinrichtung (50) eine Einrichtung (52) zum Berechnen einer Kennwortrelevanz aufweist, welche eine Amplitude der Beziehung zwischen einer Gruppe von bestimmten Schlüsselworten von der Eingabeeinrichtung (60) aus und jedes der Schlüsselworte anzeigt, welche in der Speichereinrichtung (21, 31, 41) registriert sind, wobei die Wähleinrichtung (50) das eine oder eine Anzahl registrierter Dokumente auswählt, die Schlüsselworte mit einer Kennwortrelevanz haben, welche größer als ein Schwellenwert ist.

22. Verfahren nach Anspruch 20, dadurch gekennzeichnet, daß die Wähleinrichtung (50) eine Einrichtung (51) zum Berechnen einer Textrelevanz aufweist, welche eine Amplitude der Beziehung zwischen einer Gruppe bestimmter Schlüsselworte von der Eingabeeinrichtung (60) und jedes der in der Speichereinrichtung (21, 31, 41) registrierten Dokumente anzeigt, wobei die Wähleinrichtung (50) das eine oder eine Anzahl registrierter Daten auswählt, deren Schlüsselwortrelevanz größer als ein Schwellenwert ist.

23. Verfahren nach Anspruch 20, dadurch gekennzeichnet, daß die Beziehungsinformation zumindest einen Beziehungsnamen und einen Beziehungswert der Schlüsselwortverbindung enthält, wobei der Beziehungswert die Amplitude der Beziehung anzeigt, daß die Wähleinrichtung (50) eine Einrichtung zum Berechnen eines Beziehungswertes zwischen einer Gruppe von der Eingabeeinrichtung (60) bestimmter Schlüsselworte und jedes der in der Speichereinrichtung (21, 31, 41) registrierten Dokumente aufweist, und daß die Wähleinrichtung (50) das eine oder eine Anzahl registrierter Dokumente einschließlich der Schlüsselworte auswählt, deren Beziehungswert größer als ein Schwellenwert ist.

24. Vorrichtung zur Durchführung des Verfahrens nach Anspruch 1, um ein oder eine Anzahl registrierter Dokumente aus einer Dokumenten-Datenbasis entsprechend bestimmter Wiedergewinnungsbedingungen, die ein oder eine Anzahl benannter Schlüsselworte einschließen, wiederzugewinnen, mit den folgenden Merkmalen:

a) einer Extrahiereinrichtung (10) zum Extrahieren von Schlüsselworten aus jedem der zu registrierenden Dokumente;
b) einer mit der Extrahiereinrichtung (10) verbundenen Einrichtung (40), welche mit den Dokumenten und den extrahierten Schlüsselworten von der Extrahier einrichtung versorgt wird, um eine invertierte Datei zu erzeugen, welche eine Beziehung zwischen den extrahierten Schlüsselworten und jedem der Dokumente aufzeigt;
c) einer Speichereinrichtung (21, 31, 41), um die invertierte Datei, die extrahierte Schlüsselworte und die Dokumente als registrierte Dokumente in Form einer Dokumenten-Datenbasis zu speichern;
d) eine Eingabeeinrichtung (60) zur Vorgabe von Wiedergewinnungs bedingungen, welche ein oder eine Anzahl bestimmter Schlüsselworte einschließen, wobei die Wiedergewinnungsbedingungen ein oder eine Anzahl der registrierten Dokumente festlegt, welche aus der Speichereinrich tung wiederzugewinnen sind;
e) eine Wähleinrichtung (50), um über die invertierte Datei das oder die Anzahl registrierter Dokumente auszuwählen, welche den Wiedergewinnungsbedingungen genügen, und
f) eine Ausgabeeinrichtung (70) zum Ausgeben des einen oder der Anzahl ausgewählter registrierter Dokumente;
gekennzeichnet durch die folgenden Merkmale:
g) eine weitere Einrichtung (30), welche mit der Extrahiereinrichtung verbunden ist und mit den extra hierten Schlüsselworten versorgt wird, um eine Schlüsselwort-Verbin dungstabelle (Fig. 4) zu generieren, welche Beziehungsinformationen enthält, die zwischen jeweils zwei der insgesamt extrahierten Schlüsselworte bestehen;
h) die Speichereinrichtung (21, 31, 41) verfügt über einen Speicherbereich zum Speichern der Schlüsselwort-Verbindungstabelle in der Dokumenten-Datenbasis;
i) die Wähleinrichtung (50) ist mit der weiteren Einrichtung (30) zum Erzeugen der Schlüssel wort-Verbindungstabelle (Fig. 4) verbunden und wählt über die invertierte Datei registrierte Dokumente aus, indem mit Hilfe eines oder der Anzahl bestimmter Schlüsselworte über die Schlüsselwort-Verbindungstabelle auf die inver tierte Datei Bezug genommen wird.

25. Vorrichtung nach Anspruch 24, dadurch gekennzeich net, daß mittels der weiteren Einrichtung (30) eine Schlüsselwort-Verbindungstabelle erzeugbar ist, welche Bezie hungsinformationen die zumindest jeweils einen Beziehungsnamen und jeweils einen Wert enthält, wobei der Wert der Beziehung eine Amplitude der Beziehung anzeigt.

26. Vorrichtung nach einem der Ansprüche 24 oder 25, dadurch gekennzeichnet, daß die Wähleinrichtung (50) einen Anforderungspro zessor (54) zum Verarbeiten von Anforderungen einschließ lich einer Dokumenten-Wiedergewinnungsanforderung von der Eingabeeinrichtung (60), einen ersten Berechnungsteil (52), welcher mit den Speichereinrichtungen (21, 31, 41) verbunden ist, um eine Schlüsselwort-Relevanz zu berechnen, welche die Amplitude der Beziehung zwischen einer Gruppe be stimmter Schlüsselworte von der Eingabeeinrichtung (60) aus und jedes der in der Speichereinrichtung (21, 31, 41) registrierten Schlüsselworte entsprechend der von dem Anforderungsprozes sor verarbeiteten Anforderung anzeigt, einen zweiten Berech nungsteil (51), welcher mit der Speichereinrichtung (21, 31, 41) verbun den ist, um eine Textrelevanz zu berechnen, welche die Am plitude der Beziehung zwischen der Gruppe bestimmter Schlüs selworte von der Eingabeeinrichtung (60) aus und jedes der Dokumente, welche in der Speichereinrichtung (21, 31, 41) registriert sind, entsprechend der in dem Anforderungsprozessor (54) verar beiteten Anforderung anzeigt, und eine Steuereinrichtung (55) aufweist, um Informationen einschließlich des registrier ten Dokuments von der Speichereinrichtung (21, 31, 41) aus zu steuern, welche in die Ausgabeeinrichtung (70) in Abhängigkeit von Berechnungsergebnissen auszugeben sind, welche in den ersten und zweiten Berechnungsteilen (52, 51) enthalten sind.

27. Vorrichtung nach Anspruch 26, dadurch gekennzeich net, daß mit dem zweiten Berechnungsteil (51) die Textrelevanz berechenbar ist, indem eine Gesamtsumme der Werte der Beziehungen zwischen den bestimmten Schlüsselworten und den in der Speichereinrichtung (21, 31, 41) registrierten Schlüsselwor ten erhalten wird, und indem die Gesamtsumme normiert wird.

28. Vorrichtung nach einem der Ansprüche 26 oder 27, dadurch gekennzeich net, daß ferner ein Sortierer (53) zum Sortieren der Be rechnungsergebnisse vorgesehen ist, welche der Steuereinrich tung (55) von den ersten und zweiten Berechnungsteilen (52, 51) aus zuführbar sind, wobei der Sortierer (53) die Berech nungsergebnisse in Abhängigkeit von dem Wert der Beziehung in einer entsprechenden Reihenfolge sortiert.

29. Vorrichtung nach einem der Ansprüche 24 bis 28, dadurch gekennzeichnet, daß die Ausgabeeinrichtung (70) eine Anzeigeeinrich tung aufweist.

30. Vorrichtung nach einem der Ansprüche 24 bis 29, dadurch gekennzeichnet, daß die Wähleinrichtung (50) eine Einrichtung (52) zum Berechnen einer Kennwortrelevanz aufweist, welche eine Amplitude der Beziehung zwischen einer Gruppe von bestimmten Schlüsselworten von der Eingabeeinrichtung (60) aus und jedes der Schlüsselworte anzeigt, welche in der Speicherein richtung (21, 31, 41) registriert sind, wobei die Wähl einrichtung (50) das eine oder eine Anzahl registrierter Dokumen te auswählt, die Schlüsselworte mit einer Kennwortrelevanz haben, welche größer als ein Schwellenwert ist.

31. Vorrichtung nach einem der Ansprüche 24 bis 30, dadurch gekennzeichnet, daß die Wähleinrichtung (50) eine Einrichtung (51) zum Berechnen einer Textrelevanz aufweist, welche eine Am plitude der Beziehung zwischen einer Gruppe bestimmter Schlüsselworte von der Eingabeeinrichtung (60) und jedes der in der Speichereinrichtung (21, 31, 41) registrierten Dokumente anzeigt, wobei die Wähleinrichtung (50) das eine oder eine Anzahl registrierter Daten auswählt, deren Schlüssel wortrelevanz größer als ein Schwellenwert ist.

32. Vorrichtung nach einem der Ansprüche 24 bis 31, dadurch gekennzeichnet, daß die Beziehungsinformationen zumindest einen Bezie hungsnamen und einen Beziehungswert der Schlüsselwortverbin dung enthalten, wobei der Beziehungswert die Amplitude der Be ziehung anzeigt, wobei die Wähleinrichtung (50) eine Einrich tung zum Berechnen eines Beziehungswertes zwischen einer Gruppe von der Eingabeeinrichtung (60) bestimmter Schlüsselworte und jedes der in der Speichereinrichtung (21, 31, 41) registrierten Dokumente aufweist, und daß die Wähl einrichtung (50) das eine oder eine Anzahl registrierter Dokumen te einschließlich der Schlüsselworte auswählt, deren Be ziehungswert größer als ein Schwellenwert ist.