DE69426541T2 - Dokumentdetektionssystem mit Darstellung des Detektionsresultats zur Erleichterung des Verständnis des Benutzers - Google Patents
Dokumentdetektionssystem mit Darstellung des Detektionsresultats zur Erleichterung des Verständnis des BenutzersInfo
- Publication number
- DE69426541T2 DE69426541T2 DE69426541T DE69426541T DE69426541T2 DE 69426541 T2 DE69426541 T2 DE 69426541T2 DE 69426541 T DE69426541 T DE 69426541T DE 69426541 T DE69426541 T DE 69426541T DE 69426541 T2 DE69426541 T2 DE 69426541T2
- Authority
- DE
- Germany
- Prior art keywords
- detection
- detection result
- document
- display
- result display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims description 637
- 238000004458 analytical method Methods 0.000 claims description 53
- 238000000605 extraction Methods 0.000 claims description 32
- 238000007726 management method Methods 0.000 claims description 29
- 238000003860 storage Methods 0.000 claims description 20
- 238000000034 method Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 35
- 238000013500 data storage Methods 0.000 description 19
- 230000004044 response Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 9
- 230000000877 morphologic effect Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000032683 aging Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000004397 blinking Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
- Die vorliegenden Erfindung betrifft ein Dokumentdetektionssystem und ein Verfahren zum Detektieren gewünschter Dokumente aus einer großen Zahl von Dokumenten, die in einer Dokumentendatenbasis gespeichert sind. Es ist zu erwähnen, dass der Begriff "Wiederauffinden" oft in der Literatur des technischen Gebiets verwendet wird, anstelle des Begriffs "Detektieren", der in der folgenden Beschreibung Verbinder wird. Die vorliegende Beschreibung richtet sich auf die Verwendung des Begriffs "Detektion" in durchgehender Weise.
- In den zurückliegenden Jahren wurde aufgrund des erheblichen Fortschritts und der Verbreitung von Computern das elektronische Manipulieren von Dokumenten in zunehmender Weise populär, beispielsweise bei elektronischen Nachrichten und bei elektronischen Mailsystemen und in CDROM-Publikationen von Datenquellen, wie Verzeichnissen bzw. Wörterbüchern und einer Enzyklopädie, die nur auf Papier verfügbar waren, und es wird erwartet, dass dieser Trend der elektronischen Manipulation von Dokumenten mit zunehmender Geschwindigkeit in der Zukunft fortgeführt wird.
- Im Zusammenhang mit derartigen elektronischen Manipulationen von Dokumenten hat ein Dokumenten- Detektionssystem zum Detektieren gewünschter Dokumente aus einer großen Zahl von Dokumenten in wirksamer Weise viel Aufmerksamkeit auf sich gezogen, damit die Möglichkeit besteht, die in einem Datenbasissystem gespeicherten Dokumente vorab wirksam zu verwenden.
- Bei einem üblicherweise verfügbaren Dokumenten- Detektionssystem handelt es sich um ein System, das Schlüsselwörter in Kombination mit Logikoperatoren verwendet, wie UND, ODER, NICHT oder nahe Operatoren zum Spezifizieren der Zahl von Zeichen, Sätzen und Paragraphen, die zwischen Schlüsselwörtern existieren können, und es detektiert ein Dokument durch Verwenden einer spezifizierten Kombination der Schlüsselwörter und Operatoren als Detektionsschlüssel.
- Jedoch wird in einem derartigen üblichen Dokumenten- Detektionssystem das Detektionsergebnis lediglich durch Anzeigen entweder einer Zahl detektierter Dokumente oder der Titel der detektierten Dokumente angezeigt, so dass der Anwender jedes der detektierten Dokumente prüfen muss, um zu sehen, ob es das gewünschte Dokument ist oder nicht, und es ist für den Anwender erforderlich, den gesamten Inhalt jedes der detektierten Dokumente Stück für Stück zu lesen, und dieser Betrieb ist enorm zeitaufwendig.
- Weiterhin sind bei dem üblichen Dokumenten-Detektionssystem beim Anzeigen der Titel der detektierten Dokumente die Titel einfach in einer vorgegebenen Folge gemäss der Abfrage des Anwenders angeordnet, beispielsweise einer Folge abnehmender Ähnlichkeiten zu den in dem Detektionsschlüssel verwendeten Schlüsselwörtern. Aus diesem Grund ist es für den Anwender nicht möglich, die relativen Beziehungen zwischen den detektierten Dokumenten und das Niveau der Ähnlichkeit im Hinblick auf den Detektionsbefehl für jedes der detektierten Dokumente anhand des angezeigten Detektionsergebnis zu verstehen, und demnach ist es für den Anwender schwierig, einen unmittelbaren Eindruck der Geeignetheit des angezeigten Detektionsergebnis zu gewinnen.
- Ferner ist bei dem üblichen Dokumenten-Detektionssystem das Detektionsschema auf dasjenige beschränkt, bei dem jedes Dokument als Ganzes als einzelne Einheit behandelt wird, so dass das Dokument mit dem gewünschten Inhalt in den Hintergrundabschnitt und das Dokument mit dem gewünschten Inhalt in dem Zusammenfassungsabschnitt zusammen gemischt detektiert werden. In anderen Worten ausgedrückt, enthält das Detektionsergebnis eine Vielzahl von Dokumenten in gemischter Weise unabhängig von der Weise, in der der gewünschte Inhalt in den Dokumenten auftritt. Beispielsweise ist dann, wenn die Maßnahmen der Vergangenheit ohne Interesse sind, das detektierte Dokument ohne Nutzen, bei dem ein Abgleich zu den vorgegebenen Schlüsselwörtern in dem Hintergrundabschnitt vorliegt. Jedoch erfolgt bei dem üblichen Dokumenten-Detektionssystem keine Unterscheidung der Dokumente mit unterschiedlichen Perspektiven, beispielsweise einem Dokument, das den gewünschten Inhalt in dem Hintergrundabschnitt bzw. Einleitungsabschnitt enthält, und dem Dokument, das den gewünschten Inhalt in dem Zusammenfassungsabschnitt enthält, und das gemischte Vorliegen dieser Dokumente bei unterschiedlichen Perspektiven macht es für den Anwender außerordentlich schwierig, die Geeignetheit des Detektionsergebnis zu beurteilen.
- Im Hinblick auf diese Probleme existiert ein Vorschlag für ein Schema zum Reduzieren der Last des Anwenders zum Lesen des gesamten Inhalts jedes detektierten Dokuments durch Anzeigen lediglich eines Abschnittes jedes detektierten Dokuments. Jedoch ist es bei einem derartigen Schema oft unmöglich, eine genaue Beurteilung dahingehend durchzuführen, ob es sich um das gewünschte Dokument handelt oder nicht, sofern nicht die Beziehung zwischen dem angezeigten Abschnitt und dem verbleibenden Abschnitt ersichtlich wird. Beispielsweise ist es dann, wenn der Hintergrundabschnitt mit dem gewünschten Inhalt für ein Dokument angezeigt wird, während der Zusammenfassungsabschnitt mit dem gewünschten Inhalt für das andere Dokument angezeigt wird, aufgrund der Tatsache, dass diese Dokumente nicht als einheitliche Ansicht zu verstehen sind, für den Anwender schwierig, eine genaue Beurteilung dahingehend durchzuführen, bei welchen dieser Dokumente es sich um das erforderliche handelt. Im Ergebnis wird zum vollständigen Verstehen der perspektivischen der angezeigten Abschnitte dieser Dokumente der Anwender gezwungen, den gesamten Inhalt dieser Dokumente nach wie vor zu lesen, so dass kein Beitrag zur Reduzierung der Last des Anwenders insgesamt geleistet wird.
- Weiterhin gibt es einen Vorschlag für ein Schema zum Reduzieren der Last eines Anwenders zum Lesen des gesamten Inhalts jedes detektierten Dokuments durch Ausarbeiten einer handerstellten Dokumentzusammenfassung für jedes gespeicherte Dokument vorab in Zuordnung zu jedem gespeicherten Dokument selbst sowie durch Anzeigen der Dokumentzusammenfassung im Zeitpunkt der Anzeige des Detektionsergebnis. Jedoch erfordert ein derartiges Schema einen enormen Aufwand an menschlichem Einsatz zum Vorbereiten der Dokumentzusammenfassung für jedes Dokument im Zeitpunkt der Erzeugung der Datenbasis selbst, was praktisch solange nicht rechtfertigbar ist, solange das Datenbanksystem eine beachtlich hohe Nutzungsrate hat. Weiterhin gibt es viele bereits existierende Datenbanksysteme, in denen die Dokumentzusammenfassung für jedes Dokument nicht bereitgestellt wird, und ein enormer Aufwand an menschlicher Anstrengung ist in ähnlicher Weise zum Vorbereiten der Dokumentzusammenfassung für jedes Dokument in derartigen bereits existierenden Datenbanksystemen erforderlich. Zusätzlich wird die handerstellte Dokumentzusammenfassung lediglich aus einem sehr allgemeinen Blickwinkel erstellt, so dass keine Garantie dahingehend besteht, dass jedes Dokument ausgehend von einem Blickwinkel zusammengefasst wird, der sich für die erforderliche Detektion eignet. Im Ergebnis kann die als Detektionsergebnis angezeigte Dokumentzusammenfassung ziemlich weitab von dem Blickwinkel des Anwenders mit der spezifischen Dokumentendetektionszielrichtung liegen, und in einem solchen Fall ist es möglich, dass der Anwender das tatsächlich erforderliche Dokument im Zeitpunkt der Beurteilung übersieht, ob jedes detektierte Dokument das gewünschte Dokument ist oder nicht.
- Der Text "Miteinbeziehung einer Semantischen Analyse in eine Dokumenten-Wiederauffindungs-Strategie" von Wendlandt E. B. und anderen für die Proceedings der 14. Annual Internat. ACM/SIGIR Conf. on Research and Development on Information Retrieval, October 13, 1991 in Chicago, USA (Seiten 270-297) offenbart ein Informations- Wiederauffindungssystem, bei dem Schlüsselwörter aus einer Abfrage natürlicher Sprache, die von dem Anwender eingegeben wird, extrahiert werden. Es wird ein Vektor Q berechnet, der Gewichtungen für jeden Begriff in der Abfrage enthält, und es wird ein Vektor D berechnet, der Gewichtungen für jeden Kern in dem Dokument darstellt. Die Wiederauffindung eines Dokuments basiert auf dem Wert eines Ähnlichkeitsmaß zwischen dem Abfragevektor Q und dem Dokumentenvektor D. Dieses Dokument schlägt ferner vor, thematische Funktionen anhand von Abfrage natürlicher Sprache zum Beschreiben der Eigenschaften der Beziehungen zwischen Objekten der tatsächlichen Welt abzuleiten. Die obigen Schlüsselwörter, Ähnlichkeiten und thematische Funktionen werden zum Auffinden von entsprechenden Dokumenten verwendet.
- Es ist demnach ein technisches Problem der vorliegenden Erfindung, ein Dokumenten-Detektionssystem und ein Verfahren zum Dokumentendetektieren zu schaffen, das eine Detektionsergebnis-Darstellung verwendet, die eine schnelle Erfassung der Relevanz jedes detektierten Elements durch einen Anwender vereinfacht, so dass es für den Anwender einfacher ist, einen Gesamtbetrieb unter Verwendung des Dokumenten-Detektionssystems gleichmäßig durchzuführen.
- Dieses technische Problem wird mit den Merkmalen des Patentanspruchs 1 und 17 gelöst.
- Weitere Merkmale und Vorteile der vorliegenden Erfindung werden anhand der folgenden Beschreibung im Zusammenhang mit der beiliegenden Zeichnung ersichtlich.
- Es zeigen:
- Fig. 1 ein schematisches Blockschaltbild für eine Gesamthardware-Konfiguration einer ersten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 2 ein Blockschaltbild einer detaillierten funktionellen Konfiguration des in Fig. 1 gezeigten Dokumenten-Detektionssystems;
- Fig. 3 ein Blockschaltbild einer detaillierten funktionellen Konfiguration einer Eingabeanalyseeinheit des in Fig. 2 gezeigten Dokumenten-Detektionssystems;
- Fig. 4 ein Flussdiagramm für den Betrieb einer Eingabeanalyse-Steuereinheit in der in Fig. 3 gezeigten Eingabeanalyseeinheit;
- Fig. 5 ein Flussdiagramm für den Betrieb einer Detektionsbefehls-Erzeugungseinheit bei der in Fig. 3 gezeigten Eingabeanalyseeinheit;
- Fig. 6 eine Tabelle beispielhafter Betrachtungsextrahierregeln, die bei der Betrachtungsweise-Extrahiereinheit in der in Fig. 3 gezeigten Eingabeanalyseeinheit verwendet werden;
- Fig. 7 eine Darstellung eines Formats sowie von Beispielen für einen Detektionsbefehl, der durch die in Fig. 3 gezeigte Detektionsbefehl- Erzeugungseinheit in der Eingabeanalyseeinheit erzeugt wird;
- Fig. 8 ein Blockschaltbild einer detaillierten funktionellen Konfiguration einer Detektionseinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem;
- Fig. 9 ein Flussdiagramm für den Detektionsbetrieb der Detektionssteuereinheit bei der in Fig. 8 gezeigten Detektionseinheit;
- Fig. 10 eine schematische Darstellung eines Schlüsselwortindex, der in einer Dokumentdaten- Speichereinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem gespeichert ist;
- Fig. 11 eine Darstellung eines Formats sowie von Beispielen für ein Detektionsergebnis, das durch die in Fig. 8 gezeigte Detektionseinheit erhalten wird;
- Fig. 12 ein Flussdiagramm für den Neudetektionsbetrieb einer Detektionssteuereinheit in der in Fig. 8 gezeigten Detektionseinheit;
- Fig. 13 ein Blockschaltbild einer detaillierten funktionellen Konfiguration einer Datensatzverwaltungseinheit in dem in Fig. 2 gezeigten Detektionssystem;
- Fig. 14 ein Flussdiagramm für den Betrieb einer Datensatzverwaltungs-Steuereinheit in der in Fig. 13 gezeigten Datensatzverwaltungseinheit;
- Fig. 14 eine Darstellung eines Formats und eines Beispiels für einen Detektionsknoten, der in der Detektionsdatensatz-Speichereinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem gespeichert ist;
- Fig. 16 ein Flussdiagramm für den Betrieb einer Detektionsdatensatz-Anzeigeeinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem;
- Fig. 17A und 17B Darstellungen beispielhafter Detektionsdatensatzanzeigen, die durch die Detektionsdatensatz-Anzeigeeinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem dargestellt werden;
- Fig. 18 ein Flussdiagramm für den Betrieb einer Detektionsergebnis-Anzeigeeinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem;
- Fig. 19 Darstellungen beispielhafter Detektionsergebnisanzeigen, die von der Detektionsergebnis-Anzeigeeinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem dargestellt werden;
- Fig. 20 eine Darstellung eines Formats und von Beispielen von Annahme/Zurückweisungsdaten, die in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem verwendet werden;
- Fig. 21 ein Flussdiagramm für den Betrieb einer Browser- Einheit in dem in Fig. 2 gezeigten Dokumenten- Detektionssystem;
- Fig. 22 eine schematische Darstellung eines Datenformats für den Dateninhalt des Dokuments, das in der Dokumentdaten-Speichereinheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem gespeichert ist;
- Fig. 23 Darstellungen beispielhafter Browser-Einheit- Anzeigen, die durch die Browser-Einheit in dem in Fig. 2 gezeigten Dokumenten-Detektionssystem dargestellt werden;
- Fig. 24A und 24B ein Flussdiagramm für den modifizierten Betrieb der Detektionsergebnis-Anzeigeeinheit bei einer zweiten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 25 schematische Darstellungen beispielhafter Detektionsergebnisanzeigen, die durch die Detektionsergebnis-Anzeigeeinheit gemäss dem Flussdiagramm nach Fig. 24A und 24B angezeigt werden;
- Fig. 26A und 26B ein Flussdiagramm für den modifizierten Betrieb der Detektionsergebnis-Anzeigeeinheit bei einer dritten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 27A, 27B und 27C schematische Darstellungen beispielhafter Detektionsergebnisanzeigen, die durch die Detektionsergebnis-Anzeigeeinheit gemäss dem Flussdiagramm nach Fig. 26A und 26B dargestellt werden;
- Fig. 28 eine Darstellung einer beispielhaften Detektionsergebnisanzeige, die durch die Detektionsdatensatz-Anzeigeeinheit einer vierten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 29 eine Darstellung eines Fensters für die Detektionsbefehls-Satzeingabe, das bei einer fünften Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung verwendet wird;
- Fig. 30 ein Flussdiagramm für den modifizierten Betrieb der Detektionsbefehls-Erzeugungseinheit bei einer sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 31 eine Darstellung eines Betrachtungsweise- Extrahierergebnis, wie es bei der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 32 ein Flussdiagramm für den modifizierten Betrieb der Datensatzverwaltungs-Steuereinheit bei der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 33 eine Darstellung eines Formats und eines Beispiels für einen Detektionsknoten, der in der Detektionsdatensatz-Speichereinheit der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung gespeichert wird;
- Fig. 34 ein Flussdiagramm für den modifizierten Betrieb der Detektionsergebnis-Anzeigeeinheit bei der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 35A und 35B Darstellungen beispielhafter Detektionsdatensatzanzeigen, die von der Detektionsergebnis-Anzeigeeinheit bei der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt werden;
- Fig. 36 eine Darstellung der Detektionsknotendaten, die durch die Detektionsergebnis-Anzeigeeinheit der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt werden;
- Fig. 37 ein Flussdiagramm für den modifizierten Betrieb der Detektionsergebnis-Anzeigeeinheit bei der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 38 ein Flussdiagramm für das Clustern bzw. Bündeln bei der Detektionsergebnis-Anzeigeeinheit gemäss dem Flussdiagramm nach Fig. 37;
- Fig. 39 ein Flussdiagramm für das Clustern bei der Detektionsergebnis-Anzeigeeinheit gemäss dem Flussdiagramm nach Fig. 38;
- Fig. 40 eine Darstellung eines Formats und eines Beispiels für Cluster-Dokumentdaten, die durch die Detektionsergebnis-Anzeigeeinheit der sechsten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt werden;
- Fig. 41 eine Darstellung einer beispielhaften Detektionsergebnisanzeige in einem Cluster- Anzeigemodus, die durch die Detektionsergebnis- Anzeigeeinheit der sechsten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 42 Darstellungen beispielhafter Detektionsergebnisanzeigen in einem Dokumenten- Anzeigemodus, die durch die Detektionsergebnis- Anzeigeeinheit der sechsten Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung dargestellt werden;
- Fig. 43 eine Darstellung einer beispielhaften Detektionsergebnisanzeige in einem Dokumentenanzeigemodus, die durch die Detektionsergebnis-Anzeigeeinheit der sechsten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 44A und 44B Darstellungen beispielhafter Browser- Einheit-Anzeigen, die durch die Browser-Einheit bei der sechsten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 45 eine schematische Darstellung eines Datenformats für den Dateninhalt des Dokuments, das in der Dokumentdaten-Speichereinheit der sechsten Ausführungsform eines Dokumentssystems gemäss der vorliegenden Erfindung gespeichert ist;
- Fig. 46 eine Darstellung einer beispielhaften Detektionsergebnisanzeige in einem Cluster- Anzeigemodus, das durch die Detektionsergebnis- Anzeigeeinheit der siebten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 47 eine Darstellung einer beispielhaften Detektionsergebnisanzeige in einem Dokumentenanzeigemodus, die durch die Detektionsergebnis-Anzeigeeinheit der siebten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 48 eine Darstellung einer beispielhaften Detektionsergebnisanzeige, die durch die Detektionsergebnis-Anzeigeeinheit der achten Ausführungsform eines Detektionssystems der vorliegenden Erfindung dargestellt wird;
- Fig. 49 eine Darstellung einer beispielhaften Tabelle zum Darstellen von Ähnlichkeiten zwischen detektierten Dokumenten, die durch die Detektionsergebnis-Anzeigeeinheit der achten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 50 eine Darstellung einer beispielhaften Tabelle zum Anzeigen der Betrachtungsweisen, die bei der Dokumentendaten-Speichereinheit der neunten Ausführungsform eines Detektionssystems der vorliegenden Erfindung verwendet werden;
- Fig. 51 eine Tabelle beispielhafter Regeln für Extrahierausdrücke numerischer Werte bei der zehnten Ausführungsform eines Detektionssystems der vorliegenden Erfindung;
- Fig. 52 eine Darstellung einer beispielhaften Detektionsergebnisanzeige, wie sie durch die Detektionsergebnis-Anzeigeeinheit der zehnten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 53A und 53B Darstellungen beispielhafter Detektionsergebnisanzeigen, die durch die Detektionsergebnis-Anzeigeeinheit der elften Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt werden;
- Fig. 54 eine Tabelle beispielhafter Betrachtungsweise- Extrahierregeln, die bei der zwölften Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung verwendet werden;
- Fig. 55A, 55B, 55C und 55D Darstellungen von Fenstern zum Registrieren einer Betrachtungsweise- Extrahierregel bei der zwölften Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung;
- Fig. 56A und 56B Darstellungen beispielhafter Detektionsergebnisanzeigen, die durch die Detektionsdatensatz-Anzeigeeinheit der dreizehnten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 57 eine Darstellung einer anderen beispielhaften Detektionsdatensatzanzeige, die durch die Detektionsdatensatz-Anzeigeeinheit der dreizehnten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 58 eine Darstellung einer beispielhaften Browser- Einheit-Anzeige, die durch die Browser-Einheit der vierzehnten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 59 eine Darstellung beispielhafter Fenster für Browser-Einheit-Anzeigen, die durch die Browser- Einheit der vierzehnten Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 60 eine schematische Darstellung eines Datenformats für die einzelnen Daten, die bei der vierzehnten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung verwendet werden;
- Fig. 61 eine Darstellung einer beispielhaften Detektionsergebnisanzeige in einem Dokumentenanzeigemodus, die durch die Detektionsergebnis-Anzeigeeinheit der fünfzehnten Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird;
- Fig. 62 eine Darstellung einer anderen beispielhaften Detektionsergebnisanzeige in einem Dokumentenanzeigemodus, die durch die Detektionsergebnis-Anzeigeeinheit bei der fünfzehnten Ausführungsform eines Detektionssystems gemäss der vorliegenden Erfindung dargestellt wird; und
- Fig. 63 eine Darstellung beispielhafter Fenster für Browser-Einheit-Anzeigen, die durch die Browser- Einheit der sechzehnten Ausführungsform eines Dokumentendetektionssystems gemäss der vorliegenden Erfindung dargestellt werden.
- Unter Bezug auf die Fig. 1 wird die erste Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser ersten Ausführungsform weist das Dokumenten- Detektionssystem eine Gesamthardware-Konfiguration auf, wie sie in Fig. 1 gezeigt ist, und eine zentrale Verarbeitungsvorrichtung 101 ist mit einer Speichervorrichtung 102, ferner einer Anzeigeeinrichtung 104 über einen Anzeigecontroller 103 verbunden, sowie mit einer Eingabevorrichtung 106 über einen Eingabecontroller 105.
- Die zentrale Verarbeitungsvorrichtung 101 wird durch einen Prozessor zum Ausführen zahlreicher Prozessschritte gebildet. Die Speichervorrichtung 102 wird durch eine Speichermedium wie einem Halbleiterspeicher, einem Magnetplattenspeicher, einem optischen Plattenspeicher, und so weiter, gebildet, und zwar zum Speichern von Programmen und Daten, die durch die Zentralverarbeitungsvorrichtung 101 verwendet werden. Die Anzeigevorrichtung 104 wird durch eine Anzeigeeinrichtung wie einer Flüssigkristallanzeige oder einer Plasmaanzeige gebildet, und zwar zum Anzeigen des Textinhalts des Dokuments und des Detektionsergebnis unter Steuerung durch den Anzeigecontroller 103. Die Eingabevorrichtung 106 wird durch Eingabeeinrichtungen wie einer Tastatur und einer Maus gebildet, und zwar zum Eingeben der Detektionsergebnisse durch den Anwender unter Steuerung des Eingabecontrollers 106.
- Noch detaillierter weist das Dokumenten-Detektionssystem dieser ersten Ausführungsform eine in Fig. 2 gezeigte detaillierte funktionelle Konfiguration auf, die eine Eingabeeinheit 201 enthält, sowie eine Eingabeanalyseeinheit 202, eine Detektionseinheit 203, eine Datensatzverwaltungseinheit 204, eine Detektionsdatensatz- Speichereinheit 205, eine Dokumentdaten-Speichereinheit 206, eine Detektionsergebnis-Anzeigeeinheit 207, eine Detektionsdatensatz-Anzeigeeinheit 208 und eine Browser- Einheit 209, die wechselseitig durch Datenleitungen 210-227 - in Fig. 2 mit dicken durchgezogenen Linien bezeichnet - verbunden sind, sowie mit Steuerleitungen 228-238 - die in Fig. 2 mit dünnen durchgezogenen Linien bezeichnet sind, wie nachfolgend detaillierter beschrieben wird.
- Mit der Eingabeeinheit 201 erfolgt die Eingabe von Eingabesätzen durch den Anwender, die in natürlicher Sprache vorgegeben sind, oder von Schlüsselwörtern zum Anweisen des Dokumentendetektionsbetriebs. Die Eingabesätze werden sequentiell in den Detektionsbefehl bei der Eingabeanalyseeinrichtung 202 umgesetzt, und der umgesetzte Detektionsbefehl wird zu dieser Eingabeeinheit 201 zurückgegeben, und zwar über die Datenleitungen 210 und 211. Die Eingabeeinheit 201 empfängt eine Detektionsknoten- ID von der Datensatzverwaltungseinheit 204 über die Dienstleistung 213, und sie gibt die Detektionsknoten-ID und den Detektionsbefehl paarweise an die Datensatzverwaltungseinheit 204 über die Datenleitung 212 und an die Detektionseinheit 203 über die Datenleitung 214 aus.
- Die Eingabeanalyseeinheit 202 empfängt die Eingabe des Anwenders von der Eingabe 201 über die Datenleitung 210, und sie setzt die Eingabe des Anwenders in einen Detektionsbefehl um, und sie gibt den umgesetzten Detektionsbefehl an die Eingabeeinheit 201 über die Datenleitung 211 aus.
- Die Detektionseinheit 203 empfängt das Paar des Detektionsbefehls und der Detektionsknoten-ID von der Eingabeeinheit 201 über die Datenleitung 211, und sie führt eine Durchsicht der in der Dokumentendaten-Speichereinheit 206 gespeicherten Dokumentendaten über die Datenleitung 218 zum Detektieren der relevanten Dokumentgruppe durch, und sie gibt ein Detektionsergebnis im Hinblick auf die betreffende Dokumentengruppe und die Detektionsknoten-ID paarweise an die Datensatzverwaltungseinheit 204 über die Datenleitung 215 aus, bei Ausgabe des Detektionsergebnis bei der Detektionsergebnis-Anzeigeeinheit 208 über die Datenleitung 216.
- Die Detektionsergebnis-Anzeigeeinheit 207 empfängt das Detektionsergebnis über die Datenleitung 216, und sie zeigt die Dokumentengruppe des Detektionsergebnisses als mehrdimensionale Anzeige an, und sie gibt eine Dokumenten- ID eines ausgewählten Dokuments der mehrdimensionalen Anzeige an die Browser-Einheit 209 über die Datenleitung 227 aus.
- Die Browser-Einheit 209 bewirkt eine Durchsicht der in der Dokumentendaten-Speichereinheit 206 gespeicherten Dokumentendaten über die Datenleitung 219 durch, und zwar gemäss der Dokumenten-ID, die von der Detektionsergebnis- Anzeigeeinheit 207 über die Datenleitung 227 empfangen wird, zum Anzeigen des Inhalts des einzelnen Dokuments.
- Die Datensatzverwaltungseinheit 204 speichert das Paar des Detektionsbefehls und der Detektionsknoten-ID, die über die Datenleitung 212 empfangen wird, sowie das Paar des Detektionsergebnis und der Detektionsknoten-ID, die über die Datenleitung 215 empfangen wird, und zwar in der Detektionsdatensatz-Speichereinheit 205 über die Datenleitung 223, während der Detektionsdatensatz über die Datenleitung 222 durchgesehen wird, und sie gibt die Detektionsdatensatzdaten an die Detektionsdatensatz- Anzeigeeinheit 207 über die Datenleitung 225 aus.
- Die Detektionsdatensatz-Anzeigeeinheit 208 zeigt die über die Datenleitung 225 empfangenen Detektionsdatensatzdaten in einer Baumstruktur an, und sie gibt die Detektionsknoten-ID und einen in der angezeigten Baumstruktur spezifizierten Knoten an die Datensatzverwaltungseinheit 204 über die Datenleitung 224 aus.
- Die Detektionsdatensatz-Speichereinheit 205 speichert den von der Datensatzverwaltungseinheit 204 über die Datenleitung 223 empfangenen Detektionsdatensatz, während die Dokumentendaten-Speichereinheit 206 die Dokumentdaten speichert.
- Die Datenleitung 226 dient zum Übertragen eines Annahme/Zurückweisungsdatenwerts, der für jedes einzelne Dokument durch den Anwender bei der Browser-Einheit 209 für die Detektionsergebnis-Anzeigeeinheit 207 spezifiziert wird, und die Datenleitung 220 dient zum Übertragen der Detektionsknoten-ID, die bei der Datensatzverwaltungseinheit 204 generiert wird, an die Detektionsergebnis-Anzeigeeinheit 207, und die Datenleitungen 221 und 217 dienen zum Übertragen des unmittelbar vorangehenden Detektionsergebnisses, des Dokumentnannahme/Zurückweisungs-Datenwerts und der Detektionsknoten-ID im Zeitpunkt einer erneuten Detektion, die bei der Detektionsergebnis-Anzeigeeinheit 207 für die Detektionseinheit 203 und die Datensatzverwaltungseinheit 204 spezifiziert wird.
- Die Eingabeanalyseeinheit 202 hat eine in Fig. 3 gezeigte detaillierte funktionelle Konfiguration, und sie enthält eine Eingabeanalyse-Steuereinheit 301, eine Detektionsbefehls-Erzeugungseinheit 302, eine Betrachtungseise-Extrahiereinheit 303, eine Einheit für die morphologische Ananlyse 304, eine Einheit für die syntaktische Analyse 305, die wechselweise durch Datenleitungen 308-315 - in Fig. 3 durch dicke durchgezogene Linien bezeichnet - verbunden sind, sowie durch Steuerleitungen 317-320 - in Fig. 3 durch dünne durchgezogene Linien bezeichnet -, wie detaillierter nachfolgend beschrieben wird.
- Die Eingabeanalyse-Steuereinheit 301 wird über die Steuerleitung 228 von der Eingabeeinheit 201 aktiviert. Die Eingabeanalyse-Steuereinheit 301 aktiviert die Einheit für die morphologische Analyse 304 über die Steuerleitung 319, und sie führt den einzelnen Eingabesatz der Einheit für die morphologische Analyse 304 über die Datenleitung 312 zu, und sie empfängt anschließend das Ergebnis der morphologischen Analyse von der Einheit für die morphologische Analyse 304 über die Datenleitung 313. Zusätzlich aktiviert diese Eingabeanalyse-Steuereinheit 301 die Einheit für die syntaktische Analyse 305 über die Steuerleitung 320, und sie führt das Ergebnis der morphologischen Analyse für den einzelnen Eingabesatz der Einheit für die syntaktische Analyse 305 über die Datenleitung 314 zu, und sie empfängt anschließend das Ergebnis der syntaktischen Analyse von der Einheit für die syntaktische Analyse 305 über die Datenleitung 315. Ferner aktiviert diese Eingabeanalyse-Steuereinheit 301 die Detektionsbefehls-Erzeugungseinheit 302 über die Steuerleitung 317, und sie führt das Ergebnis der syntaktischen Analyse für den einzelnen Eingabesatz der Detektionsbefehls-Erzeugungseinheit 302 über die Datenleitung 308 zu, und sie empfängt dann den Detektionsbefehl von der Detektionsbefehls- Erzeugungseinheit 302 über die Datenleitung 309.
- Die Detektionsbefehls-Erzeugungseinheit 302 aktiviert die Betrachtungsweise-Extrahiereinheit 303 für die Steuerleitung 318 für jeden einzelnen Eingabesatz, und sie führt das Ergebnis der syntaktischen Analyse über die Datenleitung 310 zu, und sie empfängt anschließend die Betrachtungsweisedaten, die durch die Betrachtungsweise- Extrahiereinheit 303 extrahiert werden, über die Datenleitung 311. Zusätzlich extrahiert diese Detektionsbefehls-Erzeugungseinheit 302 Inhaltswörter für den einzelnen Eingabesatz, und sie konstruiert den Detektionsbefehl anhand der extrahierten Inhaltswörter, und sie gibt den konstruierten Detektionsbefehl an die Eingabeanalyse-Steuereinheit 301 über die Datenleitung 309 aus.
- Der Betrieb der Eingabeanalyse-Steuereinheit 301 erfolgt gemäss dem in Fig. 4 gezeigten Flussdiagramm, wie nachfolgend erläutert.
- Zunächst besteht eine Möglichkeit für die Eingabe mehrerer Sätze natürlicher Sprache ausgehend von der Eingabeeinheit 201. Aus diesem Grund erfolgt im Hinblick auf jeden eingegebenen individuellen Eingabesatz die morphologische Analyse und die syntaktische Analyse bei den Schritten 401 und 402 unter Verwendung der Einheit für die morphologische Analyse 304 und die Einheit für die syntaktische Analyse 305. Hierbei sind die morphologische Analyse und die syntaktische Analyse bereits allgemein aus dem technischen Gebiet der Maschinenübersetzung bekannt, und die Details dieser Analysen sind für die vorliegende Erfindung nicht wesentlich, so dass die nähere Erläuterung weggelassen wird.
- Anschließend wird gemäss dem Ergebnis der syntaktischen Analyse, das für jeden einzelnen eingegebenen individuellen Eingabesatz erhalten wird, das Erzeugen des Detektionsbefehls bei dem Schritt 403 unter Verwendung der Detektionsbefehls-Erzeugungseinheit 302 ausgeführt.
- Der Betrieb der Detektionsbefehls-Erzeugungseinheit 302 verläuft gemäss dem in Fig. 5 gezeigten Flussdiagramm, wie nachfolgend erläutert.
- Insbesondere erfolgt gemäss dem Ergebnis der syntaktischen Analyse für den einzelnen Eingabesatz ein Extrahieren der Betrachtungsweisedaten bei dem Schritt 501, und die Inhaltswörter zum Bilden des einzelnen Eingabesatz werden bei dem Schritt 502 extrahiert.
- Anschließend erfolgt nach dem Ausführen dieser Betrachtungsweiseextrahierung und der Inhaltswortextrahierung für alle Eingabesätze ein Mischen der extrahierten Inhaltswörter für jede Betrachtungsweise bei dem Schritt 503, so dass der Detektionsbefehl aufgebaut wird.
- Hierbei wird das Extrahieren der Betrachtungsweisedaten gemäss der Betrachtungsweise-Extrahierregeln durchgeführt, wie sie beispielsweise in einer Tabelle nach Fig. 6 gezeigt sind, die lediglich eine begrenzte Zahl von Beispielen zeigt. Wie in Fig. 6 gezeigt, liegt jede Betrachtungsweise- Extrahierregel in einem Format wie folgt vor:
- (Abstimmabschnitt) → Betrachtungsweise
- und hierbei bezeichnet der Abstimmabschnitt ein syntaktisches Muster, zu dem ein Abgleich gefunden werden muss, so dass dann, wenn das syntaktische Muster des Abstimmabschnitts der linken Seite mit demjenigen des einzelnen Eingabesatz abgestimmt ist, die Betrachtungsweise auf der rechten Seite als die Betrachtungsweise des einzelnen Eingabesatzes festgelegt wird.
- In einem Fall, in dem sich Betrachtungsweisedaten nicht gemäss den Betrachtungsweise-Extrahierregeln nach Fig. 6 extrahieren lassen, konstruiert die Detektionsbefehls- Erzeugungseinheit 302 den Detektionsbefehl durch vorangehendes Angleichen der Vorgabe- Betrachtungsweisegruppe. Diese Vorgabe-Betrachtungsweise kann von der Eingabeeinheit 201 festgelegt werden, vor dem Ausführen des Detektionsbefehls durch den Anwender.
- Beispielsweise erfolgt in einem Fall der Betrachtungsweise- Extrahierregel der ersten Zeile nach Fig. 6 ein Angleichen für ein Teilelement eines Satzes mit dem syntaktischen Muster "mit einer Zielsetzung von", wohingehend in einem Fall der Betrachtungsweise-Extrahierregel der zweiten Zeile nach Fig. 6 ein Angleichen für ein Teilelement eines Satzes mit dem syntaktischen Muster "Verstehen" [Perfekt]" erfolgt, d. h. "Verstanden", "Verstanden haben", und so weiter.
- Es ist jedoch zu erwähnen, dass das Format dieses Angleichabschnitts von dem Ergebnis der syntaktischen Analyse abhängt, das im Rahmen der syntaktischen Analyse erhalten wird, und jedwedges geeignete Format, das sich von demjenigen unterscheidet, das bei dem Beispielen nach Fig. 6 verwendet wird, kann angewandt werden.
- Bei der Inhaltworts-Extraktion werden die Hauptwörter von dem Ergebnis der syntaktischen Analyse herausgenommen, und anschließend werden die nicht erforderlichen Wörter gemäss einem (nicht gezeigten) Verzeichnis nicht erforderlicher Wörter in bereits bekannter Weise für die Inhaltswortextraktion von dem Ergebnis der syntaktischen Analyse entfernt.
- Der Detektionsbefehl weist ein in Fig. 7 gezeigtes beispielhaftes Format auf, und der Detektionsbefehl ist als Paar des Schlüsselwortes und der Betrachtungsweisenliste definiert. Die in Fig. 7 gezeigten Beispiele sind vier Detektionsbefehle, die ausgehend von dem Eingabesatz "Ein Entwurfswerkzeug auf der Grundlage von Beispielen, die mit einem Objekt eines Computerentwurfs entwickelt sind." konstruiert sind, und die Hauptwörter "Computer" und "Entwurf" sind untergeordnet zu "Mit dem Ziel von", während die Hauptwörter "Beispiel", "Entwurf" und "Werkzeug" zu "entwickelt" untergeordnet sind.
- Die Detektionseinheit 203 weist eine in Fig. 8 gezeigte detaillierte funktionelle Konfiguration auf, und sie enthält eine Detektionssteuereinheit 801 zum Steuern der Detektionseinheit 203 als Ganzes, eine Index-Sucheinheit 802 zum Detektieren relevanter Dokumente durch Suchen in einem Schlüsselwortindex, der in einer Dokumentendaten- Speichereinheit 206 gespeichert ist, eine Anpasseinheit 803 zum Empfangen der Akzeptier/Zurückweisungsdaten für die Dokumente von der Detektionsergebnis-Anzeigeeinheit 207 und zum Ausführen eines Angleichbetriebs in einem Fall einer erneuten Detektion, sowie eine Distanzberechnungseinheit 804 zum Berechnen der Ähnlichkeiten der detektierten Dokumente im Hinblick auf die Detektionsbefehle und zum Umsetzen der berechneten Ähnlichkeiten in Distanzen.
- Die Detektionssteuereinheit 801 führt zwei Typen von Betriebsabläufen durch, einschließlich einem Detektionsbetrieb, wenn die Detektionsbefehle empfangen werden, und eines erneuten Detektionsbetriebs, wenn die Annahme/Zurückweisedaten für die Dokumente von der Detektionsergebnis-Anzeigeeinheit 207 empfangen werden.
- Der Detektionsbetrieb durch die Detektionssteuereinheit 801 wird gemäss dem in Fig. 9 gezeigten Flussdiagramm ausgeführt, wie nachfolgend erläutert.
- Der Detektionsbetrieb wird zunächst dann ausgeführt, wenn die Detektionssteuereinheit 801 über die Steuerleitung 230 aktiviert wird.
- Zunächst wird die Indexsucheinheit 802 über die Steuerleitung 812 aktiviert, und zwar gemäss den Detektionsbefehlen, die über die Datenleitung 214 empfangen werden. Zu diesem Zeitpunkt werden die Detektionsbefehle zu der Indexsucheinheit 802 über die Datenleitung 813 übertragen.
- In Ansprechen hierauf durchsucht die Indexsucheinheit 802 den Schlüsselwortindex, und sie erhält die Dokumenten-ID- Werte und die Betrachtungsweisendaten mit den Schlüsselwörtern der Detektionsbefehle als Kandidatendokumente bei dem Schritt 901. Die bei dem Schritt 901 erhaltenen Dokumenten-ID-Werte und Betrachtungsweisedaten werden anschließend der Detektionssteuereinheit 801 über die Datenleitung 807 zugeführt.
- Anschließend wird für alle Kandidatendokumente, die bei dem Schritt 901 erhalten werden, die Distanzberechnungseinheit 804 über die Steuerleitung 811 aktiviert, und es werden die Berechnungen der Distanzen im Hinblick auf die Detektionsbefehle bei dem Schritt 902 durchgeführt. Bei der Distanzberechnungseinheit 804 werden die Schlüsselwörter jedes Kandidatendokumentes und die Detektionsbefehle von der Detektionssteuereinheit 801 über die Datenleitung 808 empfangen, und die Distanzberechnung wird gemäss einer M · N Matrixdarstellung jedes Detektionsbefehls Q ausgeführt, wie sie in der folgenden Gleichung (1) definiert ist, sowie einer M · N Matrixdarstellung jedes Dokuments Di, die durch die folgende Gleichung (2) definiert ist, und der Distanz Dist(Q, D1), die durch die folgende Gleichung (3) definiert ist. Die erhaltene Distanz wird anschließend der Detektionssteuereinheit 801 über die Datenleitung 809 zugeführt.
- Gleichung (1) bis (3) auf Seite 19/20 einfügen
- Dist(Q, Di) = Q - Di /M (3)
- Das i-jte Element qij und dij in der i-ten Zeile und der j- ten Spalte der Matrizen der Gleichungen (1) und (2) sind jeweils für das i-te Schlüsselwort und die j-te Betrachtungsweise des Detektionsbefehls und des Dokuments vorgesehen, und sie bringen Gewichtungen für die Schlüsselwörter zum Ausdruck, die durch Analyse des Detektionsbefehls und des Dokuments bestimmt werden.
- Beispielsweise weist das ij-te Element qij einen Wert 1 dann auf, wenn das i-te Schlüsselwort in dem Satz verwendet wird, der zu der jten Betrachtungsweise gehört, oder andernfalls einen Wert von 0. Hierbei ist es dann, wenn die Schlüsselwörter in Synonyme unter Verwendung des Synonymverzeichnisses (nicht gezeigt) entwickelt werden, auch möglich, einen Wert von weniger als 1 oder größer als 0 an die nachrangigen Wörter, die vorrangigen Wörter oder Synonymwörter zu vergeben. Es ist auch möglich, einen Wert von weniger als 1 und größer als 0 gemäss der Position des Schlüsselworts in der Dokumentenstruktur zu vergeben, beispielsweise dem Titel, der Kapitelüberschrift, dem Haupttext der Fußnote und so weiter.
- Die Matrizen Q und Di lassen sich als Ausdrucksmerkmals- Vektoren des Detektionsbefehls und des Dokuments im Hinblick auf die Betrachtungsweisen ansehen.
- Bei der obigen Gleichung (3) stellt ein Symbol A für eine beliebige Matrix A die Bedeutung dar, die durch die folgende Gleichung (4) definiert ist.
- Für jedes Element aij der Matrix gilt im Fall aij < 0 bij = -aij und andernfalls bij = aij.
- Es ist zu erwähnen, dass die Distanz Dist(Q; Di) der obigen Gleichung (3) die Stadt-Block-Distanz ist, jedoch kann jedes andere allgemein bekannte Distanzmaß anstelle hiervon - sofern gewünscht - verwendet werden.
- Anhand der obigen Gleichung (3) wird die Distanz zwischen dem Detektionsbefehl und dem einzelnen Dokument für jede Betrachtungsweise erhalten.
- Die Fig. 10 zeigt einen beispielhaften Inhalt des in der Dokumentendaten-Speichereinheit 206 gespeicherten Schlüsselwortindex, der sich für Japanisch eignet.
- Insbesondere weist dieser Schlüsselwortindex nach Fig. 10 die TRIE Struktur auf, bei der jedes betroffene Kanji- Zeichen in den Schlüsselwörtern einer eindeutigen Adresse zugeordnet ist, und jedes ausgehend von mehreren Kanji- Zeichen gebildete Schlüsselwort wird durch Verbindungsdaten spezifiziert, die nach jedem Kanji-Zeichen registriert sind, zum Reduzieren der erforderlichen Speicherkapazität und zum Vereinfachen der erforderlichen Detektionsprozedur.
- Beispielsweise weist bei dem japanischen Wort "kikai" (mit der Bedeutung "Maschine"), das durch zwei Kanji-Zeichen gebildet wird, das erste Zeichen, das bei der Adresse 00305 in dem Kopfzeichen-Speicherbereich registriert ist, Verbindungsdaten "00935" auf, zum Spezifizieren des zweiten Zeichens des Schlüsselworts als dasjenige, das bei der Adresse 00305 in dem Nachfolgezeichen-Speicherbereich registriert ist. Zusätzlich weist auch dieses zweite Zeichen bei der Adresse 00305 ebenso die Verbindungsdaten "00623" auf, zum Spezifizieren des dritten Zeichens, und das dritte Zeichen bei der Adresse 00623 weist die Verbindungsdaten "00914" auf, zum Spezifizieren des vierten Zeichens, für ein anderes Schlüsselwort "kikai-honyaku" (mit der Bedeutung "Maschinenübersetzung"), das durch vier Kanji-Zeichen gebildet ist, und das oben beschriebene Schlüsselwort "kikai" als ersten Teil enthält.
- Weiterhin enthält das zweite Zeichen bei der Adresse 00305 auch Dateidaten "Datei 4", zum Anzeigen der Tatsache, dass das Schlüsselwort "kikai" in den Dokumentendaten mit dem Dokumenten-ID-Wert "Datei 4" enthalten ist, begleitet von Betrachtungsweisedaten "Zusammenfassung" zum Anzeigen der Tatsache, dass dieses Schlüsselwort "kikai" in dem Satz verwendet wird, der die Betrachtungsweise "Zusammenfassung" in diesen Dokumentendaten "Datei 4" betrifft.
- Ähnlich weist das vierte Zeichen bei der Adresse 00914 zwei Paare von Dateidaten und Betrachtungsweisedaten auf, festgelegt zu "Datei 25, Aufgabe" und "Datei 21, Zusammenfassung" zum Anzeigen, dass das Schlüsselwort "kikai-honyaku" in den Dokumentendaten "Datei 25" in dem Satz enthalten ist, der die Betrachtungsweise "Aufgabe" betrifft, und in den Dokumentendaten "Datei 21" in dem Satz, der die Betrachtungsweise "Zusammenfassung" betrifft.
- Andererseits ist das erste Zeichen bei der Adresse 000A0 in dem Kopfzeichen-Speicherbereich gemeinsam für die zwei Schlüsselwörter "sanpo" (mit der Bedeutung "Algorithmus") und "sanjuti" (mit der Bedeutung "arithmetisch"), so dass es zwei Verbindungsdaten "00A15" und "00A16" gibt, zum Spezifizieren der jeweiligen zweiten Zeichen dieser beiden Schlüsselwörter.
- In Fig. 10 dient ein isoliertes "0"-Zeichen als Separator zum Trennen der Zeichen, der Verbindungsdaten und der Dateidaten und des Betrachtungsweise-Datenpaars. Weiterhin sind die ersten Zeichen der Schlüsselwörter in dem fortlaufenden Kopfzeichen-Speichergebiet in sortierter Folge registriert, wie bei den JIS-Codes (japanischer Industri-Standard).
- Die Fig. 11 zeigt ein beispielhaftes Format für ein Detektionsergebnis zusammen mit tatsächlichen Beispielen der Detektionsergebnisse.
- In diesem Fall ist jedes Dokument ID mehreren Distanzen zugeordnet, und die ij-te Distanz < DISTANZij> ist für das i-te Dokument < DOKUMENTi> und die j-te Betrachtungsweise.
- Die durch die Detektionseinheit 203 erhaltenen Detektionsergebnisse werden dann der Datensatzverwaltungseinheit 204 über die Datenleitung 215 zugeführt, sowie in der Detektionsergebnis-Anzeigeeinheit 207 über die Datenleitung 216.
- Andererseits wird der Neu-Detektionsbetrieb durch die Detektions-Steuereinheit 801 gemäss dem in Fig. 12 gezeigten Flussdiagramm wie folgt ausgeführt.
- In diesem Fall wird der Neu-Detektionsbetrieb durch die Detektionsergebnis-Anzeigeeinheit 203 über die Steuerleitung 232 aktiviert. Die Detektionssteuereinheit 801 aktiviert dann die Anpasseinheit 803 über die Steuerleitung 810 unter Verwendung des Detektionsergebnis mit den Akzeptier/Zurückweisungsdaten für die Dokumente in der Eingabe über die Datenleitung 217, damit die Detektionsbefehle bei dem Schritt 1201 erneut aufgebaut werden. Hierbei berechnet die Anpasseinheit 803 jeden neu aufgebauten Detektionsbefehl Q' anhand jedes vorangehenden Detektionsbefehls Q gemäss der folgenden Gleichung (5)
- Q' = w0 · Q + wk · Qk (5)
- derart, dass Qk die Matrixdarstellung des Dokuments dargestellt, das für das Detektionsergebnis als geeignet bewertet wird, d. h. gemäss den Akzeptanz/Zurückweisungsdaten akzeptiert wird, und wk eine Gewichtung zum Durchführen einer gewichteten Mittlung bezeichnet.
- Nach dieser Neuberechnung der Detektionsbefehle bei dem Schritt 1201 werden die Schritte 1202 und 1203 ähnlich zu den Schritten 901 und 902 nach Fig. 9 für den oben beschriebenen Detektionsbetrieb für die neu aufgebauten Detektionsbefehle Q' ausgeführt.
- Die Datensatzverwaltungseinheit 204 weist eine in Fig. 13 gezeigte detaillierte funktionale Konfiguration auf, und sie enthält eine Datensatzverwaltungs-Speichereinheit 1301 und eine Detektions-Erzeugungseinheit 1302.
- Die Datensatzverwaltungs-Steuereinheit 1301 wird gemäss dem in Fig. 14 gezeigten Flussdiagramm wie folgt betrieben.
- Hierbei geht in Übereinstimmung mit einer Eingabemeldung der Betrieb selektiv zu einem geeigneten der folgenden Betriebsschritte über, d. h. dem Schritt 1402, 1043 und 1405, wie nachfolgend beschrieben, und zwar ausgehend von dem Schritt 1401.
- Insbesondere in einem Fall, bei dem die Erzeugung des Detektionsknoten-ID-Werts von der Eingabeeinheit 201 über die Steuerleitung 231 angewiesen wird oder von der Detektionsergebnis-Anzeigeeinheit 207 über die Steuerleitung 233, erfolgt das Erzeugen des Detektionsknoten unter Verwendung der Detektionsknoten- Erzeugungseinheit 1302 bei dem Schritt 1402. Der erzeugte Detektionsknoten wird dann in den Detektionsdatensatz- Speichereinheit 205 über die Datenleitung 223 gespeichert.
- In diesem Fall wird der Detektionsknoten in einem Format abgegeben, wie es in Fig. 15 zusammen mit einem Beispiel gezeigt ist, und es enthält eine Gruppe von vier Elementen mit dem Detektionsknoten-ID-Wert, dem Elternknoten-ID-Wert, den Detektionsbefehlen und den Detektionsergebnissen.
- Hierbei speichert der Detektionsknoten-ID-Wert einen Identifizierwert (ID) zum Identifizieren dieses Detektionsknotens, während der Eltern-Knoten-ID-Wert den ID-Wert des Detektionsknoten speichert, der die Detektionsbefehle und die Detektionsergebnisse für den unmittelbar vorangehenden Detektionsbetrieb speichert. Die Datensatzverwaltungseinheit 204 verwaltet den Detektionsdatensatz gemäss diesem Detektionsknoten-ID-Wert.
- Bei dieser Erzeugung des Detektionsknotens wird ein Neu- Detektionsknoten durch Festlegen des momentanen Detektionsknotens als Eltern-Knoten erzeugt. Anschließend wird der Detektionsknoten-ID-Wert des neu erzeugten Detektionsknoten an die Eingabeeinheit 201 über die Datenleitung 213 ausgegeben, oder an die Detektionsergebnis-Anzeigeeinheit 207 über die Datenleitung 220.
- Andererseits wird in einem Fall, in dem ein Paar des Detektionsbefehls und des Detektionsknoten-ID-Werts von der Eingabeeinheit 201 über die Datenleitung 212 eingegeben wird und wenn ein Paar des Detektionsergebnis und des Detektionsknoten-ID-Werts von der Detektionseinheit 302 über die Datenleitung 215 eingegeben wird, das Speichern des Detektionsbefehls und des Detektionsergebnis bei dem Schritt 1403 ausgeführt.
- Anschließend wird die Detektionsergebnis-Anzeigeeinheit 208 über die Steuerleitung 236 zum Übertragen der in der Detektionsdatensatz-Speichereinheit 205 gespeicherten Detektionsknoten an die Detektionsdatensatz-Anzeigeeinheit 208 über die Datenleitung 225 angewiesen, so dass bei dem Schritt 1404 die Detektionsdatensatzanzeige aktualisiert wird.
- Weiterhin erfolgt in einem Fall, in dem die Änderung des momentanten Detektionsknotens von der Detektionsdatensatz- Anzeigeeinheit 208 über die Steuerleitung 237 angewiesen wird, eine Eingabe des unter Verwendung der Maus oder der Eingabeeinrichtung bei der Detektionsdatensatz- Anzeigeeinheit 208 spezifizierten Detektionsknotens über die Datenleitung 224, und der momentane Detektionsknoten- ID-Wert wird entsprechend bei dem Schritt 1405 geändert. Anschließend wird die Detektionsdatensatzanzeige bei dem Schritt 1406 aktualisiert, während die Detektionsergebnis- Anzeigeeinheit 207 zum entsprechenden Aktualisierung der Detektionsergebnisanzeige über die Steuerleitung 238 bei dem Schritt 1407 angewiesen wird.
- Die Detektionsdatensatz-Anzeigeeinheit 208 wird gemäss dem in Fig. 16 gezeigten Flussdiagramm wie folgt betrieben.
- Hierbei geht in Übereinstimmung mit einer Eingabemeldung der Betrieb selektiv ausgehend von dem Schritt 1601 zu einem geeigneten der folgenden Betriebsabläufe gemäss Schritt 1602, 1604, 1605, 1606 und 1607 über, wie nachfolgend beschrieben.
- Zunächst wird die Erzeugung eines Anzeigefensters für diese Detektionsdatensatz-Anzeigeeinheit 208 von der Eingabeeinheit 201 über die Steuerleitung 235 angewiesen. In diesem Fall wird die Erzeugung eines neuen Fensters für die Detektionsdatensatzanzeige bei dem Schritt 1605 ausgeführt. Weiterhin wird dann, wenn das Löschen des Fensters für die Detektionsdatensatzanzeige ausgehend von der Anzeigeeinheit 201 über die Steuerleitung 235 angewiesen wird, das Löschen des Fensters für die Detektionsdatensatzanzeige bei dem Schritt 1606 ausgeführt.
- In einem Fall, in dem eine neue Datensatzanzeige von der Datensatzverwaltungseinheit 204 über die Steuerleitung 236 angewiesen wird, wird der neu anzuzeigende Detektionsdatensatz über die Datenleitung 225 bei dem Schritt 1602 ausgelesen, und die Detektionsdatensatzanzeige wird durch den ausgelesenen Detektionsdatensatz bei dem Fenster für die Detektionsdatensatzanzeige bei dem Schritt 1602 aktualisiert. Hier erfolgt eine beispielhafte Detektionsdatensatzanzeige mit dieser Detektionsdatensatz- Anzeigeeinheit 208, wie in Fig. 17A gezeigt.
- Wie in Fig. 17A gezeigt, erhält die Detektionsdatensatzanzeige eine Form der Baumstruktur, bei der die Detektionsknoten als schwarze Punkte dargestellt sind, und zwei Knoten sind durch eine gerade Linie mit der Eltern-Kind-Beziehung verbunden, und ein umkreister schwarzer Knoten bezeichnet den momentanen Detektionsknoten. Hierbei wird zusätzlich der momentane Detektionsknoten in einem Anzeigemodus zum klaren Unterscheiden desselben von den anderen Knoten angezeigt, beispielsweise mit einem Blinkanzeigemodus, einem invertierten Anzeigemodus, einem Modus mit unterschiedlicher Farbanzeige, und so weiter.
- Bei dieser Detektionsdatensatz-Anzeigeeinheit 208 können die Eingaben des Anwenders zum Anweisen der Änderung des momentanen Detektionsknotens und zum Erzeugen eines neuen Fensters für die Detektionsergebnisanzeige empfangen werden.
- In einem Fall der Änderung des momentanen Detektionsknotens kann der Anwender die Eingabe zum Spezifizieren des gewünschten Detektionsknotens von dem bei dem Fenster für die Detektionsdatensatzanzeige angezeigten eingeben, durch Verwenden der Maus oder einer anderen Eingabeeinrichtung. Wird die Änderung des momentanen Detektionsknotens angewiesen, so weist die Detektionsdatensatz-Anzeigeeinheit 208 die Datensatzverwaltungseinheit 204 dahingehend an, dass sie den spezifizierten Detektionsknoten als neuen momentanen Detektionsknoten festlegt, und in Ansprechen hierauf führt die Datensatzverwaltungs-Steuereinheit 1031 die oben beschriebenen Schritte 1405 bis 1407 nach Fig. 14 aus. Durch Ändern des momentanen Detektionsknotens bei der beispielhaften Detektionsdatensatzanzeige nach Fig. 17A lässt sich die Detektionsdatensatzanzeige beispielsweise so ändern, wie in Fig. 17B gezeigt.
- Andererseits weist in einem Fall, in dem die Anwendereingabe zum Erzeugen eines neuen Fensters für die Detektionsergebnisanzeige empfangen wird, die Detektionsdatensatz-Anzeigeeinheit 208 die Detektionsergebnis-Anzeigeeinheit 207 zum Erzeugen und Anzeigen eines neuen Fensters für die Detektionsergebnisanzeige über die Steuerleitung 239 an.
- Die Detektionsergebnis-Anzeigeeinheit 207 wird gemäss dem in Fig. 18 gezeigten Flussdiagramm betrieben, wie nachfolgend dargelegt.
- Hierbei geht in Übereinstimmung mit einer Eingabemeldung der Betrieb selektiv zu einem geeigneten der nachfolgenden Betriebsabläufe gemäss dem Schritt 1802, 1803, 1804, 1806, 1807 und 1810 ausgehend von dem Schritt 1801 über, wie nachfolgend beschrieben.
- Insbesondere führt diese Detektionsergebnis-Anzeigeeinheit 207 die Anzeige der von der Detektionseinheit 203 über die Datenleitung 216 eingegebenen Detektionsergebnisse aus, sowie die Anzeige der Detektionsergebnisse für die Detektionsdatensatzdaten, die von der Datensatzverwaltungseinheit 204 über die Datenleitung 220 eingegeben werden, ferner die Eingabe der Annahme/Zurückweisungsdaten für die Dokumente von der Browser-Einheit 209 über die Datenleitung 226, das Erzeugen des Fensters für die Detektionseregebnisanzeige, die von der Detektionsdatensatz-Anzeigeeinheit 208 über die Steuerleitung 239 angewiesen wird, und das Erzeugen des Fensters für die Detektionsergebnisanzeige, die von der Angabeeinheit 201 über die Steuerleitung 229 angewiesen wird.
- Zusätzlich führt diese Detektionsergebnis-Anzeigeeinheit 207 auch einen der folgenden Schritte durch, d. h. Ändern der angezeigten Betrachtungsweise, Aktivieren der Browser- Einheit 209 und Reaktivieren der Detektionseinheit 203 gemäss den Akzeptier/Zurückweisungsdaten für die Dokumente bei Empfang der Eingabe des Anwenders.
- In einem Fall, in dem das Erzeugen des Fensters für die Detektionsergebnisanzeige von der Eingabeeinheit 201 oder der Detektionsdatensatz-Anzeigeeinheit 208 angewiesen wird, wird das Fenster für die Detektionsergebnisanzeige bei dem Schritt 1802 erzeugt. Hierbei kommt der Befehl von der Detektionsdatensatz-Anzeigeeinheit 208 von dem Schritt 1607 nach Fig. 16.
- Weiterhin werden dann, wenn Detektionsergebnisse von der Detektionseinheit 203 über die Datenleitung 216 eingegeben werden oder Detektionsergebnisse in dem Detektionsdatensatzdaten von der Datensatzverwaltungseinheit 204 über die Datenleitung 220 eingegeben werden, die eingegebenen Detektionsergebnisse bei dem Schritt 1803 angezeigt.
- Hierbei erfolgt diese Detektionsergebnisanzeige in einer Form einer mehrdimensionalen Anzeige mit jeder in den Detektionsergebnissen gespeicherten Betrachtungsweise als eine Achse, ferner den Detektionsbefehlen als Ursprung, und den Distanzen zwischen den Detektionsbefehlen und den Kandidatendokumenten für jede Betrachtungsweise als Koordinaten der Datenpunkte zum Darstellen der Kandidatendokumente.
- Bei dieser ersten Ausführungsform erfolgt diese mehrdimensionale Anzeige in beispielhafter Form, die in einem Teil (a) nach Fig. 19 gezeigt ist, die eine Darstellung eines dreidimensionalen Falls als ein Beispiel zeigt. Hier ist jede Achse durch die Betrachtungsweise markiert, die durch jede Achse dargestellt ist, wie "Aufgabe" und "Schlussfolgerung" als Beispiel.
- Bei diesem und in Fig. 19 gezeigten Beispiel ist eine der Betrachtungsweiseachsen mit "andere" bzw. "weitere" bezeichnet, da bei diesem Beispiel mehrere Betrachtungsweiseachsen auf diese eine als "weitere" bezeichnete Achse abgebildet werden, da eine Zahl der Betrachtungsweisen, die von den Detektionsergebnissen extrahiert wird, eine vorgegebene Zahl gleichzeitig anzeigbarer Betrachtungsweisen übersteigt, so dass der durch die Fig. 19 angezeigte mehrdimensionale Raum ein reduzierter Raum ist, der von dem tatsächlich höher dimensionalen Raum abgeleitet ist. Hierbei lassen sich die Koordinaten entlang dieser mit "weitere" markierten Achse durch Bilden eines gewichteten Mittelwerts der Koordinaten entlang der zusammenzufassenden Achsen gemäss der folgenden Gleichung (6) in beispielhafter Weise berechnen.
- r = Σvi · ri (6)
- Hierbei ist r eine Koordinate entlang der mit "weitere" bezeichneten Achse, ri ist eine Koordinate entlang der i- ten zusammenzufassenden Achse und vi ist eine Gewichtung für die i-te zusammenzufassende Achse.
- Es ist auch möglich, die obige Gleichung (6) gemäss der folgenden Gleichung (7) zu modifizieren.
- r = Σvi · (ri)² (7)
- Allgemein lässt sich die Formel zum Berechnen der Koordinate entlang dieser mit "weitere" bezeichneten Achse anhand der folgenden Gleichung (8) ausdrücken.
- r = func2(Σ vi · func1(ri)) (8)
- mit func1 und func2 als geeigneten Funktionen.
- Anstelle der Anzeige des Kennzeichnens "weitere" - wie in Fig. 19 gezeigt - ist es auch möglich, das Kennzeichen zum expliziten Anzeigen der Betrachtungsweisen zu verwenden, die durch die zusammengefassten Achse dargestellt sind, wie "Hintergrund + Verfahren" als Beispiel.
- Es ist auch zu erwähnen, dass sich die in Fig. 19 gezeigte dreidimensionale Anzeige des Beispiels einfach auf die zweidimensionale oder die eindimensionale durch weiteres Zusammenfassen der Achsen reduzieren lässt.
- Bei dem in Fig. 19 gezeigten Teil (a) sind die Datenpunkte für die Dokumente durch schwarze Punkte bezeichnet, begleitet durch Dokumententitel, die in den Umrandungen mit durchgezogener Linie bezeichnet sind.
- In einem Fall, in dem der Anwender die Annahme/Zurückweisungsdaten für momentan durchforstete Dokumente bei der Browser-Einheit 209 eingibt, werden die Annahme/Zurückweisungsdaten über die Datenleitung 226 bei dem Schritt 1804 empfangen. Hierbei weist jeder empfangene Annahme/Zurückweisungsdatenwert folgendes Format auf:
- < Dokument ID> ; < Annehmen/Zurückweisen> ,
- und < Annehmen/Zurückweisen> wird durch einen Wert "0" angezeigt, zum Bezeichnen der Zurückweisung des durch den begleitenden Dokument-ID-Wert bezeichneten Dokuments als ungeeignet für das detektierte Dokument, oder mit einem Wert "1", zum Anzeigen der Akzeptanz dieses Dokuments als geeignet für das detektierte Dokument.
- Anschließend wird bei der Detektionsergebnis-Anzeigeeinheit 207 die Anzeige des Dokuments gemäss dem eingegebenen Detektionsknoten-ID-Wert entsprechend aktualisiert, wie bei dem Teil (10) nach Fig. 19 gezeigt, und zwar bei dem Schritt 1805. Bei diesen Teilen (10) nach Fig. 19 sind die Datenpunkte für diejenigen Elemente, die durch den Annahme/Zurückweisungsdatenwert zurückgewiesen sind, anhand leerer Kreise bezeichnet, wohingehend diejenigen Datenpunkte für diejenigen Dokumente, die durch die Akzeptier/Zurückweisungsdaten akzeptiert werden, nach wie vor durch schwarze Punkte bezeichnet werden, und die Dokumententitel, die die schwarzen Kreise und die schwarzen Punkte begleiten, werden in unterschiedlichen Farben angezeigt, wie anhand der strichlierten Linienumrandungen und der durchgezogenen Linienumrandungen in dem Teil (c) nach Fig. 19 bezeichnet.
- Hierbei werden die Akzeptier/Zurückweisungsdaten, die von der Browser-Einheit 209 empfangen werden, in dem in Fig. 20 gezeigten Datenformat gespeichert, bis die neuen Detektionsergebnisse empfangen werden.
- Die Detektionsergebnis-Anzeigeeinheit 207 kann auch die Browser-Einheit 209 in Ansprechen auf die Eingabe des Anwenders unter Verwendung der Maus oder die andere Eingabeeinrichtung bei dem Fenster für die Detektionsergebnisanzeige aktivieren.
- Insbesondere dann, wenn der Datenpunkt zum Darstellen des einzelnen Dokuments bei dem Fenster für die Detektionsergebnisanzeige durch den Anwender spezifiziert ist, aktiviert die Detektionsergebnis-Anzeigeeinheit 207 die Browser-Einheit 209 für das spezifizierte Dokument über die Steuerleitung 234 bei dem Schritt 1806. In diesem Fall ändert sich die Detektionsergebnisanzeige wie in dem Teil (b) nach Fig. 19 gezeigt, bei dem der Dokumententitel zum Begleiten des Datenpunkts für das momentan durchleuchtete Dokument im blinkenden Anzeigemodus angezeigt wird oder in einem Modus mit unterschiedlicher Farbanzeige, wie durch die Schattierung in der Umrandung mit durchgezogener Linie bei dem Teil (b) nach Fig. 19 angezeigt.
- In einem Fall, in dem ein angezeigter Button "neues Detektieren" durch den Anwender bei dem Fenster für die Detektionsergebnisanzeige ausgewählt wird, wird die Detektionseinheit 203 bei dem Schritt 1807 gemäss den momentanen Detektionsergebnissen erneut aktiviert, einschließlich der Akzeptier/Zurückweisungsdaten für momentan angezeigte Dokumente, die von der Datenleitung 217 zugeführt wird.
- In einem Fall, in dem durch den Anwender bei dem Fenster für die Detektionsergebnisanzeige der angezeigte Button "Betrachtungsweise" ausgewählt wird, ändert sich die Betrachtungsweise zu einer neuen Betrachtungsweise bei dem Schritt 1808. Hierbei erfolgt - beim Ändern der Betrachtungsweise - eine Änderung dahingehend, welche Betrachtungsweise zu welcher Achse zuzuordnen ist, in Übereinstimmung mit der Eingabe des Anwenders. Anschließend werden die Detektionsergebnisse ausgehend von der neuen Betrachtungsweise bei dem Schritt 1809 angezeigt.
- In einem neuen Fall, in dem ein angezeigter Knopf "Erzeugen" durch den Anwender bei dem Fenster der Detektionsergebnisanzeige ausgewählt wird, wird der oben beschriebene Schritt 1802 erneut zum Erzeugen eines zusätzlichen Fensters für die erneute Detektionsergebnisanzeige ausgeführt. Anschließend werden in dem zusätzlich erzeugten Fenster dieselben Detektionsergebnisse, wie sie in dem ursprünglichen Fenster angezeigt sind, ebenso angezeigt. Hierbei lassen sich durch Auswahl unterschiedlicher Betrachtungsweisen für das ursprüngliche und die zusätzlichen Fenster die Detektionsergebnisse ausgehend von zwei unterschiedlichen Betrachtungsweisen anzeigen. Hierbei werden jedoch die Detektionsergebnisse selbst und die Akzeptier/Zurückweisungsdaten zwischen diesen ursprünglichen und dem zusätzlichen Fenstern geteilt, so dass die Anzeige der Akzeptier/Zurückweisungsdaten für die Dokumente identisch für das ursprüngliche und die zusätzlichen Fenster sind.
- In einem Fall, in dem ein angezeigter Kropf "Löschen" durch den Anwender bei dem Fenster für die Detektionsergebnisanzeige ausgewählt wird, wird das Fenster für die Detektionsergebnisanzeige bei dem Schritt 1810 gelöscht.
- Die Browser-Einheit 209 wird gemäss dem in Fig. 21 gezeigten Flussdiagramm wie folgt betrieben.
- Hierbei geht gemäss einer Eingabemeldung der Betrieb ausgehend von dem Schritt 2101 selektiv zu einem geeigneten der folgenden Betriebsschritte gemäss dem Schritt 2102, 2104, 2108, 2115 und 2116 über, wie nachfolgend beschrieben.
- Diese Browser-Einheit 209 wird von der Detektionsergebnis- Anzeigeeinheit 207 über die Steuerleitung 234 aktiviert, wie oben beschrieben, und sie bewirkt ein Anzeigen des Dateninhalts des durch die Eingabe des Anwenders spezifizierten Dokuments.
- Insbesondere in einem Fall, in dem diese Browser-Einheit 209 durch den Schritt 1806 gemäss Fig. 18 aktiviert wird, wird bei dem Schritt 2102 das Fenster für die Browser- Einheit-Anzeige erzeugt. In diesem Punkt wird auch der Dokumenten-ID-Wert des spezifizierten Dokuments von der Detektionsergebnis-Anzeigeeinheit 207 über die Datenleitung 227 eingegeben. Anschließend werden die Dokumentendaten des spezifizierten Dokuments von der Dokumentendaten- Speichereinheit 206 über die Datenleitung 219 ausgelesen, und die Zusammenfassung des spezifizierten Elements wird bei dem Schritt 2103 bei dem im Rahmen des Schritts 2102 erzeugten Fenster angezeigt. Hierbei kann - sofern gewünscht - anstelle der Zusammenfassung das ursprüngliche Dokument angezeigt werden.
- Hierbei ist der Dateninhalt des Dokuments in der Dokumentendaten-Speichereinheit 206 in einem in Fig. 22 beispielhaft gezeigten Datenformat gezeigt, bei dem Zeiger zu dem ursprünglichen Element, der Zusammenfassung, der Schlüsselwortliste, der Betrachtungsweiseliste und der Dokumentenstruktur gemeinsam registriert sind.
- In diesem Fall kann die Browser-Einheit-Anzeige eine beispielhafte und in Fig. 23 gezeigte Form aufweisen, bei der ein Teil (a) eine Ursprungsfensteranzeige zum Darstellen der Zusammenfassung des spezifizierten Dokuments in einem Fall des oben beschriebenen Schritts 2103 zeigt. Diese anfängliche Fensteranzeige erzielt auch die Anzeige der Knöpfe für "Betrachtungsweise" und "Schlüsselwort" und die Anzeige der Knöpfe für "OK" und "NG" zum Eingeben der Akzeptier/Zurückweisungsdaten.
- In einem Fall, in dem ein angezeigter Knopf "Betrachtungsweise" durch den Anwender bei dem Fenster für die Browser-Einheits-Anzeige ausgewählt wird, erfolgt ein Darstellen der Betrachtungsweiseliste zum Auflisten sämtlicher Betrachtungsweisen, die in dem Dokumentendaten für das spezifizierte Dokument gespeichert sind, in einem Menüformat, wie es in Teilen (c) von Fig. 23 gezeigt ist, und zwar bei dem Schritt 2104, und es erfolgt ein Warten auf die Auswahl der gewünschten Betrachtungsweise durch den Anwender bei dem Schritt 2105. Anschließend wird - sofern es sich nicht um den Abbruch bei dem Schritt 2106 handelt - der Textinhalt des betreffenden Dokuments für die spezifizierte Betrachtungsweise in einer Form angezeigt, wie sie in einem Teil (e) nach Fig. 23 dargestellt ist, und zwar bei dem Schritt 2107.
- In einem Fall, in dem ein angezeigter Knopf "Schlüsselwort" durch den Anwender bei dem Fenster für die Browser- Einheits-Anzeige ausgewählt wird, erfolgt eine Darstellung der Schlüsselwortliste zum Auflisten sämtlicher Schlüsselwörter, die in den Dokumentdaten für das spezifizierte Dokument gespeichert sind, in einem Teil (b) nach Fig. 23 gezeigten Menüformat, und zwar bei dem Schritt 2108, und die Auswahl des gewünschten Schlüsselworts durch den Anwender wird bei dem Schritt 2109 abgewartet. Anschließend erfolgt - sofern es sich nicht um den Abbruch bei dem Schritt 2110 handelt - eine Darstellung der Betrachtungsweiselisten unter Auflistung sämtlicher Betrachtungsweisen im Hinblick auf das spezifizierte Schlüsselwort in einem Menüformat, das in einem Teil (d) in Fig. 23 gezeigt ist, und zwar bei dem Schritt 2111, und die Auswahl der gewünschten Betrachtungsweise durch den Anwender wird bei dem Schritt 2112 abgewartet. Anschließend wird - sofern es sich nicht um den Abbruch bei dem Schritt 2113 handelt - der Textinhalt des Dokuments im Hinblick auf die spezifizierte Betrachtungsweise in einer Form angezeigt, die in einem Teil (e) von Fig. 23 gezeigt ist, und zwar bei dem Schritt 2114.
- In einem Fall, in dem der angezeigte Knopf "OK" oder "NG" durch den Anwender bei dem Fenster für die Browser-Einheit- Anzeige zum Spezifizieren der Akzeptier/Zurückweisungsdaten ausgewählt wird, werden die eingegebenen Akzeptier/Zurückweisungsdaten zu der Detektionsergebnis- Anzeigeeinheit 207 bei dem Schritt 2115 übertragen.
- In einem Fall, in dem das Löschen des Fensters für die Browser-Einheit-Anzeige durch den Anwender angewiesen wird, wird das Fenster für die Browser-Einheits-Anzeige bei dem Schritt 2116 gelöscht.
- Wie detailliert beschrieben, werden gemäss dieser ersten Ausführungsform die Distanzen zwischen den Detektionsbefehlen und detektierten Dokumenten für mehrere Betrachtungsweisen erhalten, und die Detektionsergebnisse werden durch Anzeigen der erhaltenen Distanzen in einem mehrdimensionalen Raum dargestellt, der durch Verwenden der Betrachtungsweisen als Achsen gebildet wird, so dass der Anwender leicht verstehen kann, wie jedes detektierte Dokument nahe bei den Detektionsbefehlen für welche Betrachtungsweise liegt, gemäss der Verteilung der Datenpunkte bei der mehrdimensionalen Anzeige.
- Demnach ist es gemäss dieser ersten Ausführungsform möglich, ein Dokumentendetektionssystem unter Verwendung der Detektionsergebnisdarstellung zu schaffen, die es einem Anwender erleichtert, die Relevanz jedes detektierten Dokuments schnell zu verstehen, so dass der Anwender in die Lage versetzt wird, einen Gesamtbetrieb unter Verwendung des Dokumenten-Detektionssystems gleichmäßig durchzuführen.
- Es ist bei dieser ersten Ausführungsform auch möglich, einen Datensatz der Detektionsergebnisanzeige vor dem erneuten Detektionsbetrieb aufrecht zu erhalten, durch Speichern der Detektionsergebnisse und der zugeordneten Akzeptier/Zurückweisungsdaten als Detektionsdatensatzdaten, so dass sich die Detektionsergebnisanzeige vor dem erneuten Detektionsbetrieb selbst nach dem erneuten Detektionsbetrieb reproduzieren lässt.
- Es ist zu erwähnen, dass der in Fig. 10 gezeigte und bei der ersten Ausführungsform verwendete Schlüsselwortindex in mehreren Ausführungsformen in Zuordnung zu den mehreren Betrachtungsweisen vorgesehen sein kann, so dass der in jedem TRIE-Struktureintrag des Schlüsselwortindex nach Fig. 10 registrierte Betrachtungsweisen-Datenwert weggelassen werden kann.
- Es ist auch zu erwähnen, dass sich der in der TRIE-Struktur vorgegebenen Schlüsselwortindex nach Fig. 10 durch den Schlüsselwortindex ersetzen lässt, der das andere bekannte Referenzschema mit hoher Geschwindigkeit verwendet, beispielsweise dasjenige mit der Hash-Funktion.
- Nun wird die zweite Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Diese zweite Ausführungsform ist eine Modifikation der oben beschriebenen ersten Ausführungsform im Hinblick auf den Betrieb der Detektionsergebnis-Anzeigeeinheit 207. Die Merkmale, die sich von dem Betrieb der Detektionsergebnis- Anzeigeeinheit 207 unterscheiden, sind im wesentlichen äquivalent zu denjenigen der oben beschriebenen ersten Ausführungsform.
- Insbesondere wird bei dieser zweiten Ausführungsform die Detektionsergebnis-Anzeigeeinheit 207 gemäss dem in Fig. 24A und 24B gezeigten Flussdiagramm wie folgt betrieben.
- Zunächst wird bei dem Schritt 2402 beurteilt, ob eine Eingabemeldung eine Mauseingabe von dem Anwender ist oder nicht. Ist dies nicht der Fall, so geht gemäss der Eingabemeldung der Betrieb selektiv ausgehend von dem Schritt 2401 zu einem geeigneten der folgenden Betriebsschritte gemäss dem Schritt 2402, 2403, 2404 und 2405 über, wie nachfolgend beschrieben. Hierbei sind die Schritte 2403, 2404, 2405 und 2406 äquivalent zu den Schritten 1802, 1803, 1804 und 1805 gemäss dem in Fig. 18 gezeigten Flussdiagramm der ersten Ausführungsform, so dass deren Beschreibungen weggelassen werden.
- In einem Fall der Mauseingabe wird bei den Schritten 2407, 2409, 2411 und 2413 sequentiell beurteilt, ob die Mauseingabe ein "Lösch"-Befehl ist, ein "Erzeuge"-Befehl, ein "Neudetektier"-Befehl oder ein "Betrachtungsweise"- Befehl. Handelt es sich um einen dieser Befehle, so geht der Betrieb jeweils zu den Schritten 2408, 2410, 2412 oder 2414 und 2415 über, die jeweils äquivalent zu den Schritten 1810, 1802, 1807 oder 1808 und 1809 sind, gemäss dem in Fig. 18 gezeigten Flussdiagramm für die erste Ausführungsform, so dass deren Beschreibungen weggelassen werden. Zusätzlich wird bei dem Schritt 2416 beurteilt, ob die Mauseingabe ein Klicken auf einem Punkt zum Anzeigen des Dokuments ist oder nicht. Ist dies der Fall, so geht der Betrieb zu dem Schritt 2417 über, der äquivalent zu dem Schritt 1806 des in Fig. 18 gezeigten Flussdiagramms für die erste Ausführungsform ist, so dass ihre Beschreibungen weggelassen werden.
- Als nächstes wird bei dem Schritt 2418 beurteilt, ob die Mauseingabe ein Klicken auf ein Ende einer Achse ist oder nicht. Ist dies der Fall, so wird die durch das Klicken spezifizierte Achse entlang der Bewegung der Maus gedreht, die durch den Anwender eingegeben wird, bei geeignetem Vergrößern oder Zusammenfassen der Achse im Rahmen des Schritts 2419. Beispielsweise lässt sich ausgehend von der Anzeige, wie sie im Teil (a) nach Fig. 25 gezeigt ist, eine Achse so drehen, wie es in dem Teil (b) von Fig. 25 gezeigt ist, oder ein Ursprung lässt sich durch gemeinsames Drehen der Achsen verschieben, wie bei einem Teil (c) von Fig. 25 gezeigt. Anschließend erfolgt unter Verwendung der Achsen mit geänderter Orientierung eine erneute Anzeige des Detektionsergebnis bei dem Schritt 2420.
- Andernfalls wird bei dem Schritt 2421 beurteilt, ob die Mauseingabe ein "Vergrößerungs"-Befehl ist oder nicht. Ist dies der Fall, so wird eine Bereichspezifikation für einen zu vergrößernden Abschnitt durch den Anwender eingegeben, wie bei einem Teil (d) nach Fig. 25 gezeigt, und zwar bei dem Schritt 2422. Dann wird die vergrößerte Anzeige erneut durch Anwenden einer Normalisierung in dem spezifizierten Bereich angezeigt. Insbesondere wird die vergrößerte Anzeige durch ein Neuskalieren der Distanz gemäss der folgenden Gleichung (9) erhalten.
- Hierbei ist bj' = aj/Rj, aj ist ein Element von Dist(Q, D1), und Rj ist ein Bereich jeder Achse, der durch eine Bereichspezifikation erhalten wird.
- Andernfalls wird bei dem Schritt 2424 beurteilt, ob die Mauseingabe ein "Zusammenfassungs"-Befehl bzw. ein "Kontrahier"-Befehl ist oder nicht. Ist dies so, so wird eine Bereichspezifikation für einen zu kontrahierenden Abschnitt durch den Anwender bei dem Schritt 2425 eingegeben. Anschließend erfolgt eine erneute Anzeige der zusammengefassten Anzeige durch Festlegen des spezifizierten Bereichs als eine Gesamtgröße. Insbesondere wird die kontrahierte Anzeige durch Neuskalieren der Distanzen gemäss der folgenden Gleichung (10) erhalten.
- Hierbei ist bj" = aj · Rj, aj ist ein Element von Dist(Q, Di), und Rj ist ein Bereich jeder Achse, der durch eine Bereichspezifikation erhalten wird.
- Andernfalls wird bei dem Schritt 2427 beurteilt, ob die Mauseingabe ein "Annahme/Zurückweisungs"-Befehl ist oder nicht. Ist dies der Fall, so erfolgt die Eingabe einer Bereichspezifikation für einen Abschnitt, in dem Akzeptier/Zurückweisungsdaten für die Dokumente umzukehren sind, durch den Anwender bei dem Schritt. 2428. Anschließend erfolgt bei dem Schritt 2429 eine erneute Anzeige der Anzeige, bei der die Akzeptier/Zurückweisungsdaten für jedes Dokument in dem spezifizierten Bereich invertiert sind.
- Es ist zu erwähnen, dass die obigen Schritte 2421 bis 2427 so modifizierbar sind, dass sich die Bereichspezifikation als erstes durchführen lässt, bevor der Befehlsinhalt spezifiziert ist.
- Es ist auch zu erwähnen, dass sich bei der Detektionsergebnisanzeige durch die Detektionsergebnis- Anzeigeeinheit 207 die Perspektive im Hinblick auf den Ursprung entlang der Tiefenrichtung durch Überschreiben des Datenpunkts und des Titels des Dokuments ausdrücken lässt, das an einer näheren Seite über dem Datenpunkt angeordnet ist, sowie dem Titel, der das an einer entfernteren Seite angeordnet ist. Weiterhin lassen sich - sofern gewünscht - zusätzlich die anderen Computergraphiktechniken zum Ausdrücken der dreidimensionalen Perspektive einsetzen, beispielsweise eine Farbabstufung oder eine Schattierung.
- Es ist auch zu erwähnen, dass nach dem letzten Schritt jeder Betriebsabfolge dieses in Fig. 24 gezeigten Flussdiagramms auf das nächste Eingabeereignis - beispielsweise die Mauseingabe - gewartet wird, und der Betrieb startet ausgehend vom Beginn in Ansprechen auf das Eingabeereignis.
- Als nächstes wird die dritte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Diese dritte Ausführungsform ist eine weitere Modifikation der oben beschriebenen zweiten Ausführungsform im Hinblick auf den Betrieb der Detektionsergebnis-Anzeigeeinheit 207. Diejenigen Merkmale, die sich von dem Betrieb der Detektionsergebnis-Anzeigeeinheit 207 unterscheiden, sind im wesentlichen äquivalent zu denjenigen der ersten oben beschriebenen Ausführungsform.
- Insbesondere wird bei dieser dritten Ausführungsform die Detektionsergebnis-Anzeigeeinheit 207 zusätzlich gemäss den in Fig. 26A gezeigten Flussdiagramm wie folgt betrieben. Hierbei kann vor dem Schritt 2618 die Detektionsergebnis- Anzeigeeinheit 207 Betriebsabläufe ähnlich zu denjenigen der in Fig. 24 gezeigten Schritte 2401 bis 2417 für die zweite Ausführungsform ausführen.
- Dann wird bei dem Schritt 2618 beurteilt, ob die Mauseingabe ein "Dreh"-Befehl ist oder nicht. Ist dies der Fall, so wird bei dem Schritt 2619 auf die Mauseingabe gewartet, und bei dem Schritt 2620 wird beurteilt, ob die nächste Mauseingabe ein Klicken in einer Nähe einer Achse ist oder nicht.
- Ist dies der Fall, so wird jeder Datenpunkt zum Darstellen jedes Dokuments des Detektionsergebnis um einen vorgegebenen Winkel θ um die durch die Mauseingabe spezifizierte Achse gedreht, und die neuen Koordinaten jedes Datenpunkts nach der Drehung werden bei dem Schritt 2621 erhalten. Anschließend erfolgt die Anzeige des Detektionsergebnis unter Verwendung der neuen Koordinaten, die bei dem Schritt 2621 erhalten werden, für jeden Datenpunkt bei dem Schritt 2622.
- Hierbei lässt sich die Anzeige des Detektionsergebnis bei dem Schritt 2622 gemäss dem in Fig. 26B gezeigten Flussdiagramm ausführen, gemäss dem Koordinaten jedes Datenpunkts zum Darstellen jedes Dokuments des Detektionsergebnisses auf eine vorgegebene zweidimensionale Ebene bei dem Schritt 2623 projiziert werden, und anschließend wird die Detektionsergebnisanzeige gemäss den projizierten Koordinaten für jeden Datenpunkt an der zweidimensionalen Ebene erhalten. Dieser in Fig. 26B gezeigte Detektionsergebnis-Anzeigebetrieb lässt sich auch bei den anderen Schritten einsetzen, die die Detektionsergebnisanzeige erfordern, beispielsweise diejenigen Schritte 2404, 2415 und 2420 des in Fig. 24 gezeigten Flussdiagramms der zweiten Ausführungsform.
- Bei dem in Fig. 26B gezeigten Detektionsergebnis- Anzeigebetrieb ist die Projektion auf die zweidimensionale Ebene offensichtlich aufgrund der Anforderung zum Darstellen der mehrdimensionalen Detektionsergebnisanzeige auf einem zweidimensionalen Anzeigebildschirm erforderlich.
- Hierfür ist das allgemeine Verfahren zum Projizieren eines Punkts in einem Koordinatensystem mit einer bestimmten Dimension in ein Koordinatensystem mit einer niedrigeren Dimension mathematisch gut als Projektion auf einen Teilraum bekannt. Die Projektion auf die zweidimensionale Ebene bei dem Schritt 2623 entspricht einem Spezialfall dieses allgemeinen Verfahrens, so dass sich dieses allgemein bekannte Verfahren bei dem Schritt 2623 verwenden lässt.
- Wie für die Rotation bei dem Schritt 2621 ist es auch allgemein bekannt, dass ein Koordinatenvektor "a" jedes Punkts sich in einen gedrehten Koordinatenvektor "a'" transformieren lässt, durch Drehung um eine Z-Achse gemäss einem Winkel 8 gemäss der folgenden Gleichung (11).
- Demnach lässt sich in einem Fall der Schritte 2621 und 2622 nach Fig. 26A, nachdem die Koordinaten sämtlicher Datenpunkte gemäss dieser Gleichung (11) transformiert sind, die Projektion auf die zweidimensionale Ebene ausführen, damit die Detektionsergebnisanzeige nach der Drehung erhalten wird.
- Hier lässt sich die allgemeine Drehung um eine beliebige Achse als Linearkombination der Drehungen um drei orthogonale Koordinatenachsen ausdrücken, so dass die Drehung um irgendeine vorgegebene Achse sich durch sequentielles Ausführen der Drehung um jede der orthogonalen Koordinatenachsen erhalten lässt.
- Als Beispiel lässt sich dann, wenn die in Fig. 27A gezeigte Detektionsergebnisanzeige durch Auswahl des "Dreh"-Knopfs und Klicken bei einer Nähe der vertikalen Achse nach Fig. 27A gedreht wird, die Detektionsergebnisanzeige so ändern, wie in Fig. 27B gezeigt, bei der die gesamte Detektionsergebnisanzeige um die vertikale Achse gemäss einem vorgegebenen Winkel gedreht ist.
- Zusätzlich lässt sich beim Erhalten der Detektionsergebnisanzeige durch den Betrieb nach Fig. 26B durch Projizieren des mehrdimensionalen Detektionsergebnis auf die zweidimensionale Ebene die dreidimensionale Perspektive verbessern, indem ergänzende Liniensegmente bereitgestellt werden, wie in Fig. 27C gezeigt, derart, dass die ergänzenden Liniensegmente für jeden Datenpunkt Liniensegmente darstellen, die sich von jedem Datenpunkt entlang der x-, y- und z-Achsen erstrecken, bis sie jeweils die y-z-Ebene, die z-x-Ebene und die x-y-Ebene schneiden, wie sie durch die Koordinatenachsen definiert sind, die durch die durchgezogenen Linien bezeichnet sind.
- Es ist zu erwähnen, dass die bei dieser dritten Ausführungsform zum Zweck des Spezifizierens des Drehbetriebs verwendete Mauseingabe durch irgendeine andere Eingabeeinrichtung ersetzt werden kann, die die Fähigkeit derselben Funktion hat, wie einem Datenglobus, der bei der dreidimensionalen Objektanzeigemanipulation bei Computergraphiken verwendet wird, als Beispiel.
- Als nächstes wird die vierte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser vierten Ausführungsform ist die Detektionsdatensatzanzeige in Form einer Baumstruktur, wie sie bei der ersten oben beschriebenen Ausführungsform verwendet wird, modifiziert, um weiter die zusammengefasste Anzeige des zugeordneten Detektionsergebnis in einer Nähe jedes Detektionsknoten mit einzubeziehen, wie in Fig. 28 gezeigt.
- Mit dieser modifizierten Detektionsdatensatzanzeige nach Fig. 28 wird es für den Anwender einfacher, die zurückliegenden Detektionsfunktionen bzw. -ausführungen zu verstehen.
- Hier lässt sich die zusammengefasste bzw. kontrahierte Anzeige des Detektionsergebnis in der Weise erhalten, die ähnlich zu derjenigen ist, die bei der zweiten Ausführungsform verwendet wird, und zwar in Ansprechen auf die Mauseingabe für den "Zusammenzieh"-Befehl.
- Als nächstes wird die fünfte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser fünften Ausführungsform wird anstelle des Extrahierens der Blickwinkeldaten von dem Ergebnis der syntaktischen Analyse der Eingabesätze und dem Verwenden der Vorgabebetrachtungsweise-Einstellung in einem Fall bei einem Fehler zum Extrahieren irgendeines Betrachtungsweise- Datenwerts vom Ergebnis der syntaktischen Analyse für Eingabesätze gemäss der oben beschriebenen ersten Ausführungsform ermöglicht, das Festlegen der Betrachtungsweise interaktiv auszuführen, in einem Menüformat, und zwar durch Bereitstellen eines Fensters für die Detektionsbefehls-Satzeingabe, das mit einem Knopf für eine Betrachtungsweiseauswahl ausgerüstet ist, wie in Fig. 29 gezeigt. Wählt in diesem Fall der Anwender den Betrachtungsweiseknopf, so erscheint eine Betrachtungsweise-Menüauflistung sämtlicher verfügbarer Betrachtungsweisen, wie in Fig. 29 gezeigt, so dass der Anwender irgendeine gewünschte Betrachtungsweise von diesem Betrachtungsweisemenü auswählen kann. Hierbei kommt die Betrachtungsweise-Einstellung unmittelbar vor der Detektionsbefehls-Satzeingabe, die durch Eingabe des letzten Rücksprungs abgeschlossen ist, für den Aufbau des Detektionsbefehls zum Einsatz.
- Wie bei dem Beispiel in Fig. 29 gezeigt, erfolgt die Eingabe eines Detektionsbefehlssatzes "Verfeinerung des Wissens" aus einer Betrachtungsweise "Aufgabe", wohingehend ein anderer Detektionsbefehlssatz "Entwicklung eine Expertensystems" ausgehend von einer Betrachtungsweise "Schlussfolgerung" eingegeben wird, wie bei dem rechten Randfeld in dem Fenster gezeigt. Dieses Fenster kann auch einen Detektionsknopf zusammen mit dem Betrachtungsweise- Knopf haben, wie in Fig. 29 bezeichnet.
- Als nächstes wird die sechste Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser sechsten Ausführungsform ist die oben beschriebene erste Ausführungsform im Hinblick auf mehrere Aspekte wie folgt erweitert. Hier werden lediglich diejenigen Merkmale, die sich von zugeordneten Merkmalen der ersten Ausführungsform unterscheiden, detailliert beschrieben.
- Bei dieser sechsten Ausführungsform führt die Detektionsbefehls-Erzeugungseinheit 302 bei der Eingabeanalyseeinheit 202 einen Betrieb gemäss dem in Fig. 30 gezeigten Flussdiagramm durch, und bei diesem sind die Schritte 3001, 3002 und 3003 identisch zu den in Fig. 5 gezeigten Schritten 501, 502 und 503 der ersten Ausführungsform, gefolgt von einem Schritt 3004, bei dem ein Fenster für eine Betrachtungsweiseextrahier- Ergebnisanzeige erzeugt wird, sowie einem Schritt 3005, bei dem das Betrachtungsweise-Extrahierergebnis bei dem in dem Schritt 3004 erzeugten Fenster angezeigt wird.
- In diesem Fall wird die Betrachtungsweise-Extrahierung selbst ähnlich zu der ersten Ausführungsform ausgeführt, jedoch wird das Ergebnis der Betrachtungsweise-Extrahierung in einer in Fig. 31 gezeigten Form angezeigt, bei dem die Schlüsselwörter in Zuordnung zu jeder Betrachtungsweise tabelliert sind.
- Weiterhin empfängt in diesem Fall die Distanzberechnungseinheit 804 der Detektionseinheit 203 die Betrachtungsweisedaten im Zusammenhang mit den Schlüsselwörtern und den Detektionsbefehlen von der Detektionsteuereinheit 801 über die Datenleitung 808.
- Andererseits wird die Datensatzverwaltungs-Steuereinheit 1301 der Datensatzverwaltungseinheit 204 gemäss dem in Fig. 32 gezeigten Flussdiagramm wie folgt betrieben.
- Insbesondere sind bei diesem in Fig. 32 gezeigten Flussdiagramm die Schritte 3201 bis 3207 identisch zu den in Fig. 14 gezeigten Schritten 1401 bis 1407 der ersten Ausführungsform. Zusätzlich ist ein Schritt 3208 zwischen den Schritten 3206 und 3207 vorgesehen, bei dem Detektionsknotendaten aktualisiert und angezeigt werden, sowie ein Schritt 3209, der von dem Schritt 3201 fortschreiten kann, bei dem Akzeptier/Zurückweisungsdaten für die Dokumente gespeichert werden.
- In diesem Fall wird an jeden Detektionsknoten ein in Fig. 33 im Zusammenhang mit einem Beispiel gezeigtes Format vergeben, bei dem zusätzlich zu dem Detektionsknoten-ID- Wert, dem Eltern-Knoten-ID-Wert, den Detektionsbefehlen und den Detektionsergebnissen, die in Fig. 15 für die erste Ausführungsform enthalten sind, die Fig. 33 weiter ein Detektionsdatum und eine Detektionszeit enthält, sowie einen detektierten Eingabesatz, eine Zahl detektierter Dokumente, eine Zahl von OK-Dokumenten, eine Liste der OK- Dokumente, eine Zahl der NG-Dokumente und eine Liste der NG-Dokumente. Hier reflektieren Einträge im Hinblick auf das Detektieren den Detektionsbetrieb, wohingegen Einträge im Hinblick auf OK-Dokumente und die NG-Dokumente die Akzeptier/Zurückweisungsdaten für die Dokumente anzeigen, die durch den Anwender bei der Browser-Einheit 209 eingegeben werden.
- Die Detektionsdatensatz-Anzeigeeinheit 208 bewirkt ein Anzeigen der Detektionsdatensatzanzeige in einer Form der Baumstruktur, wie sie in Fig. 35A gezeigt ist, und die sich von derjenigen nach Fig. 17A dahingehend unterscheidet, dass jeder Detektionsknoten durch einen schwarzen Punkt dargestellt ist, begleitet durch das Detektionsdatum auf der linken Seite und die Zahl der detektierten Dokumente auf der rechten Seite.
- Insbesondere wird die Detektionsdatensatz-Anzeigeeinheit 208 gemäss dem in Fig. 34 gezeigten Flussdiagramm wie folgt betrieben.
- Insbesondere sind bei diesem in Fig. 34 gezeigten Flussdiagramm die Schritte 3401 bis 3407 identisch zu den in Fig. 16 für die erste Ausführungsform gezeigten Schritten 1601 bis 1607. Zusätzlich ist ein Schritt 3408 vorgesehen, bei dem Detektionsknotendaten ausgelesen werden, gefolgt durch einen Schritt 3409, bei dem ausgelesene-Detektionsknotendaten aktualisiert und angezeigt werden. Weiterhin gibt es einen Schritt 3410, bei dem ein Fenster für die Detektionsknotendatenanzeige erzeugt wird, sowie ein Schritt 3411, bei dem ein Fenster für die Detektionsknotenanzeige erzeugt wird, und ein Schritt 3412, bei dem eine Erzeugung und eine Anzeige des Fensters für die Browser-Einheit-Anzeige in einem Fall angewiesen wird, dass der Anwender den OK-Dokumentennamen oder den NG-Dokumentennamen spezifiziert hat. Hier werden die Detektionsknotendaten bei dem Fenster für die Detektionsknotenanzeige bei dem Schritt 3411 angezeigt, in einer beispielhaften in Fig. 36 gezeigten Form in Zuordnung zu dem in Fig. 33 gezeigten Detektionsknoten.
- Bei dieser sechsten Ausführungsform wird die Detektionsergebnisanzeigeeinheit 207 gemäss dem in Fig. 37 beschriebenen Flussdiagramm wie folgt betrieben.
- Insbesondere sind bei diesem in Fig. 37 gezeigten Flussdiagramm die Schritte 3701 bis 3710 identisch zu den in Fig. 18 für die erste Ausführungsform gezeigten Schritten 1801 bis 1810.
- Zusätzlich ist bei dieser sechsten Ausführungsform ein vorgegebener Schwellwert zum Clustern vorgesehen, zum Entscheiden eines Clusterns der Detektionsergebnisanzeige, bei der Dokumente innerhalb eines vorgegebene Distanzbereichs zusammen zum Bilden eines Clusters für die gemeinsame Anzeige gruppiert sind, oder ob dies nicht durchgeführt wird. In einem Fall der Gesamtzahl detektierter Dokumente, die nicht diesen vorgegebenen Schwellwert übersteigt, erfolgt die mehrdimensionale Anzeige des Detektionsergebnis bei dem Schritt 3703 genau so wie bei der ersten Ausführungsform.
- Übersteigt andererseits die Gesamtzahl der detektierten Dokumente den vorgegebenen Schwellwert, so wird das Detektionsergebnis bei dem Schritt 3712 geclustert, und anschließend wird das geclusterte Detektionsergebnis bei dem Schritt 3713 angezeigt.
- Hier wird das Clustern bei dem Schritt 3712 gemäss dem in Fig. 38 gezeigten Flussdiagramm wie folgt ausgeführt. Insbesondere werden zunächst die detektierten Dokumente des Detektionsergebnisses so geclustert, dass eine Zahl der detektierten Dokumente pro Cluster weniger als der vorgegebene Schwellwert zum Clustern bei dem Schritt 3801 ist. Anschließend wird bei dem Schritt 3802 bestimmt, ob eine Zahl der Cluster, die sich aus dem Schritt 3801 ergeben, niedriger als eine vorgegebene Minimalzahl der Cluster ist oder nicht. Ist bei dem Schritt 3802 die sich aus dem Schritt 3801 ergebende Zahl der Cluster niedriger als die vorgegebene minimale Zahl der Cluster, so erfolgt ein weiteres Clustern eines Clusters mit der größten Zahl detektierter Dokumente bei dem Schritt 3803, und der Betrieb kehrt zu dem Schritt 3802 zurück. Detaillierter wird das Clustern bei dem Schritt 3801 gemäss dem in Fig. 39 gezeigten Flussdiagramm wie folgt ausgeführt. Insbesondere wird zunächst der Koordinatenraum der Detektionsergebnisanzeige in acht Teilräume unterteilt, bei Ebenen parallel zu den zwei Koordinatenachsen und durch ein Zentrum einer anderen der Koordinatenachsen, und zwar bei dem Schritt 3901. Anschließend wird bei dem Schritt 3902 bestimmt, ob eine Zahl der detektierten Dokumente in irgendeinem Teilraum größer als ein vorgegebener Schwellwert zum Clustern ist. Gibt es bei dem Schritt 3902 einen Teilraum, bei dem die Zahl der detektierten Dokumente größer ist als der vorgegebene Schwellwert, so wird dieser Teilraum mit einer übermäßigen Zahl detektierter Dokumente weiter in acht Teilräume bei dem Schritt 3903 unterteilt, und der Betrieb kehrt zu dem Schritt 3902 zurück.
- Bei diesem Clusterbetrieb nach Fig. 39 werden die in Fig. 40 gezeigten Clusterdokumentdaten zum Anzeigen der Zuordnungen zwischen den Clustern und den detektierten Dokumenten erzeugt, zum Nachverfolgen des Clusterbetriebs.
- In diesem Fall wird das geclusterte Detektionsergebnis bei dem Fenster für die Detektionsergebnisanzeige in einem in Fig. 41 gezeigten beispielhaften Clusteranzeigemodus angezeigt, bei dem jeder Cluster gemäss einer Distanz im Hinblick auf die Detektionsbefehle bei dem Ursprung in einem dreidimensionalen Raum - gebildet durch Achsen zum Darstellen der Betrachtungsweisen - angezeigt wird. Hierbei wird jeder Cluster als eine kleine Sphäre dargestellt, die bei einer Koordinatenposition angeordnet ist, die anhand er Koordinatenpositionen der detektierten Dokumente in jedem Cluster berechnet wird, wie einer durchschnittlichen Koordinatenposition der Koordinatenpositionen der detektierten Dokumente in jedem Cluster, als Beispiel. Es ist auch möglich, einen Titel eines beliebig detektierten Dokuments in jedem Cluster zusammen mit der Sphärendarstellung jedes Clusters als repräsentativen Titel anzuzeigen.
- Zusätzlich wird die Zahl der detektierten Dokument in jedem Cluster ausgedrückt durch Ändern einer Größe oder eines Konzentrierniveaus jeder kleinen Sphäre in Zuordnung zu der Zahl der detektierten Dokumente in jedem Cluster. Es ist auch möglich, die Zahl der in jedem Cluster enthaltenen detektierten Dokumente durch Bezugszeichen anzuzeigen, die innerhalb oder in einer Nähe der kleinen Sphäre zum Darstellen jedes Clusters angezeigt werden.
- Es ist zu erwähnen, dass bei der Detektionsergebnisanzeige des in Fig. 41 gezeigten Clusteranzeiemodus durch die Detektionsergebnis-Anzeigeeinheit 207 die Perspektive relativ zu dem Ursprung entlang der Tiefenrichtung durch das Überschreiben der kleinen Sphäre für den Cluster ausgedrückt werden kann, der an einer näheren Seite über der kleinen Sphäre angeordnet ist, für den bei einer entfernteren Seite angeordneten Cluster. Weiterhin lassen sich - sofern gewünscht - die anderen Computergraphiktechniken zum Ausdrücken der dreidimensionalen Perspektive zusätzlich einsetzen, beispielsweise eine Farbabstufung oder ein Schattieren. Es ist auch möglich, eine Seriennummer für die Cluster in zunehmender Ordnung der Distanz im Hinblick auf den Ursprung zuzuordnen, und diese Zuordnung für jeden Cluster durch Bezugszeichen anzuzeigen, die innerhalb oder in einer Nähe der kleinen Sphäre zum Darstellen jedes Clusters angezeigt werden.
- Zusätzlich enthält die Detektionsergebnisanzeige in dem in Fig. 41 gezeigten Clusteranzeigemodus auch eine Anzeige der Gesamtzahl der detektierten Dokumente, sowie angezeigte Knöpfe für "Betrachtungsweise", "Entwickeln", "Clustern", "Erzeugen" und "Löschen".
- Wird der angezeigte Knopf "Clustern" ausgewählt, so wird bei dem in Figur. 37 gezeigten Schritt 3714 ein Fenster für eine Clusterdatenanzeige erzeugt, und die Clusterdaten zum Anzeigen einer Zahl geclusterter Dokumente, einer Zahl von detektierten Dokumenten pro Cluster und einer Zahl von Clustern werden bei diesem Fenster bei dem Schritt 3715 angezeigt, zusammen mit dem angezeigten Knopf "Erneute Anzeige", wie in Fig. 41 gezeigt. Hier kann der Anwender die Einstellungen dieser Zahlen frei ändern und die erneute Anzeige durch Auswählen des "Neuanzeige"-Knopfs anweisen, zum Erhalten der Neuanzeige der Detektionsergebnisanzeige in dem Clusteranzeigemodus gemäss den geänderten Einstellungen. Weiterhin lässt sich durch wiederholtes Auswählen des angezeigten Knopfs "Cluster" in diesem Zustand das Fenster für die Clusterdatenanzeige durch den in Fig. 37 gezeigten Schritt 3716 löschen.
- Andererseits wird dann, wenn der angezeigte Knopf "Entwickeln" ausgewählt wird, während mindestens ein Cluster durch die Maus oder die andere Eingabeeinrichtung an dem Fenster für die Detektionsergebnisanzeige spezifiziert wird, ein neues Fenster für die Detektionsergebnisanzeige bei dem Schritt 3702 erzeugt, und es erfolgt nur die mehrdimensionale Anzeige der detektierten Dokumente in dem spezifizierten Cluster bei dem Schritt 3703, in einer Form einer vergrößerten Anzeige, bei der der Koordinatenbereich des spezifizierten Clusters als gesamter Anzeigekoordinatenraum festgelegt ist.
- Hierbei ist es in einem Fall, in dem der Anwender den Cluster nicht genau spezifiziert hat, möglich, die Gruppe der Cluster anzuzeigen, die innerhalb einer vorgegebenen Distanz von dem spezifizierten Punkt angeordnet sind, und zwar zusammen in der vergrößerten Anzeige. Alternativ ist es auch möglich, den am nächsten bei dem spezifizierten Punkt in angeordneten Cluster in der vergrößerten Anzeige anzuzeigen. Es ist ferner möglich, die in dem spezifizierten Cluster enthaltenen detektierten Dokumente sequentiell in vorgegebener Folge bei der Browser-Einheit 209 anzuzeigen. Ferner ist es möglich, den repräsentativen Titel des detektierten Dokuments zu ändern, das in einer Nähe der kleinen Sphäre angezeigt wird, die jeden Cluster darstellt, und zwar sequentiell in einer vorgegebenen Folge bei den detektierten Dokumenten in jedem Cluster.
- Weiterhin können unabhängig von der Spezifikation des Clusters durch den Anwender die detektierten Dokumente einer vorgegebenen Zahl von Clustern in einer Folge der Distanz im Hinblick auf den Ursprung bei getrennten Fenstern für die Detektionsergebnisanzeige angezeigt werden, oder es können die detektierten Dokumente einer vorgegebenen Zahl von Clustern infolge einer Zahl von detektierten Dokumenten in jedem Cluster bei den getrennten Fenstern für die Detektionsergebnisanzeige angezeigt werden. In diesem Fall ist es auch möglich, die Zuordnungen zwischen den kleinen Sphären zum Darstellen der Cluster und den Fenstern für die Detektionsergebnisanzeige zum Anzeigen der detektierten Dokumente diese Cluster zu bezeichnen.
- In diesem Fall kann das Fenster für die Detektionsergebnisanzeige die detektierten Dokumente jeder Clusters in Ansprechen auf die Auswahl des angezeigten Knopfs "Entwickeln" anzeigen, und zwar für einen beispielhaften Dokumentenanzeigemodus, der in einem Teil (a) der Fig. 42 gezeigt ist, der ähnlich zu der gesamten Detektionsergebnisanzeige nach Fig. 19 für die erste Ausführungsform mit der Ausnahme ist, dass jede Achse zum Darstellen jeder Betrachtungsweise eine Bezeichnung für einen Bereich dieser Betrachtungsweise für den angezeigten Cluster aufweist. Zusätzlich enthält diese Detektionsergebnisanzeige des in Fig. 42 gezeigten Dokumentanzeigemodus auch die Bezeichnungen der Gesamtzahl der detektierten Dokumente, sowie einer Zahl der detektierten Dokumente in dem angezeigten Cluster, und angezeigte Knöpfe für "Betrachtungsweise", "Neudetektion", "Erzeugen", "Löschen" und "Anordnen".
- Es ist zu erwähnen, dass bei diesem Fenster für die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus nach der Fig. 42, bereitgestellt durch die Detektionsergebnis-Anzeigeeinheit 207, die Perspektive im Hinblick auf den Ursprung entlang der Tiefenrichtung sich durch Überschreiben des Datenpunkts und des Titels des Dokuments ausdrücken lässt, das an einer näheren Seite über dem Datenpunkt und dem Titel des Dokuments angeordnet ist, das an einer weiter entfernten Seite angeordnet ist. Weiterhin können - sofern gewünscht - andere Computergraphiktechniken zum Ausdrücken der dreidimensionalen Perspektive eingesetzt werden, beispielsweise eine Farbabstufung oder ein Schattieren. Es ist auch möglich, eine Seriennummer für die detektierten Dokumente in zunehmender Folge der Distanz im Hinblick auf den Ursprung zuzuordnen, und diese Seriennummer für jedes detektierte Dokument durch anzuzeigende Bezugszeichen in einer Nähe des Datenpunkts zum Darstellen jedes detektierten Dokuments zu bezeichnen.
- In einem Fall, in dem kein Cluster verwendet wird, da eine Gesamtzahl der detektierten Dokumente nicht den vorgegebenen Schwellwert übersteigt, kann die mehrdimensionale Anzeige des Detektionsergebnis bei dem Schritt 3703 ähnlich mit der Ausnahme durchgeführt werden, dass die Zahl der detektierten Dokumente in dem angezeigten Cluster nicht in einem solchen Fall enthalten ist.
- Bei den in Fig. 41 und 42 gezeigten Detektionsergebnisanzeigen ist die Skala jeder Betrachtungsweisenachse als reelle Skala mit konstanten Intervallen vorgegeben, jedoch ist es auch möglich, eine logarithmische Skala zu verwenden, wenn die gewünscht ist. Es ist auch möglich, dass dem Anwender erlaubt wird, dass er die gewünschte Skala auswählt. Bei einem in Fig. 41 gezeigten Beispiel läuft die Skala von 0 bis 100, wohingehend bei dem in Fig. 42 gezeigten Beispiel die Skala von 0 bis 50 läuft, in Zuordnung zu dem Bereich, der durch den Koordinatenraum für den angezeigten Cluster abgedeckt wird. Hierbei ist es auch möglich, den Skalenbereich nach Fig. 42 in Zuordnung zu der Distanz des detektierten Dokuments oder des Clusters festzulegen, der am weitesten von dem Ursprung entlang jeder Achse in dem angezeigten Cluster oder der Clustergruppe entfernt vorliegt.
- Wird einer der angezeigten Knöpfe "Betrachtungsweise", "Erzeugen" oder "Löschen" bei der Detektionsergebnisanzeige in dem in Fig. 41 gezeigten Clusteranzeigemodus ausgewählt, so werden jeweils die Schritte 3708 und 3709, 3702 oder 3710 ähnlich zu der ersten Ausführungsform ausgeführt.
- Ähnlich werden dann, wenn einer der angezeigten Knöpfe "Betrachtungsweise", "Neudetektieren", "Erzeugen" oder "Löschen" bei der Detektionsergebnisanzeige in dem in Fig. 42 gezeigten Dokumentenanzeigemodus ausgewählt wird, jeweils die Schritte 3708 und 3709, 3707, 3702 oder 3710 ähnlich zu der ersten Ausführungsform ausgewählt.
- Weiterhin lässt sich die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus, der in einem Teil (a) der Fig. 42 gezeigt ist, zu derjenigen ändern, der in einem Teil (b) oder in einem Teil (c) nach Fig. 42 gezeigt ist, in Ansprechen auf die Aktivierung der Browser-Einheit 209 oder der von der Browser-Einheit 209 eingegebenen Akzeptier/Zurückweisungsdaten, genauso wie in den Fällen der Teile (b) und (c) nach Fig. 19 bei der ersten Ausführungsform. In diesem Fall werden die Akzeptier/Zurückweisungsdaten für die Dokumente solange gespeichert, bis der Detektionsbetrieb beendet wird, und zu diesem Zeitpunkt werden die Akzeptier/Zurückweisungsdaten für die Dokumente zu der Detektionsdatensatz- Verwaltungseinheit 204 übertragen und für den momentanen Detektionsknoten bei dem in Fig. 37 gezeigten Schritt 3717 gespeichert.
- Wird andererseits der angezeigte Knopf "Anordnen" bei der Detektionsergebnisanzeige in dem in Fig. 42 gezeigten Dokumentenanzeigemodus ausgewählt, so wird die Browser- Einheit 209 für jedes der detektierten Dokumente aktiviert, die bis zu diesem Punkt spezifiziert sind, und die Fenster für die Browser-Einheitsanzeige werden in einer Folge angeordnet, die durch den Anwender bei dem in Fig. 37 gezeigten Schritt 3711 spezifiziert sind.
- In diesem Fall erscheint in Ansprechen auf die Auswahl des angezeigten Knopfs "Anordnen" ein in Fig. 43 beispielhaft gezeigtes Menü, bei dem sich die Art der Anordnung der Fenster für die Browser-Einheitanzeige auswählen lässt. Bei diesem Beispiel nach Fig. 43 kann der Anwender frei wählen, aus einer "Distanz vom Ursprung"-Anordnung in zunehmender Folge der Distanzen der spezifizierten Dokumente relativ zu dem Ursprung, einer "Dokumentnproduktionsdatum"-Anordnung in einer zunehmenden älter werdenden Folge der Daten für die Produktionen der spezifizierten Dokumente, einer "Autorname (alphabetisch)"-Anordnung in einer alphabetischen Reihenfolge der Autoren der spezifizierten Dokumente und einer "Zugriffsdatum und Zeit"-Anordnung in einer zunehmend älter werdenden Folge der letzten Zugriffe zu den spezifizierten Dokumenten für den Zweck der Anzeige.
- In Ansprechen auf die Auswahl durch den Anwender bei dem in Fig. 43 gezeigten Menü lässt sich ein Originalzustand der Fenster für die Browser-Einheitsanzeige, wie in Fig. 44A gezeigt, in den Anordnungszustand verändern, wie er in Fig. 44B gezeigt ist. Bei dieser Anzeige der Fenster für die Browser-Einheitanzeige gemäss den Fig. 44A und 44B ist es auch möglich, die Farbe für das Konzentrationsniveau des Rahmens oder den Hintergrund jedes Fensters gemäss einer bestimmten Folge zu ändern, beispielsweise einer zunehmenden Folge der Distanzen der spezifizierten Dokumente im Hinblick auf den Ursprung, einer zunehmend älter werdenden Folge der Daten für die Produktionen der spezifizierten Dokumente, einer alphabetischen Folge der Autoren der spezifizierten Dokumente oder einer zunehmenden älter werdenden Folge der letzten Zugriffe zu den spezifizierten Dokumenten für den Zweck der Anzeige.
- Für den Zweck dieser Anordnung der Fenster für die Browser- Einheitanzeige registriert der Dateninhalt des in der Dokumentdaten-Speichereinheit 206 gespeicherten Dokuments bei dieser sechsten Ausführungsform ferner einen Zeiger zu Zeitdaten mit dem Produktionsdatum und der Zugriffsdaten- und Zeitinformation, wie in Fig. 45 gezeigt, zusätzlich zu dem in Fig. 22 für die erste Ausführungsform gezeigten Format.
- Nun wird die siebte Ausführungsform eines Dokumenten- Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser siebten Ausführungsform ist die Detektionsergebnis-Anzeigeeinheit 207 der oben beschriebenen sechsten Ausführungsform so modifiziert, dass sich die Akzeptier/Zurückweisungsdaten für die Dokumente bei der Detektionsergebnisanzeige in dem in Fig. 41 gezeigten Clusteranzeigemodus eingeben lassen, oder bei der Detektionsergebnisanzeige des in Fig. 42 gezeigten Dokumentenanzeigemodus, der durch die Detektionsergebnis- Anzeigeeinheit 207 bereitgestellt wird, und zwar in folgender Weise.
- Insbesondere ist bei dieser siebten Ausführungsform die Detektionsergebnisanzeige in dem Clusteranzeigemodus in einer Form vorgegeben, wie sie in Fig. 46 gezeigt ist, und sie enthält einen angezeigten Knopf "Dokument" anstelle in Fig. 41 gezeigten angezeigten Knopfs "Entwickeln".
- Wird dieser angezeigte Knopf "Dokument" durch den Anwender nach dem Spezifizieren mindestens eines Clusters ausgewählt, so erscheint - wie in Fig. 46 gezeigt - ein Menü mit den Punkten "Entwickeln", "OK" und "NG". Wird der Punkt "Entwickeln" bei diesem Menü ausgewählt, so wird der Betrieb zum Anzeigen des Detektionsergebnis in dem Dokumentenanzeigemodus durch den in Fig. 37 gezeigten Schritt 3703 ausgeführt, wie in einem Fall zum Auswählen des angezeigten Knopfs "Entwickeln" bei der sechsten Ausführungsform.
- Andererseits werden dann, wenn der Punkt "OK" in diesem Menü gewählt wird, die Akzeptier/Zurückweisungsdaten für sämtliche detektierte Dokumente in dem spezifizierten Cluster zu 1 für das Anzeigen der Annahme spezifiziert, wohingehend dann, wenn der Punkt "NG" in diesem Menü gewählt wird, die Akzeptier/Zurückweisungsdaten für sämtliche detektierte Dokumente in dem spezifizierten Cluster zu 0 zum Anzeigen der Zurückweisung spezifiziert werden.
- Bei dem Fenster für die Detektionsergebnisanzeige in dem in Fig. 46 gezeigten Clusteranzeigemodus sind die kleinen Sphären zum Darstellen derjenigen Cluster, für die der Punkt "Entwickeln" oder "OK" ausgewählt ist, durch schwarze Sphären gezeigt, wohingehend die kleinen Sphären zum Darstellen derjenigen Cluster, für die der Punkt "NG" ausgewählt ist, als weiße Sphären gezeigt sind, so dass der Zustand der Akzeptier/Zurückweisungsdaten für jeden Cluster durch die Farbe der kleinen Sphären zum Darstellen der Cluster angezeigt werden kann. Es ist auch möglich, unterschiedliche Konzentrationsniveaus derselben Farbe zum Anzeigen des Zustands der Akzeptier/Zurückweisungsdaten für jeden Cluster zu verwenden. Die bei diesem Fenster für die Detektionsergebnisanzeige in dem Clusteranzeigemodus eingegebenen Akzeptier/Zurückweisungsdaten werden nachfolgend zu der Datensatzverwaltungseinheit 204 durch den in Fig. 37 gezeigten Schritt 3717 übertragen.
- Ähnlich ist bei dieser siebten Ausführungsform die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus in einer in Fig. 47 gezeigten Form vorgegeben, die einen angezeigten Knopf "Auswählen" zusätzlich zu den in Fig. 42 enthaltenen angezeigten Knöpfen enthält.
- Wird dieser angezeigte Knopf "Auswählen" durch den Anwender nach dem Spezifizieren mindestens eines Dokuments ausgewählt, so erscheint ein Menü mit Punkten "Entwickeln", "OK" und "NG", wie in Fig. 47 gezeigt. Wird der Punkt "Entwickeln" bei diesem Menü ausgewählt, so wird der Betrieb zum Anzeigen des Dateninhalts des spezifizierten Dokuments bei dem Fenster für die Browser-Einheitanzeige durch den in Fig. 37 gezeigten Schritt 3706 ausgeführt, wie in einem Fall zum Spezifizieren des Dokuments bei dem Fenster für die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus der sechsten Ausführungsform.
- Andererseits werden dann, wenn der Punkt "OK" in diesem Menü ausgewählt wird, die Akzeptier/Zurückweisungsdaten für die spezifizierten detektierten Dokumente zu 1 zum Anzeigen der Akzeptanz festgelegt, wohingehend dann, wenn der Punkt "NG" in diesem Menü ausgewählt ist, die Akzeptier/Zurückweisungsdaten für das spezifizierte detektierte Dokument zu 0 zum Anzeigen der Zurückweisung festgelegt wird.
- Bei dem in Fig. 47 gezeigten Fenster für die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus sind die Datenpunkte und Titel zum Darstellen derjenigen detektierten Dokumente, für die der Punkt "Entwickeln" oder "OK" ausgewählt ist, in Schwarz gezeigt, wohingehend die Datenpunkte und Titel zum Darstellen derjenigen detektierten Dokumente, für die der Punkt "NG" ausgewählt ist, in Weiß gezeigt sind, so dass der Zustand der Akzeptier/Zurückweisungsdaten für jedes detektierte Dokument durch die Farbe der Datenpunkte und Titel zum Darstellen der detektierten Dokumente angezeigt ist. Es ist auch möglich, unterschiedliche Konzentrationsniveaus derselben Farbe zum Anzeigen des Zustands der Akzeptier/Zurückweisungsdaten für jedes detektierte Dokument zu verwenden. Die bei diesem Fenster für die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus eingegebenen Akzeptier/Zurückweisungsdaten werden nachfolgend im Rahmen des in Fig. 37 gezeigten Schritts 3717 zu der Datensatzverwaltungseinheit 204 übertragen.
- Die verbleibenden Merkmale dieser siebten Ausführungsform sind im wesentlichen identisch zu denjenigen der sechsten oben beschriebenen Ausführungsform.
- Es ist zu erwähnen, dass die in Fig. 46 und 47 gezeigten Detektionsergebnisanzeigen in einer ein- oder zweidimensionalen Anzeige anstelle der dreidimensionalen Anzeige - wie gezeigt - vorgegeben sein können. Es ist auch möglich, die Art zum Spezifizieren der Cluster und der detektierten Dokumente so zu modifizieren, dass der Anwender den Bereich an der Anzeige spezifizieren kann, damit sämtliche Cluster oder detektierten Dokumente spezifiziert sind, die in dem spezifizierten Bereich gemeinsam enthalten sind.
- Als nächstes wird die achte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser achten Ausführungsform ist die Art zum Darstellen des Detektionsergebnis der oben beschriebenen sechsten Ausführungsform wie folgt modifiziert.
- Insbesondere erfolgt bei dieser achten Ausführungsform anstelle der Darstellung der Detektionsergebnisanzeige im Clusteranzeigemodus in der Form der mehrdimensionalen Anzeige wie bei der sechsten Ausführungsform die Anzeige der Zahl detektierter Dokument für jeden Cluster in der Form eines zweidimensionalen Graphen, wie in Fig. 48 gezeigt, gemäss der Koordinatenposition jedes Clusters, und die Ähnlichkeiten zwischen detektierten Dokumenten jedes Clusters gemäss zahlreichen Betrachtungsweisen wird in der Form einer in Fig. 49 gezeigten Tabelle angezeigt.
- In der Fig. 48 bezeichnen die Ziffern in Kreisen zum Darstellen der Cluster in diesem zweidimensionalen Graphen die Zahl detektierter Dokumente in den jeweiligen Clustern, wohingehend in Fig. 49 die Zahlenwerte, die unterhalb jeder Betrachtungsweiseüberschrift aufgelistet sind, die Ähnlichkeitsniveaus der aufgelisteten detektierten Dokumente für jede Betrachtungsweise-Anzeigen.
- Als nächstes wird die neunte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser neunten Ausführungsform ist die oben beschriebene erste Ausführungsform zum Darstellen der in der Dokumentendaten-Speichereinheit 206 gespeicherten Dokumente gemäss den Betrachtungsweisen modifiziert, durch Prüfen sämtlicher Indizes in der Dokumentendaten- Speichereinheit unabhängig von dem Detektionsbetrieb auf der Grundlage ausgewählter Betrachtungsweisen, die von den Eingabesätzen extrahiert werden.
- Insbesondere wird bei dieser neunten Ausführungsform dann, wenn mehrere Dokumentendatenklassen wie mehrere Datenbasen in der Dokumentendaten-Speichereinheit 206 enthalten sind, eine Zahl der in jeder dieser Dokumentendatenklassen gespeicherten Dokumente für jede der bei der Dokumentendaten-Speichereinheit 206 verwendeten Betrachtungsweisen in der Form einer in Fig. 50 gezeigten Tabelle dargestellt, bei der die Gesamtzahl der Dokumente sowie eine Zahl der Dokumente für jede Betrachtungsweise einschließlich derjenigen der bereits angezeigten detektierten Dokumente für jede Dokumentendatenklasse - durch ihre Namen identifiziert - aufgelistet ist.
- Weiterhin ist es immer dann, wenn das in der Dokumentendaten-Speichereinheit 206 gespeicherte Dokument aktualisiert wird, möglich, die Änderung der Verteilung der gespeicherten Dokumente durch Aktualisieren der Zahlen anzuzeigen, die in dieser in Fig. 50 gezeigten Tabelle auf gelistet sind.
- Als nächstes wird die zehnte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser zehnten Ausführungsform wird der Detektionsbetrieb und die mehrdimensionale Anzeige des Detektionsergebnis auf der Grundlage der ausgewählten Betrachtungsweise, die von den Eingabesätzen extrahiert werden, gemäss der oben beschriebenen ersten Ausführungsform so modifiziert, dass sich der Detektionsbetrieb und die mehrdimensionale Anzeige des Detektionsergebnis gemäss der numerischen Werte ausführen lassen, beispielsweise Datum, Preis und Verarbeitungsgeschwindigkeit, die von den Eingabesätzen gemäss den vorgegebenen Extrahierregeln für einen Ausdruck eines numerischen Werts extrahiert werden.
- Insbesondere ist bei dieser zehnten Ausführungsform jede Extrahierregel für einen Ausdruck eines numerischen Werts in einem Format wie folgt vorgegeben:
- (Abgleichabschnitt) → Typ eines Ausdrucks für einen numerischen Wert,
- wie bei den typischen Beispielen, die in einer Tabelle in Fig. 51 gezeigt sind, und bei diesen stellen die Variablen X, Y, Z die zu extrahierenden numerischen Werte dar.
- In diesem Fall lässt sich die Detektionsergebnisanzeige in einer Form eines in Fig. 52 gezeigten zweidimensionale Graphen für einen beispielhaften Fall unter Verwendung der numerischen Werte des Preises und des Verkaufsdatums eines bestimmten Produkts wie einem IC-Speicher als Beispiel vorgeben. Bei dieser Fig. 52 stellen die Kreise die Dokumente dar, beispielsweise die Zeitungsartikel im Hinblick auf den Preis und das Verkaufsdatum jedes Produkts.
- Als nächstes wird die elfte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser elften Ausführungsform ist die oben beschriebene sechste Ausführungsform so modifiziert, dass der Anwender den Bereich für jede Achse spezifizieren kann, anstelle der Spezifikation einer kleinen Sphäre oder eines Datenpunkts oder eines Titel zum Darstellen des Clusters oder des Dokuments in der Detektionsergebnisanzeige, so dass sich die vergrößerte Anzeige des spezifizierten Bereichs erhalten lässt.
- Insbesondere kann bei der in Fig. 53A gezeigten Originaldetektonsergebnisanzeige, die in diesem Beispiel in einer zweidimensionalen Anzeige vorgegeben ist, der Anwender die Bereiche entlang der zwei Achsen spezifizieren, wie sie durch die gestrichelten Linien angezeigt sind, und in Ansprechen hierauf lässt sich die vergrößere Anzeige der Daten in diesen spezifizierten Bereichen erhalten, wie in Fig. 53B gezeigt.
- Hierbei wird entweder die ursprüngliche Detektionsergebnisanzeige nach Fig. 53A durch die vergrößerte Anzeige nach Fig. 53B ersetzt oder sowohl die ursprüngliche Detektionsergebnisanzeige nach Fig. 53A als auch die vergrößerte Anzeige nach Fig. 53B können nebeneinander zusammen dargestellt sein.
- Als nächstes wird die zwölfte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser zwölften Ausführungsform sind die bei der oben beschriebenen ersten Ausführungsform verwendeten Betrachtungsweise-Extrahierregeln zum Mitaufnehmen unterschiedlicher Gewichtungsfaktoren für unterschiedliche Betrachtungsweisen modifiziert.
- Insbesondere ist bei dieser zwölften Ausführungsform jede Betrachtungsweise-Extrahierregel in einem folgenden Format vorgegeben:
- (Abgleichabschnitt) → Betrachtungsweise, Gewicht;
- wie bei dem in einer in Fig. 54 gezeigten Tabelle dargestellten typischen Beispielen.
- In diesem Fall sind die Matrixdarstellungen Q und Di für den Detektionsbefehl und das Dokument durch die folgenden Gleichungen (12) bis (15) vorgegeben.
- Gleichungen (12) bis (15) (where = mit)
- mit
- mit
- Hierbei dienen die j-ten Elemente Xj und Yj in der j-ten Reihe von Q und Di in den jeweiligen Gleichungen (12) und (14) für die j-te Betrachtungsweise, und die ij-ten Elemente qij und dij bei der i-ten Reihe und j-ten Spalte von Xj und Yj in den jeweiligen Gleichungen (13) und (15) dienen jeweils dem i-ten Schlüsselwort und dem j-ten Gewicht des Detektionsbefehls und des Dokuments.
- Anschließend ist die Formel zum Berechnen der Distanz Dist(Q, Di) zwischen dem Detektionsbefehl und dem Dokument durch die folgenden Gleichungen (16) bis (18) definiert.
- und
- zj = Func(Dist'(Xj, Yj)) (17)
- mit
- Dist'(Xj, Yj) = Xj - Yj /M (18)
- Bei der obigen Gleichung (18) stelle ein Symbol A für eine beliebige Matrix die Bedeutung dar, die durch die folgende Gleichung (19) definiert ist.
- Hierbei gilt für jedes Element aij der Matrix A dann, wenn aij < 0, die Beziehung bij = -aij, und andernfalls gilt bij = aij.
- Weiterhin ist bei der obigen Gleichung (17) die Funktion Func(C) für ein beliebiges argument C definiert durch die folgende Gleichung.
- Func(C) = ( ck · wk)/ wk (20)
- Hierbei ist wk ein Gewicht für ck, und ck ist das k-te Element des Arguments C, das sich durch die folgende Gleichung (21) ausdrücken lässt.
- Zusätzlich kann bei dieser zwölften Ausführungsform der Anwender frei die gewünschte Betrachtungsweise- Extrahierregel registrieren und die Einstellung des Gewichtsfaktors für jede Betrachtungsweise ändern.
- Insbesondere kann das Registrieren der Betrachtungsweise- Extrahierregel und das Ändern des Gewichtsfaktors für jede Betrachtungsweise so ausgeführt werden, wie in Fig. 55A bis 55D gezeigt.
- Die Fig. 55A zeigt eine Anzeige für die Eingabe der Zeichenkette für das Registrieren der Betrachtungsweise- Extrahierregel, und sie enthält die angezeigten Knöpfe "Registrieren", "Betrachtungsweise" und "Bestätigen".
- Die Zeichenkette, die bei der in Fig. 55A gezeigten Anzeige eingegeben wird, wird anschließend bei der Eingabeanalyseeinheit 202 analysiert, zum Erhalten des Analyseergebnisses als Abgleichabschnitt der Betrachtungsweise-Extrahierregel, die so dargestellt ist, wie in Fig. 55B gezeigt. Hierbei wird das Gewicht auf eine Anfangseinstellung von 1 festgelegt.
- Als nächstes erscheint dann, wenn der Anwender den angezeigten Knopf "Betrachtungsweise" auswählt, ein Menü zum Auflisten aller verfügbarer Betrachtungsweisen, wie in Fig. 55C gezeigt, von denen der Anwender irgendeine gewünschte Betrachtungsweise für das Registrieren in Zuordnung zu dem angezeigten Abgleichabschnitt auswählen kann.
- Die Fig. 55D zeigt einen Zustand, bei dem der Anwender die Betrachtungsweise "Aufgabe" in dem in Fig. 55C gezeigten Menü ausgewählt hat, und dann die Gewichtung zu 2 geändert ist, während "Verbessern" von dem Abgleichmuster gelöscht ist. Bei diesem Punkt wird dann, wenn der Anwender den angezeigten Knopf "Bestätigen" auswählt, die in Fig. 55D gezeigte Betrachtungsweise-Extrahierregel in dem Betrachtungsweise-Extrahierregel-Verzeichnis der Eingabeanalyseeinheit 202 zum Abschließen der Registrierung gespeichert.
- Als nächstes wird die dreizehnte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser dreizehnten Ausführungsform ist die oben beschriebene erste Ausführungsform so modifiziert, dass der bei dem Fenster für die Detektionsdatensatzanzeige angezeigte Detektionsdatensatz editiert werden kann, und die Detektionsbefehle und die Detektionsergebnisse für mehrere spezifizierte Detektionsdatensätze lassen sich zum Vereinfachen des Vergleichs darstellen.
- Insbesondere lässt sich bei dieser dreizehnten Ausführungsform der in Fig. 56A gezeigte ursprüngliche Detektionsdatensatz in den in Fig. 56B gezeigten modifizierten Detektionsdatensatz modifizieren, gemäss der Eingabe des Anwenders zum Entfernen eines nicht erforderlichen Detektionsknoten, als Beispiel.
- Zusätzlich ist bei der dreizehnten Ausführungsform ein angezeigter Knopf "Vergleiche" bei dem Fenster für die Detektionsdatensatzanzeige vorgesehen, wie in Fig. 57 gezeigt, und wird dieser angezeigte Knopf "Vergleich" durch den Anwender nach dem Spezifizieren zweier Detektionsknoten - angezeigt durch rechtwinklige und runde Umrandungen um die Punkte zum Darstellen der Detektionsknoten - ausgewählt, so erfolgt, wie in Fig. 57 gezeigt, eine Darstellung der Vergleichsdaten zum Anzeigen der Zahl der detektierten Dokumente, der Zahl der OK-Dokumente und der Zahl der NG-Dokumente für jeden dieser Detektionsknoten, sowie die Zahl der detektierten Dokumente, die Zahl der OK- Dokumente und die Zahl der NG-Dokumente, die für beide der Detektionsknoten gemeinsam sind, so dass der Vergleich dieser beiden Detektionsknoten durch den Anwender vereinfacht ist.
- Als nächstes wird die vierzehnte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser vierzehnten Ausführungsform ist die Browser- Einheit 209 der oben beschriebenen ersten Ausführungsform so modifiziert, dass Dokumenten-Verbindungsdaten zum Anzeigen der Beziehungen zwischen irgendwelchen zwei Dokumenten sich bei dem Fenster für die Browser- Einheitanzeige festlegen lassen, und die festgelegten Dokumenten-Verbindungsdaten können bei der Browser-Einheit 209 angezeigt werden.
- Insbesondere lassen sich bei dieser vierzehnten Ausführungsform die Dokumenten-Verbindungsdaten in einem Format ausdrücken, das wie folgt lautet:
- < Dokument ID (1)> ; < Verbindungsname> ;
- < Dokument ID (2)> ,
- und der Verbindungsname ist als Zeichenkette wie "Referenz" und "Original" vorgegeben.
- In diesem Fall ist das Fenster für die Browser- Einheitanzeige so vorgegeben, wie es in beispielhafter Form in Fig. 58 gezeigt ist, gemäss der ein angezeigter Knopf "Verbindung" vorgesehen ist. Wählt der Anwender diesen angezeigten Knopf "Verbindung" nach dem Spezifizieren eines Fensters für die Browser-Einheitanzeige, die anders ist als dieses eine, so wird ein Menü zum Auflisten sämtlicher verfügbarer Verbindungsnamen dargestellt, wie in Fig. 58 gezeigt, und der Anwender kann hiervon irgendeinen gewünschten Verbindungsnamen auswählen, der sich für die beabsichtigte Beziehung eignet, die zwischen dem an diesem Fenster angezeigten Dokument und dem an dem spezifizierten Fenster angezeigten Dokument einzurichten ist. Anschließend legt die Browser-Einheit 209 die Dokumentenverbindungsdaten in dem oben beschriebenen Format fest, ausgehend von dem Detektionsknoten-ID-Wert des in dem spezifizierten Fenster angezeigten Dokuments, von dem aus dem Menü ausgewählten Verbindungsnamen und dem Detektionsknoten-ID-Wert des in diesem Fenster angezeigten Dokuments.
- Hierbei können die durch die Browser-Einheit 209 festgelegten Dokumenteverbindungsdaten bei diesen Fenstern für die Browser-Einheitsanzeige angezeigt werden, wie in Fig. 59 gezeigt, und zwar durch Verbinden der Fenster zum Anzeigen der verbundenen Dokumente durch einen Zeigerpfeil.
- Zusätzlich ist es bei der vierzehnten Ausführungsform auch möglich, einen individuellen Datenwert für jedes Dokument in einem in Fig. 60 gezeigten Datenformat bereitzustellen, gemäss dem Zeiger zu den Detektionsknoten-ID-Werten der OK- Dokumente, zu den Detektionsknoten-ID-Werten der NG- Dokumente zu der Dokumenteverbindungsdatenliste und der Detektionsknoten-ID-Liste und so weiter kollektiv registriert sind. Hier ist es möglich, die Zeiger bei einem Teil oder einer Gesamtheit der Detektionsdatensätze oder der Detektionsergebnisse dieser einzelnen Daten aufzunehmen. Zusätzlich ist es, wie in der Detektionsknoten-ID-Liste, auf die der Zeiger zu der Detektionsknoten-ID-Liste zeigt, wie in Fig. 60 gezeigt, für den Anwender auch möglich, einen Vermerk zu irgendeinem gewünschten Teil der einzelnen Daten im Zeitpunkt des Speicherns dieser einzelnen Daten zu ergänzen.
- Als nächstes wird die fünfzehnte Ausführungsform eines Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser fünfzehnten Ausführungsform ist die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus durch die Detektionsergebnis-Anzeigeeinheit 207 gemäss der oben beschriebenen sechsten Ausführungsform so modifiziert, dass das Positionieren der Achsen und das Zuordnen der Betrachtungsweise zu jeder Achse bei der mehrdimensionalen Anzeige durch den Anwender spezifiziert werden kann.
- Insbesondere ist bei dieser fünfzehnten Ausführungsform das Fenster für die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus so vorgegeben, wie in Fig. 61 gezeigt, und es enthält einen angezeigten Knopf "Positionieren" anstelle des in Fig. 42 für die sechste Ausführungsform gezeigten Anzeigeknopfs "Anordnen".
- Wählt der Anwender diesen angezeigten Knopf "Positionieren", so wird - wie in Fig. 61 gezeigt - ein Menü unter Auflistung möglicher Positioniermuster dargestellt, von dem der Anwender irgendeinen gewünschten Positioniermusterpunkt zum Ändern der Position der Achsen bei der Detektionsergebnisanzeige wählen kann, und der in dem Menü verwendete Punkt "A", "B", "C" stellt die zugeordneten Betrachtungsweisen dar, wie sie bei der Detektionsergebnisanzeige angezeigt sind. Dieses Menü enthält auch Punkte für die eindimensionale Anzeige und die zweidimensionale Anzeige, und in Ansprechen hierauf kann die Dimensionalität der Detektionsergebnisanzeige entsprechend geändert werden.
- Zusätzlich sind bei dem Fenster für die Detektionsergebnisanzeige in dem Dokumentenanzeigemodus dieser fünfzehnen Ausführungsform die Kennzeichen zum Anzeigen der Betrachtungsweisen, die den Achsen der Detektionsergebnisanzeige zugeordnet sind, auch so ausgebildet, dass sie angezeigte Knöpfe sind, die sich durch den Anwender auswählen lassen. Beispielsweise wird dann, wenn der Anwender den angezeigten Knopf "Zusammenfassung" bzw. "Schlussfolgerung" auswählt, das - wie in Fig. 62 gezeigt - einer Achse zugeordnet ist, ein Menü unter Auflistung der anderen verfügbaren Betrachtungsweisen - wie in Fig. 62 gezeigt - dargestellt, von dem der Anwender irgendeine gewünschte Betrachtungsweise für das Zuordnen zu dieser Achse anstelle der momentanen Zuordnung von "Schlussfolgerung" wählen kann.
- Ferner kann bei dieser fünfzehnten Ausführungsform die adaptive Lernfunktion vorgesehen sein, für den Zweck zum Lernen der Betrachtungsweise-Zuordnungen und der Achsenpositionierung, die für jeden Anwender ausgewählt ist, so dass dieselben Betrachtungsweise-Zuordnungen und Achsenpositionen - wie sie für jeden Anwender bevorzugt sind, im Zeitpunkt des nachfolgenden Detektionsbetriebs für denselben Anwender automatisch wieder aufgenommen werden.
- Als nächstes wird die sechzehnte Ausführungsform des Dokumenten-Detektionssystems gemäss der vorliegenden Erfindung detailliert beschrieben.
- Bei dieser sechzehnten Ausführungsform ist die oben beschriebene sechste Ausführungsform so modifiziert, dass die Anzeige der Fenster für die Browser-Einheitanzeige, die während der vorangehenden Detektionsbetriebsabläufe erzeugt werden, während dem nachfolgenden Detektionsbetrie fortgeführt werden können, wohingehend die Fenster, die zu unterschiedlichen Detektionsbetriebsabläufen gehören, durch Ändern der Fensteranzeigeweisen unterschieden werden.
- Insbesondere werden bei dieser sechzehnten Ausführungsform die Fenster für die Browser-Einheitsanzeige, die während der vorangehenden Detektionsbetriebsschritte erzeugt werden, und die Fenster für die Browser-Einheitsanzeige, die während dem nachfolgenden Detektionsbetrieb erzeugt werden, durch Ändern der Farben oder der Konzentrationsniveaus für den Rahmen oder den Hintergrund jedes Fensters unterschieden, gemäss der Folge der Detektionsbetriebsabläufe als Beispiel.
- Die Fig. 76 zeigt einen beispielhaften Zustand der Anzeige der Fenster für die Browser-Einheitsanzeige, bei dem die Fenster mit den geschwärzten Seiten und Unterrädern zu dem vorangehenden Detektionsbetrieb gehören, im Gegensatz zu den anderen Fenstern, die zu dem momentanen Detektionsbetrieb gehören.
- Es ist hier zu erwähnen, dass neben den bereits oben erwähnten viele Modifikationen und Variationen der obigen Ausführungsformen durchgeführt werden können, ohne von den neuen und vorteilhaften Merkmalen der vorliegenden Erfindung abzuweichen. Demnach wird beabsichtigt, dass sämtliche derartige Modifikationen und Variationen in dem Schutzbereich der angefügten Patentansprüche enthalten sind.
Claims (18)
1. Dokumentdetektionssystem, enthaltend:
eine Dokumentspeichervorrichtung (206) zum Speichern
mehrerer Dokumente;
eine Eingabevorrichtung (201) zum Eingeben einer
Anwendereingabe in natürlicher Sprache zum Anweisen
einer Dokumentdetektion für die in der
Dokumentspeichervorrichtung (206) gespeicherten
Dokumente;
eine Eingabeanalysevorrichtung (202) zum Analysieren
der Anwendereingabe, die durch die Eingabevorrichtung
(201) eingegeben wird, zum Extrahieren von
Schlüsselwörtern und Ansichtspunkten, die für jedes in
der Anwendereingabe enthaltene Schlüsselwort relevant
sind, und zum Konstruieren eines Detektionsbefehls
anhand der von der Anwendereingabe extrahierten
Schlüsselwörter und Ansichtspunkte;
eine Detektionsvorrichtung (213) zum Detektieren
derjenigen in der Dokumentspeichervorrichtung (206)
gespeicherten Dokumente, die einen Abgleich zu dem
durch die Eingabeanalysevorrichtung konstruierten
Detektionsbefehl aufweisen, als detektierte Dokumente
eines Detektionsergebnis;
eine Distanzberechnungsvorrichtung (804) zum Berechnen
von Distanzen zum Darstellen von Ähnlichkeiten der
detektierten Dokumente, die durch die
Detektionsvorrichtung (203) detektiert werden, im
Hinblick auf den Detektionsbefehl für jeden
Ansichtspunkt; und
eine Detektionsergebnis-Anzeigevorrichtung (207) zum
Darstellen einer Detektionsergebnisanzeige zum
Wiedergeben des durch die Detektionsvorrichtung (203)
erhaltenen Detektionsergebnis in einer mehrfach
dimensionalen Anzeige, die durch Festlegen der
Ansichtspunkte zu Achsen gebildet wird, mit dem
Detektionsbefehl als Ursprung unter Verwendung der
Distanzen der detektierten Dokumente für jeden
Ansichtspunkt, die durch die
Distanzberechnungsvorrichtung (804) berechnet sind,
als Koordinaten der detektierten Dokumente im Hinblick
auf jede Achse zum Darstellen jedes Ansichtspunkts.
2. System nach Anspruch 1, dadurch gekennzeichnet, dass
die Eingabeanalysevorrichtung (202) die für jedes
Schlüsselwort relevanten Ansichtspunkte extrahiert
gemäss vorgegebener Ansichtspunkt-Extrahierregeln zum
Spezifizieren von Ausdrucksmustern für den Abgleich
mit einem Teil der Anwendereingabe mit jedem
Schlüsselwort, und die Ansichtspunkte gemäss den
Ausdrucksmustern.
3. System nach Anspruch 1, dadurch gekennzeichnet, dass
die Detektionsvorrichtung (203) die detektierten
Dokumente durch Durchsuchen einer Gruppe jedes
Schlüsselworts des für jedes Schlüsselwort relevanten
Ansichtspunkts durch einen Schlüsseslwortindex
detektiert, unter Auflistung all der Schlüsselwörter
des Dokuments, die in der Dokumentspeichervorrichtung
(206) im Zusammenhang mit den Ansichtspunkten
gespeichert sind.
4. System nach Anspruch 1, dadurch gekennzeichnet, dass
es ferner enthält:
eine Datensatz-Managementvorrichtung (204) zum
Handhaben eines Paars des Detektionsbefehls und des
Detektionsergebnis als Detektionsdatensatz; und
eine Detektionsdatensatz-Anzeigevorrichtung (208) zum
Darstellen einer Detektionsdatensatzanzeige zum
Angeben der Beziehungen zwischen mehreren
Detektionsdatensätzen, die durch die Datensatz-
Managementvorrichtung (204) in Form einer Baumstruktur
verwaltet werden, bei der jeder Detektionsdatensatz
durch einen Knoten in der Baumstruktur dargestellt
ist.
5. System nach Anspruch 4, dadurch gekennzeichnet, dass
die Detektionsdatensatz-Anzeigevorrichtung (208) die
Detektionsergebnis-Anzeigevorrichtung (207) anweist,
zum Darstellen der Detektionsergebnisanzeige für den
durch den Knoten dargestellten Detektionsdatensatz,
spezifiziert durch einen Anwender an der
Detektionsdatensatzanzeige.
6. System nach Anspruch 1, dadurch gekennzeichnet, dass
es ferner enthält:
eine Vorrichtung (209) zum Eingeben von
Annahme/Zurückweisungsdaten zum Anzeigen einer
Annahme/einer Zurückweisung jedes detektierten
Dokuments in der Detektionsergebnisanzeige, derart,
dass die Detektionsergebnis-Anzeigevorrichtung (207)
diejenigen Detektionsergebnisse anzeigt, die durch die
Annahme/Zurückweisungsdaten unterscheidbar von
denjenigen Detektionsdokumenten akzeptiert sind, die
durch die Annahme/Zurückweisungsdaten zurückgewiesen
sind.
7. System nach Anspruch 6, dadurch gekennzeichnet, dass
die Detektionsvorrichtung (203) einen neuen
Detektionsbefehl gemäss den
Annahme/Zurückweisungsdaten konstruiert, und diese in
der Dokumentspeichervorrichtung (206) gespeicherten
Dokumente erneut detektiert, die mit diesem neuen,
konstruierten Detektionsbefehl abgestimmt sind.
8. System nach Anspruch 1, dadurch gekennzeichnet, dass
es ferner enthält:
eine Browser-Vorrichtung (209) zum Anzeigen von Daten
zum Wiedergeben jedes detektierten Dokuments, das
durch einen Anwender bei der Detektionsergebnisanzeige
spezifiziert ist, derart, dass die Detektionsergebnis-
Anzeigevorrichtung (207) jedes detektierte Dokument
anzeigt, für das die Browser-Vorrichtung (209) die
Daten unterscheidbar von anderen detektierten
Dokumenten an der Detektionsergebnisanzeige anzeigt.
9. System nach Anspruch 8, dadurch gekennzeichnet, dass
die Browser-Vorrichtung (209) zumindest eine
Zusammenfassung, eine Schlüsselwortliste und eine
Ansichtspunktliste jedes detektierten Dokuments als
Daten zum Anzeigen jedes detektierten Dokuments
anzeigt.
10. System nach Anspruch 8, dadurch gekennzeichnet, dass
die Browser-Vorrichtung (209) ein Fenster zum
getrennten Anzeigen der Daten für jede durch den
Anwender bei der Detektionsergebnisanzeige
spezifizierten detektierten Dokuments erzeugt und
mehrere Fenster zum Anzeigen der Daten für mehrere der
detektierten Dokumente anordnet, die durch den
Anwender gemäss einer gewünschten durch den Anwender
spezifizierten Folge spezifiziert sind.
11. System nach Anspruch 1, dadurch gekennzeichnet, dass
die Detektionsergebnis-Anzeigevorrichtung (207) die
Detektionsergebnisanzeige gemäss einer Eingabe zum
Spezifizieren einer Drehung - eingegeben durch einen
Anwender - an der Detektionsergebnisanzeige rotiert.
12. System nach Anspruch 1, dadurch gekennzeichnet, dass
die Detektionsergebnis-Anzeigevorrichtung (207) die
Detektionsergebnisanzeige gemäss einer Eingabe zum
Spezifizieren eines Bereichs für die mehrdimensionale
Anzeige - eingegeben durch einen Anwender bei der
Detektionsergebnisanzeige - vergrößert/verkleinert.
13. System nach Anspruch 1, dadurch gekennzeichnet, dass
die Detektionsergebnis-Anzeigevorrichtung (207) die
Detektionsergebnisanzeige in einem Clusteranzeigemodus
darstellt, bei dem ein mehrdimensionaler Raum der
mehrdimensionalen Anzeige in eine Zahl von Teilräumen
unterteilt ist und die detektierten Dokumente, die
innerhalb jedes Teilraums angeordnet sind, gemeinsam
als Cluster dargestellt sind.
14. System nach Anspruch 13, dadurch gekennzeichnet, dass
die Detektionsergebnis-Anzeigevorrichtung (207) auch
die Detektionsergebnisanzeige in einem
Dokumentanzeigemodus darstellt, der die
mehrdimensionale Anzeige für lediglich einen Cluster -
spezifiziert durch einen Anwender bei der
Detektionsergebnisanzeige in dem Clusteranzeigemodus -
enthält.
15. System nach Anspruch 13, dadurch gekennzeichnet, dass
die Detektionsergebnis-Anzeigevorrichtung (207) die
Detektionsergebnisanzeige in dem Clusteranzeigemodus
ändert, gemäss einer Zahl der detektierten Dokumente,
die in jedem Cluster enthalten sind.
16. System nach Anspruch 13, dadurch gekennzeichnet, dass
die Detektionsergebnis-Anzeigevorrichtung (207) auch
eine Eingabe von Annahme/Zurückweisungsdaten bewirkt,
zum Anzeigen einer Annahme/Zurückweisung sämtlicher
detektierter Dokumente in jedem Cluster in der
Detektionsergebnisanzeige in dem Clusteranzeigemodus
in kollektiver Weise.
17. Verfahren für eine Dokumentdetektion, enthaltend die
Schritte:
Analysieren einer Anwendereingabe in natürlicher
Sprache zum Anweisen einer Dokumentdetektion zum
Extrahieren von Schlüsselwörtern und Ansichtspunkten,
die für jedes Schlüsselwort relevant sind und in der
Anwendereingabe enthalten sind (401, 402, 501, 503);
Konstruieren eines Detektionsbefehls anhand der
Schlüsselwörter und der Ansichtspunkte, extrahiert
ausgehend von der Anwendereingabe - bei dem
Analyseschritt (403);
Detektieren derjenigen Dokumente aus den mehreren
gespeicherten Dokumenten, die einen Abgleich zu dem
Detektionsbefehl aufweisen, der in dem
Konstruktionsschritt konstruiert wird, als detektierte
Dokumente eines Detektionsergebnis;
Berechnen der Distanzen zum Darstellen von
Ähnlichkeiten der detektierten Dokumente, die bei dem
Ausführungsschritt im Hinblick auf den
Detektionsbefehl erhalten werden, für jeden
Ansichtspunkt (507, 1203); und
Darstellen einer Detektionsergebnisanzeige zum Angeben
des Detektionsergebnis, das bei dem Ausführungsschritt
(1605) erhalten wird, in einer mehrdimensionalen
Anzeige, die durch Festlegen der Ansichtspunkte zu
Achsen gebildet werden, mit dem Detektionsbefehl als
Ursprung und unter Verwendung der Distanzen der
detektierten Befehle für jeden Ansichtspunkt,
berechnet bei dem Berechnungsschritt, als Koordinaten
der detektierten Dokumente im Hinblick auf jede Achse
zum Darstellen jedes Ansichtspunkts.
18. Verfahren nach Anspruch 17, dadurch gekennzeichnet,
dass der Darstellungsschritt das Darstellen der
Detektionsergebnisanzeige in einem Clusteranzeigemodus
bewirkt, bei dem ein mehrdimensionaler Raum der
mehrdimensionalen Anzeige in eine Zahl von Teilräumen
unterteilt wird und die in jedem Teilraum angeordneten
detektierten Dokumente gemeinsam als Cluster
dargestellt werden.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7914993 | 1993-03-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69426541D1 DE69426541D1 (de) | 2001-02-15 |
DE69426541T2 true DE69426541T2 (de) | 2001-06-13 |
Family
ID=13681908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69426541T Expired - Fee Related DE69426541T2 (de) | 1993-03-12 | 1994-03-14 | Dokumentdetektionssystem mit Darstellung des Detektionsresultats zur Erleichterung des Verständnis des Benutzers |
Country Status (3)
Country | Link |
---|---|
US (1) | US5649193A (de) |
EP (1) | EP0615201B1 (de) |
DE (1) | DE69426541T2 (de) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69432575T2 (de) * | 1993-01-28 | 2004-03-18 | Kabushiki Kaisha Toshiba, Kawasaki | Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung |
US5544352A (en) * | 1993-06-14 | 1996-08-06 | Libertech, Inc. | Method and apparatus for indexing, searching and displaying data |
US5873107A (en) * | 1996-03-29 | 1999-02-16 | Apple Computer, Inc. | System for automatically retrieving information relevant to text being authored |
JP3916007B2 (ja) * | 1996-08-01 | 2007-05-16 | 高嗣 北川 | 意味情報処理方法及びその装置 |
US6026410A (en) * | 1997-02-10 | 2000-02-15 | Actioneer, Inc. | Information organization and collaboration tool for processing notes and action requests in computer systems |
US7146381B1 (en) | 1997-02-10 | 2006-12-05 | Actioneer, Inc. | Information organization and collaboration tool for processing notes and action requests in computer systems |
EP0859330A1 (de) * | 1997-02-12 | 1998-08-19 | Kokusai Denshin Denwa Co., Ltd | Dokumentwiederauffindungsvorrichtung |
JP2000013423A (ja) * | 1998-06-26 | 2000-01-14 | Sony Corp | 情報処理装置および方法、並びに提供媒体 |
EP0989738A1 (de) * | 1998-09-22 | 2000-03-29 | Hewlett-Packard Company | Dokumentenanalyseverfahren zur Erkennung von Schwarz/Weiss- oder Farbbereichen und Abtastvorrichtung dafür |
US6418429B1 (en) | 1998-10-21 | 2002-07-09 | Apple Computer, Inc. | Portable browsing interface for information retrieval |
US20030069873A1 (en) | 1998-11-18 | 2003-04-10 | Kevin L. Fox | Multiple engine information retrieval and visualization system |
US6326988B1 (en) * | 1999-06-08 | 2001-12-04 | Monkey Media, Inc. | Method, apparatus and article of manufacture for displaying content in a multi-dimensional topic space |
US6598047B1 (en) * | 1999-07-26 | 2003-07-22 | David W. Russell | Method and system for searching text |
US20030004996A1 (en) * | 2001-06-29 | 2003-01-02 | International Business Machines Corporation | Method and system for spatial information retrieval for hyperlinked documents |
US6778995B1 (en) | 2001-08-31 | 2004-08-17 | Attenex Corporation | System and method for efficiently generating cluster groupings in a multi-dimensional concept space |
US6888548B1 (en) * | 2001-08-31 | 2005-05-03 | Attenex Corporation | System and method for generating a visualized data representation preserving independent variable geometric relationships |
US6978274B1 (en) | 2001-08-31 | 2005-12-20 | Attenex Corporation | System and method for dynamically evaluating latent concepts in unstructured documents |
JPWO2003044693A1 (ja) * | 2001-11-19 | 2005-03-24 | 富士通株式会社 | 情報ナビゲーションシステム |
US6965900B2 (en) * | 2001-12-19 | 2005-11-15 | X-Labs Holdings, Llc | Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents |
JP2003216650A (ja) * | 2002-01-28 | 2003-07-31 | Sony Corp | 情報媒介システムのためのグラフィカルユーザインターフェイス |
US7271804B2 (en) * | 2002-02-25 | 2007-09-18 | Attenex Corporation | System and method for arranging concept clusters in thematic relationships in a two-dimensional visual display area |
US7610313B2 (en) * | 2003-07-25 | 2009-10-27 | Attenex Corporation | System and method for performing efficient document scoring and clustering |
US7836010B2 (en) | 2003-07-30 | 2010-11-16 | Northwestern University | Method and system for assessing relevant properties of work contexts for use by information services |
US8869061B1 (en) | 2003-08-29 | 2014-10-21 | Microsoft Corporation | User interface for searching an electronic document |
US7590936B1 (en) * | 2003-09-30 | 2009-09-15 | Microsoft Corporation | Method for extracting information associated with a search term |
US7191175B2 (en) | 2004-02-13 | 2007-03-13 | Attenex Corporation | System and method for arranging concept clusters in thematic neighborhood relationships in a two-dimensional visual display space |
JPWO2005096182A1 (ja) * | 2004-03-31 | 2007-08-16 | 松下電器産業株式会社 | 情報抽出システム |
JP4394517B2 (ja) * | 2004-05-12 | 2010-01-06 | 富士通株式会社 | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 |
US7356777B2 (en) * | 2005-01-26 | 2008-04-08 | Attenex Corporation | System and method for providing a dynamic user interface for a dense three-dimensional scene |
US7404151B2 (en) * | 2005-01-26 | 2008-07-22 | Attenex Corporation | System and method for providing a dynamic user interface for a dense three-dimensional scene |
US8019763B2 (en) * | 2006-02-27 | 2011-09-13 | Microsoft Corporation | Propagating relevance from labeled documents to unlabeled documents |
US8001121B2 (en) * | 2006-02-27 | 2011-08-16 | Microsoft Corporation | Training a ranking function using propagated document relevance |
US9165040B1 (en) | 2006-10-12 | 2015-10-20 | Google Inc. | Producing a ranking for pages using distances in a web-link graph |
US8429422B1 (en) | 2007-03-31 | 2013-04-23 | Actioneer, Inc. | Method and apparatus for an improved access system |
CN101174273B (zh) * | 2007-12-04 | 2010-06-23 | 清华大学 | 基于元数据分析的新闻事件检测方法 |
CN101290624B (zh) * | 2008-06-11 | 2012-02-01 | 华东师范大学 | 一种新闻网页元数据自动抽取方法 |
EP2284726A1 (de) * | 2009-07-27 | 2011-02-16 | HTC Corporation | Verfahren und System zur Navigation von Daten und Computerprogrammprodukt mit diesem Verfahren |
TWI408340B (zh) * | 2009-07-27 | 2013-09-11 | Htc Corp | 導航路徑顯示方法、導航裝置及電腦程式產品 |
US8572084B2 (en) | 2009-07-28 | 2013-10-29 | Fti Consulting, Inc. | System and method for displaying relationships between electronically stored information to provide classification suggestions via nearest neighbor |
US8612446B2 (en) | 2009-08-24 | 2013-12-17 | Fti Consulting, Inc. | System and method for generating a reference set for use during document review |
US10320789B1 (en) | 2014-03-26 | 2019-06-11 | Actioneer, Inc. | Fast and secure way to fetch or post data and display it temporarily to a user |
WO2017210618A1 (en) | 2016-06-02 | 2017-12-07 | Fti Consulting, Inc. | Analyzing clusters of coded documents |
US20180101540A1 (en) * | 2016-10-10 | 2018-04-12 | Facebook, Inc. | Diversifying Media Search Results on Online Social Networks |
CA3067326A1 (en) * | 2017-06-19 | 2018-12-27 | Equifax Inc. | Machine-learning system for servicing queries for digital content |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4736296A (en) * | 1983-12-26 | 1988-04-05 | Hitachi, Ltd. | Method and apparatus of intelligent guidance in natural language |
US5123103A (en) * | 1986-10-17 | 1992-06-16 | Hitachi, Ltd. | Method and system of retrieving program specification and linking the specification by concept to retrieval request for reusing program parts |
FR2613509B1 (fr) * | 1987-04-03 | 1989-06-09 | Thomson Cgr | Procede de calcul et de representation d'images de vues d'un objet |
US4839853A (en) * | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure |
JPH02133803A (ja) * | 1988-11-15 | 1990-05-23 | Sony Corp | 制御データ入力装置 |
US5408655A (en) * | 1989-02-27 | 1995-04-18 | Apple Computer, Inc. | User interface system and method for traversing a database |
JPH02297188A (ja) * | 1989-03-14 | 1990-12-07 | Sharp Corp | 文書作成支援装置 |
US5020019A (en) * | 1989-05-29 | 1991-05-28 | Ricoh Company, Ltd. | Document retrieval system |
US5220625A (en) * | 1989-06-14 | 1993-06-15 | Hitachi, Ltd. | Information search terminal and system |
JP3691844B2 (ja) * | 1990-05-21 | 2005-09-07 | 株式会社東芝 | 文書処理方法 |
US5301109A (en) * | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
JP3009215B2 (ja) * | 1990-11-30 | 2000-02-14 | 株式会社日立製作所 | 自然語処理方法および自然語処理システム |
US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
US5317647A (en) * | 1992-04-07 | 1994-05-31 | Apple Computer, Inc. | Constrained attribute grammars for syntactic pattern recognition |
JPH05324726A (ja) * | 1992-05-25 | 1993-12-07 | Fujitsu Ltd | 文書データ分類装置及び文書分類機能構築装置 |
-
1994
- 1994-03-14 EP EP94103922A patent/EP0615201B1/de not_active Expired - Lifetime
- 1994-03-14 DE DE69426541T patent/DE69426541T2/de not_active Expired - Fee Related
-
1995
- 1995-11-17 US US08/560,512 patent/US5649193A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0615201A3 (de) | 1995-02-08 |
DE69426541D1 (de) | 2001-02-15 |
EP0615201A2 (de) | 1994-09-14 |
US5649193A (en) | 1997-07-15 |
EP0615201B1 (de) | 2001-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69426541T2 (de) | Dokumentdetektionssystem mit Darstellung des Detektionsresultats zur Erleichterung des Verständnis des Benutzers | |
DE69526168T2 (de) | Verfahren und Gerät zur Klassifikation von Dokumentinformationen | |
DE3650417T2 (de) | Informationsaufzeichnungs- und Wiederauffindungssystem. | |
DE68928775T2 (de) | Verfahren und Vorrichtung zur Herstellung einer Zusammenfassung eines Dokumentes | |
US20240095867A1 (en) | Patent mapping | |
DE69432575T2 (de) | Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung | |
DE69028592T2 (de) | Gerät zur automatischen Generierung eines Index | |
DE69923650T2 (de) | System für mehrsprachige Informationswiederauffindung | |
DE69631457T2 (de) | Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung | |
DE69724910T2 (de) | Vorrichtung zum Erkennen von eingegebenen Zeichenketten durch Schlussfolgerung | |
DE60129652T2 (de) | Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung | |
DE69418474T2 (de) | Semantisches objektmodellierungssystem und verfahren um relationelle datenbankschemata herzustellen | |
DE60213409T2 (de) | Erstellung von strukturierten daten aus unformatiertem text | |
DE69834386T2 (de) | Textverarbeitungsverfahren und rückholsystem und verfahren | |
DE60029845T2 (de) | System zum identifizieren der verhältnisse zwischen bestandteilen in aufgaben vom typ informations-wiederauffindung | |
DE69131941T2 (de) | System und verfahren für informationsauffindung | |
DE69032921T2 (de) | Direkte Manipulationsschnittstelle zum Abrufen von logischen Informationen | |
DE112020002600T5 (de) | Entdecken einer semantischen bedeutung von datenfeldern anhand von profildaten der datenfelder | |
DE19952769B4 (de) | Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache | |
DE60304331T2 (de) | Abrufen übereinstimmender dokumente durch abfragen in einer nationalen sprache | |
DE69812162T2 (de) | Vorrichtung zur Verwendung bei der Identifizierung semantischer Mehrdeutigkeiten | |
US7194471B1 (en) | Document classification system and method for classifying a document according to contents of the document | |
DE3901485C2 (de) | Verfahren und Vorrichtung zur Durchführung des Verfahrens zur Wiedergewinnung von Dokumenten | |
DE69129107T2 (de) | Automatisches übersetzungs-und fernübertragungssystem | |
DE602004003361T2 (de) | System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8320 | Willingness to grant licences declared (paragraph 23) | ||
8339 | Ceased/non-payment of the annual fee |