JPH1145256A - Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded - Google Patents
Document retrieval device and computer-readable recording medium where program making computer function as same device is recordedInfo
- Publication number
- JPH1145256A JPH1145256A JP9199617A JP19961797A JPH1145256A JP H1145256 A JPH1145256 A JP H1145256A JP 9199617 A JP9199617 A JP 9199617A JP 19961797 A JP19961797 A JP 19961797A JP H1145256 A JPH1145256 A JP H1145256A
- Authority
- JP
- Japan
- Prior art keywords
- document
- classification item
- search
- unit
- directory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、記憶媒体とは独立
にディレクトリを作成し、作成したディレクトリに該当
する文書を検索技術を用いて収集し、分類・管理するこ
とができるようにした文書管理支援装置およびその装置
としてコンピュータを機能させるためのプログラムを記
録したコンピュータ読み取り可能な記録媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document management system in which a directory is created independently of a storage medium, and documents corresponding to the created directory can be collected, classified, and managed using a search technology. The present invention relates to a support device and a computer-readable recording medium storing a program for causing a computer to function as the support device.
【0002】[0002]
【従来の技術】ハードディスク等の記憶媒体に保存され
た文書は、ディレクトリ(またはフォルダ)と呼ばれる
論理的区分に従って分類されて管理されるのが一般的で
ある。このディレクトリは、文書管理を簡便に行うため
に、ユーザが好みに応じて作成することができるもので
あり、作成したディレクトリに関連のある複数の文書を
まとめるために利用することができる。2. Description of the Related Art Documents stored in a storage medium such as a hard disk are generally classified and managed according to a logical division called a directory (or folder). This directory can be created by the user according to his / her preference in order to easily perform document management, and can be used to collect a plurality of documents related to the created directory.
【0003】具体的には、ユーザは、おおもとのルート
ディレクトリに対して、サブディレクトリと呼ばれるデ
ィレクトリを作成することができ、作成したサブディレ
クトリに名称を付け、その下にワードプロセッサ等で作
成した文書を所属させることができる。作成したサブデ
ィレクトリの下には、さらにサブディレクトリを作成す
ることができるため、様々なレベルのディレクトリを作
成することによって階層構造で文書を管理することがで
きる。また、文書を読み出す際には、ディレクトリを指
定することによってそのディレクトリ内の文書名の一覧
を表示し、一覧表示した文書名のいずれかを選択するこ
とによって所望の文書を読み出すことができる。[0003] Specifically, a user can create a directory called a subdirectory with respect to the original root directory, name the created subdirectory, and create a name thereunder with a word processor or the like. Documents can belong. Sub-directories can be further created under the created sub-directory, so that it is possible to manage documents in a hierarchical structure by creating directories at various levels. When reading a document, a list of document names in the directory is displayed by designating the directory, and a desired document can be read by selecting one of the listed document names.
【0004】上述したディレクトリに関する情報はファ
イルにまとめられて記憶媒体中に保存される。このファ
イルには、ディレクトリに関連づけられて保存された文
書の文書名,記憶媒体中の位置等が記録され、記憶媒体
中の文書は、ディレクトリ名と文書名とによって管理さ
れることになる。[0004] Information on the above-mentioned directory is collected in a file and stored in a storage medium. In this file, the document name of the document stored in association with the directory, the position in the storage medium, and the like are recorded, and the document in the storage medium is managed by the directory name and the document name.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、上記従
来の技術においては、ディレクトリを用いることによっ
て簡単に文書管理を行うことができるが、その反面、デ
ィレクトリを中心にして文書を分類して管理を行うた
め、文書を固定的にしか分類することができないという
問題点があった。換言すれば、ディレクトリを中心にし
て文書を分類して管理を行うため、文書の分類方法を変
更する場合には、新たなディレクトリを作成し、作成し
たディレクトリに文書を移動させる等の煩雑な作業が必
要であって、文書の分類・管理の利便性に欠けるという
問題点があった。However, in the above-mentioned conventional technology, it is possible to easily perform document management by using a directory. On the other hand, on the other hand, the document is classified and managed based on the directory. Therefore, there is a problem that documents can be classified only fixedly. In other words, since the documents are classified and managed based on the directory, when changing the method of classifying the documents, complicated work such as creating a new directory and moving the documents to the created directory is required. However, there is a problem that document classification and management are not convenient.
【0006】また、ディレクトリを中心にして文書の分
類・管理を行うため、作成した文書を保存する場合に
は、文書を所属させるディレクトリを指定する必要があ
るという問題点があった。すなわち、適切なディレクト
リを指定する作業を怠った場合には、文書を後に読み出
す際にどのディレクトリに保存されたかを探し出す作業
が必要であった。[0006] In addition, since documents are classified and managed mainly in directories, there is a problem in that when a created document is stored, it is necessary to specify a directory to which the document belongs. That is, when the operation of designating an appropriate directory is neglected, it is necessary to find the directory in which the document is stored when reading the document later.
【0007】また、ディレクトリは記憶媒体と一対一対
応であり、新たな記憶媒体を用いる場合には、他の記憶
媒体で作成したディレクトリをそのまま用いることはで
きないため、その記憶媒体用のディレクトリを新たに作
成しなければならないという問題点があった。[0007] Further, the directory has a one-to-one correspondence with a storage medium, and when a new storage medium is used, a directory created on another storage medium cannot be used as it is. There was a problem that it had to be created.
【0008】さらに、ディレクトリを中心にして文書を
管理するため、誤った操作でディレクトリが壊れてしま
ったような場合には、そのディレクトリの中の文書を読
み出すことができないという問題点があった。Furthermore, since documents are managed mainly in the directory, there is a problem that if the directory is broken by an erroneous operation, the documents in the directory cannot be read.
【0009】本発明は上記に鑑みてなされたものであっ
て、記憶媒体とは独立にディレクトリを作成し、作成し
たディレクトリに該当する文書を検索技術を用いて収集
し、分類・管理することができるようにすることによ
り、文書の分類方法を変更する場合の処理の簡便性の向
上を図ることを目的とする。[0009] The present invention has been made in view of the above, and it is possible to create a directory independently of a storage medium and collect, classify, and manage documents corresponding to the created directory using a search technique. An object of the present invention is to improve the simplicity of processing when changing the method of classifying documents by making it possible.
【0010】また、本発明は上記に鑑みてなされたもの
であって、記憶媒体とは独立にディレクトリを作成し、
作成したディレクトリに該当する文書を検索技術を用い
て収集し、分類・管理することができるようにすること
により、文書を保存する際に、文書を所属させるディレ
クトリを指定する作業を省略することができるようにし
て、保存操作の簡素化を図ることを目的とする。Further, the present invention has been made in view of the above, and a directory is created independently of a storage medium.
By using search technology to collect, sort, and manage documents that correspond to the created directory, it is not necessary to specify the directory to which the document belongs when saving the document. It is an object of the present invention to simplify the storage operation as much as possible.
【0011】また、本発明は上記に鑑みてなされたもの
であって、記憶媒体とは独立にディレクトリを作成し、
作成したディレクトリに該当する文書を検索技術を用い
て収集し、分類・管理することができるようにすること
により、異なる記憶媒体毎にディレクトリを作成する必
要をなくし、同一の環境で文書の分類・管理を行うこと
ができるようにすることを目的とする。Further, the present invention has been made in view of the above, and a directory is created independently of a storage medium.
By making it possible to collect, classify and manage documents corresponding to the created directory using search technology, it is not necessary to create directories for different storage media, and to classify and store documents in the same environment. The purpose is to be able to perform management.
【0012】さらに、本発明は上記に鑑みてなされたも
のであって、記憶媒体とは独立にディレクトリを作成
し、作成したディレクトリに該当する文書を検索技術を
用いて収集し、分類・管理することができるようにする
ことにより、ディレクトリに関するファイルが破損した
場合に文書の読み出しが不可能となるような事態が起き
ないようにすることを目的とする。Furthermore, the present invention has been made in view of the above, and a directory is created independently of a storage medium, and documents corresponding to the created directory are collected, sorted, and managed by using a search technique. It is an object of the present invention to prevent a situation where reading of a document becomes impossible when a file related to a directory is damaged.
【0013】[0013]
【課題を解決するための手段】上記目的を達成するた
め、請求項1の文書管理支援装置は、管理対象となる文
書を格納した格納手段と、検索条件を入力する検索条件
入力手段と、前記検索条件入力手段で入力された検索条
件を分類項目として設定する分類項目設定手段と、前記
分類項目設定手段で設定した分類項目を画面表示する分
類項目表示手段と、前記分類項目表示手段で表示した分
類項目を選択する選択手段と、前記選択手段で選択した
分類項目に基づいて、前記格納手段から該当する文書を
検索する検索手段と、前記検索手段の検索結果に基づい
て、該当する文書の文書名を表示する文書名表示手段
と、を備えたものである。According to a first aspect of the present invention, there is provided a document management support apparatus, comprising: a storage unit for storing a document to be managed; a search condition input unit for inputting a search condition; Classification item setting means for setting the search condition input by the search condition input means as a classification item, classification item display means for displaying the classification item set by the classification item setting means on a screen, and display by the classification item display means Selecting means for selecting a classification item; searching means for searching a corresponding document from the storage means based on the classification item selected by the selecting means; and a document of the corresponding document based on a search result of the searching means. Document name display means for displaying a name.
【0014】また、請求項2の文書管理支援装置は、請
求項1に記載の文書管理支援装置において、さらに、前
記分類項目表示手段で画面表示されている分類項目の中
からアンド条件の対象となる分類項目を指定する指定手
段を備え、前記指定手段で前記アンド条件の対象となる
分類項目が指定された場合、前記分類項目設定手段が、
前記検索条件入力手段で入力された検索条件を入れ子の
分類項目として前記アンド条件の対象となる分類項目の
下位に配置するものである。According to a second aspect of the present invention, there is provided the document management support apparatus according to the first aspect, further comprising an AND condition target among the classification items displayed on the screen by the classification item display means. A designation item for designating a classification item that is a target item of the AND condition is designated by the designation device;
The search condition input by the search condition input means is arranged as a nested classification item below the classification item targeted by the AND condition.
【0015】また、請求項3の文書管理支援装置は、請
求項1または2に記載の文書管理支援装置において、さ
らに、前記格納手段に格納された文書をベクター表現に
変換して記憶する記憶手段と、前記分類項目設定手段で
分類項目として設定した検索条件をベクター表現に変換
する変換手段と、を備え、前記検索手段が、前記検索条
件のベクター表現と前記文書のベクター表現との類似度
を求め、求めた類似度が所定の閾値を超える文書を選択
し、選択した文書を類似度に応じて配列した文書リスト
を検索結果として出力し、前記文書名表示手段が、前記
検索手段から文書リストを入力し、入力した文書リスト
に基づいて、前記文書名を類似度順に画面表示するもの
である。According to a third aspect of the present invention, there is provided the document management support apparatus according to the first or second aspect, further comprising: converting the document stored in the storage means into a vector expression and storing the vector expression. And a conversion unit that converts the search condition set as a classification item by the classification item setting unit into a vector expression, wherein the search unit determines a similarity between the vector expression of the search condition and the vector expression of the document. A document list in which the calculated similarity exceeds a predetermined threshold value, and outputs a document list in which the selected documents are arranged according to the similarity as a search result. Is input, and the document names are displayed on the screen in order of similarity based on the input document list.
【0016】さらに、請求項4のコンピュータ読み取り
可能な記録媒体は、前記請求項1〜3のいずれか1つに
記載の文書管理支援装置の各手段としてコンピュータを
機能させるためのプログラムを記録したものである。According to a fourth aspect of the present invention, there is provided a computer-readable recording medium in which a program for causing a computer to function as each unit of the document management support apparatus according to any one of the first to third aspects is recorded. It is.
【0017】[0017]
【発明の実施の形態】以下、本発明の文書管理支援装置
およびその装置としてコンピュータを機能させるための
プログラムを記録したコンピュータ読み取り可能な記録
媒体の一実施の形態について、添付の図面を参照しつつ
詳細に説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an embodiment of a document management support apparatus of the present invention and a computer-readable recording medium storing a program for causing a computer to function as the apparatus will be described with reference to the accompanying drawings. This will be described in detail.
【0018】図1は、本実施の形態の文書管理支援装置
のシステム構成図である。図1に示す文書管理支援装置
は、後に詳細に説明する検索技術を用いて文書を管理す
る機能を有する複数のクライアント100と、文書DB
(データベース)101から転置ファイル102を生成
すると共に、ベクトル空間検索を行うことができる検索
エンジン(例えば、CLARITECH社のCLARI
T等)を備え、クライアント100から検索条件を入力
し、入力した検索条件に基づいて、転置ファイル102
を用いて該当する文書を検索する検索サーバ103と、
上記クライアント100や検索サーバ103等を接続す
るネットワーク104と、から構成されている。FIG. 1 is a system configuration diagram of the document management support apparatus according to the present embodiment. The document management support device shown in FIG. 1 includes a plurality of clients 100 each having a function of managing documents using a search technique described in detail below, and a document DB.
(Database) A search engine capable of generating the transposed file 102 from the database 101 and performing a vector space search (for example, CLARITECH's CLARI)
T), the search condition is input from the client 100, and the transposed file 102 is
A search server 103 for searching for a corresponding document by using
And a network 104 for connecting the client 100, the search server 103, and the like.
【0019】図1において、文書DB101は、複数の
文書、例えば、新聞記事等の文書を格納したものであ
る。本実施の形態においては、文書DB101に格納さ
れた文書として新聞記事を例とし、この新聞記事をクラ
イアント100による文書管理の対象とする。ただし、
管理対象の文書を新聞記事や文書DB101中の文書に
限定するものではない。In FIG. 1, a document DB 101 stores a plurality of documents, for example, documents such as newspaper articles. In the present embodiment, a newspaper article is taken as an example of a document stored in the document DB 101, and the newspaper article is a target of document management by the client 100. However,
The document to be managed is not limited to a newspaper article or a document in the document DB 101.
【0020】転置ファイル102は、文書DB101中
の複数の文書(新聞記事)と、これら複数の文書それぞ
れから後述する方法で抽出した複数の索引語との関係を
規定し、ある索引語が各文書それぞれにおいてどの程度
重要な語彙であるかをベクター表現を用いて示したもの
であって、この索引語を用いて該当する文書を検索する
ことができるようにしたものである。The transposed file 102 defines the relationship between a plurality of documents (newspaper articles) in the document DB 101 and a plurality of index terms extracted from each of the plurality of documents by a method described later. In each case, the degree of importance of the vocabulary is indicated using a vector expression, and a corresponding document can be searched using the index term.
【0021】具体的には、1つの文書を予め定め複数の
センテンスからなるサブドキュメント単位に区切り、サ
ブドキュメントから上記索引語となる名詞句を抽出し
て、抽出した名詞句それぞれについて、サブドキュメン
ト中の出現頻度,文書DB101全体における分布等の
統計情報を求め、求めた名詞句毎の統計情報を用いて各
サブドキュメントをベクター表現に変換する。そして、
変換したサブドキュメントのベクター表現に基づいて、
文書のベクター表現を生成する。転置ファイル102
は、このようにしてベクター表現された文書DB101
中の文書を格納するものである。More specifically, one document is divided into sub-documents consisting of a plurality of sentences determined in advance, and the noun phrases serving as the above index words are extracted from the sub-documents. , Statistical information such as the frequency of occurrence of the noun phrase and the distribution in the entire document DB 101 is obtained, and each subdocument is converted into a vector expression using the obtained statistical information for each noun phrase. And
Based on the vector representation of the converted subdocument,
Generate a vector representation of the document. Inversion file 102
Is the document DB 101 thus expressed in vector.
This is for storing the document inside.
【0022】なお、各索引語には、対応する文書中の重
要度に応じた重み付けを行うことができる。また、文書
のベクター表現については、実際の検索を行う際に、サ
ブドキュメントのベクター表現に基づいて生成すること
にしても良い。Each index word can be weighted according to the degree of importance in the corresponding document. Also, the vector expression of the document may be generated based on the vector expression of the sub-document when performing an actual search.
【0023】クライアント100および検索サーバ10
3は、パーソナルコンピュータやワークステーション等
によって構成される。図2は、クライアント100のブ
ロック構成図である。クライアント100は、検索条件
を入力するキーボードおよびマウス等からなる入力装置
200と、入力装置200で入力した検索条件をディレ
クトリとして設定し、設定したディレクトリをディレク
トリ情報としてディレクトリ情報格納部201に格納す
ると共に、設定したディレクトリ情報に基づいて、検索
条件を検索サーバ103に出力し、検索サーバ103に
よる検索処理を利用して、文書DB101中の文書を設
定したディレクトリに分類することによって、文書DB
101中の文書を管理する文書管理部202と、文書管
理部202で設定したディレクトリを画面表示すると共
に、検索サーバ103で検索した文書の文書名を該当す
るディレクトリに表示するCRT等の出力装置203
と、を備えている。なお、図2において、204は、入
力装置200,出力装置203およびネットワーク10
4と文書管理部202とのインターフェイスとなる入出
力部を示している。Client 100 and search server 10
Reference numeral 3 includes a personal computer, a workstation, and the like. FIG. 2 is a block diagram of the client 100. The client 100 sets an input device 200 such as a keyboard and a mouse for inputting search conditions, and sets search conditions input by the input device 200 as directories, stores the set directories as directory information in the directory information storage unit 201, and The search condition is output to the search server 103 based on the set directory information, and the documents in the document DB 101 are classified into the set directories by using the search process performed by the search server 103, thereby obtaining the document DB.
A document management unit 202 that manages documents in the document 101, and an output device 203 such as a CRT that displays the directory set by the document management unit 202 on the screen and displays the document name of the document searched by the search server 103 in the corresponding directory
And In FIG. 2, reference numeral 204 denotes an input device 200, an output device 203, and a network 10
4 shows an input / output unit serving as an interface between the document management unit 202 and the document management unit 202.
【0024】また、図3は、検索サーバ103の処理を
示す概略ブロック図である。検索サーバ103は、文書
DB101中の文書を転置ファイル102に登録する処
理と、ベクトル空間検索を利用した検索処理とを行うも
のである。FIG. 3 is a schematic block diagram showing the processing of the search server 103. The search server 103 performs a process of registering a document in the document DB 101 in the transposed file 102 and a search process using a vector space search.
【0025】検索サーバ103において、転置ファイル
102に登録する処理は、自然言語処理モジュール30
0と、データベース・ビルド・コンポーネント304と
によって行われる。具体的に、自然言語処理モジュール
300は、文書DB101から文書(新聞記事)を入力
し、文書のフォーマットの認識処理や、品詞情報等を格
納した辞書301および各単語の係り受け等を解析する
ための文法辞書302を用いて形態素解析,構文解析,
名詞句抽出等の解析処理を行い、上述したサブドキュメ
ント毎の名詞句リストを含むドキュメント・セット30
3を生成する。データベース・ビルドコンポーネント3
04は、自然言語処理モジュール300で生成したドキ
ュメント・セット303を入力し、入力したドキュメン
ト・セット303中の各サブドキュメントをベクター表
現に変換すると共に、サブドキュメントのベクター表現
に基づいて、文書のベクター表現を生成して転置ファイ
ル102に登録する。In the search server 103, the process of registering in the transposed file 102 is performed by the natural language processing module 30.
0 and the database build component 304. More specifically, the natural language processing module 300 inputs a document (newspaper article) from the document DB 101 and analyzes the document format recognition processing, the dictionary 301 storing part of speech information and the like, and the dependency of each word. Morphological analysis, syntax analysis,
Analysis processing such as noun phrase extraction is performed, and the above-described document set 30 including the noun phrase list for each sub-document is described.
3 is generated. Database Build Component 3
04, the document set 303 generated by the natural language processing module 300 is input, each sub-document in the input document set 303 is converted into a vector expression, and based on the vector expression of the sub-document, a document vector is input. An expression is generated and registered in the transposition file 102.
【0026】一方、検索処理は、自然言語処理モジュー
ル300と、クエリー・ビルド・コンポーネント305
と、検索エンジン307とによって行われる。具体的
に、自然言語処理モジュール300は、クライアント1
00から検索条件206を入力し、品詞情報等を格納し
た辞書301および各単語の係り受け等を解析するため
の文法辞書302を用いて形態素解析,構文解析,名詞
句抽出等の解析処理を行い、検索条件206中の名詞句
のリストを含むドキュメント・セット303を生成す
る。クエリー・ビルド・コンポーネント305は、ドキ
ュメント・セット303を入力し、検索条件206を構
成する各名詞句について、検索条件206中の出現頻
度,文書DB101全体における分布等の統計情報を求
め、求めた統計情報を用いて検索条件206をベクター
表現に変換したクエリー・ドキュメント306を生成す
る。検索エンジン307は、クエリー・ビルド・コンポ
ーネント305で生成したクエリー・ドキュメント30
6を入力し、転置ファイル102中の各文書のベクトル
とクエリー・ドキュメント306のベクトルとを比較し
て、クエリー・ドキュメント306との類似度に応じた
スコアを各文書に付与し、所定の閾値を超えるスコアが
付与された文書リスト308を検索結果として出力す
る。On the other hand, the search processing is performed by the natural language processing module 300 and the query build component 305.
And the search engine 307. Specifically, the natural language processing module 300
A search condition 206 is input from 00, and analysis processing such as morphological analysis, syntax analysis, and noun phrase extraction is performed using a dictionary 301 storing part of speech information and the like and a grammar dictionary 302 for analyzing the dependency of each word. , A document set 303 including a list of noun phrases in the search condition 206 is generated. The query build component 305 inputs the document set 303 and obtains, for each noun phrase constituting the search condition 206, statistical information such as an appearance frequency in the search condition 206 and a distribution in the entire document DB 101. A query document 306 is generated by converting the search condition 206 into a vector expression using the information. The search engine 307 generates the query document 30 generated by the query build component 305.
6, the vector of each document in the transposed file 102 is compared with the vector of the query document 306, and a score corresponding to the similarity with the query document 306 is given to each document. A document list 308 to which a score exceeding the score is given is output as a search result.
【0027】なお、図1においては、文書DB101お
よび転置ファイル102をネットワーク104に単独に
接続した構成を示したが、これらを検索サーバ103に
直接接続する構成としても良い。また、図1において
は、本実施の形態の文書管理支援装置をネットワーク1
04を介したシステムで構成するように示したが、クラ
イアント100と検索サーバ103の処理を1つのコン
ピュータで行うようにすることもできる。Although FIG. 1 shows a configuration in which the document DB 101 and the transposed file 102 are independently connected to the network 104, these may be directly connected to the search server 103. In FIG. 1, the document management support apparatus of the present embodiment is connected to a network 1
Although the system is shown to be configured via the system 04, the processing of the client 100 and the search server 103 may be performed by one computer.
【0028】次に、上述した構成を備えた文書管理支援
装置の動作について、(1)転置ファイルの生成処理,
(2)ディレクトリの設定処理,(3)ディレクトリへ
の分類処理の順で詳細に説明する。Next, the operation of the document management support apparatus having the above-described configuration will be described with respect to (1) a process of generating an inverted file,
(2) Directory setting processing and (3) directory classification processing will be described in detail in this order.
【0029】(1)転置ファイルの生成処理 図4は、転置ファイルの生成処理を示すフローチャート
である。検索サーバ103は、新たな文書(新聞記事)
が文書DB101に登録された場合(S401)、この
文書を入力して転置ファイル102に登録するための処
理を開始する(S402)。(1) Transposition File Generation Process FIG. 4 is a flowchart showing a transposition file generation process. The search server 103 adds a new document (newspaper article)
Is registered in the document DB 101 (S401), a process for inputting this document and registering it in the transposition file 102 is started (S402).
【0030】検索サーバ103において、自然言語処理
モジュール300は、ステップS402で入力した文書
を解析する処理を行う(S403)。具体的には、入力
した文書がワープロ文書,HTML等の構造化文書等、
いかなるフォーマットの文書であるかを判定する処理を
行う。その後、辞書301および文法辞書302を用い
て形態素解析,係り受け等の構文解析を行い、文書を複
数のサブドキュメントに区分すると共に、区分したサブ
ドキュメントから名詞句を抽出する等の処理を行う。In the search server 103, the natural language processing module 300 performs a process of analyzing the document input in step S402 (S403). Specifically, the input document is a word processing document, a structured document such as HTML, etc.
A process is performed to determine the format of the document. Thereafter, syntax analysis such as morphological analysis and dependency is performed by using the dictionary 301 and the grammar dictionary 302 to divide the document into a plurality of sub-documents, and to perform processing such as extracting a noun phrase from the divided sub-documents.
【0031】そして、自然言語処理モジュール300
は、ステップS403における処理の結果に基づいて、
サブドキュメント毎に名詞句リストを生成し、生成した
名詞句リストを含むドキュメント・セット303を生成
する(S404)。Then, the natural language processing module 300
Is based on the result of the processing in step S403.
A noun phrase list is generated for each sub-document, and a document set 303 including the generated noun phrase list is generated (S404).
【0032】その後、データベース・ビルド・コンポー
ネント304は、自然言語処理モジュール300で生成
したドキュメント・セット303を入力し、文書のベク
ター表現を生成して転置ファイル102に登録する処理
を行う(S405)。Thereafter, the database build component 304 receives the document set 303 generated by the natural language processing module 300, generates a vector representation of the document, and registers it in the transposed file 102 (S405).
【0033】具体的には、ドキュメント・セット303
中のサブドキュメントの各名詞句を転置ファイル102
の索引語として、サブドキュメント中の出現頻度,文書
DB101全体における分布等の統計情報を求め、求め
た名詞句毎の統計情報を用いてサブドキュメントをベク
ター表現に変換する。この処理をドキュメント・セット
303中の全てのサブドキュメントについて行い、変換
したサブドキュメントのベクター表現に基づいて、文書
のベクター表現を生成して転置ファイル102に登録す
る。Specifically, the document set 303
Transpose file 102 for each noun phrase of subdocument in
The statistical information such as the frequency of occurrence in the sub-document and the distribution in the entire document DB 101 is obtained as an index term, and the sub-document is converted into a vector expression using the obtained statistical information for each noun phrase. This processing is performed for all the sub-documents in the document set 303, and based on the converted sub-document vector expression, a vector expression of the document is generated and registered in the transposed file 102.
【0034】(2)ディレクトリの設定処理 続いて、文書DB101中の文書を管理するためのディ
レクトリを設定する処理について説明する。図5は、デ
ィレクトリの設定処理を説明するための説明図である。(2) Directory Setting Process Next, a process of setting a directory for managing documents in the document DB 101 will be described. FIG. 5 is an explanatory diagram for explaining a directory setting process.
【0035】ユーザは、クライアント100の入力装置
200を用いて文書管理部202に指示を出し、出力装
置203で画面表示された様子を確認しつつ、ディレク
トリを設定していく。まず、ルートディレクトリ500
の下に、サブディレクトリ501を作成し、ディレクト
リ名「スポーツ」を付す。そして、サブディレクトリ5
01に、文書DB101中の該当する文書を検索して、
その文書名を表示するための検索条件206を関連づけ
る。この検索条件206は、検索式,検索文,キーワー
ドの集合,例示用文書等のいずれであっても良い。ま
た、検索条件206として、サブディレクトリ501に
付したディレクトリ名を用いることにしても良い。した
がって、ユーザがサブディレクトリ501を選択する
と、関連づけられた検索条件206が検索サーバ103
に出力された後、文書DB101からスポーツに関する
新聞記事が検索され、その文書名、即ち記事の見出し等
がサブディレクトリ501に表示されることになる。ま
た、設定されたディレクトリに関する情報は、ディレク
トリ情報格納部201に格納される。The user issues an instruction to the document management unit 202 using the input device 200 of the client 100, and sets the directory while checking the state of the screen displayed on the output device 203. First, the root directory 500
, A subdirectory 501 is created, and a directory name “sports” is assigned. And subdirectory 5
01, a corresponding document in the document DB 101 is searched,
A search condition 206 for displaying the document name is associated. The search condition 206 may be any of a search formula, a search sentence, a set of keywords, an example document, and the like. Further, a directory name given to the subdirectory 501 may be used as the search condition 206. Therefore, when the user selects the subdirectory 501, the associated search condition 206 is changed to the search server 103.
After that, a newspaper article relating to sports is retrieved from the document DB 101, and the document name, that is, the headline of the article, is displayed in the subdirectory 501. Information about the set directory is stored in the directory information storage unit 201.
【0036】上述したようにして、ディレクトリ名が
「科学」であるサブディレクトリ502,ディレクトリ
名が「経済」であるサブディレクトリ503についても
同様に設定する。As described above, the sub-directory 502 whose directory name is "science" and the sub-directory 503 whose directory name is "economic" are set in the same manner.
【0037】また、設定したサブディレクトリの下位
に、さらにサブディレクトリを設定することによってア
ンド条件を設定することができる。例えば、サブディレ
クトリ503を指定した後、その下位にディレクトリ名
が「金融」であるサブディレクトリ504およびディレ
クトリ名が「産業」であるディレクトリ505を作成す
る。そして、これらに検索条件206を関連づける。そ
の結果、サブディレクトリ503を選択した場合には、
「経済」に関する記事が文書DB101から検索され
て、その見出し(文書名)が表示される。また、サブデ
ィレクトリ504が選択された場合には、「経済」に関
する記事で、かつ、「金融」に関する記事が文書DB1
01から検索されて、その見出しが表示される。The AND condition can be set by further setting a subdirectory below the set subdirectory. For example, after designating the subdirectory 503, a subdirectory 504 whose directory name is “finance” and a directory 505 whose directory name is “industry” are created below the subdirectory 503. Then, the search condition 206 is associated with these. As a result, when the subdirectory 503 is selected,
An article related to "economy" is retrieved from the document DB 101, and the headline (document name) is displayed. When the subdirectory 504 is selected, an article related to “economy” and an article related to “finance” are stored in the document DB1.
01 and the heading is displayed.
【0038】図6は、上述したようにしてディレクトリ
の設定処理を行った結果の一例を示す説明図である。図
6に示すようにディレクトリを設定することにより、文
書DB101中の文書を分類して画面表示することがで
きる準備が整ったことになる。FIG. 6 is an explanatory diagram showing an example of the result of performing the directory setting processing as described above. By setting the directory as shown in FIG. 6, the preparation for classifying the documents in the document DB 101 and displaying them on the screen is completed.
【0039】(3)ディレクトリへの分類処理 続いて、上述したようにして設定したディレクトリに基
づいて、文書DB101中の文書を分類して管理するた
めの処理について説明する。図7はディレクトリへの分
類処理を示すフローチャートである。(3) Processing for Classifying into Directories Next, processing for classifying and managing documents in the document DB 101 based on the directories set as described above will be described. FIG. 7 is a flowchart showing the process of classifying a directory.
【0040】ユーザは、クライアント100を操作し
て、図6に示したようにして作成したディレクトリを画
面表示し、任意のディレクトリを指定する。文書管理部
202は、ディレクトリの指定があると(S701)、
指定されたディレクトリに基づいて、該当する検索条件
206を検索サーバ103に出力する(S702)。The user operates the client 100 to display the directory created as shown in FIG. 6 on the screen, and designate an arbitrary directory. When the directory is designated (S701), the document management unit 202
The corresponding search condition 206 is output to the search server 103 based on the specified directory (S702).
【0041】本実施の形態を説明するにあたっては、図
6に示した「交通事故」というサブディレクトリが指定
されたものとする。したがって、文書管理部202は、
検索条件206として、予め関連づけられた「交通事
故」に関する検索式,検索文,キーワードの集合または
例示用の文書を出力する。In describing this embodiment, it is assumed that the subdirectory "Traffic Accident" shown in FIG. 6 has been designated. Therefore, the document management unit 202
As the search condition 206, a search formula, a search sentence, a set of keywords, or a document for illustration relating to “traffic accident” associated in advance is output.
【0042】検索サーバ103は、クライアント100
から検索条件206を入力し、自然言語処理モジュール
300が検索条件206の解析処理を行う(S70
3)。具体的には、辞書301および文法辞書302を
用いて形態素解析,係り受け等の構文解析処理を行う。The search server 103 is connected to the client 100
, And the natural language processing module 300 analyzes the search condition 206 (S70).
3). Specifically, syntax analysis processing such as morphological analysis and dependency is performed using the dictionary 301 and the grammar dictionary 302.
【0043】そして、自然言語処理モジュール300
は、ステップS703での解析結果に基づいて、検索条
件206から転置ファイル102中の索引語に対応する
名詞句を抽出し、名詞句からなるドキュメント・セット
303を生成する(S704)。Then, the natural language processing module 300
Extracts a noun phrase corresponding to the index word in the transposed file 102 from the search condition 206 based on the analysis result in step S703, and generates a document set 303 including the noun phrase (S704).
【0044】続いて、クエリー・ビルド・コンポーネン
ト305は、自然言語処理モジュール300からドキュ
メント・セット303を入力し、入力したドキュメント
・セット303を構成する各名詞句について、検索条件
206中の出現頻度,文書DB101全体における分布
等の統計情報を求め、求めた統計情報を用いてドキュメ
ント・セット303をベクター表現に変換したクエリー
・ドキュメント306を生成する(S705)。Subsequently, the query build component 305 inputs the document set 303 from the natural language processing module 300, and for each noun phrase constituting the input document set 303, the appearance frequency in the search condition 206, Statistical information such as distribution in the entire document DB 101 is obtained, and a query document 306 is generated by converting the document set 303 into a vector expression using the obtained statistical information (S705).
【0045】検索エンジン307は、クエリー・ビルド
・コンポーネント305で生成したクエリー・ドキュメ
ント306を入力し、転置ファイル102中の各文書の
ベクトルとクエリー・ドキュメント306のベクトルを
比較して、クエリー・ドキュメント306との類似度に
応じたスコアを各文書に付与する(S706)。The search engine 307 inputs the query document 306 generated by the query build component 305, compares the vector of each document in the transposed file 102 with the vector of the query document 306, and A score corresponding to the degree of similarity is given to each document (S706).
【0046】なお、類似度に応じたスコアは、各文書と
クエリー・ドキュメント306との類似度を余弦距離に
基づいて表現したものであり、スコアが大きい文書がよ
りクエリー・ドキュメント306と類似していることを
表している。The score according to the similarity expresses the similarity between each document and the query document 306 based on the cosine distance. A document having a higher score is more similar to the query document 306. It represents that it is.
【0047】そして、検索エンジン307は、予め設定
されたスコアの閾値に基づいて、閾値を超えるスコアが
付与された文書を選択し、選択した文書に基づいて、文
書リスト308を生成して、検索結果として出力する
(S707)。The search engine 307 selects a document having a score exceeding the threshold based on a preset score threshold, generates a document list 308 based on the selected document, and performs a search. The result is output (S707).
【0048】図8は、文書リスト308の一例を示す説
明図である。図8に示すように、文書リスト308に
は、クエリー・ドキュメント306との類似度に応じた
スコアのランキング,文書名等が表示される。FIG. 8 is an explanatory diagram showing an example of the document list 308. As shown in FIG. 8, in the document list 308, ranking of scores, document names, and the like according to the similarity with the query document 306 are displayed.
【0049】クライアント100は、検索エンジン30
7から文書リスト308を入力し、入力した文書リスト
308に基づいて、上位のランキングの文書から順に、
該当するディレクトリに関連づけて文書名を画面表示す
る(S708)。したがって、ディレクトリに関連づけ
られた検索条件206に最も近い文書から順に表示する
ことができ、ユーザが文書を選択する際の基準を提供す
ることができる。The client 100 operates as the search engine 30
7, the document list 308 is input, and based on the input document list 308, the documents having the highest rankings are sequentially entered.
The document name is displayed on the screen in association with the corresponding directory (S708). Therefore, the documents can be displayed in order from the document closest to the search condition 206 associated with the directory, and the criteria for the user to select the document can be provided.
【0050】図9は、指定したディレクトリに関連づけ
て文書名を一覧表示した様子の一例を示す説明図であ
る。図9に示すように、ステップS701で指定された
サブディレクトリ「交通事故」に該当する文書が検索サ
ーバ103によって文書DB101から検索され、その
文書名が画面表示されている。この図9に示した状態
で、その下位のサブディレクトリ「人身事故」を指定す
ると、「交通事故」に関する記事で、かつ「人身事故」
に関する記事が検索されて画面表示されることになる。FIG. 9 is an explanatory diagram showing an example of a state in which a list of document names is displayed in association with a specified directory. As shown in FIG. 9, a document corresponding to the sub-directory "traffic accident" specified in step S701 is searched from the document DB 101 by the search server 103, and the document name is displayed on the screen. In the state shown in FIG. 9, if a subdirectory “personal accident” under the subordinate directory is designated, an article related to “traffic accident” and “personal accident”
Will be searched and displayed on the screen.
【0051】なお、ここでは類似度に応じて文書名を表
示することにしたが、もちろん、日付順,五十音順等で
文書名を表示することにしても良い。Although the document names are displayed in accordance with the similarity here, the document names may be displayed in the order of date, Japanese syllabary or the like.
【0052】このように、本実施の形態の文書管理支援
装置によれば、記憶媒体とは独立にディレクトリを作成
し、作成したディレクトリに該当する文書を検索技術を
用いて収集し、分類・管理することができるようにする
ことにより、予め文書DB101中の文書が複数のディ
レクトリに分類されていたかのように、文書DB101
中の文書を分類して表示することができる。As described above, according to the document management support apparatus of the present embodiment, a directory is created independently of a storage medium, documents corresponding to the created directory are collected by using a search technique, and classified and managed. In this way, the documents in the document DB 101 can be read as if the documents in the document DB 101 had been classified into a plurality of directories in advance.
Documents inside can be classified and displayed.
【0053】また、ユーザの操作自体は、ディレクトリ
で文書を管理する通常の文書管理支援装置と同様である
ため、ユーザに文書を検索して表示しているということ
を意識させることなく、文書を分類し、管理することが
できる。Further, since the operation itself of the user is the same as that of a normal document management support device that manages a document in a directory, the user can retrieve the document without being conscious of searching for and displaying the document. Can be categorized and managed.
【0054】なお、本実施の形態においては、管理対象
となる文書を文書DB101の文書としたが、複数の文
書DBが用意されている場合においては、ディレクトリ
の指定を行う前に、いずれの文書DBを対象とするかを
選択することができるようにしても良い。いずれの文書
DBを選択したとしても、文書の管理はユーザが設定し
たディレクトリに基づいて行われるため、どの文書DB
を対象としても同様な文書の分類および管理を行うこと
ができる。したがって、1996年の新聞記事を格納し
たデータベースと1995年の新聞記事を格納したデー
タベースのいずれを選択しても、同一のディレクトリで
新聞記事の分類・管理を行うことができる。また、文書
DBを他のものにそっくり入れ替えたとしても、新たに
ディレクトリを作成することなく、予め作成しておいた
ディレクトリを利用して新たな文書DB中の文書を分類
し、管理することができる。In the present embodiment, the document to be managed is a document in the document DB 101. However, if a plurality of document DBs are prepared, any It may be possible to select whether to target the DB. Regardless of which document DB is selected, document management is performed based on the directory set by the user.
, And similar document classification and management can be performed. Therefore, regardless of whether a database storing newspaper articles in 1996 or a database storing newspaper articles in 1995 is selected, classification and management of newspaper articles can be performed in the same directory. Further, even if the document DB is completely replaced with another one, it is possible to classify and manage the documents in the new document DB using the directory created in advance without creating a new directory. it can.
【0055】また、文書DB101とは独立にディレク
トリを作成し、作成したディレクトリに該当する文書を
検索技術を用いて収集し、分類・管理することができる
ようにしたため、文書DB101中の文書をディレクト
リで分類して管理しておく必要をなくすことができる。
したがって、文書DB101に文書を新たに保存する場
合にあっては、保存先のディレクトリの指定が不要とな
る。Further, a directory is created independently of the document DB 101, and documents corresponding to the created directory can be collected, classified, and managed using a search technique. This eliminates the need to classify and manage.
Therefore, when a document is newly stored in the document DB 101, it is not necessary to specify a storage destination directory.
【0056】また、文書DB101とは独立にディレク
トリを作成し、作成したディレクトリに該当する文書を
検索技術を用いて収集し、分類・管理することができる
ようにしたため、ディレクトリに関するファイルを文書
DB101中に作成する必要をなくすことができる。し
たがって、ディレクトリに関するファイルが破損した場
合に文書の読み出しが不可能となるような事態の発生を
なくすことができる。Further, a directory is created independently of the document DB 101, and documents corresponding to the created directory can be collected, classified, and managed by using a search technique. Can be eliminated. Therefore, it is possible to prevent a situation where reading of a document becomes impossible when a file related to a directory is damaged.
【0057】また、ユーザが作成したディレクトリのい
くつかに当てはまるような文書については、検索サーバ
103による検索によって、該当する全てのディレクト
リに表示されることになる。Documents that correspond to some of the directories created by the user are displayed in all corresponding directories by the search by the search server 103.
【0058】また、各ディレクトリに表示された文書に
おいて、ユーザが分類結果としてふさわしいと思う文書
やふさわしくないと思う文書については、その結果を検
索サーバ103にフィードバックすることができる。す
なわち、ユーザは、分類結果としてふさわしいと思う文
書に対して、正の重み、例えば「+」を指定することが
でき、検索結果としてふさわしくないと思う文書に対し
て負の重み、例えば「−」を指定することができる。そ
の結果、入力した重みが正の指定である場合には、転置
ファイル102中の該当する文書の重みが強化され、入
力した重みが負の指定である場合には、文書の重みが弱
められる。Further, among the documents displayed in each directory, for the documents that the user considers appropriate or unsuitable as the classification result, the results can be fed back to the search server 103. That is, the user can specify a positive weight, for example, “+” for a document that is considered appropriate as a classification result, and a negative weight, for example, “−” for a document that is not appropriate as a search result. Can be specified. As a result, when the input weight is a positive specification, the weight of the corresponding document in the transposed file 102 is strengthened, and when the input weight is a negative specification, the weight of the document is weakened.
【0059】また、本実施の形態においては、ベクトル
空間法による検索を例にとって説明したが、ブーリアン
検索により検索処理を行うことにしても良い。Further, in the present embodiment, the search by the vector space method has been described as an example, but the search processing may be performed by a Boolean search.
【0060】また、本実施の形態においては詳細な説明
を省略するが、図9のように表示された文書を削除する
等の処理は自由に行うことができる。Although a detailed description is omitted in the present embodiment, processing such as deleting a document displayed as shown in FIG. 9 can be freely performed.
【0061】また、作成したディレクトリに検索条件を
関連づける際には、ユーザが自ら作成した検索条件を関
連づけても良いし、文書DB101から関連語を抽出
し、抽出した関連語をディレクトリに関連づけることに
しても良い。When associating the search condition with the created directory, the search condition created by the user may be associated with the directory, or a related word may be extracted from the document DB 101 and the extracted related word may be associated with the directory. May be.
【0062】また、詳細な説明は省略するが、本実施の
形態の文書管理支援装置は、ワードプロセッサ等のアプ
リケーションプログラムで文書を読み出す際にも適用可
能であることは明らかである。Although a detailed description is omitted, it is clear that the document management support apparatus of the present embodiment can be applied to reading a document by an application program such as a word processor.
【0063】さらに、本実施の形態で説明した文書管理
支援装置は、予め用意されたプログラムをコンピュータ
やワークステーションで実行することによって実現され
る。このプログラムは、ハードディスク,フロッピーデ
ィスク,CD−ROM,MO,DVD等のコンピュータ
で読み取り可能な記録媒体に記録され、コンピュータに
よって記録媒体から読み出されることによって実行され
る。また、このプログラムは、上記記録媒体を介して、
またはネットワークを介して配布することができる。Further, the document management support device described in the present embodiment is realized by executing a prepared program on a computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a floppy disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. In addition, this program, via the recording medium,
Or it can be distributed over a network.
【0064】[0064]
【発明の効果】以上説明したように、本発明の文書管理
支援装置(請求項1)によれば、管理対象となる文書を
格納した格納手段と、検索条件を入力する検索条件入力
手段と、検索条件入力手段で入力された検索条件を分類
項目として設定する分類項目設定手段と、分類項目設定
手段で設定した分類項目を画面表示する分類項目表示手
段と、分類項目表示手段で表示した分類項目を選択する
選択手段と、選択手段で選択した分類項目に基づいて、
格納手段から該当する文書を検索する検索手段と、検索
手段の検索結果に基づいて、該当する文書の文書名を表
示する文書名表示手段と、を備えたため、記憶媒体とは
独立に作成したディレクトリに該当する文書を検索技術
を用いて収集し、分類・管理することができ、格納手段
中の文書を分類してあったかのように扱うことができ
る。したがって、記憶媒体を入れ替えた場合等におい
て、新たに分類項目を作成する必要をなくすことができ
ると共に、文書の分類方法を変更する場合において、分
類項目を変更するのみで文書自体を移動させる等の処理
を行う必要をなくすことができ、文書管理の利便性の向
上を図ることができる。また、ユーザが作成した分類項
目に該当する文書を検索技術を用いて収集して画面表示
することができるため、文書を保存する際に、文書を所
属させる分類項目を指定する作業を省略することがで
き、保存操作の簡素化を図ることができる。さらに、分
類項目は記憶媒体に作成されないため、分類項目に関す
るファイルが破損した場合に文書の読み出しが不可能と
なるような事態を防止することができる。As described above, according to the document management support apparatus of the present invention (claim 1), storage means for storing documents to be managed, search condition input means for inputting search conditions, Classification item setting means for setting the search condition input by the search condition input means as a classification item, classification item display means for displaying the classification item set by the classification item setting means on the screen, and classification item displayed by the classification item display means Based on the selecting means for selecting and the classification item selected by the selecting means,
A directory created independently of the storage medium, comprising: a search unit for searching for the relevant document from the storage unit; and a document name display unit for displaying a document name of the relevant document based on a search result of the search unit. Can be collected, classified and managed using a search technology, and the documents in the storage means can be handled as if they had been classified. Therefore, it is possible to eliminate the necessity of creating a new classification item when the storage medium is replaced, and to change the classification method of the document and to move the document itself only by changing the classification item. This eliminates the need for processing, and improves the convenience of document management. In addition, since documents corresponding to the category items created by the user can be collected and displayed on the screen by using a search technology, when saving the documents, the operation of specifying the category items to which the documents belong can be omitted. And the saving operation can be simplified. Further, since the classification item is not created in the storage medium, it is possible to prevent a situation where reading of a document becomes impossible when a file relating to the classification item is damaged.
【0065】また、本発明の文書管理支援装置(請求項
2)によれば、請求項1に記載の文書管理支援装置にお
いて、さらに、分類項目表示手段で画面表示されている
分類項目の中からアンド条件の対象となる分類項目を指
定する指定手段を備え、指定手段でアンド条件の対象と
なる分類項目が指定された場合、分類項目設定手段は、
検索条件入力手段で入力された検索条件を入れ子の分類
項目としてアンド条件の対象となる分類項目の下位に配
置するため、より詳細な文書の分類を可能とすることが
できる。According to the document management support device of the present invention (claim 2), the document management support device according to claim 1 further includes a classification item displayed on the screen by the classification item display means. A designation unit for designating a classification item to be subjected to the AND condition; and when the classification item to be subjected to the AND condition is designated by the designation unit, the classification item setting unit:
Since the search condition input by the search condition input means is arranged as a nested classification item below the classification item to be subjected to the AND condition, more detailed document classification can be performed.
【0066】また、本発明の文書管理支援装置(請求項
3)によれば、請求項1または2に記載の文書管理支援
装置において、さらに、格納手段に格納された文書をベ
クター表現に変換して記憶する記憶手段と、分類項目設
定手段で分類項目として設定した検索条件をベクター表
現に変換する変換手段と、を備え、検索手段は、検索条
件のベクター表現と文書のベクター表現との類似度を求
め、求めた類似度が所定の閾値を超える文書を選択し、
選択した文書を類似度に応じて配列した文書リストを検
索結果として出力し、文書名表示手段は、検索手段から
文書リストを入力し、入力した文書リストに基づいて、
文書名を類似度順に画面表示するため、分類項目として
設定された検索条件に最も近い文書から順に表示するこ
とができ、ユーザが文書を選択する際の基準を提供する
ことができる。According to the document management support apparatus of the present invention (claim 3), the document management support apparatus according to claim 1 or 2 further converts the document stored in the storage means into a vector expression. And a conversion unit for converting a search condition set as a classification item by the classification item setting unit into a vector expression. The search unit is configured to perform similarity between the vector expression of the search condition and the vector expression of the document. , And select a document in which the calculated similarity exceeds a predetermined threshold.
A document list in which the selected documents are arranged according to the similarity is output as a search result, and the document name display unit inputs the document list from the search unit, and based on the input document list,
Since the document names are displayed on the screen in the order of similarity, the documents can be displayed in order from the document closest to the search condition set as the classification item, and the criteria for the user to select the document can be provided.
【0067】さらに、本発明のコンピュータ読み取り可
能な記録媒体(請求項4)によれば、請求項1〜3のい
ずれか1つに記載の文書管理支援装置の各手段としてコ
ンピュータを機能させるためのプログラムを記録したた
め、このプログラムをコンピュータに実行させることに
より、記憶媒体とは独立に作成したディレクトリに該当
する文書を検索技術を用いて収集し、分類・管理するこ
とができ、文書の分類・管理における利便性の向上を図
ることができる文書管理支援装置を提供することができ
る。Further, according to the computer-readable recording medium of the present invention (claim 4), the computer-readable recording medium for causing a computer to function as each means of the document management support apparatus according to any one of claims 1 to 3 is provided. Since the program is recorded, by executing this program on a computer, it is possible to use a search technology to collect, classify and manage documents corresponding to a directory created independently of the storage medium, and to classify and manage the documents. A document management support device that can improve the convenience of the document management.
【図1】本実施の形態の文書管理支援装置のシステム構
成図である。FIG. 1 is a system configuration diagram of a document management support device according to an embodiment.
【図2】図1に示したクライアントのブロック構成図で
ある。FIG. 2 is a block diagram of the client shown in FIG. 1;
【図3】図1に示した検索サーバの処理を示す概略ブロ
ック図である。FIG. 3 is a schematic block diagram illustrating processing of a search server illustrated in FIG. 1;
【図4】本実施の形態の文書管理支援装置において、転
置ファイルの生成処理を示すフローチャートである。FIG. 4 is a flowchart illustrating a process of generating a transposed file in the document management support apparatus according to the embodiment.
【図5】本実施の形態の文書管理支援装置において、デ
ィレクトリの設定処理を説明するための説明図である。FIG. 5 is an explanatory diagram illustrating a directory setting process in the document management support apparatus according to the present embodiment.
【図6】本実施の形態の文書管理支援装置において、デ
ィレクトリの設定処理を行った結果の一例を示す説明図
である。FIG. 6 is an explanatory diagram illustrating an example of a result of performing a directory setting process in the document management support apparatus according to the present embodiment.
【図7】本実施の形態の文書管理支援装置において、デ
ィレクトリへの分類処理を示すフローチャートである。FIG. 7 is a flowchart illustrating a process of classifying into a directory in the document management support apparatus according to the present embodiment.
【図8】本実施の形態の文書管理支援装置において、文
書リストの一例を示す説明図である。FIG. 8 is an explanatory diagram illustrating an example of a document list in the document management support device according to the present embodiment.
【図9】本実施の形態の文書管理支援装置において、指
定したディレクトリに文書名を一覧表示した様子の一例
を示す説明図である。FIG. 9 is an explanatory diagram showing an example of a state in which a list of document names is displayed in a specified directory in the document management support device of the present embodiment.
100 クライアント 101 文書DB 102 転置ファイル 103 検索サーバ 104 ネットワーク 200 入力装置 201 ディレクトリ情報管理部 202 文書管理部 203 出力装置 204 入出力部 206 検索条件 300 自然言語処理モジュール 301 辞書 302 文法辞書 303 ドキュメント・セット 304 データベース・ビルド・コンポーネント 305 クエリー・ビルド・コンポーネント 306 クエリー・ドキュメント 307 検索エンジン 308 文書リスト REFERENCE SIGNS LIST 100 client 101 document DB 102 transposed file 103 search server 104 network 200 input device 201 directory information management unit 202 document management unit 203 output device 204 input / output unit 206 search condition 300 natural language processing module 301 dictionary 302 grammar dictionary 303 document set 304 Database Build Component 305 Query Build Component 306 Query Document 307 Search Engine 308 Document List
Claims (4)
と、 検索条件を入力する検索条件入力手段と、 前記検索条件入力手段で入力された検索条件を分類項目
として設定する分類項目設定手段と、 前記分類項目設定手段で設定した分類項目を画面表示す
る分類項目表示手段と、 前記分類項目表示手段で表示した分類項目を選択する選
択手段と、 前記選択手段で選択した分類項目に基づいて、前記格納
手段から該当する文書を検索する検索手段と、 前記検索手段の検索結果に基づいて、該当する文書の文
書名を表示する文書名表示手段と、 を備えたことを特徴とする文書管理支援装置。A storage unit for storing a document to be managed; a search condition input unit for inputting a search condition; a classification item setting unit for setting the search condition input by the search condition input unit as a classification item; A classification item display means for displaying a classification item set by the classification item setting means on a screen; a selection means for selecting a classification item displayed by the classification item display means; and a classification item selected by the selection means. Document management support comprising: a search unit that searches for a corresponding document from the storage unit; and a document name display unit that displays a document name of the corresponding document based on a search result of the search unit. apparatus.
示されている分類項目の中からアンド条件の対象となる
分類項目を指定する指定手段を備え、 前記指定手段で前記アンド条件の対象となる分類項目が
指定された場合、前記分類項目設定手段は、前記検索条
件入力手段で入力された検索条件を入れ子の分類項目と
して前記アンド条件の対象となる分類項目の下位に配置
することを特徴とする請求項1に記載の文書管理支援装
置。2. The system according to claim 1, further comprising a designation unit for designating a classification item to be subjected to an AND condition from among the classification items displayed on the screen by the classification item display unit, When a classification item is specified, the classification item setting unit arranges the search condition input by the search condition input unit as a nested classification item below the classification item targeted for the AND condition. The document management support device according to claim 1.
をベクター表現に変換して記憶する記憶手段と、 前記分類項目設定手段で分類項目として設定した検索条
件をベクター表現に変換する変換手段と、を備え、 前記検索手段は、前記検索条件のベクター表現と前記文
書のベクター表現との類似度を求め、求めた類似度が所
定の閾値を超える文書を選択し、選択した文書を類似度
に応じて配列した文書リストを検索結果として出力し、 前記文書名表示手段は、前記検索手段から文書リストを
入力し、入力した文書リストに基づいて、前記文書名を
類似度順に画面表示することを特徴とする請求項1また
は2に記載の文書管理支援装置。3. A storage unit for converting a document stored in the storage unit into a vector expression and storing the converted expression, and a conversion unit for converting a search condition set as a classification item by the classification item setting unit into a vector expression. The search means obtains a similarity between the vector expression of the search condition and the vector expression of the document, selects a document in which the obtained similarity exceeds a predetermined threshold, and converts the selected document into the similarity. Outputting a document list arranged in accordance with the search result as a search result, wherein the document name display means inputs the document list from the search means, and displays the document names on the screen in order of similarity based on the input document list. The document management support device according to claim 1 or 2, wherein
の文書管理支援装置の各手段としてコンピュータを機能
させるためのプログラムを記録したことを特徴とするコ
ンピュータ読み取り可能な記録媒体。4. A computer-readable recording medium on which a program for causing a computer to function as each unit of the document management support apparatus according to claim 1 is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9199617A JPH1145256A (en) | 1997-07-25 | 1997-07-25 | Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9199617A JPH1145256A (en) | 1997-07-25 | 1997-07-25 | Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1145256A true JPH1145256A (en) | 1999-02-16 |
Family
ID=16410841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9199617A Pending JPH1145256A (en) | 1997-07-25 | 1997-07-25 | Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1145256A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250935A (en) * | 1999-03-01 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device and method using classification tree and recording medium recording information retrieval program using classification tree |
JP2006215724A (en) * | 2005-02-02 | 2006-08-17 | Toshiba Corp | Material management system and program |
CN100424688C (en) * | 2003-09-29 | 2008-10-08 | 奥林巴斯株式会社 | Information managing method and information managing device |
JP2010092118A (en) * | 2008-10-03 | 2010-04-22 | Canon Inc | Content management method, content management device, and program |
-
1997
- 1997-07-25 JP JP9199617A patent/JPH1145256A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250935A (en) * | 1999-03-01 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device and method using classification tree and recording medium recording information retrieval program using classification tree |
CN100424688C (en) * | 2003-09-29 | 2008-10-08 | 奥林巴斯株式会社 | Information managing method and information managing device |
JP2006215724A (en) * | 2005-02-02 | 2006-08-17 | Toshiba Corp | Material management system and program |
JP2010092118A (en) * | 2008-10-03 | 2010-04-22 | Canon Inc | Content management method, content management device, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6442540B2 (en) | Information retrieval apparatus and information retrieval method | |
US7272558B1 (en) | Speech recognition training method for audio and video file indexing on a search engine | |
JP3577819B2 (en) | Information search apparatus and information search method | |
US20020099685A1 (en) | Document retrieval system; method of document retrieval; and search server | |
JP2005122295A (en) | Relationship figure creation program, relationship figure creation method, and relationship figure generation device | |
JP4091146B2 (en) | Document retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus | |
JP4967133B2 (en) | Information acquisition apparatus, program and method thereof | |
JPH0484271A (en) | Intra-information retrieval device | |
JP3178421B2 (en) | Text search device and computer-readable recording medium storing text search program | |
JP3921837B2 (en) | Information discrimination support device, recording medium storing information discrimination support program, and information discrimination support method | |
JP4065346B2 (en) | Method for expanding keyword using co-occurrence between words, and computer-readable recording medium recording program for causing computer to execute each step of the method | |
JP2004029906A (en) | Document retrieval device and method | |
JP3767763B2 (en) | Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device | |
JP2001184358A (en) | Device and method for retrieving information with category factor and program recording medium therefor | |
JPH1145268A (en) | Document retrieval device and computer-readable recording medium where eprogram making computer funtion as same device is recorded | |
JPH0844771A (en) | Information retrieval device | |
JPH1145257A (en) | Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the device | |
JPH1145256A (en) | Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded | |
JP4423385B2 (en) | Document classification support apparatus and computer program | |
JP4384736B2 (en) | Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device | |
JP4000332B2 (en) | Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus | |
JP4497337B2 (en) | Concept search device and recording medium recording computer program | |
JPH1145254A (en) | Document retrieval device and computer readable recording medium recorded with program for functioning computer as the device | |
JPH1145238A (en) | Document management system and computer readable recording medium for recording program for having computer function as the same system | |
JP4138048B2 (en) | Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070529 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070730 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070828 |