JPH1145260A - 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH1145260A
JPH1145260A JP9200627A JP20062797A JPH1145260A JP H1145260 A JPH1145260 A JP H1145260A JP 9200627 A JP9200627 A JP 9200627A JP 20062797 A JP20062797 A JP 20062797A JP H1145260 A JPH1145260 A JP H1145260A
Authority
JP
Japan
Prior art keywords
document
collection
list
documents
collection condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9200627A
Other languages
English (en)
Inventor
Kazunobu Ukikawa
和宣 浮川
Hatsuko Ukikawa
初子 浮川
Yoshiya Arai
好哉 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9200627A priority Critical patent/JPH1145260A/ja
Publication of JPH1145260A publication Critical patent/JPH1145260A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 特定の内容の文書を収集するための収集条件
を登録しておき、検索技術を用いて収集条件に該当する
文書を収集できるようにすること。 【解決手段】 管理対象となる文書をベクター表現に変
換して格納する転置ファイル102と、特定の内容の文
書を収集する条件を記述した収集条件を入力し、入力し
た収集条件を登録して管理すると共に、収集条件を読み
出して画面表示し、画面表示した収集条件が選択される
と、選択された収集条件を出力するクライアント100
と、収集条件を入力してベクター表現に変換し、変換し
た収集条件のベクター表現と転置ファイル102に格納
された文書のベクター表現との類似度を求め、求めた類
似度が所定の閾値を超える文書を選択して文書リストを
生成する文書管理サーバ103と、からなり、クライア
ント100は、文書管理サーバ103から文書リストを
入力して、収集した文書の一覧を画面表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特定の内容の文書
を収集するための収集条件を登録しておき、検索技術を
用いて収集条件に該当する文書を必要に応じて収集でき
るようにすることにより、文書管理を容易にした文書管
理支援装置およびその装置としてコンピュータを機能さ
せるためのプログラムを記録したコンピュータ読み取り
可能な記録媒体に関する。
【0002】
【従来の技術】ハードディスク等の記憶媒体に保存され
た文書は、ディレクトリ(またはフォルダ)と呼ばれる
論理的区分に従って分類されて管理されるのが一般的で
ある。このディレクトリは、文書管理を簡便に行うため
に、ユーザが好みに応じて作成することができるもので
あり、作成したディレクトリに関連のある複数の文書を
まとめるために利用することができる。
【0003】具体的には、ユーザは、おおもとのルート
ディレクトリに対して、サブディレクトリと呼ばれるデ
ィレクトリを作成することができ、作成したサブディレ
クトリに名称を付け、その下にワードプロセッサ等で作
成した文書を所属させることができる。作成したサブデ
ィレクトリの下には、さらにサブディレクトリを作成す
ることができるため、様々なレベルのディレクトリを作
成することによって階層構造で文書を管理することがで
きる。また、文書を読み出す際には、ディレクトリを指
定することによってそのディレクトリ内の文書名の一覧
を表示し、一覧表示した文書名のいずれかを選択するこ
とによって所望の文書を読み出すことができる。
【0004】上述したディレクトリに関する情報はファ
イルにまとめられて記憶媒体中に保存される。このファ
イルには、ディレクトリに関連づけられて保存された文
書の文書名,記憶媒体中の位置等が記録され、記憶媒体
中の文書は、ディレクトリ名と文書名とによって管理さ
れることになる。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の技術においては、ディレクトリを用いることによっ
て簡単に文書管理を行うことができるが、ディレクトリ
で文書を管理するには、ディレクトリ毎に関連する文書
を整理しておかなければならないという問題があった。
換言すれば、いくらディレクトリを整理して作成したと
しても、各ディレクトリに文書を整理して保存していな
ければ、ディレクトリを辿って目的の文書を見つけ出す
ことは困難であった。
【0006】また、上記従来の技術においては、ディレ
クトリを中心にして文書を分類して管理を行うため、文
書を固定的にしか分類することができないという問題点
があった。換言すれば、ディレクトリを中心にして文書
を分類して管理を行うため、文書の分類方法を変更する
場合には、新たなディレクトリを作成し、作成したディ
レクトリに文書を移動させる等の煩雑な作業が必要であ
って、文書の分類・管理の利便性に欠けるという問題点
があった。
【0007】本発明は上記に鑑みてなされたものであっ
て、特定の内容の文書を収集するための収集条件を登録
しておき、検索技術を用いて収集条件に該当する文書を
必要に応じて収集できるようにして、文書管理を容易に
することを目的とする。
【0008】また、本発明は上記に鑑みてなされたもの
であって、上記収集条件を登録しておき、同一の条件で
必要な文書をいつでも収集することができるようにし
て、文書管理を容易にすることを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の文書管理支援装置は、ベクトル空間法を
用いた検索処理を利用して、文書を管理する文書管理支
援装置であって、管理対象となる文書をベクター表現に
変換して格納する文書格納手段と、特定の内容の文書を
収集する条件を記述した収集条件を入力する入力手段
と、前記入力手段を介して入力された収集条件を登録し
て管理する収集条件管理手段と、前記収集条件管理手段
から前記収集条件を読み出して画面表示する収集条件表
示手段と、前記収集条件表示手段で画面表示した収集条
件を選択する選択手段と、前記選択手段を介して選択さ
れた収集条件をベクター表現に変換する収集条件変換手
段と、前記収集条件変換手段で変換した収集条件のベク
ター表現と前記文書格納手段に格納された前記文書のベ
クター表現との類似度を求め、求めた類似度が所定の閾
値を超える文書を選択し、選択した文書を類似度に応じ
て配列した文書リストを生成して出力する文書リスト生
成手段と、前記文書リスト生成手段で生成した文書リス
トを画面表示する文書リスト表示手段と、を備えたもの
である。
【0010】また、請求項2の文書管理支援装置は、請
求項1に記載の文書管理支援装置において、さらに、前
記文書リスト表示手段で画面表示した文書リストを格納
する文書リスト格納手段と、前記文書リスト格納手段に
格納されている文書リストを文書の収集履歴として画面
表示する履歴表示手段と、を備えたものである。
【0011】さらに、請求項3のコンピュータ読み取り
可能な記録媒体は、前記請求項1または2に記載の文書
管理支援装置の各手段としてコンピュータを機能させる
ためのプログラムを記録したものである。
【0012】
【発明の実施の形態】以下、本発明の文書管理支援装置
およびその装置としてコンピュータを機能させるための
プログラムを記録したコンピュータ読み取り可能な記録
媒体の一実施の形態について、添付の図面を参照しつつ
詳細に説明する。
【0013】図1は、本実施の形態の文書管理支援装置
のシステム構成図である。図1に示す文書管理支援装置
は、特定の内容の文書を収集するための条件を記述した
収集条件を管理する複数のクライアント100と、文書
DB(データベース)101に格納された文書から転置
ファイル102を生成すると共に、ベクトル空間検索を
行うことができる検索エンジン(例えば、CLARIT
ECH社のCLARIT等)を備え、クライアント10
0から収集条件を入力し、入力した収集条件に基づい
て、転置ファイル102を用いて該当する文書を収集
し、収集した文書のリストをクライアント100に出力
する文書管理サーバ103と、上記クライアント100
や文書管理サーバ103等を接続するネットワーク10
4と、から構成されている。
【0014】図1において、文書DB101は、クライ
アント100等で作成された複数の文書を格納したもの
であり、格納される文書は、ワープロ文書や、SGM
L,HTML等の構造化文書等、いかなる種類の文書で
あっても良い。本実施の形態においては、文書DB10
1に格納された文書を管理対象とするが、管理対象とな
る文書は複数のデータベースに分散しているものであっ
ても良い。
【0015】転置ファイル102は、文書DB101中
の複数の文書と、これら複数の文書それぞれから後述す
る方法で抽出した複数の索引語との関係を規定すること
により、ある索引語が各文書それぞれにおいてどの程度
重要な語彙であるかをベクター表現を用いて示したもの
であって、この索引語を用いて該当する文書を検索する
ことができるようにしたものである。
【0016】具体的には、1つの文書を予め定めた複数
のセンテンスからなるサブドキュメント単位に区切り、
サブドキュメントから上記索引語となる名詞句を抽出し
て、抽出した名詞句それぞれについて、サブドキュメン
ト中の出現頻度,文書DB101全体における分布等の
統計情報を求め、求めた名詞句毎の統計情報を用いて各
サブドキュメントをベクター表現に変換する。そして、
変換したサブドキュメントのベクター表現に基づいて、
文書のベクター表現を生成する。転置ファイル102
は、このようにしてベクター表現された文書DB101
中の文書を格納するものである。
【0017】なお、各索引語には、対応する文書中の重
要度に応じた重み付けを行うことができる。また、文書
のベクター表現については、実際の検索を行う際に、サ
ブドキュメントのベクター表現に基づいて生成すること
にしても良い。
【0018】また、クライアント100および文書管理
サーバ103は、パーソナルコンピュータやワークステ
ーション等によって構成される。図2は、クライアント
100のブロック構成図である。クライアント100
は、特定の内容の文書を収集するための条件を記述した
収集条件を登録して管理すると共に、この収集条件を文
書管理サーバ103に出力し、文書管理サーバ103か
ら収集条件に該当する文書のリストを入力して、収集し
た文書の一覧を表示するものである。
【0019】図2において、入力装置200は、キーボ
ードおよびマウス等からなり、特定の内容の文書を収集
するための条件を記述した収集条件を入力すると共に、
入力した収集条件を選択して、該当する文書の一覧の表
示を指定するためのものである。ここで、収集条件は、
収集したい文書の特徴を自然言語で記述した文章や、検
索式、キーワードの集合、収集したい文書の例となる文
書等のいずれであっても良い。収集条件を文書とする場
合には、その文書のファイル名を指定することができ
る。
【0020】収集条件管理部201は、入力装置200
で入力した収集条件をブックマークとして登録して管理
すると共に、入力装置200を介して文書の一覧の表示
が指定されると、指定された収集条件を文書管理サーバ
103に出力して、該当する文書のリストを入力して、
収集した文書の一覧の表示処理を制御するものである。
【0021】文書リスト格納部202は、文書管理サー
バ103から入力した文書のリストを格納しておくもの
である。すなわち、文書のリストを格納しておき、文書
の収集履歴として、過去のリストを表示することができ
るようにするためのものである。
【0022】出力装置203は、CRT等からなり、収
集条件管理部201で登録した収集条件を画面表示する
と共に、文書管理サーバ103から入力した文書のリス
トを表示するものである。また、文書リスト格納部20
2に格納されている過去のリストも表示することができ
る。
【0023】入出力部204は、入力装置200,出力
装置203およびネットワーク104と収集条件管理部
201とのインターフェイスとなるものである。
【0024】また、図3は、文書管理サーバ103の処
理を示す概略ブロック図である。文書管理サーバ103
は、文書DB101中の文書を転置ファイル102に登
録する処理と、ベクトル空間法を利用した検索処理を用
いて、収集条件206に該当する文書を収集する処理を
行うものである。
【0025】文書管理サーバ103において、転置ファ
イル102に登録する処理は、自然言語処理モジュール
300と、データベース・ビルド・コンポーネント30
4とによって行われる。具体的に、自然言語処理モジュ
ール300は、文書DB101から文書を入力し、文書
のフォーマットの認識処理や、品詞情報等を格納した辞
書301および各単語の係り受け等を解析するための文
法辞書302を用いて形態素解析,構文解析,名詞句抽
出等の解析処理を行い、上述したサブドキュメント毎の
名詞句リストを含むドキュメント・セット303を生成
する。データベース・ビルドコンポーネント304は、
自然言語処理モジュール300で生成したドキュメント
・セット303を入力し、入力したドキュメント・セッ
ト303中の各サブドキュメントをベクター表現に変換
すると共に、サブドキュメントのベクター表現に基づい
て、文書のベクター表現を生成して転置ファイル102
に登録する。
【0026】一方、文書を収集する処理は、自然言語処
理モジュール300と、クエリー・ビルド・コンポーネ
ント305と、検索エンジン307とによって行われ
る。具体的に、自然言語処理モジュール300は、クラ
イアント100から収集条件206を入力し、品詞情報
等を格納した辞書301および各単語の係り受け等を解
析するための文法辞書302を用いて形態素解析,構文
解析,名詞句抽出等の解析処理を行い、収集条件206
中の名詞句のリストを含むドキュメント・セット303
を生成する。クエリー・ビルド・コンポーネント305
は、ドキュメント・セット303を入力し、収集条件2
06を構成する各名詞句について、収集条件206中の
出現頻度,文書DB101全体における分布等の統計情
報を求め、求めた統計情報を用いて収集条件206をベ
クター表現に変換したクエリー・ドキュメント306を
生成する。検索エンジン307は、クエリー・ビルド・
コンポーネント305で生成したクエリー・ドキュメン
ト306を入力し、転置ファイル102中の各文書のベ
クトルとクエリー・ドキュメント306のベクトルとを
比較して、クエリー・ドキュメント306との類似度に
応じたスコアを各文書に付与し、所定の閾値を超えるス
コアが付与された文書リスト308を検索結果として出
力する。
【0027】なお、図1においては、文書DB101お
よび転置ファイル102をネットワーク104に単独に
接続した構成を示したが、これらを文書管理サーバ10
3に直接接続する構成としても良い。また、図1におい
ては、本実施の形態の文書管理支援装置をネットワーク
104を介したシステムで構成するように示したが、ク
ライアント100と文書管理サーバ103の処理を1つ
のコンピュータで行うようにすることもできる。
【0028】次に、上述した構成を備えた文書管理支援
装置の動作について、(1)転置ファイルの生成処理,
(2)収集条件の登録処理,(3)文書の収集処理の順
で詳細に説明する。
【0029】(1)転置ファイルの生成処理 図4は、転置ファイルの生成処理を示すフローチャート
である。文書管理サーバ103は、新たな文書が文書D
B101に登録された場合(S401)、この文書を入
力して転置ファイル102に登録するための処理を開始
する(S402)。
【0030】文書管理サーバ103において、自然言語
処理モジュール300は、ステップS402で入力した
文書を解析する処理を行う(S403)。具体的には、
入力した文書がワープロ文書,HTML等の構造化文書
等、いかなるフォーマットの文書であるかを判定する処
理を行う。その後、辞書301および文法辞書302を
用いて形態素解析,係り受け等の構文解析を行い、文書
を複数のサブドキュメントに区分すると共に、区分した
サブドキュメントから名詞句を抽出する等の処理を行
う。
【0031】そして、自然言語処理モジュール300
は、ステップS403における処理の結果に基づいて、
サブドキュメント毎に名詞句リストを生成し、生成した
名詞句リストを含むドキュメント・セット303を生成
する(S404)。
【0032】その後、データベース・ビルド・コンポー
ネント304は、自然言語処理モジュール300で生成
したドキュメント・セット303を入力し、文書のベク
ター表現を生成して転置ファイル102に登録する処理
を行う(S405)。
【0033】具体的には、ドキュメント・セット303
中のサブドキュメントの各名詞句を転置ファイル102
の索引語として、サブドキュメント中の出現頻度,文書
DB101全体における分布等の統計情報を求め、求め
た名詞句毎の統計情報を用いてサブドキュメントをベク
ター表現に変換する。この処理をドキュメント・セット
303中の全てのサブドキュメントについて行い、変換
したサブドキュメントのベクター表現に基づいて、文書
のベクター表現を生成して転置ファイル102に登録す
る。
【0034】(2)収集条件の登録処理 続いて、特定の内容の文書を収集するための基準となる
収集条件を登録する処理について説明する。図5(a)
および図5(b)は、収集条件の登録処理を説明するた
めの説明図である。
【0035】ユーザは、クライアント100の入力装置
200を用いて収集条件管理部201に指示を出し、出
力装置203で画面表示された様子を確認しつつ、収集
条件を登録していく。具体的には、例えば、図5(a)
に示すような収集条件の登録画面を表示させ、収集条件
名500と収集条件206とを入力していく。図5
(a)では、例として、「自然言語処理プロジェク
ト」,「検索処理プロジェクト」,「文書管理プロジェ
クト」に関する収集条件名500および収集条件206
が入力されている。そして、入力装置200を介して登
録が指定されると、収集条件管理部201は、入力され
た収集条件名500および収集条件206を登録する。
【0036】このようにして、収集条件名500および
収集条件206を登録することにより、収集条件の選択
画面の表示を指定すると、図5(b)に示すような収集
条件の選択画面を表示することができる。図5(b)に
は、図5(a)に示した登録画面を用いて登録した収集
条件名500が表示されている。なお、ここでは収集条
件名500を入力して表示することにしたが、収集条件
206を直接画面表示することにしても良い。
【0037】(3)文書の収集処理 次に、上述したようにして登録した収集条件に基づい
て、該当する文書を収集するための処理について説明す
る。図6は文書の収集処理を示すフローチャートであ
る。
【0038】収集条件管理部201は、入力装置200
を介して選択画面の表示要求を入力すると(S60
1)、図5(b)に示した選択画面を出力装置203を
介して画面表示する(S602)。
【0039】そして、図5(b)の選択画面から収集条
件名500のいずれかが選択されると、該当する収集条
件206を文書管理サーバ103に出力する(S60
3)。ここでは、収集条件名500として、「自然言語
処理プロジェクト」が選択されたものとする。
【0040】文書管理サーバ103は、クライアント1
00から収集条件206を入力し、自然言語処理モジュ
ール300において、収集条件206の解析処理を行う
(S604)。具体的には、辞書301および文法辞書
302を用いて形態素解析,係り受け等の構文解析処理
を行う。
【0041】そして、自然言語処理モジュール300
は、ステップS604での解析結果に基づいて、収集条
件206から転置ファイル102中の索引語に対応する
名詞句を抽出し、名詞句からなるドキュメント・セット
303を生成する(S605)。
【0042】続いて、クエリー・ビルド・コンポーネン
ト305は、自然言語処理モジュール300からドキュ
メント・セット303を入力し、入力したドキュメント
・セット303を構成する各名詞句について、収集条件
206中の出現頻度,文書DB101全体における分布
等の統計情報を求め、求めた統計情報を用いてドキュメ
ント・セット303をベクター表現に変換したクエリー
・ドキュメント306を生成する(S606)。
【0043】検索エンジン307は、クエリー・ビルド
・コンポーネント305で生成したクエリー・ドキュメ
ント306を入力し、転置ファイル102中の各文書の
ベクトルとクエリー・ドキュメント306のベクトルを
比較して、クエリー・ドキュメント306との類似度に
応じたスコアを各文書に付与する(S607)。
【0044】なお、類似度に応じたスコアは、各文書と
クエリー・ドキュメント306との類似度を余弦距離に
基づいて表現したものであり、スコアが大きい文書がよ
りクエリー・ドキュメント306と類似していることを
表している。
【0045】そして、検索エンジン307は、予め設定
されたスコアの閾値に基づいて、閾値を超えるスコアが
付与された文書を選択し、選択した文書に基づいて、文
書リスト308を生成して、検索結果として出力する
(S608)。
【0046】図7は、文書リスト308の一例を示す説
明図である。図7に示すように、文書リスト308に
は、クエリー・ドキュメント306との類似度に応じた
スコアのランキング,文書名,作成日等が表示される。
本実施の形態においては、ステップS603で選択され
た収集条件名500が「自然言語処理プロジェクト」で
あるため、自然言語処理に関して記述した文書が収集さ
れている。
【0047】クライアント100は、文書管理サーバ1
03から文書リスト308を入力し、入力した文書リス
ト308に基づいて、上位のランキングの文書から順
に、文書名を一覧表示する(S609)。
【0048】図8は、収集した文書を一覧表示した様子
の一例を示す説明図である。ユーザは、図8に示した文
書の一覧から所望の文書を選択することにより、選択し
た文書を画面表示することができる。
【0049】また、文書管理サーバ103から入力した
文書リスト308を、クライアント100の文書リスト
格納部202に格納することにより、収集条件名500
を選択する選択画面に過去に収集した履歴を表示するこ
とができるようにする。図9は、文書の収集履歴を表示
した選択画面の一例を示す説明図である。ここでは、文
書を収集した日付を表示することにしている。そして、
この日付を指定することにより、過去に収集した文書の
一覧を表示することができる。したがって、この履歴を
参照することにより、例えば、自然言語処理プロジェク
トの進捗状況の把握に利用することができる。
【0050】このように、本実施の形態の文書管理支援
装置によれば、特定の内容の文書を収集するための収集
条件206を設定し、検索技術を用いて収集条件206
に該当する文書を必要に応じて収集できるようにしたた
め、所望の文書を簡単に収集することができ、文書管理
を容易にすることができる。また、収集条件206は登
録しておくことができるため、同一の条件で必要な文書
をいつでも収集することができる。また、文書を収集す
る条件を変更したい場合には、収集条件206を変更す
るのみでよく、ディレクトリを変更する場合のような面
倒な作業は不要である。
【0051】なお、本実施の形態の文書管理支援装置に
おいては、登録した収集条件206について、文書を収
集する処理を行う毎にベクター表現に変換する処理が必
要となるが、収集条件管理部201に収集条件を入力し
た際に、入力した収集条件をベクター表現に変換して登
録することにして、ベクター表現に変換する処理を1回
で済むようにすることができる。
【0052】また、収集した文書において、ユーザが収
集結果としてふさわしいと思う文書やふさわしくないと
思う文書については、その結果を文書管理サーバ103
にフィードバックすることができる。すなわち、ユーザ
は、収集結果としてふさわしいと思う文書に対して、正
の重み、例えば「+」を指定することができ、収集結果
としてふさわしくないと思う文書に対して負の重み、例
えば「−」を指定することができる。その結果、入力し
た重みが正の指定である場合には、転置ファイル102
中の該当する文書の重みが強化され、入力した重みが負
の指定である場合には、文書の重みが弱められる。
【0053】また、詳細な説明は省略するが、本実施の
形態の文書管理支援装置は、ワードプロセッサ等のアプ
リケーションプログラムで文書を読み出す際にも適用可
能であることは明らかである。
【0054】さらに、本実施の形態で説明した文書管理
支援装置は、予め用意されたプログラムをコンピュータ
やワークステーションで実行することによって実現され
る。このプログラムは、ハードディスク,フロッピーデ
ィスク,CD−ROM,MO,DVD等のコンピュータ
で読み取り可能な記録媒体に記録され、コンピュータに
よって記録媒体から読み出されることによって実行され
る。また、このプログラムは、上記記録媒体を介して、
またはネットワークを介して配布することができる。
【0055】
【発明の効果】以上説明したように、本発明の文書管理
支援装置(請求項1)によれば、管理対象となる文書を
ベクター表現に変換して格納する文書格納手段と、特定
の内容の文書を収集する条件を記述した収集条件を入力
する入力手段と、入力手段を介して入力された収集条件
を登録して管理する収集条件管理手段と、収集条件管理
手段から収集条件を読み出して画面表示する収集条件表
示手段と、収集条件表示手段で画面表示した収集条件を
選択する選択手段と、選択手段を介して選択された収集
条件をベクター表現に変換する収集条件変換手段と、収
集条件変換手段で変換した収集条件のベクター表現と文
書格納手段に格納された文書のベクター表現との類似度
を求め、求めた類似度が所定の閾値を超える文書を選択
し、選択した文書を類似度に応じて配列した文書リスト
を生成して出力する文書リスト生成手段と、文書リスト
生成手段で生成した文書リストを画面表示する文書リス
ト表示手段と、を備えたため、所望の文書を簡単に収集
することができ、文書管理を容易にすることができる。
また、収集条件は登録しておくことができるため、同一
の条件で必要な文書をいつでも収集することができる。
また、文書を収集する条件を変更したい場合には、収集
条件を変更するのみでよく、ディレクトリを変更する場
合のような面倒な作業を不要とすることができる。
【0056】また、本発明の文書管理支援装置(請求項
2)によれば、請求項1に記載の文書管理支援装置にお
いて、さらに、文書リスト表示手段で画面表示した文書
リストを格納する文書リスト格納手段と、文書リスト格
納手段に格納されている文書リストを文書の収集履歴と
して画面表示する履歴表示手段と、を備えたため、収集
履歴を参照することにより、特定の内容に関し、現在と
過去の変化の様子を知ることができる。
【0057】さらに、本発明のコンピュータ読み取り可
能な記録媒体(請求項3)によれば、請求項1または2
に記載の文書管理支援装置の各手段としてコンピュータ
を機能させるためのプログラムを記録したため、このプ
ログラムをコンピュータに実行させることにより、特定
の内容の文書を収集するための収集条件を登録してお
き、検索技術を用いて収集条件に該当する文書を必要に
応じて収集できるようにした文書管理支援装置を実現す
ることができる。
【図面の簡単な説明】
【図1】本実施の形態の文書管理支援装置のシステム構
成図である。
【図2】図1に示したクライアントのブロック構成図で
ある。
【図3】図1に示した文書管理サーバの処理を示す概略
ブロック図である。
【図4】本実施の形態の文書管理支援装置において、転
置ファイルの生成処理を示すフローチャートである。
【図5】本実施の形態の文書管理支援装置において、収
集条件の登録処理を説明するための説明図である。
【図6】本実施の形態の文書管理支援装置において、文
書の収集処理を示すフローチャートである。
【図7】本実施の形態の文書管理支援装置において、文
書リストの一例を示す説明図である。
【図8】本実施の形態の文書管理支援装置において、収
集した文書を一覧表示した様子の一例を示す説明図であ
る。
【図9】本実施の形態の文書管理支援装置において、文
書の収集履歴を表示した選択画面の一例を示す説明図で
ある。
【符号の説明】
100 クライアント 101 文書DB 102 転置ファイル 103 文書管理サーバ 104 ネットワーク 200 入力装置 201 収集条件管理部 202 文書リスト格納部 203 出力装置 204 入出力部 206 収集条件 300 自然言語処理モジュール 301 辞書 302 文法辞書 303 ドキュメント・セット 304 データベース・ビルド・コンポーネント 305 クエリー・ビルド・コンポーネント 306 クエリー・ドキュメント 307 検索エンジン 308 文書リスト 500 収集条件名

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ベクトル空間法を用いた検索処理を利用
    して、文書を管理する文書管理支援装置であって、 管理対象となる文書をベクター表現に変換して格納する
    文書格納手段と、 特定の内容の文書を収集する条件を記述した収集条件を
    入力する入力手段と、 前記入力手段を介して入力された収集条件を登録して管
    理する収集条件管理手段と、 前記収集条件管理手段から前記収集条件を読み出して画
    面表示する収集条件表示手段と、 前記収集条件表示手段で画面表示した収集条件を選択す
    る選択手段と、 前記選択手段を介して選択された収集条件をベクター表
    現に変換する収集条件変換手段と、 前記収集条件変換手段で変換した収集条件のベクター表
    現と前記文書格納手段に格納された前記文書のベクター
    表現との類似度を求め、求めた類似度が所定の閾値を超
    える文書を選択し、選択した文書を類似度に応じて配列
    した文書リストを生成して出力する文書リスト生成手段
    と、 前記文書リスト生成手段で生成した文書リストを画面表
    示する文書リスト表示手段と、 を備えたことを特徴とする文書管理支援装置。
  2. 【請求項2】 さらに、前記文書リスト表示手段で画面
    表示した文書リストを格納する文書リスト格納手段と、 前記文書リスト格納手段に格納されている文書リストを
    文書の収集履歴として画面表示する履歴表示手段と、 を備えたことを特徴とする請求項1に記載の文書管理支
    援装置。
  3. 【請求項3】 前記請求項1または2に記載の文書管理
    支援装置の各手段としてコンピュータを機能させるため
    のプログラムを記録したことを特徴とするコンピュータ
    読み取り可能な記録媒体。
JP9200627A 1997-07-25 1997-07-25 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH1145260A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9200627A JPH1145260A (ja) 1997-07-25 1997-07-25 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9200627A JPH1145260A (ja) 1997-07-25 1997-07-25 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH1145260A true JPH1145260A (ja) 1999-02-16

Family

ID=16427533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9200627A Pending JPH1145260A (ja) 1997-07-25 1997-07-25 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH1145260A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004171215A (ja) * 2002-11-19 2004-06-17 Yamatake Corp 文書管理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004171215A (ja) * 2002-11-19 2004-06-17 Yamatake Corp 文書管理装置

Similar Documents

Publication Publication Date Title
JP3691844B2 (ja) 文書処理方法
JP3181548B2 (ja) 情報検索装置及び情報検索方法
US6442540B2 (en) Information retrieval apparatus and information retrieval method
JP3577819B2 (ja) 情報探索装置及び情報探索方法
US20050203900A1 (en) Associative retrieval system and associative retrieval method
Capstick et al. A system for supporting cross-lingual information retrieval
KR20020058639A (ko) 엑스엠엘 문서 검색 시스템 및 그 방법
JP4091146B2 (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11224256A (ja) 情報検索方法および情報検索プログラムを記録した記録媒体
JP2001290843A (ja) 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体
JPH0484271A (ja) 文書内情報検索装置
JP3178421B2 (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145284A (ja) プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145257A (ja) Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145268A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145260A (ja) 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145256A (ja) 文書管理支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06318202A (ja) 文書記憶方式及び文書管理方式並びに文書表示方式
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4497337B2 (ja) 概念検索装置およびコンピュータプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080115