JP3851712B2 - Document management system and computer-readable recording medium storing a program for causing a computer to function as the system - Google Patents

Document management system and computer-readable recording medium storing a program for causing a computer to function as the system Download PDF

Info

Publication number
JP3851712B2
JP3851712B2 JP20203697A JP20203697A JP3851712B2 JP 3851712 B2 JP3851712 B2 JP 3851712B2 JP 20203697 A JP20203697 A JP 20203697A JP 20203697 A JP20203697 A JP 20203697A JP 3851712 B2 JP3851712 B2 JP 3851712B2
Authority
JP
Japan
Prior art keywords
document
changed
management system
computer
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20203697A
Other languages
Japanese (ja)
Other versions
JPH1145238A (en
Inventor
澄男 藤田
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP20203697A priority Critical patent/JP3851712B2/en
Publication of JPH1145238A publication Critical patent/JPH1145238A/en
Application granted granted Critical
Publication of JP3851712B2 publication Critical patent/JP3851712B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、変更した文書を保存する際に、該変更した文書によって影響を受ける文書の関連記述に相当する部分のセンテンスを自動的に提示可能な文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
コンピュータの発達に伴って、紙を媒体として記録・保存されていた文書についても、電子化された情報として取り扱うことが一般的となり、大量の電子化された文書がデータベースに蓄積されることとなっている。
【0003】
ところで、大量の電子化された文書が蓄積されていくに従って、大量の文書の中から所望の文書を容易に探し出すことができる検索技術が重要となってくる。特に、誰もがコンピュータを用いて作業を行う今日にあっては、特殊な手法を用いることなく、コンピュータの初心者であっても簡単に所望の文書を検索できるような検索システムを構築することが重要なポイントとなる。
【0004】
また、このように大量に電子化された文書を、情報資産・情報資源と捕らえた場合、これらの情報を如何に有効かつ効率的に管理できるかが重要となってきている。
【0005】
【発明が解決しようとする課題】
ところで、従来の技術によれば、大量に電子化された文書の中から、任意の文書に対して変更を行った際に、その変更した文書によって影響を受ける文書の関連記述に相当する部分のセンテンスを捜し出して自動的に提示するようなシステムは提供されていなかった。
【0006】
本発明は上記に鑑みてなされたものであって、変更した文書を保存する際に、該変更した文書によって影響を受ける文書の関連記述に相当する部分のセンテンスを自動的に提示することにより、ユーザーの作業性・利便性の向上を図ることを目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するため、本発明の文書管理システムは、文書の作成および変更を行う文書作成手段と、前記文書作成手段で作成または変更した文書を保存する文書保存手段とを備えた文書管理システムにおいて、前記変更した文書を前記文書保存手段に保存する際に、前記変更した文書と変更前の文書の差分を抽出する文書差分抽出手段と、前記文書差分抽出手段で抽出した差分を検索条件として、前記文書保存手段に保存されている文書の中から関連記述を有する文書を検索する検索手段と、前記検索手段で検索した文書の関連記述に相当する部分のセンテンスを、前記変更した文書によって影響を受ける影響部分として提示する影響部分提示手段と、を備えたものである。
【0008】
また、本発明の文書管理システムは、上記の文書管理システムにおいて、前記検索手段が、ベクトル空間法を用いた検索を行い、前記文書差分抽出手段が、前記変更した文書のベクター表現と前記変更前の文書のベクター表現とを比較して、削除された名詞句および新たに追加された名詞句差分を抽出するものである。
【0009】
また、本発明の文書管理システムは、上記の文書管理システムにおいて、さらに、前記変更した文書を前記文書保存手段に保存する際に、前記文書差分抽出手段、検索手段および影響部分提示手段を介して前記影響部分の提示を行うか否かを指定する指定手段を備えたものである。
【0010】
また、本発明の文書管理システムは、上記の文書管理システムにおいて、前記指定手段が、前記影響部分の提示を行うことを指定した際に、前記文書保存手段に保存されている文書から前記検索手段で検索対象とする検索対象文書または検索範囲を指定可能であるものである。
【0011】
さらに、本発明のコンピュータ読み取り可能な記録媒体は、上記のいずれか一つの文書管理システムとしてコンピュータを機能させるためのプログラムを記録したものである。
【0012】
【発明の実施の形態】
以下、本発明の文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体の一実施の形態について、添付の図面を参照しつつ詳細に説明する。
【0013】
図1は、本実施の形態の文書管理システムのシステム構成図である。図1において、100はCPUを、101はROMを、102はRAMを、103は文書管理を行うための文書管理ソフト104,文書を作成するための文書作成ソフト105および文書作成ソフト105で作成しまたは変更した文書を保存するハードディスク装置(請求項1の文書保存手段に該当する)を、106はキーボードやマウス等の入力装置を、107はCRT等からなるディスプレイを、108は上記各部を接続するバスをそれぞれ示している。なお、本実施の形態においては、保存文書の格納先をハードディスク装置103とするが、これに限定するものではない。
【0014】
図2は、文書管理ソフト104の処理を示す概略ブロック図である。文書管理ソフト104は、ベクトル空間法による検索機能を利用して文書を管理するものであって、(1)ベクトル空間法による検索機能を利用するためにハードディスク装置103に保存されている保存文書211を転置ファイル203に登録する処理と、(2)文書作成ソフト105で変更した変更文書206をハードディスク装置103に保存する際に、変更文書206と変更前の保存文書211との差分を抽出する文書差分抽出処理と、(3)文書差分抽出処理で抽出した差分を検索条件212として、ハードディスク装置103に保存されている保存文書211の中から関連記述を有する保存文書211を検索する検索処理と、(4)検索処理で検索した保存文書211の関連記述に相当する部分のセンテンスを、変更した変更文書206によって影響を受ける影響部分として提示する影響部分提示処理と、を行うものである。
【0015】
(1)文書を転置ファイルに登録する処理
文書管理ソフト104において、文書を転置ファイル203に登録する処理は、自然言語処理モジュール200およびデータベース・ビルド・コンポーネント205とによって行われる。なお、転置ファイル203はハードディスク装置103内に生成される。
【0016】
具体的に、自然言語処理モジュール200は、ハードディスク装置103に保存されている保存文書211を入力し、入力した保存文書211について、文書のフォーマットの認識処理や、品詞情報等を格納した辞書201および各単語の係り受け等を解析するための文法辞書202を用いて形態素解析,構文解析,名詞句抽出等の解析処理を行う。そして、解析処理の結果に基づいて、保存文書211を複数のセンテンスからなるサブドキュメント単位に区切り、サブドキュメントから名詞句を抽出してサブドキュメント毎の名詞句リストを含むドキュメント・セット204を生成する。
【0017】
データベース・ビルド・コンポーネント205は、自然言語処理モジュール200から入力したドキュメント・セット204中の各名詞句について、サブドキュメント中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた名詞句毎の統計情報を用いて各サブドキュメントをベクター表現に変換する。そして、このサブドキュメント毎のベクター表現に基づいて、保存文書211のベクター表現を生成して転置ファイル203に登録する。
【0018】
(2)文書差分抽出処理
文書管理ソフト104において、文書作成ソフト105で変更した変更文書206をハードディスク装置103に保存する際に、変更文書206と変更前の保存文書211との差分を抽出する文書差分抽出処理は、自然言語処理モジュール200,クエリー・ビルド・コンポーネント207および検索エンジン209(これらは請求項1の文書差分抽出手段に該当する)を用いて行われる。
【0019】
具体的に、自然言語処理モジュール200は、文書作成ソフト105で変更した変更文書206を入力し、上述した解析処理を行って、ドキュメント・セット204を生成する。
【0020】
クエリー・ビルド・コンポーネント207は、自然言語処理モジュール200から入力したドキュメント・セット204を構成する各名詞句について、変更文書206(ドキュメント・セット204)中の出現頻度,転置ファイル203全体における分布等の統計情報を求め、求めた統計情報を用いて変更文書206をベクター表現に変換したクエリー・ドキュメント208を生成する。
【0021】
検索エンジン209(例えば、CLARITECH社のCLARIT等)は、クエリー・ビルド・コンポーネント207で生成したクエリー・ドキュメント208を入力すると共に、変更文書206に対応する変更前の保存文書211のベクター表現を転置ファイル203から入力する。そして、クエリー・ドキュメント208(変更文書206のベクター表現)と保存文書211のベクター表現とを比較して、変更した文書において削除された名詞句および新たに追加された名詞句からなる前記変更した文書と変更前の文書の差分を抽出する。
【0022】
(3)検索処理
また、文書管理ソフト104において、差分抽出処理で抽出した差分を検索条件212としてハードディスク装置103に保存されている保存文書211の中から関連記述を有する保存文書211を検索する検索処理は、自然言語処理モジュール200,クエリー・ビルド・コンポーネント207および検索エンジン209(これらは請求項1の検索手段に該当する)を用いて行われる。
【0023】
具体的に、自然言語処理モジュール200は、検索エンジン209から差分として抽出された削除された名詞句および新たに追加された名詞句を検索条件212として入力し、これらの名詞句からなるドキュメント・セット204を生成する。
【0024】
クエリー・ビルド・コンポーネント207は、上述したようにして自然言語処理モジュール200から入力したドキュメント・セット204をベクター表現に変換したクエリー・ドキュメント208(検索条件212のベクター表現)を生成する。
【0025】
検索エンジン209は、クエリー・ビルド・コンポーネント207で生成したクエリー・ドキュメント208を入力し、転置ファイル203中の各保存文書211のベクター表現とクエリー・ドキュメント208(検索条件212のベクター表現)とを比較して、上記文書差分抽出処理で変更文書206および対応する保存文書211から得た差分に関連する記述を有する保存文書211を検索する。
【0026】
(4)影響部分提示処理
さらに、文書管理ソフトにおいて、検索処理で検索した保存文書211の関連記述に相当する部分のセンテンスを、変更した変更文書206によって影響を受ける影響部分として提示する影響部分提示処理は、影響部分提示モジュール210(請求項1の影響部分提示手段に該当する)を用いて行われる。
【0027】
具体的に、影響部分提示モジュール210は、文書差分抽出処理で得た差分に関連する記述を有する保存文書211の検索結果を検索エンジン209から入力し、関連する記述に相当する部分のセンテンスを該当する保存文書211から抽出し、ディスプレイ107に画面表示する。
【0028】
次に、本実施の形態の文書管理システムの動作について、図3に示すフローチャートを用いて詳細に説明する。
【0029】
文書管理ソフト104は、文書作成ソフト105において文書を保存する指定があると(S301)、指定された保存処理が文書の更新であるか否かを判定する(S302)。
【0030】
ステップS302において、指定された保存処理が新規文書の保存等である場合には処理を終了する。一方、指定された保存処理が文書の更新である場合には、自然言語処理モジュール200,クエリー・ビルド・コンポーネント208および検索エンジン209を用いて文書差分抽出処理を行う(S303)。すなわち、文書作成ソフト105で内容を変更した変更文書206と変更前の保存文書211との差分を抽出する処理を行う。
【0031】
ステップS303で差分を抽出すると、抽出した差分を検索条件212とし、自然言語処理モジュール200,クエリー・ビルド・コンポーネント207および検索エンジン209を用いて、ハードディスク装置103に保存されている保存文書211の中から関連記述を有する保存文書211を検索する検索処理を行う(S304)。
【0032】
そして、ステップS304において関連記述を有する保存文書が検索されなかった場合、変更文書206の変更による影響を受ける保存文書211は存在しないことになるため、そのまま処理を終了する。一方、関連記述を有する保存文書が検索された場合、影響部分提示モジュール210を用いて影響部分の提示処理を行う(S306)。
【0033】
影響部分を表示する際には、該当するセンテンスを表示するのみならず、保存文書211全体を表示し、影響部分をハイライト表示する等、様々な表示方法を用いて影響部分をディスプレイ107に画面表示することができる。
【0034】
文書管理システムのユーザは、必要に応じて影響部分の記述を変更することができる。例えば、本実施の形態の文書管理システムを法律関係のデータベースに適用したとする。法律改正があったような場合に、特定の文書の記述を改正に合わせて修正して保存すると、文書管理システムが他の文書の改正箇所をユーザに提示してくれるため、データベース中の文書を法律改正に合わせて容易に修正することができる。
【0035】
なお、変更文書206をハードディスク装置103に保存する際に、入力装置106を介して、上述した文書差分抽出処理,検索処理および影響部分提示処理を行って影響部分の提示を行うか否かを書管理ソフト104に指定することができるようにしても良い。このような構成とすることにより、必要に応じて影響部分の提示を指定し、利用することができる。
【0036】
また、入力装置106を介して影響部分の提示を行うことを指定した際に、ハードディスク装置103に保存されている保存文書211から検索処理で検索対象とする検索対象文書または検索範囲を指定することができるようにしても良い。このような構成とすることにより、利用者の意図する目的に沿って適切に影響部分を提示することができる。
【0037】
このように、本実施の形態の文書管理システムによれば、変更文書206を保存する際に、変更文書206によって影響を受ける保存文書211の関連記述に相当する部分のセンテンスを自動的に提示することにしたため、ユーザーの作業性・利便性の向上を図ることができる。
【0038】
なお、本実施の形態においては、文書管理システムを図1に示したように1台のコンピュータで構成することにしたが、文書管理ソフト104をサーバに設けることにより、クライアント・サーバシステム全体で本実施の形態の文書管理システムを構築するこができる。このように、本実施の形態の文書管理システムは、自由に設計・変更可能なものである。
【0039】
また、本実施の形態においては、ベクトル空間法によって検索処理を行うことにしたが、文章からキーワードを抽出することができるような場合には、ブーリアン検索による検索処理を用いても良い。
【0040】
さらに、本実施の形態で説明した文書管理システムは、予め用意されたプログラム(文書管理ソフト104)を図1に示したパーソナルコンピュータやワークステーション等のコンピュータで実行することによって実現される。このプログラムは、ハードディスク,フロッピーディスク,CD−ROM,MO,DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、このプログラムは、上記記録媒体を介して、またはネットワークを介して配布することができる。
【0041】
【発明の効果】
以上説明したように、本発明の文書管理システムによれば、文書の作成および変更を行う文書作成手段と、文書作成手段で作成または変更した文書を保存する文書保存手段とを備えた文書管理システムにおいて、変更した文書を文書保存手段に保存する際に、変更した文書と変更前の文書の差分を抽出する文書差分抽出手段と、文書差分抽出手段で抽出した差分を検索条件として、文書保存手段に保存されている文書の中から関連記述を有する文書を検索する検索手段と、検索手段で検索した文書の関連記述に相当する部分のセンテンスを、変更した文書によって影響を受ける影響部分として提示する影響部分提示手段と、を備えたため、変更した文書を保存する際に、該変更した文書によって影響を受ける文書の関連記述に相当する部分のセンテンスを自動的に提示することにより、ユーザーの作業性・利便性の向上を図ることができる。
【0042】
また、本発明の文書管理システムによれば、上記の文書管理システムにおいて、検索手段は、ベクトル空間法を用いた検索を行い、文書差分抽出手段が、変更した文書のベクター表現と変更前の文書のベクター表現とを比較して、削除された名詞句および新たに追加された名詞句差分を抽出するため、差分の抽出を効率的に行うことができると共に、変更した文書によって影響を受ける文書の関連記述に相当する部分のセンテンスを的確に検索することできる。
【0043】
また、本発明の文書管理システムによれば、上記の文書管理システムにおいて、さらに、変更した文書を文書保存手段に保存する際に、文書差分抽出手段、検索手段および影響部分提示手段を介して影響部分の提示を行うか否かを指定する指定手段を備えたため、必要に応じて影響部分の提示を指定し、利用することができ、さらに作業性・利便性が向上する。
【0044】
また、本発明の文書管理システムによれば、上記の文書管理システムにおいて、指定手段は、影響部分の提示を行うことを指定した際に、文書保存手段に保存されている文書から検索手段で検索対象とする検索対象文書または検索範囲を指定可能であるため、利用者の意図する目的に沿って適切に影響部分を提示することができる。
【0045】
さらに、本発明のコンピュータ読み取り可能な記録媒体によれば、上記のいずれか一つの文書管理システムとしてコンピュータを機能させるためのプログラムを記録したため、このプログラムをコンピュータに実行させることにより、変更した文書を保存する際に、該変更した文書によって影響を受ける文書の関連記述に相当する部分のセンテンスを自動的に提示し、ユーザーの作業性・利便性の向上を図ることができる。
【図面の簡単な説明】
【図1】本実施の形態の文書管理システムのシステム構成図である。
【図2】本実施の形態の文書管理システムにおいて、文書管理ソフトの処理を示す概略ブロック図である。
【図3】本実施の形態の文書管理システムの動作を示すフローチャートである。
【符号の説明】
100 CPU
101 ROM
102 RAM
103 ハードディスク装置
104 文書管理ソフト
105 文書作成ソフト
106 入力装置
107 ディスプレイ
108 バス
200 自然言語処理モジュール
201 辞書
202 文法辞書
203 転置ファイル
204 ドキュメント・セット
205 データベース・ビルド・コンポーネント
206 変更文書
207 クエリー・ビルド・コンポーネント
208 クエリー・ドキュメント
209 検索エンジン
210 影響部分提示モジュール
211 保存文書
212 検索条件
[0001]
BACKGROUND OF THE INVENTION
The present invention provides a document management system capable of automatically presenting a sentence corresponding to a related description of a document affected by the changed document when the changed document is stored, and a computer functioning as the system. The present invention relates to a computer-readable recording medium on which the program is recorded.
[0002]
[Prior art]
With the development of computers, documents that have been recorded and stored on paper as a medium are generally handled as digitized information, and a large amount of digitized documents will be accumulated in the database. ing.
[0003]
By the way, as a large amount of electronic documents are accumulated, a search technique that can easily find a desired document from a large amount of documents becomes important. In particular, today, when everyone works using a computer, it is possible to construct a search system that allows a beginner of a computer to easily search for a desired document without using a special technique. It becomes an important point.
[0004]
In addition, when such a large amount of digitized documents are regarded as information assets and information resources, it is important how effectively and efficiently these pieces of information can be managed.
[0005]
[Problems to be solved by the invention]
By the way, according to the conventional technology, when an arbitrary document is changed from among a large amount of digitized documents, a part corresponding to a related description of a document affected by the changed document is displayed. No system has been provided that searches for sentences and automatically presents them.
[0006]
The present invention has been made in view of the above, and when storing a changed document, by automatically presenting a sentence corresponding to a related description of a document affected by the changed document, The purpose is to improve user workability and convenience.
[0007]
[Means for Solving the Problems]
In order to achieve the above object, a document management system of the present invention includes a document creation unit that creates and changes a document, and a document storage unit that saves a document created or changed by the document creation unit. In this case, when storing the changed document in the document storage unit, a document difference extraction unit that extracts a difference between the changed document and a document before the change, and a difference extracted by the document difference extraction unit is used as a search condition. A search means for searching for a document having a related description from documents stored in the document storage means, and a sentence corresponding to the related description of the document searched by the search means is affected by the changed document. And an affected part presenting means for presenting as an affected part.
[0008]
The document management system of the present invention, in the above document management system, said search means performs the search using the vector space method, the document difference extraction means, the pre-change and vector representations of the documents the change by comparing the vector representation of the document, and extracts the difference between the noun phrase and newly added noun phrases that were deleted.
[0009]
The document management system of the present invention, in the above document management system, further, when saving documents the change in the document storage means, the document difference extraction means, via the search means and the impact portion presenting means A designation means for designating whether or not to present the affected part is provided.
[0010]
In the document management system of the present invention , in the above document management system, when the designating unit designates that the affected part is to be presented, the search unit is searched from the document stored in the document storage unit. It is possible to specify a search target document or a search range as a search target.
[0011]
Furthermore, a computer-readable recording medium of the present invention records a program for causing a computer to function as any one of the document management systems described above .
[0012]
DETAILED DESCRIPTION OF THE INVENTION
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, an embodiment of a document management system of the present invention and a computer-readable recording medium that records a program for causing a computer to function as the system will be described in detail with reference to the accompanying drawings.
[0013]
FIG. 1 is a system configuration diagram of a document management system according to the present embodiment. In FIG. 1, reference numeral 100 denotes a CPU, 101 denotes a ROM, 102 denotes a RAM, 103 denotes document management software 104 for document management, document creation software 105 for creating a document, and document creation software 105. Alternatively, a hard disk device (corresponding to the document storage means of claim 1) is stored, 106 is an input device such as a keyboard or mouse, 107 is a display such as a CRT, and 108 is connected to each of the above components. Each bus is shown. In the present embodiment, the storage destination of the stored document is the hard disk device 103, but is not limited to this.
[0014]
FIG. 2 is a schematic block diagram showing processing of the document management software 104. The document management software 104 manages documents using a search function based on a vector space method. (1) A stored document 211 stored in the hard disk device 103 in order to use a search function based on a vector space method. And (2) a document for extracting a difference between the changed document 206 and the saved document 211 before the change when the changed document 206 changed by the document creation software 105 is saved in the hard disk device 103. A difference extraction process; and (3) a search process for searching the saved document 211 having a related description from the saved documents 211 saved in the hard disk device 103, using the difference extracted in the document difference extraction process as a search condition 212; (4) Changed sentence in which the sentence corresponding to the related description of the saved document 211 searched in the search process is changed. The impact portion presenting process of presenting as affecting part affected by 206 and performs.
[0015]
(1) Processing for registering a document in a transposed file In the document management software 104, processing for registering a document in the transposed file 203 is performed by the natural language processing module 200 and the database build component 205. Note that the transposed file 203 is generated in the hard disk device 103.
[0016]
Specifically, the natural language processing module 200 inputs a stored document 211 stored in the hard disk device 103, and for the input stored document 211, a dictionary 201 that stores document format recognition processing, part of speech information, and the like. Analysis processing such as morphological analysis, syntax analysis, and noun phrase extraction is performed using the grammar dictionary 202 for analyzing the dependency of each word. Based on the result of the analysis processing, the saved document 211 is divided into sub-document units composed of a plurality of sentences, noun phrases are extracted from the sub-documents, and a document set 204 including a noun phrase list for each sub-document is generated. .
[0017]
For each noun phrase in the document set 204 input from the natural language processing module 200, the database build component 205 obtains statistical information such as the appearance frequency in the sub-document, the distribution in the entire document DB 101, and the obtained noun phrase. Each sub-document is converted into a vector representation using statistical information for each. Based on the vector representation for each sub-document, a vector representation of the saved document 211 is generated and registered in the transposed file 203.
[0018]
(2) Document difference extraction processing When the document management software 104 saves the changed document 206 changed by the document creation software 105 to the hard disk device 103, a document for extracting the difference between the changed document 206 and the saved document 211 before the change. The difference extraction processing is performed using the natural language processing module 200, the query build component 207, and the search engine 209 (these correspond to the document difference extraction means of claim 1).
[0019]
Specifically, the natural language processing module 200 receives the changed document 206 changed by the document creation software 105, performs the above-described analysis processing, and generates a document set 204.
[0020]
The query build component 207, for each noun phrase constituting the document set 204 input from the natural language processing module 200, the appearance frequency in the changed document 206 (document set 204), the distribution in the entire transposed file 203, etc. Statistical information is obtained, and a query document 208 is generated by converting the changed document 206 into a vector expression using the obtained statistical information.
[0021]
A search engine 209 (for example, CLARITECH's CLARIT, etc.) inputs the query document 208 generated by the query build component 207 and transposes the vector representation of the saved document 211 before the change corresponding to the changed document 206 into a transposed file. Input from 203. Then, the query document 208 (the vector expression of the changed document 206) and the vector expression of the saved document 211 are compared, and the changed document including the noun phrase deleted and the newly added noun phrase in the changed document. And the difference between the documents before the change .
[0022]
(3) Retrieval processing Further, the document management software 104 retrieves the stored document 211 having the related description from the stored documents 211 stored in the hard disk device 103 using the difference extracted by the difference extraction processing as the search condition 212. The processing is performed using the natural language processing module 200, the query build component 207, and the search engine 209 (these correspond to the search means of claim 1).
[0023]
Specifically, the natural language processing module 200 inputs a deleted noun phrase extracted as a difference from the search engine 209 and a newly added noun phrase as the search condition 212, and a document set including these noun phrases 204 is generated.
[0024]
The query build component 207 generates a query document 208 (vector expression of the search condition 212) obtained by converting the document set 204 input from the natural language processing module 200 into a vector expression as described above.
[0025]
The search engine 209 inputs the query document 208 generated by the query build component 207, and compares the vector expression of each saved document 211 in the transposed file 203 with the query document 208 (vector expression of the search condition 212). Then, the saved document 211 having a description related to the difference obtained from the changed document 206 and the corresponding saved document 211 in the document difference extraction process is searched.
[0026]
(4) Affected part presentation processing Further, in the document management software, an affected part presentation that presents a sentence corresponding to the related description of the saved document 211 searched by the search process as an affected part affected by the changed changed document 206. The processing is performed by using an affected part presentation module 210 (corresponding to the affected part presenting means of claim 1).
[0027]
Specifically, the affected part presentation module 210 inputs a search result of the saved document 211 having a description related to the difference obtained by the document difference extraction process from the search engine 209, and applies the sentence of the part corresponding to the related description. Is extracted from the stored document 211 to be displayed and displayed on the display 107.
[0028]
Next, the operation of the document management system of this embodiment will be described in detail using the flowchart shown in FIG.
[0029]
When there is an instruction to save the document in the document creation software 105 (S301), the document management software 104 determines whether the designated saving process is a document update (S302).
[0030]
If it is determined in step S302 that the designated saving process is saving a new document, the process ends. On the other hand, if the designated saving process is a document update, a document difference extraction process is performed using the natural language processing module 200, the query build component 208, and the search engine 209 (S303). That is, a process of extracting a difference between the changed document 206 whose contents are changed by the document creation software 105 and the saved document 211 before the change is performed.
[0031]
When the difference is extracted in step S 303, the extracted difference is used as the search condition 212, and the stored document 211 stored in the hard disk device 103 is stored using the natural language processing module 200, the query build component 207, and the search engine 209. A search process for searching the stored document 211 having the related description is performed (S304).
[0032]
If no stored document having a related description is found in step S304, there is no stored document 211 that is affected by the change of the changed document 206, and thus the process ends. On the other hand, when a stored document having a related description is searched, the affected part presentation process is performed using the affected part presentation module 210 (S306).
[0033]
When displaying the affected part, not only the corresponding sentence but also the entire stored document 211 is displayed, and the affected part is highlighted on the display 107 by using various display methods such as highlighting the affected part. Can be displayed.
[0034]
The user of the document management system can change the description of the affected part as necessary. For example, assume that the document management system of the present embodiment is applied to a legal database. If there is a legal revision, and the description of a specific document is modified and saved in accordance with the revision, the document management system will present the revisions of other documents to the user. It can be easily amended according to the law revision.
[0035]
When the changed document 206 is stored in the hard disk device 103, whether or not the affected part is presented by performing the above-described document difference extraction process, search process, and affected part presentation process via the input device 106 is written. The management software 104 may be designated. By adopting such a configuration, it is possible to designate and use the presentation of the affected part as necessary.
[0036]
In addition, when it is specified that the affected part is to be presented via the input device 106, a search target document or search range to be searched by the search process is specified from the saved document 211 stored in the hard disk device 103. You may be able to. By adopting such a configuration, it is possible to present the affected part appropriately in accordance with the purpose intended by the user.
[0037]
As described above, according to the document management system of the present embodiment, when the changed document 206 is saved, the sentence corresponding to the related description of the saved document 211 affected by the changed document 206 is automatically presented. As a result, the user's workability and convenience can be improved.
[0038]
In the present embodiment, the document management system is configured by a single computer as shown in FIG. 1, but by providing the document management software 104 in the server, the entire client / server system is The document management system of the embodiment can be constructed. As described above, the document management system according to the present embodiment can be freely designed and changed.
[0039]
In this embodiment, the search process is performed by the vector space method. However, when a keyword can be extracted from a sentence, a search process using a Boolean search may be used.
[0040]
Furthermore, the document management system described in the present embodiment is realized by executing a program (document management software 104) prepared in advance on a computer such as a personal computer or a workstation shown in FIG. This program is recorded on a computer-readable recording medium such as a hard disk, floppy disk, CD-ROM, MO, or DVD, and is executed by being read from the recording medium by the computer. The program can be distributed via the recording medium or via a network.
[0041]
【The invention's effect】
As described above, according to the document management system of the present invention, a document management with a document creation means to create and modify documents, and document storage means for storing documents created or modified the document creating means In the system, when a changed document is stored in the document storage unit, the document difference extraction unit that extracts the difference between the changed document and the document before the change, and the document extracted using the difference extracted by the document difference extraction unit as a search condition The retrieval means for retrieving a document having a related description from the documents stored in the means, and the sentence corresponding to the related description of the document retrieved by the retrieval means are presented as affected parts affected by the changed document. And an affected part presentation means for saving the changed document, when storing the changed document, the part corresponding to the related description of the document affected by the changed document. By automatically presenting the Ntensu, it is possible to improve the user operability and convenience.
[0042]
Further, according to the document management system of the present invention, in the above document management system, the search means performs the search using the vector space method, the document difference extraction means, before the change and a vector representation of a document has been changed Compared with the vector representation of the document and extract the difference between the deleted noun phrase and the newly added noun phrase , so the difference can be extracted efficiently and affected by the modified document A sentence corresponding to a related description of a document can be accurately searched.
[0043]
Further, according to the document management system of the present invention, in the above document management system, further, when saving the document was changed in the document storage means, the document difference extraction means, via the search means and the impact portion presenting means Since there is a designation means for designating whether or not to present the affected part, it is possible to designate and use the presented affected part as necessary, further improving workability and convenience.
[0044]
Further, according to the document management system of the present invention, in the above document management system, specifying means, upon specifies that the presentation of the impact portion, the search means from the document stored in the document storage means Since it is possible to specify a search target document or a search range as a search target, it is possible to present the affected part appropriately in accordance with the purpose intended by the user.
[0045]
Further, according to the computer-readable recording medium of the present invention, since recording a program for causing a computer to function as a document management system or any of the above, by executing the program in the computer, the document has been changed When a document is stored, a sentence corresponding to a related description of a document affected by the changed document is automatically presented, so that the user's workability and convenience can be improved.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of a document management system according to an embodiment.
FIG. 2 is a schematic block diagram showing processing of document management software in the document management system of the present embodiment.
FIG. 3 is a flowchart showing the operation of the document management system of the present embodiment.
[Explanation of symbols]
100 CPU
101 ROM
102 RAM
103 Hard Disk Device 104 Document Management Software 105 Document Creation Software 106 Input Device 107 Display 108 Bus 200 Natural Language Processing Module 201 Dictionary 202 Grammar Dictionary 203 Transposed File 204 Document Set 205 Database Build Component 206 Changed Document 207 Query Build Component 208 Query document 209 Search engine 210 Affected part presentation module 211 Saved document 212 Search condition

Claims (2)

文書の作成および変更を行う文書作成手段と、前記文書作成手段で作成または変更した文書を保存する文書保存手段とを備えた文書管理システムにおいて、
前記変更した文書を前記文書保存手段に保存する際に、前記変更した文書において削除された名詞句および新たに追加された名詞句からなる前記変更した文書と変更前の文書の差分を抽出する文書差分抽出手段と、
前記文書差分抽出手段で差分として抽出された削除された名詞句および新たに追加された名詞句を検索条件として、前記文書保存手段に保存されている文書の中から関連記述を有する文書を検索する検索手段と、
前記検索手段で検索した文書の関連記述に相当する部分のセンテンスを、前記変更した文書によって影響を受ける影響部分として提示する影響部分提示手段と、
を備えたこと特徴とする文書管理システム。
In a document management system comprising a document creation unit that creates and changes a document, and a document storage unit that stores a document created or changed by the document creation unit,
A document for extracting a difference between the changed document and the pre-change document composed of the noun phrase deleted and the newly added noun phrase in the changed document when the changed document is stored in the document storage unit Difference extraction means;
Using the deleted noun phrase extracted as a difference and the newly added noun phrase extracted by the document difference extraction unit as a search condition, a document having a related description is searched from the documents stored in the document storage unit. Search means;
An affected part presenting means for presenting a sentence corresponding to a related description of a document retrieved by the retrieving means as an affected part affected by the changed document;
A document management system comprising:
前記請求項1に記載の文書管理システムとしてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。A computer-readable recording medium having recorded thereon a program for causing a computer to function as the document management system according to claim 1 .
JP20203697A 1997-07-28 1997-07-28 Document management system and computer-readable recording medium storing a program for causing a computer to function as the system Expired - Fee Related JP3851712B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20203697A JP3851712B2 (en) 1997-07-28 1997-07-28 Document management system and computer-readable recording medium storing a program for causing a computer to function as the system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20203697A JP3851712B2 (en) 1997-07-28 1997-07-28 Document management system and computer-readable recording medium storing a program for causing a computer to function as the system

Publications (2)

Publication Number Publication Date
JPH1145238A JPH1145238A (en) 1999-02-16
JP3851712B2 true JP3851712B2 (en) 2006-11-29

Family

ID=16450880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20203697A Expired - Fee Related JP3851712B2 (en) 1997-07-28 1997-07-28 Document management system and computer-readable recording medium storing a program for causing a computer to function as the system

Country Status (1)

Country Link
JP (1) JP3851712B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4534690B2 (en) * 2004-09-22 2010-09-01 富士ゼロックス株式会社 Document retrieval apparatus and method
JP6448407B2 (en) * 2015-02-19 2019-01-09 株式会社富士通アドバンストエンジニアリング Reliability calculation program, system, method, and apparatus
JP6703698B1 (en) * 2019-10-31 2020-06-03 株式会社 情報システムエンジニアリング Information provision system
JP6841394B1 (en) * 2020-01-28 2021-03-10 株式会社日本法務システム研究所 Information processing system

Also Published As

Publication number Publication date
JPH1145238A (en) 1999-02-16

Similar Documents

Publication Publication Date Title
JP3691844B2 (en) Document processing method
JP2783558B2 (en) Summary generation method and summary generation device
JPH11110416A (en) Method and device for retrieving document from data base
JP2001043236A (en) Synonym extracting method, document retrieving method and device to be used for the same
KR20020058639A (en) A XML Document Retrieval System and Method of it
JP4091146B2 (en) Document retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP4065346B2 (en) Method for expanding keyword using co-occurrence between words, and computer-readable recording medium recording program for causing computer to execute each step of the method
US11301441B2 (en) Information processing system and information processing method
JP3767763B2 (en) Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device
CN113535642A (en) File searching method and computing device
JP3851712B2 (en) Document management system and computer-readable recording medium storing a program for causing a computer to function as the system
KR101835994B1 (en) Method and apparatus of providing searching service for electronic books
JPH1145252A (en) Information retrieval device and computer readable recording medium for recording program for having computer function as the same device
JPWO2009113289A1 (en) NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM
JP2003108571A (en) Document summary device, control method of document summary device, control program of document summary device and recording medium
JP4000332B2 (en) Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP4138048B2 (en) Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device
JP4384736B2 (en) Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device
JP2003108582A (en) Synonym extracting method and document retrieving device
JP2004157965A (en) Search support device and method, program and recording medium
JPH1145254A (en) Document retrieval device and computer readable recording medium recorded with program for functioning computer as the device
JPH1145249A (en) Information retrieval device and computer-readable recording medium where program for making computer function as same device is recorded
JPH1145269A (en) Document management support system and computer readable recording medium recorded with program for functioning computer as the system
JP4074687B2 (en) Summary sentence creation support system and computer-readable recording medium recording a program for causing a computer to function as the system
JPH1145236A (en) Document management support device and computer-readable recording medium where program allowing computer to function as same device is recorded

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060509

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060904

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150908

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees