JPH05233712A - 文書管理装置 - Google Patents

文書管理装置

Info

Publication number
JPH05233712A
JPH05233712A JP3065806A JP6580691A JPH05233712A JP H05233712 A JPH05233712 A JP H05233712A JP 3065806 A JP3065806 A JP 3065806A JP 6580691 A JP6580691 A JP 6580691A JP H05233712 A JPH05233712 A JP H05233712A
Authority
JP
Japan
Prior art keywords
user
document
keyword
keyword connection
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3065806A
Other languages
English (en)
Inventor
Yasutsugu Ogawa
泰嗣 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3065806A priority Critical patent/JPH05233712A/ja
Publication of JPH05233712A publication Critical patent/JPH05233712A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 学習のさせ方の異なる複数の利用者が利用し
ても、各々の利用者の文書検索効率が損なわれることの
ないようにする。 【構成】 検索条件に対する各文書の適切さを表す文書
確度を求めるために予め設定された所定の計算式により
書誌情報、キーワードコネクション等の情報に基づき文
書確度を計算する文書確度計算部を有して検索条件に合
致した文書を選出する文書検索手段7や、検索結果に対
する利用者の評価に基づいてキーワードコネクションを
変更する学習手段8や、キーワードコネクションを管理
するキーワードコネクション管理手段10を利用した柔
軟な文書検索可能なものにおいて、利用者管理テーブル
を用いて利用者の登録と認識を行い利用者毎にキーワー
ドコネクションを管理する利用者管理手段16を設け、
あたかも個々の利用者にとって自己専用機的な効率のよ
い利用を可能とした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書管理装置、特に、
検索結果において利用者の検索条件に近い順に文書を提
示し得るような、柔軟で高速な文書管理装置に関する。
【0002】
【従来の技術】従来の文書管理装置では、文書登録時に
登録オペレータが適切と思われるキーワードを選択し、
シソーラスにより適切に分類し、キーワードの追加、削
除に伴いシソーラスを更新するようにしたものがある。
しかし、登録するオペレータの妥当性の点、シソーラス
による分類・更新作業の煩雑さ及びその妥当性の点で問
題がある。また、検索時に利用者が指定した検索条件を
概ね満たす文書を検索するためには、検索条件を検討し
直した上で再度の検索が必要となるものである。
【0003】このような問題を解決するため、キーワー
ド間の関連情報を記述したキーワードコネクションを利
用し、文書検索時には利用者の検索要求に近いものほど
大きな値を持つ文書確度という評価値を導入すること
で、柔軟な検索を実現したものが特願昭63−8291
号等により提案され、さらにはキーワードコネクション
を利用者の評価に基づいて修正する機能を持たせたもの
も特願平2−201936号として本出願人により提案
されている。
【0004】
【発明が解決しようとする課題】ところが、このような
提案例によっても、多数の利用者が利用した場合には問
題が生ずる。これは、キーワードコネクションの学習を
実施すると、利用者によって学習のさせ方が異なるた
め、各利用者にとってキーワードコネクションが最適な
ものにならないからである。例えば、利用者Aがキーワ
ード1とキーワード2との関連度を大きくするように学
習させた後、利用者Bがキーワード1とキーワード2と
の関連度を小さくするように学習させると、両者の効果
が相殺されてしまうことになる。
【0005】
【課題を解決するための手段】請求項1記載の発明で
は、入力装置及び表示装置の管理を行う対話処理手段
と、利用者が入力した文書をデータファイルに格納させ
るための文書登録手段と、書誌情報を管理する書誌情報
管理手段と、キーワード間の関連情報を記述したキーワ
ードコネクションを管理するキーワードコネクション管
理手段と、文書、書誌情報及びキーワードコネクション
の各データファイルを管理するファイル管理手段と、前
記対話処理手段を介して利用者が入力した検索条件を標
準形に変換する条件解析手段と、検索条件に対する各文
書の適切さを表す値を文書確度と定義しこの文書確度を
求めるために予め設定された所定の計算式により書誌情
報、キーワードコネクション等の情報に基づき文書確度
を計算する文書確度計算部を有して検索条件に合致した
文書を選出する文書検索手段と、検索結果に対する利用
者の評価に基づいてキーワードコネクションを変更する
学習手段とを設ける他、利用者管理テーブルを有して利
用者の登録と認識を行い利用者毎にキーワードコネクシ
ョンを管理する利用者管理手段を設けた。
【0006】この場合、請求項2記載の発明では、利用
者管理手段の利用者管理テーブルが、学習機能の利用を
禁止させる制約付きの未登録利用者用の利用者名を有す
るものとした。
【0007】また、請求項3記載の発明では、新規利用
者に与えられるアクセス権に基づいて利用者登録時に文
書データベースからその利用者に固有のキーワードコネ
クションを生成するキーワードコネクション生成手段を
設けた。
【0008】
【作用】請求項1記載の発明によれば、利用者管理手段
を設けて、利用者管理を行い、利用者毎にキーワードコ
ネクションを用意することで、多数の利用者が共用する
場合であっても、個々の利用者は、あたかも自己専用機
のような状態で学習させて、自己に最適な条件で文書検
索に利用できるものとなる。
【0009】この場合、請求項2記載の発明によれば、
登録されていない利用者であっても学習機能を伴わず他
人の学習の影響を受けない一般的な文書検索として共用
できるものとなる。
【0010】さらに、請求項3記載の発明によれば、キ
ーワードコネクション生成手段が付加されているので、
キーワードコネクションが利用者登録時にそのアクセス
権に基づいて利用者毎に作成されるため、学習以前から
その利用者にとって効率的な文書検索が可能となる。
【0011】
【実施例】請求項1記載の発明の一実施例を図1ないし
図3に基づいて説明する。まず、キーボード1、マウス
2等の入力装置を通して与えられる利用者の指示を適切
なモジュールに転送し、検索結果などをディスプレイ
(表示装置)3に表示させる対話処理部(対話処理手
段)4が設けられている。この対話処理部4には条件解
析部(条件解析手段)5、文書登録部(文書登録手段)
6、文書検索部(文書検索手段)7、学習管理部(学習
手段)8、書誌情報管理部(書誌情報管理手段)9、K
C管理部(キーワードコネクション管理手段)10、フ
ァイル管理部(ファイル管理手段)11等のモジュール
が階層的に接続されている。条件解析部5は利用者の入
力した検索条件を解析し、効率的な検索にあった形式に
変換する。文書検索部7は検索条件に対する各文書の適
切さを表す値を文書確度と定義しこの文書確度を求める
ために予め設定された所定の計算式により書誌情報、キ
ーワード間の関連情報を記述したキーワードコネクショ
ン等の情報に基づき文書確度を計算する文書確度計算部
(図示せず)を有して、検索条件に合致した文書の選出
を行うものである。学習管理部8はキーワードコネクシ
ョンの学習を実施するものである。文書登録部6は利用
者の入力した文書をファイルに格納するための登録処理
を実施するものである。書誌情報管理部9は文書登録又
は検索時に書誌情報の管理を行うものである。KC管理
部10は文書登録又は検索時に本文書管理装置中におけ
るキーワードコネクションのメモリ上での管理を行うも
のである。キーワードコネクションはキーワード間の関
連の大きさを“0”から“1”までの数値で表現したも
ので、例えば図2に示すようなキーワードコネクション
表12としてメモリ上で管理される。このようなキーワ
ードコネクション値は学習により動的に変更されるが、
この学習は前記学習管理部8により行われる。ファイル
管理部11は本文書管理装置が使用するデータファイ
ル、例えば文書データファイル13、書誌情報データフ
ァイル14、キーワードコネクションファイル(KCフ
ァイル)15の管理を行うものである。
【0012】このような基本構成における検索及び学習
方式については、前述した特願昭63−8291号等に
より開示されているので、ここでは説明を省略する。
【0013】しかして、本実施例ではKCファイル15
は複数個とされ、15a,15b,〜で示すように各利
用者毎に用意されている。また、対話処理部4とファイ
ル管理部11との間には利用者管理部(利用者管理手
段)16が用いられている。この利用者管理部16には
図3に示すような利用者管理テーブル17を用いて利用
者管理を行うものである。利用者管理テーブル17には
利用者名、パスワード及びキーワードコネクシションの
3つの欄が用意されている。利用者名欄には、本文書管
理装置にログインする際の利用者の名前が保持され(例
えば、“太郎”“花子”等)、パスワード欄には利用者
確認のためのパスワードが保持され(例えば、“xxx
xx”“yyyyy”等)、キーワードコネクション欄
にはその利用者用KCファイル名が保持される。このよ
うな利用者管理は、システム管理者により行われる。こ
のため、利用者管理テーブル17には管理者用のパスワ
ード、キーワードコネクションも保持されている。
【0014】ここに、このような利用者管理テーブル1
7には、初めは、システム管理者分のエントリしかな
い。よって、本文書管理装置には、初めは、KCファイ
ル15もKCnで示す1個だけが用意されており、利用
者登録時には、その利用者に対応したKCファイルKC
nの内容をコピーし、新たなKCファイル名を付ける。
図3の例では、利用者“太郎”“花子”用のキーワード
コネクション名は各々“KC1”“KC2”とされてい
る。パスワードは登録された利用者が自分で付けるもの
とされている。
【0015】このような構成において、まず、各利用者
は本文書管理装置にログインする。利用者管理部16は
パスワードを用いて利用者の確認を行い、パスワードが
正しい場合にのみその利用者に対して本文書管理装置の
サービスを提供する。即ち、パスワードが正しかった場
合、その利用者用のキーワードコネクション名をフアイ
ル管理部11に伝達する。すると、ファイル管理部11
では対応するKCファイルをメモリ上にロードする。ロ
ードされたキーワードコネクションはKC管理部10に
より管理される。一方、文書検索部7や学習管理部8は
メモリ上にロードされたこのキーワードコネクションを
用いて検索や学習を行う。利用者がログアウトすること
により本文書管理装置の使用を終了する。この際、メモ
リ上にロードされていたキーワードコネクションはその
利用者に対応した名前のKCファイルに書き戻される。
【0016】このように本実施例によれば、キーワード
コネクションに関しては、利用者管理部16による管理
によって、利用者毎に学習等のキーワードコネクション
処理が行われるため、異なる複数の利用者が本文書管理
装置を共用しても、各々が自己の最適なる条件のもとで
利用可能となる。よって、利用者毎に最大の文書検索効
率が得られるものとなる。また、利用者管理テーブル1
7に登録されていない不正な利用者の使用を制限するこ
ともできる。
【0017】ついで、請求項2記載の発明の一実施例を
図4により説明する。前記実施例による場合、利用者管
理テーブル17に登録された利用者しか利用できない。
そこで、本実施例では、利用者管理テーブル17中に未
登録の利用者用に特別な利用者名(以下では、これを
「ゲスト」とする)を用意したものである。この他の構
成は、前記実施例と同様である。
【0018】このような構成において、基本的には前記
実施例の場合と同様に処理される。もっとも、本実施例
にあってはゲストは登録された利用者と異なり、利用者
管理テーブル17においてパスワードを付けることがで
きない。これは、任意の未登録利用者がゲストとして本
文書管理装置を利用できることを保証するためである。
また、ゲストはキーワードコネクションの学習を行うこ
とはできないという制約を受ける。これは、複数利用者
使用時の学習の問題を排除するためである。即ち、登録
された利用者であれば自己専用のKCファイルを利用す
るため学習機能を持たせてもよいが、未登録利用者にあ
ってはゲストとして1つの専用KCファイルを共用する
ため、ゲストには学習を認めないようにしたものであ
る。図4における利用者管理テーブル17のゲスト対応
のパスワード欄の“*”はパスワードを付けることがで
きないことを示し、キーワードコネクション欄の“KC
g”はゲスト用キーワードコネクションのKCファイル
名を示している。
【0019】さらに、請求項3記載の発明の一実施例を
図5により説明する。前述した実施例においては、新規
登録利用者に対してシステムが予め用意していた全て同
じキーワードコネクション(例えば、KCn)が与えら
れるが、同一文書管理装置内に格納されている文書デー
タであっても、与えられるアクセス権は利用者によって
異なり、かつ、データベースに格納される文書を追加・
削除することによって変化することを考えると、利用者
が使用するキーワードコネクションはその利用者の登録
時に実際のデータ・アクセス権に応じて作成されること
が望ましい。そこで、本実施例では、図1に示した構成
に、KC生成部(キーワードコネクション生成手段)1
8を付加したものである。このKC生成部18によりキ
ーワードコネクションを生成する方法としては、例えば
本出願人既提案の特願平2−250675号中に記載の
方式が用いられる。即ち、文書データベースの新規作成
時にキーワードコネクションはKC生成部18により次
のように設定される。これは、キーワードコネクション
の重みが「2つのキーワードが同じ文書に同時に付与さ
れている頻度が大きいほどそれらの2つのキーワードは
関連が強い」という経験則を基に決定するものである。
即ち、i番目のキーワードとj番目のキーワード(同じ
キーワード間のキーワードコネクションの重みは常に1
に固定されているので、i≠jとする)との間のキーワ
ードコネクションの重みの初期値Wijは、(1)式の計算
式により算出される。
【0020】
【数1】
【0021】ここに、Ni,Njは各々キーワードKi,
Kjを索引とする文書数、NijはキーワードKi,Kjを
同時に索引とする文書数である。即ち、Ni,Njは各々
i,j番目のキーワードのキーワードコネクションにお
ける出現文書数(出現頻度)、Nijはi番目とj番目と
のキーワードの共出現文書数(共出現頻度)に相当す
る。これにより、文書データベースの新規作成時にキー
ワードコネクションを適切に設定できる。
【0022】従って、本実施例によれば、キーワードコ
ネクションは対象とする文書データベースに応じて異な
ったものとなる。この結果、最新の文書データベースに
おいて、各利用者毎に参照可能な文書に応じたキーワー
ドコネクションを用いることになり、より効率的な文書
検索が可能となる。
【0023】ここに、KC生成部18において上記の方
式でキーワードコネクションを生成するものとして、本
文書管理装置の利用者登録時の動作を説明する。新規利
用者の登録時には、新規利用者に与えられるアクセス権
に基づいてアクセス可能な文書について、各キーワード
毎にそのキーワードが索引として与えられている文書数
をカウントする。さらに、同時に2つのキーワードが索
引として与えられている文書数もカウントする。これら
のカウント結果を(1)式に代入することにより、その利
用者用のキーワードコネクションを作成できる。このキ
ーワードコネクションをキーワードコネクション欄に含
むように利用者管理テーブル17に新たなエントリを作
成することにより、利用者登録作業が終了する。
【0024】よって、本実施例によれば、キーワードコ
ネクションが利用者登録時にそのアクセス権に基づいて
利用者毎に生成されるので、学習以前から効率的な文書
検索が可能となり、文書検索が一層、効率アップされ
る。
【0025】
【発明の効果】本発明は、上述したように構成したの
で、請求項1記載の発明によれば、利用者管理手段を設
けて、利用者管理を行い、利用者毎にキーワードコネク
ションを用意するようにしたので、多数の利用者が共用
する場合であっても、個々の利用者は、あたかも自己専
用機のような状態でキーワードコネクションを学習させ
て、自己に最適な条件で文書検索に利用できるものとな
り、検索効率のよいものとなり、この場合、請求項2記
載の発明によれば、利用者管理手段の利用者管理テーブ
ルが、学習機能の利用を禁止させる制約付きの未登録利
用者用の利用者名を有するので、登録されていない利用
者であっても学習機能を伴わず他人の学習の影響を受け
ない一般的な文書検索として共用できるものとなり、さ
らに、請求項3記載の発明によれば、キーワードコネク
ション生成手段が付加されているので、キーワードコネ
クションが利用者登録時にそのアクセス権に基づいて利
用者毎に作成されるため、学習以前からその利用者にと
って効率的な文書検索を可能とすることができるもので
ある。
【図面の簡単な説明】
【図1】請求項1記載の発明の一実施例を示すブロック
図である。
【図2】キーワードコネクション表構成を示す説明図で
ある。
【図3】利用者管理テーブル構成を示す説明図である。
【図4】請求項2記載の発明の一実施例の利用者管理テ
ーブル構成を示す説明図である。
【図5】請求項3記載の発明の一実施例を示すブロック
図である。
【符号の説明】
1,2 入力装置 3 表示装置 4 対話処理手段 5 条件解析手段 6 文書登録手段 7 文書検索手段 8 学習手段 9 書誌情報管理手段 10 キーワードコネクション管理手段 11 ファイル管理手段 13〜15 データファイル 16 利用者管理手段 17 利用者管理テーブル 18 キーワードコネクション生成手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力装置及び表示装置の管理を行う対話
    処理手段と、利用者が入力した文書をデータファイルに
    格納させるための文書登録手段と、書誌情報を管理する
    書誌情報管理手段と、キーワード間の関連情報を記述し
    たキーワードコネクションを管理するキーワードコネク
    ション管理手段と、文書、書誌情報及びキーワードコネ
    クションの各データファイルを管理するファイル管理手
    段と、前記対話処理手段を介して利用者が入力した検索
    条件を標準形に変換する条件解析手段と、検索条件に対
    する各文書の適切さを表す値を文書確度と定義しこの文
    書確度を求めるために予め設定された所定の計算式によ
    り書誌情報、キーワードコネクション等の情報に基づき
    文書確度を計算する文書確度計算部を有して検索条件に
    合致した文書を選出する文書検索手段と、検索結果に対
    する利用者の評価に基づいてキーワードコネクションを
    変更する学習手段と、利用者管理テーブルを有して利用
    者の登録と認識を行い利用者毎にキーワードコネクショ
    ンを管理する利用者管理手段とよりなることを特徴とす
    る文書管理装置。
  2. 【請求項2】 利用者管理手段の利用者管理テーブル
    が、学習機能の利用を禁止させる制約付きの未登録利用
    者用の利用者名を有することを特徴とする請求項1記載
    の文書管理装置。
  3. 【請求項3】 新規利用者に与えられるアクセス権に基
    づいて利用者登録時に文書データベースからその利用者
    に固有のキーワードコネクションを生成するキーワード
    コネクション生成手段を設けたことを特徴とする請求項
    1又は2記載の文書管理装置。
JP3065806A 1991-03-29 1991-03-29 文書管理装置 Pending JPH05233712A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3065806A JPH05233712A (ja) 1991-03-29 1991-03-29 文書管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3065806A JPH05233712A (ja) 1991-03-29 1991-03-29 文書管理装置

Publications (1)

Publication Number Publication Date
JPH05233712A true JPH05233712A (ja) 1993-09-10

Family

ID=13297640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3065806A Pending JPH05233712A (ja) 1991-03-29 1991-03-29 文書管理装置

Country Status (1)

Country Link
JP (1) JPH05233712A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4860139A (en) * 1987-06-19 1989-08-22 Censtor Corporation Planarized read/write head and method
JPH08137893A (ja) * 1994-11-14 1996-05-31 Toshiba Corp 文書検索方法及び文書検索装置
WO1999017229A1 (fr) * 1997-09-29 1999-04-08 Fujitsu Limited Systeme de signets par affichage d'image
JP2000112968A (ja) * 1998-10-02 2000-04-21 Fujitsu Ltd 情報検索支援装置および情報検索支援プログラム記憶媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4860139A (en) * 1987-06-19 1989-08-22 Censtor Corporation Planarized read/write head and method
JPH08137893A (ja) * 1994-11-14 1996-05-31 Toshiba Corp 文書検索方法及び文書検索装置
WO1999017229A1 (fr) * 1997-09-29 1999-04-08 Fujitsu Limited Systeme de signets par affichage d'image
US6526424B2 (en) 1997-09-29 2003-02-25 Fujitsu Limited Browser image display bookmark system
JP2000112968A (ja) * 1998-10-02 2000-04-21 Fujitsu Ltd 情報検索支援装置および情報検索支援プログラム記憶媒体

Similar Documents

Publication Publication Date Title
US6701310B1 (en) Information search device and information search method using topic-centric query routing
US9262584B2 (en) Systems and methods for managing a master patient index including duplicate record detection
CN110532797A (zh) 大数据的脱敏方法和系统
US5926812A (en) Document extraction and comparison method with applications to automatic personalized database searching
JP3648051B2 (ja) 関連情報検索装置及びプログラム記録媒体
JP3311540B2 (ja) データ管理システム
KR20040013097A (ko) 카테고리 기반의 확장가능한 대화식 문서 검색 시스템
JP2002519751A (ja) 文脈に基づきユーザーのプロフィールが駆動する情報検索
US6745195B1 (en) System, method and computer program product for generating software cards that summarize and index information
Sasikumar et al. A survey of natural language question answering system
US20120130972A1 (en) Concept disambiguation via search engine search results
Salton Automatic information retrieval
JP4428850B2 (ja) 情報検索装置及び情報検索方法
JP2003288348A (ja) 図書館蔵書検索システム
JPH05233712A (ja) 文書管理装置
JP2002230005A (ja) サポートセンターシステム
Walke et al. Implementation approaches for various categories of question answering system
JP3558267B2 (ja) 文書検索装置
JP2732661B2 (ja) テキスト型データベース装置
JP3425784B2 (ja) 文献情報検索装置
JPS61243531A (ja) 情報検索方式
JP3088805B2 (ja) 文書管理装置
JP2009277154A (ja) 情報検索装置及び情報検索方法
Dessy et al. Information retrieval and laboratory data management
JPH0944521A (ja) インデックス作成装置および文書検索装置