JP3088805B2 - 文書管理装置 - Google Patents

文書管理装置

Info

Publication number
JP3088805B2
JP3088805B2 JP03284484A JP28448491A JP3088805B2 JP 3088805 B2 JP3088805 B2 JP 3088805B2 JP 03284484 A JP03284484 A JP 03284484A JP 28448491 A JP28448491 A JP 28448491A JP 3088805 B2 JP3088805 B2 JP 3088805B2
Authority
JP
Japan
Prior art keywords
document
search
search condition
standard form
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03284484A
Other languages
English (en)
Other versions
JPH05114000A (ja
Inventor
泰嗣 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03284484A priority Critical patent/JP3088805B2/ja
Publication of JPH05114000A publication Critical patent/JPH05114000A/ja
Application granted granted Critical
Publication of JP3088805B2 publication Critical patent/JP3088805B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書管理装置、特に、
検索結果において利用者の検索条件に近い順に文書を提
示し得るような、柔軟で高速な文書管理装置に関する。
【0002】
【従来の技術】従来の文書管理装置では、文書登録時に
登録オペレータが適切と思われるキーワードを選択し、
これをシソーラスにより適切に分類し、さらに、キーワ
ードの追加、削除に伴いシソーラスを更新するようにし
たものがある。しかし、登録するオペレータの妥当性の
点、シソーラスによる分類・更新作業の煩雑さ及びその
妥当性の点で問題がある。また、検索時に利用者が指定
した検索条件を概ね満たす文書を検索するためには、検
索条件を検討し直した上で再度の検索が必要となるもの
である。
【0003】このような問題を解決するため、キーワー
ド間の関連情報を記述したキーワード結合行列を利用
し、文書検索時には利用者の検索要求に近いものほど大
きな値を持つ文書確度という評価値を導入することで、
柔軟な検索を実現したものが特願昭63−8291号等
により提案されている。ここに、検索条件として、複数
のキーワードを論理積、論理和及び否定を任意の組合せ
で結合させた検索条件式に対しても、その条件を積標準
形又は和標準形に変換することで文書確度を計算し得る
ようにしたものが特願平2−201936号として本出
願人により提案されている。
【0004】
【発明が解決しようとする課題】ところが、このような
提案例にあっては、文書検索を行う場合、積標準形/和
標準形の検索条件で各副検索条件を表すキーワードの集
合は通常のクリスプな集合に限定されてしまう。よっ
て、より一般的な検索条件としてファジィ検索条件によ
り検索したい場合には対応できないものである。
【0005】
【課題を解決するための手段】入力装置及び表示装置の
管理を行う対話処理手段と、利用者が入力した文書をデ
ータファイルに格納させるための文書登録手段と、書誌
情報を管理する書誌情報管理手段と、キーワード間の関
連情報を記述したキーワード結合行列を管理するキーワ
ード結合行列管理手段と、文書、書誌情報及びキーワー
ド結合行列の各データファイルを管理するファイル管理
手段とを設けるとともに、対話処理手段を介して利用者
が入力したファジィ集合表現を選択的に含む検索条件を
ファジィ集合表現の標準形に変換する条件解析手段を設
け、変換された標準形の検索条件に対する各文書の適切
さを表す値を文書確度と定義してこの標準形の検索条件
に対して予め設定された計算式により書誌情報、キーワ
ード結合行列等の情報に基づき文書確度を計算する文書
確度計算部を有して検索条件に合致した文書を選出する
文書検索手段を設けた。ここに、検索条件の標準形は、
積標準形又は和標準形とした。
【0006】
【作用】検索条件をファジィ集合表現の形で入力した場
合も、処理可能なファジィ集合表現の標準形の検索条件
に変換され、キーワード結合行列等の情報を利用して文
書確度が求められて必要な文書が検索されるので、利用
者はよりあいまいな検索条件の指定ができ、一層、効率
的な文書検索を行うことができる。
【0007】
【実施例】本発明の第一の実施例を図1に基づいて説明
する。まず、キーボード1、マウス2等の入力装置を通
して与えられる利用者の指示を適切なモジュールに転送
し、検索結果などをディスプレイ(表示装置)3に表示
させる要求処理部(対話処理手段)4が設けられてい
る。この要求処理部4には条件解析部(条件解析手段)
5、文書検索部(文書検索手段)6、書誌情報管理部
(書誌情報管理手段)7、キーワード結合行列管理部
(KC管理部=キーワード結合行列管理手段)8を有す
る文書管理部9が接続されている。ここに、条件解析部
5は利用者の入力した検索条件を解析し、効率的な検索
にあった形式(積標準形又は和標準形)に変換する。文
書検索部6はユーザの入力した検索条件に対する各文書
の適切さを表す値を文書確度と定義しこの文書確度を求
めるために予め設定された所定の計算式(後述する)に
より書誌情報、キーワード間の関連情報を記述したキー
ワード結合行列等の情報に基づき文書確度を計算する文
書確度計算部(図示せず)を有して、検索条件に合致し
た文書の選出を行う。書誌情報管理部7は文書登録又は
検索時に書誌情報の管理を行う。KC管理部8は文書登
録又は検索時に本文書管理装置中におけるキーワード結
合行列のメモリ上での管理を行う。キーワード結合行列
はキーワード間の関連の大きさを“0”から“1”まで
の数値で表現したもので、“0”はキーワード間に関係
がないこと、“0”以上の値はキーワード間に関係があ
ることを示し、“1”がその関係の大きさが最大である
ことを意味する。本実施例では、i番目のキーワードと
j番目のキーワードとの間の関連度(「重み」と称す
る)をWijで表現するものとする。なお、文書管理部9
中には、利用者の入力した文書をファイルに格納するた
めの登録処理を行う文書登録手段(図示せず)も設けら
れている。
【0008】さらに、文書管理部9にはファイル管理部
(ファイル管理手段)10が接続されている。このファ
イル管理部10は本文書管理装置が使用するデータファ
イル、例えば文書データファイル11、書誌情報データ
ファイル12、キーワード結合行列ファイル(KCファ
イル)13の管理を行うものである。
【0009】このような構成において、文書検索部6の
動作を詳細に説明する。文書検索部6ではユーザの入力
した検索条件を満たす文書の検索処理を下記の手順で行
う。第1に、検索条件を標準形に変換し、第2に、全文
書について文書確度を計算し、第3に、全文書を文書確
度順にソートする。ここに、文書確度とは、検索条件に
対する各文書の適切さを表す数値であり、この値が大き
いほど検索条件を満たすことを意味する。標準形には積
標準形と和標準形とがある。
【0010】まず、積標準形の場合を説明する。既提案
方式によれば、積標準形の検索条件は(1)式のように表
される。
【0011】
【数1】
【0012】ここに、“∧”は論理積を表し、N≧1で
ある。また、Subquery(h) は論理和(∨)と否定(¬)の
みで構成される(2)式のような副検索条件である。
【0013】
【数2】
【0014】ここで、n≧0、m≧0、n+m≧1であ
る。以下では、否定の付かないキーワードの集合を(3)
式、否定の付くキーワードの集合を(4)式のように示す
ものとする。
【0015】
【数3】
【0016】文書確度は、まず、各副検索条件に対する
文書確度(副文書確度)を計算し、ついで、最終的な文
書確度を計算する、という2ステップで行われる。ファ
ジィ集合の和/積の計算に代数和/積を用いるため、各
文書(ここでは、i番目の文書とする)のh番目の副文
書確度ri(h) は(5)式で計算される。
【0017】
【数4】
【0018】ここで、WjkをキーワードKj とキーワー
ドKk との間のキーワード結合行列の重み、Ai をi番
目の文書に付与されているキーワードの集合とすると、
Rijは(6)式により計算される。
【0019】
【数5】
【0020】全ての副検索条件に対する副文書確度を計
算した後、最終的な文書確度ri は(7)式で計算され
る。
【0021】
【数6】
【0022】前述したように、積標準形の検索条件は各
副検索条件を表すキーワードの集合の集合として表現さ
れる。これを一般化すれば、各副検索条件を表すキーワ
ードの集合はファジィ集合となる。本実施例では、各副
検索条件のキーワード集合がファジィ集合の場合であっ
ても文書確度を求め得るようにしたものである。いま、
(3)(4)式に対応するファジィ集合を(8)(9)式のよう
に表し、各ファジィ集合のメンバーシップ関数値を(10)
(11)式のように書くものとすると、積標準形のファジィ
検索条件は(12)(13)式のようになる。
【0023】
【数7】
【0024】このようなファジィ検索条件に対して、文
書確度計算式は(14)(15)式のようになる。
【0025】
【数8】
【0026】ついで、和標準形の場合について説明す
る。既提案方式によれば、和標準形の検索条件は(16)(1
7)式のように表される。
【0027】
【数9】
【0028】ここで、否定の付かないキーワードの集
合、否定の付くキーワードの集合を各々前述した(3)
(4)式のように示すものとする。この場合も、文書確度
は、各副検索条件に対する文書確度(副文書確度)を計
算し、ついで、最終的な文書確度を計算する、という2
ステップで行われる。i番目の文書のh番目の副文書確
度ri(h) は(18)式で計算される。
【0029】
【数10】
【0030】ここで、Rijは積標準形の場合と同じであ
り、(6)式により計算される。全ての副検索条件に対す
る副文書確度を計算した後、最終的な文書確度ri は(1
9)式で計算される。
【0031】
【数11】
【0032】次に、各副検索条件を表すキーワードの集
合の文書確度計算式を示す。この場合も、前述した積標
準形の場合と同様に、ファジィ集合を(8)(9)式のよう
に表し、各ファジィ集合のメンバーシップ関数値を(10)
(11)式のように書くものとすると、和標準形のファジィ
検索条件は(20)(21)式のようになる。
【0033】
【数12】
【0034】このようなファジィ検索条件に対して、文
書確度計算式は(22)(23)式のようになる。
【0035】
【数13】
【0036】つづいて、本発明の第二の実施例を図2に
より説明する。前記実施例で示した部分と同一部分は同
一符号を用いて示す。本実施例では、キーワード結合行
列へのアクセスを低減し、文書確度の計算を効率よく
し、かつ、検索処理を簡単化させるようにしたものであ
る。図1に示す構成との対比では、利用者の管理を行な
う利用者管理部14が付加されている。この利用者管理
部14は利用者がログインしたらその利用者のキーワー
ド結合行列をロードするものである。KCファイル13
は利用者毎に用意されている。また、前記実施例では省
略されていた文書登録部15が図示されている。
【0037】このような構成において、本実施例の処理
を説明する。基本的には、検索条件を標準形に変換した
後、ファジィ検索条件をキーワード結合行列を用いて生
成し、その後で文書毎に文書確度を計算し、文書を文書
確度順にソートする。ここに、検索条件のファジィ変換
化を行なう際にキーワード結合行列を用い、ファジィイ
ンデックスの生成は行なわないものである。即ち、1つ
の検索条件を処理する際には1回だけキーワード結合行
列をアクセスすればよいものとし、検索の高速化、検索
処理の簡単化が図られている。
【0038】まず、検索条件の変換について説明する。
利用者はキーワードをAND(∧),OR(∨),NO
T(¬)で組合せた任意の検索条件を入力することがで
きる。このような利用者の入力した検索条件は、(24)式
のような積標準形に変換される。(25)式はその副検索条
件を示す。
【0039】
【数14】
【0040】ここに、検索条件は和標準形に変換するこ
とも可能であるが、本実施例では必ず積標準形に変換さ
れる。また、s≧0,t≧0,s+t≧1であり、以下
では、否定の付かないキーワードの集合を(26)式、否定
の付くキーワードの集合を(27)式のように示すものとす
る。
【0041】
【数15】
【0042】次に、積標準形に変換した検索条件をキー
ワード結合行列を用いて展開する。例えば、Ki に対し
てキーワード結合行列に関連が記述されているキーワー
ドの集合は、キーワード結合行列の重みをファジィ集合
の帰属度と捉えることでファジィ集合として扱うことが
できる。以下では、キーワードKi の関連キーワードの
ファジィ集合{Wij/Kj |Wij>0}をLi として表
し、このファジィ集合Li の台集合をLi として表すも
のとする。今、全てのキーワードをキーワード結合行列
を用いて展開する。ここに、(28)(29)式を用いる。ま
た、副検索条件を(30)式のようにする。
【0043】
【数16】
【0044】この時、ファジィ集合の和/積集合の計算
にはmax/minが用いられる。従って、(30)式のMi は(3
1)(32)式により求めることができる。
【0045】
【数17】
【0046】ついで、文書毎に文書確度を計算する。ま
ず、副文書確度を計算する。例えば、i番目の文書のh
番目の副検索条件に対する副文書確度ri(h) は(33)式
で計算される。ここで、Ai は文書iのキーワード集合
を示す。また、χAi(k) はキーワード集合の特性関数
で、kがAi に含まれれば1、含まれなければ0をと
る。そこで、(33)式は(34)式のように書換えることがで
きる。
【0047】
【数18】
【0048】全ての副検索条件に対する副文書確度の計
算が終了した後、最終的な文書確度ri を(35)式により
計算する。ここでは、ファジィ集合の積集合をmin を用
いて求めている。
【0049】
【数19】
【0050】この際、ファジィ集合の演算方式を複数用
意しておき、利用者がその内の1つを任意に選択使用す
るようにすることもできる。構成的には、図2のままで
よい。まず、要求処理部4が利用者の設定を解析し、条
件解析部5と文書検索部6にどの方式を用いるかを指示
する。ファジィ集合の和/積集合のmax/min以外の演算
方式として、例えば代数和/代数積がある。ファジィ集
合の和/積集合を求めるためのメンバシップ値の計算に
代数和/代数積を用いる場合、変換後の検索条件のキー
ワードに対する重みの計算式(31)(32)式は、各々(36)(3
7)式のようになり、副文書確度の計算式(34)、文書確度
の計算式(35)は、各々(38)(39)式のようになる。
【0051】
【数20】
【0052】よって、利用者は自分の好みに合った検索
方式を選択でき、検索効率が上がるものとなる。
【0053】さらに、本発明の第三の実施例を図3ない
し図5により説明する。本実施例は、前述した実施例を
本出願人により既提案のローカルエリアネットワーク
(LAN)利用によりネットワーク構成した検索システ
ムに適用したものである。即ち、図3に示すように1つ
の共通なデータ管理ユニット21に対してLAN22を
介して接続された複数の検索ユニット23上で、任意に
文書検索できるようにしたものである。
【0054】まず、データ管理ユニット21は複数の利
用者によって共通に用いられるデータを管理するもので
あり、本システム中では唯1つだけ設けられる。構成的
には図4に示すように構成され、図2に示した例であれ
ば、その構成中から、各ファイル11,12,13、フ
ァイル管理部10及び利用者管理部14が抜き出されて
いる他に、LAN22に接続するためのネットワークイ
ンタフェース24が付加された構成とされている。な
お、データ管理ユニット21の利用者管理部14中には
アクセス制御部が設けられており、検索ユニット23の
要求を解析しファイル11〜13に対するアクセス権の
管理、同時アクセスに対する排他処理などを行なう。
【0055】一方、各検索ユニット23は各ユーザの検
索要求を処理するものであり、LAN22に接続されて
いるワークステーション毎に用意される。構成的には、
図5に示すように構成され、図2に示した例であれば、
その構成中から、上記のデータ管理ユニット21に必要
なものを除いた要素1〜8,15に、LAN22に接続
するためのネットワークインタフェース25が付加され
た構成とされている。ここに、KC管理部8はネットワ
ークインタフェース25を介してデータ管理ユニット2
1から読み込んだキーワード結合行列をメモリに格納
し、その管理を行なう。さらに必要に応じて、このKC
管理部8はキーワード結合行列をネットワークインタフ
ェース25を介してデータ管理ユニット21が管理する
KCファイル13に書込む。同様に、書誌情報管理部7
はネットワークインタフェース25を介してデータ管理
ユニット21から読み込んだ文書及び書誌情報をメモリ
に格納し、その管理を行ない、必要に応じて、データ管
理ユニット21側に書き戻す。
【0056】このようなシステム構成において、ワーク
ステーション上の処理は全て検索ユニット23が行な
う。利用者がワークステーションのキーボード1から入
力したデータは、要求処理部4を通して文書検索部6に
伝えられる。この時、検索に必要なデータ(キーワード
結合行列や書誌情報)が既にメモリ上にロードされてい
れば、文書検索部6は検索処理を行ない、結果をディス
プレイ3に表示する。検索に必要なデータがメモリ上に
ロードされていなければ、文書検索部6はネットワーク
インタフェース25,24を介してデータ管理ユニット
21にキーワード結合行列及び書誌情報を要求する。デ
ータ管理ユニット21ではアクセス権のチェックを行な
い、アクセス権が認められればキーワード結合行列及び
書誌情報を要求元の検索ユニット23に転送する。要求
元の検索ユニット23では送られたキーワード結合行列
及び書誌情報をメモリ上に展開し、通常の検索処理を行
なう。この際の処理は、前述した実施例と同様に行なわ
れる。
【0057】このようなシステム構成によれば、データ
管理ユニット21が単一のデータ管理を行なうため、シ
ステムで一貫性のあるデータ管理ができ、個別管理方式
のようなデータコピー等の必要性もなくなる。また、デ
ータ管理ユニット21で検索処理も集中して行なわせる
ことも可能であるが、この場合、多数の利用者からの要
求を1つのユニットが処理しなければならず、キーワー
ド結合行列を用いた処理量が比較的大きい検索処理では
システム全体の処理速度が低下してしまう。この点、本
実施例によれば、検索処理は各検索ユニット23が行な
うため、多数の利用者からの要求が各検索ユニット23
に分散されるため、多数のユーザが同時に使用しても高
い処理性能を維持できるものとなる。
【0058】つづいて、本発明の第四の実施例を図6な
いし図9により説明する。一般に、この種の文書管理装
置では、文書を検索する際に利用者は検索要求を表現す
るためには、キーワードを論理演算子で組合せて検索条
件を作成する必要があり、このような検索条件作成には
専門知識が要求されるため、一般利用者には難しい。そ
こで、利用者が検索要求を自然言語文で入力でき、その
自然言語を解析し、自動的に検索条件に変換する文書管
理装置が、例えば「文献データベースにおける対話型問
い合わせ理解とその評価」として情報処理学会データベ
ースシステム研究会の文献「データベース・システム
78−1」(1990.7.19)等により提案されて
いる。しかし、このような提案例のATRシステムで
は、システムによって生成される検索条件がキーワード
の論理演算子による組合せであり、利用者の検索要求を
完全に表現しているものではない。即ち、利用者の検索
要求の中ではキーワード毎に相対的な重要性が異なるの
が一般的であるが、それが検索条件には反映されないも
のである。
【0059】そこで、本実施例は、利用者による検索要
求の入力として自然言語文の使用を可能としつつ、キー
ワード毎に重要度を自動的に設定し得るようにし、利用
者の検索要求をより正確に検索条件に反映させるように
したものである。
【0060】図6は本実施例の文書管理装置の構成例を
示すブロック図であり、キーワード結合行列を必須とし
ないため、図2との対比ではKC管理部8とKCファイ
ル13とが省略されている。
【0061】本実施例の特徴は、上記のように、利用者
の入力した自然言語文である検索要求から検索条件を自
動的に生成するものであり、かつ、自動生成される検索
条件は、そこに含まれるキーワード毎に重要度が設定さ
れている(重み付けされている)前述したような「ファ
ジィ検索条件」である。
【0062】このようなファジィ検索条件は、 自然言語文の形態素解析 「キーワード判定表」による単語の選択 「一般語表」による単語の重み付け 「関連変換表」による論理演算子の挿入 というフローに従い自動的に生成される。
【0063】例えば、利用者が「文書管理システムにお
ける検索条件生成処理」という自然言語文を検索要求と
して入力した場合を例にとり、各ステップを説明する。
ステップでは、検索要求として利用者が入力した自然
言語文を形態素解析し、単語に分割するとともに、その
品詞を決定する。本例の場合、形態素解析結果は、 文書 管理 システム に おけ る 検索 条件 生成 処理 名詞 名詞 名詞 助詞 動詞 助動詞 名詞 名詞 名詞 名詞 のようになる。
【0064】ステップでは、品詞に基づいて単語の選
択を行なう。この際、品詞毎に単語を検索キーワードと
して用いるか否かを記述した図7に示すようなキーワー
ド判定表26が用いられる。キーワード可能性の欄に○
印の付いている品詞に属する単語のみが検索キーワード
として使用される。ステップでは、ステップで検索
キーワードと判定された単語に対して重要度を設定す
る。検索において一般的な語は文書の選択性が低いた
め、検索キーワードとしての重要度は小さくすべきであ
る。このような単語の重要度を記述したものが図8に示
すような一般語表27である。この一般語表27に記述
されていない語の重要度は1.0に設定される。
【0065】ステップでは、キーワードを結合するた
めの論理演算子が選択される。この際、図9に示すよう
な関連変換表28が用いられる。ここに、“/”は連続
して現れることを示しており、例えば一番上の行は、
「に」、「おけ」、「る」が連続して現れる場合、その
前後をAND(∧)で結合させることを表している。ま
た、この関連変換表28には現れないデフォルトの変換
規則があり、それは「連続する語はANDで接続する」
というものである。
【0066】よって、各ステップ〜による処理結果
は、 ステップ 文書 管理 システム に おけ る 検索 条件 生成 処理 名詞 名詞 名詞 助詞 動詞 助動詞 名詞 名詞 名詞 名詞 ステップ 文書 管理 システム に おけ る 検索 条件 生成 処理 ○ ○ ○ × × × ○ ○ ○ ○ ステップ 文書 管理 システム に おけ る 検索 条件 生成 処理 1.0 1.0 0.4 × × × 1.0 1.0 1.0 0.7 ステップ 文書∧管理∧システム ∧ 検索∧条件∧生成∧処理 1.0 1.0 0.4 1.0 1.0 1.0 0.7 となる。
【0067】即ち、最終的に得られる検索条件は、 Query=1.0/文書∧1.0/管理∧0.4/システム∧1.0/検索
∧1.0/条件∧1.0/生成∧0.7/処理 となる。
【0068】このように作成された検索条件は、前述し
た実施例の場合のファジィ検索条件に対する検索処理と
同様に処理されて検索される。即ち、第1に検索条件の
積標準形への変換を行ない、第2に文書確度を文書毎に
計算し(各副検索条件に対する文書確度=副文書確度の
計算と、最終的な文書確度の計算)、第3に文書を文書
確度順にソートする。
【0069】まず、積標準形の検索条件とは、つぎの(4
0)(41)式のようなものである。ここに、各副検索条件に
おいて否定の付かないキーワードのファジィ集合を(42)
式、否定の付くキーワードのファジィ集合を(43)式で表
すものとする。また、これらのファジィ集合の台集合を
アンダーラインを取ったものとして示す。
【0070】
【数21】
【0071】つぎに、文書毎の文書確度の計算について
説明する。まず、副文書確度の計算につき、ファジィ集
合の和/積集合の計算にmax/minを用いるものとする
と、i番目の文書のh番目の副検索条件に対する副文書
確度ri(h) は(33)式に準じて、(44)式により計算され
る。そして、(34)式に準じて(45)式のように書換えるこ
とができる。このような文書確度の計算式(44)(45)は(3
3)(34)式とは式中の記号F,f、M,mが異なるだけで
あり、内容的には殆ど同じである。
【0072】
【数22】
【0073】全ての副検索条件に対する副文書確度の計
算が終了した後、最終的な文書確度ri を前述した(35)
式により計算する。
【0074】よって、本実施例によれば、自然言語文で
検索要求を入力できるため、検索の知識のない利用者で
も容易に利用できる。また、検索キーワードの重要度が
自動的に計算されるため、通常の方式と比較して、正確
な検索が可能となる。
【0075】つづいて、本発明の第五の実施例を図10
により説明する。基本的構成は、前記実施例と同様であ
り、図6の構成を用いればよい。
【0076】本実施例では、ファジィ検索条件の自動生
成のフローにおいて、ステップとして、「一般語表」
による単語の重み付けに代えて、「分野別一般語表」に
よる単語の重み付けを行なうことにより、キーワードの
重要度を検索の分野に応じて設定し得るようにしたもの
である。即ち、単語の重要性は検索対象の分野によって
大きく変化するので、一般語表を分野毎に分けたもので
ある。
【0077】単語の重要度を設定するに際して、検索の
始めに利用者に分野指定してもらい、その分野に対応す
る分野別一般語表を用いて単語の重要度を設定する。例
えば、利用者の分野指定が「文学」であれば、図10
(a)に示すような文学用の分野別一般語表27aが用い
られ、前述した入力例の場合であれば、生成される検索
条件は Query=0.3/文書∧1.0/管理∧0.8/システム∧1.0/検索
∧1.0/条件∧1.0/生成∧0.5/処理 となる。
【0078】また、分野指定が「情報処理」であれば、
図10(b)に示すような情報処理用の分野別一般語表2
7bが用いられ、前述した入力例の場合であれば、生成
される検索条件は Query=1.0/文書∧1.0/管理∧0.1/システム∧1.0/検索
∧1.0/条件∧0.6/生成∧0.3/処理 となる。
【0079】このように、本実施例によれば、分野によ
って、きめ細かく単語の重要度が設定されるため、より
精密な検索が可能となる。ファジィ検索処理は前記実施
例と同じでよい。
【0080】さらに、本発明の第六の実施例を説明す
る。本実施例は、前述した第四の実施例を前述した第二
の実施例に適用し、キーワード結合行列も活用するよう
にしたものである。即ち、自然言語文による検索要求に
対するファジィ検索条件の自動生成は前述した第四の実
施例に従い行ない、その後の検索処理は、第二の実施例
で示した(28)〜(35)式に従い行なうようにしたものであ
る。
【0081】この場合もファジィ検索条件の自動生成に
際して、第五の実施例のように、分野別の一般語表を用
いるようにしてもよい。
【0082】
【発明の効果】本発明は、上述したようにファジィ集合
表現を選択的に含む検索条件を利用者が入力した場合に
条件解析手段によりファジィ集合表現型の積標準形又は
和標準形に変換し、この検索条件に対する各文書の文書
確度を文書検索手段中の文書確度計算部で予め設定され
た計算式により計算し検索条件に合致した文書を選出す
るようにしたので、検索条件をファジィ集合表現の形で
入力した場合も、処理可能な標準形の検索条件に変換さ
れ、文書確度が求められて必要な文書が検索されるた
め、利用者はよりあいまいな検索条件の指定ができ、キ
ーワード結合行列方式において一層、効率的な文書検索
を行うことができるものとなる。
【図面の簡単な説明】
【図1】本発明の第一の実施例を示すブロック図であ
る。
【図2】本発明の第二の実施例を示すブロック図であ
る。
【図3】本発明の第三の実施例を示すブロック図であ
る。
【図4】そのデータ管理ユニットを示すブロック図であ
る。
【図5】その検索ユニットを示すブロック図である。
【図6】本発明の第四の実施例を示すブロック図であ
る。
【図7】キーワード判定表の構成を示す説明図である。
【図8】一般語表の構成を示す説明図である。
【図9】関連変換表の構成を示す説明図である。
【図10】本発明の第五の実施例を示す分野別一般語表
の構成を示す説明図である。
【符号の説明】
1,2 入力装置 3 表示装置 4 対話処理手段 5 条件解析手段 6 文書検索手段 7 書誌情報管理手段 8 キーワード結合行列管理手段 10 ファイル管理手段 11〜13 データファイル 15 文書登録手段
フロントページの続き (56)参考文献 特開 平2−235176(JP,A) 特開 平1−149127(JP,A) 特開 平1−145721(JP,A) 特開 昭61−248130(JP,A) 特開 平2−1057(JP,A) 特開 平3−129472(JP,A) 梶博行,新田義彦,「文献検索システ ムのファジイモデルとその実現」,電子 通信学会論文誌VOL.J62−4,N O.4,PP297−304(昭和54年4月20 日) 森田哲也,小川泰嗣,小林清彦,「フ ァジイ文書検索システム(1)−実験シ ステムと評価−」,情報処理学会第39回 (平成元年後期)全国大会講演論文集 (▲II▼),pp1067−1068 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力装置及び表示装置の管理を行う対話
    処理手段と、利用者が入力した文書をデータファイルに
    格納させるための文書登録手段と、書誌情報を管理する
    書誌情報管理手段と、キーワード間の関連情報を記述し
    たキーワード結合行列を管理するキーワード結合行列管
    理手段と、文書、書誌情報及びキーワード結合行列の各
    データファイルを管理するファイル管理手段と、前記対
    話処理手段を介して利用者が入力したファジィ集合表現
    を選択的に含む検索条件をファジィ集合表現の標準形に
    変換する条件解析手段と、変換された標準形の検索条件
    に対する各文書の適切さを表す値を文書確度と定義して
    この標準形の検索条件に対して予め設定された計算式に
    より書誌情報、キーワード結合行列等の情報に基づき文
    書確度を計算する文書確度計算部を有して検索条件に合
    致した文書を選出する文書検索手段とよりなることを特
    徴とする文書管理装置。
  2. 【請求項2】 検索条件の標準形を積標準形としたこと
    を特徴とする請求項1記載の文書管理装置。
  3. 【請求項3】 検索条件の標準形を和標準形としたこと
    を特徴とする請求項1記載の文書管理装置。
JP03284484A 1991-03-29 1991-10-30 文書管理装置 Expired - Fee Related JP3088805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03284484A JP3088805B2 (ja) 1991-03-29 1991-10-30 文書管理装置

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP6580791 1991-03-29
JP14857991 1991-06-20
JP3-219502 1991-08-30
JP3-65807 1991-08-30
JP3-148579 1991-08-30
JP21950291 1991-08-30
JP03284484A JP3088805B2 (ja) 1991-03-29 1991-10-30 文書管理装置

Publications (2)

Publication Number Publication Date
JPH05114000A JPH05114000A (ja) 1993-05-07
JP3088805B2 true JP3088805B2 (ja) 2000-09-18

Family

ID=27464622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03284484A Expired - Fee Related JP3088805B2 (ja) 1991-03-29 1991-10-30 文書管理装置

Country Status (1)

Country Link
JP (1) JP3088805B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3275612B2 (ja) * 1995-02-28 2002-04-15 三菱電機株式会社 ファジィシソーラス生成装置
CN107818091B (zh) * 2016-09-12 2023-01-06 百度在线网络技术(北京)有限公司 文档处理方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
梶博行,新田義彦,「文献検索システムのファジイモデルとその実現」,電子通信学会論文誌VOL.J62−4,NO.4,PP297−304(昭和54年4月20日)
森田哲也,小川泰嗣,小林清彦,「ファジイ文書検索システム(1)−実験システムと評価−」,情報処理学会第39回(平成元年後期)全国大会講演論文集(▲II▼),pp1067−1068

Also Published As

Publication number Publication date
JPH05114000A (ja) 1993-05-07

Similar Documents

Publication Publication Date Title
JP3755134B2 (ja) コンピュータベースの適合テキスト検索システムおよび方法
US7693910B2 (en) Method of searching documents and a service for searching documents
US5873076A (en) Architecture for processing search queries, retrieving documents identified thereby, and method for using same
US5675788A (en) Method and apparatus for generating a composite document on a selected topic from a plurality of information sources
US5659742A (en) Method for storing multi-media information in an information retrieval system
US6499030B1 (en) Apparatus and method for information retrieval, and storage medium storing program therefor
US20050108200A1 (en) Category based, extensible and interactive system for document retrieval
JP3266586B2 (ja) データ分析システム
JPH0424869A (ja) 文書処理システム
WO1997010557A1 (en) Method for categorizing documents into subjects
JPH021057A (ja) 文書検索装置
CN110633264B (zh) 应用专利数据库的研发辅助系统及其方法
CN110569289B (zh) 基于大数据的列数据处理方法、设备及介质
WO2020123689A1 (en) Suggesting text in an electronic document
JP3315781B2 (ja) 利用者情報管理装置、情報フィルタ、情報分類装置、情報再生装置、情報検索装置及び仮名漢字変換装置
JP2008243024A (ja) 情報取得装置、そのプログラム及び方法
JP3356519B2 (ja) 文書情報検索装置
Abimbola et al. A noun-centric keyphrase extraction model: Graph-based approach
JP2829745B2 (ja) 文書検索装置
JP3088805B2 (ja) 文書管理装置
JPH04152468A (ja) 文書検索装置
JP3418876B2 (ja) データ・ベース検索装置および方法
WO1997010537A2 (en) Method and apparatus for identifying textual documents and multi-media files corresponding to a search topic
JP2000105769A (ja) 文書表示方法
JP2954949B2 (ja) 文書検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070714

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080714

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees