JP3311778B2 - 類似情報検索装置 - Google Patents

類似情報検索装置

Info

Publication number
JP3311778B2
JP3311778B2 JP14752892A JP14752892A JP3311778B2 JP 3311778 B2 JP3311778 B2 JP 3311778B2 JP 14752892 A JP14752892 A JP 14752892A JP 14752892 A JP14752892 A JP 14752892A JP 3311778 B2 JP3311778 B2 JP 3311778B2
Authority
JP
Japan
Prior art keywords
importance
information
knowledge
model
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14752892A
Other languages
English (en)
Other versions
JPH05342276A (ja
Inventor
雅一 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP14752892A priority Critical patent/JP3311778B2/ja
Publication of JPH05342276A publication Critical patent/JPH05342276A/ja
Application granted granted Critical
Publication of JP3311778B2 publication Critical patent/JP3311778B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、事例ベース推論システ
ムや類似データ検索システムに必要な類似知識や特徴付
け知識等の情報を自動的に生成し、且つこれらの知識を
利用して最良類似情報を検索する類似情報検索装置に関
する。
【0002】
【従来の技術】近年、エキスパートシステムは製造業か
ら金融、流通業など幅広い分野で実用化されるようにな
ってきた。
【0003】ところで、かかるエキスパートシステムを
構築するには、対象分野の質問(以下問題と呼ぶ)解決
知識をシステムに十分に入力する必要があるため、推論
方式により新しく発生した問題の解を過去に発生した事
例から求める事例ベース推論が知識獲得負荷を減少させ
るものとして注目を集めている。
【0004】しかし、この事例ベース推論システムにお
いて、必要な知識を構築するには最良事例を検索するた
めに必要な「特徴付け知識」や「類似知識」、選択され
た事例を問題に適合するように修正する「修正知識」な
ど多種多様な知識が必要になる。特に与えられた問題に
対象領域の構造を考慮しながら最も類似した事例を決定
する「特徴付け知識」、「類似知識」は、推論結果の信
頼性を決定する重要なファクターとして完全、且つ矛盾
のないことが要求される。従って、与えられた問題状況
によって、検索の観点が変化するため、問題状況を類似
性の観点で整理しなければならない。
【0005】現在、与えられた問題を網羅的に想定しな
がら専門家が「類似知識」や「特徴付け知識」を明らか
にして、システム設計者がこれらの知識を獲得してシス
テム化する作業を行っている。しかし、このような作業
は複雑な対象領域を扱うほど指数関数的に困難になって
くる。
【0006】一方、類似データ検索機能を持つシステム
として、知的データベースシステムが知られている。こ
の知的データベースシステムは、検索システムを構築す
るため、類似性に関する知識が必要になるが、このよう
な知識は専門家が無意識に用いたり、曖昧であったりす
るため、明確に整理することが難しいものとなる。この
ため、類似データの検索結果が人間の直観的な判断と合
わないことがあり、類似性尺度に関する知識をいかにし
て人間の直観的判断と合う形で表現するかということが
知的データベースを構築する上で大きな問題となってい
る。
【0007】
【発明が解決しようとする課題】このように従来の事例
ベース推論システムや類似データ検索システムにおいて
は、情報の構築に際して、必要な類似性尺度に関する情
報を予め完全に与えておくことは困難である。特に検索
する対象領域が曖昧で明確でない場合には、「特徴付け
知識」、「類似知識」を専門家から獲得し、システムが
利用できる形式で記述することは困難である。
【0008】本発明は、このような問題を解決するため
に、個々の質問状況にあった類似性尺度に関する情報を
導き出す「特徴付け知識」、「類似知識」を自動的に生
成すると共に、その知識を利用して最良類似情報を検索
することができる類似情報検索装置を提供することを目
的とする。
【0009】
【課題を解決するための手段】本発明は上記の目的を達
成するため、次のような手段を講じたものである。
【0010】知識情報が蓄えられた情報蓄積装置より知
識情報を取込んでその特徴付け知識と類似知識とを得、
これらの情報を用いて質問情報との類似比較により類似
情報を検索する類似情報検索装置において、前記情報蓄
積装置より適宜数の知識情報を例題として取込むと共
に、これら各例題に対する情報間の優先順序付けにより
個々の例題の類似知識を抽出するための重要度テーブル
を作成する重要度テーブル作成手段と、この重要度テー
ブル作成手段より得られる個々の例題の重要度テーブル
の情報を合成して重要度モデルを生成すると共に、検索
対象領域における類似知識を生成する重要度モデル抽出
手段と、この重要度モデル抽出手段より重要度モデルを
取込んで前記例題間の類似度を計算して検索対象領域に
固有な特徴付け知識を抽出する特徴モデル抽出手段とか
らなる知識獲得システムを備えたものである。
【0011】また、知識情報が蓄えられた情報蓄積装置
より知識情報を取込んでその特徴付け知識と類似知識と
を得、これらの情報を用いて質問情報との類似比較によ
り類似情報を検索する類似情報検索装置において、前記
情報蓄積装置より適宜数の知識情報を例題として取込む
と共に、これら各例題に対する情報間の優先順序付けに
より個々の例題の類似知識を抽出するための重要度テー
ブルを作成する重要度テーブル作成手段、この重要度テ
ーブル作成手段より得られる個々の例題の重要度テーブ
ルの情報を合成して重要度モデルを生成すると共に、検
索対象領域における類似知識を生成する重要度モデル抽
出手段およびこの重要度モデル抽出手段より重要度モデ
ルを取込んで前記例題間の類似度を計算して検索対象領
域に固有な特徴付け知識を抽出する特徴モデル抽出手段
からなる知識獲得システムと、質問情報に対して前記知
識獲得システムの特徴モデル抽出手段より得られる特徴
付け知識を用いて特徴モデルを生成する特徴モデル選択
手段、前記質問情報に対して前記知識獲得システムの重
要度モデル抽出手段より得られる類似知識を用いて重要
度モデルを選択する重要度モデル選択手段および前記特
徴モデル選択手段で生成された質問情報の特徴モデル情
報と前記重要度モデル選択手段で選択された重要度モデ
ル情報とから質問情報に最も類似した情報を前記情報蓄
積装置より検索する最良事例検索手段からなる類似検索
システムとを備えたものである。
【0012】
【作用】このような構成の類似情報検索装置にあって
は、重要度テーブル作成手段により情報蓄積装置より取
込んだ適宜数の例題に対する情報間の優先順序付けによ
り個々の例題の類似知識を抽出するための重要度テーブ
ルを作成し、この重要度テーブルを重要度モデル抽出手
段に与えて個々の例題の重要度テーブルの情報を合成す
ることにより重要度モデルを生成すると共に、検索対象
領域における類似知識を生成し、さらに特徴モデル抽出
手段により例題間の類似度を計算して検索対象領域にお
ける特徴領域を抽出するようにしたので、対象領域おけ
る属性の重要性について定量的、且つ定性的に獲得する
ことができる。すなわち、事例ベース推論システムや類
似データ検索システムの構築時に必要となる「類似知
識」や「特徴付け知識」を例題同志の類似性を問合わせ
るだけで自動的に獲得することができる。
【0013】また、上記のような知識獲得システムを利
用して、特徴モデル選択手段により質問情報に対して特
徴モデル抽出手段より得られる特徴付け知識を用いて特
徴モデルを生成し、重要度モデル選択手段により質問情
報に対して重要度テーブル作成手段より得られる類似知
識を用いて重要度テーブルを選択して、これら特徴モデ
ル情報と重要度テーブル情報とを用いて質問情報の特徴
と重要度を生成することにより、質問情報に最も類似し
た情報を情報蓄積装置より検索することが可能となる。
【0014】
【実施例】以下本発明の一実施例を図面を参照して説明
する。
【0015】図1は本発明による類似情報検索装置のシ
ステム構成例を示すもので、本システムは大きく機能的
に分けて、知識獲得部Nと事例検索部Sとから構成され
ている。
【0016】図1において、知識獲得部Nは事例検索に
必要となる類似知識と特徴付け知識を獲得する機能を有
するもので、重要度テーブル作成部1と、重要度モデル
抽出部2と、特徴モデル抽出部3とから構成されてい
る。また、事例検索部Sは特徴モデル選択部4と、重要
度モデル選択部5と、最良事例検索部6とから構成され
ている。
【0017】さらに、7は検索対象領域の過去の問題解
決として採取された経験的事例を格納した事例ベース、
8は事例ベース7からランダムにサンプリングされる適
当数の事例が格納される例題ベース、9は属性毎の重要
度を記述したテーブルと属性内で取り得る値間の概念距
離を記述した概念距離テーブルから構成された類似知識
ファイル、10は事例ベース7から一次検索を行うイン
デックスを生成するための知識データが記述された特徴
付け知識ファイルである。
【0018】ここで、重要度テーブル作成部1は、図2
に示すように膨大な事例を含むサンプルが格納された事
例ベース7から相当数のサンプルをランダムに取り出し
て例題ベース8に格納する例題取出機能1aと、この例
題取出機能1aにより取出されたサンプルを専門家に例
題として提示すると共に、サンプル間の優先順序付けを
回答として入力させる類似テスト機能1bと、この類似
テスト機能1bより得られる回答を取込んで線形計画法
に基づき個々のサンプルが持つ重要度テーブルを作成す
る重要度テーブル作成機能1cとを有し、この重要度テ
ーブルはメモリ11に格納される。
【0019】重要度モデル抽出部2は、図3に示すよう
にメモリ11に格納された重要度テーブルを参照しなが
ら、個々のサンプルをサンプル群としてグループ化し、
重要度テーブルを合成し、この合成された重要度テーブ
ルと例題ベース8より取込まれた例題により最終的に数
個の一般的な重要度テーブルに絞り込む重要度テーブル
合成機能2aと、、これら絞り込まれたサンプル群と重
要度テーブルの対を重要度モデルの特徴として生成する
重要度モデルの特徴生成機能2bとを有し、この重要度
モデルの特徴をメモリ12に格納すると共に、これらモ
デルから類似知識を抽出して類似知識ファイル9に書込
まれる。
【0020】特徴モデル抽出部3は、図4に示すように
メモリ12に格納された重要度モデル群と例題ベース8
よりサンプル群を取込んで、全サンプル間の類似度を計
算する類似マトリックス計算機能3aと、その計算結果
からサンプル相互の結合度を調べ、結合力の強いグルー
プを検出する強結合検出機能3bと、この強結合検出機
能3bにより検出されたグループの共通属性を機能的に
調べてグループの記述を一般化することで特徴モデルを
抽出する特徴付け知識抽出機能3cとを有し、この特徴
モデルは特徴付け知識ファイル10に書込まれる。
【0021】図5は特徴付け知識ファイル10の例を示
すものである。特徴付け知識は、事例ベース7から1次
検索を行うインデックスを生成するための知識であり、
この例ではインデックス生成手続きをルール型で記述し
ている。1番のルールは、「車種をインデックスせよ」
ということを意味している。
【0022】図6は類似知識ファイル9の一例を示すも
のである。類似知識は、属性毎の重要度を記述したテー
ブルと属性内で取り得る値間の概念距離を記述した概念
距離テーブルから構成される。従って、この対象では6
属性を持つので、最低限、1つの重要度テーブルと6つ
の概念距離テーブルを用意する必要がある。本実施例で
は、重要度と概念距離は0以上1以下の数として設定し
ている。重要度テーブル内の値が大きいほど、その項目
の重要性が高いことを意味し、概念距離テーブルの属性
内の値が大きいほど、その属性値間が概念的に近いこと
を意味している。
【0023】一方、特徴モデル選択部4は、ユーザから
与えられた問題に対して特徴付け知識ファイル10に書
込まれた特徴付け知識を用いて問題に対する特徴モデル
を決定するもので、この特徴モデルはメモリ13に格納
される。
【0024】重要度モデル選択部5は、ユーザから与え
られた問題が類似知識ファイル9内のどの重要度モデル
に属するかを決定するもので、ここで決定された重要度
モデルはメモリ14に格納される。
【0025】最良事例検索部6は、特徴モデル選択部4
と重要モデル選択部5より出力された特徴付け情報と類
似情報を用いて事例ベース7から最良事例を検索するも
のである。
【0026】次に上記のように構成された類似情報検索
装置の作用を述べるに、ここでは事例ベース7に過去の
車の診断事例が大量に蓄えられている場合を想定して具
体的に説明する。
【0027】まず、知識獲得部Nにおいて、「類似知
識」や「特徴付け知識」を獲得する場合について図7お
よび図8に示すフローチャートを参照しながら述べる。
いま事例ベース7に図9に示すような過去の診断状況と
故障原因の記述がセットされた診断事例が蓄えられてい
るものとする。すなわち、図9において、例えば事例1
では、工場Xで85年に製造された車種Aの排気量2000
の白い車が、気温が高い状態でエンジンがかからなかっ
た。そして、その診断結果はバッテリー不良であること
が判明したことを示している。このような過去の問題解
決として採取された経験的な診断事例が大量に蓄えられ
ている。
【0028】このような状態にあるとき、ステップS1
にて事例ベース7より適当数の事例をランダムにサンプ
リングして取出し、これらを例題ベース8に格納する。
図10は例題ベース8に格納された大量の事例から取扱
い易いサイズの部分集合をランダムにサンプリングした
情報を示している。例題ベース8においては、取扱い易
いサイズの部分集合としてサンプル1,サンプル2,…
…がサンプリングされたことを意味している。この例題
ベース8に格納されたサンプルを、ステップS2にて専
門家に提示し、類似テストを実行する。図11はサンプ
ル全体に対して類似テストを専門家が行った回答例を示
している。
【0029】この場合、知識獲得部Nは、専門家にサン
プルを対話的に1つ1つ提示し、他のサンプルとの類似
性において、例題ベース内のサンプルの優先順位付けを
要求する。ただし、優先順位付け対象範囲を必ずしもサ
ンプル全体にする必要はない。また、専門家は、個々の
サンプルを画面で見ながら類似度が高いと判断されるサ
ンプルを並べて行く。例えばサンプル1と最も類似して
いるサンプル全体の要素は当然、サンプル1である。そ
の次にサンプル3、サンプル4、……と専門家は選択し
たことを示している。
【0030】このようにして類似テストが実行される
と、ステップS3にて専門家により1サンプルの類似テ
スト結果を読込み、ステップS4にて重要度テーブルを
変数化して線形計画法により標準形にする。そして、ス
テップS5にて単体法により最適な重要度テーブルの生
成を試みる。ステップS6にて単体法の結果が一義的に
決まらない(有限でない)場合には、ステップS7にて
専門家にサンプルに対する類似テストを要求し、ステッ
プS4に戻って優先度情報をテスト結果に追加する。ま
た、可能解が存在しない場合には、ステップS8にて類
似テスト結果の優先順位の低いサンプルを除外し、ステ
ップS4に戻る。ステップS6にて単体法の結果が定ま
った値であれば、ステップS9にて出力する。この場
合、線形計画法を初めとする数理計画法が取り扱う問題
は、主問題、双対問題にしても、 (i)最適解が存在する (ii) 可能解が存在するが目的関数が有限でない (iii)可能解が存在しない の3つの場合があり得る。ステップS7,S8は(ii)
,(iii)の場合に対する処理を行っている。
【0031】ここで、重要度テーブルの作成について具
体的に説明する。図12は、個々のサンプルに対して重
要度テーブルを作成していく例であり、サンプル1に対
する類似テストから重要度テーブルを作成する過程を示
している。重要度テーブルは、過去の問題であるサンプ
ルの診断状況に応じて様々な重み付けで存在している。
従って、サンプル1に対する重要度テーブルを変数化
し、サンプル1の類似テストを最も良く満足する具体値
を設定することが必要となる。車種にはW1、気温には
W2、製造年にはW3、……というように、属性に対応
する6つの変数を用意する。ここで、変数化された重要
度テーブルと専門家によって入力される6つの概念距離
テーブルのデータを使って、類似テストを類似計算によ
って再現する。サンプル1とサンプル1の類似度は、1
×W1+1×W2+……となり、サンプル1とサンプル
2の類似は、0.4×W1+0.6×W2+……とな
る。
【0032】以上のようにサンプル1の類似テストにお
いて対象としたサンプルとの類似性を全て類似度によっ
て表現する。ここで、サンプル1>>サンプル3>> サンプ
ル4>>……なので、次のような不等式が成立する。 1×W1+1×W2+……>0.4×W1+0.6×W
2+…… また、重要度テーブルの重要度は、全て0以上1以下の
数なので、 W1≦1 W2≦1 W3≦1 W4≦1 W5≦1
W6≦1 W1≧0 W2≧0 W3≧0 W4≧0 W5≧0
W6≧0(非負制約式)となる。以上の不等式の集合か
らなる線形制約条件式を満足する解が無数存在する場合
があるので、経験的な評価関数を用意する。
【0033】いま、仮にW1+W2+W3+W4+W5
+W6を最大にするという評価関数(目的関数)を設定
する。この評価関数は、様々設定可能である。これらは
線形計画法の一種である単体法の標準形になっているの
で、評価関数を最大にするという条件を満足する変数の
組合わせを計算することができる。 W1=0.4、W2=0.7、W3=0.3、W4=
0.5、W5=0.1、W6=0.2 この式では、属性2、つまり気温が重要であるというこ
とを意味している。ただし、ある制約条件式では線形計
画法の解が存在しない場合があるので、その場合に対す
る対処も必要である(ステップS7またはステップS
8)。
【0034】図13は重要度テーブル作成部1より出力
された結果を示している。図12で示したように類似テ
ストのサンプル比較を行い、その結果に線形計画法を適
用することにより、サンプル固有の重要度テーブルが作
成される。従って、類似テストの回数に応じた個数の重
要度テーブルが出力される。図12にはサンプル1、サ
ンプル2、……に固有であり、かつ最適化された重要度
テーブルが生成されている。
【0035】このようにして重要度テーブル作成部1で
重要度テーブルが作成され、重要度モデル抽出部2に入
力されると、この重要度モデル抽出部2では図8に示す
ステップS10にて入力された重要度テーブル同志を合
成することで重要度モデルの生成を行い、続いてステッ
プS11にて重要度テーブルの一般的な状態としての重
要度モデルの定性的な特徴付けを行う。このような処理
を行っているのは、重要度テーブル作成部1に入力され
た重要度テーブルが、1つ1つのサンプルに固有なもの
であり、検索時に利用するにはテーブル数が多過ぎるた
めである。一般的に対象領域における類似知識は、数種
類の重要度テーブルで大半の類似度知識を説明してしま
うことが多く、より一般的なパターンに洗練化しておく
ことが必要である。
【0036】図14はステップS10におけるモデル生
成結果を示す。ここで、重要度モデル1とは、サンプル
1、サンプル4、サンプル5の重要度テーブルを合成し
た結果として、[W1=0.5、W2=0.7、W3=
0.5、W4=0.4、W5=0.1、W6=0.9]
が生成されたことを示している。以降サンプル1,サン
プル4、サンプル5は重要度モデル1の「モデル例題」
であると呼ぶことにする。
【0037】図15はステップS10のモデル生成アル
ゴリズムを示す。属性毎の重要度の値が近いサンプルの
重要度テーブルのペアー1,2に対して、合成計算を行
い、類似テスト1,2と大きく矛盾するような結果を導
き出さないならば、合成された重要度テーブル(1,
2)を追加し、重要度テーブル1,2を削除する。
【0038】このようなオペレーションを重要度テーブ
ル群に対して任意に適用することでより一般的な重要度
テーブルである重要度モデルを生成し、全体としてのテ
ーブル数を減少させる。ここで、重要度テーブル間の合
成計算には、いくつかの方法が考えられる。最も簡単な
計算方法として、(i)属性毎に平均を取ることが考えら
れる。また、(ii) 車種にはW1、気温にはW2、製造
年にはW3、……というように、属性数に対応する6つ
の変数をもう一度用意して2つの類似度テストを最も良
く説明する具体値を単体法によって生成することも考え
られる。
【0039】図16はステップS11における重要度モ
デルの特徴抽出結果を示す。重要度モデル1の例題であ
るサンプル1、サンプル4、サンプル5の共通属性を抽
出し、事例検索時におけるモデル選択の条件部を生成す
る。このような例から一般的知識を生成する技術を帰納
推論と呼ぶ。分類木を作るのに適した帰納推論アルゴリ
ズムであるID3手法(参照クインラン)や一般化学習
手法を用いることによって、サンプル1、サンプル4、
サンプル5の共通的な特徴を車種がAまたはBで製造年
が89以上で工場Xで生産されたという記述を得ること
が可能である。従って、問題が車種がAまたはBで製造
年89以上で工場Xで生産されたのであれば、重要度テ
ーブル[車種の重要度=0.4、気温の重要度=0.
7、……]を選択し、類似計算を行えば、過去の統計に
より信頼性の高い類似性の評価が行えることになる。つ
まり、重要度モデルのモデル例題の共通的な特徴を重要
度モデルの適用条件と見なすことができる。この重要度
モデル抽出部2より最終的に出力された知識は類似知識
ファイル9に登録される。
【0040】かくして、重要度モデル抽出部2で生成さ
れた全ての重要度モデルが特徴モデル抽出部3に入力さ
れると、この特徴モデル抽出部3では問題を特徴付ける
知識を生成してこれを出力する。この知識は、検索時に
おいて、新しい問題が与えられた時に類似している事例
候補を事例ベース8から検索するためのインデックスと
なる。具体的には図8に示すステップS12にてサンプ
ル間の類似マトリックスを計算し、ステップS13にて
サンプル間の類似結合が強いサンプル群(強結合)を検
出する。そして、ステップS14にて強結合から特徴付
け知識を獲得する。
【0041】図17はステップS12で処理されたサン
プル間の類似マトリックスの例を示す。重要度モデル抽
出部2で事例ベース7からサンプリングされたn個のサ
ンプル同志の類似度は、モデル例題として属する一般的
なパターンである重要度モデルによって計算可能であ
る。類似マトリックスとは、nサンプリング間の全ての
組合わせの類似度をn×nのマトリックスの升目に埋め
込んだ結果である。
【0042】図18はステップS13における強結合の
例である。ここで、強結合とは、その要素であるmサン
プル相互の類似度が基準以上のサンプル集合である。こ
こでは、サンプル1とサンプル3、サンプル1とサンプ
ル4、サンプル3とサンプル1、サンプル3とサンプル
4、サンプル4とサンプル1、サンプル4とサンプル3
が基準である閾値1.5を越えたので、[サンプル1、
サンプル3、サンプル4]を強結合として認識する。閾
値は任意に設定可能なので、値を上げれば厳密な強結合
が得られるが、強結合の総数は少なくなり、値を下げれ
ばその逆というトレードオフの関係が存在している。従
って、段階的に閾値を上昇、あるいは下降するように設
定すれば、様々なレベルの強結合が生成可能である。ス
テップS13で生成された強結合を特徴モデルと呼ぶ。
【0043】図19はステップS14における特徴モデ
ルに対する特徴抽出の例を示すものである。図16にお
いて、重要モデルの特徴を生成したが、同様な手法を用
いて特徴モデルの特徴を特徴付け知識として抽出する。
閾値1.5における特徴モデル1の共通属性値は、車種
がAで気温が低いということである。最終的にこれらの
知識を知識付け知識として特徴付け知識ファイル10に
記録する。
【0044】図20は類似知識ファイル9、図21は特
徴付け知識ファイル10の一例を示す。特徴付け知識は
抽出基準となる閾値の設定に依存して、様々なレベルの
特徴モデルが生成されていることが分かる。ここでは、
閾値1.5と閾値1.0の特徴モデルが記述されてい
る。
【0045】次にこのようして知識獲得部Nによって獲
得された「類似知識」や「特徴付け知識」を利用してユ
ーザより事例検索部Sに与えられた問題に最も類似した
事例を検索する場合の作用について述べる。
【0046】現在、ある車がエンジンの故障を起こした
ときに原因を探ろうとするユーザが、現在の診断状況と
本質的に類似している過去の診断経験である事例を検索
し、その中で状況的に最も類似している事例を選択する
ことで、現在の故障原因を探ろうとしている。そこで、
選択された最良事例の診断原因を用いて車のエンジンの
故障を診断することになる。ただし、現在の診断状況と
検索された事例の状況には、一般に多くの類似点や相違
点がある。これらの類似点や相違点としては、多くの類
似点があっても、適合を無効にするするような重要な相
違点を持つ場合や、逆に相違点が本質的でない場合もあ
る。従って、与えられた診断状況に表面的でなく、本質
的な部分で類似性の尺度を設定しなければ、誤った診断
事例を検索することになる。
【0047】まず、入力問題に対して事例を検索する場
合のシステム全体の作用について述べる。いま、検索対
象領域として図22に示すような特徴付けがなされてい
るものとする。すなわち、検索対象領域には事例の記述
可能な項目として、車種、気温、製造年、工場、排気
量、色が存在する。車種はA,B,Cの3値を取り得
る。気温は高い場合と低い場合が値として存在する。こ
のように事例と問題は、これらの属性の値の組合わせと
して捉らえることができる。
【0048】図23は過去の診断事例集合、つまり事例
ベースから最も類似する事例を検索する場合の処理の流
れを示すものである。図23においては、入力問題とし
て工場Xで90年に製造された車種Aの排気量2000の白
い車が気温が低い状況でエンジンがかからなかったこと
を診断状況としている。いま、事例ベース7から最も状
況的に類似する診断事例を検索する必要があるが、その
検索手続きは大まかに特徴付け、候補検索、最良事例選
択から成立つ。特徴付けは事例検索処理を行うために大
量に蓄えられた事例ベースから候補を選択するインデッ
クスを生成することである。このインデックスは、問題
の本質的な特徴を意味するので、問題解決に関連する必
要十分な知識であることが望ましい。そこで、STEP
15では、特徴付け知識10を用いて入力された問題に
マッチする特徴モデルを取出し、車種属性の属性値がA
またはBで、気温属性の属性値が低く、排気量属性の属
性値が1500以上であるというインデックスを生成する。
候補検索は、インデックスを満足する事例を最良事例候
補として検索することである。STEPS16は、事例
ベース7からインデックスを満足する候補を検索した結
果を示す。最良事例検索は、類似知識を用いて候補の評
価付けを行い、任意の基準を満足する事例を選択する。
STEPS17では、類似知識を用いて問題と候補間の
類似計算を行い、類似度を算出する。類似度は、現在の
問題に含まれる属性項目と属性値、および候補に含まれ
る属性項目と属性値同志を比較することによって計算さ
れるが、一般的に以下のような属性毎の重要度と属性内
の属性値間の概念距離の積の総和で得ることができる。
【0049】STEP18では、類似度に基づき候補を
並び替え、基準以上のものを最良事例として選択する。
STEP19では、事例19が状況的に最も類似した事
例として選択される。次に事例検索部Sの具体的な作用
について述べる。
【0050】ユーザから新たな問題が事例検索部Sに与
えられると、この事例検索部Sでは、入力問題に類似し
た最良事例を検索するが、その前処理として問題の特徴
であるインデックスを生成する。特徴モデル選択部4は
インデックス生成帰納を持つモジュールであり、次のよ
うな処理を行う。すなわち、図24に示すように、まず
STEP20にて閾値を設定し、STEP21にて閾値
以上の結合力を持つ特徴モデル群を特徴付け知識ファイ
ル10から取出す。次にSTEP22では閾値以上の結
合力を持つ特徴モデルが存在しなければ、特徴モデル抽
出部2において類似モデルを生成する。STEP23に
て現問題にマッチする特徴モデルが存在すれば、その特
徴モデルをインデックスとして利用する。そして、ST
EP24にてSTEP22の特徴抽出実行後も特徴モデ
ルが存在しなければ段階的に閾値を下げて行き、STE
PS21に戻る。
【0051】図25は、特徴モデル選択部4の例であ
る。図19における特徴付けファイルを対象として、閾
値1.5から段階的に下げて行くことで、特徴モデルが
問題[車種=A、気温=低、……]にマッチする特徴モ
デルとして特徴付け知識ファイルより選択された。特徴
モデルの記述は、[車種=AまたはB、……]であり、
インデックスとして出力する。
【0052】図26は、重要度モデル選択部の手続きを
示すものである。重要度モデル選択部では、現問題が重
要度モデル抽出部2で生成された重要度モデル群のどれ
に該当するかを決定し、STEP25では類似知識ファ
イル内の重要度モデルの適用条件と現問題がマッチして
いれば、その重要度テーブルを選択する。STEP26
では、マッチしていなければ、ユーザに対し類似テスト
を行い、その結果を満足するような重要度テーブルを選
択する。
【0053】図27は、重要度モデル選択部と特徴モデ
ル選択部で出力された現問題の重要度モデルとインデッ
クスを用いて最良な事例を選択する例を示す。問題のイ
ンデックスは、[車種=AまたはB、……]として設定
された。図21における類似ファイルから現問題が満足
される適用条件を持つ重要度モデル1を選択する。最良
事例検索部において、インデックスを満足する事例を事
例ベース7から最良事例候補として検索する。事例1
3、事例14、事例19、……は候補である。これらの
候補に対して類似評価を行い、最高得点を獲得した事例
19を最良事例として選択する。
【0054】このように本実施例では、与えられた問題
に類似する事例を特徴付け知識と類似知識を用いて、過
去の問題解決として採取された経験事例を事例ベース7
から検索する事例ベース推論システムにおいて、重要度
テーブル作成部1により事例ベース7より取込んだ適宜
数の例題に対する各情報間の優先順位付け情報により個
々の例題の類似知識を抽出するための重要度テーブル群
を作成し、この重要度テーブル群を重要度モデル抽出部
2に与えて個々の例題の重要度テーブルを合成して一般
的な重要度テーブルを生成することで重要度モデルを生
成すると共に、検索対象領域における類似知識を生成
し、さらに特徴モデル抽出部3により重要度モデル群と
サンプル群とから例題間の類似度を計算して検索対象領
域における特徴領域を抽出するようにしたものである。
【0055】従って、専門家が無意識的に着目している
対象領域おける属性の重要性について定量的、且つ定性
的に獲得することができる。すなわち、事例ベース推論
システム構築時に必要となる「類似知識」や「特徴付け
知識」を例題同志の類似性を問合わせるだけで自動的に
獲得することができる。
【0056】また、事例ベース推論システムの利用時に
おいて、特徴モデル選択部4により上述のようにして獲
得された特徴付け知識と類似知識を用いて、入力問題の
特徴と重要度を生成するようにしているので、与えられ
た問題に最も類似した事例を事例ベースから検索するこ
とが可能となる。
【0057】なお、上記実施例では、重要度テーブル作
成部で線形計画法を用いて、重要度テーブルを生成する
場合について述べたが、「事象に対して複雑に絡みあっ
た多数要因の影響を統合化、明確化」できる技術であれ
ば、回帰分析を用いるようにしてもよい。
【0058】また、上記実施例では事例ベース推論シス
テムの場合について述べたが、事例ベースをデータベー
スに置換えたデータ検索システムについても前述と全く
同様に適用実施できるものである。
【0059】
【発明の効果】以上述べたように本発明によれば、個々
の問題状況にあった類似性尺度に関する情報を導き出す
「特徴付け知識」、「類似知識」を自動的に生成すると
共に、その知識を利用して最良類似情報を検索すること
ができる類似情報検索装置を提供できる。
【図面の簡単な説明】
【図1】本発明による類似情報検索装置の一実施例を示
すシステム構成図。
【図2】同実施例における重要度テーブル作成部の機能
説明図。
【図3】同実施例における重要度モデル抽出部の機能説
明図。
【図4】同実施例における特徴モデル抽出部の機能説明
図。
【図5】特徴付け知識ファイルの一例を示す図。
【図6】類似知識ファイルの一例を示す図。
【図7】同実施例における知識獲得部の処理の流れを示
すフローチャート。
【図8】図7に続くフローチャート。
【図9】事例ベースに格納された車の故障診断事例の一
例を示す図。
【図10】例題ベースに格納された事例のサンプル結果
を示す図。
【図11】重要度テーブル作成部において、類似テスト
の例を示す図。
【図12】重要度テーブル作成部において、重要度テー
ブルの作成過程の例を示す図。
【図13】重要度テーブル作成結果を示す図。
【図14】重要度モデル抽出部において、重要度モデル
抽出結果を示す図。
【図15】重要度モデル抽出部におれる抽出手続きを示
す図。
【図16】特徴モデル抽出部において、重要度モデルの
特徴生成結果の例を示す図。
【図17】特徴モデル抽出部において、類似マトリック
スの例を示す図。
【図18】特徴モデル抽出部において、強結合の例を示
す図。
【図19】特徴モデル抽出部において、特徴抽出の例を
示す図。
【図20】類似知識ファイルの例を示す図。
【図21】特徴付け知識ファイルの例を示す図。
【図22】対象の特徴を示す図。
【図23】過去の類似した診断事例を検索する例を示す
図。
【図24】特徴モデル選択部の手続きを示す図。
【図25】特徴モデル選択部の選択結果を示す図。
【図26】重要度モデル選択部の選択手続きを示す図。
【図27】最良事例を検索する例を示す図。
【符号の説明】
1…重要度テーブル作成部、2…重要度モデル抽出部、
3…特徴モデル抽出部、4…特徴モデル選択部、5…重
要度モデル選択部、6…最良事例検索部、7…事例ベー
ス、8…例題ベース、9…類似知識ファイル、10…特
徴付け知識ファイル、11,12,13,14…メモ
リ。
フロントページの続き (56)参考文献 特開 平2−61769(JP,A) 特開 昭62−31430(JP,A) 服部雅一,事例ベース推論における事 例ベース管理機構,情報処理学会 知識 のリフォーメーションシンポジウム論文 集,1993年11月25日,Vol.93 N o.8,p.119−124 西尾章治郎,大規模データベースにお ける発見,情報処理学会研究報告(91− FI−21),1991年5月28日,Vol. 91 No.47,P.1−9 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 知識情報が蓄えられた情報蓄積装置より
    知識情報を取込んでその特徴付け知識と類似知識とを
    得、これらの情報を用いて質問情報との類似比較により
    類似情報を検索する類似情報検索装置において、前記情
    報蓄積装置より適宜数の知識情報を例題として取込むと
    共に、これら各例題に対する情報間の優先順序付けによ
    り個々の例題の類似知識を抽出するための重要度テーブ
    ルを作成する重要度テーブル作成手段と、この重要度テ
    ーブル作成手段より得られる個々の例題の重要度テーブ
    ルの情報を合成して重要度モデルを生成すると共に、検
    索対象領域における類似知識を生成する重要度モデル抽
    出手段と、この重要度モデル抽出手段より重要度モデル
    を取込んで前記例題間の類似度を計算して検索対象領域
    に固有な特徴付け知識を抽出する特徴モデル抽出手段と
    からなる知識獲得システムを備えたことを特徴とする類
    似情報検索装置。
  2. 【請求項2】 重要度テーブル作成手段は、各例題間の
    優先順序付け情報から、線形計画法を用いて例題毎の重
    要度テーブルを作成するようにした請求項1に記載の類
    似情報検索装置。
  3. 【請求項3】 重要度モデル抽出手段は、複数の例題の
    重要度テーブルから一般的な重要度テーブルを合成し、
    その例題と重要度テーブルの対を重要度モデルの特徴と
    して抽出するようにした請求項1に記載の類似情報検索
    装置。
  4. 【請求項4】 特徴モデル抽出手段は、各例題間の重要
    度を計算し、その重要度が互いに基準以上の値を持つ例
    題集合を生成し、その適用条件を抽出するようにした請
    求項1に記載の類似情報検索装置。
  5. 【請求項5】 知識情報が蓄えられた情報蓄積装置より
    知識情報を取込んでその特徴付け知識と類似知識とを
    得、これらの情報を用いて質問情報との類似比較により
    類似情報を検索する類似情報検索装置において、前記情
    報蓄積装置より適宜数の知識情報を例題として取込むと
    共に、これら各例題に対する情報間の優先順序付けによ
    り個々の例題の類似知識を抽出するための重要度テーブ
    ルを作成する重要度テーブル作成手段、この重要度テー
    ブル作成手段より得られる個々の例題の重要度テーブル
    の情報を合成して重要度モデルを生成すると共に、検索
    対象領域における類似知識を生成する重要度モデル抽出
    手段およびこの重要度モデル抽出手段より重要度モデル
    を取込んで前記例題間の類似度を計算して検索対象領域
    に固有な特徴付け知識を抽出する特徴モデル抽出手段と
    からなる知識獲得システムと、質問情報に対して前記知
    識獲得システムの特徴モデル抽出手段より得られる特徴
    付け知識を用いて特徴モデルを生成する特徴モデル選択
    手段、前記質問情報に対して前記知識獲得システムの重
    要度モデル抽出手段より得られる類似知識を用いて重要
    度モデルを選択する重要度モデル選択手段および前記特
    徴モデル選択手段で生成された質問情報の特徴モデル情
    報と前記重要度モデル選択手段で選択された重要度モデ
    ル情報とから質問情報に最も類似した情報を前記情報蓄
    積装置より検索する最良事例検索手段からなる類似検索
    システムとを備えたことを特徴とする類似情報検索装
    置。
JP14752892A 1992-06-08 1992-06-08 類似情報検索装置 Expired - Fee Related JP3311778B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14752892A JP3311778B2 (ja) 1992-06-08 1992-06-08 類似情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14752892A JP3311778B2 (ja) 1992-06-08 1992-06-08 類似情報検索装置

Publications (2)

Publication Number Publication Date
JPH05342276A JPH05342276A (ja) 1993-12-24
JP3311778B2 true JP3311778B2 (ja) 2002-08-05

Family

ID=15432357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14752892A Expired - Fee Related JP3311778B2 (ja) 1992-06-08 1992-06-08 類似情報検索装置

Country Status (1)

Country Link
JP (1) JP3311778B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4427265A (en) * 1980-06-27 1984-01-24 Canon Kabushiki Kaisha Diffusion plate
JP2021117205A (ja) * 2020-01-29 2021-08-10 トヨタ自動車株式会社 情報処理装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
服部雅一,事例ベース推論における事例ベース管理機構,情報処理学会 知識のリフォーメーションシンポジウム論文集,1993年11月25日,Vol.93 No.8,p.119−124
西尾章治郎,大規模データベースにおける発見,情報処理学会研究報告(91−FI−21),1991年5月28日,Vol.91 No.47,P.1−9

Also Published As

Publication number Publication date
JPH05342276A (ja) 1993-12-24

Similar Documents

Publication Publication Date Title
CN109189991B (zh) 重复视频识别方法、装置、终端及计算机可读存储介质
US6484168B1 (en) System for information discovery
US6212526B1 (en) Method for apparatus for efficient mining of classification models from databases
US6665661B1 (en) System and method for use in text analysis of documents and records
US6654744B2 (en) Method and apparatus for categorizing information, and a computer product
EP1209582A2 (en) Document retrieval method and system and computer readable storage medium
CN110299209B (zh) 相似病历查找方法、装置、设备及可读存储介质
CN109408578B (zh) 一种针对异构环境监测数据融合方法
CN110287382B (zh) 一种面向电池生产数据的关联规则的挖掘方法
WO2005008519A1 (en) Combined search method for content-based image retrieval
JP3311778B2 (ja) 類似情報検索装置
CN117290404A (zh) 一种主配网故障处理方法快速检索实用方法及系统
CN111027771A (zh) 景区客流量预估方法、系统、装置及可存储介质
JPH0394375A (ja) 文書検索装置
CN110399528B (zh) 一种自动跨特征推理式目标检索方法
CN114048148A (zh) 一种众包测试报告推荐方法、装置及电子设备
CN110502660B (zh) 一种弱监督下的多距离度量图像检索方法
CN113626686A (zh) 基于用户数据分析的自动推送方法、装置和计算机设备
US20030109940A1 (en) Device, storage medium and a method for detecting objects strongly resembling a given object
CN117131256B (zh) 一种基于aigc的媒体管理系统
CN116825304B (zh) 基于深度互联的在线医疗方法与系统
CN117556118B (zh) 基于科研大数据预测的可视化推荐系统及方法
CN116628216A (zh) 基于非结构化数据的知识图谱构建方法
CN116992144A (zh) 一种基于动态特征识别的数据召回方法
CN114648204A (zh) 一种多场景动态企业综合评价方法及系统

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110524

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees