JPH06282574A - 類似検索装置 - Google Patents

類似検索装置

Info

Publication number
JPH06282574A
JPH06282574A JP5065725A JP6572593A JPH06282574A JP H06282574 A JPH06282574 A JP H06282574A JP 5065725 A JP5065725 A JP 5065725A JP 6572593 A JP6572593 A JP 6572593A JP H06282574 A JPH06282574 A JP H06282574A
Authority
JP
Japan
Prior art keywords
search
similarity
knowledge
attribute
constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5065725A
Other languages
English (en)
Inventor
Riichi Tanaka
利一 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5065725A priority Critical patent/JPH06282574A/ja
Publication of JPH06282574A publication Critical patent/JPH06282574A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】対象領域固有の知識を類似度評価に正確に反映
できる学習機能を備えた類似検索装置を提供する。 【構成】現時点での正解類似順序関係の充足状況を外部
に出力するとともに変更対象とする類似検索知識の指定
を外部から入力して変更対象と指定された類似検索知識
に対して手段15を用いて類似検索知識が類似度に影響
をおよぼす検索条件と検索対象との組を特定し、特定さ
れた検索条件と検索対象との組に関連する正解類似順序
関係を特定し、変更対象と指定された類似検索知識を変
数群として特定された正解類似順序関係を制約条件群と
した制約充足問題を定式化する手段16と、この手段1
6により定式化された問題を解く手段17と、この解を
用いて属性間重要度性知識および属性別類似度知識の一
方あるいは両方を変更する手段14とを含む学習手段2
を備えている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報間の類似性を考慮
した柔軟な検索(類似検索)を実現できる類似検索装置
に関する。
【0002】
【従来の技術】情報処理分野におけるデータ検索や人工
知能分野にける事例ベース推論の事例検索においても類
似検索の重要性が高まっている。
【0003】類似検索とは、検索条件と検索対象との間
の類似性に関する何らかの評価尺度を用いて行う柔軟な
情報検索で、検索条件に厳密に照合する検索対象が存在
しない場合でも、予め設定された評価尺度内において類
似した情報を検索することをいう。
【0004】このような類似検索に際しては、一般的
に、検索条件および検索対象を属性−属性値で表現し、
検索条件と検索対象との間の各属性毎の類似度(以後、
属性別類似度と呼ぶ)に、属性間の相対的な重要性(属
性間重要度)を考慮した類似度の大小で検索を行なう方
式が採用されている。類似度の定義式は、加重和あるい
は加重平均をとるのが一般的である。
【0005】このような方式において、問題になるのは
属性間重要度や属性別類似度を正確に数値表現するのが
困難なことである。しかし、これらの値によって検索さ
れる情報が異なってくるので、その設定を疎かにするこ
とはできない。これらの設定を支援する技術としては、
現在の設定値や設定値間の関係を判り易く表示すること
を目的とした専用エディタを用いる方式やニューラルネ
ットワークを用いて自動学習させる方式などがある。
【0006】しかしながら、専用エディタを用いる方式
は、設定の容易化に寄与できるものの、システムの受取
る情報が設定値そのものであるため、最適設定の問題を
解決することはできない。
【0007】一方、ニューラルネットワークを用いる方
式は、類似評価の正解情報を与えておき、これに合せて
属性間重要度や属性別類似度を学習させるものである。
したがって、この方式では初期に専門家から与えられた
属性間重要度や属性別類似度が考慮されないという欠点
がある。また、たとえば東京−名古屋の距離は、東京−
大阪の距離より短い。したがって、名古屋は東京との類
似度が大阪より大きいといった対象領域特有の知識を反
映させることが困難である。
【0008】
【発明が解決しようとする課題】上述の如く、従来の類
似検索装置にあっては、専門家の判断を正確に反映でき
ないばかりか、対象領域固有の知識を類似度評価に正確
に反映することができない問題があった。
【0009】そこで本発明は、上述した不具合を解消で
きる学習機能を備え、柔軟な類似検索を実現できる類似
検索装置を提供するすることを目的としている。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る類似検索装置では、類似検索知識学習
手段を備えている。
【0011】すなわち、本発明は、複数の属性−属性値
の組によって記述された検索対象を格納してなる検索対
象記憶手段と、複数の属性−属性値の組として表現され
た検索条件に対して属性間の相対的な重要度を評価する
属性間重要度評価知識を格納してなる属性間重要度評価
知識記憶手段と、検索条件と検索対象との組に対して特
定の属性に関する両者の類似度を評価する属性別類似度
評価知識を格納してなる属性別類似度評価知識記憶手段
と、検索条件と検索対象との組に対して前記属性別類似
度評価知識記憶手段に格納されている属性別類似度評価
知識を用いて評価した類似度に前記属性間重要度評価知
識記憶手段に格納されている属性間重要度評価知識を用
いて評価した属性間の相対的な重要度を加味した上で検
索条件と検索対象との間の総合的な類似度を算出する類
似度評価手段と、外部から入力された検索条件に対して
前記類似度評価手段を用いて上記検索条件と前記検索対
象記憶手段に格納されている検索対象との間の類似度を
算出するとともに検索対象を類似度の順序に整列あるい
は選択して外部に出力する類似検索制御手段とを備えた
類似検索装置において、特定の検索条件に対して行なっ
た検索対象の間の類似度の正しい順序関係が前記類似検
索制御手段を介して格納される正解類似順序記憶手段
と、上記特定の検索条件と検索対象との組に対し、その
類似度の評価に影響をおよぼす前記属性間重要度評価知
識記憶手段に格納されている属性間重要度評価知識およ
び前記属性別類似度評価知識記憶手段に格納されている
属性別類似度評価知識からなる類似検索知識を特定する
とともに上記類似検索知識に対して類似度の評価が影響
を受ける検索条件と検索対象との組を特定する知識依存
関係特定手段と、現時点での正解類似順序関係の充足状
況を外部に出力するとともに変更対象とする前記類似検
索知識の指定を外部から入力して変更対象と指定された
類似検索知識に対して前記知識依存関係特定手段を用い
て上記類似検索知識が類似度に影響をおよぼす検索条件
と検索対象との組を特定し、特定された検索条件と検索
対象との組に関連する正解類似順序関係を特定し、変更
対象と指定された類似検索知識を変数群として特定され
た正解類似順序関係を制約条件群とした制約充足問題を
定式化する制約充足問題定式化手段と、この制約充足問
題定式化手段により定式化された制約充足問題を解く制
約充足問題解決手段と、外部から変更対象の指示を受け
ながら前記制約充足問題定式化手段を用いて前記類似検
索知識を調整する問題を制約充足問題として定式化し、
前記制約充足問題解決手段を用いて解いた制約充足問題
の結果を用いて前記属性間重要度性知識および前記属性
別類似度知識の一方あるいは両方を変更する学習制御手
段とを含む類似検索知識学習手段を備えている。
【0012】ここで、前記制約充足問題定式化手段は、
特定された前記変数群と制約条件群だけに限らず、前記
制約条件の充足に影響をおよぼす他の類似検索知識をも
変更対象として変数群に加え、追加された変更対象の類
似検索知識が影響をおよぼす検索条件と検索対象との組
に関係した類似順序関係をも制約条件群に追加すること
を繰り返すことによって、変更対象を拡大し、かつ対応
した制約条件を追加することによって制約充足問題を定
式化する機能を備えていてもよい。
【0013】また、前記類似検索知識学習手段が、前記
類似検索知識に関する類似順序関係以外の対象分野に特
化した制約条件を格納した領域特化制約知識ベースを備
え、さらに前記制約充足問題定式化手段が、前記領域特
化制約知識ベースに格納されている領域特化制約条件を
用いて指定された変更対象に連動して変更対象とすべき
前記類似検索知識を特定し、特定された変更対象の類似
検索知識に関する領域特化制約条件を制約条件として追
加して前記制約充足問題を定式化する機能を備えていて
もよい。
【0014】さらに、前記制約充足問題定式化手段が、
定式化した前記制約充足問題に類似性知識の変更を現在
の設定値からの変化を所定の尺度で最小にするという目
的関数を加えた最適化制約充足問題として定式化する機
能を備え、前記制約充足問題解決手段が、定式化された
前記最適化制約充足問題を解く機能を備えていてもよ
い。
【0015】
【作用】通常の類似度検索の実行は、検索対象記憶手段
と、属性間重要度評価知識記憶手段と、属性別類似度評
価知識記憶手段と、類似度評価手段と、類似検索制御手
段との間で行われる。
【0016】そして、学習に際しては、外部からの指示
で満足すべき類似順序関係を正解類似順序記憶手段に格
納することが行われる。学習において、知識依存関係特
定手段は、検索条件と検索対象の組に対し、その類似度
の評価に影響をおよぼす属性間重要度評価知識記憶手段
に格納されている属性間重要度評価知識および属性別類
似度評価知識記憶手段に格納されている属性別類似度評
価知識からなる類似検索知識を特定し、また逆に類似検
索知識に対し、類似度の評価が影響を受ける検索条件と
検索対象の組を特定する。
【0017】学習処理は、学習制御手段が制御を司る。
学習制御手段は、外部から変更対象の指示を受けながら
制約充足問題定式化手段を用いて、類似検索知識を調整
する問題を制約充足問題として定式化し、制約充足問題
解決手段を用いて制約充足問題を解き、その結果を用い
て属性間重要性知識および属性別類似度知識の一方ある
いは両方を変更する。
【0018】このとき、制約充足問題定式化手段での定
式化の手法およびその解法には次のような幾つかがあ
る。
【0019】すなわち、その第1は、現時点での正解類
似順序関係の充足状況を外部に出力し、変更対象とする
類似検索知識の指定を外部から入力し、変更対象と指定
された類似検索知識に対し、知識依存関係特定手段を用
いて類似検索知識が類似度に影響を及ぼすような検索条
件と検索対象との組を特定し、特定された検索条件と検
索対象の組に関連する正解類似順序関係を特定し、変更
対象と指定された類似検索知識を変数群とし、特定され
た正解類似順序関係を制約条件群とした制約充足問題を
定式化する手法である。
【0020】また、その第2は、上記第1の手法によっ
て特定された変数群と制約条件群だけではなく、制約条
件の充足に影響をおよぼす他の類似検索知識をも変更対
象として変数群に加え、ここで追加された変更対象の類
似検索知識が影響を及ぼす検索条件と検索対象の組に関
係した類似順序関係をも制約条件群に追加する、という
ことを繰り返すことによって、変更対象を拡大し、かつ
対応した制約条件を追加することによって制約充足問題
を定式化する手法である。
【0021】また、その第3は、領域特化制約知識ベー
スに格納されている領域特化制約条件を用いて指定され
た変更対象に連動して変更対象とすべき類似検索知識を
特定し、また、このようにして特定された変更対象の類
似検索知識に関する領域特化制約条件を制約条件として
追加して制約充足問題を定式化する手法である。
【0022】また、その第4は、前記手法によって定式
化した制約充足問題に、類似性知識の変更を現在の設定
値からの変化を所定の尺度で最小にするという目的関数
を加えた最適化制約充足問題として定式化し、この最適
化制約充足問題を解く手法である。
【0023】
【実施例】以下、図面を参照しながら実施例を説明す
る。
【0024】図1には本発明の一実施例に係る類似検索
装置の概略構成が示されている。
【0025】この類似検索装置は、大きく分けて、類似
検索実行部1と、類似検索知識学習部2と、類似検索実
行部1に対して検索条件を入力する入力手段3と、類似
検索実行部1で検索された結果を表示する表示手段4
と、類似検索実行部1に正解情報を入力する入力手段5
と、類似検索知識学習部2に学習指令を与える指令手段
6と、学習結果を表示する表示手段7と、類似検索知識
学習部2に対して確認情報を与える手段8とで構成され
ている。
【0026】類似検索実行部1は、類似検索の実行を司
る類似検索制御部9と、検索対象のデータが格納されて
いる検索対象データベース10と、検索条件と検索対象
との間の類似度を評価する類似度評価部11と、属性間
の相対的な重要度を評価する知識が格納されている属性
間重要度評価知識ベース12と、属性毎の類似度を評価
する知識が格納されている属性別類似度評価知識ベース
13とで構成されている。
【0027】検索対象データベース10には、複数の属
性−属性値の組により記述された検索対象が格納されて
いる。属性間重要度評価知識ベース12には、複数の属
性−属性値の組として表現された検索条件に対して属性
間の相対的な重要度を評価する属性間重要度評価知識が
格納されている。属性別類似度評価知識ベース13に
は、検索条件と検索対象との組に対し、特定の属性に関
する両者の類似度を評価する属性別類似度評価知識が格
納されている。
【0028】類似度評価部11は、検索条件と検索対象
との組に対し、属性別類似度評価知識ベース13に格納
されている属性別類似度評価知識を用いて評価した各属
性毎の両者の類似度を基にして属性間重要度評価知識ベ
ース12に格納されている属性間重要度評価知識を用い
て評価した属性間の相対的な重要度を考慮した上で検索
条件と検索対象の間の総合的な類似度を算出する。
【0029】類似検索制御部9は、外部から検索条件を
入力し、類似度評価部11を用いて検索条件と検索対象
データベース10に格納されている検索対象との間の類
似度を算出し、検索対象を類似度の順序に整列あるいは
選択して外部に出力し、さらに類似検索結果を外部に出
力した後に、満足すべき類似順序関係を外部より入力
し、その類似順序関係を後述する正解類似順序データベ
ース18に格納する。
【0030】一方、類似検索知識学習部2は、類似検索
知識(重要度評価知識および類似度評価知識)の学習を
司る類似検索知識学習制御部14と、検索条件と検索対
象との組に対してその類似度に影響を与える類似検索知
識を特定したり、類似検索知識に対してその類似度が影
響を受ける検索条件と検索対象との組を特定したりする
知識依存関係特定部15と、類似検索知識の学習を最適
化制約充足問題として定式化する最適化制約充足問題定
式化部16と、定式化された最適化制約充足問題を解く
最適化制約充足問題解決部17と、ユーザにより入力さ
れた正しい類似順序が格納されている正解類似順序デー
タベース18と、検索時の類似度評価に用いた知識の識
別子と類似度評価(検索条件と検索対象との類似度の
組)とが格納されている知識依存関係データベース19
と、対象領域に特化された制約条件が格納されている領
域特化制約知識ベース20とで構成されている。
【0031】次に、この類似検索装置の動作を説明す
る。
【0032】なお、説明を簡単にするために、この類似
検索装置が「旅行案内装置」として使用されている場合
について説明する。この「旅行案内装置」は、旅行に対
する要望がユーザによって入力されたとき、検索対象デ
ータベース10に格納されている過去の旅行プランから
最も類似したプランを検索してユーザに提示する役目を
果たすものとする。
【0033】ここで、旅行プランは、「目的」,「場
所」,「時期」,「交通」の4つの属性で特徴づけられ
ているとする。それぞれの属性が取り得る値は、図2に
示す通りのものであるとする。たとえば、「目的」とい
う属性は、「家族旅行」,「慰安旅行」,「スキー」と
いう値のいずれかを取るものとし、以下、「場所」,
「時期」,「交通」についても図2に示され値のいずれ
かを取るものとする。
【0034】一方、検索対象データベース10には、図
3に示すように、過去の旅行プランの具体例が格納され
ているものとする。ただし、簡単のために、具体的なプ
ランの内容は表示せず、プランを特徴づけている上記4
つの属性の値のみを示すことにする。図4にはユーザが
順次入力するであろうと想定される検索条件の一覧が示
されている。このように、検索条件は検索対象のデータ
と同じ4つの属性に対する具体的な値で表現されている
ものとする。
【0035】図5には、属性間重要度評価知識ベース1
2に現時点において格納されている属性間重要度知識の
具体例が示されている。ここでは、属性間重要度知識が
各属性に割り当てられた合計が1になる0〜1の数値で
表現されているとする。これを以後「重要度ベクトル」
と呼ぶことにする。この重要度ベクトルは、あらゆる検
索条件と検索対象との組合せに対して適用されるものと
する。
【0036】図6には、属性別類似度評価知識ベース1
3に現時点において格納されている属性別類似度知識の
具体例が示されている。ここでは、属性別類似度知識が
各属性に対してテーブル形式で与えられている。テーブ
ルは、検索条件の値と検索対象データの値との間の関数
として定義され、値として0〜1をとる。0は全く似て
いないことを示しており、1は同一であることを示して
いる。以後、このテーブルを「類似度テーブル」と呼ぶ
ことにし、類似度テーブルが定義している2変数関数を
「類似度関数」と呼ぶことにする。また、ここで定義さ
れているテーブル、つまり類似度関数は対称であるとす
る。
【0037】図7には、この「旅行案内装置」を起動し
た際に画面に表示される内容が示されている。“%”は
オペレーティングシステムのプロンプトで、本装置はコ
マンド“trip-plan ”で起動される。起動すると、図7
に示すように、データベース群および知識ベース群がオ
ープンまたはロードされ、コマンドの利用方法が表示さ
れた後、コマンドを受付るモードとなる。コマンドに
は、検索を実行する“retrieve”と知識の学習を行なう
“learn ”とがある。これらは、後述する「類似検索実
行モード」と「学習モード」の2つの動作モードに対応
する。コマンド入力のプロンプトは、通し番号に“>
>”をつけたものとなっている。
【0038】最初に「類似検索実行モード」について説
明する。
【0039】この類似検索は図8に示される処理の流れ
にしたがって実行される。
【0040】まず、検索条件を入力すると(ステップS
1)、類似評価結果(類似度と存在知識)を格納してお
くための配列Rを確保して初期化する(ステップS2)。
【0041】次に、検索対象データベース10中の全て
の検索対象データに関して以下の処理を行う。まず、未
処理の検索対象データがあるときには(ステップS3)、
そのような検索対象データを1つ選んでDiとする(ス
テップS4)。Diについて計算する類似度riと依存知
識Kiとをそれぞれ0および{}(空集合)に初期化す
る(ステップS5)。
【0042】そして、検索条件および検索対象データを
記述する全ての属性に対して以下の処理を行なう。ま
ず、未処理の属性を1つ選択しAjとする(ステップS
7)。属性間重要度評価知識ベース12に格納されてい
る知識を用いて属性Ajの重要度wjを求める(ステッ
プS8)。また、その際に用いた知識の識別子をKiに格
納しておく(同じくステップS8)。次に、属性別類似度
評価知識ベース13に格納されている知識を用いて属性
Ajに関する検索条件Cと検索対象データDiとの間の
類似度rjを求める(ステップS9)。また、その際に用
いた知識の識別子をKiに追加格納しておく(同じくス
テップS9)。次に、wj×rjをriに加え(ステップ
S10 )、ステップS6の分岐に戻る。
【0043】未処理の属性がなくなると(ステップS
6)、そのときのriが与えられた検索条件と検索対象
データDiとの総合類似度になり、そのときのKiがそ
の総合類似度を求める上で参照した知識の識別子の集合
を表す。検索対象データDi、類似度ri、依存知識K
iを配列Rのi番目の場所に格納し(ステップS11 )、
ステップS3の分岐へと戻る。
【0044】全ての検索対象データに対しての処理が終
了した時点(ステップS3)で、配列Rに格納しておいた
データ群Diをその類似度riでソートし(ステップS1
2 )、検索結果を類似度順にユーザに表示する(ステッ
プS13 )。
【0045】ここで、正解情報をユーザに入力してもら
い、正解類似順序データベース18に記録しておく(ス
テップS14 )。また、類似度を計算する過程で調べてお
いた知識依存関係を知識依存関係データベース19に格
納する(ステップS15 )。最後に検索条件をデータとし
て検索対象データベース10に格納した(ステップS16
)後、検索処理を終了する。
【0046】以上に述べた「類似検索実行モード」の動
作を具体的な例を用いて詳細に説明する。
【0047】図9には検索過程における画面表示の具体
例が示されている。また、図10には検索条件と各検索
対象データとの間の総合類似度を計算する過程が示さ
れ、図11にはユーザが入力した正解類似順序例が示さ
れている。なお、図9においてはlearn コマンドを実行
しているが何も処理されない。これは、図11に示すよ
うに全ての正解類似順序が満足されているからである。
【0048】図12には別の検索過程における画面表示
の具体例が示されている。このときの検索条件と各検索
対象データとの間の総合類似度を計算する過程が図13
に示されており、そのときにユーザの入力した正解類似
順序が図14に示されている。この例では、図14に示
されるように、全ての正解類似順序が満足されているわ
けではない。したがって、類似検索知識の学習が必要に
なる。
【0049】次に、「学習モード」について説明する。
【0050】図15には学習モードの処理の流れが示さ
れている。
【0051】まず、ステップS20 において後述する手法
で重要度ベクトルの変更を試みる。もし成功したときに
は終了する。失敗したときには(ステップS39 )、後述
する手法で類似度テーブルの変更を試みる(ステップS4
0 )。ここでは、満足されていない類似順序に直接関係
する類似度定義のみを変更対象とする。もし成功したと
きには終了する。
【0052】失敗したときには(ステップS59 )、後述
する手法で類似度テーブルの変更を試みる(ステップS6
0 )。ここでは、満足されていない類似順序に直接関係
する類似度定義だけでなく、制約条件に現われる類似度
定義も変更対象とする。もし成功したときには終了す
る。失敗したときには(ステップS79 )、制約を緩和す
る必要がある。制約の緩和は、類似順序あるいは領域特
化制約の幾つかを無視することにより行なう(ステップ
S80 )。いずれかの学習方式が成功するまで緩和が行な
われる。
【0053】次に、図15に示される個々の学習方式に
ついて説明する。
【0054】まず、ステップS20 において、重要度ベク
トルの変更を試みる場合について説明する。
【0055】図16には、その処理の流れが示されてい
る。
【0056】まず、重要度を変更対象にする(すなわち
変数化する)属性の組を選択する(ステップS22 )。次
に、同時に重要度を変更対象とすべき属性の組を特定す
る(ステップS23 )。これは、領域特化制約知識ベース
20に格納されている等式制約を用いる。次に、正解類
似順序データベース18に格納されているユーザが入力
した正しい類似順序関係を読み込む(ステップS24 )。
これらは不等号制約条件として利用される。次に、領域
特化制約知識ベース20に格納されている不等式制約も
加える(ステップS25 )。目的関数を選択し(複数あれ
ば)、重要度ベクトルの変更問題を最適化制約充足問題
として定式化する(ステップS26 )。定式化された最適
化制約充足問題を解く(ステップS27 )。もし、解が求
まれば(ステップS28 )、解を選択し(複数ある場
合)、ユーザに確認の上で属性間重要度評価知識ベース
12の重要度ベクトルを更新する(ステップS29 )。
【0057】もし、解が求まらないときには(ステップ
S28 )、ステップS21 に戻る。全属性の重要度を変数化
して調整を試みたのであれば終了である(学習失敗)。
【0058】まだ変数化を試みていない属性の組合せパ
ターンのあるときには、ステップS22 に進む。なお、こ
のフローチャートでは知識依存関係の追跡に触れていな
いが、これは重要度ベクトルが全ての類似度評価に適用
されていることを考え、逐一追跡せずに全ての正解類似
順序を制約条件として取り込んでいるからである。
【0059】ステップS27 での最適化制約充足問題の定
式化においては、変数の種類、目的関数の種類、制約条
件の種類に応じて、さまざまな手法をとり得る。まず目
的関数は、現在の設定値からの変化分が最小になるよう
なものを設定する。変数が連続量をとるものとし、目的
関数、制約条件群とも一次式で表現できれば、線形計画
問題として取扱うことができる。また、目的関数を現在
値からの変化分の自乗和とし表現すれば、二次計画法と
して定式化することも可能である。さらには、変数を適
当な刻みをつけて離散化すれば、整数計画法として定式
化することも可能である。ここでは、線形計画法として
定式化する場合のみを説明する。
【0060】図17には、この学習方式をインプリメン
トしたlearn コマンドを実行した際の画面表示例が示さ
れている。図18には疑似的な線形計画問題としての定
式化が示されている。「疑似的」というのは、完全な線
形計画問題ではないが、変数の符号を場合分けすること
により、容易に線形計画問題になるからである。変数x
とyは、属性「場所」と「時期」との現在の重要度から
の変化分である。なお、ここでは領域特化の知識を使っ
て、最も最適化の効果がありそうな変数を2つ選んでい
る。また、ここでは後の説明を容易化するために、xと
yとを0.1 刻みで離散化し、整数計画問題として解いて
いる。その結果、x=0.1 ,y=-0.1が最適解となっ
た。図19には学習後の重要度ベクトルが示されてい
る。図20には変更前の重要度ベクトルを用いて計算し
た類似度と、この変更された新しい重要度ベクトルを用
いて計算した類似度とが示されている。正解類似順序が
満足されていることが判る。
【0061】次に、図15に示されるステップS40 にお
いて、類似度テーブルの変更を試みる場合の学習方式に
ついて説明する。
【0062】これは、属性別類似度の学習(修正対象は
直接関係するもののみ)を行なうものである。図24に
処理の流れが示されている。
【0063】学習が起動された時点で満足されていない
類似順序関係を正解類似順序データベース18から検索
し、そこに現われる検索条件と検索対象データとの組
(Ci,Dj)を求める(ステップS41 )。知識依存関
係データベース19を参照し、ステップS41 で求めた検
索条件と検索対象データとの組(Ci,Dj)に対する
類似度評価に直接影響する類似度定義を特定する(ステ
ップS42 )。
【0064】ステップS42 で求めた類似度定義を全て変
数化しても実行可能解が求められなかった場合は、学習
失敗として終了する(ステップS43 )。
【0065】そうでない場合は、変更対象とすべき類似
度定義の組を選択する(ステップS44 )。次に、領域特
化制約知識ベース20を参照し、同時に変数化すべき類
似度定義を特定する(ステップS45 )。次に、知識依存
関係データベース19を参照し、ステップS44 で選択し
た類似度定義およびステップS45 で特定した類似度定義
が類似度評価に影響をおよぼす検索条件と検索対象デー
タとの組(Ci′,Dj′)を特定する(ステップS46
)。
【0066】次に、ステップS41 およびステップS46 で
特定した検索条件と検索対象データとの組の一方または
両方が現われるような正解類似順序関係を正解類似順序
データベース18から求める(ステップS47 )。次に、
領域特化制約知識ベース20を参照し、変更対象とした
類似度定義に関係するような不等号制約条件を検索する
(ステップS48 )。
【0067】次に、ステップS44 およびステップS45 で
選択・特定した類似度定義を変数とし、ステップS47 お
よびステップS48 で求めた不等式を制約条件とし、目的
関数を設定して最適化制約充足問題を定式化(ステップ
S49 )し、定式化した最適化制約充足問題を解く(ステ
ップS50 )。もし解が求まれば成功である(ステップS5
1 )。もし求まらなければステップS43 に戻る。
【0068】成功した場合、解を選択し(複数あれ
ば)、ユーザに確認の上で属性別類似度評価知識ベース
13に格納されている類似度テーブルを更新し(ステッ
プS52 )、学習成功として終了する。
【0069】この図24に示される処理の具体例を説明
する。
【0070】まず、現在の検索対象データベース10に
は、データD1,D2,D3,D4,D5が格納されて
いるものとする。そこに、図4に示す検索条件C6に対
する検索要求が与えられたとする。
【0071】図21に類似検索の画面表示例を示す。各
データとの総合類似度の計算過程の詳細は図22に示す
通りである。ここで、注意を要するの点は、現時点での
重要度ベクトルは、先の学習により変更された図19に
示される値である。
【0072】ユーザからの正解類似順序の入力により、
正解類似順序データベース18の内容が図23のように
なる。装置の出力とユーザの判断とに相違点がある。す
なわち、ユーザの示したr(C6,D1)≦r(C6,
D2)という判断が装置の出力と異なっている。
【0073】そこで、学習を行なう。図25〜図28に
は、その画面表示例が示されている。先程と同じく、重
要度ベクトルの変更が試みられるが、図25に示すよう
に、ここではそれが失敗したものとする。すると、図2
6に示すように、次には、類似度テーブルの変更が試み
られる。ここでは、最低限変更の必要なもののみを変更
対象とする。すなわち、r(C6,D1)および(C
6,D2)の値を変化させられるものに限定する。
【0074】 C6=(家族,熱海,春,マイカー) D1=(家族,日光,秋,鉄道) D2=(慰安,熱海,冬,バス) であるから、 r1(家族旅行,慰安旅行),r2(熱海,日光), r3(春,秋),r3(春,冬), r4(マイカー,鉄道),r4(マイカー,バス) の中から変更対象を選択することになる。なお、r1
(家族旅行,慰安旅行),r2(熱海,日光)は、検索
条件側の値とデータ側の値が等しく、領域特化制約知識
ベース20に、そのような場合は類似度が1と定義され
るとの知識が格納されており、今回の変更対象候補から
外される。
【0075】また、同じく領域特化制約知識ベース20
に、ri,i=1,…,4は対象であること、すなわ
ち、 ri(u,v)=ri(v,u),i=1,…,4 という知識が記述されており、r1(家族旅行,慰安旅
行)を変更対象として選択したら、r1(慰安旅行,家
族旅行)も変更対象として選択しなければならないこと
となる。
【0076】上記の類似度定義は、すべて変更する必要
はない。もし一部の変更のみで制約条件が全て満足さ
れ、しかも変更が不自然でなければ、厳密な最適化はで
きないが、これでも十分である。そのような変更対象の
選択戦略として下記のようなものが考えられる。
【0077】1 .最初から関連する類似度定義をすべて
変更対象とする。
【0078】(a) 長所:変更の試みを繰り返す必要がな
くなる。つまり、成功すれば一回で済むし、失敗すると
きは、変更対象を絞り込んだ場合も全て失敗するはずで
あり、絞り込みの意味がなくなる。また、現在の設定値
からの変化分を確実に最小化できる。
【0079】(b) 短所:変数の個数が多くなり、現実的
な時間内で解けない可能性がでてくる。
【0080】2 .ユーザに選択させる。
【0081】(a) 長所:専門家的な知識を利用できるの
で、早期に収束できる可能性が大きい。また、既に固定
した設定値を変更対象から外すといったコントロールが
できる。
【0082】(b) 短所:現在からの設定値からの変化分
が必ずしも最小にならない。
【0083】3 .属性間重要度の大きい順に変更対象を
拡大していく。具体的には、重要度最大の属性に関する
類似度定義をまず変数化の対象にして変更を試みる。成
功すればそれでよいが、失敗したときには、次に重要度
の大きい属性に関する類似度定義を変数化の対象として
追加する。それでも失敗したときには、さらに変数化の
対象を拡大していく。
【0084】(a) 長所:変化分が最小の解が得られる可
能性が高い。
【0085】(b) 短所:もともとの制約が強過ぎるとき
は、成功するまでに、何度も失敗する可能性がある。
【0086】ここでは、3の重要度順の戦略にユーザの
判断を加えていくことにする。
【0087】現在の重要度ベクトルは、(0.4 ,0.3 ,
0.1 ,0.2 )であるから、属性「目的」と「場所」とに
関する類似度定義を変更対象にする。すなわち、図26
に示すように、r1(家族旅行,慰安旅行)とr2(熱
海,日光)を変数化する。
【0088】変数化の対象が決定したら、これらを変更
した場合に影響を受ける類似度評価を特定する。これ
は、知識依存関係データベース19に格納されている情
報を用いて行なう。図29にその結果を示す。また、図
27にもその結果が現われている。
【0089】これらの類似順序および領域特化の制約を
制約条件とし、r1(家族旅行,慰安旅行)とr2(熱
海,日光)の現在値からの変化分を、それぞれ変数x,
yとし、目的関数をその絶対値の和の最小化として疑似
的な線形計画問題として定式化すると、図30に示すよ
うになる。ここでは、後の説明を容易にするために、x
とyを0.1 刻みで離散化し、整数計画問題として解いて
いる。x=0.1 ,y=0.0 とx=0.0 ,y=-0.1の2つ
の最適解が見つかる。
【0090】図31には学習後の類似度テーブルが示さ
れている。、また、図32には変更前の類似度テーブル
を用いて計算した類似度と、この新しい類似度テーブル
を用いて計算した類似度とが示されている。図から判る
ように、正解類似順序が満足されている。
【0091】次に、図15に示されるステップS60 にお
いて、類似度テーブルの変更を試みる場合の学習方式に
ついて説明する。ここでは、満足されていない類似順序
に直接関係する類似度定義だけではなく、制約条件に現
われる類似度定義も変更対象とする。
【0092】図33には、この学習方式の処理の流れが
示されている。
【0093】ここでは、制約条件群を格納しておく配列
CONSTと、変更対象候補の類似度定義を格納してお
く配列Rと、選択された変更対象群を格納しておく配列
VARと、影響を受ける検索条件とデータとの組を格納
しておく配列CDを用いる。配列の添字のlevel は、変
更対象の拡大のレベルである。
【0094】学習が起動された時点で満足されていない
類似順序関係を正解類似順序データベース18から検索
し、配列要素CONST[0]に格納する(ステップS6
1 )。また、そこに現われる検索条件とデータとの組
(Ci,Dj)を求め、配列要素CD[0]に格納する
(同じくステップS61 )。
【0095】次に、知識依存関係データベース19を参
照し、ステップS61 で求めた検索条件とデータとの組
(Ci,Dj)に対する類似度評価に直接影響する類似
度定義を変更対象候補として配列要素R[0]に格納す
る(ステップS62 )。また、ここで変数level を0に初
期化する(同じくステップS62 )。
【0096】ステップS62 で求めた類似度定義(現レベ
ルでの変更対象候補)を全て変数化しても実行可能解を
求められなかった場合には、このレベルでの学習が失敗
したとしてステップS73 に進む(ステップS63 )。そう
でない場合はステップS64 に進む。
【0097】変更対象とすべき類似度定義の組を現レベ
ルでの変更対象候補R[level ]から選択し、VAR
[level ]にセットする(ステップS64 )。領域特化制
約知識ベース20を参照し、同時に変数化すべき類似度
定義を特定し、VAR[level]に追加する(ステップS
65 )。
【0098】次に、知識依存関係データベース19を参
照し、VAR[level ]の内容、すなわちステップS64
で選択した類似度定義およびステップS65 で特定した類
似度定義が類似度評価に影響をおよぼす検索条件とデー
タとの組(Di,Dj)を特定し、CD[level +1]
に格納する(ステップS66 )。
【0099】ステップS61 およびステップS66 で特定し
た検索条件とデータとの組が現われるような正解類似順
序関係を正解類似順序データベース18から求め、CO
NST[level +1]に格納する(ステップS67 )。領
域特化制約知識ベース20を参照し、変更対象とした類
似度定義に関係するような不等号制約条件を検索し、C
ONST[level +1]に追加する(ステップS68 )。
【0100】このレベルまでの各レベルで変更対象とし
て指定した全ての変更対象を変数とし、このレベルまで
の各レベルで特定した類似順序関係や領域特化制約を制
約条件群として、さらに適切な目的関数を設定して最適
化制約充足問題を定式化する(ステップS69 )。
【0101】定式化した最適化制約充足問題を解く(ス
テップS70 )。もし解が求まれば成功である(ステップ
S71 )。もし求まらない場合にはステップS63 に戻る。
【0102】成功した場合、解を選択し(複数であれ
ば)、ユーザに確認の上で属性別類似度評価知識ベース
13に格納されている類似度テーブルを更新し(ステッ
プS72)、学習成功として終了する。
【0103】ステップS63 の分岐において、もし、現在
のレベルでの変更対象候補を全て変数化してしまってい
れば、それは現在のレベルでの制約充足失敗を意味す
る。その場合は、次のレベルへの変更対象の拡大を行な
うためにステップS73 へ進む。現在のレベルで変更対象
にした類似度定義VAR[level ]=R[lebel ]に影
響を受ける検索条件とデータとの組CD[level +1]
の類似度評価に影響する類似度定義で、いままでに変更
対象にならなかったものを次のレベルでの変更対象の候
補としてR[level +1]に格納する(ステップS73
)。そして、levelを1つ上げる(ステップS74 )。
【0104】R[level +1]が空集合でなければ、こ
れらを変更対象として制約充足を試みるためにステップ
S63 に戻る。しかし、R[level +1]が空集合、すな
わち、すべての類似度定義を変更対象としてしまった場
合には学習失敗として終了する(ステップS75 )。
【0105】
【発明の効果】以上のように、本発明によれば、数値的
な属性間重要度知識および属性別類似度知識を用いて類
似度を評価しながら類似検索を行う類似検索装置におい
て、属性間重要度知識および属性別類似度知識に類似順
序に関する専門家の判断を正確に反映させるための学習
が可能で、もって対象領域固有の知識を類似度評価に反
映させることができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る類似検索装置のブロッ
ク構成図
【図2】属性名と属性値との具体例を示す図
【図3】検索対象データベースに格納されている内容の
具体例を示す図
【図4】検索条件の具体例を示す図
【図5】属性間重要度評価知識(重要度ベクトル)の具
体例を示す図
【図6】属性別類似度評価知識(類似度テーブル)の具
体例を示す図
【図7】同類似検索装置の起動時における画面表示例を
示す図
【図8】同類似検索装置の類似検索処理の流れ図
【図9】ある検索条件において検索コマンド実行時にお
ける画面表示例を示す図
【図10】同検索条件における類似度の計算過程の具体
例を示す図
【図11】正解類似順序の具体例を示す図
【図12】別の検索条件において検索コマンド実行時に
おける画面表示例を示す図
【図13】同検索条件における類似度の計算過程の具体
例を示す図
【図14】正解類似順序の具体例を示す図
【図15】同類似検索装置において学習動作を行わせた
ときの処理の流れ図
【図16】重要度ベクトルの変更学習時における処理の
流れ図
【図17】同学習時における画面表示例を示す図
【図18】同学習を疑似的線形計画問題として解く場合
の定式化例を示す図
【図19】学習後の重要度ベクトルの具体例を示す図
【図20】学習前および学習後の類似度評価例を示す図
【図21】さらに別の検索条件において検索コマンド実
行時における画面表示例を示す図
【図22】同検索条件に対する類似度の計算過程を示す
【図23】正解類似順序の具体例を示す図
【図24】第1段階としての類似度テーブルの変更学習
時における処理の流れ図
【図25】同学習時の画面表示例を示す図
【図26】同学習時の画面表示例を示す図
【図27】同学習時の画面表示例を示す図
【図28】同学習時の画面表示例を示す図
【図29】類似度定義と類似度評価の依存関係を示す図
【図30】制約条件例を示す図
【図31】変更後の類似とテーブルの具体例を示す図
【図32】学習前および学習後の類似度評価例を示す図
【図33】第2段階としての類似度テーブルの変更学習
時における処理の流れ図
【符号の説明】
1…類似検索実行部 2…類似検索知
識学習部 3…検索条件入力手段 4…表示手段 5…正解情報入力手段 6…学習指令手
段 7…学習結果表示手段 8…確認情報入
力手段 9…類似検索制御部 10…検索対象
データベース 11…類似度評価部 12…属性間重
要度評価知識ベース 13…属性別類似度評価知識ベース 14…類似検索
知識学習制御部 15…知識依存関係特定部 16…最適化制
約充足問題定式化部 17…最適化制約充足問題解決部 18…正解順序
データベース 19…知識依存関係データベース 20…領域特化
制約知識ベース

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】複数の属性−属性値の組によって記述され
    た検索対象を格納してなる検索対象記憶手段と、複数の
    属性−属性値の組として表現された検索条件に対して属
    性間の相対的な重要度を評価する属性間重要度評価知識
    を格納してなる属性間重要度評価知識記憶手段と、検索
    条件と検索対象との組に対して特定の属性に関する両者
    の類似度を評価する属性別類似度評価知識を格納してな
    る属性別類似度評価知識記憶手段と、検索条件と検索対
    象との組に対して前記属性別類似度評価知識記憶手段に
    格納されている属性別類似度評価知識を用いて評価した
    類似度に前記属性間重要度評価知識記憶手段に格納され
    ている属性間重要度評価知識を用いて評価した属性間の
    相対的な重要度を加味した上で検索条件と検索対象との
    間の総合的な類似度を算出する類似度評価手段と、外部
    から入力された検索条件に対して前記類似度評価手段を
    用いて上記検索条件と前記検索対象記憶手段に格納され
    ている検索対象との間の類似度を算出するとともに検索
    対象を類似度の順序に整列あるいは選択して外部に出力
    する類似検索制御手段とを備えた類似検索装置におい
    て、 特定の検索条件に対して行なった検索対象の間の類似度
    の正しい順序関係が前記類似検索制御手段を介して格納
    される正解類似順序記憶手段と、 上記特定の検索条件と検索対象との組に対し、その類似
    度の評価に影響をおよぼす前記属性間重要度評価知識記
    憶手段に格納されている属性間重要度評価知識および前
    記属性別類似度評価知識記憶手段に格納されている属性
    別類似度評価知識からなる類似検索知識を特定するとと
    もに上記類似検索知識に対して類似度の評価が影響を受
    ける検索条件と検索対象との組を特定する知識依存関係
    特定手段と、 現時点での正解類似順序関係の充足状況を外部に出力す
    るとともに変更対象とする前記類似検索知識の指定を外
    部から入力して変更対象と指定された類似検索知識に対
    して前記知識依存関係特定手段を用いて上記類似検索知
    識が類似度に影響をおよぼす検索条件と検索対象との組
    を特定し、特定された検索条件と検索対象との組に関連
    する正解類似順序関係を特定し、変更対象と指定された
    類似検索知識を変数群として特定された正解類似順序関
    係を制約条件群とした制約充足問題を定式化する制約充
    足問題定式化手段と、 この制約充足問題定式化手段により定式化された制約充
    足問題を解く制約充足問題解決手段と、 外部から変更対象の指示を受けながら前記制約充足問題
    定式化手段を用いて前記類似検索知識を調整する問題を
    制約充足問題として定式化し、前記制約充足問題解決手
    段を用いて解いた制約充足問題の結果を用いて前記属性
    間重要度性知識および前記属性別類似度知識の一方ある
    いは両方を変更する学習制御手段と、 を含む類似検索知識学習手段を具備してなることを特徴
    とする類似検索装置。
  2. 【請求項2】前記制約充足問題定式化手段は、特定され
    た前記変数群と制約条件群だけに限らず、前記制約条件
    の充足に影響をおよぼす他の類似検索知識をも変更対象
    として変数群に加え、追加された変更対象の類似検索知
    識が影響をおよぼす検索条件と検索対象との組に関係し
    た類似順序関係をも制約条件群に追加することを繰り返
    すことによって、変更対象を拡大し、かつ対応した制約
    条件を追加することによって制約充足問題を定式化する
    機能を備えているとを特徴とする請求項1に記載の類似
    検索装置。
  3. 【請求項3】前記類似検索知識学習手段は、前記類似検
    索知識に関する類似順序関係以外の対象分野に特化した
    制約条件を格納した領域特化制約知識ベースを備え、 前記制約充足問題定式化手段は、前記領域特化制約知識
    ベースに格納されている領域特化制約条件を用いて指定
    された変更対象に連動して変更対象とすべき前記類似検
    索知識を特定し、特定された変更対象の類似検索知識に
    関する領域特化制約条件を制約条件として追加して前記
    制約充足問題を定式化する機能を備えていることを特徴
    とする請求項1に記載の類似検索装置。
  4. 【請求項4】前記制約充足問題定式化手段は、定式化し
    た前記制約充足問題に類似性知識の変更を現在の設定値
    からの変化を所定の尺度で最小にするという目的関数を
    加えた最適化制約充足問題として定式化する機能を備え
    ており、 前記制約充足問題解決手段は、定式化された前記最適化
    制約充足問題を解く機能を備えていることを特徴とする
    請求項1に記載の類似検索装置。
JP5065725A 1993-03-24 1993-03-24 類似検索装置 Pending JPH06282574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5065725A JPH06282574A (ja) 1993-03-24 1993-03-24 類似検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5065725A JPH06282574A (ja) 1993-03-24 1993-03-24 類似検索装置

Publications (1)

Publication Number Publication Date
JPH06282574A true JPH06282574A (ja) 1994-10-07

Family

ID=13295289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5065725A Pending JPH06282574A (ja) 1993-03-24 1993-03-24 類似検索装置

Country Status (1)

Country Link
JP (1) JPH06282574A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212234A (ja) * 1995-02-06 1996-08-20 Nippon Telegr & Teleph Corp <Ntt> データベース検索装置及びデータベース検索方法
JPH09190451A (ja) * 1996-01-09 1997-07-22 Oki Electric Ind Co Ltd 情報検索装置
JPH09218643A (ja) * 1996-02-09 1997-08-19 Toyota Motor Corp 旅行計画出力装置
JP2000172671A (ja) * 1998-12-11 2000-06-23 Fujitsu Ltd K近傍法による類似予測の結果表示装置
JP2004515837A (ja) * 2000-07-17 2004-05-27 シーメンス アクチエンゲゼルシヤフト サーチプロファイルの比較方法
CN105005564A (zh) * 2014-04-17 2015-10-28 北京搜狗科技发展有限公司 一种基于问答平台的数据处理方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212234A (ja) * 1995-02-06 1996-08-20 Nippon Telegr & Teleph Corp <Ntt> データベース検索装置及びデータベース検索方法
JPH09190451A (ja) * 1996-01-09 1997-07-22 Oki Electric Ind Co Ltd 情報検索装置
JPH09218643A (ja) * 1996-02-09 1997-08-19 Toyota Motor Corp 旅行計画出力装置
JP2000172671A (ja) * 1998-12-11 2000-06-23 Fujitsu Ltd K近傍法による類似予測の結果表示装置
JP2004515837A (ja) * 2000-07-17 2004-05-27 シーメンス アクチエンゲゼルシヤフト サーチプロファイルの比較方法
JP4868484B2 (ja) * 2000-07-17 2012-02-01 シーメンス アクチエンゲゼルシヤフト サーチプロファイルの比較方法
CN105005564A (zh) * 2014-04-17 2015-10-28 北京搜狗科技发展有限公司 一种基于问答平台的数据处理方法和装置
CN105005564B (zh) * 2014-04-17 2019-09-03 北京搜狗科技发展有限公司 一种基于问答平台的数据处理方法和装置

Similar Documents

Publication Publication Date Title
US5899985A (en) Inference method and inference system
Maher et al. CADSYN: A case-based design process model
US6154736A (en) Belief networks with decision graphs
Acid et al. An information retrieval model based on simple Bayesian networks
JPH02250188A (ja) マルチテンプレートを用いるdpマツチング方法及び装置
JP2003228581A (ja) 適合性フィードバックによる類似検索方法
JP2827458B2 (ja) 推論処理方法
Dechter et al. Optimization in constraint networks
US5999923A (en) Methods and apparatus for optimizing decision making
CN117035074B (zh) 基于反馈强化的多模态知识生成方法及装置
Fan et al. Autogfs: Automated group-based feature selection via interactive reinforcement learning
JPH06282574A (ja) 類似検索装置
White et al. A multiple objective optimization-based approach to choicemaking
Sandvig et al. Aacorn: A CBR recommender for academic advising
CN115757464A (zh) 一种基于深度强化学习的智能物化视图查询方法
JP2913969B2 (ja) 事例検索システムおよびその検索方法
Paulus et al. Collaborative Filtering Recommender System for Semantic Model Refinement
JPH07200614A (ja) 類似検索装置
JPH0553815A (ja) 推論装置における支援方式
JPH09134289A (ja) 推論モデル更新機能を備えた帰納推論装置及び帰納推論装置の推論モデル更新方法
JPH06176072A (ja) 類似検索装置
Chellama et al. Query plan optimization with deep learning
Avramenko et al. Case-based reasoning approach
JP2024037024A (ja) モデル生成装置およびモデル生成方法
Sovat et al. RaBeCa: a hybrid case-based reasoning development environment