JPH06282574A

JPH06282574A - 類似検索装置

Info

Publication number: JPH06282574A
Application number: JP5065725A
Authority: JP
Inventors: Riichi Tanaka; 利一田中
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1993-03-24
Filing date: 1993-03-24
Publication date: 1994-10-07

Abstract

(57)【要約】【目的】対象領域固有の知識を類似度評価に正確に反映
できる学習機能を備えた類似検索装置を提供する。【構成】現時点での正解類似順序関係の充足状況を外部
に出力するとともに変更対象とする類似検索知識の指定
を外部から入力して変更対象と指定された類似検索知識
に対して手段１５を用いて類似検索知識が類似度に影響
をおよぼす検索条件と検索対象との組を特定し、特定さ
れた検索条件と検索対象との組に関連する正解類似順序
関係を特定し、変更対象と指定された類似検索知識を変
数群として特定された正解類似順序関係を制約条件群と
した制約充足問題を定式化する手段１６と、この手段１
６により定式化された問題を解く手段１７と、この解を
用いて属性間重要度性知識および属性別類似度知識の一
方あるいは両方を変更する手段１４とを含む学習手段２
を備えている。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、情報間の類似性を考慮
した柔軟な検索（類似検索）を実現できる類似検索装置
に関する。

【０００２】

【従来の技術】情報処理分野におけるデータ検索や人工
知能分野にける事例ベース推論の事例検索においても類
似検索の重要性が高まっている。

【０００３】類似検索とは、検索条件と検索対象との間
の類似性に関する何らかの評価尺度を用いて行う柔軟な
情報検索で、検索条件に厳密に照合する検索対象が存在
しない場合でも、予め設定された評価尺度内において類
似した情報を検索することをいう。

【０００４】このような類似検索に際しては、一般的
に、検索条件および検索対象を属性−属性値で表現し、
検索条件と検索対象との間の各属性毎の類似度（以後、
属性別類似度と呼ぶ）に、属性間の相対的な重要性（属
性間重要度）を考慮した類似度の大小で検索を行なう方
式が採用されている。類似度の定義式は、加重和あるい
は加重平均をとるのが一般的である。

【０００５】このような方式において、問題になるのは
属性間重要度や属性別類似度を正確に数値表現するのが
困難なことである。しかし、これらの値によって検索さ
れる情報が異なってくるので、その設定を疎かにするこ
とはできない。これらの設定を支援する技術としては、
現在の設定値や設定値間の関係を判り易く表示すること
を目的とした専用エディタを用いる方式やニューラルネ
ットワークを用いて自動学習させる方式などがある。

【０００６】しかしながら、専用エディタを用いる方式
は、設定の容易化に寄与できるものの、システムの受取
る情報が設定値そのものであるため、最適設定の問題を
解決することはできない。

【０００７】一方、ニューラルネットワークを用いる方
式は、類似評価の正解情報を与えておき、これに合せて
属性間重要度や属性別類似度を学習させるものである。
したがって、この方式では初期に専門家から与えられた
属性間重要度や属性別類似度が考慮されないという欠点
がある。また、たとえば東京−名古屋の距離は、東京−
大阪の距離より短い。したがって、名古屋は東京との類
似度が大阪より大きいといった対象領域特有の知識を反
映させることが困難である。

【０００８】

【発明が解決しようとする課題】上述の如く、従来の類
似検索装置にあっては、専門家の判断を正確に反映でき
ないばかりか、対象領域固有の知識を類似度評価に正確
に反映することができない問題があった。

【０００９】そこで本発明は、上述した不具合を解消で
きる学習機能を備え、柔軟な類似検索を実現できる類似
検索装置を提供するすることを目的としている。

【００１０】

【課題を解決するための手段】上記目的を達成するため
に、本発明に係る類似検索装置では、類似検索知識学習
手段を備えている。

【００１１】すなわち、本発明は、複数の属性−属性値
の組によって記述された検索対象を格納してなる検索対
象記憶手段と、複数の属性−属性値の組として表現され
た検索条件に対して属性間の相対的な重要度を評価する
属性間重要度評価知識を格納してなる属性間重要度評価
知識記憶手段と、検索条件と検索対象との組に対して特
定の属性に関する両者の類似度を評価する属性別類似度
評価知識を格納してなる属性別類似度評価知識記憶手段
と、検索条件と検索対象との組に対して前記属性別類似
度評価知識記憶手段に格納されている属性別類似度評価
知識を用いて評価した類似度に前記属性間重要度評価知
識記憶手段に格納されている属性間重要度評価知識を用
いて評価した属性間の相対的な重要度を加味した上で検
索条件と検索対象との間の総合的な類似度を算出する類
似度評価手段と、外部から入力された検索条件に対して
前記類似度評価手段を用いて上記検索条件と前記検索対
象記憶手段に格納されている検索対象との間の類似度を
算出するとともに検索対象を類似度の順序に整列あるい
は選択して外部に出力する類似検索制御手段とを備えた
類似検索装置において、特定の検索条件に対して行なっ
た検索対象の間の類似度の正しい順序関係が前記類似検
索制御手段を介して格納される正解類似順序記憶手段
と、上記特定の検索条件と検索対象との組に対し、その
類似度の評価に影響をおよぼす前記属性間重要度評価知
識記憶手段に格納されている属性間重要度評価知識およ
び前記属性別類似度評価知識記憶手段に格納されている
属性別類似度評価知識からなる類似検索知識を特定する
とともに上記類似検索知識に対して類似度の評価が影響
を受ける検索条件と検索対象との組を特定する知識依存
関係特定手段と、現時点での正解類似順序関係の充足状
況を外部に出力するとともに変更対象とする前記類似検
索知識の指定を外部から入力して変更対象と指定された
類似検索知識に対して前記知識依存関係特定手段を用い
て上記類似検索知識が類似度に影響をおよぼす検索条件
と検索対象との組を特定し、特定された検索条件と検索
対象との組に関連する正解類似順序関係を特定し、変更
対象と指定された類似検索知識を変数群として特定され
た正解類似順序関係を制約条件群とした制約充足問題を
定式化する制約充足問題定式化手段と、この制約充足問
題定式化手段により定式化された制約充足問題を解く制
約充足問題解決手段と、外部から変更対象の指示を受け
ながら前記制約充足問題定式化手段を用いて前記類似検
索知識を調整する問題を制約充足問題として定式化し、
前記制約充足問題解決手段を用いて解いた制約充足問題
の結果を用いて前記属性間重要度性知識および前記属性
別類似度知識の一方あるいは両方を変更する学習制御手
段とを含む類似検索知識学習手段を備えている。

【００１２】ここで、前記制約充足問題定式化手段は、
特定された前記変数群と制約条件群だけに限らず、前記
制約条件の充足に影響をおよぼす他の類似検索知識をも
変更対象として変数群に加え、追加された変更対象の類
似検索知識が影響をおよぼす検索条件と検索対象との組
に関係した類似順序関係をも制約条件群に追加すること
を繰り返すことによって、変更対象を拡大し、かつ対応
した制約条件を追加することによって制約充足問題を定
式化する機能を備えていてもよい。

【００１３】また、前記類似検索知識学習手段が、前記
類似検索知識に関する類似順序関係以外の対象分野に特
化した制約条件を格納した領域特化制約知識ベースを備
え、さらに前記制約充足問題定式化手段が、前記領域特
化制約知識ベースに格納されている領域特化制約条件を
用いて指定された変更対象に連動して変更対象とすべき
前記類似検索知識を特定し、特定された変更対象の類似
検索知識に関する領域特化制約条件を制約条件として追
加して前記制約充足問題を定式化する機能を備えていて
もよい。

【００１４】さらに、前記制約充足問題定式化手段が、
定式化した前記制約充足問題に類似性知識の変更を現在
の設定値からの変化を所定の尺度で最小にするという目
的関数を加えた最適化制約充足問題として定式化する機
能を備え、前記制約充足問題解決手段が、定式化された
前記最適化制約充足問題を解く機能を備えていてもよ
い。

【００１５】

【作用】通常の類似度検索の実行は、検索対象記憶手段
と、属性間重要度評価知識記憶手段と、属性別類似度評
価知識記憶手段と、類似度評価手段と、類似検索制御手
段との間で行われる。

【００１６】そして、学習に際しては、外部からの指示
で満足すべき類似順序関係を正解類似順序記憶手段に格
納することが行われる。学習において、知識依存関係特
定手段は、検索条件と検索対象の組に対し、その類似度
の評価に影響をおよぼす属性間重要度評価知識記憶手段
に格納されている属性間重要度評価知識および属性別類
似度評価知識記憶手段に格納されている属性別類似度評
価知識からなる類似検索知識を特定し、また逆に類似検
索知識に対し、類似度の評価が影響を受ける検索条件と
検索対象の組を特定する。

【００１７】学習処理は、学習制御手段が制御を司る。
学習制御手段は、外部から変更対象の指示を受けながら
制約充足問題定式化手段を用いて、類似検索知識を調整
する問題を制約充足問題として定式化し、制約充足問題
解決手段を用いて制約充足問題を解き、その結果を用い
て属性間重要性知識および属性別類似度知識の一方ある
いは両方を変更する。

【００１８】このとき、制約充足問題定式化手段での定
式化の手法およびその解法には次のような幾つかがあ
る。

【００１９】すなわち、その第１は、現時点での正解類
似順序関係の充足状況を外部に出力し、変更対象とする
類似検索知識の指定を外部から入力し、変更対象と指定
された類似検索知識に対し、知識依存関係特定手段を用
いて類似検索知識が類似度に影響を及ぼすような検索条
件と検索対象との組を特定し、特定された検索条件と検
索対象の組に関連する正解類似順序関係を特定し、変更
対象と指定された類似検索知識を変数群とし、特定され
た正解類似順序関係を制約条件群とした制約充足問題を
定式化する手法である。

【００２０】また、その第２は、上記第１の手法によっ
て特定された変数群と制約条件群だけではなく、制約条
件の充足に影響をおよぼす他の類似検索知識をも変更対
象として変数群に加え、ここで追加された変更対象の類
似検索知識が影響を及ぼす検索条件と検索対象の組に関
係した類似順序関係をも制約条件群に追加する、という
ことを繰り返すことによって、変更対象を拡大し、かつ
対応した制約条件を追加することによって制約充足問題
を定式化する手法である。

【００２１】また、その第３は、領域特化制約知識ベー
スに格納されている領域特化制約条件を用いて指定され
た変更対象に連動して変更対象とすべき類似検索知識を
特定し、また、このようにして特定された変更対象の類
似検索知識に関する領域特化制約条件を制約条件として
追加して制約充足問題を定式化する手法である。

【００２２】また、その第４は、前記手法によって定式
化した制約充足問題に、類似性知識の変更を現在の設定
値からの変化を所定の尺度で最小にするという目的関数
を加えた最適化制約充足問題として定式化し、この最適
化制約充足問題を解く手法である。

【００２３】

【実施例】以下、図面を参照しながら実施例を説明す
る。

【００２４】図１には本発明の一実施例に係る類似検索
装置の概略構成が示されている。

【００２５】この類似検索装置は、大きく分けて、類似
検索実行部１と、類似検索知識学習部２と、類似検索実
行部１に対して検索条件を入力する入力手段３と、類似
検索実行部１で検索された結果を表示する表示手段４
と、類似検索実行部１に正解情報を入力する入力手段５
と、類似検索知識学習部２に学習指令を与える指令手段
６と、学習結果を表示する表示手段７と、類似検索知識
学習部２に対して確認情報を与える手段８とで構成され
ている。

【００２６】類似検索実行部１は、類似検索の実行を司
る類似検索制御部９と、検索対象のデータが格納されて
いる検索対象データベース１０と、検索条件と検索対象
との間の類似度を評価する類似度評価部１１と、属性間
の相対的な重要度を評価する知識が格納されている属性
間重要度評価知識ベース１２と、属性毎の類似度を評価
する知識が格納されている属性別類似度評価知識ベース
１３とで構成されている。

【００２７】検索対象データベース１０には、複数の属
性−属性値の組により記述された検索対象が格納されて
いる。属性間重要度評価知識ベース１２には、複数の属
性−属性値の組として表現された検索条件に対して属性
間の相対的な重要度を評価する属性間重要度評価知識が
格納されている。属性別類似度評価知識ベース１３に
は、検索条件と検索対象との組に対し、特定の属性に関
する両者の類似度を評価する属性別類似度評価知識が格
納されている。

【００２８】類似度評価部１１は、検索条件と検索対象
との組に対し、属性別類似度評価知識ベース１３に格納
されている属性別類似度評価知識を用いて評価した各属
性毎の両者の類似度を基にして属性間重要度評価知識ベ
ース１２に格納されている属性間重要度評価知識を用い
て評価した属性間の相対的な重要度を考慮した上で検索
条件と検索対象の間の総合的な類似度を算出する。

【００２９】類似検索制御部９は、外部から検索条件を
入力し、類似度評価部１１を用いて検索条件と検索対象
データベース１０に格納されている検索対象との間の類
似度を算出し、検索対象を類似度の順序に整列あるいは
選択して外部に出力し、さらに類似検索結果を外部に出
力した後に、満足すべき類似順序関係を外部より入力
し、その類似順序関係を後述する正解類似順序データベ
ース１８に格納する。

【００３０】一方、類似検索知識学習部２は、類似検索
知識（重要度評価知識および類似度評価知識）の学習を
司る類似検索知識学習制御部１４と、検索条件と検索対
象との組に対してその類似度に影響を与える類似検索知
識を特定したり、類似検索知識に対してその類似度が影
響を受ける検索条件と検索対象との組を特定したりする
知識依存関係特定部１５と、類似検索知識の学習を最適
化制約充足問題として定式化する最適化制約充足問題定
式化部１６と、定式化された最適化制約充足問題を解く
最適化制約充足問題解決部１７と、ユーザにより入力さ
れた正しい類似順序が格納されている正解類似順序デー
タベース１８と、検索時の類似度評価に用いた知識の識
別子と類似度評価（検索条件と検索対象との類似度の
組）とが格納されている知識依存関係データベース１９
と、対象領域に特化された制約条件が格納されている領
域特化制約知識ベース２０とで構成されている。

【００３１】次に、この類似検索装置の動作を説明す
る。

【００３２】なお、説明を簡単にするために、この類似
検索装置が「旅行案内装置」として使用されている場合
について説明する。この「旅行案内装置」は、旅行に対
する要望がユーザによって入力されたとき、検索対象デ
ータベース１０に格納されている過去の旅行プランから
最も類似したプランを検索してユーザに提示する役目を
果たすものとする。

【００３３】ここで、旅行プランは、「目的」，「場
所」，「時期」，「交通」の４つの属性で特徴づけられ
ているとする。それぞれの属性が取り得る値は、図２に
示す通りのものであるとする。たとえば、「目的」とい
う属性は、「家族旅行」，「慰安旅行」，「スキー」と
いう値のいずれかを取るものとし、以下、「場所」，
「時期」，「交通」についても図２に示され値のいずれ
かを取るものとする。

【００３４】一方、検索対象データベース１０には、図
３に示すように、過去の旅行プランの具体例が格納され
ているものとする。ただし、簡単のために、具体的なプ
ランの内容は表示せず、プランを特徴づけている上記４
つの属性の値のみを示すことにする。図４にはユーザが
順次入力するであろうと想定される検索条件の一覧が示
されている。このように、検索条件は検索対象のデータ
と同じ４つの属性に対する具体的な値で表現されている
ものとする。

【００３５】図５には、属性間重要度評価知識ベース１
２に現時点において格納されている属性間重要度知識の
具体例が示されている。ここでは、属性間重要度知識が
各属性に割り当てられた合計が１になる０〜１の数値で
表現されているとする。これを以後「重要度ベクトル」
と呼ぶことにする。この重要度ベクトルは、あらゆる検
索条件と検索対象との組合せに対して適用されるものと
する。

【００３６】図６には、属性別類似度評価知識ベース１
３に現時点において格納されている属性別類似度知識の
具体例が示されている。ここでは、属性別類似度知識が
各属性に対してテーブル形式で与えられている。テーブ
ルは、検索条件の値と検索対象データの値との間の関数
として定義され、値として０〜１をとる。０は全く似て
いないことを示しており、１は同一であることを示して
いる。以後、このテーブルを「類似度テーブル」と呼ぶ
ことにし、類似度テーブルが定義している２変数関数を
「類似度関数」と呼ぶことにする。また、ここで定義さ
れているテーブル、つまり類似度関数は対称であるとす
る。

【００３７】図７には、この「旅行案内装置」を起動し
た際に画面に表示される内容が示されている。“％”は
オペレーティングシステムのプロンプトで、本装置はコ
マンド“trip-plan ”で起動される。起動すると、図７
に示すように、データベース群および知識ベース群がオ
ープンまたはロードされ、コマンドの利用方法が表示さ
れた後、コマンドを受付るモードとなる。コマンドに
は、検索を実行する“retrieve”と知識の学習を行なう
“learn ”とがある。これらは、後述する「類似検索実
行モード」と「学習モード」の２つの動作モードに対応
する。コマンド入力のプロンプトは、通し番号に“＞
＞”をつけたものとなっている。

【００３８】最初に「類似検索実行モード」について説
明する。

【００３９】この類似検索は図８に示される処理の流れ
にしたがって実行される。

【００４０】まず、検索条件を入力すると（ステップS
1）、類似評価結果（類似度と存在知識）を格納してお
くための配列Ｒを確保して初期化する（ステップS2）。

【００４１】次に、検索対象データベース１０中の全て
の検索対象データに関して以下の処理を行う。まず、未
処理の検索対象データがあるときには（ステップS3）、
そのような検索対象データを１つ選んでＤｉとする（ス
テップS4）。Ｄｉについて計算する類似度ｒｉと依存知
識Ｋｉとをそれぞれ０および｛｝（空集合）に初期化す
る（ステップS5）。

【００４２】そして、検索条件および検索対象データを
記述する全ての属性に対して以下の処理を行なう。ま
ず、未処理の属性を１つ選択しＡｊとする（ステップS
7）。属性間重要度評価知識ベース１２に格納されてい
る知識を用いて属性Ａｊの重要度ｗｊを求める（ステッ
プS8）。また、その際に用いた知識の識別子をＫｉに格
納しておく（同じくステップS8）。次に、属性別類似度
評価知識ベース１３に格納されている知識を用いて属性
Ａｊに関する検索条件Ｃと検索対象データＤｉとの間の
類似度ｒｊを求める（ステップS9）。また、その際に用
いた知識の識別子をＫｉに追加格納しておく（同じくス
テップS9）。次に、ｗｊ×ｒｊをｒｉに加え（ステップ
S10 ）、ステップS6の分岐に戻る。

【００４３】未処理の属性がなくなると（ステップS
6）、そのときのｒｉが与えられた検索条件と検索対象
データＤｉとの総合類似度になり、そのときのＫｉがそ
の総合類似度を求める上で参照した知識の識別子の集合
を表す。検索対象データＤｉ、類似度ｒｉ、依存知識Ｋ
ｉを配列Ｒのｉ番目の場所に格納し（ステップS11 ）、
ステップS3の分岐へと戻る。

【００４４】全ての検索対象データに対しての処理が終
了した時点（ステップS3）で、配列Ｒに格納しておいた
データ群Ｄｉをその類似度ｒｉでソートし（ステップS1
2 ）、検索結果を類似度順にユーザに表示する（ステッ
プS13 ）。

【００４５】ここで、正解情報をユーザに入力してもら
い、正解類似順序データベース１８に記録しておく（ス
テップS14 ）。また、類似度を計算する過程で調べてお
いた知識依存関係を知識依存関係データベース１９に格
納する（ステップS15 ）。最後に検索条件をデータとし
て検索対象データベース１０に格納した（ステップS16
）後、検索処理を終了する。

【００４６】以上に述べた「類似検索実行モード」の動
作を具体的な例を用いて詳細に説明する。

【００４７】図９には検索過程における画面表示の具体
例が示されている。また、図１０には検索条件と各検索
対象データとの間の総合類似度を計算する過程が示さ
れ、図１１にはユーザが入力した正解類似順序例が示さ
れている。なお、図９においてはlearn コマンドを実行
しているが何も処理されない。これは、図１１に示すよ
うに全ての正解類似順序が満足されているからである。

【００４８】図１２には別の検索過程における画面表示
の具体例が示されている。このときの検索条件と各検索
対象データとの間の総合類似度を計算する過程が図１３
に示されており、そのときにユーザの入力した正解類似
順序が図１４に示されている。この例では、図１４に示
されるように、全ての正解類似順序が満足されているわ
けではない。したがって、類似検索知識の学習が必要に
なる。

【００４９】次に、「学習モード」について説明する。

【００５０】図１５には学習モードの処理の流れが示さ
れている。

【００５１】まず、ステップS20 において後述する手法
で重要度ベクトルの変更を試みる。もし成功したときに
は終了する。失敗したときには（ステップS39 ）、後述
する手法で類似度テーブルの変更を試みる（ステップS4
0 ）。ここでは、満足されていない類似順序に直接関係
する類似度定義のみを変更対象とする。もし成功したと
きには終了する。

【００５２】失敗したときには（ステップS59 ）、後述
する手法で類似度テーブルの変更を試みる（ステップS6
0 ）。ここでは、満足されていない類似順序に直接関係
する類似度定義だけでなく、制約条件に現われる類似度
定義も変更対象とする。もし成功したときには終了す
る。失敗したときには（ステップS79 ）、制約を緩和す
る必要がある。制約の緩和は、類似順序あるいは領域特
化制約の幾つかを無視することにより行なう（ステップ
S80 ）。いずれかの学習方式が成功するまで緩和が行な
われる。

【００５３】次に、図１５に示される個々の学習方式に
ついて説明する。

【００５４】まず、ステップS20 において、重要度ベク
トルの変更を試みる場合について説明する。

【００５５】図１６には、その処理の流れが示されてい
る。

【００５６】まず、重要度を変更対象にする（すなわち
変数化する）属性の組を選択する（ステップS22 ）。次
に、同時に重要度を変更対象とすべき属性の組を特定す
る（ステップS23 ）。これは、領域特化制約知識ベース
２０に格納されている等式制約を用いる。次に、正解類
似順序データベース１８に格納されているユーザが入力
した正しい類似順序関係を読み込む（ステップS24 ）。
これらは不等号制約条件として利用される。次に、領域
特化制約知識ベース２０に格納されている不等式制約も
加える（ステップS25 ）。目的関数を選択し（複数あれ
ば）、重要度ベクトルの変更問題を最適化制約充足問題
として定式化する（ステップS26 ）。定式化された最適
化制約充足問題を解く（ステップS27 ）。もし、解が求
まれば（ステップS28 ）、解を選択し（複数ある場
合）、ユーザに確認の上で属性間重要度評価知識ベース
１２の重要度ベクトルを更新する（ステップS29 ）。

【００５７】もし、解が求まらないときには（ステップ
S28 ）、ステップS21 に戻る。全属性の重要度を変数化
して調整を試みたのであれば終了である（学習失敗）。

【００５８】まだ変数化を試みていない属性の組合せパ
ターンのあるときには、ステップS22 に進む。なお、こ
のフローチャートでは知識依存関係の追跡に触れていな
いが、これは重要度ベクトルが全ての類似度評価に適用
されていることを考え、逐一追跡せずに全ての正解類似
順序を制約条件として取り込んでいるからである。

【００５９】ステップS27 での最適化制約充足問題の定
式化においては、変数の種類、目的関数の種類、制約条
件の種類に応じて、さまざまな手法をとり得る。まず目
的関数は、現在の設定値からの変化分が最小になるよう
なものを設定する。変数が連続量をとるものとし、目的
関数、制約条件群とも一次式で表現できれば、線形計画
問題として取扱うことができる。また、目的関数を現在
値からの変化分の自乗和とし表現すれば、二次計画法と
して定式化することも可能である。さらには、変数を適
当な刻みをつけて離散化すれば、整数計画法として定式
化することも可能である。ここでは、線形計画法として
定式化する場合のみを説明する。

【００６０】図１７には、この学習方式をインプリメン
トしたlearn コマンドを実行した際の画面表示例が示さ
れている。図１８には疑似的な線形計画問題としての定
式化が示されている。「疑似的」というのは、完全な線
形計画問題ではないが、変数の符号を場合分けすること
により、容易に線形計画問題になるからである。変数ｘ
とｙは、属性「場所」と「時期」との現在の重要度から
の変化分である。なお、ここでは領域特化の知識を使っ
て、最も最適化の効果がありそうな変数を２つ選んでい
る。また、ここでは後の説明を容易化するために、ｘと
ｙとを0.1 刻みで離散化し、整数計画問題として解いて
いる。その結果、ｘ＝0.1 ，ｙ＝-0.1が最適解となっ
た。図１９には学習後の重要度ベクトルが示されてい
る。図２０には変更前の重要度ベクトルを用いて計算し
た類似度と、この変更された新しい重要度ベクトルを用
いて計算した類似度とが示されている。正解類似順序が
満足されていることが判る。

【００６１】次に、図１５に示されるステップS40 にお
いて、類似度テーブルの変更を試みる場合の学習方式に
ついて説明する。

【００６２】これは、属性別類似度の学習（修正対象は
直接関係するもののみ）を行なうものである。図２４に
処理の流れが示されている。

【００６３】学習が起動された時点で満足されていない
類似順序関係を正解類似順序データベース１８から検索
し、そこに現われる検索条件と検索対象データとの組
（Ｃｉ，Ｄｊ）を求める（ステップS41 ）。知識依存関
係データベース１９を参照し、ステップS41 で求めた検
索条件と検索対象データとの組（Ｃｉ，Ｄｊ）に対する
類似度評価に直接影響する類似度定義を特定する（ステ
ップS42 ）。

【００６４】ステップS42 で求めた類似度定義を全て変
数化しても実行可能解が求められなかった場合は、学習
失敗として終了する（ステップS43 ）。

【００６５】そうでない場合は、変更対象とすべき類似
度定義の組を選択する（ステップS44 ）。次に、領域特
化制約知識ベース２０を参照し、同時に変数化すべき類
似度定義を特定する（ステップS45 ）。次に、知識依存
関係データベース１９を参照し、ステップS44 で選択し
た類似度定義およびステップS45 で特定した類似度定義
が類似度評価に影響をおよぼす検索条件と検索対象デー
タとの組（Ｃｉ′，Ｄｊ′）を特定する（ステップS46
）。

【００６６】次に、ステップS41 およびステップS46 で
特定した検索条件と検索対象データとの組の一方または
両方が現われるような正解類似順序関係を正解類似順序
データベース１８から求める（ステップS47 ）。次に、
領域特化制約知識ベース２０を参照し、変更対象とした
類似度定義に関係するような不等号制約条件を検索する
（ステップS48 ）。

【００６７】次に、ステップS44 およびステップS45 で
選択・特定した類似度定義を変数とし、ステップS47 お
よびステップS48 で求めた不等式を制約条件とし、目的
関数を設定して最適化制約充足問題を定式化（ステップ
S49 ）し、定式化した最適化制約充足問題を解く（ステ
ップS50 ）。もし解が求まれば成功である（ステップS5
1 ）。もし求まらなければステップS43 に戻る。

【００６８】成功した場合、解を選択し（複数あれ
ば）、ユーザに確認の上で属性別類似度評価知識ベース
１３に格納されている類似度テーブルを更新し（ステッ
プS52 ）、学習成功として終了する。

【００６９】この図２４に示される処理の具体例を説明
する。

【００７０】まず、現在の検索対象データベース１０に
は、データＤ１，Ｄ２，Ｄ３，Ｄ４，Ｄ５が格納されて
いるものとする。そこに、図４に示す検索条件Ｃ６に対
する検索要求が与えられたとする。

【００７１】図２１に類似検索の画面表示例を示す。各
データとの総合類似度の計算過程の詳細は図２２に示す
通りである。ここで、注意を要するの点は、現時点での
重要度ベクトルは、先の学習により変更された図１９に
示される値である。

【００７２】ユーザからの正解類似順序の入力により、
正解類似順序データベース１８の内容が図２３のように
なる。装置の出力とユーザの判断とに相違点がある。す
なわち、ユーザの示したｒ（Ｃ６，Ｄ１）≦ｒ（Ｃ６，
Ｄ２）という判断が装置の出力と異なっている。

【００７３】そこで、学習を行なう。図２５〜図２８に
は、その画面表示例が示されている。先程と同じく、重
要度ベクトルの変更が試みられるが、図２５に示すよう
に、ここではそれが失敗したものとする。すると、図２
６に示すように、次には、類似度テーブルの変更が試み
られる。ここでは、最低限変更の必要なもののみを変更
対象とする。すなわち、ｒ（Ｃ６，Ｄ１）および（Ｃ
６，Ｄ２）の値を変化させられるものに限定する。

【００７４】Ｃ６＝（家族，熱海，春，マイカー）Ｄ１＝（家族，日光，秋，鉄道）Ｄ２＝（慰安，熱海，冬，バス）であるから、ｒ１（家族旅行，慰安旅行），ｒ２（熱海，日光），ｒ３（春，秋），ｒ３（春，冬），ｒ４（マイカー，鉄道），ｒ４（マイカー，バス）の中から変更対象を選択することになる。なお、ｒ１
（家族旅行，慰安旅行），ｒ２（熱海，日光）は、検索
条件側の値とデータ側の値が等しく、領域特化制約知識
ベース２０に、そのような場合は類似度が１と定義され
るとの知識が格納されており、今回の変更対象候補から
外される。

【００７５】また、同じく領域特化制約知識ベース２０
に、ｒｉ，ｉ＝１，…，４は対象であること、すなわ
ち、ｒｉ（ｕ，ｖ）＝ｒｉ（ｖ，ｕ），ｉ＝１，…，４という知識が記述されており、ｒ１（家族旅行，慰安旅
行）を変更対象として選択したら、ｒ１（慰安旅行，家
族旅行）も変更対象として選択しなければならないこと
となる。

【００７６】上記の類似度定義は、すべて変更する必要
はない。もし一部の変更のみで制約条件が全て満足さ
れ、しかも変更が不自然でなければ、厳密な最適化はで
きないが、これでも十分である。そのような変更対象の
選択戦略として下記のようなものが考えられる。

【００７７】1 ．最初から関連する類似度定義をすべて
変更対象とする。

【００７８】(a) 長所：変更の試みを繰り返す必要がな
くなる。つまり、成功すれば一回で済むし、失敗すると
きは、変更対象を絞り込んだ場合も全て失敗するはずで
あり、絞り込みの意味がなくなる。また、現在の設定値
からの変化分を確実に最小化できる。

【００７９】(b) 短所：変数の個数が多くなり、現実的
な時間内で解けない可能性がでてくる。

【００８０】2 ．ユーザに選択させる。

【００８１】(a) 長所：専門家的な知識を利用できるの
で、早期に収束できる可能性が大きい。また、既に固定
した設定値を変更対象から外すといったコントロールが
できる。

【００８２】(b) 短所：現在からの設定値からの変化分
が必ずしも最小にならない。

【００８３】3 ．属性間重要度の大きい順に変更対象を
拡大していく。具体的には、重要度最大の属性に関する
類似度定義をまず変数化の対象にして変更を試みる。成
功すればそれでよいが、失敗したときには、次に重要度
の大きい属性に関する類似度定義を変数化の対象として
追加する。それでも失敗したときには、さらに変数化の
対象を拡大していく。

【００８４】(a) 長所：変化分が最小の解が得られる可
能性が高い。

【００８５】(b) 短所：もともとの制約が強過ぎるとき
は、成功するまでに、何度も失敗する可能性がある。

【００８６】ここでは、３の重要度順の戦略にユーザの
判断を加えていくことにする。

【００８７】現在の重要度ベクトルは、（0.4 ，0.3 ，
0.1 ，0.2 ）であるから、属性「目的」と「場所」とに
関する類似度定義を変更対象にする。すなわち、図２６
に示すように、ｒ１（家族旅行，慰安旅行）とｒ２（熱
海，日光）を変数化する。

【００８８】変数化の対象が決定したら、これらを変更
した場合に影響を受ける類似度評価を特定する。これ
は、知識依存関係データベース１９に格納されている情
報を用いて行なう。図２９にその結果を示す。また、図
２７にもその結果が現われている。

【００８９】これらの類似順序および領域特化の制約を
制約条件とし、ｒ１（家族旅行，慰安旅行）とｒ２（熱
海，日光）の現在値からの変化分を、それぞれ変数ｘ，
ｙとし、目的関数をその絶対値の和の最小化として疑似
的な線形計画問題として定式化すると、図３０に示すよ
うになる。ここでは、後の説明を容易にするために、ｘ
とｙを0.1 刻みで離散化し、整数計画問題として解いて
いる。ｘ＝0.1 ，ｙ＝0.0 とｘ＝0.0 ，ｙ＝-0.1の２つ
の最適解が見つかる。

【００９０】図３１には学習後の類似度テーブルが示さ
れている。、また、図３２には変更前の類似度テーブル
を用いて計算した類似度と、この新しい類似度テーブル
を用いて計算した類似度とが示されている。図から判る
ように、正解類似順序が満足されている。

【００９１】次に、図１５に示されるステップS60 にお
いて、類似度テーブルの変更を試みる場合の学習方式に
ついて説明する。ここでは、満足されていない類似順序
に直接関係する類似度定義だけではなく、制約条件に現
われる類似度定義も変更対象とする。

【００９２】図３３には、この学習方式の処理の流れが
示されている。

【００９３】ここでは、制約条件群を格納しておく配列
ＣＯＮＳＴと、変更対象候補の類似度定義を格納してお
く配列Ｒと、選択された変更対象群を格納しておく配列
ＶＡＲと、影響を受ける検索条件とデータとの組を格納
しておく配列ＣＤを用いる。配列の添字のlevel は、変
更対象の拡大のレベルである。

【００９４】学習が起動された時点で満足されていない
類似順序関係を正解類似順序データベース１８から検索
し、配列要素ＣＯＮＳＴ［０］に格納する（ステップS6
1 ）。また、そこに現われる検索条件とデータとの組
（Ｃｉ，Ｄｊ）を求め、配列要素ＣＤ［０］に格納する
（同じくステップS61 ）。

【００９５】次に、知識依存関係データベース１９を参
照し、ステップS61 で求めた検索条件とデータとの組
（Ｃｉ，Ｄｊ）に対する類似度評価に直接影響する類似
度定義を変更対象候補として配列要素Ｒ［０］に格納す
る（ステップS62 ）。また、ここで変数level を０に初
期化する（同じくステップS62 ）。

【００９６】ステップS62 で求めた類似度定義（現レベ
ルでの変更対象候補）を全て変数化しても実行可能解を
求められなかった場合には、このレベルでの学習が失敗
したとしてステップS73 に進む（ステップS63 ）。そう
でない場合はステップS64 に進む。

【００９７】変更対象とすべき類似度定義の組を現レベ
ルでの変更対象候補Ｒ［level ］から選択し、ＶＡＲ
［level ］にセットする（ステップS64 ）。領域特化制
約知識ベース２０を参照し、同時に変数化すべき類似度
定義を特定し、ＶＡＲ［level］に追加する（ステップS
65 ）。

【００９８】次に、知識依存関係データベース１９を参
照し、ＶＡＲ［level ］の内容、すなわちステップS64
で選択した類似度定義およびステップS65 で特定した類
似度定義が類似度評価に影響をおよぼす検索条件とデー
タとの組（Ｄｉ，Ｄｊ）を特定し、ＣＤ［level ＋１］
に格納する（ステップS66 ）。

【００９９】ステップS61 およびステップS66 で特定し
た検索条件とデータとの組が現われるような正解類似順
序関係を正解類似順序データベース１８から求め、ＣＯ
ＮＳＴ［level ＋１］に格納する（ステップS67 ）。領
域特化制約知識ベース２０を参照し、変更対象とした類
似度定義に関係するような不等号制約条件を検索し、Ｃ
ＯＮＳＴ［level ＋１］に追加する（ステップS68 ）。

【０１００】このレベルまでの各レベルで変更対象とし
て指定した全ての変更対象を変数とし、このレベルまで
の各レベルで特定した類似順序関係や領域特化制約を制
約条件群として、さらに適切な目的関数を設定して最適
化制約充足問題を定式化する（ステップS69 ）。

【０１０１】定式化した最適化制約充足問題を解く（ス
テップS70 ）。もし解が求まれば成功である（ステップ
S71 ）。もし求まらない場合にはステップS63 に戻る。

【０１０２】成功した場合、解を選択し（複数であれ
ば）、ユーザに確認の上で属性別類似度評価知識ベース
１３に格納されている類似度テーブルを更新し（ステッ
プS72）、学習成功として終了する。

【０１０３】ステップS63 の分岐において、もし、現在
のレベルでの変更対象候補を全て変数化してしまってい
れば、それは現在のレベルでの制約充足失敗を意味す
る。その場合は、次のレベルへの変更対象の拡大を行な
うためにステップS73 へ進む。現在のレベルで変更対象
にした類似度定義ＶＡＲ［level ］＝Ｒ［lebel ］に影
響を受ける検索条件とデータとの組ＣＤ［level ＋１］
の類似度評価に影響する類似度定義で、いままでに変更
対象にならなかったものを次のレベルでの変更対象の候
補としてＲ［level ＋１］に格納する（ステップS73
）。そして、levelを１つ上げる（ステップS74 ）。

【０１０４】Ｒ［level ＋１］が空集合でなければ、こ
れらを変更対象として制約充足を試みるためにステップ
S63 に戻る。しかし、Ｒ［level ＋１］が空集合、すな
わち、すべての類似度定義を変更対象としてしまった場
合には学習失敗として終了する（ステップS75 ）。

【０１０５】

【発明の効果】以上のように、本発明によれば、数値的
な属性間重要度知識および属性別類似度知識を用いて類
似度を評価しながら類似検索を行う類似検索装置におい
て、属性間重要度知識および属性別類似度知識に類似順
序に関する専門家の判断を正確に反映させるための学習
が可能で、もって対象領域固有の知識を類似度評価に反
映させることができる。

【図面の簡単な説明】

【図１】本発明の一実施例に係る類似検索装置のブロッ
ク構成図

【図２】属性名と属性値との具体例を示す図

【図３】検索対象データベースに格納されている内容の
具体例を示す図

【図４】検索条件の具体例を示す図

【図５】属性間重要度評価知識（重要度ベクトル）の具
体例を示す図

【図６】属性別類似度評価知識（類似度テーブル）の具
体例を示す図

【図７】同類似検索装置の起動時における画面表示例を
示す図

【図８】同類似検索装置の類似検索処理の流れ図

【図９】ある検索条件において検索コマンド実行時にお
ける画面表示例を示す図

【図１０】同検索条件における類似度の計算過程の具体
例を示す図

【図１１】正解類似順序の具体例を示す図

【図１２】別の検索条件において検索コマンド実行時に
おける画面表示例を示す図

【図１３】同検索条件における類似度の計算過程の具体
例を示す図

【図１４】正解類似順序の具体例を示す図

【図１５】同類似検索装置において学習動作を行わせた
ときの処理の流れ図

【図１６】重要度ベクトルの変更学習時における処理の
流れ図

【図１７】同学習時における画面表示例を示す図

【図１８】同学習を疑似的線形計画問題として解く場合
の定式化例を示す図

【図１９】学習後の重要度ベクトルの具体例を示す図

【図２０】学習前および学習後の類似度評価例を示す図

【図２１】さらに別の検索条件において検索コマンド実
行時における画面表示例を示す図

【図２２】同検索条件に対する類似度の計算過程を示す
図

【図２３】正解類似順序の具体例を示す図

【図２４】第１段階としての類似度テーブルの変更学習
時における処理の流れ図

【図２５】同学習時の画面表示例を示す図

【図２６】同学習時の画面表示例を示す図

【図２７】同学習時の画面表示例を示す図

【図２８】同学習時の画面表示例を示す図

【図２９】類似度定義と類似度評価の依存関係を示す図

【図３０】制約条件例を示す図

【図３１】変更後の類似とテーブルの具体例を示す図

【図３２】学習前および学習後の類似度評価例を示す図

【図３３】第２段階としての類似度テーブルの変更学習
時における処理の流れ図

【符号の説明】

１…類似検索実行部２…類似検索知
識学習部３…検索条件入力手段４…表示手段５…正解情報入力手段６…学習指令手
段７…学習結果表示手段８…確認情報入
力手段９…類似検索制御部１０…検索対象
データベース１１…類似度評価部１２…属性間重
要度評価知識ベース１３…属性別類似度評価知識ベース１４…類似検索
知識学習制御部１５…知識依存関係特定部１６…最適化制
約充足問題定式化部１７…最適化制約充足問題解決部１８…正解順序
データベース１９…知識依存関係データベース２０…領域特化
制約知識ベース

Claims

【特許請求の範囲】

【請求項１】複数の属性−属性値の組によって記述され
た検索対象を格納してなる検索対象記憶手段と、複数の
属性−属性値の組として表現された検索条件に対して属
性間の相対的な重要度を評価する属性間重要度評価知識
を格納してなる属性間重要度評価知識記憶手段と、検索
条件と検索対象との組に対して特定の属性に関する両者
の類似度を評価する属性別類似度評価知識を格納してな
る属性別類似度評価知識記憶手段と、検索条件と検索対
象との組に対して前記属性別類似度評価知識記憶手段に
格納されている属性別類似度評価知識を用いて評価した
類似度に前記属性間重要度評価知識記憶手段に格納され
ている属性間重要度評価知識を用いて評価した属性間の
相対的な重要度を加味した上で検索条件と検索対象との
間の総合的な類似度を算出する類似度評価手段と、外部
から入力された検索条件に対して前記類似度評価手段を
用いて上記検索条件と前記検索対象記憶手段に格納され
ている検索対象との間の類似度を算出するとともに検索
対象を類似度の順序に整列あるいは選択して外部に出力
する類似検索制御手段とを備えた類似検索装置におい
て、特定の検索条件に対して行なった検索対象の間の類似度
の正しい順序関係が前記類似検索制御手段を介して格納
される正解類似順序記憶手段と、上記特定の検索条件と検索対象との組に対し、その類似
度の評価に影響をおよぼす前記属性間重要度評価知識記
憶手段に格納されている属性間重要度評価知識および前
記属性別類似度評価知識記憶手段に格納されている属性
別類似度評価知識からなる類似検索知識を特定するとと
もに上記類似検索知識に対して類似度の評価が影響を受
ける検索条件と検索対象との組を特定する知識依存関係
特定手段と、現時点での正解類似順序関係の充足状況を外部に出力す
るとともに変更対象とする前記類似検索知識の指定を外
部から入力して変更対象と指定された類似検索知識に対
して前記知識依存関係特定手段を用いて上記類似検索知
識が類似度に影響をおよぼす検索条件と検索対象との組
を特定し、特定された検索条件と検索対象との組に関連
する正解類似順序関係を特定し、変更対象と指定された
類似検索知識を変数群として特定された正解類似順序関
係を制約条件群とした制約充足問題を定式化する制約充
足問題定式化手段と、この制約充足問題定式化手段により定式化された制約充
足問題を解く制約充足問題解決手段と、外部から変更対象の指示を受けながら前記制約充足問題
定式化手段を用いて前記類似検索知識を調整する問題を
制約充足問題として定式化し、前記制約充足問題解決手
段を用いて解いた制約充足問題の結果を用いて前記属性
間重要度性知識および前記属性別類似度知識の一方ある
いは両方を変更する学習制御手段と、を含む類似検索知識学習手段を具備してなることを特徴
とする類似検索装置。
【請求項２】前記制約充足問題定式化手段は、特定され
た前記変数群と制約条件群だけに限らず、前記制約条件
の充足に影響をおよぼす他の類似検索知識をも変更対象
として変数群に加え、追加された変更対象の類似検索知
識が影響をおよぼす検索条件と検索対象との組に関係し
た類似順序関係をも制約条件群に追加することを繰り返
すことによって、変更対象を拡大し、かつ対応した制約
条件を追加することによって制約充足問題を定式化する
機能を備えているとを特徴とする請求項１に記載の類似
検索装置。
【請求項３】前記類似検索知識学習手段は、前記類似検
索知識に関する類似順序関係以外の対象分野に特化した
制約条件を格納した領域特化制約知識ベースを備え、前記制約充足問題定式化手段は、前記領域特化制約知識
ベースに格納されている領域特化制約条件を用いて指定
された変更対象に連動して変更対象とすべき前記類似検
索知識を特定し、特定された変更対象の類似検索知識に
関する領域特化制約条件を制約条件として追加して前記
制約充足問題を定式化する機能を備えていることを特徴
とする請求項１に記載の類似検索装置。
【請求項４】前記制約充足問題定式化手段は、定式化し
た前記制約充足問題に類似性知識の変更を現在の設定値
からの変化を所定の尺度で最小にするという目的関数を
加えた最適化制約充足問題として定式化する機能を備え
ており、前記制約充足問題解決手段は、定式化された前記最適化
制約充足問題を解く機能を備えていることを特徴とする
請求項１に記載の類似検索装置。