JP3664834B2 - 類似検索装置 - Google Patents

類似検索装置 Download PDF

Info

Publication number
JP3664834B2
JP3664834B2 JP02940097A JP2940097A JP3664834B2 JP 3664834 B2 JP3664834 B2 JP 3664834B2 JP 02940097 A JP02940097 A JP 02940097A JP 2940097 A JP2940097 A JP 2940097A JP 3664834 B2 JP3664834 B2 JP 3664834B2
Authority
JP
Japan
Prior art keywords
vector
data
vector data
weight
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02940097A
Other languages
English (en)
Other versions
JPH10228475A (ja
Inventor
賢治 吉良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP02940097A priority Critical patent/JP3664834B2/ja
Publication of JPH10228475A publication Critical patent/JPH10228475A/ja
Application granted granted Critical
Publication of JP3664834B2 publication Critical patent/JP3664834B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、蓄積されたデータ群の中から、対象となるデータに類似するデータを検索する類似検索装置に関するものである。
【0002】
【従来の技術】
図18は例えば“インクリメンタル インスタンスベースト ラーニング オブ インデペンデント アンド グレイデッド コンセプト デスクリプションズ” ディ エイハ, プロスィーディングズ オブ ザ シックスス インターナショナル ワークショップ オン マシン ラーニング,1987年(“Incremental Instance−based Learning of Independent and Graded Concept Descriptions”D.Aha,Proceedings of the Sixth International Workshop on Machine Leaning,1987)および“ア ニアレスト ハイパーレクタングル ラーニング メソッド”エス ザルツバーグ,マシン ラーニング,6,251頁−276頁,1991年(“A Nearest Hyperrectangle Learning Method”,S.Salzberg,Machine Leaning,6,pp251−276,1991)に示された従来の類似検索装置を示すブロック図である。
【0003】
図において、1は新しい目的にあたる検索対象のベクトルデータを指定する対象データ指定部、4は図2にその例を示すように、データベースとして蓄えられたベクトルデータ群であるベクトルデータベース(以下、ベクトルDBと略す)である。3は対象データ指定部1により指定されたベクトルデータと類似するベクトルデータをベクトルDB4から探し出す類似検索エンジン、5は類似検索エンジン3がデータ間の類似度を算出するために用いるベクトルデータの各属性に付けられた重みをそれぞれの要素とする重みベクトル、6は類似検索エンジン3による検索結果を表示する検索結果表示部である。
【0004】
21は類似検索エンジン3が示した類似するベクトルデータが利用者にとって正解であるかどうかを指定する回答指定部、22は対象データ指定部1により指定された検索対象のベクトルデータ、類似検索エンジン3により最も類似するとして選び出されたベクトルデータの2ベクトルの各要素の値を利用して重みベクトルの新しい値を計算する2ベクトル重み再計算部である。9は2ベクトル重み再計算部22により計算された重みベクトルの新しい値を重みベクトル5に反映させる重み改訂部、11は対象データ指定部1により指定された検索対象のベクトルデータに回答指定部21により利用者が指定する結果値を付け加えて、新しいベクトルデータとしてベクトルDB4に追加する新規データ追加部である。
【0005】
次に動作について説明する。
例えば、電子カルテや医療画像データベースなどの医療情報、設計図などの設計情報に代表されるように、発生するデータを蓄積しその中から新しい目的に見合ったデータを選び出して参照する場合に、データをベクトルデータの形に整理してデータベースに蓄え、新しい目的を表すベクトルデータとデータベース中の各データとの類似度を算出して、データベースの中で最も類似するデータを参照するという、ベクトルデータの類似検索技術が応用されている。
【0006】
例えば、図2はベクトルデータのデータベースを示す説明図であり、病院で診療を受けた患者の診療録を表わしている。図において、「患者ID」から「のど痛」までの属性は、各々の患者の診療データを表わしており、検索の条件を記述するための属性という意味でここでは「条件属性」と呼ぶ。属性「病名」は、その診療データをもとに過去に下された診断結果を表わし、検索の結果参照される属性という意味で「参照属性」と呼ぶ。
新しい患者が現れ、その条件属性の値が例えば各々順に、(123,村山,45,公務員,35.8,なし,あり,なし)であった場合に、類似検索装置がデータベースの中から条件属性に類似するベクトルデータ、例えば、(125,鈴木,25,会社員,36.2,なし,あり,なし,花粉症)を選び出し、その参照属性の値「花粉症」を参考にして新しい患者の病名を決定するという問題が類似検索技術の応用問題の例である。
【0007】
次に図18に示した類似検索装置の動作について図19から図21を参照しながら説明する。
説明を容易にするために、ベクトルDB4における条件属性の次元数をn、参照属性の次元数を1とする。ここで参照属性の数が1であることはこの技術の本質ではなく、多数であってもよい。
まず、ステップST21では、重みベクトルの算出に要するベクトル群を初期化する。即ち、類似検索エンジン3において、n次元ベクトルの重みベクトルW=(w1 ,…,wn ),累積重みベクトルWcum=(wcum1 ,…,wcumn ),重み合計ベクトルWtotal=(wtotal1 ,…,wtotaln )の全要素を0に初期化する。
【0008】
ステップST22からステップST30において、対象データを次々に選んで類似検索の処理を行うが、この過程を通して重みベクトルが改訂されてゆく。
ステップST22では、対象データ指定部1が類似検索の対象となるベクトルデータをひとつ選択する。このn次元ベクトルデータをX=(x1 ,x2 ,…,xn )と呼ぶ。ステップST23では、類似検索エンジン3がベクトルDB4からベクトルデータを一つ取り出す。このn+1次元ベクトルデータをY=(y1 ,y2 ,…,yn ,yn+1 )と呼び、y1 からをyn を条件属性の値、yn+1 を参照属性の値とする。
【0009】
ステップST24では、類似検索エンジン3がXとYの類似度sim(X,Y)の算出処理を行う。ここで類似度算出式は、
sim(X,Y)=−√{Σi=1 ,…,ni ・δ(xi ,yi2 }(1)
ここで、
Figure 0003664834
つまり、sim(X,Y)はXとYの重み付き距離の符号を反転したものである。
ステップST25では、YをベクトルDB4の他のベクトルデータに変える処理を行い、また、ステップST23およびステップST24の処理を繰り返す。そうしてベクトルDB4の全ベクトルデータをYとして調べ終わるとステップST26へ進む。
【0010】
ステップST26では、既にステップST23からステップST25で調べ終わったベクトルDB4中の全ベクトルデータの中から、sim(X,Y)を最大にするベクトルデータYmax を選び出す。ここで類似度sim(X,Y)の最大値を与えるYのベクトルデータが複数個ある場合には、それらの中のどれでも良く、例えば、最初のベクトルデータとしても良いし、ランダムに選んでも良い。
【0011】
ステップST27では、Xに最も類似するベクトルデータとしてYmax が正しい選択であったかどうかを判定する。
ステップST27における判定処理の詳細を図20に示す。ステップST271では、Ymax を検索結果表示部6に表示し、利用者がその参照属性の値ymax n+1 を参考にして、Xの参照属性の値xn+1 、例えば診断結果を決定する。
ステップST272では、回答指定部21が、新たに定められたxn+1 とymax n+1 とを比較し、これらが一致していればステップST273で類似検索の判定結果として「正解」を返し、一致していなければステップST274で「不正解」を返す。
【0012】
図19に戻り、ステップST28では、Xおよびymax のベクトルデータを用いて重みベクトルWの値を再計算し、更新する。
ステップST28における処理の詳細を図21に示す。ステップST281では、2ベクトル重み再計算部22が重みベクトルの値Wを次の代入式に従って再計算する。
Wtotali :=Wtotali +△ (3)
但し、△は重み増分パラメータ
Figure 0003664834
ステップST282では、重み改訂部9が上記再計算された新しい重みベクトルWを設定し、次回以降の類似度計算に改訂後の重みベクトルが用いられるようにする。
【0013】
図19に戻り、ステップST29では、新規データ追加部11がX=(x1 ,x2 ,…,xn )とステップST271で決定されたXの参照属性の値xn+1 とを合わせてベクトルDB4の新しいベクトルデータとして保存する。
以上のステップST22からステップST29までで実現される類似検索、重みベクトルの改訂、新規データの追加の処理を、ステップST30における判定を実施しなから類似検索をかけるべき全ての検索対象のベクトルデータについて繰り返す。
【0014】
【発明が解決しようとする課題】
従来の類似検索装置は以上のように構成されているので、
(a)2ベクトル重み再計算部22では、式(3)から式(5)に示したように、類似検索装置による類似検索結果が回答指定部21において正解であった場合にも重みベクトル5の改訂を行うので、改訂前の重みベクトル5で正解のベクトルデータを選出できる状態であったのに、その状態を変更してしまうため、類似検索の精度が向上しにくいという課題があった。
(b)重みベクトル5の値を利用者に表示することができないため、利用者が重みベクトル設定の状態を簡単に参照することができないという課題があった。
(c)重みベクトル5の改訂は、類似検索装置による処理に全て委ねられているため、利用者である人間が自分の知識に基づいてその値を変更し、類似検索装置による処理と協調して重みベクトル5をチューニングしていくことができないという課題があった。
(d)類似検索には固定的に条件属性の全てを用いて条件指定を行っており、その中から条件指定に用いるべき条件属性を選択的に指定することができないという課題があった。
(e)類似検索に用いる重みベクトル5は唯一であり、異なる重みベクトル群を使い分けることができないという課題があった。
(f)ベクトルDB4の全てのベクトルデータは全ての条件属性の値を備えていることが必要であり、DBの拡張を行って過去のベクトルデータに無かった属性が増えた場合や、元々入力データに欠落があった場合などに生じるDB中のベクトルデータの欠落に対して類似検索エンジン3が対処することができないという課題があった。
(g)類似検索を1件実行する度に重みベクトル5が逐次更新されていくため、類似検索装置がシステムとして不安定になるという課題があった。
(h)新しい重みベクトル5の値は無条件で採用され、結果として以前の重みベクトル5に比べて類似検索の精度が悪くなる場合もあり得るという課題があった。
【0015】
この発明は上記のような課題を解決するためになされたもので、類似検索の精度を向上させ、重みベクトル設定の状況を利用者が容易に確認し、変更でき、また、類似検索装置による自動変更と協調的に変更でき、検索の条件指定に相応しい条件属性を利用者が選択でき、複数の重みベクトル設定を使い分けることを可能にし、データべース中にベクトルデータの欠落があっても対処を可能とするような類似検索装置を得ることを目的とする。
また、この発明は利用者の検索作業を安定的に実施しながら重みの改訂を行い、重みの改訂においては新旧の重みの適切な評価の結果を受けて精度が向上するように改訂できる類似検索装置を得ることを目的とする。
【0016】
【課題を解決するための手段】
請求項1記載の発明に係る類似検索装置は、類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータのうちの類似検索の対象にする条件属性を利用者の操作に基づいて指定される対象属性選択部を備え、類似検索エンジンは、上記対象属性選択部により指定された条件属性のみに関してベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定されたベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索するものである。
【0017】
請求項2記載の発明に係る類似検索装置は、類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータのうちの類似検索の対象にする条件属性を利用者の操作に基づいて指定される対象属性選択部を備え、類似検索エンジンは、上記対象属性選択部により指定された条件属性のみに関してベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定されたベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索するものである。
【0018】
請求項3記載の発明に係る類似検索装置は、類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、利用者の操作に基づいて重み改訂モードが、1回の類似検索エンジンによる検索の実行毎に重みベクトルを改訂するオンラインモード、数回の類似検索エンジンによる検索の実行後に重みベクトルを改訂するオフラインモード、または全く重みベクトルを改訂しないノーモードに指定され、その指定された重み改訂モードに応じて重みベクトルの改訂処理を制御する重み改訂制御部を備えたものである。
【0019】
請求項4記載の発明に係る類似検索装置は、類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、利用者の操作に基づいて重み改訂モードが、1回の類似検索エンジンによる検索の実行毎に重みベクトルを改訂するオンラインモード、数回の類似検索エンジンによる検索の実行後に重みベクトルを改訂するオフラインモード、または全く重みベクトルを改訂しないノーモードに指定され、その指定された重み改訂モードに応じて重みベクトルの改訂処理を制御する重み改訂制御部を備えたものである。
【0020】
請求項5記載の発明に係る類似検索装置は、類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、評価用データを用い、改訂前の重みベクトルと改訂後の重みベクトルとを評価比較し、妥当な重みベクトルを選択する重みベクトル評価部を備えたものである。
【0021】
請求項6記載の発明に係る類似検索装置は、類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、評価用データを用い、改訂前の重みベクトルと改訂後の重みベクトルとを評価比較し、妥当な重みベクトルを選択する重みベクトル評価部を備えたものである。
【0022】
請求項7記載の発明に係る類似検索装置は、類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータまたはベクトルデータベースに蓄積されたベクトルデータの条件属性に欠落がある場合に、類似検索エンジンによりその欠落がある条件属性に基づいて仮類似度を計算させると共に、その欠落がある重みベクトルと欠落がない重みベクトルとその仮類似度とに基づいて矯正類似度を計算させて、その矯正類似度を利用して検索させるデータ欠落対処部を備えたものである。
【0023】
請求項8記載の発明に係る類似検索装置は、類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータまたはベクトルデータベースに蓄積されたベクトルデータの条件属性に欠落がある場合に、類似検索エンジンによりその欠落がある条件属性に基づいて仮類似度を計算させると共に、その欠落がある重みベクトルと欠落がない重みベクトルとその仮類似度とに基づいて矯正類似度を計算させて、その矯正類似度を利用して検索させるデータ欠落対処部を備えたものである。
【0024】
請求項9記載の発明に係る類似検索装置は、重みベクトルの値を表示すると共に、利用者の指示に基づいてその重みベクトルの値を改訂する重み表示設定部を備えたものである。
【0025】
請求項10記載の発明に係る類似検索装置は、重み表示設定部を、スライドバーまたは棒グラフのようにグラフィカルに表示するようにしたものである。
【0026】
請求項11記載の発明に係る類似検索装置は、対象属性選択部を、条件属性名を表示したオンオフスイッチのようにグラフィカルに表示するようにしたものである。
【0031】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による類似検索装置を示すブロック図であり、図において、1は検索対象の条件属性を有するベクトルデータを指定する対象データ指定部、2はベクトルデータの条件属性のうちのどの条件属性を対象として類似検索を行うかを指定する対象属性選択部、4は図2にその例を示したようにデータベースとして蓄えられた条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベース(以下、ベクトルDBと略す)である。3は対象データ指定部1により指定された対象データと類似するベクトルデータをベクトルDB4から検索する類似検索エンジン、5は類似検索エンジン3がデータ間の類似度を算出するために用いられるベクトルの各条件属性に付けられた重みをそれぞれの要素とする重みベクトル、6は類似検索エンジン3による検索結果を表示する検索結果表示部である。
【0032】
7は検索結果表示部6に示された類似するベクトルデータが利用者が判断して正解であるかどうか、さらに不正解ならば正解として本来どのベクトルデータを選択するべきであったかを指定する正解選択部、8は対象データ指定部1により指定された検索対象のベクトルデータ、類似検索エンジン3により最も類似するとして選び出されたベクトルデータ、正解選択部7により利用者が選択した本来の正解にあたるベクトルデータの3ベクトルの各要素の値を利用して重みベクトルの新しい値を計算する3ベクトル重み再計算部である。9は3ベクトル重み再計算部8により計算された重みベクトルの新しい値を重みベクトル5に反映させる重み改訂部、10は重みベクトル5の各重みの値を表示し、利用者からの修正を受け付ける重み表示設定部、11は対象データ指定部1により指定された検索対象のベクトルデータに正解選択部7による正解のベクトルデータまたは指定された望ましいベクトルデータの参照属性を付加して、新しいベクトルデータとしてベクトルDB4に追加する新規データ追加部である。
【0033】
15は重みの改訂をオンラインで実施するかどうかを指定する重み改訂モード、12は重み改訂モード15を利用者により設定されると共に、その設定された重み改訂モード15に従い重み改訂処理を制御する重み改訂制御部、13は利用者が正解選択部7を用いて類似検索作業を行った結果を蓄積する選択結果記録部、14は選択結果記録部13が蓄積した履歴データである選択結果ログである。16は重みベクトル5を記録および保存する重みベクトル保存部、18は保存された重みベクトル群である重みデータベース(以下、重みDBと略す)、19は重みDB18の重みベクトル群の中から類似検索に用いる重みベクトル5を選択する重みベクトル選択部、17は異なる重みベクトル5を比較および評価し、妥当な重みベクトルを選択する重みベクトル評価部である。20はデータに欠落があるベクトルデータをも類似検索の対象とするための処理を実行するデータ欠落対処部である。
【0034】
次に動作について説明する。
従来技術の説明と同様、説明を容易にするためにベクトルDB4における条件属性の次元数をn、参照属性の次元数を1とする。ここで参照属性の数が1であることはこの発明の本質ではなく、多数であってもよい。
図3はこの発明の実施の形態1による類似検索装置の動作を示すフローチャートであり、まず、ステップST1では、利用者により重み改訂制御部12を用いて重み改訂モード15を設定する。ここで重み改訂モード15の値とその意味を図4に示す。重み改訂モード15は、On−Itrv,On−Nonitrv,Off−Itrv,Off−Nonitrv,Noの値をとる。On−ItrvとOn−Nonitrvは改訂がオンラインモードで行われること、Off−ItrvとOff−Nonitrvは改訂がオフラインモードで行われること、さらに、On−ItrvとOff−Itrvは改訂がインタラクティブモードで行われること、On−NonitrvとOff−Nonitrvは改訂が非インタラクティブモードで行われること、Noは重みの改訂がノーモード、即ち、重みの改訂が行われないことをそれぞれ表している。
そして、オンラインモードは、1回の類似検索エンジン3による検索の実行毎に重みベクトルを改訂するものであり、オフラインモードは、数回の類似検索エンジン3による検索の実行後に重みベクトルを改訂するものであり、さらに、ノーモードは、全く重みベクトルを改訂しないものである。
【0035】
図3のステップST2では、図5にその詳細を示すように重みベクトルを選択、または、新たに作成する。
図5において、ステップST201では、対象属性選択部2により重みベクトルの新規定義を行うのかどうかについて利用者の指示を受け、新規定義の場合はステップST202,ステップST203に示す重みベクトルの新規定義処理へと進み、新規定義でない場合、即ち、既に定義された重みベクトルの選択が指示された場合にはステップST204,ステップST205に示す重みベクトルの選択処理へと進む。
【0036】
図6は重みDB18を示す説明図であり、図において、テーブルの横1行が重みベクトルにあたる。「検索目的」属性はその重みベクトルをどういう目的の検索に用いるかを利用者が指定した内容であり、「保存日」はその重みベクトルを重みベクトル保存部16が重みDB18に記録保存した日時、「Count」は重みの改訂処理がこれまでに何回実行されたかを示す整数、「患者ID」から「のど痛」までの属性はベクトルDB4の条件属性に対応したもので、それぞれの属性の累積重みを表す値を格納したものである。
【0037】
図5に戻って、ステップST202では、対象属性選択部2が利用者に図7に示すような新規検索目的の定義ウィンドウを表示し、利用者のマウスクリックによる指定に従って、類似検索に用いる条件属性を決定する。図7では「熱」,「せき」,「鼻水」,「のど痛」の属性が、検索目的「症状」のために用いられる条件属性として選択されている状態を示している。ステップST203では類似検索エンジン3が重みベクトルWおよび実行回数Countの初期化を行うが、初期化の値としては以下に従う。
Figure 0003664834
【0038】
ステップST204では、重みベクトル選択部19が利用者に図6に示したようなベクトルDB4の中から重みベクトル5を選択させ、ステップST205で類似検索エンジン3がその選択された内容を変数に代入する。例えば、検索目的「症状」、保存日「96.10.3」の重みベクトル5を選択した場合、値は以下のように設定される。
Count:=8
i は図8に示す通り
以上に示したように、ステップST2を終了した後は、実行回数Countと重みベクトルWに値が設定されている。以後、ステップST2で検索目的「症状」、保存日「96.10.3」の重みベクトル5を選択した場合を例にとって説明を続ける。
【0039】
図3のステップST3では、対象データ指定部1が類似検索の対象となるベクトルデータX=(x1 ,x2 ,…,xn )を一つ選択する。ここで、xからxn は条件属性の値である。ステップST4では、類似検索エンジン3がベクトルDB4からベクトルデータY=(y1 ,y2 ,…,yn ,yn+1 )を一つ取り出す。ここで、yからyn は条件属性の値、yn+1 は参照属性の値である。ステップST5では、類似検索エンジン3がベクトルデータXとYの類似度sim(X,Y)の算出処理を行う。その詳細を図9に示す。
【0040】
ステップST501では、データ欠落対処部20が、ベクトルデータXおよびYに欠落データがあるかどうかを判定する。例えば、図10に示したベクトルDB4の例では、患者IDが105のデータの「せき」および「鼻水」条件属性の属性値に欠落があり、「−」が記録されているが、このデータをベクトルデータYとして選んだ場合には、これら2つの条件属性データが欠落であると判定する。また、ベクトルデータXとして例えば(162,田中,−,建設業,39.5,あり,−,なし)のベクトルデータが指定されている場合ならば、Xの「年齢」および「鼻水」条件属性の属性値に欠落があると判定する。
【0041】
条件属性の属性値に欠落がない場合、即ち、ステップST502では、類似検索エンジン3が重みベクトル5に設定された各条件属性の重みに従って次式のように類似度を算出する。
sim(X,Y)=−√{Σi=1 ,…,ni ・δ(xi ,yi2 }(8)
但し、重みwi の値が−である場合、即ち、現在の検索目的に応じた条件属性の選択に漏れた属性群に対してはwi =0として取り扱う(従って、この場合はδ(xi ,yi )の値を計算する必要はない)。
【0042】
また、条件属性の属性値に欠落がある場合、即ち、ステップST503では、類似検索エンジン3が次式のように仮類似度を算出する。
temp.sim(X,Y)=−√{Σi=1 ,…,ni ・δ(xi ,yi2 }(9)
但し、重みwi の値が−である場合、即ち、現在の検索目的に応じた条件属性の選択に漏れた属性群に対してはwi =0として取り扱う(従って、この場合はδ(xi ,yi )の値を計算する必要はない)。
また、xi またはyi にデータの欠落がある場合には、仮にwi =0であるものとして取り扱い、δ(xi ,yi )の値の計算処理を実行しない。
さらに、ステップST503では、上記のように算出された仮類似度を元に、データ欠落対処部20が次式のように矯正類似度を算出する。
sim(X,Y)={Σi=1 ,…,ni /Σ* j=1 ,…,nj )・temp.sim(X,Y) (10)
但し、Σ* j=1,…,nj は、第j属性には条件属性のデータの欠落がないもののみに関するwj の総和とし、また、Σ* j=1,…,nj =0である場合は、sim(X,Y)=0とする。
図3のステップST6では、ベクトルデータYをベクトルDB4の他のデータに代える処理を行い、ステップST4,ステップST5の処理を繰り返す。そして、ベクトルDB4の全データをベクトルデータYとして調べ終わるとステップST7へ進む。
【0043】
ステップST7では、既に、ステップST4からステップST6で調べ終わったベクトルDB4中の全データの中から、sim(X,Y)を最大にするベクトルデータYmax を選び出す。ここで類似度simの最大値を与えるYのベクトルデータが複数個ある場合には、それらの中の任意のものをベクトルデータYmax とする。
ステップST8では、図11にその詳細を示すように、ベクトルデータXに最も類似するデータとしてベクトルデータYmax が正しい選択であったかどうかを判定すると同時に、正しくなかった場合には、本来何を選択すべきであったかという正解のベクトルデータZを指定する処理を行う。
【0044】
次にステップST8の詳細を説明する。図11のステップST801では、検索結果表示部6がベクトルデータYmax の参照属性値Ymaxn+1を表示し、利用者に提示する。ステップST802では、利用者が何らかの行為(例えば診断)の結果として決定したベクトルデータXの参照属性値Xn+1 とベクトルデータYmaxn+1の参照属性値を比較し、一致したかどうかを判定する。
一致した場合は、正解選択部7により、ステップST803で判定結果として「正解」を返す。一方一致しなかった場合、ステップST804に進み、検索結果表示部6はさらにベクトルDB4中のYmax 以外のべクトルデータYをsimの値が高い順にリストアップして利用者に提示する。利用者はこのリストの中から正解選択部7により正解のベクトルデータZを選択する。そして、ステップST805に進み、判定結果として「不正解」を返す。
【0045】
図3のステップST9では、図12にその詳細を示すように選択結果ログ14を出力する。
図12のステップST901では、重み改訂制御部12により重み改訂モード15がオフラインモードになっているかどうかを判定し、オフラインモードの場合にのみステップST902において選択結果ログ14を選択結果記録部13から出力する。
選択結果ログ14は、例えば図13に示したようなデータであり、重みベクトルを指定する「検索目的」、べクトルデータXにあたる「対象データ」、べクトルデータXに最も類似するベクトルデータである「正解データ」から構成される履歴を蓄積していくものであるが、「正解データ」については正解選択部7による判定結果が「正解」の場合にはベクトルデータYmax 、「不正解」の場合にはベクトルデータZを採用する。
【0046】
図3のステップST10,ステップST11では、正解選択部7による判定結果が「不正解」であった場合にのみ、ベクトルデータX、ベクトルデータYmax 、ベクトルデータZを用いて重み改訂の処理を行う。その詳細を図14を用いて次に説明する。
図14のステップST1101では、重み改訂制御部12により重み改訂モードがインタラクティブモードであるかどうかのチェックを行う。インタラクティブでなければ、ステップST1105に進む。
ステップST1105では、累積重みベクトルWcum、累積度数の値Countをそれぞ次の代入式に従って3ベクトル重み再計算部8が再計算し、重み改訂部9が改訂処理を行う。
Wcumi :=Wcumi +δ(xi ,ymaxi2 −δ(xi ,zi2 (11)
Count:=Count+1 (12)
【0047】
ステップST1101で重み改訂モードがインタラクティブである場合は、ステップST1102に進む。
ステップST1102およびステップST1103は、重み表示設定部10による動作であり、ステップST1102では、例えば図15に示すように現在の重みを利用者に提示し、ステップST1103で利用者が例えばスライドバーを移動させたり、数値入力することにより重みを手動改訂する。図15の例では、各属性の重みの値として式(13)で定められるような重みベクトル値Wを提示し、利用者の設定値は式(14)を用いて累積重みベクトルWcumに換算する。
i =Wcumi /Count (13)
Wcumi =Wi ・Count (14)
ステップST1105では、手動改訂された累積重みベクトルWcumの値を元に、前述したのと全く同様に、式(11),式(12)に従って重みを改訂する。
【0048】
図3に戻って、ステップST12では、新規データ追加部11がベクトルデータX=(x1 ,x2 ,…,xn )に、正解選択部7により指定されたベクトルデータYmax の参照属性値yn+1 またはベクトルデータZの参照属性値zn+1 を参考にして決められたXの参照属性値xn+1 を付加して、ベクトルDB4に新しいデータとして保存する。
以上のステップST3からステップST12までで実現される類似検索、重みベクトルの改訂および新規データの追加の処理を、ステップST13における判定を実施しながら、類似検索をかけるべき全ての対象データについて繰り返す。
【0049】
ステップST14では、重み改訂制御部12により重み改訂モードがオフラインモードであるかどうかを判定し、オフラインモードであればステップST15に進んでオフライン処理で重みの改訂を行った後、ステップST16に進み、オフラインモードでなければ直接ステップST16に進む。ステップST16では、重みベクトル保存部16がその時点での累積重みベクトルWcumと重み更新の累積度数Countの値を、検索目的、保存日時と共に重みDB18に記録保存する。
【0050】
ステップST15では、重み改訂制御部12の制御により、図16にその詳細を示すような手順でオフラインモードでの重み改訂処理を行う。
図16において、ステップST1501では、重み改訂制御部12が選択結果ログ14からログデータとして、検索目的、対象ベクトルデータX、正解のベクトルデータZの1対を読み出した上で、ステップST4からステップST7により対象のベクトルデータXに最も類似するベクトルデータYmax を選出するが、その処理は図3および図9で既に説明したのと全く同様である。
【0051】
ステップST1502では、ベクトルデータYmax とベクトルデータZの同一性を確認する。同一でない場合はステップST11に進んで重み改訂を行うが、その処理は既に図3および図14で説明したのと全く同様である。
重み改訂制御部12は、ステップST1503の判断を行いながら、選択結果ログ14に記録された全ての履歴についてオフラインの重み改訂処理を行うように制御する。
【0052】
重み改訂制御部12は、ステップST1504において、重みベクトル評価部17を用いて次の処理を行う。即ち、重みDB18に前回保存された重みベクトルの値と現在のオフライン改訂後の重みベクトルとの重み設定に従って、全ての選択結果ログ14についてシステムが選び出したベクトルデータYmax と正解のベクトルデータZがどれだけ一致するかという正解率を算出し、その正解率の高い方を改めて重みベクトルの値とする。このように選択結果ログ14に残された履歴を評価用データとして用い、重みベクトルが改訂後に検索精度を上げるかどうかを評価した上で、検索精度が下がることのないように重みを設定する。
【0053】
上記実施の形態1で用いられた重みベクトルの改訂式(11)は一例を示すものであり、ベクトルデータX、ベクトルデータYmax 、ベクトルデータZを用いてその他の式により重みベクトルの訂正を行っても良い。
また、上記実施の形態1における式(9),式(10)を用いた矯正類似度の算出方法は一例を示すものであり、他の式により矯正類似度を算出しても良い。
また、上記実施の形態1における図7,図15に示したユーザインタフェースは一例を示すものであり、他の画面構成であっても良い。
また、上記実施の形態1では、検索の対象となるベクトルデータXに症状と病名からなる医療上の診療データの例を用いて説明したが、類似検索装置は医療応用に限らず一般にベクトルデータの類似検索において同様の効果を奏する。特に、その他のベクトルデータの一例としては、図17に示すように、検査画像を解析して得られる特徴量を条件属性として検査画像のファイル名の類似検索を行うような場合がある。
【0054】
以上のように、この実施の形態1によれば、以下のような効果が得られる。
(a)正解選択部7および3ベクトル重み再計算部8を用いて、類似検索装置の実施した類似検索の結果が不正解であった場合にのみ、検索対象のベクトルデータ、類似検索装置が最も類似するデータとして選出したベクトルデータ、利用者が正解として選んだベクトルデータの3つのベクトルデータを用いて重みを改訂するので、類似検索装置の類似検索の結果が正解の場合にまで重みを変更してしまうことがなく、検索精度が向上する。
(b)重み表示設定部10を用いて利用者に対してグラフィカルな表現を用いて重みベクトルを提示することができるので、利用者が重み設定の状態を容易に理解することができる。
(c)重み改訂制御部12が重み改訂を利用者との協調作業により、インタラクティブに実施させることができるので、利用者の経験に基づく主観的な判断を組み込みながら類似検索の重みベクトルをチューニングして行くことができる。
(d)対象属性選択部2が利用者による条件属性の選択を可能にするので、類似検索に用いる条件属性を利用者の意志に従って選択指定することができる。
(e)重みDB18、重みベクトル選択部19、重みベクトル保存部16を用いて複数の重みベクトルの設定を保存管理できるので、検索目的などに応じて重みベクトルを使い分けることができる。
(f)データ欠落対処部20により、検索対象あるいはベクトルDB4中のデータの属性値に欠落があっても、それを矯正する類似度を算出することができ、類似検索エンジン3がデータの欠落に対処できる。
(g)重み改訂制御部12、選択結果記録部13が、重みを逐次更新する代わりに選択結果ログ14を蓄え、オフラインで重みの改訂を実施することができるので、類似検索作業の実施中には重みベクトルを固定しておくことが可能になり、システムの不安定要因を除くことができる。
(h)重みベクトル評価部17が以前の重みベクトルと現在の重みベクトルの類似検索精度を評価し、精度の高い方を選ぶことができるので、無条件に重みベクトルを更新する場合に比べて精度の劣化を防止することができる。
【0055】
【発明の効果】
以上のように、本願発明によれば、利用者の操作に基づいて検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、対象データ指定部により指定されたベクトルデータ、類似検索エンジンにより検索されたベクトルデータ、および正解選択部により不正解である場合に指定されたベクトルデータに基づいて重みベクトルを改訂する3ベクトル重み再計算部とを備えるように構成したので、類似検索エンジンが検索したベクトルデータが正解であったかどうかの単なる判定だけでなく、不正解の場合には本来ならばどのベクトルデータを検索結果とすることが望ましかったのかを利用者が正解選択部により指定することにより、3ベクトル重み再計算部が3つのべクトルデータから重みベクトルを改訂することができる効果がある。また、この3ベクトル重み再計算部は類似検索エンジンが正解のベクトルデータを検索した際には重みベクトルの改訂を全く行わないが、これにより重みべクトルの設定がうまく行っている時には重みを固定することができ、精度の悪化を防止することができる効果がある。
【0056】
本願発明によれば、利用者の操作に基づいて検索結果表示部に表示されたベクトルデータが正解か不正解かを判定されると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、対象データ指定部により指定されたベクトルデータに正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加してベクトルデータベースに蓄積する新規データ追加部と、対象データ指定部により指定されたベクトルデータ、類似検索エンジンにより検索されたベクトルデータ、および正解選択部により不正解である場合に指定されたベクトルデータに基づいて重みベクトルを改訂する3ベクトル重み再計算部とを備えるように構成したので、類似検索エンジンが検索したベクトルデータが正解であったかどうかの単なる判定だけでなく、不正解の場合には本来ならばどのベクトルデータを検索結果とすることが望ましかったのかを利用者が正解選択部により指定することにより、3ベクトル重み再計算部が3つのべクトルデータから重みベクトルを改訂することができる効果がある。また、この3ベクトル重み再計算部は類似検索エンジンが正解のベクトルデータを検索した際には重みベクトルの改訂を全く行わないが、これにより重みべクトルの設定がうまく行っている時には重みを固定することができ、精度の悪化を防止することができる効果がある。
さらに、新規データ追加部により、対象データ指定部により指定されたベクトルデータに正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を参考にして決められた参照属性値を付加してベクトルデータベースに蓄積することができる効果がある。
【0057】
本願発明によれば、重みベクトルの値を表示すると共に、利用者の指示に基づいてその重みベクトルの値を改訂する重み表示設定部を備えるように構成したので、重み表示設定部が重みベクトルの値を表示し、また、利用者はこの重み表示設定部を用いて類似検索装置が現在用いている重みベクトルの設定を改訂することができ、重みベクトルの状態を把握できると共に、希望通りに設定することができる効果がある。
【0058】
本願発明によれば、重み表示設定部を、スライドバーまたは棒グラフのようにグラフィカルに表示するように構成したので、利用者が直感的にベクトルの状態を把握することができ、新しい状態の重みベクトルの設定を容易に行うことができる効果がある。
【0060】
本願発明によれば、対象データ指定部により指定されたベクトルデータのうちの類似検索の対象にする条件属性を利用者の操作に基づいて指定される対象属性選択部を備え、類似検索エンジンは、対象属性選択部により指定された条件属性のみに関してベクトルデータを検索するように構成したので、類似検索の対象にする条件属性を利用者の意志に応じて設定できる効果がある。
【0061】
本願発明によれば、対象属性選択部を、条件属性名を表示したオンオフスイッチのようにグラフィカルに表示するように構成したので、条件属性の選択を、マウスで選択するなど条件属性の選択を容易にすることができる効果がある。
【0062】
本願発明によれば、利用者の操作に基づいて、1回の類似検索エンジンによる検索の実行毎に重みベクトルを改訂するオンラインモードと、数回の類似検索エンジンによる検索の実行後に重みベクトルを改訂するオフラインモードと、全く重みベクトルを改訂しないノーモードとに指定され、その指定されたモードに応じて重みベクトルの改訂処理を制御する重み改訂制御部を備えるように構成したので、利用者が重み改訂モードをオンラインモード、オフラインモード、ノーモードに切り替えることができ、その重み改訂制御部の重み改訂モードに従って、重み改訂の処理を切り替えることができる効果がある。
【0064】
本願発明によれば、評価用データを用い、改訂前の重みベクトルと改訂後の重みベクトルとを評価比較し、妥当な重みベクトルを選択する重みベクトル評価部を備えるように構成したので、重みベクトル評価部が類似検索の精度を比較するためのテストデータである評価用データを用いて、改訂前の重みベクトルと改訂後の重みベクトルを用いた場合の類似検索後の正解率から精度を比較し、その結果に応じてより良い重みベクトルを選択し、採用することができる効果がある。
【0069】
本願発明によれば、対象データ指定部により指定されたベクトルデータまたはベクトルデータベースに蓄積されたベクトルデータの条件属性に欠落がある場合に、類似検索エンジンによりその欠落がある条件属性に基づいて仮類似度を計算させると共に、その欠落がある重みベクトルと欠落がない重みベクトルとその仮類似度とに基づいて矯正類似度を計算させて、その矯正類似度を利用して検索させるデータ欠落対処部を備えるように構成したので、データ欠落対処部が欠落していない部分の条件属性から算出される部分的な類似度指標を元に、類似検索の条件指定の対象になる全属性を用いた類似度に換算し、欠落のないベクトルデータが示す類似度と比較することができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による類似検索装置を示すブロック図である。
【図2】 ベクトルDBを示す説明図である。
【図3】 この発明の実施の形態1による類似検索装置の動作を示すフローチャートである。
【図4】 重み改訂モードを示す説明図である。
【図5】 重みベクトルの選択および作成処理の詳細を示すフローチャートである。
【図6】 重みDBを示す説明図である。
【図7】 条件属性の選択画面を示す説明図である。
【図8】 重みベクトルを示す説明図である。
【図9】 類似度算出処理の詳細を示すフローチャートである。
【図10】 データの欠落を含むベクトルDBを示す説明図である。
【図11】 類似検索結果の判定および正解選択処理の詳細を示すフローチャートである。
【図12】 選択結果ログの出力処理の詳細を示すフローチャートである。
【図13】 選択結果ログを示す説明図である。
【図14】 重み改訂処理の詳細を示すフローチャートである。
【図15】 重み設定の提示および手動改訂の画面を示す説明図である。
【図16】 オフライン重み改訂処理の詳細を示すフローチャートである。
【図17】 他のベクトルDBを示す説明図である。
【図18】 従来の類似検索装置を示すブロック図である。
【図19】 従来の類似検索装置の動作を示すフローチャートである。
【図20】 従来の類似検索装置の結果判定処理の詳細を示すフローチャートである。
【図21】 従来の類似検索装置の重み改訂処理の詳細を示すフローチャートである。
【符号の説明】
1 対象データ指定部、2 対象属性選択部、3 類似検索エンジン、4 ベクトルデータベース、5 重みベクトル、6 検索結果表示部、7 正解選択部、8 3ベクトル重み再計算部、9 重み改訂部、10 重み表示設定部、11新規データ追加部、12 重み改訂制御部、13 選択結果記録部、14 選択結果ログ、15 重み改訂モード、16 重みベクトル保存部、17 重みベクトル評価部、18 重みデータベース、19 重みベクトル選択部、20 データ欠落対処部。

Claims (11)

  1. 類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータのうちの類似検索の対象にする条件属性を利用者の操作に基づいて指定される対象属性選択部を備え、類似検索エンジンは、上記対象属性選択部により指定された条件属性のみに関してベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定されたベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索することを特徴とする類似検索装置。
  2. 類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータのうちの類似検索の対象にする条件属性を利用者の操作に基づいて指定される対象属性選択部を備え、類似検索エンジンは、上記対象属性選択部により指定された条件属性のみに関してベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定されたベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索することを特徴とする類似検索装置。
  3. 類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、利用者の操作に基づいて重み改訂モードが、1回の類似検索エンジンによる検索の実行毎に重みベクトルを改訂するオンラインモード、数回の類似検索エンジンによる検索の実行後に重みベクトルを改訂するオフ ラインモード、または全く重みベクトルを改訂しないノーモードに指定され、その指定された重み改訂モードに応じて重みベクトルの改訂処理を制御する重み改訂制御部を備えたことを特徴とする類似検索装置。
  4. 類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、利用者の操作に基づいて重み改訂モードが、1回の類似検索エンジンによる検索の実行毎に重みベクトルを改訂するオンラインモード、数回の類似検索エンジンによる検索の実行後に重みベクトルを改訂するオフラインモード、または全く重みベクトルを改訂しないノーモードに指定され、その指定された重み改訂モードに応じて重みベクトルの改訂処理を制御する重み改訂制御部を備えたことを特徴とする類似検索装置。
  5. 類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、評価用データを用い、改訂前の重みベクトルと改訂後の重みベクトルとを評価比較し、妥当な重みベクトルを選択する重みベクトル評価部を備えたことを特徴とする類似検索装置。
  6. 類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、評価用データを用い、改訂前の重みベクトルと改訂後の重みベクトルとを 評価比較し、妥当な重みベクトルを選択する重みベクトル評価部を備えたことを特徴とする類似検索装置。
  7. 類似検索対象のベクトルデータを指定する対象データ指定部と、複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータまたはベクトルデータベースに蓄積されたベクトルデータの条件属性に欠落がある場合に、類似検索エンジンによりその欠落がある条件属性に基づいて仮類似度を計算させると共に、その欠落がある重みベクトルと欠落がない重みベクトルとその仮類似度とに基づいて矯正類似度を計算させて、その矯正類似度を利用して検索させるデータ欠落対処部を備えたことを特徴とする類似検索装置。
  8. 類似検索対象の条件属性を有するベクトルデータを指定する対象データ指定部と、条件属性および参照属性を有する複数のベクトルデータを蓄積するベクトルデータベースと、そのベクトルデータベースに蓄積された複数のベクトルデータの中から上記対象データ指定部により指定された類似検索対象のベクトルデータに類似するベクトルデータを条件属性に関する重みベクトルに基づいて検索する類似検索エンジンと、その類似検索エンジンにより検索された類似するベクトルデータを表示する検索結果表示部と、利用者の操作に基づいて上記検索結果表示部に表示されたベクトルデータが正解か不正解かを判定すると共に、不正解である場合に望ましいベクトルデータが指定される正解選択部と、上記対象データ指定部により指定されたベクトルデータに上記正解選択部による正解のベクトルデータの参照属性または不正解である場合の望ましいベクトルデータの参照属性を付加して上記ベクトルデータベースに蓄積する新規データ追加部と、上記対象データ指定部により指定された類似検索対象のベクトルデータ、上記類似検索エンジンにより検索された類似するベクトルデータ、および上記正解選択部により不正解である場合に指定された望ましいベクトルデータに基づいて上記重みベクトルを改訂する3ベクトル重み再計算部と、対象データ指定部により指定されたベクトルデータまたはベクトルデータベースに蓄積されたベクトルデータの条件属性に欠落がある場合に、類似検索エンジンによりその欠落がある条件属性に基づいて仮類似度を計算させると共に、その欠落がある重みベクトルと欠落がない重みベクトルとその仮類似度とに基づいて矯正類似度を計算させて、その矯正類似度を利用して検索させるデータ欠落対処部を備えたことを特徴とする類似検索装置。
  9. 重みベクトルの値を表示すると共に、利用者の指示に基づいてその重みベクトルの値を改訂する重み表示設定部を備えたことを特徴とする請求項1から請求項8のうちのいずれか1項記載の類似検索装置。
  10. 重み表示設定部は、スライドバーまたは棒グラフのようにグラフィカルに表示することを特徴とする請求項記載の類似検索装置。
  11. 対象属性選択部は、条件属性名を表示したオンオフスイッチのようにグラフィカルに表示することを特徴とする請求項1または2記載の類似検索装置。
JP02940097A 1997-02-13 1997-02-13 類似検索装置 Expired - Fee Related JP3664834B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02940097A JP3664834B2 (ja) 1997-02-13 1997-02-13 類似検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02940097A JP3664834B2 (ja) 1997-02-13 1997-02-13 類似検索装置

Publications (2)

Publication Number Publication Date
JPH10228475A JPH10228475A (ja) 1998-08-25
JP3664834B2 true JP3664834B2 (ja) 2005-06-29

Family

ID=12275102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02940097A Expired - Fee Related JP3664834B2 (ja) 1997-02-13 1997-02-13 類似検索装置

Country Status (1)

Country Link
JP (1) JP3664834B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163359A (ja) * 2000-11-27 2002-06-07 Mediva:Kk 医療用診断・処置支援装置、医療用診断・処置支援システム装置および医療用診断・処置支援プログラム記録したコンピュータ読み取り可能な記録媒体。
JP2003122845A (ja) * 2001-10-09 2003-04-25 Shinkichi Himeno 医療情報の検索システム及びそのシステムを実行するためのプログラム
JP2003339646A (ja) * 2002-05-24 2003-12-02 Keijiro Torigoe 疾患拾い出しシステム及び知識ベース
JP4617116B2 (ja) * 2004-08-23 2011-01-19 商之器科技股▼ふん▲有限公司 即時医療映像自動的サーチ対照方法及びそのシステム
CN101903883B (zh) 2007-12-20 2017-02-15 皇家飞利浦电子股份有限公司 用于基于病例的决策支持的方法和装置
JP5450556B2 (ja) * 2011-10-14 2014-03-26 富士フイルム株式会社 診療情報処理装置および方法並びにプログラム
CN112613734B (zh) * 2020-12-22 2024-02-09 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 一种电能状态评估指标选取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2885482B2 (ja) * 1990-06-21 1999-04-26 日本電信電話株式会社 重み学習型テキストベース検索装置
JPH064584A (ja) * 1992-06-24 1994-01-14 Sharp Corp 文章検索装置

Also Published As

Publication number Publication date
JPH10228475A (ja) 1998-08-25

Similar Documents

Publication Publication Date Title
JP4003468B2 (ja) 適合性フィードバックによる類似データ検索方法および装置
US8719210B2 (en) System and method for medical treatment hypothesis testing
Negoescu et al. The knowledge-gradient algorithm for sequencing experiments in drug discovery
JP3268529B2 (ja) 知識データベース処理システムおよびエキスパートシステム
JP3664834B2 (ja) 類似検索装置
JP4388301B2 (ja) 画像検索装置、画像検索方法、画像検索プログラム及びそのプログラムを記録した記録媒体
EP1859392B1 (en) Fault diagnostics
JPS619729A (ja) 推論システム
DE60206241T2 (de) Fehlerdiagnose
JP7160574B2 (ja) 処理装置、方法、およびプログラム
CN111522733A (zh) 众包测试人员推荐与众包测试方法及电子装置
JP4253498B2 (ja) 画像検索プログラム、そのプログラムを記憶した記憶媒体、画像検索装置及び画像検索方法
Kleinbaum et al. Modeling strategy guidelines
CN114783580B (zh) 一种医疗数据质量评估方法及系统
JP4776325B2 (ja) アンケート作成システム
Kleinbaum et al. Modeling strategy for assessing interaction and confounding
US20040193560A1 (en) System and method for case-based reasoning
JPH01103735A (ja) 類似画像検索装置
JP5018463B2 (ja) 診療情報表示プログラム、診療情報表示装置、及び診療情報表示方法
Ferket et al. Cost-effectiveness of coronary artery bypass grafting plus mitral valve repair versus coronary artery bypass grafting alone for moderate ischemic mitral regurgitation
JP2010282402A (ja) 検索システム
US7440928B2 (en) Diagnostic apparatus
JP2000242651A (ja) データマイニング方法およびデータマイニング装置
JP2004272492A (ja) Webサイトの検索表示方法
JP7242407B2 (ja) 匿名加工システム、匿名加工プログラム及び匿名加工方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041012

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050330

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080408

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090408

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100408

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees