JPH10228475A - 類似検索装置 - Google Patents

類似検索装置

Info

Publication number
JPH10228475A
JPH10228475A JP9029400A JP2940097A JPH10228475A JP H10228475 A JPH10228475 A JP H10228475A JP 9029400 A JP9029400 A JP 9029400A JP 2940097 A JP2940097 A JP 2940097A JP H10228475 A JPH10228475 A JP H10228475A
Authority
JP
Japan
Prior art keywords
vector
weight
data
unit
vector data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9029400A
Other languages
English (en)
Other versions
JP3664834B2 (ja
Inventor
Kenji Kira
賢治 吉良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP02940097A priority Critical patent/JP3664834B2/ja
Publication of JPH10228475A publication Critical patent/JPH10228475A/ja
Application granted granted Critical
Publication of JP3664834B2 publication Critical patent/JP3664834B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 2ベクトル重み再計算部22では、類似検索
装置による類似検索結果が正解であった場合にも重みベ
クトル5の改訂を行うので、類似検索の精度が向上しに
くい課題があった。 【解決手段】 対象データ指定部1により指定されたベ
クトルデータ、類似検索エンジン3により検索されたベ
クトルデータ、および正解選択部7により不正解である
場合に指定されたベクトルデータに基づいて重みベクト
ル5を計算する3ベクトル重み再計算部8とを備え、こ
の3ベクトル重み再計算部8は類似検索エンジン3が正
解のベクトルデータを検索した際には重みベクトル5の
改訂を全く行わず、これにより精度の悪化を防止するも
のである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、蓄積されたデー
タ群の中から、対象となるデータに類似するデータを検
索する類似検索装置に関するものである。
【0002】
【従来の技術】図18は例えば“インクリメンタル イ
ンスタンスベースト ラーニング オブ インデペンデ
ント アンド グレイデッド コンセプト デスクリプ
ションズ” ディ エイハ, プロスィーディングズ
オブ ザ シックスス インターナショナル ワークシ
ョップ オン マシン ラーニング,1987年(“I
ncremental Instance−based
Learning of Independent
and Graded Concept Descri
ptions”D.Aha,Proceedings
of the Sixth Internationa
l Workshop on Machine Lea
ning,1987)および“ア ニアレスト ハイパ
ーレクタングル ラーニング メソッド”エス ザルツ
バーグ,マシン ラーニング,6,251頁−276
頁,1991年(“A Nearest Hyperr
ectangle Learning Metho
d”,S.Salzberg,Machine Lea
ning,6,pp251−276,1991)に示さ
れた従来の類似検索装置を示すブロック図である。
【0003】図において、1は新しい目的にあたる検索
対象のベクトルデータを指定する対象データ指定部、4
は図2にその例を示すように、データベースとして蓄え
られたベクトルデータ群であるベクトルデータベース
(以下、ベクトルDBと略す)である。3は対象データ
指定部1により指定されたベクトルデータと類似するベ
クトルデータをベクトルDB4から探し出す類似検索エ
ンジン、5は類似検索エンジン3がデータ間の類似度を
算出するために用いるベクトルデータの各属性に付けら
れた重みをそれぞれの要素とする重みベクトル、6は類
似検索エンジン3による検索結果を表示する検索結果表
示部である。
【0004】21は類似検索エンジン3が示した類似す
るベクトルデータが利用者にとって正解であるかどうか
を指定する回答指定部、22は対象データ指定部1によ
り指定された検索対象のベクトルデータ、類似検索エン
ジン3により最も類似するとして選び出されたベクトル
データの2ベクトルの各要素の値を利用して重みベクト
ルの新しい値を計算する2ベクトル重み再計算部であ
る。9は2ベクトル重み再計算部22により計算された
重みベクトルの新しい値を重みベクトル5に反映させる
重み改訂部、11は対象データ指定部1により指定され
た検索対象のベクトルデータに回答指定部21により利
用者が指定する結果値を付け加えて、新しいベクトルデ
ータとしてベクトルDB4に追加する新規データ追加部
である。
【0005】次に動作について説明する。例えば、電子
カルテや医療画像データベースなどの医療情報、設計図
などの設計情報に代表されるように、発生するデータを
蓄積しその中から新しい目的に見合ったデータを選び出
して参照する場合に、データをベクトルデータの形に整
理してデータベースに蓄え、新しい目的を表すベクトル
データとデータベース中の各データとの類似度を算出し
て、データベースの中で最も類似するデータを参照する
という、ベクトルデータの類似検索技術が応用されてい
る。
【0006】例えば、図2はベクトルデータのデータベ
ースを示す説明図であり、病院で診療を受けた患者の診
療録を表わしている。図において、「患者ID」から
「のど痛」までの属性は、各々の患者の診療データを表
わしており、検索の条件を記述するための属性という意
味でここでは「条件属性」と呼ぶ。属性「病名」は、そ
の診療データをもとに過去に下された診断結果を表わ
し、検索の結果参照される属性という意味で「参照属
性」と呼ぶ。新しい患者が現れ、その条件属性の値が例
えば各々順に、(123,村山,45,公務員,35.
8,なし,あり,なし)であった場合に、類似検索装置
がデータベースの中から条件属性に類似するベクトルデ
ータ、例えば、(125,鈴木,25,会社員,36.
2,なし,あり,なし,花粉症)を選び出し、その参照
属性の値「花粉症」を参考にして新しい患者の病名を決
定するという問題が類似検索技術の応用問題の例であ
る。
【0007】次に図18に示した類似検索装置の動作に
ついて図19から図21を参照しながら説明する。説明
を容易にするために、ベクトルDB4における条件属性
の次元数をn、参照属性の次元数を1とする。ここで参
照属性の数が1であることはこの技術の本質ではなく、
多数であってもよい。まず、ステップST21では、重
みベクトルの算出に要するベクトル群を初期化する。即
ち、類似検索エンジン3において、n次元ベクトルの重
みベクトルW=(w1 ,…,wn ),累積重みベクトル
Wcum=(wcum1 ,…,wcumn ),重み合計
ベクトルWtotal=(wtotal1 ,…,wto
taln )の全要素を0に初期化する。
【0008】ステップST22からステップST30に
おいて、対象データを次々に選んで類似検索の処理を行
うが、この過程を通して重みベクトルが改訂されてゆ
く。ステップST22では、対象データ指定部1が類似
検索の対象となるベクトルデータをひとつ選択する。こ
のn次元ベクトルデータをX=(x1 ,x2 ,…,x
n )と呼ぶ。ステップST23では、類似検索エンジン
3がベクトルDB4からベクトルデータを一つ取り出
す。このn+1次元ベクトルデータをY=(y1,y
2 ,…,yn ,yn+1 )と呼び、y1 からをyn を条件
属性の値、yn+1 を参照属性の値とする。
【0009】ステップST24では、類似検索エンジン
3がXとYの類似度sim(X,Y)の算出処理を行
う。ここで類似度算出式は、 sim(X,Y)=−√{Σi=1 ,…,ni ・δ(xi ,yi2 }(1) ここで、 δ(xi ,yi )= (xi ,yi )/(属性iの区間幅) 《属性iが連続値をとる場合》 0 《属性iが離散値をとり、xi =yi の場合》 1 《属性iが離散値をとり、xi ≠yi の場合》 (2) つまり、sim(X,Y)はXとYの重み付き距離の符
号を反転したものである。ステップST25では、Yを
ベクトルDB4の他のベクトルデータに変える処理を行
い、また、ステップST23およびステップST24の
処理を繰り返す。そうしてベクトルDB4の全ベクトル
データをYとして調べ終わるとステップST26へ進
む。
【0010】ステップST26では、既にステップST
23からステップST25で調べ終わったベクトルDB
4中の全ベクトルデータの中から、sim(X,Y)を
最大にするベクトルデータYmax を選び出す。ここで類
似度sim(X,Y)の最大値を与えるYのベクトルデ
ータが複数個ある場合には、それらの中のどれでも良
く、例えば、最初のベクトルデータとしても良いし、ラ
ンダムに選んでも良い。
【0011】ステップST27では、Xに最も類似する
ベクトルデータとしてYmax が正しい選択であったかど
うかを判定する。ステップST27における判定処理の
詳細を図20に示す。ステップST271では、Ymax
を検索結果表示部6に表示し、利用者がその参照属性の
値ymax n+1 を参考にして、Xの参照属性の値xn+1
例えば診断結果を決定する。ステップST272では、
回答指定部21が、新たに定められたxn+1 とyma x
n+1 とを比較し、これらが一致していればステップST
273で類似検索の判定結果として「正解」を返し、一
致していなければステップST274で「不正解」を返
す。
【0012】図19に戻り、ステップST28では、X
およびymax のベクトルデータを用いて重みベクトルW
の値を再計算し、更新する。ステップST28における
処理の詳細を図21に示す。ステップST281では、
2ベクトル重み再計算部22が重みベクトルの値Wを次
の代入式に従って再計算する。 Wtotali :=Wtotali +△ (3) 但し、△は重み増分パラメータ Wcumi := Wcumi +{1−δ(xi ,ymaxi)}・△ 《判定結果が正解の場合》 Wcumi +δ(xi ,ymaxi)・△ 《判定結果が不正解の場合》 (4) Wi :=max(Wcumi /Wtotali −0.5,0) (5) ステップST282では、重み改訂部9が上記再計算さ
れた新しい重みベクトルWを設定し、次回以降の類似度
計算に改訂後の重みベクトルが用いられるようにする。
【0013】図19に戻り、ステップST29では、新
規データ追加部11がX=(x1 ,x2 ,…,xn )と
ステップST271で決定されたXの参照属性の値x
n+1 とを合わせてベクトルDB4の新しいベクトルデー
タとして保存する。以上のステップST22からステッ
プST29までで実現される類似検索、重みベクトルの
改訂、新規データの追加の処理を、ステップST30に
おける判定を実施しなから類似検索をかけるべき全ての
検索対象のベクトルデータについて繰り返す。
【0014】
【発明が解決しようとする課題】従来の類似検索装置は
以上のように構成されているので、 (a)2ベクトル重み再計算部22では、式(3)から
式(5)に示したように、類似検索装置による類似検索
結果が回答指定部21において正解であった場合にも重
みベクトル5の改訂を行うので、改訂前の重みベクトル
5で正解のベクトルデータを選出できる状態であったの
に、その状態を変更してしまうため、類似検索の精度が
向上しにくいという課題があった。 (b)重みベクトル5の値を利用者に表示することがで
きないため、利用者が重みベクトル設定の状態を簡単に
参照することができないという課題があった。 (c)重みベクトル5の改訂は、類似検索装置による処
理に全て委ねられているため、利用者である人間が自分
の知識に基づいてその値を変更し、類似検索装置による
処理と協調して重みベクトル5をチューニングしていく
ことができないという課題があった。 (d)類似検索には固定的に条件属性の全てを用いて条
件指定を行っており、その中から条件指定に用いるべき
条件属性を選択的に指定することができないという課題
があった。 (e)類似検索に用いる重みベクトル5は唯一であり、
異なる重みベクトル群を使い分けることができないとい
う課題があった。 (f)ベクトルDB4の全てのベクトルデータは全ての
条件属性の値を備えていることが必要であり、DBの拡
張を行って過去のベクトルデータに無かった属性が増え
た場合や、元々入力データに欠落があった場合などに生
じるDB中のベクトルデータの欠落に対して類似検索エ
ンジン3が対処することができないという課題があっ
た。 (g)類似検索を1件実行する度に重みベクトル5が逐
次更新されていくため、類似検索装置がシステムとして
不安定になるという課題があった。 (h)新しい重みベクトル5の値は無条件で採用され、
結果として以前の重みベクトル5に比べて類似検索の精
度が悪くなる場合もあり得るという課題があった。
【0015】この発明は上記のような課題を解決するた
めになされたもので、類似検索の精度を向上させ、重み
ベクトル設定の状況を利用者が容易に確認し、変更で
き、また、類似検索装置による自動変更と協調的に変更
でき、検索の条件指定に相応しい条件属性を利用者が選
択でき、複数の重みベクトル設定を使い分けることを可
能にし、データべース中にベクトルデータの欠落があっ
ても対処を可能とするような類似検索装置を得ることを
目的とする。また、この発明は利用者の検索作業を安定
的に実施しながら重みの改訂を行い、重みの改訂におい
ては新旧の重みの適切な評価の結果を受けて精度が向上
するように改訂できる類似検索装置を得ることを目的と
する。
【0016】
【課題を解決するための手段】請求項1記載の発明に係
る類似検索装置は、利用者の操作に基づいて検索結果表
示部に表示されたベクトルデータが正解か不正解かを判
定すると共に、不正解である場合に望ましいベクトルデ
ータが指定される正解選択部と、対象データ指定部によ
り指定されたベクトルデータ、類似検索エンジンにより
検索されたベクトルデータ、および正解選択部により不
正解である場合に指定されたベクトルデータに基づいて
重みベクトルを改訂する3ベクトル重み再計算部とを備
えたものである。
【0017】請求項2記載の発明に係る類似検索装置
は、利用者の操作に基づいて検索結果表示部に表示され
たベクトルデータが正解か不正解かを判定すると共に、
不正解である場合に望ましいベクトルデータが指定され
る正解選択部と、対象データ指定部により指定されたベ
クトルデータに正解選択部による正解のベクトルデータ
の参照属性または不正解である場合の望ましいベクトル
データの参照属性を付加してベクトルデータベースに蓄
積する新規データ追加部と、対象データ指定部により指
定されたベクトルデータ、類似検索エンジンにより検索
されたベクトルデータ、および正解選択部により不正解
である場合に指定されたベクトルデータに基づいて重み
ベクトルを改訂する3ベクトル重み再計算部とを備えた
ものである。
【0018】請求項3記載の発明に係る類似検索装置
は、重みベクトルの値を表示すると共に、利用者の指示
に基づいてその重みベクトルの値を改訂する重み表示設
定部を備えたものである。
【0019】請求項4記載の発明に係る類似検索装置
は、重み表示設定部を、スライドバーまたは棒グラフの
ようにグラフィカルに表示するようにしたものである。
【0020】請求項5記載の発明に係る類似検索装置
は、3ベクトル重み再計算部による重みベクトルの改訂
と重み表示設定部による重みベクトルの改訂とを協調的
に行う重み改訂部を備えたものである。
【0021】請求項6記載の発明に係る類似検索装置
は、対象データ指定部により指定されたベクトルデータ
のうちの類似検索の対象にする条件属性を利用者の操作
に基づいて指定される対象属性選択部を備え、類似検索
エンジンは、対象属性選択部により指定された条件属性
のみに関してベクトルデータを検索するようにしたもの
である。
【0022】請求項7記載の発明に係る類似検索装置
は、対象属性選択部を、条件属性名を表示したオンオフ
スイッチのようにグラフィカルに表示するようにしたも
のである。
【0023】請求項8記載の発明に係る類似検索装置
は、利用者の操作に基づいて重み改訂モードが、1回の
類似検索エンジンによる検索の実行毎に重みベクトルを
改訂するオンラインモード、数回の類似検索エンジンに
よる検索の実行後に重みベクトルを改訂するオフライン
モード、または全く重みベクトルを改訂しないノーモー
ドに指定され、その指定された重み改訂モードに応じて
重みベクトルの改訂処理を制御する重み改訂制御部を備
えたものである。
【0024】請求項9記載の発明に係る類似検索装置
は、対象データ指定部により指定されたベクトルデータ
と利用者の操作に基づいて正解選択部により指定された
正解のベクトルデータまたは不正解である場合の望まし
いベクトルデータとを対にして履歴を選択結果ログに蓄
積する選択結果記録部を備えたものである。
【0025】請求項10記載の発明に係る類似検索装置
は、改訂前の重みベクトルと改訂後の重みベクトルとを
評価比較し、妥当な重みベクトルを選択する重みベクト
ル評価部を備えたものである。
【0026】請求項11記載の発明に係る類似検索装置
は、重みベクトルの値を重みデータベースに蓄積する重
みベクトル保存部と、重みデータベースの中から類似検
索エンジンによる検索に用いられる重みベクトルを選択
する重みベクトル選択部とを備えたものである。
【0027】請求項12記載の発明に係る類似検索装置
は、重みベクトル保存部を、重みベクトルの値に更新日
時を付加して過去の重みベクトル更新の履歴が残るよう
に重みデータベースに蓄積し、重みベクトル選択部を、
その重みデータベースから更新日時に基づいて、利用者
により重みベクトルが選択されるようにしたものであ
る。
【0028】請求項13記載の発明に係る類似検索装置
は、重みベクトル保存部を、重みベクトルの値に検索目
的を付加して過去の重みベクトル更新の履歴が残るよう
に重みデータベースに蓄積し、重みベクトル選択部を、
その重みデータベースから検索目的に基づいて、利用者
により重みベクトルが選択されるようにしたものであ
る。
【0029】請求項14記載の発明に係る類似検索装置
は、重み改訂制御部により重み改訂モードがオフライン
モードに指定されている場合に、選択結果ログに蓄積さ
れた対象データ指定部により指定されたベクトルデータ
に類似するベクトルデータを類似検索エンジンにより重
みベクトルに基づいて検索し、その検索されたベクトル
データとその選択結果ログに対にして蓄積された正解の
ベクトルデータまたは望ましいベクトルデータとが異な
る場合に、それら対象データ指定部により指定されたベ
クトルデータ、類似検索エンジンにより検索されたベク
トルデータおよび正解選択部により不正解である場合に
指定された望ましいベクトルデータに基づいて3ベクト
ル重み再計算部により重みベクトルを計算するようにし
たものである。
【0030】請求項15記載の発明に係る類似検索装置
は、対象データ指定部により指定されたベクトルデータ
またはベクトルデータベースに蓄積されたベクトルデー
タの条件属性に欠落がある場合に、類似検索エンジンに
よりその欠落がある条件属性に基づいて仮類似度を計算
させると共に、その欠落がある重みベクトルと欠落がな
い重みベクトルとその仮類似度とに基づいて矯正類似度
を計算させて、その矯正類似度を利用して検索させるデ
ータ欠落対処部を備えたものである。
【0031】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による類
似検索装置を示すブロック図であり、図において、1は
検索対象の条件属性を有するベクトルデータを指定する
対象データ指定部、2はベクトルデータの条件属性のう
ちのどの条件属性を対象として類似検索を行うかを指定
する対象属性選択部、4は図2にその例を示したように
データベースとして蓄えられた条件属性および参照属性
を有する複数のベクトルデータを蓄積するベクトルデー
タベース(以下、ベクトルDBと略す)である。3は対
象データ指定部1により指定された対象データと類似す
るベクトルデータをベクトルDB4から検索する類似検
索エンジン、5は類似検索エンジン3がデータ間の類似
度を算出するために用いられるベクトルの各条件属性に
付けられた重みをそれぞれの要素とする重みベクトル、
6は類似検索エンジン3による検索結果を表示する検索
結果表示部である。
【0032】7は検索結果表示部6に示された類似する
ベクトルデータが利用者が判断して正解であるかどう
か、さらに不正解ならば正解として本来どのベクトルデ
ータを選択するべきであったかを指定する正解選択部、
8は対象データ指定部1により指定された検索対象のベ
クトルデータ、類似検索エンジン3により最も類似する
として選び出されたベクトルデータ、正解選択部7によ
り利用者が選択した本来の正解にあたるベクトルデータ
の3ベクトルの各要素の値を利用して重みベクトルの新
しい値を計算する3ベクトル重み再計算部である。9は
3ベクトル重み再計算部8により計算された重みベクト
ルの新しい値を重みベクトル5に反映させる重み改訂
部、10は重みベクトル5の各重みの値を表示し、利用
者からの修正を受け付ける重み表示設定部、11は対象
データ指定部1により指定された検索対象のベクトルデ
ータに正解選択部7による正解のベクトルデータまたは
指定された望ましいベクトルデータの参照属性を付加し
て、新しいベクトルデータとしてベクトルDB4に追加
する新規データ追加部である。
【0033】15は重みの改訂をオンラインで実施する
かどうかを指定する重み改訂モード、12は重み改訂モ
ード15を利用者により設定されると共に、その設定さ
れた重み改訂モード15に従い重み改訂処理を制御する
重み改訂制御部、13は利用者が正解選択部7を用いて
類似検索作業を行った結果を蓄積する選択結果記録部、
14は選択結果記録部13が蓄積した履歴データである
選択結果ログである。16は重みベクトル5を記録およ
び保存する重みベクトル保存部、18は保存された重み
ベクトル群である重みデータベース(以下、重みDBと
略す)、19は重みDB18の重みベクトル群の中から
類似検索に用いる重みベクトル5を選択する重みベクト
ル選択部、17は異なる重みベクトル5を比較および評
価し、妥当な重みベクトルを選択する重みベクトル評価
部である。20はデータに欠落があるベクトルデータを
も類似検索の対象とするための処理を実行するデータ欠
落対処部である。
【0034】次に動作について説明する。従来技術の説
明と同様、説明を容易にするためにベクトルDB4にお
ける条件属性の次元数をn、参照属性の次元数を1とす
る。ここで参照属性の数が1であることはこの発明の本
質ではなく、多数であってもよい。図3はこの発明の実
施の形態1による類似検索装置の動作を示すフローチャ
ートであり、まず、ステップST1では、利用者により
重み改訂制御部12を用いて重み改訂モード15を設定
する。ここで重み改訂モード15の値とその意味を図4
に示す。重み改訂モード15は、On−Itrv,On
−Nonitrv,Off−Itrv,Off−Non
itrv,Noの値をとる。On−ItrvとOn−N
onitrvは改訂がオンラインモードで行われるこ
と、Off−ItrvとOff−Nonitrvは改訂
がオフラインモードで行われること、さらに、On−I
trvとOff−Itrvは改訂がインタラクティブモ
ードで行われること、On−NonitrvとOff−
Nonitrvは改訂が非インタラクティブモードで行
われること、Noは重みの改訂がノーモード、即ち、重
みの改訂が行われないことをそれぞれ表している。そし
て、オンラインモードは、1回の類似検索エンジン3に
よる検索の実行毎に重みベクトルを改訂するものであ
り、オフラインモードは、数回の類似検索エンジン3に
よる検索の実行後に重みベクトルを改訂するものであ
り、さらに、ノーモードは、全く重みベクトルを改訂し
ないものである。
【0035】図3のステップST2では、図5にその詳
細を示すように重みベクトルを選択、または、新たに作
成する。図5において、ステップST201では、対象
属性選択部2により重みベクトルの新規定義を行うのか
どうかについて利用者の指示を受け、新規定義の場合は
ステップST202,ステップST203に示す重みベ
クトルの新規定義処理へと進み、新規定義でない場合、
即ち、既に定義された重みベクトルの選択が指示された
場合にはステップST204,ステップST205に示
す重みベクトルの選択処理へと進む。
【0036】図6は重みDB18を示す説明図であり、
図において、テーブルの横1行が重みベクトルにあた
る。「検索目的」属性はその重みベクトルをどういう目
的の検索に用いるかを利用者が指定した内容であり、
「保存日」はその重みベクトルを重みベクトル保存部1
6が重みDB18に記録保存した日時、「Count」
は重みの改訂処理がこれまでに何回実行されたかを示す
整数、「患者ID」から「のど痛」までの属性はベクト
ルDB4の条件属性に対応したもので、それぞれの属性
の累積重みを表す値を格納したものである。
【0037】図5に戻って、ステップST202では、
対象属性選択部2が利用者に図7に示すような新規検索
目的の定義ウィンドウを表示し、利用者のマウスクリッ
クによる指定に従って、類似検索に用いる条件属性を決
定する。図7では「熱」,「せき」,「鼻水」,「のど
痛」の属性が、検索目的「症状」のために用いられる条
件属性として選択されている状態を示している。ステッ
プST203では類似検索エンジン3が重みベクトルW
および実行回数Countの初期化を行うが、初期化の
値としては以下に従う。 Count:=1 (6) wi :=1.0 《属性iが類似検索に用いられる属性の場合》 − 《それ以外》 (7)
【0038】ステップST204では、重みベクトル選
択部19が利用者に図6に示したようなベクトルDB4
の中から重みベクトル5を選択させ、ステップST20
5で類似検索エンジン3がその選択された内容を変数に
代入する。例えば、検索目的「症状」、保存日「96.
10.3」の重みベクトル5を選択した場合、値は以下
のように設定される。 Count:=8 wi は図8に示す通り 以上に示したように、ステップST2を終了した後は、
実行回数Countと重みベクトルWに値が設定されて
いる。以後、ステップST2で検索目的「症状」、保存
日「96.10.3」の重みベクトル5を選択した場合
を例にとって説明を続ける。
【0039】図3のステップST3では、対象データ指
定部1が類似検索の対象となるベクトルデータX=(x
1 ,x2 ,…,xn )を一つ選択する。ここで、xから
nは条件属性の値である。ステップST4では、類似
検索エンジン3がベクトルDB4からベクトルデータY
=(y1 ,y2 ,…,yn ,yn+1 )を一つ取り出す。
ここで、yからyn は条件属性の値、yn+1 は参照属性
の値である。ステップST5では、類似検索エンジン3
がベクトルデータXとYの類似度sim(X,Y)の算
出処理を行う。その詳細を図9に示す。
【0040】ステップST501では、データ欠落対処
部20が、ベクトルデータXおよびYに欠落データがあ
るかどうかを判定する。例えば、図10に示したベクト
ルDB4の例では、患者IDが105のデータの「せ
き」および「鼻水」条件属性の属性値に欠落があり、
「−」が記録されているが、このデータをベクトルデー
タYとして選んだ場合には、これら2つの条件属性デー
タが欠落であると判定する。また、ベクトルデータXと
して例えば(162,田中,−,建設業,39.5,あ
り,−,なし)のベクトルデータが指定されている場合
ならば、Xの「年齢」および「鼻水」条件属性の属性値
に欠落があると判定する。
【0041】条件属性の属性値に欠落がない場合、即
ち、ステップST502では、類似検索エンジン3が重
みベクトル5に設定された各条件属性の重みに従って次
式のように類似度を算出する。 sim(X,Y)=−√{Σi=1 ,…,ni ・δ(xi ,yi2 }(8) 但し、重みwi の値が−である場合、即ち、現在の検索
目的に応じた条件属性の選択に漏れた属性群に対しては
i =0として取り扱う(従って、この場合はδ(x
i ,yi )の値を計算する必要はない)。
【0042】また、条件属性の属性値に欠落がある場
合、即ち、ステップST503では、類似検索エンジン
3が次式のように仮類似度を算出する。 temp.sim(X,Y) =−√{Σi=1 ,…,ni ・δ(xi ,yi2 } (9) 但し、重みwi の値が−である場合、即ち、現在の検索
目的に応じた条件属性の選択に漏れた属性群に対しては
i =0として取り扱う(従って、この場合はδ(x
i ,yi )の値を計算する必要はない)。また、xi
たはyi にデータの欠落がある場合には、仮にwi =0
であるものとして取り扱い、δ(xi ,yi )の値の計
算処理を実行しない。さらに、ステップST503で
は、上記のように算出された仮類似度を元に、データ欠
落対処部20が次式のように矯正類似度を算出する。 sim(X,Y)={Σi=1 ,…,ni /Σ* j=1 ,…,nj ) ・temp.sim(X,Y) (10) 但し、Σ* j=1,…,nj は、第j属性には条件属性の
データの欠落がないもののみに関するwj の総和とし、
また、Σ* j=1,…,nj =0である場合は、sim
(X,Y)=0とする。図3のステップST6では、ベ
クトルデータYをベクトルDB4の他のデータに代える
処理を行い、ステップST4,ステップST5の処理を
繰り返す。そして、ベクトルDB4の全データをベクト
ルデータYとして調べ終わるとステップST7へ進む。
【0043】ステップST7では、既に、ステップST
4からステップST6で調べ終わったベクトルDB4中
の全データの中から、sim(X,Y)を最大にするベ
クトルデータYmax を選び出す。ここで類似度simの
最大値を与えるYのベクトルデータが複数個ある場合に
は、それらの中の任意のものをベクトルデータYmax
する。ステップST8では、図11にその詳細を示すよ
うに、ベクトルデータXに最も類似するデータとしてベ
クトルデータYmax が正しい選択であったかどうかを判
定すると同時に、正しくなかった場合には、本来何を選
択すべきであったかという正解のベクトルデータZを指
定する処理を行う。
【0044】次にステップST8の詳細を説明する。図
11のステップST801では、検索結果表示部6がベ
クトルデータYmax の参照属性値Ymaxn+1を表示し、利
用者に提示する。ステップST802では、利用者が何
らかの行為(例えば診断)の結果として決定したベクト
ルデータXの参照属性値Xn+1 とベクトルデータYma
xn+1の参照属性値を比較し、一致したかどうかを判定す
る。一致した場合は、正解選択部7により、ステップS
T803で判定結果として「正解」を返す。一方一致し
なかった場合、ステップST804に進み、検索結果表
示部6はさらにベクトルDB4中のYmax 以外のべクト
ルデータYをsimの値が高い順にリストアップして利
用者に提示する。利用者はこのリストの中から正解選択
部7により正解のベクトルデータZを選択する。そし
て、ステップST805に進み、判定結果として「不正
解」を返す。
【0045】図3のステップST9では、図12にその
詳細を示すように選択結果ログ14を出力する。図12
のステップST901では、重み改訂制御部12により
重み改訂モード15がオフラインモードになっているか
どうかを判定し、オフラインモードの場合にのみステッ
プST902において選択結果ログ14を選択結果記録
部13から出力する。選択結果ログ14は、例えば図1
3に示したようなデータであり、重みベクトルを指定す
る「検索目的」、べクトルデータXにあたる「対象デー
タ」、べクトルデータXに最も類似するベクトルデータ
である「正解データ」から構成される履歴を蓄積してい
くものであるが、「正解データ」については正解選択部
7による判定結果が「正解」の場合にはベクトルデータ
max 、「不正解」の場合にはベクトルデータZを採用
する。
【0046】図3のステップST10,ステップST1
1では、正解選択部7による判定結果が「不正解」であ
った場合にのみ、ベクトルデータX、ベクトルデータY
max、ベクトルデータZを用いて重み改訂の処理を行
う。その詳細を図14を用いて次に説明する。図14の
ステップST1101では、重み改訂制御部12により
重み改訂モードがインタラクティブモードであるかどう
かのチェックを行う。インタラクティブでなければ、ス
テップST1105に進む。ステップST1105で
は、累積重みベクトルWcum、累積度数の値Coun
tをそれぞ次の代入式に従って3ベクトル重み再計算部
8が再計算し、重み改訂部9が改訂処理を行う。 Wcumi :=Wcumi +δ(xi ,ymaxi2 −δ(xi ,zi2 (11) Count:=Count+1 (12)
【0047】ステップST1101で重み改訂モードが
インタラクティブである場合は、ステップST1102
に進む。ステップST1102およびステップST11
03は、重み表示設定部10による動作であり、ステッ
プST1102では、例えば図15に示すように現在の
重みを利用者に提示し、ステップST1103で利用者
が例えばスライドバーを移動させたり、数値入力するこ
とにより重みを手動改訂する。図15の例では、各属性
の重みの値として式(13)で定められるような重みベ
クトル値Wを提示し、利用者の設定値は式(14)を用
いて累積重みベクトルWcumに換算する。 Wi =Wcumi /Count (13) Wcumi =Wi ・Count (14) ステップST1105では、手動改訂された累積重みベ
クトルWcumの値を元に、前述したのと全く同様に、
式(11),式(12)に従って重みを改訂する。
【0048】図3に戻って、ステップST12では、新
規データ追加部11がベクトルデータX=(x1 ,x
2 ,…,xn )に、正解選択部7により指定されたベク
トルデータYmax の参照属性値yn+1 またはベクトルデ
ータZの参照属性値zn+1 を参考にして決められたXの
参照属性値xn+1 を付加して、ベクトルDB4に新しい
データとして保存する。以上のステップST3からステ
ップST12までで実現される類似検索、重みベクトル
の改訂および新規データの追加の処理を、ステップST
13における判定を実施しながら、類似検索をかけるべ
き全ての対象データについて繰り返す。
【0049】ステップST14では、重み改訂制御部1
2により重み改訂モードがオフラインモードであるかど
うかを判定し、オフラインモードであればステップST
15に進んでオフライン処理で重みの改訂を行った後、
ステップST16に進み、オフラインモードでなければ
直接ステップST16に進む。ステップST16では、
重みベクトル保存部16がその時点での累積重みベクト
ルWcumと重み更新の累積度数Countの値を、検
索目的、保存日時と共に重みDB18に記録保存する。
【0050】ステップST15では、重み改訂制御部1
2の制御により、図16にその詳細を示すような手順で
オフラインモードでの重み改訂処理を行う。図16にお
いて、ステップST1501では、重み改訂制御部12
が選択結果ログ14からログデータとして、検索目的、
対象ベクトルデータX、正解のベクトルデータZの1対
を読み出した上で、ステップST4からステップST7
により対象のベクトルデータXに最も類似するベクトル
データYmax を選出するが、その処理は図3および図9
で既に説明したのと全く同様である。
【0051】ステップST1502では、ベクトルデー
タYmax とベクトルデータZの同一性を確認する。同一
でない場合はステップST11に進んで重み改訂を行う
が、その処理は既に図3および図14で説明したのと全
く同様である。重み改訂制御部12は、ステップST1
503の判断を行いながら、選択結果ログ14に記録さ
れた全ての履歴についてオフラインの重み改訂処理を行
うように制御する。
【0052】重み改訂制御部12は、ステップST15
04において、重みベクトル評価部17を用いて次の処
理を行う。即ち、重みDB18に前回保存された重みベ
クトルの値と現在のオフライン改訂後の重みベクトルと
の重み設定に従って、全ての選択結果ログ14について
システムが選び出したベクトルデータYmax と正解のベ
クトルデータZがどれだけ一致するかという正解率を算
出し、その正解率の高い方を改めて重みベクトルの値と
する。このように選択結果ログ14に残された履歴を評
価用データとして用い、重みベクトルが改訂後に検索精
度を上げるかどうかを評価した上で、検索精度が下がる
ことのないように重みを設定する。
【0053】上記実施の形態1で用いられた重みベクト
ルの改訂式(11)は一例を示すものであり、ベクトル
データX、ベクトルデータYmax 、ベクトルデータZを
用いてその他の式により重みベクトルの訂正を行っても
良い。また、上記実施の形態1における式(9),式
(10)を用いた矯正類似度の算出方法は一例を示すも
のであり、他の式により矯正類似度を算出しても良い。
また、上記実施の形態1における図7,図15に示した
ユーザインタフェースは一例を示すものであり、他の画
面構成であっても良い。また、上記実施の形態1では、
検索の対象となるベクトルデータXに症状と病名からな
る医療上の診療データの例を用いて説明したが、類似検
索装置は医療応用に限らず一般にベクトルデータの類似
検索において同様の効果を奏する。特に、その他のベク
トルデータの一例としては、図17に示すように、検査
画像を解析して得られる特徴量を条件属性として検査画
像のファイル名の類似検索を行うような場合がある。
【0054】以上のように、この実施の形態1によれ
ば、以下のような効果が得られる。 (a)正解選択部7および3ベクトル重み再計算部8を
用いて、類似検索装置の実施した類似検索の結果が不正
解であった場合にのみ、検索対象のベクトルデータ、類
似検索装置が最も類似するデータとして選出したベクト
ルデータ、利用者が正解として選んだベクトルデータの
3つのベクトルデータを用いて重みを改訂するので、類
似検索装置の類似検索の結果が正解の場合にまで重みを
変更してしまうことがなく、検索精度が向上する。 (b)重み表示設定部10を用いて利用者に対してグラ
フィカルな表現を用いて重みベクトルを提示することが
できるので、利用者が重み設定の状態を容易に理解する
ことができる。 (c)重み改訂制御部12が重み改訂を利用者との協調
作業により、インタラクティブに実施させることができ
るので、利用者の経験に基づく主観的な判断を組み込み
ながら類似検索の重みベクトルをチューニングして行く
ことができる。 (d)対象属性選択部2が利用者による条件属性の選択
を可能にするので、類似検索に用いる条件属性を利用者
の意志に従って選択指定することができる。 (e)重みDB18、重みベクトル選択部19、重みベ
クトル保存部16を用いて複数の重みベクトルの設定を
保存管理できるので、検索目的などに応じて重みベクト
ルを使い分けることができる。 (f)データ欠落対処部20により、検索対象あるいは
ベクトルDB4中のデータの属性値に欠落があっても、
それを矯正する類似度を算出することができ、類似検索
エンジン3がデータの欠落に対処できる。 (g)重み改訂制御部12、選択結果記録部13が、重
みを逐次更新する代わりに選択結果ログ14を蓄え、オ
フラインで重みの改訂を実施することができるので、類
似検索作業の実施中には重みベクトルを固定しておくこ
とが可能になり、システムの不安定要因を除くことがで
きる。 (h)重みベクトル評価部17が以前の重みベクトルと
現在の重みベクトルの類似検索精度を評価し、精度の高
い方を選ぶことができるので、無条件に重みベクトルを
更新する場合に比べて精度の劣化を防止することができ
る。
【0055】
【発明の効果】以上のように、請求項1記載の発明によ
れば、利用者の操作に基づいて検索結果表示部に表示さ
れたベクトルデータが正解か不正解かを判定すると共
に、不正解である場合に望ましいベクトルデータが指定
される正解選択部と、対象データ指定部により指定され
たベクトルデータ、類似検索エンジンにより検索された
ベクトルデータ、および正解選択部により不正解である
場合に指定されたベクトルデータに基づいて重みベクト
ルを改訂する3ベクトル重み再計算部とを備えるように
構成したので、類似検索エンジンが検索したベクトルデ
ータが正解であったかどうかの単なる判定だけでなく、
不正解の場合には本来ならばどのベクトルデータを検索
結果とすることが望ましかったのかを利用者が正解選択
部により指定することにより、3ベクトル重み再計算部
が3つのべクトルデータから重みベクトルを改訂するこ
とができる効果がある。また、この3ベクトル重み再計
算部は類似検索エンジンが正解のベクトルデータを検索
した際には重みベクトルの改訂を全く行わないが、これ
により重みべクトルの設定がうまく行っている時には重
みを固定することができ、精度の悪化を防止することが
できる効果がある。
【0056】請求項2記載の発明によれば、利用者の操
作に基づいて検索結果表示部に表示されたベクトルデー
タが正解か不正解かを判定されると共に、不正解である
場合に望ましいベクトルデータが指定される正解選択部
と、対象データ指定部により指定されたベクトルデータ
に正解選択部による正解のベクトルデータの参照属性ま
たは不正解である場合の望ましいベクトルデータの参照
属性を付加してベクトルデータベースに蓄積する新規デ
ータ追加部と、対象データ指定部により指定されたベク
トルデータ、類似検索エンジンにより検索されたベクト
ルデータ、および正解選択部により不正解である場合に
指定されたベクトルデータに基づいて重みベクトルを改
訂する3ベクトル重み再計算部とを備えるように構成し
たので、類似検索エンジンが検索したベクトルデータが
正解であったかどうかの単なる判定だけでなく、不正解
の場合には本来ならばどのベクトルデータを検索結果と
することが望ましかったのかを利用者が正解選択部によ
り指定することにより、3ベクトル重み再計算部が3つ
のべクトルデータから重みベクトルを改訂することがで
きる効果がある。また、この3ベクトル重み再計算部は
類似検索エンジンが正解のベクトルデータを検索した際
には重みベクトルの改訂を全く行わないが、これにより
重みべクトルの設定がうまく行っている時には重みを固
定することができ、精度の悪化を防止することができる
効果がある。さらに、新規データ追加部により、対象デ
ータ指定部により指定されたベクトルデータに正解選択
部による正解のベクトルデータの参照属性または不正解
である場合の望ましいベクトルデータの参照属性を参考
にして決められた参照属性値を付加してベクトルデータ
ベースに蓄積することができる効果がある。
【0057】請求項3記載の発明によれば、重みベクト
ルの値を表示すると共に、利用者の指示に基づいてその
重みベクトルの値を改訂する重み表示設定部を備えるよ
うに構成したので、重み表示設定部が重みベクトルの値
を表示し、また、利用者はこの重み表示設定部を用いて
類似検索装置が現在用いている重みベクトルの設定を改
訂することができ、重みベクトルの状態を把握できると
共に、希望通りに設定することができる効果がある。
【0058】請求項4記載の発明によれば、重み表示設
定部を、スライドバーまたは棒グラフのようにグラフィ
カルに表示するように構成したので、利用者が直感的に
ベクトルの状態を把握することができ、新しい状態の重
みベクトルの設定を容易に行うことができる効果があ
る。
【0059】請求項5記載の発明によれば、3ベクトル
重み再計算部による重みベクトルの改訂と重み表示設定
部による重みベクトルの改訂とを協調的に行う重み改訂
部を備えるように構成したので、重み表示設定部を用い
て利用者が重みベクトルの設定を行うと、その後その設
定された重みベクトルを用いて類似検索が実行され、同
時に重みベクトルに基づいて重みベクトルの自動改訂を
実施する。逆にこの結果を重み表示設定部を用いて利用
者に提示し、必要に応じて利用者の再設定を受けること
ができる。このような類似検索装置による重みの自動改
訂と利用者による重みベクトルの手動設定を交互に繰り
返すことを可能にし、協調的な重みのチューニング作業
を実現することができる効果がある。
【0060】請求項6記載の発明によれば、対象データ
指定部により指定されたベクトルデータのうちの類似検
索の対象にする条件属性を利用者の操作に基づいて指定
される対象属性選択部を備え、類似検索エンジンは、対
象属性選択部により指定された条件属性のみに関してベ
クトルデータを検索するように構成したので、類似検索
の対象にする条件属性を利用者の意志に応じて設定でき
る効果がある。
【0061】請求項7記載の発明によれば、対象属性選
択部を、条件属性名を表示したオンオフスイッチのよう
にグラフィカルに表示するように構成したので、条件属
性の選択を、マウスで選択するなど条件属性の選択を容
易にすることができる効果がある。
【0062】請求項8記載の発明によれば、利用者の操
作に基づいて、1回の類似検索エンジンによる検索の実
行毎に重みベクトルを改訂するオンラインモードと、数
回の類似検索エンジンによる検索の実行後に重みベクト
ルを改訂するオフラインモードと、全く重みベクトルを
改訂しないノーモードとに指定され、その指定されたモ
ードに応じて重みベクトルの改訂処理を制御する重み改
訂制御部を備えるように構成したので、利用者が重み改
訂モードをオンラインモード、オフラインモード、ノー
モードに切り替えることができ、その重み改訂制御部の
重み改訂モードに従って、重み改訂の処理を切り替える
ことができる効果がある。
【0063】請求項9記載の発明によれば、対象データ
指定部により指定されたベクトルデータと利用者の操作
に基づいて正解選択部により指定された正解のベクトル
データまたは不正解である場合の望ましいベクトルデー
タとを対にして履歴を選択結果ログに蓄積する選択結果
記録部を備えるように構成したので、対象データ指定部
により指定されたベクトルデータに対して利用者の選ん
だ正解のベクトルデータまたは不正解である場合の望ま
しいベクトルデータは何であったかを蓄積することがで
きる効果がある。
【0064】請求項10記載の発明によれば、改訂前の
重みベクトルと改訂後の重みベクトルとを評価比較し、
妥当な重みベクトルを選択する重みベクトル評価部を備
えるように構成したので、重みベクトル評価部が、例え
ば類似検索の精度を比較するためのテストデータを用い
て、改訂前の重みベクトルと改訂後の重みベクトルを用
いた場合の類似検索後の正解率から精度を比較し、その
結果に応じてより良い重みベクトルを選択し、採用する
ことができる効果がある。
【0065】請求項11記載の発明によれば、重みベク
トルの値を重みデータベースに蓄積する重みベクトル保
存部と、重みデータベースの中から類似検索エンジンに
よる検索に用いられる重みベクトルを選択する重みベク
トル選択部とを備えるように構成したので、重みベクト
ル保存部が重みベクトルの値を重みデータベースに蓄積
することができ、また、重みベクトル選択部が保存され
た重みベクトルの中から適切な重みを選び出すことがで
きる効果がある。
【0066】請求項12記載の発明によれば、重みベク
トル保存部を、重みベクトルの値に更新日時を付加して
過去の重みベクトル更新の履歴が残るように重みデータ
ベースに蓄積し、重みベクトル選択部を、その重みデー
タベースから更新日時に基づいて、利用者により重みベ
クトルが選択されるように構成したので、過去の重みベ
クトルの更新の履歴を更新日時などのデータと共に蓄え
ておき、利用者が重みベクトル選択部で過去の更新日時
に基づいて重みベクトルを選択することにより、過去に
記録された重みベクトルに自由に戻して類似検索を実行
することができる効果がある。
【0067】請求項13記載の発明によれば、重みベク
トル保存部を、重みベクトルの値に検索目的を付加して
過去の重みベクトル更新の履歴が残るように重みデータ
ベースに蓄積し、重みベクトル選択部を、その重みデー
タベースから検索目的に基づいて、利用者により重みベ
クトルが選択されるように構成したので、重みベクトル
を検索目的などのデータと共に蓄えておき、利用者が重
みべクトル選択部で検索目的に基づいて重みベクトルを
選択することにより、目的に応じた重みベクトルを選択
することができる効果がある。
【0068】請求項14記載の発明によれば、重み改訂
制御部により重み改訂モードがオフラインモードに指定
されている場合に、選択結果ログに蓄積された対象デー
タ指定部により指定されたベクトルデータに類似するベ
クトルデータを類似検索エンジンにより重みベクトルに
基づいて検索し、その検索されたベクトルデータとその
選択結果ログに対にして蓄積された正解のベクトルデー
タまたは望ましいベクトルデータとが異なる場合に、そ
れら対象データ指定部により指定されたベクトルデー
タ、類似検索エンジンにより検索されたベクトルデータ
および正解選択部により不正解である場合に指定された
望ましいベクトルデータに基づいて3ベクトル重み再計
算部により重みベクトルを計算するように構成したの
で、選択結果ログに蓄積された対象データ指定部により
指定されたベクトルデータに関する類似検索を自動実行
し、その時の類似検索エンジンにより検索されたベクト
ルデータと、選択結果ログに記録された正解のベクトル
データを用いてオフラインモードで重みベクトルを改訂
することができる効果がある。
【0069】請求項15記載の発明によれば、対象デー
タ指定部により指定されたベクトルデータまたはベクト
ルデータベースに蓄積されたベクトルデータの条件属性
に欠落がある場合に、類似検索エンジンによりその欠落
がある条件属性に基づいて仮類似度を計算させると共
に、その欠落がある重みベクトルと欠落がない重みベク
トルとその仮類似度とに基づいて矯正類似度を計算させ
て、その矯正類似度を利用して検索させるデータ欠落対
処部を備えるように構成したので、データ欠落対処部が
欠落していない部分の条件属性から算出される部分的な
類似度指標を元に、類似検索の条件指定の対象になる全
属性を用いた類似度に換算し、欠落のないベクトルデー
タが示す類似度と比較することができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による類似検索装置
を示すブロック図である。
【図2】 ベクトルDBを示す説明図である。
【図3】 この発明の実施の形態1による類似検索装置
の動作を示すフローチャートである。
【図4】 重み改訂モードを示す説明図である。
【図5】 重みベクトルの選択および作成処理の詳細を
示すフローチャートである。
【図6】 重みDBを示す説明図である。
【図7】 条件属性の選択画面を示す説明図である。
【図8】 重みベクトルを示す説明図である。
【図9】 類似度算出処理の詳細を示すフローチャート
である。
【図10】 データの欠落を含むベクトルDBを示す説
明図である。
【図11】 類似検索結果の判定および正解選択処理の
詳細を示すフローチャートである。
【図12】 選択結果ログの出力処理の詳細を示すフロ
ーチャートである。
【図13】 選択結果ログを示す説明図である。
【図14】 重み改訂処理の詳細を示すフローチャート
である。
【図15】 重み設定の提示および手動改訂の画面を示
す説明図である。
【図16】 オフライン重み改訂処理の詳細を示すフロ
ーチャートである。
【図17】 他のベクトルDBを示す説明図である。
【図18】 従来の類似検索装置を示すブロック図であ
る。
【図19】 従来の類似検索装置の動作を示すフローチ
ャートである。
【図20】 従来の類似検索装置の結果判定処理の詳細
を示すフローチャートである。
【図21】 従来の類似検索装置の重み改訂処理の詳細
を示すフローチャートである。
【符号の説明】
1 対象データ指定部、2 対象属性選択部、3 類似
検索エンジン、4 ベクトルデータベース、5 重みベ
クトル、6 検索結果表示部、7 正解選択部、8 3
ベクトル重み再計算部、9 重み改訂部、10 重み表
示設定部、11新規データ追加部、12 重み改訂制御
部、13 選択結果記録部、14 選択結果ログ、15
重み改訂モード、16 重みベクトル保存部、17
重みベクトル評価部、18 重みデータベース、19
重みベクトル選択部、20 データ欠落対処部。

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 類似検索対象のベクトルデータを指定す
    る対象データ指定部と、複数のベクトルデータを蓄積す
    るベクトルデータベースと、そのベクトルデータベース
    に蓄積された複数のベクトルデータの中から上記対象デ
    ータ指定部により指定された類似検索対象のベクトルデ
    ータに類似するベクトルデータを重みベクトルに基づい
    て検索する類似検索エンジンと、その類似検索エンジン
    により検索された類似するベクトルデータを表示する検
    索結果表示部と、利用者の操作に基づいて上記検索結果
    表示部に表示されたベクトルデータが正解か不正解かを
    判定すると共に、不正解である場合に望ましいベクトル
    データが指定される正解選択部と、上記対象データ指定
    部により指定された類似検索対象のベクトルデータ、上
    記類似検索エンジンにより検索された類似するベクトル
    データ、および上記正解選択部により不正解である場合
    に指定された望ましいベクトルデータに基づいて上記重
    みベクトルを改訂する3ベクトル重み再計算部とを備え
    た類似検索装置。
  2. 【請求項2】 類似検索対象の条件属性を有するベクト
    ルデータを指定する対象データ指定部と、条件属性およ
    び参照属性を有する複数のベクトルデータを蓄積するベ
    クトルデータベースと、そのベクトルデータベースに蓄
    積された複数のベクトルデータの中から上記対象データ
    指定部により指定された類似検索対象のベクトルデータ
    に類似するベクトルデータを条件属性に関する重みベク
    トルに基づいて検索する類似検索エンジンと、その類似
    検索エンジンにより検索された類似するベクトルデータ
    を表示する検索結果表示部と、利用者の操作に基づいて
    上記検索結果表示部に表示されたベクトルデータが正解
    か不正解かを判定すると共に、不正解である場合に望ま
    しいベクトルデータが指定される正解選択部と、上記対
    象データ指定部により指定されたベクトルデータに上記
    正解選択部による正解のベクトルデータの参照属性また
    は不正解である場合の望ましいベクトルデータの参照属
    性を付加して上記ベクトルデータベースに蓄積する新規
    データ追加部と、上記対象データ指定部により指定され
    た類似検索対象のベクトルデータ、上記類似検索エンジ
    ンにより検索された類似するベクトルデータ、および上
    記正解選択部により不正解である場合に指定された望ま
    しいベクトルデータに基づいて上記重みベクトルを改訂
    する3ベクトル重み再計算部とを備えた類似検索装置。
  3. 【請求項3】 重みベクトルの値を表示すると共に、利
    用者の指示に基づいてその重みベクトルの値を改訂する
    重み表示設定部を備えたことを特徴とする請求項1また
    は請求項2記載の類似検索装置。
  4. 【請求項4】 重み表示設定部は、スライドバーまたは
    棒グラフのようにグラフィカルに表示することを特徴と
    する請求項3記載の類似検索装置。
  5. 【請求項5】 3ベクトル重み再計算部による重みベク
    トルの改訂と重み表示設定部による重みベクトルの改訂
    とを協調的に行う重み改訂部を備えたことを特徴とする
    請求項3または請求項4記載の類似検索装置。
  6. 【請求項6】 対象データ指定部により指定されたベク
    トルデータのうちの類似検索の対象にする条件属性を利
    用者の操作に基づいて指定される対象属性選択部を備
    え、類似検索エンジンは、上記対象属性選択部により指
    定された条件属性のみに関してベクトルデータベースに
    蓄積された複数のベクトルデータの中から上記対象デー
    タ指定部により指定されたベクトルデータに類似するベ
    クトルデータを重みベクトルに基づいて検索することを
    特徴とする請求項1から請求項5のうちのいずれか1項
    記載の類似検索装置。
  7. 【請求項7】 対象属性選択部は、条件属性名を表示し
    たオンオフスイッチのようにグラフィカルに表示するこ
    とを特徴とする請求項6記載の類似検索装置。
  8. 【請求項8】 利用者の操作に基づいて重み改訂モード
    が、1回の類似検索エンジンによる検索の実行毎に重み
    ベクトルを改訂するオンラインモード、数回の類似検索
    エンジンによる検索の実行後に重みベクトルを改訂する
    オフラインモード、または全く重みベクトルを改訂しな
    いノーモードに指定され、その指定された重み改訂モー
    ドに応じて重みベクトルの改訂処理を制御する重み改訂
    制御部を備えたことを特徴とする請求項1から請求項7
    のうちのいずれか1項記載の類似検索装置。
  9. 【請求項9】 対象データ指定部により指定されたベク
    トルデータと利用者の操作に基づいて正解選択部により
    指定された正解のベクトルデータまたは不正解である場
    合の望ましいベクトルデータとを対にして履歴を選択結
    果ログに蓄積する選択結果記録部を備えたことを特徴と
    する請求項1から請求項8のうちのいずれか1項記載の
    類似検索装置。
  10. 【請求項10】 改訂前の重みベクトルと改訂後の重み
    ベクトルとを評価比較し、妥当な重みベクトルを選択す
    る重みベクトル評価部を備えたことを特徴とする請求項
    1から請求項9のうちのいずれか1項記載の類似検索装
    置。
  11. 【請求項11】 重みベクトルの値を重みデータベース
    に蓄積する重みベクトル保存部と、上記重みデータベー
    スの中から類似検索エンジンによる検索に用いられる重
    みベクトルを選択する重みベクトル選択部とを備えたこ
    とを特徴とする請求項1から請求項10のうちのいずれ
    か1項記載の類似検索装置。
  12. 【請求項12】 重みベクトル保存部は、重みベクトル
    の値に更新日時を付加して過去の重みベクトル更新の履
    歴が残るように重みデータベースに蓄積し、重みベクト
    ル選択部は、その重みデータベースから更新日時に基づ
    いて、利用者により重みベクトルが選択されることを特
    徴とする請求項11記載の類似検索装置。
  13. 【請求項13】 重みベクトル保存部は、重みベクトル
    の値に検索目的を付加して過去の重みベクトル更新の履
    歴が残るように重みデータベースに蓄積し、重みベクト
    ル選択部は、その重みデータベースから検索目的に基づ
    いて、利用者により重みベクトルが選択されることを特
    徴とする請求項11記載の類似検索装置。
  14. 【請求項14】 重み改訂制御部により重み改訂モード
    がオフラインモードに指定されている場合に、選択結果
    ログに蓄積された対象データ指定部により指定されたベ
    クトルデータに類似するベクトルデータを類似検索エン
    ジンによりベクトルデータベースに蓄積された複数のベ
    クトルデータの中から重みベクトルに基づいて検索し、
    その検索された類似するベクトルデータとその選択結果
    ログに対にして蓄積された正解のベクトルデータまたは
    望ましいベクトルデータとが異なる場合に、それら対象
    データ指定部により指定されたベクトルデータ、類似検
    索エンジンにより検索された類似するベクトルデータお
    よび正解選択部により不正解である場合に指定された望
    ましいベクトルデータに基づいて3ベクトル重み再計算
    部により重みベクトルを計算することを特徴とする請求
    項11から請求項13のうちのいずれか1項記載の類似
    検索装置。
  15. 【請求項15】 対象データ指定部により指定されたベ
    クトルデータまたはベクトルデータベースに蓄積された
    ベクトルデータの条件属性に欠落がある場合に、類似検
    索エンジンによりその欠落がある条件属性に基づいて仮
    類似度を計算させると共に、その欠落がある重みベクト
    ルと欠落がない重みベクトルとその仮類似度とに基づい
    て矯正類似度を計算させて、その矯正類似度を利用して
    検索させるデータ欠落対処部を備えたことを特徴とする
    請求項1から請求項14のうちのいずれか1項記載の類
    似検索装置。
JP02940097A 1997-02-13 1997-02-13 類似検索装置 Expired - Fee Related JP3664834B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02940097A JP3664834B2 (ja) 1997-02-13 1997-02-13 類似検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02940097A JP3664834B2 (ja) 1997-02-13 1997-02-13 類似検索装置

Publications (2)

Publication Number Publication Date
JPH10228475A true JPH10228475A (ja) 1998-08-25
JP3664834B2 JP3664834B2 (ja) 2005-06-29

Family

ID=12275102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02940097A Expired - Fee Related JP3664834B2 (ja) 1997-02-13 1997-02-13 類似検索装置

Country Status (1)

Country Link
JP (1) JP3664834B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163359A (ja) * 2000-11-27 2002-06-07 Mediva:Kk 医療用診断・処置支援装置、医療用診断・処置支援システム装置および医療用診断・処置支援プログラム記録したコンピュータ読み取り可能な記録媒体。
JP2003122845A (ja) * 2001-10-09 2003-04-25 Shinkichi Himeno 医療情報の検索システム及びそのシステムを実行するためのプログラム
JP2003339646A (ja) * 2002-05-24 2003-12-02 Keijiro Torigoe 疾患拾い出しシステム及び知識ベース
JP2006055507A (ja) * 2004-08-23 2006-03-02 Shoshiki Kagi Kofun Yugenkoshi 即時医療映像自動的サーチ対照方法及びそのシステム
JP2011511337A (ja) * 2007-12-20 2011-04-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ケースベースの意思決定支援のための方法及び装置
JP2013088880A (ja) * 2011-10-14 2013-05-13 Fujifilm Corp 診療情報処理装置および方法並びにプログラム
CN112613734A (zh) * 2020-12-22 2021-04-06 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 一种电能状态评估指标选取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0454564A (ja) * 1990-06-21 1992-02-21 Nippon Telegr & Teleph Corp <Ntt> 重み学習型テキストベース検索装置
JPH064584A (ja) * 1992-06-24 1994-01-14 Sharp Corp 文章検索装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0454564A (ja) * 1990-06-21 1992-02-21 Nippon Telegr & Teleph Corp <Ntt> 重み学習型テキストベース検索装置
JPH064584A (ja) * 1992-06-24 1994-01-14 Sharp Corp 文章検索装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163359A (ja) * 2000-11-27 2002-06-07 Mediva:Kk 医療用診断・処置支援装置、医療用診断・処置支援システム装置および医療用診断・処置支援プログラム記録したコンピュータ読み取り可能な記録媒体。
JP2003122845A (ja) * 2001-10-09 2003-04-25 Shinkichi Himeno 医療情報の検索システム及びそのシステムを実行するためのプログラム
JP2003339646A (ja) * 2002-05-24 2003-12-02 Keijiro Torigoe 疾患拾い出しシステム及び知識ベース
JP2006055507A (ja) * 2004-08-23 2006-03-02 Shoshiki Kagi Kofun Yugenkoshi 即時医療映像自動的サーチ対照方法及びそのシステム
JP4617116B2 (ja) * 2004-08-23 2011-01-19 商之器科技股▼ふん▲有限公司 即時医療映像自動的サーチ対照方法及びそのシステム
JP2011511337A (ja) * 2007-12-20 2011-04-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ケースベースの意思決定支援のための方法及び装置
US9792414B2 (en) 2007-12-20 2017-10-17 Koninklijke Philips N.V. Method and device for case-based decision support
JP2013088880A (ja) * 2011-10-14 2013-05-13 Fujifilm Corp 診療情報処理装置および方法並びにプログラム
CN112613734A (zh) * 2020-12-22 2021-04-06 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 一种电能状态评估指标选取方法
CN112613734B (zh) * 2020-12-22 2024-02-09 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 一种电能状态评估指标选取方法

Also Published As

Publication number Publication date
JP3664834B2 (ja) 2005-06-29

Similar Documents

Publication Publication Date Title
JP5668090B2 (ja) 医療診断支援装置及び医療診断支援方法
JP5612731B2 (ja) 関心領域についての関連情報の決定
JP4003468B2 (ja) 適合性フィードバックによる類似データ検索方法および装置
JP7433601B2 (ja) エキスパートレポートエディタ
CN110008409A (zh) 基于自注意力机制的序列推荐方法、装置及设备
Xu et al. Multiresponse systems optimization using a goal attainment approach
JPH1074188A (ja) データ学習装置およびプラント制御装置
CN111696661A (zh) 患者分群模型构建方法、患者分群方法及相关设备
US20140236869A1 (en) Interactive variable selection device, interactive variable selection method, and interactive variable selection program
WO2020255307A1 (ja) 情報処理装置、情報処理方法、および記録媒体
JPH10228475A (ja) 類似検索装置
JP4253498B2 (ja) 画像検索プログラム、そのプログラムを記憶した記憶媒体、画像検索装置及び画像検索方法
JP2006163465A (ja) 医療情報分析装置、方法及びプログラム
US20240335170A1 (en) System and method for electrocardiogram image-based patient evaluation
JP2685456B2 (ja) 類似画像検索装置
Fan et al. A new search procedure of steepest ascent in response surface exploration
JPH05324728A (ja) 情報検索装置
Gao et al. LLM-enhanced Reranking in Recommender Systems
JP3385913B2 (ja) 関連語提示装置及び関連語提示用プログラムを記録した媒体
JPH06282574A (ja) 類似検索装置
JP2019149109A (ja) 調達先決定支援プログラム、装置、及び方法
JP7242407B2 (ja) 匿名加工システム、匿名加工プログラム及び匿名加工方法
JP5125721B2 (ja) 予測支援プログラム、予測支援装置、および予測支援方法
JPH06176072A (ja) 類似検索装置
Liu et al. Stacked Attention-based Networks for Accurate and Interpretable Health Risk Prediction

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041012

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050330

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080408

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090408

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100408

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees