JP2993539B2

JP2993539B2 - データベース検索システムおよびその方法

Info

Publication number: JP2993539B2
Application number: JP3356348A
Authority: JP
Inventors: 寛高田
Original assignee: Nippon Steel Corp
Current assignee: Nippon Steel Corp
Priority date: 1991-12-24
Filing date: 1991-12-24
Publication date: 1999-12-20
Anticipated expiration: 2014-12-20
Also published as: JPH05174067A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データベースから必要
な情報を取り出すためのデータベース検索システムおよ
びその方法に関する。

【０００２】

【従来の技術】現状のデータベース検索における検索空
間圧縮の手法としては、キーワード付加方式によるもの
が一般的である。また対象物件数が比較的少数のケース
では、全物件検索方式が実用化されている。例えば効率
的な全物件検索手法として、ボイヤ―モア法が考案され
ている。さらに、検索対象からキーワードを自動抽出
し、索引を生成するインデックス方式もある。

【０００３】

【発明が解決しようとする課題】上記のキーワード検索
方式は、以下のような欠点を有する。（１）、物件一つ一つにキーワードを付加しなくてはな
らない。（２）、任意のキーワードを付加して行くと、その個数
は膨大になるため、例えばシソーラスによる管理などを
必要とし、その維持に多大なコストがかかる。（３）、付加されるキーワードが必ずしも適切なものと
は限らないため、検索もれが発生する。すなわち現状の
データベース検索方式では、特に物件数が膨大になった
時に必要なコストに比してパーフォーマンスが伸びない
傾向が現れる。

【０００４】一方、全物件検索方式では、上記のような
問題は発生しない。しかし直接検索方式では、物件数が
膨大になったとき、検索時間は対話的な時間の域を大幅
に超過し、実用にならないのが現状である。また全物件
検索方式では、完全一致が条件であり、あいまい一致検
索ができない欠点も有る。また上述のボイヤ―モア法に
よる全物件検索では、文書以外のデータ、例えば物理的
な時系列データを扱うことができない問題がある。

【０００５】さらに、インデックス方式では、扱う情報
単位が単語であるため、英語文書のように単語が分割さ
れているものには適しているが、何らかの文法解析を要
する。また、日本語文書などのように単語が分割されて
書かれていないものには不向きである。さらに、単語の
表記上のバリエーションに対しては、考えられるすべて
の組を辞書化せざるを得ないため、システムの負荷が大
きい。

【０００６】本発明は、上記のような問題に鑑み、全物
件検索でありながら検索時間を飛躍的に短縮することが
でき、またあいまい一致検索ができるデータベース検索
方式を提供することを目的とする。

【０００７】

【課題を解決するための手段】本発明のデータベース検
索システムは、検索キーに応じて検索対象の複数の物件
から情報を検索するためのデータベース検索システムに
おいて、上記検索対象のｉ番目の物件のｊ番目のデータ
Ｃ _i,j と、ｉ番目の物件内のデータＣ _i,j の近傍データ
Ｃ _i,k とに基づいて複数の量子化量を算出する量子化量
算出手段と、近傍特徴量として上記複数の量子化量の組
合わせを記憶する記憶手段とを有することを特徴とす
る。また、本発明の他の態様では、上記量子化量算出手
段で上記検索キーについて複数の量子化量を算出し、上
記検索対象の近傍特徴量との合致度を求める検索手段を
有する。また、上記物件毎の合致度を上記検索キーの近
傍特徴量の完全一致度数で割った値を、物件毎の検索キ
ーの含有確率として算出する含有率算出手段を更に有す
るようにしても良い。また、物件番号を合致度の降順に
出力するようにしても良いし、含有確率リストを確率の
降順に出力するようにしても良い。また、本発明のデー
タベース検索方法は、検索キーに応じて検索対象の複数
の物件から情報を検索するためのデータベース検索方法
であって、上記検索対象のｉ番目の物件のｊ番目のデー
タＣ _i,j と、ｉ番目の物件内のデータＣ _i,j の近傍デー
タＣ _i,k とに基づいて複数の量子化量を算出し、近傍特
徴量として上記複数の量子化量の組合わせを記憶し、上
記検索キーについて上記物件の量子化量を算出するのと
同じ処理を施して上記検索キーの複数の量子化量を算出
し、上記検索キーの複数の量子化量と上記近傍特徴量と
の合致度を求めることを特徴とする。

【０００８】

【作用】全物件直接検索を行なう際に検索時間を増大さ
せる要因であるデータの位相情報（検索キーが物件中の
どこに存在するかと言う場所情報）を近傍特徴量の抽出
により捨象してある。検索時間は検索キー情報の長さの
みに依存する。従って、検索時間がデータ量に依存しな
い高速な検索が可能となる。また物件毎の検索キーの合
致度（含有確率）として検索結果が求まるので、文法な
どに依存しない汎用な検索システムが実現可能である。
また、合致度の降順参照により、あいまい検索が可能と
なる。検索対象としては、文書データ、物理計測デー
タ、信号波形データ、画像データ、音響データなどを扱
うことができる。

【０００９】

【実施例】図１は、本発明の一実施例を示す近傍特徴量
によるパターン検索システムのデータフロー図である。
この検索システムでは、予め全対象物件から事象（情
報）の位相情報を全て捨象した自己相関データを作成
し、そのデータ群に対して全物件検索を行なう。検索の
アルゴリズムは、学習ステップと検索ステップとからな
る。学習ステップでは、物件毎に近傍特徴量行列が位相
情報として作成される。図１では、検索対象１０から自
己相関行列（近傍特徴量行列）３０を作成し、それを構
造ファイル４０に保存するまでのステップに該当する。
また、検索ステップでは、検索キーに対して学習ステッ
プと同様の処理を行って検索キーの近傍特徴量が求めら
れ、物件の近傍特徴量とのマッチング演算が行なわれ、
物件ごとにマッチング度（類似度）を示す評価結果を得
る。図１では、検索キー５０をもとに検索Ｓ４にて構造
ファイル４０の物件データとのマッチング演算を行い、
評価結果リスト７０あるいはソート済みリスト８０のよ
うに結果を出力するまでのステップに該当する。以下、
各ステップについて説明する。

【００１０】（１）、学習ステップ図１に於いて、検索対象１０は、例えば日本語、英語、
ドイツ語、フランス語、ヘブライ語、ロシア語などの文
書データ、或いは量子化された波形数値データ、化学構
造式、遺伝子情報などである。このような検索対象に対
して、まず正規化手段Ｓ１により正規化の処理を行な
う。一般に検索対象は、情報の最小単位（文書であれば
アルファベットなどの文字、数値チャートであれば、あ
る時刻における実数値など）の列で表現されている。そ
れをなんらかの方法でｎ階調の整数列に変換する。これ
をデータの正規化と呼ぶ。

【００１１】例えば、英文書データの場合、ＡＳＣＩＩ
コード表をそのまま用いることにより、次のような２５
６階調の数値表現として実現される。 …… This is a pen. …… 84｜104 ｜105 ｜115 ｜32｜105 ｜115 ｜32｜97｜32｜112 ｜101 ｜110 ｜46｜

【００１２】上記のコードにおいては、Ｔが84、ｈが10
4 ．．と対応している。

【００１３】次に、正規化されたデータ２０から、学習
手段Ｓ２により近傍特徴量が算出され、以下に説明する
手順で近傍特徴量行列３０の形式に畳込まれる。ここで
近傍特徴量をとる演算式は種々考えられる。この演算式
は検索の鋭さ（過検出の少なさ）にも影響を与える。

【００１４】学習手段Ｓ２の一例として、正規化された
データ２０から量子化量を求め、この量子化量を用いて
近傍特徴量行列３０を得る手順を説明する。例えば図３
に示すように、検索される対象物件（文書）が複数ある
とし、そのうちのｉ番目の物件の量子化について考え
る。ここで、ｉ番目の物件（文書）のｊ番目のデータ
（文字）をＣ_i,jとし、Ｃ _i,j のｋ近傍に関するデータ
をＣ _i,j+1 ，Ｃ _i,j+2 ， _.... Ｃ _i,j+k とする。ｉ番目の
物件において、図２に示すように正規化された数値列13
5,64,37,71,101,...が並んでいるとすると、Ｃ_i,jに関
する量子化量ｘおよびＣ _i,j の前方ｋ近傍に関する量子
化量ｙは、ｘ＝f(Ｃ_i,j）ｙ＝g(Ｃ_i,j, Ｃ_i,j+1,Ｃ_i,j+2,....,Ｃ_i,j+k) …式（１）で求められる。

【００１５】ここで、f(Ｃ_i,j）はＣ_i,jに関するｎ段
階量子化関数である。すなわち、ｉ番目の物件のｊ番目
のデータＣ_i,jについて所定の演算を行って得られる値
であり、１〜ｎのいずれかの整数で表される。したがっ
て、このｎ段階量子化関数fの演算により得られた量子
化量ｘの値によって、図３に示す行列（座標）において
ｘ軸方向の位置が１〜ｎの範囲で定まる。

【００１６】また、g(Ｃ_i,j, Ｃ_i,j+1,Ｃ_i,j+2,....,
Ｃ_i,j+k) は、Ｃ_i,jの前方ｋ近傍に関するｍ段階量子
化関数である。すなわち、ｉ番目の物件のｊ番目のデー
タＣ_i,jと、そのデータＣ _i,j の近傍の所定数のデータ
Ｃ _i,j+1, Ｃ _i,j+2,...., Ｃ _i,j+k とについて所定の演算
を行って得られる値であり、１〜ｍのいずれかの整数で
表される。たとえば図２に示すようにｊ番目のデータＣ
_i,jが１３５であり、ｋが３の場合には、Ｃ_i,j+1,Ｃ
_i,j+2,Ｃ_i,j+3としてデータ１３５に続くデータ６４、
３７、７１を抽出し、これらのデータとデータ１３５と
の相関について所定の演算を行う。ｊ番目のデータＣ
_i,jが次の６４の場合には、Ｃ_i,j+1,Ｃ_i,j+2,Ｃ_i,j+3
としてデータ６４に続くデータ３７、７１、１０１を抽
出し、これらのデータとデータ６４との相関について所
定の演算を行う。このようにしてｍ段階量子化関数g の
演算により得られた量子化量ｙの値によって、図３に示
す行列（座標）におけるｙ軸方向の位置が１〜ｍの範囲
で定まる。

【００１７】したがって、上記のように正規化されたデ
ータ２０から量子化量ｘ、ｙを求めることによって、図
３に示す行列（座標）における位置が定まる。なお、量
子化量を求める演算式f() 、g() としては種々あるが、
例えば、 f: x→x g: (x,y)→x-y （または｜x-y｜） …式（２）のように、演算式f() は入力された値をそのまま量子化
量とし、演算式g() は入力された２つの値の差、あるい
は差の絶対値を量子化量とする例が考えられる。この場
合、正規化されたデータ２０が先の例 84｜104 ｜105
｜115 _.... では、データＣ _i,j を84とすると、Ｃ
_i,j と、Ｃ _i,j の前方ｋ近傍に関する量子化量ｘ，ｙの
座標位置は、(84,20) 、(84,21) 、(84,31) 、 _.... とな
る。また、この式（２）以外にも、幾つかの文字列の個
々の文字整数値に対し四則演算を施すことにより近傍特
徴量を取り出してもよい。図２中に示した量子化量ｘ，
ｙの座標位置(51,71) 、(32,103 ) 、 _.... は、上記式
（２）とは異なる手法によって求めたものである。

【００１８】本システムでは、各物件情報は、上記のよ
うにして求めたｘ、ｙに対して物件の通番ｉと重みｗ
（x,y,i)の組として記憶される。重みｗ（x,y,i)は、デ
ータｘ、ｙ、ｉから所定の演算によって求められるが通
常は重みｗ（x,y,i)の値として１に固定してもよい。

【００１９】上記のようにして各物件についてデータＣ
_i,j ごとに求められた量子化量ｘ、ｙの値に基づき、図
３に棒によって示されるように、データを記憶する。す
なわち、データＣ_i,jの量子化量ｘ、ｙの値によって定
められる座標の位置に、その物件の通番ｉとその重みｗ
（x,y,i)を組みとしたデータを記憶する。同図ではこの
ようなデータが記憶されるごとに棒の長さが延びるよう
に表されている。もし重みｗ（x,y,i)を１とした場合に
は、物件の通番ｉのデータのみがｘ、ｙの値によって定
められる座標の位置に記憶されてゆく。

【００２０】この様にして作成された近傍特徴量行列に
物件の識別番号を付加して構造ファイル４０として保存
する。

【００２１】（２）、検索ステップまず検索キー５０を入力する。例えば、"This is a pe
n."を検索キーとする。この検索キー５０に対して学習
ステップでの正規化手段Ｓ１と同一の正規化方法に基づ
く正規化手段Ｓ３によりキー情報を以下の整数列に正規
化する。 84｜104 ｜105 ｜115 ｜32｜105 ｜115 ｜32｜97｜32｜112 ｜101 ｜110 ｜46｜

【００２２】次に、検索手段Ｓ４において、学習ステッ
プでの学習手段Ｓ２と同一の自己相関計算式f() 、g()
を用いて、正規化された検索キー５０の数値列の先頭か
ら量子化量ｘ、ｙの組の系列を作成する。次に、この検
索キー５０の量子化量ｘ、ｙの組の系列に基づいて、構
造ファイル４０内から取り出した物件ｉに対する検索キ
ー５０の含有度数ω _i として、Ｖ（ｘ _j, ｙ _j, ｉ）をｊ＝
１〜ｍについて合計することにより算出する。

【００２３】ただし、Ｖ（ｘ _j, ｙ _j, ｉ）は、構造ファイ
ル４０に記憶された物件ｉの重みに等しく、重みを持た
ない場合には０と定める。

【００２４】したがって、検索すべきキー５０の数値列
から求めた量子化量ｘ、ｙの組に対応する図３の量子化
量ｘ、ｙの位置にデータがある場合（棒がある場合）に
は、別に設けられた記憶手段のそのデータに示される物
件の通番ｉの格納箇所に、その重みの値を構造評価値sc
ore （合致度）として記憶させる。

【００２５】次に、評価結果出力手段Ｓ５において、構
造ファイル４０内の各物件毎に得られた構造評価値scor
e （合致度）を完全一致の場合の評価値で割って、検索
キー５０の含有確率を求め、評価結果のリスト７０を得
る。更にソート手段Ｓ６において、このリスト７０を含
有確率の降順にソートし、ソート済みリスト８０を得
る。

【００２６】このソート済みリスト８０が検索結果であ
り、その上位物件を参照することにより、検索キーが物
件中に含まれている確率が高い物件名を知ることができ
る。含有確率は、完全一致及び不完全一致の全てについ
て求まるから、あいまい一致検索を行なうことができ
る。

【００２７】また、検索キーの全情報についての全物件
探索であるから、検索もれが発生する確率は、本質的に
零であると言う特徴がある。

【００２８】また、１つの物件に対する検索キーの評価
時間は、キーの文字数のみに依存し、各物件の大きさに
は依存しない。従って、非常に高速に検索を行なうこと
ができる。

【００２９】また検索結果のリストどうしの論理演算を
行うことにより、検索条件に対するＡＮＤ、ＯＲなどの
検索演算処理も高速に実行できる。

【００３０】近傍特徴量は、各物件の全データを対象と
し取り出さなくてもよい。例えば、物件データ中の特定
の一つまたは一つ以上の整数値、特定の範囲の整数値、
或いはデータ列を構成する各バイト中の特定の１つまた
は一つ以上のビットを除外して近傍特徴量を生成しても
よい。また日本語文書のように２バイト文字で構成され
ている場合には、例えば上位バイトを除外して下位バイ
トを対象として近傍特徴量を取り出してもよい。

【００３１】上述の例では、自己相関によって生成され
る行列は、２５６次のビット行列であり、これは８Ｋバ
イトに相当する。従って、１物件のデータが１Ｋバイト
程度であるデータベースでは、効率のよいシステムであ
るとは言えない。そこでデータ圧縮手段Ｓ７を設けてデ
ータ圧縮を行なって構造ファイル４０の容量を減らすの
がよい。

【００３２】図４にデータ圧縮法の一例を示す。この例
では、２５６次の近傍特徴量行列の各物件毎に重みｗが
０でない物件名４０ａ（識別コード）を１バイト／件の
データ列として蓄積する。従って、重みｗが０である物
件名は不要データとして除外する。

【００３３】物件数が２５５個以上ある場合には、物件
名４０ａは１バイトで表せないので、下位の１バイトの
みを蓄積する。例えば、物件数が１万件の場合、物件名
は２バイトで表されるが、そのうちの下位１バイトを使
用する。そして物件名コードが２５５を越える毎にデー
タ列にマーカ４０ｂを挿入する。

【００３４】検索時には、検索キーの近傍特徴量の各々
に該当する構造ファイルのデータ列を取り出し、物件名
毎の出現度数テーブルを作成する。この際、マーカ４０
ｂを越える毎に物件名コードに２５５を加える。このよ
うにして作成した出現度数テーブルに基づいて図１の評
価結果リスト７０が得られる。

【００３５】なお物件名コードのデータ列が例えば全物
件中の半分以上ある場合には、その近傍特徴量行列要素
は各物件について共通であると見なして、その要素を削
除してもよい。

【００３６】上述の実施例において，正規化手段Ｓ１、
学習手段Ｓ２、正規化手段Ｓ３、検索手段Ｓ４、評価結
果出力手段Ｓ５、ソート手段Ｓ６、データ圧縮手段Ｓ７
は、コンピュータプログラムによって構成することがで
きるが、論理回路素子を用いて専用のハードウエアを構
成してもよい。

【００３７】

【発明の効果】本発明のデータベース検索システムおよ
びその方法は、検索対象のｉ番目の物件のｊ番目のデー
タＣ _i,j と、ｉ番目の物件内のデータＣ _i,j の近傍デー
タＣ _i,k とに基づいて複数の量子化量を算出し、その複
数の量子化量の組合わせを近傍特徴量として記憶し、検
索キーについて同様の処理を施して算出した複数の量子
化量と検索対象の近傍特徴量との合致度を求める構成で
ある。また、物件毎の合致度から物件毎の検索キーの含
有確率を求めても良い。さらに、物件番号を合致度の降
順に出力するようにしても良いし、含有確率リストを確
率の降順に出力するようにしても良い。

【００３８】従って、本発明によると、全物件直接検索
を行なう際に検索時間を増大させる要因であるデータの
位相情報（検索キーが物件中のどこに存在するかと言う
場所情報）を近傍特徴量の抽出により捨象してあるか
ら、検索時間は検索キー情報の長さのみに依存する。従
って、検索時間がデータ量に依存しない高速な検索が可
能となる。また物件毎の検索キーの合致度（含有確率）
として検索結果が求まるので、文法などに依存しない汎
用な検索システムが実現可能である。また、合致度の降
順参照により不完全一致検索を行えるため、あいまい検
索が可能となり、検索キー上のノイズにも強い。

【図面の簡単な説明】

【図１】本発明の一実施例のデータベース検索システム
のデータフロー図である。

【図２】近傍情報の量子化を示す図である。

【図３】記憶される情報構造を示す図である。

【図４】圧縮された近傍特徴量のデータ構成図である。

【符号の説明】

１０検索対象２０正規化データ３０近傍特徴量行列４０構造ファイル５０検索キー６０正規化キー７０評価結果リスト８０ソート済みリストＳ１正規化手段Ｓ２学習手段Ｓ３正規化手段Ｓ４検索手段Ｓ５評価結果出力手段Ｓ６ソート手段Ｓ７データ圧縮手段

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭60−241173（ＪＰ，Ａ) 特開昭60−65335（ＪＰ，Ａ) 特開昭48−39125（ＪＰ，Ａ) 特開平１−102685（ＪＰ，Ａ) 特開平２−16676（ＪＰ，Ａ) 特開昭63−143668（ＪＰ，Ａ) 特開昭61−25272（ＪＰ，Ａ) 特開昭63−27988（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 17/30

Claims

(57)【特許請求の範囲】

【請求項１】検索キーに応じて検索対象の複数の物件
から情報を検索するためのデータベース検索システムに
おいて、上記検索対象のｉ番目の物件のｊ番目のデータＣ
_i,j と、ｉ番目の物件内のデータＣ _i,j の近傍データＣ
_i,k とに基づいて複数の量子化量を算出する量子化量算
出手段と、近傍特徴量として上記複数の量子化量の組合わせを記憶
する記憶手段とを有することを特徴とするデータベース
検索システム。
【請求項２】検索キーに応じて検索対象の複数の物件
から情報を検索するためのデータベース検索システムに
おいて、上記検索対象のｉ番目の物件のｊ番目のデータＣ
_i,j と、ｉ番目の物件内のデータＣ _i,j の近傍データＣ
_i,k とに基づいて複数の量子化量を算出する量子化量算
出手段と、近傍特徴量として上記複数の量子化量をそれぞれ近傍特
徴量行列座標の各軸の要素値とする座標位置に上記物件
の物件番号を記憶する記憶手段とを有することを特徴と
するデータベース検索システム。
【請求項３】上記量子化量算出手段で上記検索キーに
ついて複数の量子化量を算出し、上記検索対象の近傍特
徴量との合致度を求める検索手段を有することを特徴と
する請求項１または２のデータベース検索システム。
【請求項４】上記近傍データＣ _i,k が複数あることを
特徴とする請求項１〜３の何れか１項のデータベース検
索システム。
【請求項５】上記近傍データＣ _i,k は、ｋ個のデータ
列Ｃ _i,j+1, Ｃ _i,j+2,...., Ｃ _i,j+k であることを特徴と
する請求項１〜４の何れか１項のデータベース検索シス
テム。
【請求項６】物件毎の上記近傍特徴量と共に重みｗを
記憶することを特徴とする請求項１または２のデータベ
ース検索システム。
【請求項７】上記重みｗが１であることを特徴とする
請求項６のデータベース検索システム。
【請求項８】上記物件毎の合致度を上記検索キーの近
傍特徴量の完全一致度数で割った値を、物件毎の検索キ
ーの含有確率として算出する含有率算出手段を更に有す
ることを特徴とする請求項３のデータベース検索システ
ム。
【請求項９】上記検索対象の近傍特徴量を圧縮するデ
ータ圧縮手段を具備することを特徴とする請求項１のデ
ータベース検索システム。
【請求項１０】上記データ圧縮手段は、各物件毎に重
みｗが０でないものだけをデータ列として蓄積すること
を特徴とする請求項９のデータベース検索システム。
【請求項１１】上記近傍特徴量は、各物件中のデータ
の特定の一部のみを用いて生成された値であることを特
徴とする請求項１〜１０の何れか１項のデータベース検
索システム。
【請求項１２】上記近傍特徴量は、２バイト以上で構
成されたデータの内、少なくとも１バイトを用いて生成
された値であることを特徴とする請求項１１のデータベ
ース検索システム。
【請求項１３】上記近傍特徴量は、２バイトで構成さ
れたデータの内、下位１バイトを用いて生成された値で
あることを特徴とする請求項１１のデータベース検索シ
ステム。
【請求項１４】上記検索手段は、物件番号を合致度の
降順に出力することを特徴とする請求項３のデータベー
ス検索システム。
【請求項１５】上記検索手段は、物件番号とともに更
に合致度を出力することを特徴とする請求項３または１
４のデータベース検索システム。
【請求項１６】上記検索手段は、含有確率リストを確
率の降順に出力することを特徴とする請求項８のデータ
ベース検索システム。
【請求項１７】上記検索手段は、更に含有確率を出力
することを特徴とする請求項８または１６のデータベー
ス検索システム。
【請求項１８】検索キーに応じて検索対象の複数の物
件から情報を検索するためのデータベース検索方法であ
って、上記検索対象のｉ番目の物件のｊ番目のデータＣ
_i,j と、ｉ番目の物件内のデータＣ _i,j の近傍データＣ
_i,k とに基づいて複数の量子化量を算出し、近傍特徴量として上記複数の量子化量の組合わせを記憶
し、上記検索キーについて上記物件の量子化量を算出するの
と同じ処理を施して上記検索キーの複数の量子化量を算
出し、上記検索キーの複数の量子化量と上記近傍特徴量との合
致度を求めることを特徴とするデータベース検索方法。
【請求項１９】検索キーに応じて検索対象の複数の物
件から情報を検索するためのデータベース検索方法であ
って、上記検索対象のｉ番目の物件のｊ番目のデータＣ
_i,j と、ｉ番目の物件内のデータＣ _i,j の近傍データＣ
_i,k とに基づいて複数の量子化量を算出し、近傍特徴量として上記複数の量子化量をそれぞれ近傍特
徴量行列座標の各軸の要素値とする座標位置に上記物件
の物件番号を記憶し、上記検索キーについて上記物件の量子化量を算出するの
と同じ処理を施して上記検索キーの複数の量子化量を算
出し、上記検索キーの複数の量子化量と上記近傍特徴量との合
致度を求めることを特徴とするデータベース検索方法。
【請求項２０】上記物件毎の合致度を上記検索キーの
近傍特徴量の完全一致度数で割った値を、物件毎の検索
キーの含有確率として更に算出することを特徴とする請
求項１９のデータベース検索方法。
【請求項２１】請求項２０に記載のデータベース検索
方法において、更に含有確率リストを出力することを特
徴とするデータベース検索方法。