JP2000112973A - 空間インデックス方法及び空間インデックス処理プログラムを格納した媒体 - Google Patents

空間インデックス方法及び空間インデックス処理プログラムを格納した媒体

Info

Publication number
JP2000112973A
JP2000112973A JP10281782A JP28178298A JP2000112973A JP 2000112973 A JP2000112973 A JP 2000112973A JP 10281782 A JP10281782 A JP 10281782A JP 28178298 A JP28178298 A JP 28178298A JP 2000112973 A JP2000112973 A JP 2000112973A
Authority
JP
Japan
Prior art keywords
spatial
spatial data
index
data
spatial index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10281782A
Other languages
English (en)
Other versions
JP3938815B2 (ja
Inventor
Masajiro Iwasaki
雅ニ郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP28178298A priority Critical patent/JP3938815B2/ja
Publication of JP2000112973A publication Critical patent/JP2000112973A/ja
Application granted granted Critical
Publication of JP3938815B2 publication Critical patent/JP3938815B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 動的にオブジェクトを挿入することができる
ことを前提としつつ、検索速度を高速度化する。 【解決手段】 空間データを登録し、登録された空間デ
ータについて予め木構造をなすM−tree形式の空間
インデックス1を生成しておき、ユーザが指定した空間
データに類似する空間データを空間インデックス1を利
用して検索する。この場合、空間インデックス1の木構
造を構成する各ノードの領域を下位に存在するすべての
空間データを包含する領域とすることで、各ノード領域
間のオーバーラップを削除し、検索速度を高速化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、大量の画像特徴デ
ータからユーザが指定する画像特徴データに類似する特
徴を検索するような空間データの検索を高速化する空間
インデックス方法及び空間インデックス処理プログラム
を格納した媒体に関する。
【0002】
【従来の技術】近年、CPUの高速化及び一時/二次記
憶装置の大容量化により、画像を手軽に扱えるようにな
っただけでなく、ワールドワイドウェブ(WWW)やデ
ジタルカメラの普及により画像データを容易にパーソナ
ルコンピュータ等に取り込むことが可能となっている。
このため、我々の身の回りに大量の画像データが氾濫し
つつある。このため、近年、このような大量の画像デー
タからユーザが所望する画像を検索するための技術が要
望され、脚光を浴び始めている。
【0003】従来の画像検索では予め人手により画像に
属性情報を付与し、この属性情報をもとに検索する方法
が一般的であった。しかし、これでは画像データの急増
には対応することができない。そこで、近年、画像デー
タから自動的に特徴を抽出し、抽出された画像特徴をも
とに指定された画像に類似する画像を検索する類似画像
検索の研究が進められ、成果を収めている。
【0004】画像から抽出される特徴として代表的なも
のには、色(ヒストグラム)、テクスチャ、形状などが
ある。類似画像検索では、これらの画像特徴を予め画像
から抽出し保管しておく。そして、検索時には、指定さ
れた問い合わせ画像から同様に画像特徴を抽出し、すで
に抽出されている画像特徴と逐次比較(距離計算)を行
なうことで類似する画像を検索する。この方法では、画
像特徴の数が少ない場合には処理速度に問題がないが、
画像特徴が大量になると必然的に処理速度が遅くなって
しまう。そこで、画像特徴のインデックスを生成し検索
の高速化を図るというようなことが一般的に行なわれて
いる。
【0005】画像特徴として代表的であるヒストグラム
特徴では、類似度を計算する場合に、類似する色のビン
も考慮して類似度を求めなければならない。つまり、ヒ
ストグラムは、ビンで構成される多次元データで表現さ
れ、類似度の計算には多次元データの要素間の相関を考
慮した距離が利用される。多次元データということから
多次元空間インデックスを利用する方法が考えられる
が、多次元空間インデックスは一般にユークリッド空間
を前提としているため、相関を考慮した距離に応用する
ことは困難である。
【0006】そこで、距離空間インデックスの研究が進
められている。多次元インデックスでは多次元空間上で
のオブジェクトの座標値をもとにしてインデックスを生
成するのに対し、距離空間インデックスでは距離のみに
基づいてインデックスを生成する。つまり、距離空間イ
ンデックスは、オブジェクトの座標はまったく関知せ
ず、オブジェクト間の距離のみによってインデックスを
生成する。したがって、相関を考慮した距離でも問題な
くインデックスを生成することが可能となる。
【0007】ここで、距離空間インデックスによる類似
画像検索の手法について説明する。まず、Oを画像、F
(O)を特徴抽出関数、画像特徴をX={X1 ,X2
3,……,Xn }とすると、X=F(O)であり、画
像間の距離(類似度)は、D(F(Oa),F(O
b))と表される。類似画像検索では、指定した問い合
わせ画像に類似する画像を検索する。つまり、問い合わ
せ画像と各画像との距離を算出し、距離が小さい画像を
検索結果とする。なお、検索の指定方法としては、次の
二つがある。 ・範囲指定検索(range query) 検索範囲を示す円の中心オブジェクト(問い合わせオブ
ジェクト)Oq及び半径Rqを指定し、D(Oq,O)
≦Rqを満足するオブジェクトの集合を求める方法であ
る。 ・件数指定検索(k−nearest neighbor query) 検索の中心オブジェクトOq及び検索結果kを指定して
Oqとの距離D(Oq,O)が小さい順に上位k件のオ
ブジェクトOの集合を求める方法である。
【0008】類似画像検索では、類似する尺度を表す距
離定義が重要となる。代表的な特徴間の距離として、次
式で表される距離がある。 De(F(X),F(Y))={Σ(X−Y)k1/k この距離は、k=2のときにはユークリッド距離であ
り、K=1のときには市街区距離となる。しかし、色の
ヒストグラム特徴では、各特徴間の相関を考慮する必要
があるため、以下のヒストグラム距離が提案されてい
る。 Dh(F(X),F(Y))=(X−Y)TA(X−Y) 次いで、距離空間インデックスとしては、M−tree
やvp−treeがある。
【0009】M−treeは、例えば、「M-tree: An E
fficient Access Method for Similarity Search in Me
tric Spaces」(Proc. of the 23rd VLDB Conf. Athen
s, Greece, 1997)に示されているような空間インデッ
クスである。このようなM−treeにおいては、M−
treeの各ノードNは中心オブジェクトOと半径とに
よって形成され、ノードNは複数の子ノードnを有す
る。図12に示すように、ノードNの円は子ノードnの
円を完全に包囲し、ノードNの円は必ずいずれかの子ノ
ードnの円に接する。M−treeでは、各ノードNが
中心オブジェクトOとノードNに属するすべての子ノー
ドnの円を包含する円の半径を保持する。さらに、各ノ
ードNは、中心オブジェクトOと親ノードNの中心オブ
ジェクトOとの間の距離を持つ。この距離により、三角
不等式に基づいて検索時に距離計算回数を削減すること
ができる。
【0010】一方、vp−treeは、「Uhlmann, J.
K., Satisfying general proximity/similarity querie
s with metric trees, Information Procedding Letter
s 40, pp. 175-179, 1991」や「Yianilos, P. N., Data
Structure and Algorithmsfor Nearest Neighbor Sear
ch in General Metric Spaces, ACM-SIAM Symp. onDisc
rete Algorithms, pp. 311-321, 1993」等に示されてい
るような空間インデックスである。このようなvp−t
reeでは、各ノードの空間はひとつの中心オブジェク
ト(vantage point)と分割円(二次元空間ではないの
で実際には円ではないが、説明の都合上円と表す)とに
よって順次分割される。検索時には、ルートノードから
辿り、問い合わせオブジェクトが中心オブジェクトと半
径とによって分割されている領域のいずれに属するかを
判断し、辿るべき子ノードを決定する。これを繰り返す
ことで、検索範囲に適合するリーフを探す。
【0011】距離空間インデックスの検索処理に占める
時間は二次記憶へのアクセス時間は勿論のこと、距離計
算時間が大きな割合を占める。特に、ヒストグラム距離
のように相関を考慮した距離の場合には増大する。した
がって、距離計算の回数を減らすことが大きな課題とな
っている。
【0012】vp−treeでは、一つの中心オブジェ
クトに対して複数の分割円を設定した分岐とすること
で、中心オブジェクトからの距離を一回計算するだけで
複数のノード領域のいずれに属するかを判断することが
でき、距離計算回数を減らすことができる。しかし、画
像特徴の場合には、空間を一つの中心オブジェクトのみ
で数多く分割しても各領域はきわめて細いリング状にな
るため、検索時にすべての分割領域が検索範囲と交差し
てしまい、分割の意味が薄れてしまう傾向がある。
【0013】
【発明が解決しようとする課題】以上述べた空間距離イ
ンデックスのうち、vp−treeは、静的にインデッ
クスを生成するアルゴリズムであり、インデックスを構
築した後にオブジェクトを追加登録したり削除したりす
るというような操作ができないという問題がある。ま
た、前述したように、画像特徴の検索に適用した場合、
空間を一つの中心オブジェクトのみで数多く分割しても
各領域はきわめて細いリング状になるため、検索時にす
べての分割領域が検索範囲と交差してしまい、充分な検
索速度を得ることができないという問題もある。さら
に、空間を一つの中心オブジェクトで数多く分割すると
いう構造上、単一の空間での検索にしか対応することが
できないという問題もある。
【0014】一方、前述したM−treeによれば、動
的にオブジェクトの挿入をすることができる。しかしな
がら、各ノード領域は子ノードの領域を包含するため
に、各ノード領域が大きくなりすぎる傾向がある。した
がって、兄弟ノード同士の領域のオーバーラップが大き
くなり、その結果、検索時に木構造を辿る場合の分別率
が悪くなり、その結果、多くの子ノードを辿ることとな
るために検索速度が低下してしまうという問題がある。
また、各ノードは、親ノードとの距離を予め保持するこ
とで、検索時に距離計算回数をある程度押さえることが
できるが、これも充分とはいえない。さらに、vp−t
ree同様、単一の空間での検索にしか対応することが
できないという問題もある。
【0015】本発明の目的は、動的にオブジェクトを挿
入することができることを前提としつつ、検索速度を高
速度化することである。
【0016】本発明の別の目的は、複数空間での検索に
対応することができる空間インデックス構造を得ること
である。
【0017】
【課題を解決するための手段】請求項1記載の発明は、
空間データを登録し、登録された前記空間データについ
て予め木構造をなすM−tree形式の空間インデック
スを生成しておき、ユーザが指定した前記空間データに
類似する前記空間データを前記空間インデックスを利用
して検索するようにした空間インデックス方法におい
て、前記空間インデックスの木構造を構成する各ノード
の領域にそれらのノードの下位に存在するすべての空間
データを包含させるようにした。
【0018】請求項2記載の発明は、請求項1記載の空
間インデックス方法の発明において、前記空間データの
削除によって前記空間データに属していたリーフノード
の領域が狭められた場合、そのすべての上位ノードの領
域を狭め、その上位ノードの領域にその下位ノードの領
域が包含されるようにした。
【0019】請求項3記載の発明は、請求項1記載の空
間インデックス方法の発明において、空間データの削除
によってノードの領域がその下位ノードに属する空間デ
ータを包含する領域よりも大きくなったことを示すフラ
グを前記ノード毎に設け、最少領域より大きくなった前
記ノードの数が特定の基準値を超えた場合に空間インデ
ックスを再構成するようにした。
【0020】請求項4記載の発明は、空間データを登録
し、登録された前記空間データについて予め木構造をな
すM−tree形式の空間インデックスを生成してお
き、ユーザが指定した前記空間データに類似する前記空
間データを前記空間インデックスを利用して検索するよ
うにした空間インデックス方法において、空間インデッ
クスの木構造を構成する各ノードとそれらの親ノード及
び兄弟ノードとの間の距離を予め保持するようにした。
【0021】請求項5記載の発明は、空間データを登録
し、登録された前記空間データについて予め木構造をな
すM−tree形式の空間インデックスを生成してお
き、ユーザが指定した前記空間データに類似する前記空
間データを前記空間インデックスを利用して検索するよ
うにした空間インデックス方法において、異なる種別の
前記空間データに対して各種別単位でそれぞれ前記空間
インデックスを生成し、前記空間データの各種別に重み
付けをして検索を行なうようにした。
【0022】請求項6記載の発明は、請求項5記載の空
間インデックス方法の発明において、個々の前記空間イ
ンデックスに基づく検索結果から距離に関するスコアの
小さいものから順に最終スコアを算出し、算出したスコ
アの個々の空間の最大スコアを合計した値よりも小さい
最終スコアのオブジェクトのランキングを順次確定する
ようにした。
【0023】請求項7記載の発明は、空間データを登録
し、登録された前記空間データについて予め木構造をな
すM−tree形式の空間インデックスを生成してお
き、ユーザが指定した前記空間データに類似する前記空
間データを前記空間インデックスを利用して検索するよ
うにした空間インデックス方法において、コンピュータ
に読み込まれ、前記空間インデックスの木構造を構成す
る各ノードの領域にそれらのノードの下位に存在するす
べての空間データを包含させるような機能をコンピュー
タに実行させるプログラムが格納されたコンピュータ読
み取り可能な記録媒体である。
【0024】請求項8記載の発明は、前記空間データの
削除によって前記空間データに属していたリーフノード
の領域が狭められた場合、そのすべての上位ノードの領
域を狭め、その上位ノードの領域にその下位ノードの領
域が包含されるような機能をコンピュータに実行させる
ようにした請求項7記載のコンピュータ読み取り可能な
記録媒体である。
【0025】請求項9記載の発明は、空間データの削除
によってノードの領域がその下位ノードに属する空間デ
ータを包含する領域よりも大きくなったことを示すフラ
グを前記ノード毎に設け、最少領域より大きくなった前
記ノードの数が特定の基準値を超えた場合に空間インデ
ックスを再構成するような機能をコンピュータに実行さ
せるようにした請求項7記載のコンピュータ読み取り可
能な記録媒体である。
【0026】請求項10記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすM−tree形式の空間インデックスを生成してお
き、ユーザが指定した前記空間データに類似する前記空
間データを前記空間インデックスを利用して検索するよ
うにした空間インデックス方法において、コンピュータ
に読み込まれ、空間インデックスの木構造を構成する各
ノードとそれらの親ノード及び兄弟ノードとの間の距離
を予め保持するような機能をコンピュータに実行させる
プログラムが格納されたコンピュータ読み取り可能な記
録媒体である。
【0027】請求項11記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすM−tree形式の空間インデックスを生成してお
き、ユーザが指定した前記空間データに類似する前記空
間データを前記空間インデックスを利用して検索するよ
うにした空間インデックス方法において、コンピュータ
に読み込まれ、異なる種別の前記空間データに対して各
種別単位でそれぞれ前記空間インデックスを生成し、前
記空間データの各種別に重み付けをして検索を行なうよ
うな機能をコンピュータに実行させるプログラムが格納
されたコンピュータ読み取り可能な記録媒体である。
【0028】請求項12記載の発明は、個々の前記空間
インデックスに基づく検索結果から距離に関するスコア
の小さいものから順に最終スコアを算出し、算出したス
コアの個々の空間の最大スコアを合計した値よりも小さ
い最終スコアのオブジェクトのランキングを順次確定す
るような機能をコンピュータに実行させるようにした請
求項11記載のコンピュータ読み取り可能な記録媒体で
ある。
【0029】請求項13記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、前記空間イ
ンデックスは追加された空間データを動的に追加する。
【0030】請求項14の発明は、請求項13記載の空
間インデックス方法の発明において、リーフノードとこ
のリーフノードに属する空間データとの距離をそのリー
フノードに保持し、検索時にその距離を利用することで
前記空間データが検索されるべきデータか否かを前記空
間インデックスにアクセスすることなく判断するように
した。
【0031】請求項15記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、異なる種別
の前記空間データに対して各種別単位でそれぞれ前記空
間インデックスを生成し、個々の前記空間インデックス
から所定の検索数を検索してバッファリングした後にこ
れらの結果をマージして検索結果を求めるという処理を
指定された検索結果数まで繰り返し、前記空間データの
各種別に重み付けをして検索を行なうようにした。
【0032】請求項16記載の発明は、請求項15記載
の空間インデックス方法の発明において、バッファリン
グされた検索数のうちスコアの増加量が多い前記空間イ
ンデックスを優先的に処理するようにした。
【0033】請求項17記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、異なる種別
の前記空間データに対して各種別単位でそれぞれ前記空
間インデックスを生成し、個々の前記空間インデックス
の検索結果において未処理の最上位及び次に位置するオ
ブジェクト間の距離に関するスコアの増加量が多いもの
から順にスコアを算出し、次の順位の最大スコアをそれ
ぞれ合計した値を最大確定スコアとし、その最大確定ス
コアより小さい最終スコアのオブジェクトの順位を順位
確定することで、前記空間データの各種別に重み付けを
して検索を行なうようにした。
【0034】請求項18記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、異なる種別
の前記空間データに対して各種別単位でそれぞれ前記空
間インデックスを生成し、前記空間データの各種別に付
けられた重み付けを等分に設定し、複数の前記空間デー
タを統合して単一の空間インデックスを生成し、指定さ
れた重み付けに従い生ずる不確定部分を包含する範囲を
インデックスで検索し、重み付けによる最終スコアを算
出して順位付けを行なうことにより前記空間データの各
種別に重み付けをして検索を行なうようにした。
【0035】請求項19記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、コンピュー
タに読み込まれ、前記空間インデックスは追加された空
間データを動的に追加するような機能をコンピュータに
実行させるプログラムが格納されたコンピュータ読み取
り可能な記録媒体である。
【0036】請求項20記載の発明は、リーフノードと
このリーフノードに属する空間データとの距離をそのリ
ーフノードに保持し、検索時にその距離を利用すること
で前記空間データが検索されるべきデータか否かを前記
空間インデックスにアクセスすることなく判断するよう
な機能をコンピュータに実行させるようにした請求項1
9記載のコンピュータ読み取り可能な記録媒体である。
【0037】請求項21記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、コンピュー
タに読み込まれ、異なる種別の前記空間データに対して
各種別単位でそれぞれ前記空間インデックスを生成し、
個々の前記空間インデックスから所定の検索数を検索し
てバッファリングした後にこれらの結果をマージして検
索結果を求めるという処理を指定された検索結果数まで
繰り返し、前記空間データの各種別に重み付けをして検
索を行なうような機能をコンピュータに実行させるプロ
グラムが格納されたコンピュータ読み取り可能な記録媒
体である。
【0038】請求項22記載の発明は、バッファリング
された検索数のうちスコアの増加量が多い前記空間イン
デックスを優先的に処理するような機能をコンピュータ
に実行させるようにした請求項21記載のコンピュータ
読み取り可能な記録媒体である。
【0039】請求項23記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、コンピュー
タに読み込まれ、異なる種別の前記空間データに対して
各種別単位でそれぞれ前記空間インデックスを生成する
機能と、個々の前記空間インデックスの検索結果におい
て未処理の最上位及び次に位置するオブジェクト間の距
離に関するスコアの増加量が多いものから順にスコアを
算出する機能と、次の順位の最大スコアをそれぞれ合計
した値を最大確定スコアとし、その最大確定スコアより
小さい最終スコアのオブジェクトの順位を順位確定する
ことで、前記空間データの各種別に重み付けをして検索
を行なうような機能とをコンピュータに実行させるプロ
グラムが格納されたコンピュータ読み取り可能な記録媒
体である。
【0040】請求項24記載の発明は、空間データを登
録し、登録された前記空間データについて予め木構造を
なすvp−tree形式の空間インデックスを生成して
おき、ユーザが指定した前記空間データに類似する前記
空間データを前記空間インデックスを利用して検索する
ようにした空間インデックス方法において、コンピュー
タに読み込まれ、異なる種別の前記空間データに対して
各種別単位でそれぞれ前記空間インデックスを生成する
機能と、前記空間データの各種別に付けられた重み付け
を等分に設定し、複数の前記空間データを統合して単一
の空間インデックスを生成する機能と、指定された重み
付けに従い生ずる不確定部分を包含する範囲をインデッ
クスで検索し、重み付けによる最終スコアを算出して順
位付けを行なうことにより前記空間データの各種別に重
み付けをして検索を行なうような機能とをコンピュータ
に実行させるプログラムが格納されたコンピュータ読み
取り可能な記録媒体である。
【0041】
【発明の実施の形態】本発明の第1の実施の形態を図1
ないし図8に基づいて説明する。本実施の形態は、木構
造をなすM−tree形式の空間インデックスへの適用
例である。 [構成]図1は、空間インデックスを利用した空間デー
タ管理システムの構成を示す模式図である。図1に示す
ように、空間インデックス1に登録部2と検索部3とが
接続されている。これらは、実際には、図示しないマイ
クロコンピュータによって実現される。登録部2には、
例えば画像特徴データのような空間データ4を格納する
メモリ装置か接続され、検索部3には、検索空間データ
5及び類似空間データ6を構成するメモリ装置が接続さ
れている。つまり、このようなシステムは、図示しない
CPUやメモリ装置等を主体として構成されるハードウ
ェアと、このハードウエアの一部であり、空間インデッ
クス1や空間データ4等のような空間データを登録及び
検索目的で格納するメモリ領域と、ハードウエアのシス
テムを構築するオペレーティングシステムのようなシス
テムソフトウエアと、ハードウエアに各種処理を実行さ
せるアプリケーションプログラムとによって構築されて
いる。アプリケーションプログラムは、コンピュータ読
み取り可能な媒体、例えば、ハードディスクやCD−R
OM等に格納されている。
【0042】次いで、図2は、空間インデックス1の構
造を示す模式図である。つまり、空間インデックスは、
図2に例示するような木構造をしている。そして、各ノ
ードNは中心点Oと半径とによって形成され、このよう
なノードNは複数の子ノードnを有する。図3は、空間
インデックス1を図2とは異なる視点から見た模式図で
ある。図3に示すように、各ノードNの領域は、下位に
属する空間データを包含し、いずれかの空間データに必
ず接する。ここで、図12に例示した従来のM−tre
eとの相違として、従来のM−treeでは、ノードN
の円は子ノードnの円を完全に包含し、ノードNの円は
必ずいずれかの子ノードnの円に接しているのに対し、
本実施の形態の空間インデックス1では、従来との比較
においてノード領域間のオーバーラップが明らかに少な
い。したがって、検索時に辿る枝の数が減少し、検索処
理の高速化が図られる。 [データ構造]図4は、空間インデックス1の木構造を
なすデータ構造を示す模式図である。木構造は、ノード
データと個々の空間データ(以下、オブジェクトと呼
ぶ)を保持し、オブジェクトはエントリとしてリーフノ
ード(最先端のノード)にリンクされている。図4中、
Nがノードであり、Eがエントリである。
【0043】ノードNは、次のデータからなる。 ・ノードID ・ノード種別(リーフノードか否か) ・子ノードのノードID(リーフノードの場合にはエン
トリID) ・親ノードのID ・すべての兄弟ノードの中心との距離 ・中心オブジェクト ・半径 ・親ノードの中心オブジェクトと当ノードの中心オブジ
ェクトとの距離 ・ノード半径不適合フラグまた、ノードテーブルのプロ
フィル情報として、以下のデータを持つ。 ・ルートノードID ・Fanout(子ノードの数)の最大値/最小値 ・中心ポイントのオブジェクトのサイズ ここで、「すべての兄弟ノードの中心との距離」を事前
にノードに設定しておくことにより、距離計算の回数を
削減することができ、検索速度を向上させることができ
る。また、「ノード半径不適合フラグ」は、ノード半径
が適切な半径を示しているか否かを示すフラグである。
【0044】エントリEは、次のデータからなる。 ・エントリID ・オブジェクト ・親ノードの中心オブジェクトとオブジェクトとの距離 また、エントリテーブルのプロファイル情報として、以
下の情報を持つ。 ・オブジェクトのサイズ 図5は、図4に示す空間インデックス1の木構造をなす
データ構造を格納する二次記憶のデータ構造を示す模式
図である。図5に示すように、空間インデックス1は、
画像IDテーブルとエントリテーブルとノードテーブル
とからなる。IDテーブルは、オブジェクト名とIDと
を対応つけている。エントリテーブルは、各オブジェク
トデータを保持している。ノードテーブルは、各ノード
データを保持している。そして、個々のテーブルは、Sp
ace Page クラスというページ管理クラスを承継してい
る。
【0045】図6は、図5に示す各テーブルの基本とな
るSpace Page クラスのデータ構造を示す模式図であ
る。各ページが、前述の各IDやノードNやエントリE
に対応している。各ページの先頭には削除フラグ7があ
り、そのページが削除されているか否かを示している。
そのページが削除されている場合には削除リスト8に加
えられ、削除フラグ7が次の削除ページの番号を示すこ
とになる。なお、SpacePage クラスのデータ構造は、デ
ータ数9及びデータサイズ10の領域も含んでいる。 [登録処理]新たなオブジェクトを登録するアルゴリズ
ムを次に示す。このアルゴリズムによって図2に例示す
るような木構造が構築され、このアルゴリズム中の( *
1)で示す部分でノードNの半径が設定され、前述のよ
うに、オブジェクトを包含するノード領域が設定され
る。
【0046】
【数1】 但し、上記アルゴリズム中、 Nc:子ノードの中心点 Nr:子ノードの半径 Oc:オブジェクトの中心点 D(a,b):a,b間の距離
【0047】
【数2】 Splite()中のオブジェクト集合を2分するアルゴリズム
は、現状では計算コストが比較的少ない次のようなアル
ゴリズムを採用しいている。まず、ランダムに選んだオ
ブジェクトから最遠にあるオブジェクトを一つ目の集合
の中心オブジェクトとする。そして、その中心オブジェ
クトから最遠にあるオブジェクトを二つ目の中心オブジ
ェクトとする。さらに、すべてのオブジェクトを近い方
の中心オブジェクトに振り分けて集合を二分する。な
お、上記アルゴリズム中、( *2)の部分において、兄
弟ノードとの距離を設定することで、検索時に距離計算
回数を削減することができる。
【0048】なお、以上のアルゴリズムの他にも、多様
なアルゴリズムを利用することが可能である。 [検索処理]以下に、従来のM−treeの検索アルゴ
リズムの一例を示す。検索時には、検索中心点と半径と
によって指定される検索領域が入力となる。従来のM−
treeの検索アルゴリズムでは、基本的には、ノード
領域と検索領域とが交わるノードNを辿っていき検索領
域に包含されるオブジェクトを検索するのであるが、一
般に、距離計算に時間がかかるので、距離計算の回数を
削減することが検索速度の高速化につながる。
【0049】M−treeでは、距離d(Pc,Nc)
やd(Pc,Oc)は、ノードやエントリに予め設定さ
れているデータなので、( *4)( *6)を計算せずと
も適合しないノードNまたはエントリEであることを判
断することができる場合がある。( *3)( *5)によ
って交差しない判断をしているが、その理屈は図7に示
すとおりである。つまり、( *3)の式を満足しなけれ
ば、図7より、QとNとは交差しないことが明白であ
る。
【0050】
【数3】
【0051】但し、 Pc:カレントノードの中心点 Nc:子ノードの中心点 Qc:検索の中心点 Nr:子ノードの半径 Qr:検索の半径 Oc:オブジェクトの中心点 d(a,b):a,b間の距離 しかし、本実施の形態では、兄弟ノード間の距離も予め
求めておくことによって、さらに、距離計算回数を削減
して検索速度を向上させることができる。そのアルゴリ
ズムを以下に示す。( *7)で、d(Nc´,Nc)を
計算するので、Nの中心座標を中心とし、Nと未だ検索
対象から除外されていない任意の兄弟ノードのN´とが
交差するか否かを( *8)で判定する(図7中でのPを
N、NをN´に置き換えて考えることができる)。式中
のd(Nc´,Nc)は、ノード中に予め設定されてい
るので、距離計算する必要がない。このようにして距離
計算を削除することが可能である。
【0052】
【数4】 但し、 Pc:カレントノードの中心点 Nc:子ノードの中心点 Qc:検索の中心点 Nr:子ノードの半径 Qr:検索の半径 Oc:オブジェクトの中心点 d(a,b):a,b間の距離 [削除処理]オブジェクトを削除するアルゴリズムを以
下に示す。削除をするには、本来、個々のノードNに属
すオブジェクトとノードNの中心との距離を計算しなけ
ればならないが、この処理には多くの時間がかかり、処
理が極めて遅い。そこで、処理の高速化のため、ノード
の半径の修正が必要な場合にはその属するすべてのオブ
ジェクトを包含するのではなく、個ノードnの領域を包
含する領域の半径を設定するようにしている。
【0053】
【数5】 このようにすることによって、削除処理の低速化が防止
される。また、個のアルゴリズムにより、本来設定され
るべき領域半径よりも大きい領域半径が設定されたノー
ド( *9)には、ノード半径不適合フラグが設定され
る。ノード半径不適合フラグがセットされているノード
Nが多ければ多いほど、ノードNのオーバーラップが大
きくなり、検索速度が遅くなる。そこで、本実施の形態
では、ノード半径不適合フラグが全ノードNのある基準
値以上の割合に達した場合には、自動的に木構造を再構
築することにより、検索速度の低下を避けるようにして
いる。ここで、ある基準というのは、例えば、50%と
いうように、アプリケーションによって適宜設定すれば
良い。 [複数空間インデックスの検索]画像検索といったアプ
リケーションを考えた場合、空間データとしては色特徴
やテクスチャ特徴といったように複数空間データを扱う
必要があり、かつ、個々の特徴(空間)単位に重み付け
を設定して検索する必要がある。このような場合には、
個々の空間単位に予め前述の空間インデックス1を生成
しておく。個々の空間単位の重み付けを指定して検索す
るアルゴリズムを以下に示す。検索の入力は、検索の中
心点と上位何位までを結果とするか、すなわち、結果の
個数である。
【0054】
【数6】
【0055】図8には、3つの空間に対する上記のアル
ゴリズムによる検索の様子を示す。Nを6として個々の
空間を検索した結果が左の3つのテーブルである。検索
結果のスコアはすでに正規化されているものとする。個
々のスコアの小さいものから順に(左番号順)最終スコ
アが計算され、右側の総合順位テーブルに順位付けされ
る。図8(a)の段階では確定最大スコアが19であ
り、総合順位でこれを下回る最終スコアがないので確定
できる順位はない。さらに続けて小さいものから順に6
番目まで計算したのが図9(b)である。この段階で、
確定最大スコアが31になるので総合順位の1位が確定
する。同様に、9位まで算出したのが図9(c)であ
る。この段階で、総合順位の2位までが確定する。この
ように操作を繰り返し、指定された順位までが確定する
と、検索が終了する。
【0056】本発明の第2の実施の形態を図9ないし図
11に基づいて説明する。本実施の形態は、木構造をな
すvp−tree形式の空間インデックスへの適用例で
ある。なお、第1の実施の形態と同一部分は同一符号で
示し説明も省略する。 [構成]図1に示すような基本構造は第1の実施の形態
と共通である。
【0057】空間インデックス1は、従来のvp−tr
eeと同様に、図2のように空間を分割する。全空間
は、R1で示される分割円により分割され、それぞれが
ルートノードの子ノードとなる。このようにして2分岐
の木構造が生成され、空間は分割されていく。分割され
た最下位のノード(リーフノード)には、空間データが
リンクされている。 [データ構造]図10は、空間インデックス1の木構造
をなすデータ構造を示す模式図である。木構造は、ノー
ドデータと個々の空間データ(以下、オブジェクトと呼
ぶ)を保持し、オブジェクトはエントリとしてリーフノ
ード(最先端のノード)にリンクされている。図9中、
Nがノードであり、Eがエントリである。
【0058】ノードNは、次のデータからなる。 ・ノードID ・ノード種別(リーフノードか否か) ・子ノードのノードID(リーフノードの場合にはエン
トリID) ・分割円の中心ポイントデータ ・分割円の半径 ・各エントリと分割円の中心ペイントとの距離(リーフ
のノードの場合)また、ノードテーブルのプロフィル情
報として、以下のデータを持つ。 ・ルートノードID ・リーフノードの子ノードの数の最大値 ・中心ポイントのオブジェクトのサイズ エントリEは、次のデータからなる。 ・エントリID ・オブジェクト また、エントリテーブルのプロファイル情報として、以
下の情報を持つ。 ・オブジェクトのサイズ vp−treeでは、空間データが予め与えられてお
り、vp−treeはこのような木構造インデックスを
静的に生成するアルゴリズムである。したがって、後に
空間データ(オブジェクト)を追加することができな
い。そこで、本実施の形態では、以下のように登録を行
なうことで、動的に空間データの登録を可能としてい
る。
【0059】
【数7】 ここで、ノードを分割する一例を以下に示す。分割円の
中心ポイントを選択する方法として単純に任意のポイン
トとしたり、分割円が最も小さくなるようなポイントを
選択したりなど、いろいろなアルゴリズムが考えられ
る。
【0060】
【数8】 このようにすることで、動的に空間データを登録するこ
とができる。削除時には、以下のような処理を行なう。
【0061】
【数9】 次いで、指定オブジェクトに類似する検索結果を指定個
数だけ繰り返す検索のアルゴリズムを以下に示す。検索
処理の時間の多くは距離計算(類似度算出)であり、距
離計算の回数を減らすことで検索の高速化が実現され
る。 *1で示される判定では、オブジェクトを獲得せず
に、かつ、個々のオブジェクトとの距離計算なしに判定
が可能であり、 *2では、オブジェクトを獲得し、か
つ、距離計算をしなければ判定をすることができない。
そこで、 *1で示される条件判定により、 *2の判定を
せずにその判定を行なうことができる場合があり、これ
によって検索の高速化が可能である。なお、Search()を
呼び出すときのQrの初期値は、無限大とする。
【0062】
【数10】 但し、 Pc:カレントノードの中心点 Qc:検索の中心点 Nr:子ノードの半径 Qr:検索の半径 Oc:オブジェクトの中心点 d(a,b):a,b間の距離 [複数空間インデックスの検索]画像検索といったアプ
リケーションを考えた場合、空間データとしては色特徴
やテクスチャ特徴といったように複数空間データを扱う
必要があり、かつ、個々の特徴(空間)単位に重み付け
を設定して検索する必要がある。このような場合には、
個々の空間単位に予め前述の空間インデックス1を生成
しておく。個々の空間単位の重み付けを指定して検索す
るアルゴリズムを以下に示す。検索の入力は、検索の中
心点と上位何位までを結果とするか、すなわち、結果の
個数である。
【0063】検索前に個々のインデックスに対し、検索
結果をいくつにすれば良いか判断することはできない。
したがって、個々のインデックスに対し、特定の検索個
数(例えば、ユーザが指定した検索数)だけ検索し、検
索された結果をバッファリングし、最終結果のマージ処
理を行なう。この処理を繰り返すことで、無駄に大量の
データを検索することなく、高速に複数インデックスの
検索を行なうことが可能となる。
【0064】上記のように各空間毎に求めた検索結果に
ついて順位の最終検索スコアを求め総合順位のリストに
加えていく。ここで、既に求めた順位の次の順位にあた
るオブジェクトのスコアを各空間について合計した値よ
りも、これから処理するオブジェクトのスコアのほうが
大きいことはありえない。そこで、この合計スコアを順
位確定スコアとし、このスコアより小さい総合順位のオ
ブジェクトは最終順位を確定することができる。したが
って、スコアをできるだけ早く増加させるほど、順位を
早く確定することができ、検索速度を向上させることが
できる。そこで、順位間の差分が多い空間を選択し、処
理する。具体的なアルゴリズムは次の通りである。
【0065】
【数11】 図11に、3つの空間に対して上記アルゴリズムを用い
て行なった検索の結果を示す。Nを6として個々の空間
を検索した結果が左の3つのテーブルである。検索結果
のスコアは重み付けに従い既に正規化されているとす
る。図11(a)は、網掛けの部分まで処理が終わった
状態を示す。円で囲まれた差分のうち最も大きい空間A
が次の処理対象となる。空間Aの順位2位の最終スコア
を計算し総合順位に加える。空間Aの3位のオブジェク
トは既に最終スコアを算出済みなので、処理済みとす
る。その結果、図11(b)のような状態となる。さら
に、差分が最も大きいオブジェクトが空間Bなので、空
間Bの順位2位を処理した結果が図11(c)の状態で
ある。
【0066】登録されているデータの量が多くなると各
空間の検索結果のスコアが同じとなる場合が頻繁に起こ
るようになる。そういった場合には、差分がすべて同じ
になる可能性が高いので、空間を選択することができな
くなる。そこで、差分が同じになった場合には、検索バ
ッファの先頭と最後尾とのオブジェクトのスコアの差分
が最も大きい空間を選択し、処理することとする。ミク
ロ的には差分が同じでも、マクロ的には差分が異なるの
で、マクロ的に見ることによって検索の効率を上げるこ
とができる。
【0067】複数インデックスを検索するよりも一つの
インデックスを検索するほうが早いが、インデックスを
生成するときに重み付けを指定しなければならないの
で、検索時にインデックス生成時と異なる重み付けを指
定することが一般にできなくなる。検索時に指定された
重み付けによって生じる不確定部分を包含する範囲でイ
ンデックスを検索し、最終スコアにより順位付けを行な
うことで検索を行なうことにより、1インデックスによ
り複数空間の検索が可能となる。
【0068】但し、特定の空間の重み付けが小さくなれ
ばなるほど不確定部分が大きくなるので、検索範囲が広
くなる。その結果、検索速度が低下してしまう。しか
し、インデックス生成時の重み付けに近い範囲で重み付
けを変更する分には複数のインデックスにより検索する
場合よりも高速に検索することができる。
【0069】インデックス生成時には、例えば、等分の
重み付け(33:33:33)でインデックスを生成す
る。インデックス検索時には、以下のアルゴリズムによ
り検索する。 *3では、以下のようにQrを設定する。
【0070】
【数12】 なお、Search()を呼び出すときのQrの初期値は無限大
とする。
【0071】
【数13】 但し、 Pc:カレントノードの中心点 Qc:検索の中心点 Nr:子ノードの半径 Qr:検索の半径 Oc:オブジェクトの中心点 d(a,b):インデックス生成時の重み付けによる
a,b間の距離
【0072】
【発明の効果】請求項1ないし3及び7ないし9記載の
発明は、空間インデックスの木構造を構成する各ノード
の領域が下位に存在するすべての空間データを包含する
領域となるので、ノードの領域間のオーバーラップが削
除され、検索速度を高速化することが可能となる。ま
た、オブジェクトの削除により、オーバーラップが増加
した場合には、自動的に再度空間インデックスを構築し
なおすことができるので(請求項3)、検索速度の低下
を防止することができる。
【0073】請求項4及び10記載の発明は、空間イン
デックスの木構造を構成する各ノードは親ノードとの距
離だけでなくすべての兄弟ノードとの間の距離を予め保
持するので、検索時に距離計算回数を削減し、検索速度
の高速化を図ることができる。
【0074】請求項5及び6並びに11及び12記載の
発明は、複数の空間種別に対し、検索時に空間単位で重
み付けを指定して検索する場合、予め個々の空間単位に
空間インデックスを生成しておき、個々の空間インデッ
クスから検索した結果に基づいて個々の距離スコアの小
さいものから順に最終スコアを算出し、同時に、既に算
出したスコアの個々の空間の最大スコアを合計した値よ
りも小さい最終スコアのオブジェクトのランキングを順
次確定することで、複数の空間インデックスに対しても
検索速度を高速化することができる。
【0075】請求項13及び19記載の発明は、追加オ
ブジェクトを適合するリーフノードにリンクし、必要に
応じて動的にノードを分割することにより、動的にイン
デックスの追加を行なうことができる。同様に、削除も
可能である。
【0076】請求項14及び20記載の発明は、リーフ
ノードにオブジェクトとの距離情報を加えることで、距
離の比較回数を減少させて検索の高速化を図ることがで
きる。
【0077】請求項16及び22記載の発明は、インデ
ックスを空間単位に生成し、それぞれの検索結果をマー
ジすることにより、重み付きで複数の空間を検索するこ
とができる。
【0078】請求項17及び18並びに23及び24記
載の発明は、検索時の重み付けの設定がインデックス生
成時の重み付けと大きく異ならない場合には、複数の空
間の重み付けを予め設定して一つのインデックスを生成
し、検索時に指定された重み付けで複数インデックスよ
りも高速に検索することが可能である。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における空間インデ
ックスを利用した空間データ管理システムの構成を示す
模式図である。
【図2】空間インデックスの構造を示す模式図である。
【図3】空間インデックスを図2とは異なる視点から見
た模式図である。
【図4】空間インデックスの木構造をなすデータ構造を
示す模式図である。
【図5】図4に示す空間インデックスの木構造をなすデ
ータ構造を格納する二次記憶のデータ構造を示す模式図
である。
【図6】図5に示す各テーブルの基本となるSpace Page
クラスのデータ構造を示す模式図である。
【図7】所定の計算することなく適合しないノードNま
たはエントリEであることを判断することができる理屈
を示すための模式図である。
【図8】3つの空間に対して各空間単位で重み付けを指
定して検索するアルゴリズムを実行する際の処理過程を
示す模式図である。
【図9】本発明の第2の実施の形態として、空間インデ
ックスの構造を示す模式図である。
【図10】空間インデックスの木構造をなすデータ構造
を示す模式図である。
【図11】3つの空間に対して各空間単位で重み付けを
指定して検索するアルゴリズムを実行する際の処理過程
を示す模式図である。
【図12】従来の空間インデックスとしてM−tree
の構造を例示する模式図である。
【符号の説明】
1 空間インデックス N ノード n 下位ノード(子ノード)

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 空間データを登録し、登録された前記空
    間データについて予め木構造をなすM−tree形式の
    空間インデックスを生成しておき、ユーザが指定した前
    記空間データに類似する前記空間データを前記空間イン
    デックスを利用して検索するようにした空間インデック
    ス方法において、 前記空間インデックスの木構造を構成する各ノードの領
    域にそれらのノードの下位に存在するすべての空間デー
    タを包含させるようにしたことを特徴とする空間インデ
    ックス方法。
  2. 【請求項2】 前記空間データの削除によって前記空間
    データに属していたリーフノードの領域が狭められた場
    合、そのすべての上位ノードの領域を狭め、その上位ノ
    ードの領域にその下位ノードの領域が包含されるように
    したことを特徴とする請求項1記載の空間インデックス
    方法。
  3. 【請求項3】 空間データの削除によってノードの領域
    がその下位ノードに属する空間データを包含する領域よ
    りも大きくなったことを示すフラグを前記ノード毎に設
    け、最少領域より大きくなった前記ノードの数が特定の
    基準値を超えた場合に空間インデックスを再構成するよ
    うにしたことを特徴とする請求項1記載の空間インデッ
    クス方法。
  4. 【請求項4】 空間データを登録し、登録された前記空
    間データについて予め木構造をなすM−tree形式の
    空間インデックスを生成しておき、ユーザが指定した前
    記空間データに類似する前記空間データを前記空間イン
    デックスを利用して検索するようにした空間インデック
    ス方法において、 空間インデックスの木構造を構成する各ノードとそれら
    の親ノード及び兄弟ノードとの間の距離を予め保持する
    ようにしたことを特徴とする空間インデックス方法。
  5. 【請求項5】 空間データを登録し、登録された前記空
    間データについて予め木構造をなすM−tree形式の
    空間インデックスを生成しておき、ユーザが指定した前
    記空間データに類似する前記空間データを前記空間イン
    デックスを利用して検索するようにした空間インデック
    ス方法において、 異なる種別の前記空間データに対して各種別単位でそれ
    ぞれ前記空間インデックスを生成し、前記空間データの
    各種別に重み付けをして検索を行なうようにしたことを
    特徴とする空間インデックス方法。
  6. 【請求項6】 個々の前記空間インデックスに基づく検
    索結果から距離に関するスコアの小さいものから順に最
    終スコアを算出し、算出したスコアの個々の空間の最大
    スコアを合計した値よりも小さい最終スコアのオブジェ
    クトのランキングを順次確定するようにしたことを特徴
    とする請求項5記載の空間インデックス方法。
  7. 【請求項7】 空間データを登録し、登録された前記空
    間データについて予め木構造をなすM−tree形式の
    空間インデックスを生成しておき、ユーザが指定した前
    記空間データに類似する前記空間データを前記空間イン
    デックスを利用して検索するようにした空間インデック
    ス方法において、 コンピュータに読み込まれ、前記空間インデックスの木
    構造を構成する各ノードの領域にそれらのノードの下位
    に存在するすべての空間データを包含させるような機能
    をコンピュータに実行させるプログラムが格納されたコ
    ンピュータ読み取り可能な記録媒体。
  8. 【請求項8】 前記空間データの削除によって前記空間
    データに属していたリーフノードの領域が狭められた場
    合、そのすべての上位ノードの領域を狭め、その上位ノ
    ードの領域にその下位ノードの領域が包含されるような
    機能をコンピュータに実行させるようにした請求項7記
    載のコンピュータ読み取り可能な記録媒体。
  9. 【請求項9】 空間データの削除によってノードの領域
    がその下位ノードに属する空間データを包含する領域よ
    りも大きくなったことを示すフラグを前記ノード毎に設
    け、最少領域より大きくなった前記ノードの数が特定の
    基準値を超えた場合に空間インデックスを再構成するよ
    うな機能をコンピュータに実行させるようにした請求項
    7記載のコンピュータ読み取り可能な記録媒体。
  10. 【請求項10】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすM−tree形式
    の空間インデックスを生成しておき、ユーザが指定した
    前記空間データに類似する前記空間データを前記空間イ
    ンデックスを利用して検索するようにした空間インデッ
    クス方法において、 コンピュータに読み込まれ、空間インデックスの木構造
    を構成する各ノードとそれらの親ノード及び兄弟ノード
    との間の距離を予め保持するような機能をコンピュータ
    に実行させるプログラムが格納されたコンピュータ読み
    取り可能な記録媒体。
  11. 【請求項11】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすM−tree形式
    の空間インデックスを生成しておき、ユーザが指定した
    前記空間データに類似する前記空間データを前記空間イ
    ンデックスを利用して検索するようにした空間インデッ
    クス方法において、 コンピュータに読み込まれ、異なる種別の前記空間デー
    タに対して各種別単位でそれぞれ前記空間インデックス
    を生成し、前記空間データの各種別に重み付けをして検
    索を行なうような機能をコンピュータに実行させるプロ
    グラムが格納されたコンピュータ読み取り可能な記録媒
    体。
  12. 【請求項12】 個々の前記空間インデックスに基づく
    検索結果から距離に関するスコアの小さいものから順に
    最終スコアを算出し、算出したスコアの個々の空間の最
    大スコアを合計した値よりも小さい最終スコアのオブジ
    ェクトのランキングを順次確定するような機能をコンピ
    ュータに実行させるようにした請求項11記載のコンピ
    ュータ読み取り可能な記録媒体。
  13. 【請求項13】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 前記空間インデックスは追加された空間データを動的に
    追加することを特徴とする空間インデックス方法。
  14. 【請求項14】 リーフノードとこのリーフノードに属
    する空間データとの距離をそのリーフノードに保持し、
    検索時にその距離を利用することで前記空間データが検
    索されるべきデータか否かを前記空間インデックスにア
    クセスすることなく判断するようにしたことを特徴とす
    る請求項13記載の空間インデックス方法。
  15. 【請求項15】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 異なる種別の前記空間データに対して各種別単位でそれ
    ぞれ前記空間インデックスを生成し、個々の前記空間イ
    ンデックスから所定の検索数を検索してバッファリング
    した後にこれらの結果をマージして検索結果を求めると
    いう処理を指定された検索結果数まで繰り返し、前記空
    間データの各種別に重み付けをして検索を行なうように
    したことを特徴とする空間インデックス方法。
  16. 【請求項16】 バッファリングされた検索数のうちス
    コアの増加量が多い前記空間インデックスを優先的に処
    理するようにしたことを特徴とする請求項15記載の空
    間インデックス方法。
  17. 【請求項17】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 異なる種別の前記空間データに対して各種別単位でそれ
    ぞれ前記空間インデックスを生成し、個々の前記空間イ
    ンデックスの検索結果において未処理の最上位及び次に
    位置するオブジェクト間の距離に関するスコアの増加量
    が多いものから順にスコアを算出し、次の順位の最大ス
    コアをそれぞれ合計した値を最大確定スコアとし、その
    最大確定スコアより小さい最終スコアのオブジェクトの
    順位を順位確定することで、前記空間データの各種別に
    重み付けをして検索を行なうようにしたことを特徴とす
    る空間インデックス方法。
  18. 【請求項18】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 異なる種別の前記空間データに対して各種別単位でそれ
    ぞれ前記空間インデックスを生成し、前記空間データの
    各種別に付けられた重み付けを等分に設定し、複数の前
    記空間データを統合して単一の空間インデックスを生成
    し、指定された重み付けに従い生ずる不確定部分を包含
    する範囲をインデックスで検索し、重み付けによる最終
    スコアを算出して順位付けを行なうことにより前記空間
    データの各種別に重み付けをして検索を行なうようにし
    たことを特徴とする空間インデックス方法。
  19. 【請求項19】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 コンピュータに読み込まれ、前記空間インデックスは追
    加された空間データを動的に追加するような機能をコン
    ピュータに実行させるプログラムが格納されたコンピュ
    ータ読み取り可能な記録媒体。
  20. 【請求項20】 リーフノードとこのリーフノードに属
    する空間データとの距離をそのリーフノードに保持し、
    検索時にその距離を利用することで前記空間データが検
    索されるべきデータか否かを前記空間インデックスにア
    クセスすることなく判断するような機能をコンピュータ
    に実行させるようにした請求項19記載のコンピュータ
    読み取り可能な記録媒体。
  21. 【請求項21】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 コンピュータに読み込まれ、異なる種別の前記空間デー
    タに対して各種別単位でそれぞれ前記空間インデックス
    を生成し、個々の前記空間インデックスから所定の検索
    数を検索してバッファリングした後にこれらの結果をマ
    ージして検索結果を求めるという処理を指定された検索
    結果数まで繰り返し、前記空間データの各種別に重み付
    けをして検索を行なうような機能をコンピュータに実行
    させるプログラムが格納されたコンピュータ読み取り可
    能な記録媒体。
  22. 【請求項22】 バッファリングされた検索数のうちス
    コアの増加量が多い前記空間インデックスを優先的に処
    理するような機能をコンピュータに実行させるようにし
    た請求項21記載のコンピュータ読み取り可能な記録媒
    体。
  23. 【請求項23】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 コンピュータに読み込まれ、異なる種別の前記空間デー
    タに対して各種別単位でそれぞれ前記空間インデックス
    を生成する機能と、個々の前記空間インデックスの検索
    結果において未処理の最上位及び次に位置するオブジェ
    クト間の距離に関するスコアの増加量が多いものから順
    にスコアを算出する機能と、次の順位の最大スコアをそ
    れぞれ合計した値を最大確定スコアとし、その最大確定
    スコアより小さい最終スコアのオブジェクトの順位を順
    位確定することで、前記空間データの各種別に重み付け
    をして検索を行なうような機能とをコンピュータに実行
    させるプログラムが格納されたコンピュータ読み取り可
    能な記録媒体。
  24. 【請求項24】 空間データを登録し、登録された前記
    空間データについて予め木構造をなすvp−tree形
    式の空間インデックスを生成しておき、ユーザが指定し
    た前記空間データに類似する前記空間データを前記空間
    インデックスを利用して検索するようにした空間インデ
    ックス方法において、 コンピュータに読み込まれ、異なる種別の前記空間デー
    タに対して各種別単位でそれぞれ前記空間インデックス
    を生成する機能と、前記空間データの各種別に付けられ
    た重み付けを等分に設定し、複数の前記空間データを統
    合して単一の空間インデックスを生成する機能と、指定
    された重み付けに従い生ずる不確定部分を包含する範囲
    をインデックスで検索し、重み付けによる最終スコアを
    算出して順位付けを行なうことにより前記空間データの
    各種別に重み付けをして検索を行なうような機能とをコ
    ンピュータに実行させるプログラムが格納されたコンピ
    ュータ読み取り可能な記録媒体。
JP28178298A 1998-10-02 1998-10-02 ノード作成方法、画像検索方法及び記録媒体 Expired - Fee Related JP3938815B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28178298A JP3938815B2 (ja) 1998-10-02 1998-10-02 ノード作成方法、画像検索方法及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28178298A JP3938815B2 (ja) 1998-10-02 1998-10-02 ノード作成方法、画像検索方法及び記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006276903A Division JP4440246B2 (ja) 2006-10-10 2006-10-10 空間インデックス方法

Publications (2)

Publication Number Publication Date
JP2000112973A true JP2000112973A (ja) 2000-04-21
JP3938815B2 JP3938815B2 (ja) 2007-06-27

Family

ID=17643907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28178298A Expired - Fee Related JP3938815B2 (ja) 1998-10-02 1998-10-02 ノード作成方法、画像検索方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP3938815B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096180A1 (ja) * 2004-03-31 2005-10-13 Pioneer Corporation 画像検索方法、装置及びプログラムを記録した記録媒体
JP2007233658A (ja) * 2006-02-28 2007-09-13 Hitachi Ltd データ処理方法および装置並びにその処理プログラム
US7492971B2 (en) 2004-05-11 2009-02-17 International Business Machines Corporation Selection of elements strongly related to a predetermined reference element
JP2010079871A (ja) * 2008-06-09 2010-04-08 Yahoo Japan Corp ベクトルデータ検索装置
WO2013051619A1 (ja) * 2011-10-03 2013-04-11 日本電気株式会社 類似性検出装置及び指向性近傍検出方法
US8422831B2 (en) 2007-10-25 2013-04-16 Ricoh Company, Ltd. Information management apparatus, information management method, and computer readable medium which determine similarities
JPWO2014109127A1 (ja) * 2013-01-11 2017-01-19 日本電気株式会社 インデックス生成装置及び方法並びに検索装置及び検索方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096180A1 (ja) * 2004-03-31 2005-10-13 Pioneer Corporation 画像検索方法、装置及びプログラムを記録した記録媒体
US7492971B2 (en) 2004-05-11 2009-02-17 International Business Machines Corporation Selection of elements strongly related to a predetermined reference element
JP2007233658A (ja) * 2006-02-28 2007-09-13 Hitachi Ltd データ処理方法および装置並びにその処理プログラム
US8422831B2 (en) 2007-10-25 2013-04-16 Ricoh Company, Ltd. Information management apparatus, information management method, and computer readable medium which determine similarities
JP2010079871A (ja) * 2008-06-09 2010-04-08 Yahoo Japan Corp ベクトルデータ検索装置
WO2013051619A1 (ja) * 2011-10-03 2013-04-11 日本電気株式会社 類似性検出装置及び指向性近傍検出方法
JPWO2013051619A1 (ja) * 2011-10-03 2015-03-30 日本電気株式会社 類似性検出装置及び指向性近傍検出方法
US9530081B2 (en) 2011-10-03 2016-12-27 Nec Corporation Similarity detecting apparatus and directional nearest neighbor detecting method
JPWO2014109127A1 (ja) * 2013-01-11 2017-01-19 日本電気株式会社 インデックス生成装置及び方法並びに検索装置及び検索方法
US10713229B2 (en) 2013-01-11 2020-07-14 Nec Corporation Index generating device and method, and search device and search method

Also Published As

Publication number Publication date
JP3938815B2 (ja) 2007-06-27

Similar Documents

Publication Publication Date Title
Zhang et al. Scheme for visual feature-based image indexing
JP4878178B2 (ja) データ処理方法および装置並びにその処理プログラム
CN104199827B (zh) 基于局部敏感哈希的大规模多媒体数据的高维索引方法
US8090745B2 (en) K-nearest neighbor search method, k-nearest neighbor search program, and k-nearest neighbor search device
US10754887B1 (en) Systems and methods for multimedia image clustering
JP2002519748A (ja) 像検索システム
CN106095920B (zh) 面向大规模高维空间数据的分布式索引方法
CN106933511B (zh) 考虑负载均衡与磁盘效率的空间数据存储组织方法及系统
US11809494B2 (en) Information processing apparatus and information processing method
CN106991141A (zh) 一种基于深度剪枝策略的关联规则挖掘方法
Yu et al. ClusterTree: Integration of cluster representation and nearest-neighbor search for large data sets with high dimensions
US20110179013A1 (en) Search Log Online Analytic Processing
CN114691721A (zh) 图数据的查询方法、装置、电子设备及存储介质
JP4440246B2 (ja) 空間インデックス方法
JP2000112973A (ja) 空間インデックス方法及び空間インデックス処理プログラムを格納した媒体
CN107256222B (zh) 基于自由词检索的电子病历快速检索系统
CN106126681A (zh) 一种增量式流式数据聚类方法及系统
CN110209895B (zh) 向量检索方法、装置和设备
CN106055690B (zh) 一种基于属性匹配的快速检索与获取数据特征方法
JP2004046612A (ja) データマッチング方法、データマッチング装置、データマッチングプログラムおよびコンピュータで読み取り可能な記録媒体
JP2000035965A (ja) 類似特徴量の検索方法及び装置及び類似特徴量の検索プログラムを格納した記憶媒体
CN115757896A (zh) 向量检索方法、装置、设备及可读存储介质
KR20220099745A (ko) 지리공간 블록체인 데이터 검색을 위한 공간 분할 기반의 트리 인덱싱 및 질의어 처리 방법 및 장치
Bachiega et al. An architecture for cost optimization in the processing of big geospatial data in public cloud providers
JP2001134593A (ja) 近傍データ検索方法及び装置及び近傍データ検索プログラムを格納した記憶媒体

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070320

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070326

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100406

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120406

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140406

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees