JP2004348426A - Multidimensional spatial data search method, multidimensional spatial data search device, multidimensional spatial data search program and recording medium with multidimensional spatial data search program recorded - Google Patents

Multidimensional spatial data search method, multidimensional spatial data search device, multidimensional spatial data search program and recording medium with multidimensional spatial data search program recorded Download PDF

Info

Publication number
JP2004348426A
JP2004348426A JP2003144642A JP2003144642A JP2004348426A JP 2004348426 A JP2004348426 A JP 2004348426A JP 2003144642 A JP2003144642 A JP 2003144642A JP 2003144642 A JP2003144642 A JP 2003144642A JP 2004348426 A JP2004348426 A JP 2004348426A
Authority
JP
Japan
Prior art keywords
leaf node
accessed
node
leaf
spatial data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003144642A
Other languages
Japanese (ja)
Inventor
Hitoshi Hatano
仁 波多野
Yasushi Sakurai
保志 櫻井
Hisaya Kotani
尚也 小谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003144642A priority Critical patent/JP2004348426A/en
Publication of JP2004348426A publication Critical patent/JP2004348426A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a multidimensional spatial data search method that provides different dynamic weighting to each feature, in a search of a high-dimensional space formed of a plurality of types of features. <P>SOLUTION: Out of a plurality of multidimensional spatial data tree structures constituting multimedia data stored in a database, a largely weighted multidimensional spatial data tree structure is searched preferentially, and with pessimistic distances about leaf nodes, a pruning strategy is executed on the basis of optimistic distances about accessed nodes to locate the nearest neighbor leaf node, so that the reduced node access enables improved search performance. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、データベースに格納される多次元空間データの探索技術に関し、特に多次元空間探索における、多次元空間データ探索方法、多次元空間データ探索装置、多次元空間データ探索プログラム、および多次元空間データ探索プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来の空間アクセス法の中で、高次元空間の探索に有用な手法としてR−treeとその派生手法がある(以下、R−treeファミリーと呼ぶ。)。R−treeファミリーには、R−tree、R*−tree、Hilbert R−tree、SS−tree、SR−treeなどがあり、いずれもデータオブジェクトは最小包囲領域、つまり最小包囲矩形(MBR;Minimum Bounding Rectangle)もしくは最小包囲球(MBS;Minimum Bounding Sphere)に包囲され、更に階層構造をなしている。多次元空間データ木は、下記の数式1のような構造を有する。
【0003】
【数1】

Figure 2004348426
【0004】
ここで、εはノードに格納されているエントリ数である。Sは、ε個の子ノードのMBRを表現したものである。またchild−nodeによって子ノードにアクセスすることができる。leaf_Nodeの中にはn種類の多次元空間データF(j=1、・・・・、n)がそれぞれ格納されている。データオブジェクトをあるアルゴリズムに従って、クラスタリングしMBRを定義した上で木構造を構築していく手段については、それぞれのR−treeファミリーによって異なる。
【0005】
【発明が解決しようとする課題】
上述した従来手法では、多次元空間データ木構造を、固定された重み付けの下で構築する必要がある。多次元空間データ木構造を構築する行程は検索を行う行程よりも処理時間が長いことが一般的であり、重み付き多次元空間データ探索において重み付けが動的に変化する場合、その都度その重み付けの下で多次元空間データ木構造を構築した上で、検索を行ってく方法は現実的ではない。また、重み付けのバリエーション毎に多次元空間データ木構造をあらかじめ構築しておく方法では、無数にある重み付けのバリエーションに対応できない。
【0006】
現在のところ、従来手法では、ある固定された重み付けの下で構築された木構造を用いて、動的に変化する多次元空間データ探索を行っており、計算量が多く、結果的に処理時間が長くなってしまうことがある。
【0007】
例として、図11のような2次元のデータ空間上の問い合わせ点Qとの最近傍点を求める問題について説明する。問い合わせ点Qから距離の近いノンリーフノード(図11ではR1およびR2にあたる)からアクセスしていき、その後、その子ノードの中で距離の近いノードをアクセスしていく。従来手法であると、R1およびR2とQとの距離が等しいため、R1およびR2の子ノードにアクセスしていき、それぞれの距離を計算しながら枝刈戦略を実施していくことになる。しかし、この2つの次元xおよびyの間に1:0の重み付けがなされた場合を考えると、y次元の数値は距離に反映されないため、R1内の子ノードのみアクセスすればよいが、従来手法では2つの次元xおよびyの間の重み付けが1:1であることを前提として木構造が構成されているため、どのような重み付けが与えられたとしても、R1およびR2の子ノードにアクセスしていき、枝刈戦略を実施していくことになる。このことは、無駄な計算を実施していることになり、結果的に処理時間が長くなってしまう。
【0008】
このように、上述した従来の探索処理においては、n個の特徴ベクトルに重み付けが変更される場合でも、あらかじめ固定的に決められた重み付けの下に多次元空間データ木構造を構築しなくてはならないため、結果的に効率的な探索を行うことができない。
【0009】
重み付き多次元データの問い合わせ点Qとの最近傍距離は下記の数式2のように表される。
【0010】
【数2】
Figure 2004348426
【0011】
各多次元空間データe(j = 1、・・・・、n)に付与される重みweight(j = 1、・・・・、n)の間に大きな差がある場合は、重み付けを考慮した探索方法が有効となる。あらかじめ重みが不変であるならば、重み付けをした多次元空間データを用いて多次元空間データ木構造を構築すればよいが、類似画像検索など、色相、彩度、明度、テクスチャ等さまざまな特徴量に与える重み付けを多次元空間データ探索を行うたびに動的に変更するような使い方をするシステムでは計算量が多くなってしまい、効率的な探索ができない場合が生じてしまう。
【0012】
例えば類似画像検索では、検索対象となる画像の色相、彩度、明度、テクスチャ、形状等様々な特徴量を抽出し、多次元空間データ木構造を構築するが、実際に類似画像検索を行う場合は、色味が似ている画像の検索や模様が似ている画像の検索が要求されるなど、抽出した特徴量に重み付けをつけて検索されることが一般的であるシステムが存在する。
【0013】
本発明は、重み付けが与えられる単位毎に多次元特徴ベクトルを格納する多次元空間データ木構造を構築し、各特徴量に与えられた重み付けを加味して効率的な探索を行うことができる、多次元空間データ探索方法、多次元空間データ探索装置、多次元空間データ探索プログラム、および多次元空間データ探索プログラムを記録した記録媒体を提供することにある。
【0014】
【課題を解決するための手段】
そこで前記課題を解決するために、請求項1に記載の多次元空間データ探索方法は、データベースに格納されるマルチメディアデータを複数の多次元空間データ木構造に格納したものについて、重み付けが強い多次元空間データ木構造を優先して探索し、リーフノードに関して、リーフノードまでアクセスしていない次元が存在する場合に、その次元に関してリーフノードがとり得る最大距離(悲観的距離)を算出し、アクセス済みのノードに関して、リーフノードまでアクセスしていない次元が存在する場合に、その次元に関してリーフノードがとり得る最小距離(楽観的距離)を算出し、前記最大距離(悲観的距離)と最小距離(楽観的距離)とを用いて枝刈戦略を実施することを特徴とする。
【0015】
また、請求項2に記載の多次元空間データ探索方法、は前記請求項1に記載の多次元空間データ探索方法において、前記枝刈戦略の際に、他のノードの枝刈に成功したリーフノードに、枝刈した他ノードのインデックス情報を保持し、そのリーフノードが最近傍ノードであることが確定した際に、保持していたインデックス情報を探索対象空間に戻すことにより、次の最近傍ノードを探索することを特徴とする。
【0016】
また、請求項3に記載の多次元空間データ探索方法は、
【0017】
【数3】
Figure 2004348426
【0018】
のように表される多次元空間データ木構造において、アクセス済ノンリーフノード選定手段により、すべてのアクセス済ノンリーフノードついて
【0019】
【数4】
Figure 2004348426
【0020】
により数値を算出し、算出される数値が最小のものを次にアクセスするノンリーフノードとして選定し、選定したノンリーフノードにアクセスする第1ステップと、アクセス済ノンリーフノード選定手段により、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、有していない場合には第1ステップに戻ることを決定し、有している場合には第3ステップに進むことを決定する第2ステップと、枝刈手段により、アクセス済リーフノードについて
【0021】
【数5】
Figure 2004348426
【0022】
により問い合わせ点との最大距離を算出し、アクセス済ノンリーフノードについて
【0023】
【数6】
Figure 2004348426
【0024】
により問い合わせ点との最小距離を算出し、前記最大距離と最小距離とを用いて枝刈戦略を行い、アクセス済リーフノードの最大距離よりもアクセス済ノンリーフノードの最小距離が大きい場合に、そのノンリーフノードは枝刈の対象となり、アクセス済ノンリーフノード集合を保持しているアクセス済リストから削除して第4ステップに進むことを決定し、また前記技刈戦略が行われなかった場合、若しくは前記枝刈リスト中で最も小さい距離を持つアクセス済ノンリーフノードよりも、小さい距離を持つそのアクセス済リーフノードと同じ多次元空間データ木に所属するアクセス済ノンリーフノードが存在すると判断した場合は、第1ステップに戻ることを決定する第3ステップと、最近傍判定手段により、前記枝刈戦略により選定された最近傍候補ノードについては前記最大距離をそのまま用い、枝刈戦略リスト中の最近傍候補ノード以外の全アクセス済リーフノードについては
【0025】
【数7】
Figure 2004348426
【0026】
により最小距離を算出し、これらの最大距離と最小距離とを比較し、最近傍候補ノードの最大距離が最も小さい場合に、この最近傍候補ノードが最近傍の多次元空間データであることを確定する第4ステップと、からなることを特徴とする。
【0027】
また、請求項4に記載の多次元空間データ探索方法は、前記請求項3に記載の多次元空間データ探索方法において、前記枝刈手段により、前記第3ステップでアクセス済リーフノードに枝刈されたノードを、前記アクセス済リーフノードに保持し、前記最近傍判定手段により、前記第4ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする。
【0028】
また、請求項5に記載の多次元空間データ探索方法は、
【0029】
【数3】
Figure 2004348426
【0030】
のように表される多次元空間データ木構造において、アクセス済ノンリーフノード選定手段により、すべてのアクセス済ノンリーフノードについて
【0031】
【数4】
Figure 2004348426
【0032】
により数値を算出し、算出される数値が最小のものを次にアクセスするノンリーフノードとして選定し、選定したノンリーフノードにアクセスする第1ステップと、アクセス済ノンリーフノード選定手段により、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、有していない場合には第1ステップに戻ることを決定し、有している場合には第3ステップに進むことを決定する第2ステップと、枝刈手段により、アクセス済リーフノードについて
【0033】
【数5】
Figure 2004348426
【0034】
により問い合わせ点との最大距離を算出し、アクセス済ノンリーフノードについて
【0035】
【数6】
Figure 2004348426
【0036】
により問い合わせ点との最小距離を算出し、距離の値が小さい順に整列させ、最も小さい距離を有するものがリーフノードである場合には後述の第5ステップに進むことを決定し、最も小さい距離を有するものがノンリーフノードである場合には、アクセス済リーフノードの最大距離よりも大きい最小距離を有するアクセス済ノンリーフノードを枝刈し、アクセス済ノンリーフノード集合を保持しているアクセス済リストから削除してから後述の第4ステップに進ことを決定する、第3ステップと、枝刈手段により、アクセスできるノンリーフノードが無い多次元空間データ木の有無を判断し、有ると判断した場合は後述の第5ステップに進むことを決定し、無いと判断した場合は第1ステップに戻ることを決定する第4ステップと、最近傍判定手段により、前記最大距離が最も小さいリーフノードについては前記最大距離をそのまま用い、それ以外のリーフノードについては
【0037】
【数7】
Figure 2004348426
【0038】
により最小距離を算出し、これらの最大距離と最小距離とを比較し、前記最大距離が最も小さい場合に、この最大距離を有するリーフノードが最近傍の多次元空間データであることを確定する第5ステップと、からなることを特徴とする。
【0039】
また、請求項6に記載の多次元空間データ探索方法は、前記請求項5に記載の多次元空間データ探索方法において、前記枝刈手段により、前記第3ステップでアクセス済リーフノードに枝刈されたノードを、前記アクセス済リーフノードに保持し、前記最近傍判定手段により、前記第5ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする。
【0040】
また、請求項7に記載の多次元空間データ探索方法は、多次元空間データの最近傍探索において、アクセス済ノンリーフノード選定手段により、各特徴量のルートノードにアクセスする第1ステップと、アクセス済ノンリーフノード選定手段により、アクセスしたノードに関する子ノードをアクセス済リストに挿入する第2ステップと、アクセス済ノンリーフノード選定手段により、アクセス済リストのノンリーフノードについて
【0041】
【数3】
Figure 2004348426
【0042】
により算出される値をアクセス済リストに格納する第3ステップと、アクセス済ノンリーフノード選定手段により、前記アクセス済リストから
【0043】
【数4】
Figure 2004348426
【0044】
により算出される値が、最も小さいものを次にアクセスするノンリーフノードとして選定する第4ステップと、アクセス済ノンリーフノード選定手段により、選定したノンリーフノードにアクセスする第5ステップと、アクセス済ノンリーフノード選定手段により、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、リーフノードを有していない場合には第1ステップに戻ることを決定し、リーフノードを有している場合には次のステップに進むことを決定する第6ステップと、枝刈手段により、アクセス済リーフノードについて
【0045】
【数5】
Figure 2004348426
【0046】
により問い合わせ点との最大距離を算出し、枝刈戦略リストに挿入する第7ステップと、枝刈手段により、アクセス済リストに格納されているノンリーフノードについて
【0047】
【数6】
Figure 2004348426
【0048】
により問い合わせ点との最小距離を算出し、枝刈戦略リストに挿入する第8ステップと、枝刈手段により、前記枝刈戦略リスト中の各ノードを距離の値が小さい順に整列させる第9ステップと、枝刈手段により、最も小さい距離の値を有するノードがリーフノードであるかを判断し、リーフノードであると判断した場合には後段の第13ステップに進むことを決定し、リーフノードではないと判断した場合には次の第11ステップに進むことを決定する第10ステップと、枝刈手段により、前記枝刈戦略リスト中のリーフノードより大きい距離を持つノンリーフノードを枝刈し、アクセス済リストから削除する第11ステップと、枝刈手段により、アクセスできるノンリーフノードが無い多次元空間データ木が有るかを判断し、無いと判断した場合には第2ステップに戻ることを決定し、有ると判断した場合には次の第13ステップに進むことを決定する第12ステップと、最近傍判定手段により、前記最大距離が最も小さいリーフノードについては前記最大距離をそのまま用い、それ以外のリーフノードについては
【0049】
【数7】
Figure 2004348426
【0050】
により最小距離を算出し、これらの最大距離と最小距離とを比較し、前記最大距離が最も小さい場合に、この最大距離を有するリーフノードが最近傍の多次元空間データであることを確定する第13ステップと、からなることを特徴とする。
【0051】
また、請求項8に記載の多次元空間データ探索方法は、前記請求項7に記載の多次元空間データ探索方法において、前記枝刈手段により、前記第11ステップでリーフノードに枝刈されたノードを、前記リーフノードに保持し、前記最近傍判定手段により、前記第13ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする。
【0052】
また、請求項9に記載の多次元空間データ探索装置は、検索情報を入力する入力手段と、
【0053】
【数3】
Figure 2004348426
【0054】
のように表される多次元空間データ木構造を有するデータベースと、すべてのアクセス済ノンリーフノードについて
【0055】
【数4】
Figure 2004348426
【0056】
により数値を算出し、算出される数値が最小のものを次にアクセスするノンリーフノードとして選定し、選定したノンリーフノードにアクセスする第1ステップと、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、有していない場合には第1ステップに戻ることを決定し、有している場合には第3ステップに進むことを決定する第2ステップと、を実行するアクセス済ノンリーフノード選定手段と、アクセスしたノンリーフノードがリーフノードを有している場合に、アクセス済リーフノードについて
【0057】
【数5】
Figure 2004348426
【0058】
により問い合わせ点との最大距離(悲観的距離)を算出し、アクセス済ノンリーフノードについて
【0059】
【数6】
Figure 2004348426
【0060】
により問い合わせ点との最小距離(楽観的距離)を算出し、距離の値が小さい順に整列させ、最も小さい距離を有するものがリーフノードである場合には後述の第5ステップに進むことを決定し、最も小さい距離を有するものがノンリーフノードである場合には、アクセス済リーフノードの最大距離(悲観的距離)よりも大きい最小距離(楽観的距離)を有するアクセス済ノンリーフノードを枝刈し、アクセス済ノンリーフノード集合を保持しているアクセス済リストから削除してから後述の第4ステップに進むことを決定する、第3ステップと、アクセスできるノンリーフノードが無い多次元空間データ木の有無を判断し、有ると判断した場合は後述の第5ステップに進むことを決定し、無いと判断した場合は第1ステップに戻ることを決定する第4ステップと、を実行する枝刈手段と、前記最大距離(悲観的距離)が最も小さいリーフノードについては前記最大距離(悲観的距離)をそのまま用い、それ以外のリーフノードについては
【0061】
【数7】
Figure 2004348426
【0062】
により最小距離(楽観的距離)を算出し、これらの最大距離(悲観的距離)と最小距離(楽観的距離)とを比較し、前記最大距離(悲観的距離)が最も小さい場合に、この最大距離(悲観的距離)を有するリーフノードが最近傍の多次元空間データであることを確定する第5ステップを実行する最近傍判定手段と、前記最近傍多次元空間データを出力するデータ出力手段と、からなることを特徴とする。
【0063】
また、請求項10に記載の多次元空間データ探索装置は、前記請求項9に記載の多次元空間データ探索装置において、前記枝刈手段は、前記第3ステップでアクセス済リーフノードに枝刈されたノードを、前記アクセス済リーフノードに保持し、前記最近傍判定手段は、前記第5ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする。
【0064】
また、請求項11に記載の多次元空間データ探索装置は、検索情報を入力する入力手段と、
【0065】
【数3】
Figure 2004348426
【0066】
のように表される多次元空間データ木構造を有するデータベースと、各特徴量のルートノードにアクセスする第1ステップと、アクセスしたノードに関する子ノードをアクセス済リストに挿入する第2ステップと、アクセス済リストのノンリーフノードについて
【0067】
【数3】
Figure 2004348426
【0068】
により算出される値をアクセス済リストに格納する第3ステップと、前記アクセス済リストから
【0069】
【数4】
Figure 2004348426
【0070】
により算出される値が、最も小さいものを次にアクセスするノンリーフノードとして選定する第4ステップと、選定したノンリーフノードにアクセスする第5ステップと、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、リーフノードを有していない場合には第1ステップに戻ることを決定し、リーフノードを有している場合には次のステップに進むことを決定する第6ステップと、を実行するアクセス済ノンリーフノード選定手段と、アクセス済リーフノードについて
【0071】
【数5】
Figure 2004348426
【0072】
により問い合わせ点との最大距離(悲観的距離)を算出し、枝刈戦略リストに挿入する第7ステップと、アクセス済リストに格納されているノンリーフノードについて
【0073】
【数6】
Figure 2004348426
【0074】
により問い合わせ点との最小距離(楽観的距離)を算出し、枝刈戦略リストに挿入する第8ステップと、前記枝刈戦略リスト中の各ノードを距離の値が小さい順に整列させる第9ステップと、最も小さい距離の値を有するノードがリーフノードであるかを判断し、リーフノードであると判断した場合には後段の第13ステップに進むことを決定し、リーフノードではないと判断した場合には次の第11ステップに進むことを決定する第10ステップと、前記枝刈戦略リスト中のリーフノードより大きい距離を持つノンリーフノードを枝刈し、アクセス済リストから削除する第11ステップと、アクセスできるノンリーフノードが無い多次元空間データ木が有るかを判断し、無いと判断した場合には第2ステップに戻ることを決定し、有ると判断した場合には次の第13ステップに進むことを決定する第12ステップと、を実行する枝刈手段と、
前記最大距離(悲観的距離)が最も小さいリーフノードについては前記最大距離(悲観的距離)をそのまま用い、それ以外のリーフノードについては
【0075】
【数7】
Figure 2004348426
【0076】
により最小距離(楽観的距離)を算出し、これらの最大距離(悲観的距離)と最小距離(楽観的距離)とを比較し、前記最大距離(悲観的距離)が最も小さい場合に、この最大距離(悲観的距離)を有するリーフノードが最近傍の多次元空間データであることを確定する第13ステップを実行する最近傍判定手段と、前記最近傍多次元空間データを出力するデータ出力手段と、からなることを特徴とする。
【0077】
また、請求項12に記載の多次元空間データ探索装置は、前記請求項11に記載の多次元空間データ探索装置において、前記枝刈手段は、前記第11ステップでリーフノードに枝刈されたノードを、前記リーフノードに保持し、前記最近傍判定手段は、前記第13ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする。
【0078】
また、請求項13に記載のプログラムは、上記の請求項1乃至12のいずれか1項に記載の多次元空間データ探索方法または多次元空間データ探索装置を、コンピュータプログラムで記載してそれを実行可能にしたことを特徴とする。
【0079】
また、請求項14に記載の記録媒体は、上記の請求項1乃至12のいずれか1項に記載の多次元空間データ探索方法または多次元空間データ探索装置を、コンピュータで実行可能に記載したプログラムを記録したことを特徴とする。
【0080】
請求項1,3,5,7,9,11に記載の本発明にあっては、n種類からなる多次元特徴ベクトルを、R−treeファミリー等における多次元空間データ木構造及び多次元空間データ更新方法を用いて、それぞれ独立した多次元空間データ木構造として格納する。多次元空間データ木構造は下記の数式3のように表される。
【0081】
【数3】
Figure 2004348426
【0082】
ここで、εはノードに格納されているエントリ数である。Sは、ε個の子ノードのMBRを表現したものである。またchild−nodeによって子ノードにアクセスすることができる。leaf_Nodeの中には、n種類の多次元空間データF(j = 1、・・・・、n)がそれぞれ格納されている。数式3はそれぞれ独立したn種類の多次元空間データ木構造を示している。そして、ノードにアクセスする順番を、下記の数式4に示される数値により決定し、最もその数値が少ないものから順にアクセスしていく。
【0083】
【数4】
Figure 2004348426
【0084】
ここで、Qは問合せ点であり、min dist(Q,non_leaf_Node)は、問合せ点Qとnon_leaf_Nodeとの最小距離を表している。またweightは多次元空間データ木構造iにつけられた重みである。このアクセス順の決定方法によって、重み付けが大きく且つ問合せ点との距離が小さい多次元特徴ベクトルの木構造を優先的に走査していくことが可能となる。
【0085】
アクセスを進めていくと、やがてリーフノードが現れるが下記の数式5で定義する数値(以下、悲観的距離)により、またノンリーフノードについては下記の数式6で定義する数値(以下、楽観的距離)により枝刈戦略を行う。
【0086】
【数5】
Figure 2004348426
【0087】
ここで、cur_acc_non_leaf_Nodeは現在アクセスしているノンリーフノードの集合を表しており、数式5はアクセス済みのリーフノードについては、問合せ点との距離をそのまま採用し、リーフノードに到達していない場合については、問合せ点との距離が最大となりえる場合での距離を採用し重み付け距離を計算するものである。
【0088】
【数6】
Figure 2004348426
【0089】
ここで、cur_acc_Nodeは現在アクセスしている全てのノードの集合を表しており、数式6はアクセス済みのリーフノードについては、問合せ点との距離をそのまま採用し、リーフノードに到達していない場合については、問合せ点との距離が最小となりえる場合での距離を採用し重み付け距離を計算するものである。
【0090】
また下記の数式7は、最近傍判定過程において、楽観的距離を計算する数式である。
【0091】
【数7】
Figure 2004348426
【0092】
ここで、cur_acc_nonleaf_Nodeは現在アクセスしている全てのノンリーフノードの集合を表しており、数式7はアクセス済のリーフノードについては、問い合わせ点との距離をそのまま採用し、リーフノードに到達していない場合については、問い合わせ点との距離が最小となりえる場合での距離を採用し、重み付け距離を計算するものである。
【0093】
悲観的距離と楽観的距離とを比較し、あるリーフノードに関する悲観的距離があるノードに対する楽観的距離よりも小さい場合は、未アクセスのノードが含まれていても、そのリーフノードの方が、あるノードに含まれるリーフノードよりも近傍であることが保証できる。
【0094】
請求項2,4,6,8,10,12の本発明にあたっては、問合せ点Qとの距離が小さい上位k件の点を求める問題について、請求項1,3,5,7,9,11の多次元空間データ探索方法によって最近傍点を確定した後も、継続して問合せ点Qとの距離が次に小さい点を効率的に探索する方法を提供するものである。
つまり、請求項1,3,5,7,9,11のリーフノードの悲観的距離と他ノードの楽観的距離とを比較し枝刈を行った際に、枝刈によって探索対象から外れたノードのインデックス情報を枝刈に成功したリーフノードに保持しておき、最近傍が決定した段階で、最近傍リーフノードが保持していたノードを探索対象集合に戻すようにする。
【0095】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。
【0096】
図1に示すように、多次元空間データの最近傍探索は大きく3つのプロセスをとる。一つ目は、アクセス済ノンリーフノード集合の中から、次のステップでどのノンリーフノードにアクセスするかを決定するアクセス済ノンリーフノード選定過程(S10)。二つ目は、アクセス済リーフノードに関する悲観的距離と、アクセス済ノンリーフノードに関する楽観的距離とを用いて枝刈を行う枝刈過程(S20)。三つ目は、アクセス済リーフノードが最近傍ベクトルであるかを判定する最近傍判定過程(S30)である。
【0097】
図10は本発明の多次元空間データ探索を行う装置の構成図である。図10に示すように、該装置は、入力手段1、アクセス済ノンリーフノード選定手段2、枝刈手段3、最近傍判定手段4、データ出力手段5、およびデータベース6から構成される。なお、アクセス済ノンリーフノード選定過程(S10)はアクセス済ノンリーフノード選定手段2により実行され、枝刈過程(S20)は枝刈手段3により実行され、最近傍判定過程(S30)は最近傍判定手段4により実行される。また、データベース6には、探索対象であるマルチメディアデータを組織する複数の多次元空間データ木構造が格納されている。
【0098】
アクセス済ノンリーフノード選定過程(S10)においては、前記数式4で示した評価関数により次にアクセスするノンリーフノードを選定する。この過程ではアクセス済ノンリーフノードと間い合わせ点との最短距離および前記数式4による評価値を保持しておく「アクセス済リスト」データ構造が用いられる。アクセス済リストには、n種類の多次元空間データに関するノンリーフノードを格納する。 アクセス済リストに保持されているノンリーフノード全てに対して、前記数式4により示した評価関数により得られる数値を算出し、この数値が最小のものを次にアクセスするノンリーフノードとして選定する。この操作により、重み付けが大きく且つ問い合わせ点との距離が近いノンリーフノードが選定されることになる。このことは、最近傍点が含まれる可能性の高いノンリーフノードを優先してアクセスしていることになる。アクセス済ノンリーフノード選定過程(S10)を進めていくと、やがてリーフノードにアクセスすることとなる。
【0099】
枝刈過程(S20)においては、アクセス済リーフノードについて前記数式5で示される問い合わせ点との悲観的距離と、アクセス済ノンリーフノードについて前記数式6で示される問い合わせ点との楽観的距離とを用いて枝刈戦略を行う。アクセス済リーフノードの悲観的距離よりもアクセス済ノンリーフノードの楽観的距離が大きい場合、そのノンリーフノードは枝刈の対象となりアクセス済ノンリーフノード集合を保持しているアクセス済リストから削除する。
【0100】
また、請求項2,4,6,8,10,12については、各ノードに枝刈したリーフノードを保持しておく「枝刈リスト」データ構造を用い、あるアクセス済リーフノードに枝刈されたノードをこのアクセス済リーフノードの枝刈リストに保持する。
【0101】
この過程では、全アクセス済リーフノードについては、悲観的距離が計算され、全アクセス済ノンリーフノードについては、楽観的距離が計算され、これら全てを距離の小さい順に整列させることによって、容易に枝刈が可能である。この各ノードの楽観的距離および悲観的距離を保持しておく「枝刈戦略リスト」データ構造を用い、距離の小さい順に整列させ枝刈を行う。この枝刈戦略リストを距離の小さい順に整列した後、アクセス済リーフノードが最小値をとる、またはそのアクセス済リーフノードが所属する多次元空間データ木が全てアクセス済であった場合に、このアクセス済リーフノードが最近傍候補ノードとなり、次の最近傍判定過程(S30)に進む。また、技刈が行われなかった場合や、枝刈戦略リスト中で最も小さい距離を持つアクセス済ノンリーフノードよりも、小さい距離を持つそのアクセス済リーフノードと同じ多次元空間データ木に所属するアクセス済ノンリーフノードが存在する場合については、アクセス済ノンリーフノード選定過程(S10)に戻り、次にアクセスするノンリーフノードを選定する。
【0102】
最近傍判定過程(S30)においては、枝刈戦略リストの中で、最も小さい距離のアクセス済リーフノードもしくは、所属する多次元空間データ木が全てアクセス済であるようなアクセス済リーフノードの中で距離が最小のものが、その他のアクセス済リーフノードよりも距離が小さいかを判定する。
【0103】
この過程では、枝刈戦略リストにより選定された最近傍候補ノードについては悲観的距離が計算され、枝刈戦略リスト中の最近傍候補ノード以外の全アクセス済リーフノードについては前記数式7による楽観的距離が計算され、これらの距離を比較した結果、最近傍候補ノードの悲観的距離が最も小さい場合に、この最近傍候補ノードが最近傍の多次元空間データであることが確定する。
【0104】
また、請求項2,4,6,8,10,12については、最近傍の多次元空間データであることが確定したノードに関する枝刈リストに保持されている枝刈されたノンリーフノードおよびリーフノードをそれぞれ、アクセス済リスト、枝刈戦略リストに再挿入し、最近傍探索を繰り返し行う。
【0105】
アクセス済ノンリーフノード選定過程(S10)、枝刈過程(S20)、最近傍判定過程(S30)のフローチャートをそれぞれ、図2、図3に示す。
【0106】
ここで、最近傍探索方法の例を図4、および図5に示す例を用いて説明する。
例えば、2種類の特徴ベクトルAとBが存在し、それぞれはa次元、b次元の特徴ベクトルであるとする。そして問い合わせ点Q、Qとの重み付き最近傍を求めることが目的であるとする。このとき、特徴ベクトルAおよびBへの重み付けをそれぞれW、Wとする。また、特徴ベクトルAおよびBが図4に示すような多次元空間データ木構造で格納されているものとする。各特徴ベクトルの多次元空間データを多次元空間データ木構造に格納する方法については、R−treeファミリー等の従来技術を用いればよいが、ここではR−treeで多次元空間データ木構造が構成されているとする。また、多次元空間A、B内のノードと問い合わせ点Qとの距離は図5に示すものとする。
【0107】
まず始めに、特徴空間ベクトル木のルートノードからアクセスする。図4に示すように、ルートノードには下記のRα、Rβ、Rγ、Rδがあり、それらをアクセス済リストに挿入し、それぞれの前記数式4による評価関数による値を算出し、最も小さいものを選定する(アクセス済ノンリーフノード選定過程)。前記数式4による計算を下記の表1に示す。
【0108】
【表1】
Figure 2004348426
【0109】
図6にアクセス済リストを示す。評価関数による値から、Rαが最も小さいため、Rαをアクセスするノードとして選出する。次に、Rαをアクセスすると、図4に示すように、リーフノードとしてR3,R6,R7が存在する。これらはリーフノードであるため、これらの悲観的距離、および現在アクセス済ノンリーフノードに挿入されているノードに関する楽観的距離を計算した上で、枝刈戦略リストに挿入し、枝刈を行う。これらの計算を下記の表2に示す。
【0110】
【表2】
Figure 2004348426
【0111】
枝刈戦略リストは図7のようになり、枝刈は特に行われなかったため、アクセス済ノンリーフノードから次にアクセスするノードを選定する。アクセス済リストは図8に示すようになり、Rβが選定され、Rβにアクセスすると、図4に示すように、リーフノードR4、R5が存在する。
【0112】
これらはリーフノードであるため、これらの悲観的距離および現在アクセス済ノンリーフノードに挿入されているノードに関する楽観的距離を計算した上で、枝刈戦略リストに挿入し。枝刈を行う。これらの計算を下記の表3に示す。
【0113】
【表3】
Figure 2004348426
【0114】
枝刈戦略リストは、図9に示すようになり、リーフノード(R6,R5,R3,R4,R7)の悲観的距離よりも、ノンリーフノード(Rδ、Rγ)の楽観的距離の方が小さいため、ここでも枝刈は行われない。
【0115】
この時点で、特徴空間ベクトルAについては、全てアクセスが終了しており、図3のS360の評価により、これ以上アクセスするノードがないため、現時点までにアクセスしたリーフノードの情報を用いて最近傍判定過程へと進む。
【0116】
ここで、枝刈戦略リストにより選定された最近傍候補ノードR6についての悲観的距離の計算、および枝刈戦略リスト中の最近傍候補ノード以外の全アクセス済リーフノードについての前記数式7による楽観的距離の計算を下記の表4に示す。
【0117】
【表4】
Figure 2004348426
【0118】
この結果、R6の悲観的距離が、残りの全てのリーフノードの楽観的距離より小さいため、R6が最近傍ノードということが決定する。
【0119】
請求項2,4,6,8,10,12については、この場合、R6によって、R5,R3,R4,R7が枝刈されるため、R6の枝刈リストにこれらの4つのノードが保持されることとなるが、R6は最近傍ノードであるため、R6が枝刈リストに保持していたノードは全て、全過程において値が参照されることとなる。そして、引き続き2番目に近いデータを探すために、同様の処理が行われる。
【0120】
本発明は、重み付けが与えられる単位に多次元特徴ベクトルを格納する多次元空間データ木構造を分け、各特徴量に与えられた重み付けを加味して効率的な探索を行う、多次元空間データ探索方法と前記方法を実施するプログラムとプログラムを記録した記録媒体とを提供することにある。上記の例では、多次元空間Aのノードが専らアクセスされており、重み付けの大きい多次元空間が優先的にアクセスされることが分かる。
【0121】
なお、本発明は図10に示したシステムの一部又は全部の処理機能をプログラムとして構成してコンピュータを用いて実現すること、あるいは図2、3で示した処理手順をプログラムとして構成してコンピュータに実行させることができる。また、コンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、フレキシブルディスク、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることが可能であり、また、インターネットのような通信ネットワークを介して配布したりすることが可能である。
【0122】
【発明の効果】
以上説明したように、本発明によれば、重み付けが与えられる単位に多次元特徴ベクトルを格納する多次元空間データ木構造を分け、各特徴量に与えられた重み付けを加味して多次元空間データ探索を行うことで、動的な重み付けの変化に対応ができ、少ないノードアクセスでオブジェクトを検出することが可能となり、結果として計算量が減り、探索性能の向上を実現することができる。また、本発明は多次元空間データとして表現される画像、映像、音声、文書等を対象とする広範囲な情報検索に適用可能である。
【図面の簡単な説明】
【図1】多次元空間データの最近傍点探索プロセスのフローチャート。
【図2】アクセス済ノンリーフノード選定過程のフローチャート。
【図3】枝刈過程のフローチャート。
【図4】多次元空間データ木構造の例を示す構成図。
【図5】問い合わせ点Qとの距離および重み付けの例を示す関係図。
【図6】アクセス済リストの例を示す関係図。
【図7】枝刈戦略リストの例を示す関係図。
【図8】アクセス済リストの例を示す関係図。
【図9】枝刈戦略リストの例を示す関係図。
【図10】多次元空間データ探索装置の構成図。
【図11】2次元のデータ空間上の問い合わせ点Qとの最近傍点を求める問題の例を示す構成図。
【符号の説明】
1…入力手段
2…アクセス済ノンリーフノード選定手段
3…枝刈手段
4…最近傍判定手段
5…データ出力手段
6…データベース[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a search technique for multidimensional spatial data stored in a database, and more particularly to a multidimensional spatial data search method, a multidimensional spatial data search device, a multidimensional spatial data search program, and a multidimensional space search program in a multidimensional spatial search. The present invention relates to a recording medium on which a data search program is recorded.
[0002]
[Prior art]
Among the conventional space access methods, there are R-tree and its derivative methods (hereinafter, referred to as R-tree family) as useful methods for searching a high-dimensional space. The R-tree family includes R-tree, R * -tree, Hilbert R-tree, SS-tree, SR-tree, and the like. In each case, the data object is a minimum surrounding area, that is, a minimum bounding rectangle (MBR; Minimum Bounding). Rectangle) or a minimum bounding sphere (MBS), and further has a hierarchical structure. The multidimensional spatial data tree has a structure as shown in the following Expression 1.
[0003]
(Equation 1)
Figure 2004348426
[0004]
Here, ε is the number of entries stored in the node. S represents the MBR of ε child nodes. Also child-node i Allows access to child nodes. The leaf_Node includes n types of multidimensional spatial data F j (J = 1,..., N) are stored. The means for clustering the data objects according to a certain algorithm and defining the MBR and constructing a tree structure differs depending on each R-tree family.
[0005]
[Problems to be solved by the invention]
In the above-mentioned conventional method, it is necessary to construct a multidimensional spatial data tree structure under fixed weighting. In general, the process of constructing a multidimensional spatial data tree structure requires a longer processing time than the process of performing a search. When the weight dynamically changes in the search for weighted multidimensional spatial data, the weight is It is not realistic to construct a multidimensional spatial data tree structure and then perform a search. In addition, the method of constructing a multidimensional spatial data tree structure in advance for each weight variation cannot cope with an infinite number of weight variations.
[0006]
At present, in the conventional method, a dynamically changing multidimensional spatial data search is performed by using a tree structure constructed under a certain fixed weighting, which requires a large amount of calculation, and as a result, processing time is increased. May be longer.
[0007]
As an example, a problem of finding a nearest point to a query point Q in a two-dimensional data space as shown in FIG. 11 will be described. Access is made from non-leaf nodes (corresponding to R1 and R2 in FIG. 11) that are close to the inquiry point Q, and then, the child nodes that are close to each other are accessed. In the conventional method, since the distances between R1 and R2 and Q are equal, the child nodes of R1 and R2 are accessed, and the pruning strategy is performed while calculating the respective distances. However, considering the case where weighting of 1: 0 is performed between these two dimensions x and y, since the y-dimensional numerical value is not reflected in the distance, only the child node in R1 needs to be accessed. Since the tree structure is configured on the assumption that the weight between the two dimensions x and y is 1: 1, the child nodes of R1 and R2 are accessed no matter what weight is given. And implement a pruning strategy. This means that useless calculations are being performed, resulting in a longer processing time.
[0008]
As described above, in the above-described conventional search processing, even when the weights are changed for the n feature vectors, the multidimensional spatial data tree structure must be constructed under the weight fixed in advance. As a result, efficient search cannot be performed as a result.
[0009]
The closest distance between the weighted multidimensional data and the query point Q is expressed by the following equation (2).
[0010]
(Equation 2)
Figure 2004348426
[0011]
Each multi-dimensional spatial data e j (Weight = 1) given to (j = 1,..., N) j If there is a large difference between (j = 1,..., N), a search method taking into account weighting is effective. If the weights are invariable in advance, a multidimensional spatial data tree structure may be constructed using the weighted multidimensional spatial data, but various features such as hue, saturation, brightness, texture, etc. In a system in which the weight given to is dynamically changed every time a multidimensional spatial data search is performed, the amount of calculation is increased, and efficient search may not be performed.
[0012]
For example, in a similar image search, various features such as hue, saturation, brightness, texture, and shape of an image to be searched are extracted to construct a multidimensional spatial data tree structure. There is a system that is generally searched by weighting the extracted feature quantity, such as a search for an image having a similar color or a search for an image having a similar pattern.
[0013]
The present invention can construct a multidimensional spatial data tree structure that stores a multidimensional feature vector for each unit to which a weight is given, and perform an efficient search in consideration of the weight given to each feature amount. It is an object of the present invention to provide a multidimensional spatial data search method, a multidimensional spatial data search device, a multidimensional spatial data search program, and a recording medium that stores the multidimensional spatial data search program.
[0014]
[Means for Solving the Problems]
Therefore, in order to solve the above-mentioned problem, the multidimensional spatial data search method according to claim 1 is a multidimensional spatial data tree structure in which multimedia data stored in a database is stored in a plurality of multidimensional spatial data tree structures. The search is performed by giving priority to the dimensional space data tree structure, and when there is a dimension that does not access the leaf node with respect to the leaf node, the maximum distance (pessimistic distance) that the leaf node can take with respect to that dimension is calculated. If there is a dimension that has not been accessed to the leaf node, the minimum distance (optimistic distance) that the leaf node can take with respect to that dimension is calculated, and the maximum distance (pessimistic distance) and the minimum distance ( (Optimistic distance) to implement the pruning strategy.
[0015]
Also, the multidimensional spatial data search method according to claim 2 is the multidimensional spatial data search method according to claim 1, wherein the leaf node succeeded in pruning another node in the pruning strategy. Holds the index information of the pruned other node, and when it is determined that the leaf node is the nearest node, returns the held index information to the search target space, so that the next nearest node Is searched.
[0016]
Further, the multidimensional spatial data search method according to claim 3 is:
[0017]
[Equation 3]
Figure 2004348426
[0018]
In the multidimensional spatial data tree structure expressed as follows, the accessed non-leaf node selecting means selects all the accessed non-leaf nodes.
[0019]
(Equation 4)
Figure 2004348426
[0020]
The first step of accessing the selected non-leaf node by selecting the non-leaf node to be accessed next, and selecting the accessed non-leaf node by the accessed non-leaf node selecting means, A second step of determining whether the node has a leaf node; if not, determining to return to the first step; otherwise, determining to proceed to the third step; For leaf nodes that have been accessed by mowing means
[0021]
(Equation 5)
Figure 2004348426
[0022]
Calculates the maximum distance from the query point by using
[0023]
(Equation 6)
Figure 2004348426
[0024]
Is calculated by using the maximum distance and the minimum distance, a pruning strategy is performed, and when the minimum distance of the accessed non-leaf node is larger than the maximum distance of the accessed leaf node, the non-leaf The node is to be pruned, and it is determined that the node is deleted from the accessed list holding the set of accessed non-leaf nodes and the procedure proceeds to the fourth step. If it is determined that there is an accessed non-leaf node belonging to the same multidimensional spatial data tree as the accessed leaf node having a smaller distance than the accessed non-leaf node having the smallest distance in the cutting list, the first step And a third step of determining to return to Recently for the neighbor candidate node used as the maximum distance, for all the accessed leaf node other than the nearest neighbor candidate nodes in the pruning strategy list
[0025]
(Equation 7)
Figure 2004348426
[0026]
Is calculated, and the maximum distance is compared with the minimum distance. When the maximum distance of the nearest candidate node is the smallest, it is determined that the nearest candidate node is the nearest multidimensional space data. And performing a fourth step.
[0027]
A multidimensional spatial data search method according to a fourth aspect is the multidimensional spatial data search method according to the third aspect, wherein the pruning means prunes the accessed leaf node in the third step. Is stored in the accessed leaf node, and when the nearest neighbor multidimensional space data is determined in the fourth step by the nearest neighbor determination means, the leaf node that is the nearest neighbor multidimensional spatial data is held. The present invention is characterized in that a multi-dimensional spatial data search is further performed after the node performing the search is returned to the search target.
[0028]
The multidimensional spatial data search method according to claim 5 is
[0029]
[Equation 3]
Figure 2004348426
[0030]
In the multidimensional spatial data tree structure expressed as follows, the accessed non-leaf node selection means selects all the accessed non-leaf nodes.
[0031]
(Equation 4)
Figure 2004348426
[0032]
The first step of accessing the selected non-leaf node by selecting the non-leaf node to be accessed next, and selecting the accessed non-leaf node by the accessed non-leaf node selecting means, A second step of determining whether the node has a leaf node; if not, determining to return to the first step; otherwise, determining to proceed to the third step; For leaf nodes that have been accessed by mowing means
[0033]
(Equation 5)
Figure 2004348426
[0034]
Calculates the maximum distance from the query point by using
[0035]
(Equation 6)
Figure 2004348426
[0036]
The minimum distance to the query point is calculated according to, the distances are arranged in ascending order, and if the one having the smallest distance is a leaf node, it is determined to proceed to the fifth step described later, and the smallest distance is determined. If the stored non-leaf node has a non-leaf node, the accessed non-leaf node having the minimum distance greater than the maximum distance of the accessed leaf node is pruned and deleted from the accessed list holding the accessed non-leaf node set. And a pruning means for judging the presence or absence of a multidimensional spatial data tree having no non-leaf nodes that can be accessed. A fourth step of deciding to proceed to step 5 and, if it is determined that there is no step, a decision of returning to step 1; By the constant unit, for it said maximum distance is smallest leaf node used as the maximum distance, for the other leaf nodes
[0037]
(Equation 7)
Figure 2004348426
[0038]
The minimum distance is calculated by comparing the maximum distance with the minimum distance, and when the maximum distance is the smallest, it is determined that the leaf node having the maximum distance is the nearest multidimensional space data. And 5 steps.
[0039]
According to a sixth aspect of the present invention, in the multidimensional spatial data search method according to the fifth aspect, the pruning means prunes the accessed leaf node in the third step. Is stored in the accessed leaf node, and when the nearest neighbor multidimensional space data is determined in the fifth step by the nearest neighbor determining means, the leaf node that is the nearest neighbor multidimensional spatial data is held. The present invention is characterized in that a multi-dimensional space data search is further performed after returning a node that has been searched to a search target.
[0040]
In the multidimensional spatial data search method according to the present invention, in the nearest neighbor search of the multidimensional spatial data, a first step of accessing a root node of each feature by an accessed non-leaf node selecting unit; A second step of inserting a child node related to the accessed node into the accessed list by the non-leaf node selecting means;
[0041]
[Equation 3]
Figure 2004348426
[0042]
Storing the value calculated in the accessed list in the accessed list, and accessing the non-leaf node selecting means from the accessed list.
[0043]
(Equation 4)
Figure 2004348426
[0044]
A fourth step of selecting the smallest non-leaf node to be accessed next, a fifth step of accessing the selected non-leaf node by the accessed non-leaf node selecting means, and an accessed non-leaf node selection By means, it is determined whether the accessed non-leaf node has a leaf node, and if it does not have a leaf node, it is determined to return to the first step. If it has a leaf node, the next step is determined. A sixth step of deciding to proceed to the step of (a),
[0045]
(Equation 5)
Figure 2004348426
[0046]
A seventh step of calculating the maximum distance from the inquiry point according to the above and inserting it into the pruning strategy list, and the pruning means for the non-leaf node stored in the accessed list.
[0047]
(Equation 6)
Figure 2004348426
[0048]
An eighth step of calculating the minimum distance from the query point according to the above and inserting it into the pruning strategy list; and a ninth step of arranging the nodes in the pruning strategy list in ascending order of the distance value by the pruning means. The pruning means determines whether the node having the smallest distance value is a leaf node. If it is determined that the node is a leaf node, it is determined that the process proceeds to the subsequent thirteenth step. And a pruning means for pruning a non-leaf node having a distance greater than a leaf node in the pruning strategy list, and determining whether to proceed to the next eleventh step. The eleventh step of deleting from the list and the pruning means determine whether there is a multidimensional spatial data tree without a non-leaf node that can be accessed, In this case, it is determined to return to the second step, and when it is determined that there is, a twelfth step of determining to proceed to the next thirteenth step, and a leaf node having the smallest maximum distance is determined by the nearest neighbor determination means. For, use the maximum distance as it is, and for other leaf nodes,
[0049]
(Equation 7)
Figure 2004348426
[0050]
The minimum distance is calculated by comparing the maximum distance with the minimum distance, and when the maximum distance is the smallest, it is determined that the leaf node having the maximum distance is the nearest multidimensional space data. And 13 steps.
[0051]
The multidimensional spatial data search method according to claim 8 is the multidimensional spatial data search method according to claim 7, wherein the pruning unit prunes the leaf nodes in the eleventh step. Is stored in the leaf node, and when the nearest neighbor multidimensional space data is determined in the thirteenth step by the nearest neighbor determination means, the node held by the leaf node that is the nearest neighbor multidimensional spatial data Is returned to the search target, and then a multidimensional spatial data search is further performed.
[0052]
In addition, the multidimensional spatial data search device according to claim 9 includes input means for inputting search information;
[0053]
[Equation 3]
Figure 2004348426
[0054]
A database with a multidimensional spatial data tree structure expressed as follows and all accessed non-leaf nodes
[0055]
(Equation 4)
Figure 2004348426
[0056]
The first step of accessing the selected non-leaf node and selecting whether the accessed non-leaf node has a leaf node An accessed non-leaf node selecting means for executing a second step of determining and returning to the first step if it does not have one, and deciding to proceed to the third step if it has one And if the accessed non-leaf node has a leaf node,
[0057]
(Equation 5)
Figure 2004348426
[0058]
Calculates the maximum distance (pessimistic distance) from the query point by using
[0059]
(Equation 6)
Figure 2004348426
[0060]
, The minimum distance (optimistic distance) from the query point is calculated, the distances are arranged in ascending order, and if the leaf node having the smallest distance is a leaf node, it is determined to proceed to the fifth step described later. If the node having the smallest distance is a non-leaf node, the accessed non-leaf node having the minimum distance (optimistic distance) larger than the maximum distance (pessimistic distance) of the accessed leaf node is pruned, and the access is performed. The third step determines whether to delete the accessed non-leaf node set from the accessed list holding and then proceeds to a fourth step described later, and determines whether there is a multidimensional spatial data tree having no accessible non-leaf node. If it is determined that there is, it is determined to proceed to the fifth step described later, and if it is determined that there is not, it is determined to return to the first step. And pruning means for performing a fourth step, the to the the maximum distance (pessimistic distance) is the smallest leaf node used as the maximum distance (pessimistic distance) For other leaf nodes
[0061]
(Equation 7)
Figure 2004348426
[0062]
, The minimum distance (optimistic distance) is calculated, and the maximum distance (pessimistic distance) is compared with the minimum distance (optimistic distance). If the maximum distance (pessimistic distance) is the smallest, Nearest neighbor determining means for executing a fifth step of determining that a leaf node having a distance (pessimistic distance) is the nearest multidimensional space data; and data output means for outputting the closest multidimensional spatial data. , Consisting of
[0063]
According to a tenth aspect of the present invention, in the multi-dimensional spatial data searching apparatus according to the ninth aspect, the pruning unit prunes the accessed leaf node in the third step. Held in the accessed leaf node, and the nearest neighbor determining means holds the leaf node that is the nearest multidimensional space data when the nearest multidimensional space data is determined in the fifth step. The present invention is characterized in that a multi-dimensional spatial data search is further performed after the node performing the search is returned to the search target.
[0064]
Further, the multidimensional spatial data search device according to claim 11 includes an input unit for inputting search information,
[0065]
[Equation 3]
Figure 2004348426
[0066]
, A first step of accessing a root node of each feature amount, a second step of inserting a child node related to the accessed node into an accessed list, Non-leaf nodes in the list
[0067]
[Equation 3]
Figure 2004348426
[0068]
A third step of storing the value calculated by the above in the accessed list; and
[0069]
(Equation 4)
Figure 2004348426
[0070]
The fourth step of selecting the smallest one as the non-leaf node to be accessed next, the fifth step of accessing the selected non-leaf node, and whether the accessed non-leaf node has a leaf node Judgment is performed, and if it does not have a leaf node, it is decided to return to the first step, and if it has a leaf node, it is decided to proceed to the next step. Accessed non-leaf node selection means and accessed leaf nodes
[0071]
(Equation 5)
Figure 2004348426
[0072]
The seventh step of calculating the maximum distance (pessimistic distance) from the query point and inserting it into the pruning strategy list, and regarding the non-leaf nodes stored in the accessed list
[0073]
(Equation 6)
Figure 2004348426
[0074]
An eighth step of calculating the minimum distance (optimistic distance) from the query point and inserting it into the pruning strategy list, and a ninth step of arranging the nodes in the pruning strategy list in ascending order of distance value. It is determined whether the node having the smallest value of the distance is a leaf node. If it is determined that the node is a leaf node, it is determined to proceed to the subsequent thirteenth step. A pruning step for deciding to proceed to the next eleventh step, an eleventh step of pruning a non-leaf node having a greater distance than a leaf node in the pruning strategy list and deleting it from the accessed list, It is determined whether there is a multidimensional spatial data tree without a possible non-leaf node. If it is determined that there is no non-leaf node, it is determined to return to the second step. And pruning means for performing a twelfth step of determining to proceed to the next 13th step, the in case of,
For the leaf node having the smallest maximum distance (pessimistic distance), the maximum distance (pessimistic distance) is used as it is, and for the other leaf nodes,
[0075]
(Equation 7)
Figure 2004348426
[0076]
, The minimum distance (optimistic distance) is calculated, and the maximum distance (pessimistic distance) is compared with the minimum distance (optimistic distance). If the maximum distance (pessimistic distance) is the smallest, Nearest neighbor determining means for executing a thirteenth step of determining that a leaf node having a distance (pessimistic distance) is the nearest multidimensional space data; and data output means for outputting the nearest neighbor multidimensional spatial data. , Consisting of
[0077]
The multidimensional spatial data search device according to claim 12 is the multidimensional spatial data search device according to claim 11, wherein the pruning means includes a node pruned into a leaf node in the eleventh step. Is stored in the leaf node, and when the nearest multidimensional space data is determined in the thirteenth step, the nearest neighbor multidimensional spatial data is stored in the leaf node. Is returned to the search target, and then a multidimensional spatial data search is further performed.
[0078]
A computer program according to a thirteenth aspect of the present invention describes the multidimensional spatial data search method or the multidimensional spatial data search device according to any one of the first to twelfth aspects as a computer program and executes the method. It is made possible.
[0079]
According to a fourteenth aspect of the present invention, there is provided a recording medium storing the multidimensional spatial data search method or the multidimensional spatial data search device according to any one of the first to twelfth aspects in a computer-executable manner. Is recorded.
[0080]
According to the present invention as set forth in claims 1, 3, 5, 7, 9, and 11, a multi-dimensional spatial data tree structure and a multi-dimensional spatial data in an R-tree family or the like can be obtained. Using an updating method, the data is stored as an independent multidimensional spatial data tree structure. The multidimensional spatial data tree structure is represented by the following Equation 3.
[0081]
[Equation 3]
Figure 2004348426
[0082]
Here, ε is the number of entries stored in the node. S represents the MBR of ε child nodes. Also child-node i Allows access to child nodes. leaf_Node j Includes n kinds of multidimensional spatial data F j (J = 1,..., N) are stored. Equation 3 shows n types of independent multidimensional spatial data tree structures. Then, the order of accessing the nodes is determined by the numerical value shown in the following Expression 4, and the nodes are accessed in ascending order of the numerical value.
[0083]
(Equation 4)
Figure 2004348426
[0084]
Here, Q is an inquiry point, and min dist (Q, non_leaf_Node i ) Indicates the query point Q and the non_leaf_Node i Represents the minimum distance between Also weight i Is a weight given to the multidimensional spatial data tree structure i. According to this access order determination method, it is possible to preferentially scan the tree structure of the multidimensional feature vector having a large weight and a small distance from the query point.
[0085]
As the access is advanced, a leaf node will appear in due course, but with a numerical value defined by the following formula 5 (hereinafter, pessimistic distance), and for a non-leaf node, a numerical value defined by the following formula 6 (hereinafter, optimistic distance) To perform a pruning strategy.
[0086]
(Equation 5)
Figure 2004348426
[0087]
Here, cur_acc_non_leaf_Node i Represents the set of non-leaf nodes that are currently being accessed. Equation 5 employs the distance to the query point for leaf nodes that have been accessed as they are. The weighting distance is calculated by adopting the distance in the case where the distance can be maximized.
[0088]
(Equation 6)
Figure 2004348426
[0089]
Where cur_acc_Node i Represents the set of all nodes that are currently being accessed. Equation 6 employs the distance from the query point for leaf nodes that have already been accessed, and sets the query point when leaf nodes have not been reached. The weighting distance is calculated by adopting the distance in the case where the distance to the distance can be minimized.
[0090]
Equation 7 below is an equation for calculating an optimistic distance in the nearest neighbor determination process.
[0091]
(Equation 7)
Figure 2004348426
[0092]
Here, cur_acc_nonleaf_Node i Represents the set of all the non-leaf nodes that are currently being accessed. Equation 7 uses the distance from the query point as it is for the accessed leaf node, and queries the distance when the leaf node has not been reached. The weighting distance is calculated by adopting the distance when the distance to the point can be minimized.
[0093]
Comparing the pessimistic distance and the optimistic distance, if the pessimistic distance for a certain leaf node is smaller than the optimistic distance for a certain node, the leaf node will be It can be guaranteed that the node is closer than a leaf node included in a certain node.
[0094]
According to the second, fourth, eighth, tenth, and twelfth aspects of the present invention, the problem of obtaining the top k points having a small distance from the inquiry point Q is described in the first, third, fifth, seventh, ninth, and eleventh aspects. Even after the nearest point is determined by the multi-dimensional space data search method described above, a method of efficiently searching for a point having the next smallest distance to the inquiry point Q is provided.
In other words, when the pessimistic distance of the leaf node is compared with the optimistic distance of another node according to claims 1, 3, 5, 7, 9, and 11, when the pruning is performed, the node excluded from the search target due to the pruning. Is held in the leaf node that has successfully pruned, and when the nearest neighbor is determined, the node held by the nearest leaf node is returned to the search target set.
[0095]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0096]
As shown in FIG. 1, the nearest neighbor search of multidimensional spatial data takes three main processes. The first is an accessed non-leaf node selection process of determining which non-leaf node is to be accessed in the next step from the accessed non-leaf node set (S10). The second is a pruning process of performing pruning using the pessimistic distance for the accessed leaf node and the optimistic distance for the accessed non-leaf node (S20). The third is a nearest neighbor determination step (S30) of determining whether the accessed leaf node is the nearest neighbor vector.
[0097]
FIG. 10 is a configuration diagram of an apparatus for performing multidimensional spatial data search according to the present invention. As shown in FIG. 10, the apparatus includes an input unit 1, an accessed non-leaf node selecting unit 2, a pruning unit 3, a nearest neighbor judging unit 4, a data output unit 5, and a database 6. The accessed non-leaf node selecting step (S10) is executed by the accessed non-leaf node selecting means 2, the pruning step (S20) is executed by the pruning means 3, and the nearest neighbor determining step (S30) is performed by the nearest neighbor determining means. 4 is performed. Further, the database 6 stores a plurality of multidimensional spatial data tree structures that organize multimedia data to be searched.
[0098]
In the accessed non-leaf node selecting step (S10), the next non-leaf node to be accessed is selected by the evaluation function shown in the above equation (4). In this process, an “accessed list” data structure that holds the shortest distance between the accessed non-leaf node and the matching point and the evaluation value according to the above equation 4 is used. The accessed list stores non-leaf nodes relating to n types of multidimensional spatial data. For all the non-leaf nodes held in the accessed list, a numerical value obtained by the evaluation function shown by the above equation 4 is calculated, and the one with the minimum numerical value is selected as the next non-leaf node to be accessed. By this operation, a non-leaf node having a large weight and a short distance from the inquiry point is selected. This means that non-leaf nodes that are likely to include the nearest point are accessed with priority. When the accessed non-leaf node selection process (S10) proceeds, the leaf node is eventually accessed.
[0099]
In the pruning process (S20), the pessimistic distance between the accessed leaf node and the query point represented by the above formula 5 and the optimistic distance between the accessed non-leaf node and the query point represented by the above formula 6 are used. Perform a pruning strategy. If the optimistic distance of the accessed non-leaf node is larger than the pessimistic distance of the accessed leaf node, the non-leaf node is pruned and deleted from the accessed list holding the accessed non-leaf node set.
[0100]
Further, in the second, fourth, sixth, eighth, tenth, and twelfth aspects, a “pruning list” data structure in which a pruned leaf node is held in each node is used, and pruned by a certain accessed leaf node. The stored node is stored in the pruning list of the accessed leaf node.
[0101]
In this process, the pessimistic distance is calculated for all the accessed leaf nodes, and the optimistic distance is calculated for all the accessed non-leaf nodes. Is possible. Using the "pruning strategy list" data structure which holds the optimistic distance and the pessimistic distance of each node, the nodes are pruned by being arranged in ascending order of distance. After arranging the pruning strategy list in ascending order of distance, if the accessed leaf node takes the minimum value, or if the multidimensional spatial data tree to which the accessed leaf node belongs has been accessed, this access The completed leaf node becomes the nearest neighbor candidate node, and proceeds to the next nearest neighbor determination step (S30). In addition, when the mowing is not performed, or when the access belongs to the same multidimensional spatial data tree as the accessed leaf node having a smaller distance than the accessed non-leaf node having the smallest distance in the pruning strategy list. If an already-existing non-leaf node exists, the process returns to the accessed non-leaf node selecting step (S10), and the next non-leaf node to be accessed is selected.
[0102]
In the nearest neighbor determination step (S30), in the pruning strategy list, among the accessed leaf nodes having the smallest distance or the accessed leaf nodes to which all the belonging multidimensional spatial data trees have been accessed. It is determined whether the one with the smallest distance is smaller than the other accessed leaf nodes.
[0103]
In this process, the pessimistic distance is calculated for the nearest candidate node selected by the pruning strategy list, and for all accessed leaf nodes other than the nearest candidate node in the pruning strategy list, the optimistic The distances are calculated, and as a result of comparing these distances, when the pessimistic distance of the nearest neighbor candidate node is the smallest, it is determined that this nearest neighbor node is the nearest neighbor multidimensional space data.
[0104]
According to claims 2, 4, 6, 8, 10, and 12, a pruned non-leaf node and a leaf node held in a pruning list for a node determined to be the nearest multidimensional space data. Are re-inserted into the accessed list and the pruning strategy list, respectively, and the nearest neighbor search is repeatedly performed.
[0105]
FIGS. 2 and 3 show flowcharts of the accessed non-leaf node selecting step (S10), the pruning step (S20), and the nearest neighbor determining step (S30), respectively.
[0106]
Here, an example of the nearest neighbor search method will be described using the examples shown in FIGS. 4 and 5.
For example, it is assumed that there are two types of feature vectors A and B, which are a-dimensional and b-dimensional feature vectors. And inquiry point Q A , Q B It is assumed that the purpose is to obtain a weighted nearest neighbor of At this time, the feature vectors A and B are weighted by W A , W B And It is also assumed that feature vectors A and B are stored in a multidimensional spatial data tree structure as shown in FIG. As a method of storing the multidimensional spatial data of each feature vector in the multidimensional spatial data tree structure, a conventional technique such as the R-tree family may be used. Here, the multidimensional spatial data tree structure is configured by the R-tree. Suppose you have been. The distance between the nodes in the multidimensional spaces A and B and the inquiry point Q is as shown in FIG.
[0107]
First, access is made from the root node of the feature space vector tree. As shown in FIG. 4, the root nodes include the following Rα, Rβ, Rγ, and Rδ, insert them into the accessed list, calculate the value by the evaluation function of each of the above formulas 4, and determine the smallest one. Select (accessed non-leaf node selection process). Table 1 below shows the calculation based on Equation 4.
[0108]
[Table 1]
Figure 2004348426
[0109]
FIG. 6 shows the accessed list. Since Rα is the smallest from the value obtained by the evaluation function, Rα is selected as a node to access. Next, when Rα is accessed, as shown in FIG. 4, R3, R6, and R7 exist as leaf nodes. Since these are leaf nodes, their pessimistic distances and the optimistic distances of the nodes inserted into the currently accessed non-leaf nodes are calculated, and then inserted into the pruning strategy list to perform pruning. These calculations are shown in Table 2 below.
[0110]
[Table 2]
Figure 2004348426
[0111]
Since the pruning strategy list is as shown in FIG. 7 and pruning has not been performed, a node to be accessed next is selected from the accessed non-leaf nodes. The accessed list is as shown in FIG. 8, and Rβ is selected. When Rβ is accessed, leaf nodes R4 and R5 are present as shown in FIG.
[0112]
Since these are leaf nodes, these pessimistic distances and optimistic distances regarding the nodes inserted in the currently accessed non-leaf nodes are calculated and then inserted into the pruning strategy list. Perform pruning. These calculations are shown in Table 3 below.
[0113]
[Table 3]
Figure 2004348426
[0114]
Since the pruning strategy list is as shown in FIG. 9, the optimistic distance of the non-leaf nodes (Rδ, Rγ) is smaller than the pessimistic distance of the leaf nodes (R6, R5, R3, R4, R7). Again, pruning is not performed.
[0115]
At this point, the access has been completed for all of the feature space vectors A, and since there is no more node to access according to the evaluation in S360 in FIG. 3, the nearest neighbor using the information of the leaf node accessed so far is used. Proceed to the determination process.
[0116]
Here, the pessimistic distance of the nearest neighbor node R6 selected by the pruning strategy list is calculated, and the optimistic equation 7 is used for all the accessed leaf nodes other than the nearest candidate node in the pruning strategy list. The calculation of the distance is shown in Table 4 below.
[0117]
[Table 4]
Figure 2004348426
[0118]
As a result, since the pessimistic distance of R6 is smaller than the optimistic distance of all the remaining leaf nodes, it is determined that R6 is the nearest node.
[0119]
In the case of claims 2, 4, 6, 8, 10, and 12, in this case, since R6 prunes R5, R3, R4, and R7, these four nodes are held in the pruning list of R6. That is, since R6 is the nearest node, the values of all the nodes held by R6 in the pruning list are referred to in all processes. Then, the same processing is performed to continuously search for the data closest to the second.
[0120]
The present invention provides a multidimensional spatial data search that divides a multidimensional spatial data tree structure storing multidimensional feature vectors into units to which weights are given, and performs an efficient search in consideration of the weight given to each feature amount. An object of the present invention is to provide a method, a program for performing the method, and a recording medium on which the program is recorded. In the above example, it can be seen that the nodes in the multidimensional space A are exclusively accessed, and the multidimensional space with a large weight is preferentially accessed.
[0121]
In the present invention, a part or all of the processing functions of the system shown in FIG. 10 may be configured as a program and realized using a computer, or the processing procedures shown in FIGS. Can be executed. Further, a program for causing a computer to execute the processing procedure is recorded and stored on a recording medium readable by the computer, for example, a flexible disk, an MO, a ROM, a memory card, a CD, a DVD, a removable disk, and the like. And can be provided and distributed via a communication network such as the Internet.
[0122]
【The invention's effect】
As described above, according to the present invention, a multidimensional spatial data tree structure storing a multidimensional feature vector is divided into weighted units, and the multidimensional spatial data By performing the search, it is possible to cope with a change in the dynamic weighting, and it is possible to detect the object with a small number of node accesses. As a result, the calculation amount is reduced, and the search performance can be improved. Further, the present invention is applicable to a wide range of information retrieval for images, videos, sounds, documents, and the like expressed as multidimensional spatial data.
[Brief description of the drawings]
FIG. 1 is a flowchart of a nearest neighbor point search process of multidimensional spatial data.
FIG. 2 is a flowchart of an accessed non-leaf node selection process.
FIG. 3 is a flowchart of a pruning process.
FIG. 4 is a configuration diagram showing an example of a multidimensional spatial data tree structure.
FIG. 5 is a relationship diagram showing an example of a distance to an inquiry point Q and weighting.
FIG. 6 is a relationship diagram showing an example of an accessed list.
FIG. 7 is a relationship diagram showing an example of a pruning strategy list.
FIG. 8 is a relationship diagram showing an example of an accessed list.
FIG. 9 is a relationship diagram showing an example of a pruning strategy list.
FIG. 10 is a configuration diagram of a multidimensional spatial data search device.
FIG. 11 is a configuration diagram showing an example of a problem of finding a nearest point to an inquiry point Q in a two-dimensional data space.
[Explanation of symbols]
1. Input means
2. Accessed non-leaf node selection means
3. Pruning means
4: Nearest neighbor determination means
5. Data output means
6 ... Database

Claims (14)

データベースに格納されるマルチメディアデータを複数の多次元空間データ木構造に格納したものについて、
重み付けが強い多次元空間データ木構造を優先して探索し、
リーフノードに関して、リーフノードまでアクセスしていない次元が存在する場合に、その次元に関してリーフノードがとり得る最大距離を算出し、
アクセス済みのノードに関して、リーフノードまでアクセスしていない次元が存在する場合に、その次元に関してリーフノードがとり得る最小距離を算出し、前記最大距離と最小距離とを用いて枝刈戦略を実施することを特徴とする多次元空間データ探索方法。
About the multimedia data stored in the database stored in multiple multi-dimensional spatial data tree structure,
Multi-dimensional spatial data tree structure with strong weight is searched first,
For a leaf node, if there is a dimension that does not access the leaf node, calculate the maximum distance that the leaf node can take for that dimension,
When there is a dimension that has not been accessed to the leaf node with respect to the accessed node, a minimum distance that the leaf node can take for that dimension is calculated, and a pruning strategy is performed using the maximum distance and the minimum distance. A multidimensional spatial data search method characterized by the following.
前記請求項1に記載の多次元空間データ探索方法において、
前記枝刈戦略の際に、他のノードの枝刈に成功したリーフノードに、枝刈した他ノードのインデックス情報を保持し、そのリーフノードが最近傍ノードであることが確定した際に、保持していたインデックス情報を探索対象空間に戻すことにより、次の最近傍ノードを探索することを特徴とする多次元空間データ探索方法。
The multidimensional spatial data search method according to claim 1,
At the time of the pruning strategy, the index information of the pruned other node is held in the leaf node that has successfully pruned the other node, and held when the leaf node is determined to be the nearest node. A multidimensional spatial data search method characterized by searching for the next nearest node by returning index information that has been used to the search target space.
Figure 2004348426
のように表される多次元空間データ木構造において、
アクセス済ノンリーフノード選定手段により、すべてのアクセス済ノンリーフノードついて
Figure 2004348426
により数値を算出し、算出される数値が最小のものを次にアクセスするノンリーフノードとして選定し、選定したノンリーフノードにアクセスする第1ステップと、
アクセス済ノンリーフノード選定手段により、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、有していない場合には第1ステップに戻ることを決定し、有している場合には第3ステップに進むことを決定する第2ステップと、
枝刈手段により、アクセス済リーフノードについて
Figure 2004348426
により問い合わせ点との最大距離を算出し、
アクセス済ノンリーフノードについて
Figure 2004348426
により問い合わせ点との最小距離を算出し、前記最大距離と最小距離とを用いて枝刈戦略を行い、アクセス済リーフノードの最大距離よりもアクセス済ノンリーフノードの最小距離が大きい場合に、そのノンリーフノードは枝刈の対象となり、アクセス済ノンリーフノード集合を保持しているアクセス済リストから削除して第4ステップに進むことを決定し、また前記技刈戦略が行われなかった場合、若しくは前記枝刈リスト中で最も小さい距離を持つアクセス済ノンリーフノードよりも、小さい距離を持つそのアクセス済リーフノードと同じ多次元空間データ木に所属するアクセス済ノンリーフノードが存在すると判断した場合は、第1ステップに戻ることを決定する第3ステップと、
最近傍判定手段により、前記枝刈戦略により選定された最近傍候補ノードについては前記最大距離をそのまま用い、枝刈戦略リスト中の最近傍候補ノード以外の全アクセス済リーフノードについては
Figure 2004348426
により最小距離を算出し、これらの最大距離と最小距離とを比較し、最近傍候補ノードの最大距離が最も小さい場合に、この最近傍候補ノードが最近傍の多次元空間データであることを確定する第4ステップと、からなることを特徴とする多次元空間データ探索方法。
Figure 2004348426
In a multidimensional spatial data tree structure represented as
All accessed non-leaf nodes are selected by the accessed non-leaf node selection means.
Figure 2004348426
A first step of calculating a numerical value according to, selecting the smallest non-leaf node to be accessed next, and accessing the selected non-leaf node;
The accessed non-leaf node selecting means determines whether the accessed non-leaf node has a leaf node, and if not, determines to return to the first step. A second step of deciding to go to a step;
Pruning means for accessed leaf nodes
Figure 2004348426
Calculates the maximum distance from the query point by
About accessed non-leaf nodes
Figure 2004348426
Is calculated by using the maximum distance and the minimum distance, a pruning strategy is performed, and when the minimum distance of the accessed non-leaf node is larger than the maximum distance of the accessed leaf node, the non-leaf The node is to be pruned, and it is determined that the node is deleted from the accessed list holding the set of accessed non-leaf nodes and the procedure proceeds to the fourth step. If it is determined that there is an accessed non-leaf node belonging to the same multidimensional spatial data tree as the accessed leaf node having a smaller distance than the accessed non-leaf node having the smallest distance in the cutting list, the first step A third step of determining to return to
By the nearest neighbor determination means, the maximum distance is used as it is for the nearest neighbor node selected by the pruning strategy, and for all accessed leaf nodes other than the nearest neighbor node in the pruning strategy list,
Figure 2004348426
Is calculated, and the maximum distance is compared with the minimum distance. When the maximum distance of the nearest candidate node is the smallest, it is determined that the nearest candidate node is the nearest multidimensional space data. A multi-dimensional spatial data search method.
前記請求項3に記載の多次元空間データ探索方法において、
前記枝刈手段により、前記第3ステップでアクセス済リーフノードに枝刈されたノードを、前記アクセス済リーフノードに保持し、
前記最近傍判定手段により、前記第4ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする多次元空間データ探索方法。
The multidimensional spatial data search method according to claim 3,
Holding the pruned node in the accessed leaf node in the third step by the pruning means in the accessed leaf node;
When the nearest neighbor multidimensional space data is determined in the fourth step by the nearest neighbor determination means, the node held by the leaf node, which is the nearest neighbor multidimensional space data, is returned to the search target. A multidimensional spatial data search method characterized by performing a multidimensional spatial data search.
Figure 2004348426
のように表される多次元空間データ木構造において、
アクセス済ノンリーフノード選定手段により、すべてのアクセス済ノンリーフノードについて
Figure 2004348426
により数値を算出し、算出される数値が最小のものを次にアクセスするノンリーフノードとして選定し、選定したノンリーフノードにアクセスする第1ステップと、
アクセス済ノンリーフノード選定手段により、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、有していない場合には第1ステップに戻ることを決定し、有している場合には第3ステップに進むことを決定する第2ステップと、
枝刈手段により、アクセス済リーフノードについて
Figure 2004348426
により問い合わせ点との最大距離を算出し、
アクセス済ノンリーフノードについて
Figure 2004348426
により問い合わせ点との最小距離を算出し、距離の値が小さい順に整列させ、最も小さい距離を有するものがリーフノードである場合には後述の第5ステップに進むことを決定し、最も小さい距離を有するものがノンリーフノードである場合には、アクセス済リーフノードの最大距離よりも大きい最小距離を有するアクセス済ノンリーフノードを枝刈し、アクセス済ノンリーフノード集合を保持しているアクセス済リストから削除してから後述の第4ステップに進むことを決定する、第3ステップと、
枝刈手段により、アクセスできるノンリーフノードが無い多次元空間データ木の有無を判断し、有ると判断した場合は後述の第5ステップに進むことを決定し、無いと判断した場合は第1ステップに戻ることを決定する第4ステップと、
最近傍判定手段により、前記最大距離が最も小さいリーフノードについては前記最大距離をそのまま用い、それ以外のリーフノードについては
Figure 2004348426
により最小距離を算出し、これらの最大距離と最小距離とを比較し、前記最大距離が最も小さい場合に、この最大距離を有するリーフノードが最近傍の多次元空間データであることを確定する第5ステップと、からなることを特徴とする多次元空間データ探索方法。
Figure 2004348426
In a multidimensional spatial data tree structure represented as
All accessed non-leaf nodes are selected by the accessed non-leaf node selection means.
Figure 2004348426
A first step of calculating a numerical value according to, selecting the smallest non-leaf node to be accessed next, and accessing the selected non-leaf node;
The accessed non-leaf node selecting means determines whether the accessed non-leaf node has a leaf node, and if not, determines to return to the first step. A second step of deciding to go to a step;
Pruning means for accessed leaf nodes
Figure 2004348426
Calculates the maximum distance from the query point by
About accessed non-leaf nodes
Figure 2004348426
The minimum distance to the query point is calculated according to, the distances are arranged in ascending order, and if the one having the smallest distance is a leaf node, it is determined to proceed to the fifth step described later, and the smallest distance is determined. If the stored non-leaf node has a non-leaf node, the accessed non-leaf node having the minimum distance greater than the maximum distance of the accessed leaf node is pruned and deleted from the accessed list holding the accessed non-leaf node set. A third step of deciding to proceed to a fourth step described later,
The pruning means determines the presence or absence of a multidimensional spatial data tree for which there is no non-leaf node that can be accessed. If it is determined that there is, the process proceeds to the fifth step described later. A fourth step of deciding to return;
By the nearest neighbor determination means, the maximum distance is used as it is for the leaf node having the smallest maximum distance, and the other leaf nodes are used for the other leaf nodes.
Figure 2004348426
The minimum distance is calculated by comparing the maximum distance with the minimum distance, and when the maximum distance is the smallest, it is determined that the leaf node having the maximum distance is the nearest multidimensional space data. 5. A multidimensional spatial data search method, comprising: 5 steps.
前記請求項5に記載の多次元空間データ探索方法において、
前記枝刈手段により、前記第3ステップでアクセス済リーフノードに枝刈されたノードを、前記アクセス済リーフノードに保持し、
前記最近傍判定手段により、前記第5ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする多次元空間データ探索方法。
The multidimensional spatial data search method according to claim 5,
Holding the pruned node in the accessed leaf node in the third step by the pruning means in the accessed leaf node;
When the nearest neighbor multidimensional space data is determined in the fifth step by the nearest neighbor determination means, the node held by the leaf node, which is the nearest neighbor multidimensional space data, is returned to the search target. A multidimensional spatial data search method characterized by performing a multidimensional spatial data search.
多次元空間データの最近傍探索において、
アクセス済ノンリーフノード選定手段により、各特徴量のルートノードにアクセスする第1ステップと、
アクセス済ノンリーフノード選定手段により、アクセスしたノードに関する子ノードをアクセス済リストに挿入する第2ステップと、
アクセス済ノンリーフノード選定手段により、アクセス済リストのノンリーフノードについて
Figure 2004348426
により算出される値をアクセス済リストに格納する第3ステップと、
アクセス済ノンリーフノード選定手段により、前記アクセス済リストから
Figure 2004348426
により算出される値が、最も小さいものを次にアクセスするノンリーフノードとして選定する第4ステップと、
アクセス済ノンリーフノード選定手段により、選定したノンリーフノードにアクセスする第5ステップと、
アクセス済ノンリーフノード選定手段により、アクセスしたノンリーフノードがリーフノードを有しているかを判断し、リーフノードを有していない場合には第1ステップに戻ることを決定し、リーフノードを有している場合には次のステップに進むことを決定する第6ステップと、
枝刈手段により、アクセス済リーフノードについて
Figure 2004348426
により問い合わせ点との最大距離を算出し、枝刈戦略リストに挿入する第7ステップと、
枝刈手段により、アクセス済リストに格納されているノンリーフノードについて
Figure 2004348426
により問い合わせ点との最小距離を算出し、枝刈戦略リストに挿入する第8ステップと、
枝刈手段により、前記枝刈戦略リスト中の各ノードを距離の値が小さい順に整列させる第9ステップと、
枝刈手段により、最も小さい距離の値を有するノードがリーフノードであるかを判断し、リーフノードであると判断した場合には後段の第13ステップに進むことを決定し、リーフノードではないと判断した場合には次の第11ステップに進むことを決定する第10ステップと、
枝刈手段により、前記枝刈戦略リスト中のリーフノードより大きい距離を持つノンリーフノードを枝刈し、アクセス済リストから削除する第11ステップと、枝刈手段により、アクセスできるノンリーフノードが無い多次元空間データ木が有るかを判断し、無いと判断した場合には第2ステップに戻ることを決定し、有ると判断した場合には次の第13ステップに進むことを決定する第12ステップと、
最近傍判定手段により、前記最大距離が最も小さいリーフノードについては前記最大距離をそのまま用い、それ以外のリーフノードについては
Figure 2004348426
により最小距離を算出し、これらの最大距離と最小距離とを比較し、前記最大距離が最も小さい場合に、この最大距離を有するリーフノードが最近傍の多次元空間データであることを確定する第13ステップと、からなることを特徴とする多次元空間データ探索方法。
In the nearest neighbor search of multidimensional spatial data,
A first step of accessing a root node of each feature amount by an accessed non-leaf node selecting unit;
A second step of inserting a child node relating to the accessed node into the accessed list by the accessed non-leaf node selecting means;
About the non-leaf node of the accessed list by the accessed non-leaf node selection means
Figure 2004348426
A third step of storing in the accessed list the value calculated by
By the accessed non-leaf node selecting means, from the accessed list
Figure 2004348426
A fourth step of selecting the smallest one as the non-leaf node to be accessed next,
A fifth step of accessing the selected non-leaf node by the accessed non-leaf node selecting means;
The accessed non-leaf node selecting means determines whether or not the accessed non-leaf node has a leaf node. If the accessed non-leaf node does not have a leaf node, it is determined to return to the first step. A sixth step of deciding to proceed to the next step, if any;
Pruning means for accessed leaf nodes
Figure 2004348426
A seventh step of calculating the maximum distance from the query point according to and inserting it into the pruning strategy list;
Non-leaf nodes stored in the accessed list by the pruning means
Figure 2004348426
An eighth step of calculating the minimum distance from the query point according to and inserting it into the pruning strategy list;
A ninth step in which the pruning means arranges the nodes in the pruning strategy list in ascending order of distance value;
The pruning means determines whether the node having the smallest value of the distance is a leaf node. If it is determined that the node is a leaf node, it is determined to proceed to the following thirteenth step. A tenth step of deciding to proceed to the next eleventh step if determined,
An eleventh step of pruning a non-leaf node having a greater distance than a leaf node in the pruning strategy list by the pruning means and deleting the non-leaf node from the accessed list; A twelfth step of determining whether there is a spatial data tree; if not, deciding to return to the second step; otherwise, deciding to proceed to the next thirteenth step;
By the nearest neighbor determination means, the maximum distance is used as it is for the leaf node having the smallest maximum distance, and the other leaf nodes are used for the other leaf nodes.
Figure 2004348426
The minimum distance is calculated by comparing the maximum distance with the minimum distance, and when the maximum distance is the smallest, it is determined that the leaf node having the maximum distance is the nearest multidimensional space data. 13. A multidimensional spatial data search method, comprising: 13 steps.
前記請求項7に記載の多次元空間データ探索方法において、
前記枝刈手段により、前記第11ステップでリーフノードに枝刈されたノードを、前記リーフノードに保持し、
前記最近傍判定手段により、前記第13ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする多次元空間データ探索方法。
The multidimensional spatial data search method according to claim 7,
Holding the node pruned into the leaf node in the eleventh step by the pruning means in the leaf node;
When the nearest-neighbor multidimensional space data is determined in the thirteenth step by the nearest-neighbor determination means, the node held by the leaf node, which is the nearest-neighbor multidimensional space data, is returned to the search target. A multidimensional spatial data search method characterized by performing a multidimensional spatial data search.
検索情報を入力する入力手段と、
Figure 2004348426
のように表される多次元空間データ木構造を有するデータベースと、
すべてのアクセス済ノンリーフノードについて
Figure 2004348426
により数値を算出し、算出される数値が最小のものを次にアクセスするノンリーフノードとして選定し、選定したノンリーフノードにアクセスする第1ステップと、
アクセスしたノンリーフノードがリーフノードを有しているかを判断し、有していない場合には第1ステップに戻ることを決定し、有している場合には第3ステップに進むことを決定する第2ステップと、を実行するアクセス済ノンリーフノード選定手段と、
アクセスしたノンリーフノードがリーフノードを有している場合に、アクセス済リーフノードについて
Figure 2004348426
により問い合わせ点との最大距離を算出し、
アクセス済ノンリーフノードについて
Figure 2004348426
により問い合わせ点との最小距離を算出し、距離の値が小さい順に整列させ、最も小さい距離を有するものがリーフノードである場合には後述の第5ステップに進むことを決定し、最も小さい距離を有するものがノンリーフノードである場合には、アクセス済リーフノードの最大距離よりも大きい最小距離を有するアクセス済ノンリーフノードを枝刈し、アクセス済ノンリーフノード集合を保持しているアクセス済リストから削除してから後述の第4ステップに進むことを決定する、第3ステップと、
アクセスできるノンリーフノードが無い多次元空間データ木の有無を判断し、有ると判断した場合は後述の第5ステップに進むことを決定し、無いと判断した場合は第1ステップに戻ることを決定する第4ステップと、を実行する枝刈手段と、
前記最大距離が最も小さいリーフノードについては前記最大距離をそのまま用い、それ以外のリーフノードについては
Figure 2004348426
により最小距離を算出し、これらの最大距離と最小距離とを比較し、前記最大距離が最も小さい場合に、この最大距離を有するリーフノードが最近傍の多次元空間データであることを確定する第5ステップを実行する最近傍判定手段と、
前記最近傍多次元空間データを出力するデータ出力手段と、からなることを特徴とする多次元空間データ探索装置。
Input means for inputting search information;
Figure 2004348426
A database having a multidimensional spatial data tree structure represented as
For all accessed non-leaf nodes
Figure 2004348426
A first step of calculating a numerical value according to, selecting the smallest non-leaf node to be accessed next, and accessing the selected non-leaf node;
It is determined whether the accessed non-leaf node has a leaf node, and if not, it is determined to return to the first step, and if it has, it is determined to proceed to the third step. An accessed non-leaf node selecting means for executing two steps;
If the accessed non-leaf node has a leaf node,
Figure 2004348426
Calculates the maximum distance from the query point by
About accessed non-leaf nodes
Figure 2004348426
The minimum distance to the query point is calculated according to, the distances are arranged in ascending order, and if the one having the smallest distance is a leaf node, it is determined to proceed to the fifth step described later, and the smallest distance is determined. If the stored non-leaf node has a non-leaf node, the accessed non-leaf node having the minimum distance greater than the maximum distance of the accessed leaf node is pruned and deleted from the accessed list holding the accessed non-leaf node set. A third step of deciding to proceed to a fourth step described later,
The presence / absence of a multidimensional spatial data tree having no accessible non-leaf node is determined. If it is determined that there is a non-leaf node, it is determined to proceed to a fifth step described later. Pruning means for performing a fourth step;
For the leaf node with the smallest maximum distance, the maximum distance is used as it is, and for the other leaf nodes,
Figure 2004348426
The minimum distance is calculated by comparing the maximum distance with the minimum distance, and when the maximum distance is the smallest, it is determined that the leaf node having the maximum distance is the nearest multidimensional space data. Nearest-neighbor determination means for executing five steps;
And a data output means for outputting the nearest neighbor multidimensional space data.
前記請求項9に記載の多次元空間データ探索装置において、前記枝刈手段は、前記第3ステップでアクセス済リーフノードに枝刈されたノードを、前記アクセス済リーフノードに保持し、
前記最近傍判定手段は、前記第5ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする多次元空間データ探索装置。
10. The multidimensional spatial data search device according to claim 9, wherein the pruning unit holds, in the accessed leaf node, a node pruned in the accessed leaf node in the third step.
The nearest neighbor judging means returns the node held by the leaf node, which is the nearest multidimensional space data, to the search target when the nearest multidimensional space data is determined in the fifth step, and further, A multidimensional spatial data search device for performing multidimensional spatial data search.
検索情報を入力する入力手段と、
Figure 2004348426
のように表される多次元空間データ木構造を有するデータベースと、
各特徴量のルートノードにアクセスする第1ステップと、
アクセスしたノードに関する子ノードをアクセス済リストに挿入する第2ステップと、
アクセス済リストのノンリーフノードについて
Figure 2004348426
により算出される値をアクセス済リストに格納する第3ステップと、
前記アクセス済リストから
Figure 2004348426
により算出される値が、最も小さいものを次にアクセスするノンリーフノードとして選定する第4ステップと、
選定したノンリーフノードにアクセスする第5ステップと、
アクセスしたノンリーフノードがリーフノードを有しているかを判断し、リーフノードを有していない場合には第1ステップに戻ることを決定し、リーフノードを有している場合には次のステップに進むことを決定する第6ステップと、を実行するアクセス済ノンリーフノード選定手段と、
アクセス済リーフノードについて
Figure 2004348426
により問い合わせ点との最大距離を算出し、枝刈戦略リストに挿入する第7ステップと、
アクセス済リストに格納されているノンリーフノードについて
Figure 2004348426
により問い合わせ点との最小距離を算出し、枝刈戦略リストに挿入する第8ステップと、
前記枝刈戦略リスト中の各ノードを距離の値が小さい順に整列させる第9ステップと、
最も小さい距離の値を有するノードがリーフノードであるかを判断し、リーフノードであると判断した場合には後段の第13ステップに進むことを決定し、リーフノードではないと判断した場合には次の第11ステップに進むことを決定する第10ステップと、
前記枝刈戦略リスト中のリーフノードより大きい距離を持つノンリーフノードを枝刈し、アクセス済リストから削除する第11ステップと、
アクセスできるノンリーフノードが無い多次元空間データ木が有るかを判断し、無いと判断した場合には第2ステップに戻ることを決定し、有ると判断した場合には次の第13ステップに進むことを決定する第12ステップと、を実行する枝刈手段と、
前記最大距離が最も小さいリーフノードについては前記最大距離をそのまま用い、それ以外のリーフノードについては
Figure 2004348426
により最小距離を算出し、これらの最大距離と最小距離とを比較し、前記最大距離が最も小さい場合に、この最大距離を有するリーフノードが最近傍の多次元空間データであることを確定する第13ステップを実行する最近傍判定手段と、
前記最近傍多次元空間データを出力するデータ出力手段と、からなることを特徴とする多次元空間データ探索装置。
Input means for inputting search information;
Figure 2004348426
A database having a multidimensional spatial data tree structure represented as
A first step of accessing a root node of each feature;
A second step of inserting a child node for the accessed node into the accessed list;
About non-leaf nodes in the accessed list
Figure 2004348426
A third step of storing in the accessed list the value calculated by
From the accessed list
Figure 2004348426
A fourth step of selecting the smallest one as the non-leaf node to be accessed next,
A fifth step of accessing the selected non-leaf node;
It is determined whether the accessed non-leaf node has a leaf node. If it does not have a leaf node, it is determined to return to the first step. If it has a leaf node, it proceeds to the next step. Accessing a non-leaf node selecting means for performing a sixth step of deciding to proceed;
About accessed leaf nodes
Figure 2004348426
A seventh step of calculating the maximum distance from the query point according to and inserting it into the pruning strategy list;
About non-leaf nodes stored in the accessed list
Figure 2004348426
An eighth step of calculating the minimum distance from the query point according to and inserting it into the pruning strategy list;
A ninth step of arranging the nodes in the pruning strategy list in ascending order of distance value;
It is determined whether the node having the smallest distance value is a leaf node. If it is determined that the node is a leaf node, it is determined to proceed to the subsequent thirteenth step. A tenth step of deciding to proceed to the next eleventh step;
An eleventh step of pruning non-leaf nodes having a greater distance than leaf nodes in the pruning strategy list and deleting them from the accessed list;
It is determined whether there is a multidimensional spatial data tree having no non-leaf node that can be accessed. If it is determined that there is no non-leaf node, it is determined to return to the second step. If it is determined that there is, the process proceeds to the next thirteenth step. A twelfth step of determining
For the leaf node with the smallest maximum distance, the maximum distance is used as it is, and for the other leaf nodes,
Figure 2004348426
The minimum distance is calculated by comparing the maximum distance with the minimum distance, and when the maximum distance is the smallest, it is determined that the leaf node having the maximum distance is the nearest multidimensional space data. Nearest neighbor determining means for executing 13 steps;
And a data output means for outputting the nearest neighbor multidimensional space data.
前記請求項11に記載の多次元空間データ探索装置において、
前記枝刈手段は、前記第11ステップでリーフノードに枝刈されたノードを、前記リーフノードに保持し、
前記最近傍判定手段は、前記第13ステップで最近傍多次元空間データが確定した場合に、前記最近傍多次元空間データであるリーフノードが保持しているノードを探索対象に戻してから、さらに多次元空間データ探索を行うことを特徴とする多次元空間データ探索装置。
The multidimensional spatial data search device according to claim 11,
The pruning means holds the node pruned into a leaf node in the eleventh step in the leaf node,
The nearest neighbor determining means, when the nearest multidimensional space data is determined in the thirteenth step, returns the node held by the leaf node that is the nearest multidimensional space data to the search target, and A multidimensional spatial data search device for performing multidimensional spatial data search.
上記の請求項1乃至12のいずれか1項に記載の多次元空間データ探索方法または多次元空間データ探索装置を、コンピュータプログラムで記載してそれを実行可能にしたことを特徴とするプログラム。13. A program, wherein the multidimensional spatial data search method or the multidimensional spatial data search device according to any one of claims 1 to 12 is described as a computer program and is executable. 上記の請求項1乃至12のいずれか1項に記載の多次元空間データ探索方法または多次元空間データ探索装置を、コンピュータで実行可能に記載したプログラムを記録したことを特徴とする記録媒体。13. A recording medium on which is recorded a program in which the multidimensional spatial data search method or the multidimensional spatial data search device according to any one of claims 1 to 12 is executable by a computer.
JP2003144642A 2003-05-22 2003-05-22 Multidimensional spatial data search method, multidimensional spatial data search device, multidimensional spatial data search program and recording medium with multidimensional spatial data search program recorded Pending JP2004348426A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003144642A JP2004348426A (en) 2003-05-22 2003-05-22 Multidimensional spatial data search method, multidimensional spatial data search device, multidimensional spatial data search program and recording medium with multidimensional spatial data search program recorded

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003144642A JP2004348426A (en) 2003-05-22 2003-05-22 Multidimensional spatial data search method, multidimensional spatial data search device, multidimensional spatial data search program and recording medium with multidimensional spatial data search program recorded

Publications (1)

Publication Number Publication Date
JP2004348426A true JP2004348426A (en) 2004-12-09

Family

ID=33532047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003144642A Pending JP2004348426A (en) 2003-05-22 2003-05-22 Multidimensional spatial data search method, multidimensional spatial data search device, multidimensional spatial data search program and recording medium with multidimensional spatial data search program recorded

Country Status (1)

Country Link
JP (1) JP2004348426A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569507B2 (en) 2013-10-31 2017-02-14 Oracle International Corporation Virtual directory server to process directory requests when information on an object is split across multiple data sources
CN112308122A (en) * 2020-10-20 2021-02-02 中国刑事警察学院 High-dimensional vector space sample fast searching method and device based on double trees

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9569507B2 (en) 2013-10-31 2017-02-14 Oracle International Corporation Virtual directory server to process directory requests when information on an object is split across multiple data sources
CN112308122A (en) * 2020-10-20 2021-02-02 中国刑事警察学院 High-dimensional vector space sample fast searching method and device based on double trees
CN112308122B (en) * 2020-10-20 2024-03-01 中国刑事警察学院 High-dimensional vector space sample rapid searching method and device based on double trees

Similar Documents

Publication Publication Date Title
Wu et al. A framework for efficient spatial web object retrieval
Aggarwal et al. A survey of uncertain data algorithms and applications
Gallagher Matching Structure and Semantics: A Survey on Graph-Based Pattern Matching.
Li et al. Dada: a data cube for dominant relationship analysis
Tao et al. Branch-and-bound processing of ranked queries
JP6183376B2 (en) Index generation apparatus and method, search apparatus, and search method
Yiu et al. Iterative projected clustering by subspace mining
Chen et al. Efficient metric indexing for similarity search and similarity joins
US20140229476A1 (en) System for Information Discovery &amp; Organization
CN106528648B (en) In conjunction with the distributed RDF keyword proximity search method of Redis memory database
JP2003256477A (en) Information processing using random sample hierarchical structure
Shi et al. Textually relevant spatial skylines
Belesiotis et al. Spatio-textual user matching and clustering based on set similarity joins
JP5552981B2 (en) Index method, search method, and storage medium thereof
JP5470082B2 (en) Information storage search method and information storage search program
Pan et al. Reverse nearest neighbor search in semantic trajectories for location-based services
Feldman et al. A knowledge-based approach for index selection in relational databases
Bertino et al. The indispensability of dispensable indexes
JP2004348426A (en) Multidimensional spatial data search method, multidimensional spatial data search device, multidimensional spatial data search program and recording medium with multidimensional spatial data search program recorded
JP3938815B2 (en) Node creation method, image search method, and recording medium
JP2007073063A (en) Space index method
Lu et al. Querying spatial data by dominators in neighborhood
CN113590889B (en) Method, device, computer equipment and storage medium for constructing metric spatial index tree
Zhang et al. Skyline queries with constraints: Integrating skyline and traditional query operators
JP2000035965A (en) Method and device for retrieving similar feature quantity and storage medium storing retrieval program of similar feature quantity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081024

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081202