JPH10301937A - 多次元ベクトル空間内の近傍検索方法とそのプログラムの記録媒体 - Google Patents
多次元ベクトル空間内の近傍検索方法とそのプログラムの記録媒体Info
- Publication number
- JPH10301937A JPH10301937A JP9106240A JP10624097A JPH10301937A JP H10301937 A JPH10301937 A JP H10301937A JP 9106240 A JP9106240 A JP 9106240A JP 10624097 A JP10624097 A JP 10624097A JP H10301937 A JPH10301937 A JP H10301937A
- Authority
- JP
- Japan
- Prior art keywords
- node
- tree
- search
- vector space
- management information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 木構造インデクスのノード間の重なり部分を
検索する無駄を省いて検索を高速化する。 【解決手段】 各階層の要素をいくつかのクラスタとい
ずれのクラスタにも属しない余りの要素とに分類する処
理を各階層ごとに繰り返して非均衡木の木構造インデク
スを予め構築する手順702と、参照点が入力されたと
き、その木構造インデクスのノードへのポインタとその
ノードに対応する多次元ベクトル空間内の点と参照点と
の距離評価値との組を作成して検索管理情報リストに格
納する手順702と、検索管理情報リストを参照して木
構造インデクスをルートノードから順に辿る手順703
と、検索管理情報リストを更新する手順705,706
と、検索の処理停止を判断する手順704とを含む方法
ならびにそのプログラムを記録した記録媒体。
検索する無駄を省いて検索を高速化する。 【解決手段】 各階層の要素をいくつかのクラスタとい
ずれのクラスタにも属しない余りの要素とに分類する処
理を各階層ごとに繰り返して非均衡木の木構造インデク
スを予め構築する手順702と、参照点が入力されたと
き、その木構造インデクスのノードへのポインタとその
ノードに対応する多次元ベクトル空間内の点と参照点と
の距離評価値との組を作成して検索管理情報リストに格
納する手順702と、検索管理情報リストを参照して木
構造インデクスをルートノードから順に辿る手順703
と、検索管理情報リストを更新する手順705,706
と、検索の処理停止を判断する手順704とを含む方法
ならびにそのプログラムを記録した記録媒体。
Description
【0001】
【発明の属する技術分野】本発明は、類似オブジェクト
検索システムにおける多次元ベクトル空間内の近傍検索
方法に関する。
検索システムにおける多次元ベクトル空間内の近傍検索
方法に関する。
【0002】
【従来の技術】類似オブジェクト検索システムは、ディ
ジタル化したオブジェクトが多数蓄積された電子博物館
や電子カタログ等のデータベースを検索して、その中の
オブジェクトのうち、利用者が何らかの手段により参照
オブジェクトとして入力したオブジェクトに最も類似し
ていると判定されたものから順に上位幾つかのオブジェ
クトを検索結果として提示するシステムである。データ
ベースの各オブジェクトは、それぞれの特徴、例えば画
像であればその色相、明度、彩度など、を特徴量ベクト
ルとして、多次元ベクトル空間内の点に対応させて表現
されており、2つのオブジェクトの類似度を判定すると
は、多次元ベクトル空間内のそれぞれの点の間の距離評
価値を求め、その距離評価値の大小を比較することであ
る。
ジタル化したオブジェクトが多数蓄積された電子博物館
や電子カタログ等のデータベースを検索して、その中の
オブジェクトのうち、利用者が何らかの手段により参照
オブジェクトとして入力したオブジェクトに最も類似し
ていると判定されたものから順に上位幾つかのオブジェ
クトを検索結果として提示するシステムである。データ
ベースの各オブジェクトは、それぞれの特徴、例えば画
像であればその色相、明度、彩度など、を特徴量ベクト
ルとして、多次元ベクトル空間内の点に対応させて表現
されており、2つのオブジェクトの類似度を判定すると
は、多次元ベクトル空間内のそれぞれの点の間の距離評
価値を求め、その距離評価値の大小を比較することであ
る。
【0003】従って、類似オブジェクト検索システムに
おいては、参照オブジェクトに対応する多次元ベクトル
空間内の参照点の近傍点を探し出して、参照点とそれら
の近傍点との間の距離評価値の小さいものをいくつか求
めることになる。
おいては、参照オブジェクトに対応する多次元ベクトル
空間内の参照点の近傍点を探し出して、参照点とそれら
の近傍点との間の距離評価値の小さいものをいくつか求
めることになる。
【0004】上述の多次元ベクトル空間内の近傍検索
は、一般には数十万件もある多次元ベクトル空間内の全
ての点に対して、参照点との距離評価値を求め、距離評
価値の小さいものを上位から特定の数k件(一般にはk
=10〜100)を選出して回答とすることになるが、
このような全ての点を対象とする方法は、点のデータの
数が増大するに伴って、それぞれの距離評価値の計算、
及び上位k件を選出する計算と、さらには選出したk個
のデータの順位付けの計算のコストが飛躍的に増大し、
検索システムとして実用的でない。
は、一般には数十万件もある多次元ベクトル空間内の全
ての点に対して、参照点との距離評価値を求め、距離評
価値の小さいものを上位から特定の数k件(一般にはk
=10〜100)を選出して回答とすることになるが、
このような全ての点を対象とする方法は、点のデータの
数が増大するに伴って、それぞれの距離評価値の計算、
及び上位k件を選出する計算と、さらには選出したk個
のデータの順位付けの計算のコストが飛躍的に増大し、
検索システムとして実用的でない。
【0005】この問題の解決策として、木構造インデク
スという補助データ構造の採用が提案された。
スという補助データ構造の採用が提案された。
【0006】木構造は、図8に示すように、ルートノー
ドを最上位として複数のノード間を階層的にリンクで結
ぶ半順序構造をなしている。このとき、リンクで結ばれ
た2つのノードのうち、上位のノードを親ノード、下位
のノードを子ノードという。子ノードのないノードをリ
ーフノードといい、それ以外のノードを内部ノードとい
う。また、最下層を第0層、その直上を第1層と呼び、
以降順次、第2層、第3層、...と呼ぶ。図8の
(a)に示すように、全ての分岐パスに等しく各層のノ
ードが存在し、リーフノードが最下層にのみ現われる構
造の木を均衡木といい、(b)のようにリーフノードが
2つ以上の層に現われる構造の木を非均衡木という。
ドを最上位として複数のノード間を階層的にリンクで結
ぶ半順序構造をなしている。このとき、リンクで結ばれ
た2つのノードのうち、上位のノードを親ノード、下位
のノードを子ノードという。子ノードのないノードをリ
ーフノードといい、それ以外のノードを内部ノードとい
う。また、最下層を第0層、その直上を第1層と呼び、
以降順次、第2層、第3層、...と呼ぶ。図8の
(a)に示すように、全ての分岐パスに等しく各層のノ
ードが存在し、リーフノードが最下層にのみ現われる構
造の木を均衡木といい、(b)のようにリーフノードが
2つ以上の層に現われる構造の木を非均衡木という。
【0007】このような木構造インデクスを予め構築し
ておき、近傍検索時にこれを用いると、距離評価値に関
して多次元ベクトル空間内で参照点に近いk個の点を選
び出す操作が高速化される。さらに、選び出されたk件
に対して距離評価値を求めて上位から順序付けするコス
トも、全体の点に対して同様のことを行なうのに比べる
とはるかに小さくなる。
ておき、近傍検索時にこれを用いると、距離評価値に関
して多次元ベクトル空間内で参照点に近いk個の点を選
び出す操作が高速化される。さらに、選び出されたk件
に対して距離評価値を求めて上位から順序付けするコス
トも、全体の点に対して同様のことを行なうのに比べる
とはるかに小さくなる。
【0008】従来の木構造インデクスの代表的なものと
して、グットマン(Guttman A.)によるR−treeと
呼ばれる均衡木のインデクス及びその改良版がある("R
-tree: A Dynamic Index Structure for Spatial Searc
hing", Proceedings of ACMSIGMOD International Conf
erence on the Management of Data, 1984)。なお、こ
れらについては、さらにホワイト等(White D.A. and J
ain R)によるサーベイがある("Algorithms and Strat
egies for Similarity Retrieval", Technical Report
VCL-96-101, University of California at San Diego,
1996)。
して、グットマン(Guttman A.)によるR−treeと
呼ばれる均衡木のインデクス及びその改良版がある("R
-tree: A Dynamic Index Structure for Spatial Searc
hing", Proceedings of ACMSIGMOD International Conf
erence on the Management of Data, 1984)。なお、こ
れらについては、さらにホワイト等(White D.A. and J
ain R)によるサーベイがある("Algorithms and Strat
egies for Similarity Retrieval", Technical Report
VCL-96-101, University of California at San Diego,
1996)。
【0009】
【発明が解決しようとする課題】しかし、従来のR−t
ree系の木構造インデクスによる検索では、木構造の
ノード間の重なりが発生して、検索に無駄があるという
問題があった。特に、この欠点は、対象とするベクトル
空間の次元数が大きい場合には、重なりが多くなり、全
件検索に対して検索性能が上がらないという問題を生じ
ていた。
ree系の木構造インデクスによる検索では、木構造の
ノード間の重なりが発生して、検索に無駄があるという
問題があった。特に、この欠点は、対象とするベクトル
空間の次元数が大きい場合には、重なりが多くなり、全
件検索に対して検索性能が上がらないという問題を生じ
ていた。
【0010】ここで、ノード間の重なりとは、MBR
(Minimum Bouning Rectangle)をノード内の全ての要
素のMBRを包含する最小の超長方形として帰納的に定
義するとき、厳密にはノードのMBRの重なりである。
要素が多次元ベクトル空間の点そのものの場合は、その
全ての要素自身をMBRとする。換言すると、MBR
は、各次元のノード内の要素の内、その次元ごとの最小
値と最大値で囲まれる範囲を全次元について積集合した
ものである。
(Minimum Bouning Rectangle)をノード内の全ての要
素のMBRを包含する最小の超長方形として帰納的に定
義するとき、厳密にはノードのMBRの重なりである。
要素が多次元ベクトル空間の点そのものの場合は、その
全ての要素自身をMBRとする。換言すると、MBR
は、各次元のノード内の要素の内、その次元ごとの最小
値と最大値で囲まれる範囲を全次元について積集合した
ものである。
【0011】図9は、木のノード間の重なりがある場合
に検索の効率が悪いことを示す2次元の簡単な例であ
る。図9の(a)は、対象とする多次元ベクトル空間、
ここでは2次元とする、の平面図で、検索対象となる点
01〜22をO印で示す。図中の長方形(1−A)〜
(1−H),(2−A)〜(2−C)はノードのMBR
である。(b)はその木構造インデクスの1例である。
に検索の効率が悪いことを示す2次元の簡単な例であ
る。図9の(a)は、対象とする多次元ベクトル空間、
ここでは2次元とする、の平面図で、検索対象となる点
01〜22をO印で示す。図中の長方形(1−A)〜
(1−H),(2−A)〜(2−C)はノードのMBR
である。(b)はその木構造インデクスの1例である。
【0012】この図では、例えば第1段階のノードのM
BR(1−A)は、点01,04,05を含んで第2段
階のMBR(2−A)に属し、MBR(1−C)は点0
6,07,08を含んでMBR(2−B)に属する。そ
して、図中の網かけ部分で示すように、ノード(2−
A)とノード(2−B)、ノード(2−B)とノード
(2−C)、ノード(2−C)とノード(2−A)が、
それぞれ重なっている。
BR(1−A)は、点01,04,05を含んで第2段
階のMBR(2−A)に属し、MBR(1−C)は点0
6,07,08を含んでMBR(2−B)に属する。そ
して、図中の網かけ部分で示すように、ノード(2−
A)とノード(2−B)、ノード(2−B)とノード
(2−C)、ノード(2−C)とノード(2−A)が、
それぞれ重なっている。
【0013】従って、X印で示す参照点に近い点を1つ
検索するためには、参照点を含む(2−A),(2−
B),(2−C)及び(1−A),(1−C),(1−
F)の各ノード、すなわち、(b)の木構造では(ルー
ト)→(2−A)→(1−A)→(04)と、(ルー
ト)→(2−B)→(1−C)→(07)と、(ルー
ト)→(2−C)→(1−F)→(12)との3通りの
検索パスを辿らなければならない。
検索するためには、参照点を含む(2−A),(2−
B),(2−C)及び(1−A),(1−C),(1−
F)の各ノード、すなわち、(b)の木構造では(ルー
ト)→(2−A)→(1−A)→(04)と、(ルー
ト)→(2−B)→(1−C)→(07)と、(ルー
ト)→(2−C)→(1−F)→(12)との3通りの
検索パスを辿らなければならない。
【0014】一方、図10は、木構造のノードの重なり
のない場合、検索の手間が少なくなることを説明する図
で、図9と同じ検索対象点01〜22に対して異なるク
ラスタリングが施されている。例えばノード(1−A)
は図9では点(01,04,05)を含み、図10では
点(01,02)を含む。また、図9では全ての点がい
ずかのノードに含まれているが、図10では点18はど
のノードにも含まれない。
のない場合、検索の手間が少なくなることを説明する図
で、図9と同じ検索対象点01〜22に対して異なるク
ラスタリングが施されている。例えばノード(1−A)
は図9では点(01,04,05)を含み、図10では
点(01,02)を含む。また、図9では全ての点がい
ずかのノードに含まれているが、図10では点18はど
のノードにも含まれない。
【0015】この図10の場合は、X印の参照点からの
最近傍点を検索するには、(ルートノード)→(2−
B)→(1−C)→(07)というパスのみを検索すれ
ばよい。
最近傍点を検索するには、(ルートノード)→(2−
B)→(1−C)→(07)というパスのみを検索すれ
ばよい。
【0016】本発明の目的は、上述の問題を解消し、木
構造インデクスのノード間の重なり部分を検索する無駄
を省いて検索を高速化できる多次元ベクトル空間内の近
傍検索方法を提供することにある。
構造インデクスのノード間の重なり部分を検索する無駄
を省いて検索を高速化できる多次元ベクトル空間内の近
傍検索方法を提供することにある。
【0017】
【課題を解決するための手段】本発明の多次元ベクトル
空間内の近傍検索方法は、各段階の要素を、要素につい
てのいくつかのクラスタと、いずれのクラスタにも属さ
ない余りの要素とに分類する処理を各階層ごとに繰返し
て木構造インデクスを構築する手順と、木構造インデク
スのノードへのポインタと、そのノードに対応する多次
元ベクトル空間内の点と参照点との距離評価値との組を
情報として格納する検索管理情報リストを作成する手順
と、検索管理情報リストを参照して、その木構造インデ
クスをルートノードから順に辿る手順と、検索管理情報
リストを更新する手順と、検索の処理停止を判断する手
順と、を有する。
空間内の近傍検索方法は、各段階の要素を、要素につい
てのいくつかのクラスタと、いずれのクラスタにも属さ
ない余りの要素とに分類する処理を各階層ごとに繰返し
て木構造インデクスを構築する手順と、木構造インデク
スのノードへのポインタと、そのノードに対応する多次
元ベクトル空間内の点と参照点との距離評価値との組を
情報として格納する検索管理情報リストを作成する手順
と、検索管理情報リストを参照して、その木構造インデ
クスをルートノードから順に辿る手順と、検索管理情報
リストを更新する手順と、検索の処理停止を判断する手
順と、を有する。
【0018】また、検索管理情報リストは、各クラスタ
の代表点と全クラスタの代表点との距離評価値を計算し
て、距離評価値の小さい順に並べたリストを含む。
の代表点と全クラスタの代表点との距離評価値を計算し
て、距離評価値の小さい順に並べたリストを含む。
【0019】本発明の多次元ベクトル空間内の近傍検索
方法の記録媒体は、各階層ごとに要素のクラスタリング
による作成を繰り返して木構造インデクスという補助デ
ータ構造を構築する手順と、検索管理情報リストを用意
する手順と、検索管理情報リストを参照して、その木構
造インデクスをルートノードから順に辿る手順と、検索
管理情報リストを更新する手順と、検索の処理停止を判
断する手順とを含むコンピュータのプログラムが記録さ
れている。
方法の記録媒体は、各階層ごとに要素のクラスタリング
による作成を繰り返して木構造インデクスという補助デ
ータ構造を構築する手順と、検索管理情報リストを用意
する手順と、検索管理情報リストを参照して、その木構
造インデクスをルートノードから順に辿る手順と、検索
管理情報リストを更新する手順と、検索の処理停止を判
断する手順とを含むコンピュータのプログラムが記録さ
れている。
【0020】すなわち、本発明は、ノード間の重なりが
小さくなるような非均衡木の木構造インデクスを予め構
築し、検索要求が与えられたとき、その木構造インデク
スを用いて指定されたk件の近傍点を検索することによ
り、高速な検索を達成することができる。
小さくなるような非均衡木の木構造インデクスを予め構
築し、検索要求が与えられたとき、その木構造インデク
スを用いて指定されたk件の近傍点を検索することによ
り、高速な検索を達成することができる。
【0021】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。本発明の木構造インデクス
の構築は、クラスタリングを順次行いながら下位層から
積み上げて非均衡木の構造とするものである。
て図面を参照して説明する。本発明の木構造インデクス
の構築は、クラスタリングを順次行いながら下位層から
積み上げて非均衡木の構造とするものである。
【0022】図1は、本発明の木構造インデクスを構築
する方法の1実施例の流れを示す図である。いま、検索
の対象としているm個のデータに対応する多次元ベクト
ル空間内のm個の点の集まり(データセット)をMとす
る。
する方法の1実施例の流れを示す図である。いま、検索
の対象としているm個のデータに対応する多次元ベクト
ル空間内のm個の点の集まり(データセット)をMとす
る。
【0023】先ず、階層に関する繰返しのカウンタLの
値を0とするとともに、各種の変数の初期化を行い(4
01)、Mを仮にDと名前を変える。また、Dの要素数
をNとする(Nの値は、ここではMの要素数mに等し
い)(402)。
値を0とするとともに、各種の変数の初期化を行い(4
01)、Mを仮にDと名前を変える。また、Dの要素数
をNとする(Nの値は、ここではMの要素数mに等し
い)(402)。
【0024】次に、Dの要素は全てどれかのクラスタに
所属するようにしてDのN個の要素をグループ分け(ク
ラスタリング)して、n’個の初期クラスタを作る。
所属するようにしてDのN個の要素をグループ分け(ク
ラスタリング)して、n’個の初期クラスタを作る。
【0025】この初期クラスタリングには、例えば既存
の木構造インデクスで構築が高速といわれているホワイ
ト等(White,D.A. and Jain,R.)のVAM Split R-tre
e の構築処理を用いることができる(White,D.A. and J
ain,R.,"Similarity Indexing: Algorithms and Perfor
mance", In Proceedings of the SPIE: Storage andRet
rieval for Image and Video Database IV, San Jose,
CA, volume 2670, pages 62-75, 1996)。 すると、D
に対してVAM Split R-tree が構築される。このVA
M Split R-tree の第1層の各ノード(全部でn’個)
を、初期のクラスタとする。
の木構造インデクスで構築が高速といわれているホワイ
ト等(White,D.A. and Jain,R.)のVAM Split R-tre
e の構築処理を用いることができる(White,D.A. and J
ain,R.,"Similarity Indexing: Algorithms and Perfor
mance", In Proceedings of the SPIE: Storage andRet
rieval for Image and Video Database IV, San Jose,
CA, volume 2670, pages 62-75, 1996)。 すると、D
に対してVAM Split R-tree が構築される。このVA
M Split R-tree の第1層の各ノード(全部でn’個)
を、初期のクラスタとする。
【0026】次に、これらn’個のクラスタ(クラスタ
群)に対してクラスタの構成要素の入れ替え(再クラス
タリング)を行なう。これには例えば、非階層クラスタ
リング法として既知のウィッシャート(Wishart )法が
ある(Anderberg M.R.,"Cluster Analysis for Applica
tions", Academic Press, 1973)。この結果、n個のク
ラスタと、どのクラスタにも属さないr個(r≧0)の
余りノードが得られる。しかし、Wishart 法は計算に時
間がかかるという問題があるので、本発明では、この部
分にWishart 法を改良した方法(詳細は後述)を用いて
高速化を図っている。
群)に対してクラスタの構成要素の入れ替え(再クラス
タリング)を行なう。これには例えば、非階層クラスタ
リング法として既知のウィッシャート(Wishart )法が
ある(Anderberg M.R.,"Cluster Analysis for Applica
tions", Academic Press, 1973)。この結果、n個のク
ラスタと、どのクラスタにも属さないr個(r≧0)の
余りノードが得られる。しかし、Wishart 法は計算に時
間がかかるという問題があるので、本発明では、この部
分にWishart 法を改良した方法(詳細は後述)を用いて
高速化を図っている。
【0027】以上の処理により、n個(n=N−r)の
クラスタと、どのクラスタにも属さないr個(r≧0)
の余りとを得る。r個の余りは剰余リストに登録する
(403)。ここで、クラスタ内の要素を第L層のノー
ドとする(404)。
クラスタと、どのクラスタにも属さないr個(r≧0)
の余りとを得る。r個の余りは剰余リストに登録する
(403)。ここで、クラスタ内の要素を第L層のノー
ドとする(404)。
【0028】次に、第1層として、先に求めたn個の各
クラスタについて、それぞれの代表点を求める(40
5)。この代表点を求める方法はいろいろある。例え
ば、クラスタ内の全要素(Dの点)について、その多次
元ベクトル空間の距離評価関数に関しての重心を取ると
いう方法がある。そして、各クラスタとクラスタ内の要
素との間をそれぞれリングで結ぶ。このn個の代表点と
剰余リストのr個の点から構成されるデータセットを新
しいDとすると、新しいDの要素数Nはn+r個となる
(406)。
クラスタについて、それぞれの代表点を求める(40
5)。この代表点を求める方法はいろいろある。例え
ば、クラスタ内の全要素(Dの点)について、その多次
元ベクトル空間の距離評価関数に関しての重心を取ると
いう方法がある。そして、各クラスタとクラスタ内の要
素との間をそれぞれリングで結ぶ。このn個の代表点と
剰余リストのr個の点から構成されるデータセットを新
しいDとすると、新しいDの要素数Nはn+r個となる
(406)。
【0029】ここで階層のカウンタLを1増やして(4
07)、この新しいDの要素数Nを予め定められた限界
値Nmax と比較して(408)、NがNmax 以上になっ
た場合は、403のクラスタリング処理に戻り、新しい
Dに対して先と同様のクラスタリングを行なって、クラ
スタと剰余リストを得る。そして、このクラスタ内の要
素を第L層のノードとする。
07)、この新しいDの要素数Nを予め定められた限界
値Nmax と比較して(408)、NがNmax 以上になっ
た場合は、403のクラスタリング処理に戻り、新しい
Dに対して先と同様のクラスタリングを行なって、クラ
スタと剰余リストを得る。そして、このクラスタ内の要
素を第L層のノードとする。
【0030】そしてまた、各クラスタの代表点を求め、
DとNを更新する。以下、Dの要素数NがNmax より小
さくなるまで、以上の403〜408の処理を繰り返
す。
DとNを更新する。以下、Dの要素数NがNmax より小
さくなるまで、以上の403〜408の処理を繰り返
す。
【0031】408の判断でNがNmax より小さくなっ
た場合は、Dの要素を第L層のノードとする(40
9)。
た場合は、Dの要素を第L層のノードとする(40
9)。
【0032】次に、Nの値を1と比較して(410)、
Nが1に等しい場合は、その第L層の唯一のノードをル
ートノードとし(412)、Nが1より大きい場合は、
第L層のノードを1つのクラスタにまとめたものをルー
トノードとして、ルートノードと第L層の各ノードとの
間をリンクして求める木構造インデクスのリンクとする
(411)。
Nが1に等しい場合は、その第L層の唯一のノードをル
ートノードとし(412)、Nが1より大きい場合は、
第L層のノードを1つのクラスタにまとめたものをルー
トノードとして、ルートノードと第L層の各ノードとの
間をリンクして求める木構造インデクスのリンクとする
(411)。
【0033】ここで、前述の本発明によるクラスタリン
グの方法について、図2により詳細に説明する。図2に
おいて、先ず、クラスタ数n’、クラスタの代表点とク
ラスタ内要素との距離評価値の最大値(thresh)、クラ
スタの要素数の最小値(e min )、最大繰り返し数(i
te max )を入力し(501)、繰り返し数(ite )を
1とする(502)。
グの方法について、図2により詳細に説明する。図2に
おいて、先ず、クラスタ数n’、クラスタの代表点とク
ラスタ内要素との距離評価値の最大値(thresh)、クラ
スタの要素数の最小値(e min )、最大繰り返し数(i
te max )を入力し(501)、繰り返し数(ite )を
1とする(502)。
【0034】次に、n’個のクラスタのそれぞれについ
て、各代表点と全クラスタの代表点との距離評価値を計
算して、距離評価値の小さい順に並べたリスト(クラス
タ距離評価値リスト)を作成する(503)。
て、各代表点と全クラスタの代表点との距離評価値を計
算して、距離評価値の小さい順に並べたリスト(クラス
タ距離評価値リスト)を作成する(503)。
【0035】本発明においては、検索処理の包含距離評
価値は、図4の(a)のように、複数の構成要素のMB
Rを含む子ノードのMBR上の点で距離評価値関数につ
いて参照点からの最遠点の距離評価値を用いて求めても
よく、また、(b)のように、参照点からその子ノード
の重心までの距離評価値d1 と、子ノードの重心からそ
の距離評価値関数について一番遠い構成要素までの距離
評価値として定義されるそのノードの半径d2 との和d
(=d1 +d2 )を用いてもよい。
価値は、図4の(a)のように、複数の構成要素のMB
Rを含む子ノードのMBR上の点で距離評価値関数につ
いて参照点からの最遠点の距離評価値を用いて求めても
よく、また、(b)のように、参照点からその子ノード
の重心までの距離評価値d1 と、子ノードの重心からそ
の距離評価値関数について一番遠い構成要素までの距離
評価値として定義されるそのノードの半径d2 との和d
(=d1 +d2 )を用いてもよい。
【0036】次に、要素数ei の1つの対象クラスタC
i を選択して(505)、このクラスタCi 中から1つ
の要素Ej を取り出し(507)、要素Ej と各クラス
タとの関係が与えられた条件を満足するか、クラスタ距
離評価値リストの上位から順に判定して、最良の条件を
与えるクラスタCj を求める(508)。すなわち、ウ
ィッシャートの方法では、Ej から各クラスタの代表点
への距離評価値の最小値を求めることになっているの
で、全てのクラスタに対してその都度、距離評価値を計
算しなければならないが、本発明においては、Ej の属
するクラスタCjの代表点と各クラスタの代表点の距離
評価値を予め計算しておき、距離評価値の小さい順に並
べてクラスタ距離評価値リストを作製してあるので(5
03)、このリストを用いることにより、最良の条件を
与えるクラスタCj を迅速に求めることができる。
i を選択して(505)、このクラスタCi 中から1つ
の要素Ej を取り出し(507)、要素Ej と各クラス
タとの関係が与えられた条件を満足するか、クラスタ距
離評価値リストの上位から順に判定して、最良の条件を
与えるクラスタCj を求める(508)。すなわち、ウ
ィッシャートの方法では、Ej から各クラスタの代表点
への距離評価値の最小値を求めることになっているの
で、全てのクラスタに対してその都度、距離評価値を計
算しなければならないが、本発明においては、Ej の属
するクラスタCjの代表点と各クラスタの代表点の距離
評価値を予め計算しておき、距離評価値の小さい順に並
べてクラスタ距離評価値リストを作製してあるので(5
03)、このリストを用いることにより、最良の条件を
与えるクラスタCj を迅速に求めることができる。
【0037】次に、このCj が予め与えられた別の条
件、例えばEj とCj との距離評価値dj が dj >th
reshである等、を満足するか否か、を判定する(50
9)。そして、この条件を満足、すなわち、例えばdj
>threshであれば、要素Ej をクラスタCi から剰余リ
ストに移動する(510)。また、dj >threshでない
等で条件を満足せず、しかも、現在のクラスタCi と最
良の条件のクラスタCj が異なる場合(511)は、要
素Ej をクラスタCi からCj に移動する(512)。
そして、510、512のいずれの場合も、要素Ej の
移動に関わったクラスタの代表点の位置を再計算して更
新する(513)。
件、例えばEj とCj との距離評価値dj が dj >th
reshである等、を満足するか否か、を判定する(50
9)。そして、この条件を満足、すなわち、例えばdj
>threshであれば、要素Ej をクラスタCi から剰余リ
ストに移動する(510)。また、dj >threshでない
等で条件を満足せず、しかも、現在のクラスタCi と最
良の条件のクラスタCj が異なる場合(511)は、要
素Ej をクラスタCi からCj に移動する(512)。
そして、510、512のいずれの場合も、要素Ej の
移動に関わったクラスタの代表点の位置を再計算して更
新する(513)。
【0038】次に、要素Ej の移動がなく、従ってクラ
スタの代表点の位置を更新しなかった場合をも含めて、
jを1だけ増加して次の要素Ej に移り(514)、そ
のクラスタ中の要素がまだ残っているか(jがei 以下
か)判定する(515)。そしてjがei 以下であれ
ば、507以降の処理を繰返し、Cj の全要素について
同様の処理を行なう。
スタの代表点の位置を更新しなかった場合をも含めて、
jを1だけ増加して次の要素Ej に移り(514)、そ
のクラスタ中の要素がまだ残っているか(jがei 以下
か)判定する(515)。そしてjがei 以下であれ
ば、507以降の処理を繰返し、Cj の全要素について
同様の処理を行なう。
【0039】515でクラスタ中の全要素について終了
と判定すれば、iを1だけ増加して(516)、未処理
のクラスタがないか(iがk以下か)判定し(51
7)、未処理のクラスタがあれば、505に戻って次の
クラスタについて同様の処理をする。517の判定で全
クラスタについて処理が完了していれば、直前の繰り返
しで要素の移動があったかを調べる(518)。そし
て、要素の移動があれば、繰り返し数ite を1だけ増加
して(519)、それがite max を越えたか調べて
(520)、越えない場合は503に戻る。ite がite
max を越えた場合、及び518で要素の移動がないと
判定された場合は、e min より要素数の少ないクラス
タ中の要素を剰余リストに移動してそのクラスタを削除
する(521)。
と判定すれば、iを1だけ増加して(516)、未処理
のクラスタがないか(iがk以下か)判定し(51
7)、未処理のクラスタがあれば、505に戻って次の
クラスタについて同様の処理をする。517の判定で全
クラスタについて処理が完了していれば、直前の繰り返
しで要素の移動があったかを調べる(518)。そし
て、要素の移動があれば、繰り返し数ite を1だけ増加
して(519)、それがite max を越えたか調べて
(520)、越えない場合は503に戻る。ite がite
max を越えた場合、及び518で要素の移動がないと
判定された場合は、e min より要素数の少ないクラス
タ中の要素を剰余リストに移動してそのクラスタを削除
する(521)。
【0040】そして、いくつかのクラスタと1つの剰余
リストを出力してクラスタリングの処理を終了する(5
22)。
リストを出力してクラスタリングの処理を終了する(5
22)。
【0041】以上の処理によって求める非均衡木の木構
造インデクスが完成する。
造インデクスが完成する。
【0042】次に、このような構築法で予め構築した木
構造インデクスCを用いて、m個の多次元ベクトル空間
内の点の中から、与えられた参照点に対するk個の近傍
点を求める方法を説明する。
構造インデクスCを用いて、m個の多次元ベクトル空間
内の点の中から、与えられた参照点に対するk個の近傍
点を求める方法を説明する。
【0043】図3において、先ず、木構造インデクスC
のノードへのポインタと、そのノードに対応している多
次元ベクトル空間内の点と参照点との距離評価値との組
を情報として格納する最初は空の検索情報管理リストを
用意する(701)。リスト内の各要素は、検索の便宜
上、各要素が持つ参照点との距離評価値によって小さい
順に並べられる。
のノードへのポインタと、そのノードに対応している多
次元ベクトル空間内の点と参照点との距離評価値との組
を情報として格納する最初は空の検索情報管理リストを
用意する(701)。リスト内の各要素は、検索の便宜
上、各要素が持つ参照点との距離評価値によって小さい
順に並べられる。
【0044】次に、この空の検索情報管理リストに、木
構造インデクスCからルートノードへのポインタと距離
評価値∞(無限大)の組を挿入する(702)。
構造インデクスCからルートノードへのポインタと距離
評価値∞(無限大)の組を挿入する(702)。
【0045】次に、この空でなくなった検索情報管理リ
ストから、リーフノードでないノードへのポインタをも
つ要素の中で、距離評価値が最小のものを探し出す(7
03)。
ストから、リーフノードでないノードへのポインタをも
つ要素の中で、距離評価値が最小のものを探し出す(7
03)。
【0046】もし、そのような要素があれば(704で
判定)、その要素をリストから削除して取り出し(70
5)、その要素のポイントしているノードの子ノードの
集合を取得する(706)。
判定)、その要素をリストから削除して取り出し(70
5)、その要素のポイントしているノードの子ノードの
集合を取得する(706)。
【0047】その後、これらの子ノード集合中の各子ノ
ードについて、子ノード集合が空になるまで、以下のこ
とを順次行なう(707〜714)。
ードについて、子ノード集合が空になるまで、以下のこ
とを順次行なう(707〜714)。
【0048】子ノード集合から1つの子ノードiを取得
して(707)、それがリーフノードであるか否かを判
定し(708)、リーフノードであれば、その子ノード
に対応する多次元ベクトル空間内の点と参照点との距離
評価値を求めてdとする(710)。判定結果が非リー
フノードであれば、参照点とそのノードの全ての要素と
の距離評価値よりも大きい何かしらの値(包含距離評価
値という)を求めてdとする(709)。
して(707)、それがリーフノードであるか否かを判
定し(708)、リーフノードであれば、その子ノード
に対応する多次元ベクトル空間内の点と参照点との距離
評価値を求めてdとする(710)。判定結果が非リー
フノードであれば、参照点とそのノードの全ての要素と
の距離評価値よりも大きい何かしらの値(包含距離評価
値という)を求めてdとする(709)。
【0049】次に、このようにして求められたdをMin
Dist と比較して、dがMinDistより小さい場合は、
そのノードへのポインタと参照点との距離評価値の組を
新しい要素として検索情報管理リストに挿入する(71
2)。そして、ノードiを子ノード集合から削除する
(713)。
Dist と比較して、dがMinDistより小さい場合は、
そのノードへのポインタと参照点との距離評価値の組を
新しい要素として検索情報管理リストに挿入する(71
2)。そして、ノードiを子ノード集合から削除する
(713)。
【0050】そして、子ノード集合が空になったか否か
を判定して(714)、空でなければ707に戻って次
のノードの処理を繰り返す。
を判定して(714)、空でなければ707に戻って次
のノードの処理を繰り返す。
【0051】子ノード全ての処理が終わって子ノード集
合が空になれば、MinDist の値を更新する。すなわ
ち、その時点でのリストの要素数がk以上の場合には、
リストのk番目の要素の距離評価値dk をMinDist と
し、要素数がk未満の場合にはMinDist の値を∞(無
限大)に設定する(715)。
合が空になれば、MinDist の値を更新する。すなわ
ち、その時点でのリストの要素数がk以上の場合には、
リストのk番目の要素の距離評価値dk をMinDist と
し、要素数がk未満の場合にはMinDist の値を∞(無
限大)に設定する(715)。
【0052】その後、703に戻って、検索情報管理リ
スト中の要素のうち、非リーフノードへのポインタをも
ち、かつ、距離評価値が最小の要素、すなわち、非リー
フノード中最上位の要素、を探して、そのような要素が
なくなるまで705〜715を繰返す。そして、そのよ
うな要素がなくなればこれを停止条件として終了し、リ
ストから結果を取得する。
スト中の要素のうち、非リーフノードへのポインタをも
ち、かつ、距離評価値が最小の要素、すなわち、非リー
フノード中最上位の要素、を探して、そのような要素が
なくなるまで705〜715を繰返す。そして、そのよ
うな要素がなくなればこれを停止条件として終了し、リ
ストから結果を取得する。
【0053】次に、本発明の第2の実施の形態について
説明する。
説明する。
【0054】本発明の第2の実施の形態は、多次元ベク
トル空間内の近傍検索方法のプログラムが記録された磁
気ディスク、半導体メモリ、光ディスクその他の記録媒
体で、このプログラムはコンピュータに読み込まれてそ
のコンピュータの多次元ベクトル空間内の近傍検索の動
作を制御する。
トル空間内の近傍検索方法のプログラムが記録された磁
気ディスク、半導体メモリ、光ディスクその他の記録媒
体で、このプログラムはコンピュータに読み込まれてそ
のコンピュータの多次元ベクトル空間内の近傍検索の動
作を制御する。
【0055】すなわち、先ず、与えられた多次元ベクト
ル空間のデータに対して、各階層ごとにいくつかのクラ
スタといずれのクラスタにも属しない余りの要素とに分
類することを繰り返して非均衡木の木構造インデクスを
構築し、次にオブジェクトの参照点が入力されると、そ
のノードに対応する多次元ベクトル空間内の点と参照点
との距離評価値を計算して、木構造インデクスのノード
へのポインタとともに検索管理情報リストとして記憶装
置に格納し、その検索管理情報リストを参照して木構造
インデクスをルートノードから順に辿り、参照点との間
の距離評価値の小さい点を特定の数だけ出力する。
ル空間のデータに対して、各階層ごとにいくつかのクラ
スタといずれのクラスタにも属しない余りの要素とに分
類することを繰り返して非均衡木の木構造インデクスを
構築し、次にオブジェクトの参照点が入力されると、そ
のノードに対応する多次元ベクトル空間内の点と参照点
との距離評価値を計算して、木構造インデクスのノード
へのポインタとともに検索管理情報リストとして記憶装
置に格納し、その検索管理情報リストを参照して木構造
インデクスをルートノードから順に辿り、参照点との間
の距離評価値の小さい点を特定の数だけ出力する。
【0056】
【実施例】次に、本発明により木構造インデクスを構築
する具体例について、図1と図5及び図6を参照して説
明する。ここで、データセットMの点を12個、与えら
れた要素数の限界値Nmax を4と仮定する。
する具体例について、図1と図5及び図6を参照して説
明する。ここで、データセットMの点を12個、与えら
れた要素数の限界値Nmax を4と仮定する。
【0057】最初のDはMの12個の点そのものであ
る。図5の(1)は、この最初のDに403のクラスタ
リング処理を行なった結果の1例を示し、2点のクラス
タ3個と3点のクラスタ1個の合計4つのクラスタと、
余りの点3個とになったとする。これら4つのクラスタ
内の9個の点を第0層のノードとする。また、各クラス
タとクラスタ内の点とをそれぞれリンクする。そして、
各クラスタの代表点を求め、剰余リストの点3個と合わ
せて7個の要素からなる集合を新たなDとする。その結
果が図5の(2)である。
る。図5の(1)は、この最初のDに403のクラスタ
リング処理を行なった結果の1例を示し、2点のクラス
タ3個と3点のクラスタ1個の合計4つのクラスタと、
余りの点3個とになったとする。これら4つのクラスタ
内の9個の点を第0層のノードとする。また、各クラス
タとクラスタ内の点とをそれぞれリンクする。そして、
各クラスタの代表点を求め、剰余リストの点3個と合わ
せて7個の要素からなる集合を新たなDとする。その結
果が図5の(2)である。
【0058】次に、Lを1にして、要素数Nを与えられ
た限界値Nmax と比較する。要素数Nは7で、限界値N
max の4より大きいので、図1の403の処理から繰返
す。
た限界値Nmax と比較する。要素数Nは7で、限界値N
max の4より大きいので、図1の403の処理から繰返
す。
【0059】この新たなDに対してクラスタリングを行
い、図5の(3)に示すように、先のそれぞれ2つのク
ラスタの代表と1つの余りとからなる2つのクラスタ
と、いずれのクラスタにも含まれない1つの余りとを得
る。ここで、クラスタ内の要素を第1層のノードとす
る。そして、各クラスタとクラスタ内の要素をそれぞれ
リンクする。
い、図5の(3)に示すように、先のそれぞれ2つのク
ラスタの代表と1つの余りとからなる2つのクラスタ
と、いずれのクラスタにも含まれない1つの余りとを得
る。ここで、クラスタ内の要素を第1層のノードとす
る。そして、各クラスタとクラスタ内の要素をそれぞれ
リンクする。
【0060】次に、各クラスタ、ここでは左と右の各ク
ラスタ、の代表点を求め、剰余リストの点と合わせて新
しく3番目のDとし、L=2として第2層を構築する。
このとき、第2層の構成要素数Nは3であり、Nmax よ
り小さくなったので、図1の409の処理(リンクおよ
び第L層の木構造インデクス生成)に進む。
ラスタ、の代表点を求め、剰余リストの点と合わせて新
しく3番目のDとし、L=2として第2層を構築する。
このとき、第2層の構成要素数Nは3であり、Nmax よ
り小さくなったので、図1の409の処理(リンクおよ
び第L層の木構造インデクス生成)に進む。
【0061】3番目のD(3つの点)について409の
処理を行ない、Dの要素を第2層のノードとする。
処理を行ない、Dの要素を第2層のノードとする。
【0062】ここで、3番目のDの要素の数Nが1であ
るかを調べると、3であって1でないので、411に進
み、これらの要素をまとめて、ルートノードを生成して
リンクすると、図6の(6)のようになる。これを整理
して木構造インデクスとして(7)に示す。
るかを調べると、3であって1でないので、411に進
み、これらの要素をまとめて、ルートノードを生成して
リンクすると、図6の(6)のようになる。これを整理
して木構造インデクスとして(7)に示す。
【0063】本実施例は、木構造インデクスの構築処理
の各クラスタリングの段階で、幾つかのクラスタとどの
クラスタにも入らなかった余りとに分ける方法を取って
いる。これにより、他のものから極端に離れた要素を無
理にどこかのクラスタに入れることを避けている。
の各クラスタリングの段階で、幾つかのクラスタとどの
クラスタにも入らなかった余りとに分ける方法を取って
いる。これにより、他のものから極端に離れた要素を無
理にどこかのクラスタに入れることを避けている。
【0064】他のものから極端に離れた要素を無理にど
こかのクラスタに入れた場合、MBRの重なりが大きく
なる例を図7に示す。図7の(a)は検索対象の多次元
ベクトル空間の構成要素の集まりを示す。これらの構成
要素の集まりを本発明の方法を用いてクラスタリングし
て、極端に離れた左下端の要素を余りとして除外してそ
のたの要素を2つのクラスタとすると、(b)のように
重なり部分は2つのクラスタの隅部分だけになる。とこ
ろが、(b)で余りとした要素を従来のように、いずれ
かのクラスタに含めようとすると、(c)〜(f)に示
すように重なり部分がいずれかのクラスタの1つの辺部
全体を占めるようになり、本発明による(b)の場合よ
りも重なりが大きくなる。
こかのクラスタに入れた場合、MBRの重なりが大きく
なる例を図7に示す。図7の(a)は検索対象の多次元
ベクトル空間の構成要素の集まりを示す。これらの構成
要素の集まりを本発明の方法を用いてクラスタリングし
て、極端に離れた左下端の要素を余りとして除外してそ
のたの要素を2つのクラスタとすると、(b)のように
重なり部分は2つのクラスタの隅部分だけになる。とこ
ろが、(b)で余りとした要素を従来のように、いずれ
かのクラスタに含めようとすると、(c)〜(f)に示
すように重なり部分がいずれかのクラスタの1つの辺部
全体を占めるようになり、本発明による(b)の場合よ
りも重なりが大きくなる。
【0065】従って、本実施例の木構造インデクスは、
当初の構築には既存のVAM SplitR-tree 等のインデ
クスの計算より時間はかかるが、木構造インデクスのノ
ード間の重なりが小さくなっているので、予め構築して
おくことにより、任意の検索要求が与えられたとき、指
定されたk件の近傍点を高速に検索することができる。
当初の構築には既存のVAM SplitR-tree 等のインデ
クスの計算より時間はかかるが、木構造インデクスのノ
ード間の重なりが小さくなっているので、予め構築して
おくことにより、任意の検索要求が与えられたとき、指
定されたk件の近傍点を高速に検索することができる。
【0066】
【発明の効果】上述のように本発明は、予め各階層ごと
に要素のクラスタリングによる作成を繰り返して非均衡
木の木構造インデクスの補助データ構造を構築しておい
て、検索管理情報リストを参照して、その木構造インデ
クスをルートノードから順に辿り、検索管理情報リスト
を更新し、検索の処理停止を判断することにより、木構
造インデクスのノード間の重なり部分を検索する無駄を
省いて検索を高速化できる効果がある。
に要素のクラスタリングによる作成を繰り返して非均衡
木の木構造インデクスの補助データ構造を構築しておい
て、検索管理情報リストを参照して、その木構造インデ
クスをルートノードから順に辿り、検索管理情報リスト
を更新し、検索の処理停止を判断することにより、木構
造インデクスのノード間の重なり部分を検索する無駄を
省いて検索を高速化できる効果がある。
【図1】本発明による木構造インデクスの構築処理例の
流れ図である。
流れ図である。
【図2】図1のクラスタリングの部分の詳細な処理の流
れ図である。
れ図である。
【図3】本発明による検索処理例の流れ図である。
【図4】本発明の検索処理の包含距離評価値の求め方の
実施例を示す図である。
実施例を示す図である。
【図5】本発明の木構造インデクスの構築処理の具体的
な例の説明図である。
な例の説明図である。
【図6】図5の続きを示す図である。
【図7】本発明の方法と従来の方法とのクラスタリング
の重なりの比較例を示す図である。
の重なりの比較例を示す図である。
【図8】木構造の説明図である。
【図9】木構造インデクスでノードの重なりのある例を
示す図である。
示す図である。
【図10】木構造インデクスでノードの重なりのない例
を示す図である。
を示す図である。
【符号の説明】 01〜22 多次元ベクトル空間内の点 1−A〜1−H,2−A〜2−C 階層別のノード(M
BR) 401〜412,501〜521,701〜713 ス
テップ
BR) 401〜412,501〜521,701〜713 ス
テップ
Claims (3)
- 【請求項1】 木構造インデクスと呼ばれる補助データ
構造を構築し、多次元ベクトル空間内の多数の点の中か
ら、その空間内で指定された点、以下参照点という、と
の間の距離評価値が近い点を前記木構造インデクスを利
用して特定の数だけ取り出す多次元ベクトル空間内の近
傍検索方法において、 各階層の要素をいくつかのクラスタと、いずれのクラス
タにも属さない余りの要素とに分類する処理を各階層ご
とに繰返して木構造インデクスを構築する手順と、 前記木構造インデクスのノードへのポインタと、そのノ
ードに対応する多次元ベクトル空間内の点と前記参照点
との距離評価値との組を情報として作成し検索管理情報
リストに格納する手順と、 前記検索管理情報リストを参照して、その木構造インデ
クスをルートノードから順に辿る手順と、 前記検索管理情報リストを更新する手順と、 検索の処理停止を判断する手順と、を有することを特徴
とする多次元ベクトル空間内の近傍検索方法。 - 【請求項2】 前記検索管理情報リストには、各クラス
タの代表点と他の全クラスタの代表点との距離評価値を
計算して、距離評価値の小さいものから順に並べられた
リストを含む請求項1に記載の多次元ベクトル空間内の
近傍検索方法。 - 【請求項3】 コンピュータに多次元ベクトル空間内の
近傍検索を実行させるためのプログラムが記録された機
械読取り可能な記録媒体であって、前記プログラムは、
各段階の要素を、要素についてのいくつかのクラスタ
と、いずれのクラスタにも属さない余りの要素とに分類
する処理を各階層ごとに繰返して木構造インデクスを構
築する手順と、前記木構造インデクスのノードへのポイ
ンタと、そのノードに対応する多次元ベクトル空間内の
点と参照点との距離評価値との組を情報として格納する
検索管理情報リストを作成する手順と、前記検索管理情
報リストを参照して、その木構造インデクスをルートノ
ードから順に辿る手順と、前記検索管理情報リストを更
新する手順と、検索の処理停止を判断する手順とを有す
ることを特徴とする多次元ベクトル空間内の近傍検索の
プログラムの記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9106240A JPH10301937A (ja) | 1997-04-23 | 1997-04-23 | 多次元ベクトル空間内の近傍検索方法とそのプログラムの記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9106240A JPH10301937A (ja) | 1997-04-23 | 1997-04-23 | 多次元ベクトル空間内の近傍検索方法とそのプログラムの記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10301937A true JPH10301937A (ja) | 1998-11-13 |
Family
ID=14428601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9106240A Pending JPH10301937A (ja) | 1997-04-23 | 1997-04-23 | 多次元ベクトル空間内の近傍検索方法とそのプログラムの記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10301937A (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000200342A (ja) * | 1999-01-06 | 2000-07-18 | Nippon Telegr & Teleph Corp <Ntt> | 多次元空間デ―タ構造および多次元空間デ―タの更新および探索方法と前記多次元空間デ―タ構造を記録した記録媒体および前記方法を実施するプログラムを記録した記録媒体 |
JP2001014291A (ja) * | 1999-06-29 | 2001-01-19 | Jisedai Joho Hoso System Kenkyusho:Kk | 放送型情報システム、放送情報配信方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002359620A (ja) * | 2001-06-01 | 2002-12-13 | Jisedai Joho Hoso System Kenkyusho:Kk | 放送型情報システム、放送情報フィルタリング方法およびその方法をコンピュータに実行させるプログラム |
KR100385528B1 (ko) * | 1997-10-31 | 2003-05-27 | 인터내셔널 비지네스 머신즈 코포레이션 | 다차원 데이터 표시 방법 및 기록 매체 |
KR100427603B1 (ko) * | 2000-12-01 | 2004-04-30 | (주)코어로직스 | 데이터 분류체계 구축방법 |
KR100429792B1 (ko) * | 2000-11-15 | 2004-05-03 | 삼성전자주식회사 | 특징 벡터 공간의 인덱싱 방법 및 검색 방법 |
KR100859710B1 (ko) | 2006-12-07 | 2008-09-23 | 한국전자통신연구원 | 데이터에 대한 검색을 수행하기 위한 자료구조를 이용하여 데이터를 검색, 저장, 삭제하는 방법 |
KR100899817B1 (ko) * | 2008-07-15 | 2009-05-27 | 한국전자통신연구원 | 데이터에 대한 검색을 수행하는 자료구조를 기록한컴퓨터로 읽을 수 있는 기록매체 |
KR100925294B1 (ko) | 2007-10-24 | 2009-11-04 | 유민구 | 정보의 태그 데이터와 큐브 구조체를 이용하는 검색 시스템및 검색 방법 |
JP4438014B1 (ja) * | 2008-11-06 | 2010-03-24 | 株式会社ネイクス | 有害顧客検知システム、その方法及び有害顧客検知プログラム |
US10564848B2 (en) | 2016-04-13 | 2020-02-18 | Fujitsu Limited | Information storage device and method for deduplication |
CN113407542A (zh) * | 2021-06-28 | 2021-09-17 | 长春理工大学 | 一种城市路网车辆出行轨迹的检索方法及系统 |
-
1997
- 1997-04-23 JP JP9106240A patent/JPH10301937A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100385528B1 (ko) * | 1997-10-31 | 2003-05-27 | 인터내셔널 비지네스 머신즈 코포레이션 | 다차원 데이터 표시 방법 및 기록 매체 |
JP2000200342A (ja) * | 1999-01-06 | 2000-07-18 | Nippon Telegr & Teleph Corp <Ntt> | 多次元空間デ―タ構造および多次元空間デ―タの更新および探索方法と前記多次元空間デ―タ構造を記録した記録媒体および前記方法を実施するプログラムを記録した記録媒体 |
JP2001014291A (ja) * | 1999-06-29 | 2001-01-19 | Jisedai Joho Hoso System Kenkyusho:Kk | 放送型情報システム、放送情報配信方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
KR100429792B1 (ko) * | 2000-11-15 | 2004-05-03 | 삼성전자주식회사 | 특징 벡터 공간의 인덱싱 방법 및 검색 방법 |
KR100427603B1 (ko) * | 2000-12-01 | 2004-04-30 | (주)코어로직스 | 데이터 분류체계 구축방법 |
JP2002359620A (ja) * | 2001-06-01 | 2002-12-13 | Jisedai Joho Hoso System Kenkyusho:Kk | 放送型情報システム、放送情報フィルタリング方法およびその方法をコンピュータに実行させるプログラム |
KR100859710B1 (ko) | 2006-12-07 | 2008-09-23 | 한국전자통신연구원 | 데이터에 대한 검색을 수행하기 위한 자료구조를 이용하여 데이터를 검색, 저장, 삭제하는 방법 |
KR100925294B1 (ko) | 2007-10-24 | 2009-11-04 | 유민구 | 정보의 태그 데이터와 큐브 구조체를 이용하는 검색 시스템및 검색 방법 |
KR100899817B1 (ko) * | 2008-07-15 | 2009-05-27 | 한국전자통신연구원 | 데이터에 대한 검색을 수행하는 자료구조를 기록한컴퓨터로 읽을 수 있는 기록매체 |
JP4438014B1 (ja) * | 2008-11-06 | 2010-03-24 | 株式会社ネイクス | 有害顧客検知システム、その方法及び有害顧客検知プログラム |
JP2010113167A (ja) * | 2008-11-06 | 2010-05-20 | Neikusu:Kk | 有害顧客検知システム、その方法及び有害顧客検知プログラム |
US10564848B2 (en) | 2016-04-13 | 2020-02-18 | Fujitsu Limited | Information storage device and method for deduplication |
CN113407542A (zh) * | 2021-06-28 | 2021-09-17 | 长春理工大学 | 一种城市路网车辆出行轨迹的检索方法及系统 |
CN113407542B (zh) * | 2021-06-28 | 2023-11-14 | 长春理工大学 | 一种城市路网车辆出行轨迹的检索方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | LISA: A learned index structure for spatial data | |
US5533148A (en) | Method for restructuring physical design images into hierarchical data models | |
Traina et al. | Fast indexing and visualization of metric data sets using slim-trees | |
Krishnapuram et al. | Content-based image retrieval based on a fuzzy approach | |
CA2434081C (en) | Data structures utilizing objects and pointers in the form of a tree structure | |
Stanoi et al. | Reverse nearest neighbor queries for dynamic databases. | |
US6477515B1 (en) | Efficient computation of least cost paths with hard constraints | |
EP0947937B1 (en) | Image search apparatus and method | |
US5499360A (en) | Method for proximity searching with range testing and range adjustment | |
US8620899B2 (en) | Generating materialized query table candidates | |
JP4878178B2 (ja) | データ処理方法および装置並びにその処理プログラム | |
US6105018A (en) | Minimum leaf spanning tree | |
US20030061244A1 (en) | System and method for database query optimization | |
US6917943B2 (en) | Sheaf data model | |
JP2003330943A (ja) | 多次元インデクス生成装置、多次元インデクス生成方法、近似情報作成装置、近似情報作成方法、及び検索装置 | |
JPH0682331B2 (ja) | トランジティブクロージャ生成方法、データベース圧縮方法、データベース生成システム、データベースストア方法および情報提供システム | |
JPH10301937A (ja) | 多次元ベクトル空間内の近傍検索方法とそのプログラムの記録媒体 | |
CN112035586A (zh) | 基于可扩展学习索引的空间范围查询方法 | |
CN118445318A (zh) | 一种支持多类型查询的路网索引方法 | |
US7302377B1 (en) | Accelerated event queue for logic simulation | |
Medina et al. | Evaluation of indexing strategies for possibilistic queries based on indexing techniques available in traditional RDBMS | |
JP3505393B2 (ja) | 類似オブジェクト検索方法、装置、および類似オブジェクト検索プログラムを記録した記録媒体 | |
Corral et al. | Algorithms for joining R-trees and linear region quadtrees | |
JP3938815B2 (ja) | ノード作成方法、画像検索方法及び記録媒体 | |
JPH10260990A (ja) | 例示検索の高速化方法 |