JPWO2015005017A1 - 多次元範囲検索装置及び多次元範囲検索方法 - Google Patents

多次元範囲検索装置及び多次元範囲検索方法 Download PDF

Info

Publication number
JPWO2015005017A1
JPWO2015005017A1 JP2015526206A JP2015526206A JPWO2015005017A1 JP WO2015005017 A1 JPWO2015005017 A1 JP WO2015005017A1 JP 2015526206 A JP2015526206 A JP 2015526206A JP 2015526206 A JP2015526206 A JP 2015526206A JP WO2015005017 A1 JPWO2015005017 A1 JP WO2015005017A1
Authority
JP
Japan
Prior art keywords
prefix
section
index key
bit
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015526206A
Other languages
English (en)
Other versions
JP6428615B2 (ja
Inventor
祥治 西村
祥治 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2015005017A1 publication Critical patent/JPWO2015005017A1/ja
Application granted granted Critical
Publication of JP6428615B2 publication Critical patent/JP6428615B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2264Multidimensional index structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

多次元範囲検索装置(10)は、空間充填曲線上の任意の点を表す対象インデックスキーを取得する取得部(11)と、対象インデックスキーのビット列に基づいて、空間充填曲線上の未探索区間に含まれるインデックスキーのビット列を表し得るプレフィックスデータを抽出する抽出部(12)と、プレフィックスデータにより示される空間充填曲線上のプレフィックス区間と、多次元範囲検索の問い合わせ区間との重複を判定する判定部(13)と、問い合わせ区間と重複すると判定された、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間と、問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定する特定部(14)と、検索点として特定されたインデックスキーに対応するページ情報をインデックス格納部(16)から検索する検索部(15)とを有する。

Description

本発明は、多次元範囲検索におけるインデックス走査技術に関する。
データ数の増加に伴い、拡張性のある分散型データベースが提案されている。これら分散型データベースの多くは、一次元のみの範囲検索のような単純な問い合わせ処理のみをサポートすることで拡張性を実現している。一方で、多次元値を一次元値にマップすることで、複数次元の範囲検索を可能としている分散型データベースも提案されている(下記非特許文献1)。下記非特許文献1では、概ね、下記のようにして、一次元化されたデータに対する多次元範囲検索を実現している。
インデックス部及びデータ格納部が存在する。データセットは、或る閾値件数以下となるように、ページに分けられ、データ格納部に格納される。この時、データセットは、空間ベースの空間分割方法により、各部分空間に含まれるデータ数が閾値以下となるまで空間的に分割され、分割されたデータセットが各部分空間と関連付けられたページへ分散配置される。
図7は、データセットにマッピングされる2次元空間の空間分割の例を示す図である。図7では、2次元空間がZ曲線と呼ばれる空間充填曲線を用いて1次元化され、1次元化されたキー値が、2進数表記されている。インデックス部では、各部分空間に含まれるキー値のビット列の最長共通プレフィックスに基づいて各部分空間にそれぞれ名前を付け、名前順でソートされた部分空間の並びがインデックスとされる。図8は、図7の例から生成されるインデックスを示す図である。
下記非特許文献1では、インデックス部を次のように操作することで多次元範囲検索を実現する。検索対象範囲(検索空間)を一次元化することで得られる区間の中から、最大値を示すビット列(最大点と表記する)及び最小値を示すビット列(最小点と表記する)が取得される。このとき、例えば、検索空間が図9に点線で示される領域であったと仮定する。この場合、最小点は、その領域の左下の角の位置「000011」であり、最大点は、その領域の右上の角の位置「100111」である。続いて、当該手法は、インデックス上で、この最小点からこの最大点までの範囲を走査する。このとき、その走査範囲内にある各部分空間について、検索対象の範囲と少なくとも一部が重なっているか否かがそれぞれチェックされ、重なっている部分空間に対応付けられたデータページが検索対象に決定される。図9の例によれば、空間名「0000**」から「10****」までの範囲がチェックされる。即ち、この例の場合、インデックス上の略全てのエントリに関して、それぞれのエントリに対応する部分空間と検索空間との重なりがチェックされることになる。但し、検索空間と重なる部分空間は、「0000**」、「0001**」、「001***」、「10****」の4つの部分空間しかなく、「010000」から「011111」の複数の部分空間は、当該チェックの結果、検索空間と重ならず、検索対象から除外されることになる。
Shoji Nishimura, Sudipto Das, Divyakant Agrawal, Amr El Abbadi, "MD-HBase: A Scalable Multi-Dimensional Data Infrastructure for Location Aware Services", IEEE computer society, 2011.6.6.
しかしながら、上述の手法では、多次元範囲検索において、インデックス走査が非効率になる場合がある。例えば、上述の図9の例に示されるように、検索空間が多次元空間全体に比べて小さいにもかかわらず、インデックスの走査範囲(最小点から最大点までの間)に多くの部分空間が含まれる場合があり得る。上述の手法は、インデックス走査範囲の最小点と最大点との間にある全ての部分空間について検索空間と重なっているか否かをチェックしているため、インデックス走査で検索空間と重なる部分空間を抽出するのに多くの時間が費やされてしまう。
このような問題は、多次元空間を一次元化するときに生じるひずみに起因する。例えば、検索範囲として、複数の属性の中の一部の属性の値が指定されず、或る属性の全値域が指定される場合、指定した属性の範囲が十分狭いにもかかわらず、全インデックスを走査することになる可能性がある。このような問題は、検索対象の次元数が多い場合や、検索時に指定する各次元の範囲の幅に差がある場合等に顕著となる。
本発明は、上述のような課題に鑑みてなされたものであり、多次元範囲検索時のヒットページの検出を高速化する技術を提供する。
本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。
第1の側面は、多次元範囲検索装置に関する。第1の側面に係る多次元範囲検索装置は、複数の属性からなるデータセットがマッピングされる多次元空間の一次元化に用いられる空間充填曲線上の任意の点を表す対象インデックスキーを取得する取得部と、取得部により取得された対象インデックスキーのビット列に基づいて、空間充填曲線上の未探索区間に含まれるインデックスキーのビット列を表し得るプレフィックスデータを抽出する抽出部と、抽出部により抽出されたプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される空間充填曲線上のプレフィックス区間と、多次元範囲検索の問い合わせ区間との重複を判定する判定部と、判定部により問い合わせ区間と重複すると判定された、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間と、問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定する特定部と、特定部により検索点として特定されたインデックスキーに対応するページ情報をインデックス格納部から検索する検索部とを有する。第1の側面で用いられる上記空間充填曲線は、プレフィックスデータと、プレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成されるプレフィックス区間とが一対一に対応し、プレフィックスデータのプレフィックスの長さとプレフィックス区間の大きさとが負の相関を持つ特性を有する。
第2の側面は、上記第1の側面と同様の特性を持つ空間充填曲線を用いる多次元範囲検索方法に関する。第2の側面に係る多次元範囲検索方法は、複数の属性からなるデータセットがマッピングされる多次元空間の一次元化に用いられる空間充填曲線上の任意の点を表す対象インデックスキーを取得し、対象インデックスキーのビット列に基づいて、空間充填曲線上の未探索区間に含まれるインデックスキーのビット列を表し得るプレフィックスデータを抽出し、抽出されたプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される空間充填曲線上のプレフィックス区間と、多次元範囲検索の問い合わせ区間との重複を判定し、問い合わせ区間と重複すると判定された、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間と、問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定し、検索点として特定されたインデックスキーに対応するページ情報をインデックス格納部から検索する、ことを含む。
なお、本発明の他の側面としては、上記第2の側面の方法を少なくとも1つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
上記各側面によれば、多次元範囲検索時のヒットページの検出を高速化する技術を提供することができる。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
本発明の実施形態における多次元範囲検索装置(検索装置)のハードウェア構成例を概念的に示す図である。 第1実施形態における多次元範囲検索装置(検索装置)の処理構成例を概念的に示す図である。 上述の実施形態における多次元範囲検索装置(検索装置)の動作例を示すフローチャートである。 実施例で利用される空間充填曲線及びプレフィックス区間を示す図である。 本実施例で用いられる空間充填曲線及インデックスキーを示す図である。 本実施例における対象インデックスキーからの検索点の特定を概念的に示す図である。 データセットにマッピングされる2次元空間の空間分割の例を示す図である。 図7の例から生成されるインデックスを示す図である。 図7の例における検索範囲の例を示す図である。
以下、本発明の実施の形態について説明する。なお、以下に挙げる実施形態は例示であり、本発明は以下の実施形態の構成に限定されない。
以下に挙げる本発明の実施の形態における多次元範囲検索装置は、多次元範囲検索のクエリを取得し、このクエリの問い合わせ区間(検索空間)をカバーするデータページ(ヒットページ)の情報を抽出する。ここで、多次元範囲検索とは、複数の属性が条件に指定された範囲検索であり、指定される属性の数は複数であれば特に制限されない。多次元範囲検索装置により抽出されるページ情報によれば、問い合わせ区間に含まれるデータが格納される場所が特定可能となる。
〔装置構成〕
図1は、本発明の実施形態における多次元範囲検索装置(以降、単に検索装置と表記する)10のハードウェア構成例を概念的に示す図である。本実施形態における検索装置10は、いわゆるコンピュータであり、例えば、バス5で相互に接続される、CPU(Central Processing Unit)2、メモリ3、入出力インタフェース(I/F)4等を有する。メモリ3は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク等である。
入出力I/F4は、ネットワーク(図示せず)を介して他のコンピュータと通信を行う通信装置、可搬型記録媒体に対するアクセスを制御する装置、キーボード、マウス等のようなユーザ操作の入力を受け付ける入力装置、ディスプレイ装置やプリンタ等のようなユーザに情報を提供する出力装置等と接続可能である。但し、検索装置10のハードウェア構成は制限されない。
〔処理構成〕
図2は、第1実施形態における検索装置10の処理構成例を概念的に示す図である。第1実施形態における検索装置10は、取得部11、抽出部12、判定部13、特定部14、検索部15、インデックス格納部16等を有する。これら各処理部は、例えば、CPU2によりメモリ3に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD(Compact Disc)、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F4を介してインストールされ、メモリ3に格納されてもよい。
インデックス格納部16は、インデックスデータ及びページ情報をそれぞれ含む複数のエントリを格納する。検索装置10で検索対象とされる、複数の属性からなるデータセットは、空間ベースの空間分割法により、各部分空間に含まれるデータ数が閾値以下となるまで空間的に分割され、分割されたデータセットが各部分空間と関連付けられたデータページへ分散配置されている。一方、当該データセットがマッピングされる多次元空間の各データ点は、当該多次元空間が空間充填曲線で一元化されることで生成される各多次元インデックスキー(以降、単に、インデックスキーと表記する)により索引付けされている。
インデックス格納部16に格納されるインデックスデータは、上記多次元空間の或る部分空間の位置及び範囲を特定し得るデータ形式を持ち、対応する部分空間に含まれるインデックスキーの最長共通プレフィックスとワイルドカード文字との組み合わせで形成される。なお、対応する部分空間に含まれるインデックスキーが1つの場合、その部分空間を示すインデックスデータは、そのインデックスキーそのものとなる。インデックス格納部16に格納されるページ情報は、同じエントリに含まれるインデックスデータにより示される部分空間と関連付けられたデータページの所在位置を示す。データページ自体は、検索装置10に保持されてもよいし、他の装置に保持されていてもよい。
インデックス格納部16に格納されるエントリは、インデックスデータの名前順にソートされている。即ち、インデックス格納部16では、ページ情報は、インデックスデータの名前順にソートされている。また、インデックス格納部16は、Bツリーのような周知の木構造で各エントリを格納してもよい。図2の例では、検索装置10がインデックス格納部16を持つが、インデックス格納部16は他の装置上で実現されてもよい。
本実施形態において、上記多次元空間の一次元化に用いられる空間充填曲線には、Z曲線、ヒルベルト曲線等のような周知の固定化されたものが利用されてもよいし、より汎用化されたものが利用されてもよい。汎用化された空間充填曲線は、例えば、各属性のビット列の並び順を変えず、各属性のビット列同士を任意の順序で混合することで、多次元空間を一次元化する。本実施形態で用いられる空間充填曲線は、プレフィックスデータと、そのプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成されるプレフィックス区間とが一対一に対応し、プレフィックスデータのプレフィックスの長さとプレフィックス区間の大きさとが負の相関を持つ特性を有するものであればよい。プレフィックスデータの説明は後述する。
取得部11は、上記多次元空間の一次元化に用いられる上記空間充填曲線上の任意の点を表す対象インデックスキーを取得する。この任意の点は、例えば、当該空間充填曲線上の探索済みの区間の最終点(最小点又は最大点)に設定され得る。取得部11は、対象インデックスキーを、可搬型記録媒体、他のコンピュータ等から入出力I/F4を経由して取得してもよいし、入力画面等に基づいて入力部をユーザが操作することにより入力された情報として取得してもよい。対象インデックスキーの取得方法は制限されない。
抽出部12は、取得部11により取得された対象インデックスキーのビット列に基づいて、当該空間充填曲線上の未探索区間に含まれるインデックスキーのビット列を表し得るプレフィックスデータを抽出する。ここで、未探索区間とは、対象インデックスキーの走査の次に、空間充填曲線に沿って走査すべきインデックスキーから形成される空間充填曲線上の区間を意味する。
プレフィックスデータとは、固定ビット長のビット列であり、プレフィックスのみから形成されるビット列、又は、プレフィックスと少なくとも1つのワイルドカード文字とから形成されるビット列である。ここでは、1つのワイルドカード文字も1ビットデータとして扱われる。上記未探索区間に「011001」から「111111」までのインデックスキーが含まれる場合、例えば、抽出部12は、「011001」、「01101*」、「0111**」、「1*****」をプレフィックスデータとして抽出する。この例では、ワイルドカード文字には「*」が利用されている。但し、ワイルドカード文字は制限されない。これらプレフィックスデータは、未探索区間に含まれる全てのインデックスキー(「011001」から「111111」まで)を表し得る。
このように、抽出部12により抽出されるプレフィックスデータは、データセットがマッピングされた多次元空間内における、少なくとも1つのインデックスキーを示す1つの部分空間に対応する。そして、本実施形態では、このプレフィックスデータが、そのプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成されるプレフィックス区間(部分空間)と一対一に対応し、プレフィックスデータのプレフィックスの長さとプレフィックス区間の大きさとが負の相関を持つような、空間充填曲線が利用される。ここで、プレフィックスデータのプレフィックスの長さとプレフィックス区間の大きさとが負の相関とは、プレフィックスの長さが長くなる程、そのプレフィックスデータに対応するプレフィックス区間が小さくなり、プレフィックスの長さが短くなる程、そのプレフィックスデータに対応するプレフィックス区間が大きくなる関係を意味する。
抽出部12は、例えば、次のようにして、対象インデックスキーのビット列から、プレフィックスデータを抽出することができる。抽出部12は、データセットの属性の数に依存しない所定ビット長で取り得る各ビットパターンについて、ビット反転及びワイルドカード文字への置換の少なくとも一方を含む置換ルールをそれぞれ持ち、対象インデックスキーのビット列を当該所定ビット長で区切ることで得られる部分ビット列のビットパターンに対応する置換ルールを用いて、プレフィックスデータを抽出する。
抽出部12が持つ置換ルールは、本実施形態で利用される空間充填曲線及び所定ビット長に適応するように設定される。ここで、所定ビット長は、1ビット以上であれば、特に制限されない。例えば、所定ビット長を、コンピュータで効率的に処理できる長さ(例えば、64ビットや128ビット等)に設定することもできる。このようにすれば、置換ルールの適用処理を効率化することができ、結果として、プレフィックスデータの抽出処理を一層高速化することができる。
判定部13は、抽出部12により抽出されたプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される空間充填曲線上のプレフィックス区間と、多次元範囲検索の問い合わせ区間との重複を判定する。ここで、プレフィックスデータによれば、プレフィックス区間の最大値及び最小値を簡単に取得することができる。ワイルドカード文字を全て1に置換すれば、プレフィックス区間の最大値が取得され、ワイルドカード文字を全て0に置換すれば、プレフィックス区間の最小値が取得され得る。判定部13は、例えば、プレフィックス区間の最大値及び最小値と、問い合わせ区間の最大値及び最小値とを比較することにより、容易に、両区間が重複するか否かを判定することができる。ここで、プレフィックス区間と問い合わせ区間との重複とは、両区間の少なくとも一部の重複を意味する。
特定部14は、判定部13により問い合わせ区間と重複すると判定された、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間と、問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定する。特定部14により特定された検索点は、多次元範囲検索の問い合わせ区間内に含まれる、取得部11で取得された対象インデックスキーの次に走査されるべきインデックスキーを表す。
特定部14は、例えば、上記検索点を次のように特定することができる。上記重複区間の最小点を表すインデックスキーを検索点として特定する場合、特定部14は、プレフィックス区間の最小点を表すインデックスキーを形成する各属性(各次元)のビット列と、問い合わせ区間の最小点を表すインデックスキーを形成する各属性のビット列とを属性毎に比較し、各属性の大きいほうのビット列から、上記重複区間の最小点を表すインデックスキーを特定する。また、上記重複区間の最大点を表すインデックスキーを検索点として特定する場合、特定部14は、プレフィックス区間の最大点を表すインデックスキーを形成する各属性(各次元)のビット列と、問い合わせ区間の最大点を表すインデックスキーを形成する各属性のビット列とを属性毎に比較し、各属性の小さいほうのビット列から、重複区間の最大点を表すインデックスキーを特定する。このように、プレフィックスデータを用いることで、プレフィックス区間の最小値又は最大値を容易に抽出することができ、ひいては、プレフィックス区間と問い合わせ区間との重複区間の最小点又は最大点も容易に特定することができる。特定部14は、他の方法で、上記検索点を特定することもできる。
検索部15は、特定部14により検索点として特定されたインデックスキーに対応するページ情報をインデックス格納部16から検索する。具体的には、検索部15は、検索点としてのインデックスキーを含むインデックスデータを含むエントリをインデックス格納部16から特定し、この特定されたエントリに含まれるページ情報を抽出する。
〔動作例〕
以下、本発明の実施の形態における多次元範囲検索方法について図3を用いて説明する。図3は、上述の実施形態における検索装置10の動作例を示すフローチャートである。以下の説明では、検索装置10が各工程の実行主体となるが、検索装置10に含まれる上述の各処理部や他の装置が実行主体となってもよい。
ここで、本実施形態における多次元範囲検索方法では、複数の属性からなるデータセットが、空間ベースの空間分割法により分割され、複数のデータページに分散配置されており、上述のインデックス格納部16が存在することが前提となる。但し、インデックス格納部16は、検索装置10上に存在してもよいし、他の装置上に存在してもよい。
まず、検索装置10は、複数の属性からなるデータセットがマッピングされる多次元空間の一次元化に用いられる空間充填曲線上の任意の点を表す対象インデックスキーを取得する(S31)。
検索装置10は、(S31)で取得された対象インデックスキーのビット列に基づいて、当該空間充填曲線上の未探索区間に含まれるインデックスキーのビット列を表し得るプレフィックスデータを抽出する(S32)。未探索区間及びプレフィックスデータは、上述のとおりである。また、プレフィックスデータの抽出方法は、抽出部12の処理として上述した手法で実現され得る。
続いて、検索装置10は、(S32)で抽出されたプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される空間充填曲線上のプレフィックス区間と、多次元範囲検索の問い合わせ区間との重複を判定する(S33)。
検索装置10は、(S33)において問い合わせ区間と重複すると判定されたプレフィックス区間であって、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間と、問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定する(S34)。この検索点の特定は、特定部14の処理として上述した手法で実現され得る。
検索装置10は、(S34)で検索点として特定されたインデックスキーに対応するページ情報をインデックス格納部16から検索する(S35)。(S34)で検索点として特定されたインデックスキーは、(S31)で取得された対象インデックスキーの次に、問い合わせ区間で走査されるべきインデックスキーであり、(S34)で抽出されるページ情報は、問い合わせ区間で次にヒットするページを示す。
〔本実施形態の作用及び効果〕
上述したように本実施形態では、空間充填曲線上の任意の点を表す対象インデックスキーのビット列に基づいて、その空間充填曲線上の未探索区間を表すプレフィックスデータが抽出され、プレフィックスデータにより表わされるプレフィックス区間と多次元範囲検索の問い合わせ区間との重複が判定される。そして、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間と問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーが検索点として特定され、その検索点を表すインデックスキーに対応するページ情報が検索される。
このように、本実施形態では、空間充填曲線上の任意の点から、その点に最も近い、問い合わせ区間内の検索点が特定され、その検索点に対応するページ情報が検索される。従って、本実施形態によれば、問い合わせ区間の最小点と最大点との間にある全ての部分空間について問い合わせ区間と重なっているか否かをチェックすることなく、検索点を特定することができるため、多次元範囲検索時のヒットページを高速に検出することができる。
また、本実施形態で用いられる空間充填曲線は、プレフィックスデータと、そのプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成されるプレフィックス区間とが一対一に対応し、プレフィックスデータのプレフィックスの長さとプレフィックス区間の大きさとが負の相関を持つ特性を有するものであれば、その空間充填曲線自体は制限されない。即ち、周知の固定ルール化された空間充填曲線が利用されてもよいし、各属性のビット列の並び順を変えず、各属性のビット列同士を任意の順序で混合することで、多次元空間を一次元化する空間充填曲線が利用されてもよい。
従って、本実施形態によれば、上述のような特性を持つ空間充填曲線を利用することができるのであれば、インデックス設計の制限、及び、データセットのページ分割手法の制限を大幅に緩和することができる。即ち、本実施形態によれば、適用可能なインデックス設計及びデータページ分割を拡大することができる。
[拡張例]
上述の実施形態において、次のようにすれば、問い合わせ区間と重複するプレフィックス区間であって、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間を更に効率的に取得することができる。
抽出部12は、対象インデックスキーのビット列を下位から上位に向かって走査することにより、空間充填曲線上で対象インデックスキーに近い順に、プレフィックスデータを順次抽出する。判定部13は、抽出部12で抽出された順に、プレフィックスデータに対応するプレフィックス区間と問い合わせ区間との重複を判定する。このようにすれば、判定部13により最初に問い合わせ区間と重複すると判定されたプレフィックス区間が、問い合わせ区間と重複するプレフィックス区間であって、空間充填曲線上で対象インデックスキーに最も近いプレフィックス区間となる。特定部14は、判定部13により最初に問い合わせ区間と重複すると判定されたプレフィックス区間と、問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定すればよい。これにより、検索点の特定処理を高速化することができる。
上述のように、対象インデックスキーのビット列を下位から上位に向かって走査することにより、プレフィックス長の長いプレフィックスデータから順次抽出していくことができる。これは、未探索区間を、対象インデックスキーに近い狭いプレフィックス区間から広いプレフィックス区間に徐々に分割していくことに相当する。
以下に実施例を挙げ、上述の実施形態を更に詳細に説明する。本発明は以下の実施例から何ら限定を受けない。
本実施例ではZ曲線を汎用化させた空間充填曲線が利用される。
図4は、実施例で利用される空間充填曲線及びプレフィックス区間を示す図である。本実施例では、図4に示されるように、属性ごとのビット列の混ぜ合わせ順序に自由度を持たせた空間充填曲線を用いる。この空間充填曲線で実現可能な1つの例として、Z曲線が存在する。本実施例では、データセットが2次元空間にマッピングされ、その2次元空間がその空間充填曲線で一次元化される。具体的には、空間充填曲線は、3ビットの長さを持つ2つの属性のビット列「x1,x2,x3」及び「y1,y2,y3」を「y1,x1,y2,y3,x2,x3」のように混ぜ合わせる。図4に示される矢印は、空間充填曲線により二次元空間が埋め尽くされる様を表している。
また、図4には、4つのプレフィックスデータと、各プレフィックスデータに対応するプレフィックス区間とが表されている。左上図では、プレフィックスデータ「0*****」に対応するプレフィックス区間がグレー背景(ハッチング)で示される。右上図では、プレフィックスデータ「00****」に対応するプレフィックス区間がグレー背景(ハッチング)で示される。左下図では、プレフィックスデータ「000***」に対応するプレフィックス区間がグレー背景(ハッチング)で示される。右下図では、プレフィックスデータ「0000**」に対応するプレフィックス区間がグレー背景(ハッチング)で示される。このように、本実施例の空間充填曲線は、プレフィックスデータと、そのプレフィックスデータにより示されるプレフィックス区間とが一対一に対応する。更に、プレフィックスデータのプレフィックスの長さ(0の数)とプレフィックス区間の大きさとが負の相関を示すことが分かる。即ち、プレフィックスの長さが長い程、プレフィックス区間が小さくなり、プレフィックスの長さが短い程、プレフィックス区間が大きくなっている。
本実施例では、プレフィックスデータを形成するワイルドカード文字として「*」が利用される。これにより、「*」を0で置き換えたビット列が、そのプレフィックスデータに対応するプレフィックス区間の最小値を示し、「*」を1で置き換えたビット列が、そのプレフィックスデータに対応するプレフィックス区間の最大値を示す。以降の説明では、ビット列Pの最上位ビットからi番目のビットをP[i]と表記する場合もある。
本実施例における検索装置10は、空間充填曲線上で任意の点P(対象インデックスキー)より大きく、かつ、問い合わせ区間に含まれる最小点(検索点)を次のように特定する。
本実施例における検索装置10は、点Pのビット列Pを最下位側(n−1番目のビット)から最上位側(0番目のビット)の方向に順に走査する。検索装置10は、i番目のビットを参照している場合、P[i]が1のときには、何もせず、P[i]が0のときに、P[i]を1に置換し、かつ、iより下位の各ビットを「*」にそれぞれ置換する。検索装置10は、このような置換ルールに基づいて、空間充填曲線上で点Pに近い順に、点Pよりも大きい少なくとも1つの点を含むプレフィックスデータを順次抽出する。
検索装置10は、抽出されたプレフィックスデータに対応するプレフィックス区間Pと問い合わせ区間Qとの重複区間(交差区間)の最小点を求める。検索装置10は、プレフィックス区間Pと問い合わせ区間Qとが重複する場合、その重複区間の最小点を検索点として特定する。検索装置10は、区間Pの最小点と区間Qの最小点とに関し、属性毎(次元毎)にビット列を比較し、大きい方のビット列から、重複区間の最小点を求めることができる。検索装置10は、この重複区間の最小点が区間Qの範囲内か否かを判定することで、両区間の重複を判定することができる。検索装置10は、両区間が重複しない場合、ビット列Pのi−1番目のビットの処理に移る。
上記置換ルールは、空間充填曲線上で点Pに近い順に、点Pよりも大きい少なくとも1つの点を含むプレフィックスデータを抽出するためのルールである。検索装置10は、この逆の置換ルール、即ち、空間充填曲線上で点Pに近い順に、点Pよりも小さい少なくとも1つの点を含むプレフィックスデータを抽出するためのルールを用いてもよい。この置換ルールによれば、検索装置10は、i番目のビットを参照している場合、P[i]が0のときには、何もせず、P[i]が1のときに、P[i]を0に置換し、かつ、iより下位の各ビットを「*」にそれぞれ置換する。
このように、本実施例における検索装置10(抽出部12)は、次のような置換ルールを持つことができる。即ち、検索装置10(抽出部12)は、対象インデックスキーのビット列の参照ビットが0の場合に、その参照ビットを1に変え、かつ、その参照ビットより下位のビットをワイルドカード文字に変える第1の置換ルール、及び、参照ビットが1の場合に、参照ビットを0に変え、かつ、参照ビットより下位のビットをワイルドカード文字に変える第2の置換ルールの少なくとも一方を持つ。第1の置換ルールによれば、対象インデックスキーよりも大きいインデックスキーの集合から形成されるプレフィックス区間のプレフィックスデータが抽出され、第2の置換ルールによれば、対象インデックスキーよりも小さいインデックスキーの集合から形成されるプレフィックス区間のプレフィックスデータが抽出される。
また、上記置換ルールは、1ビットずつのビット走査のルールであるが、コンピュータでの処理を効率化するために、kビットずつのビット走査のルールとすることもできる。この場合、置換ルールは、kビットで取り得る全てのビットパターンの各々に対して、上述の置換ルールと同じ結果となるような、ビット反転及びワイルドカード文字への置換の少なくとも一方をそれぞれ含むように設定されればよい。例えば、2ビットずつのビット走査を行う場合には、参照ビット列の全ビットパターン「00」、「01」、「10」及び「11」についての置換ルールがそれぞれ設定される。具体的には、参照ビット列が「00」であれば、その参照ビット列を「01」に置換し、かつ、その参照ビット列よりも下位の各ビットを「*」に置換するパターンと、その参照ビット列を「1*」に置換し、かつ、その参照ビット列よりも下位の各ビットを「*」に置換するパターンとが実行される。参照ビット列が「01」であれば、その参照ビット列を「1*」に置換し、かつ、その参照ビット列よりも下位の各ビットを「*」に置換するパターンが実行される。参照ビット列が「10」であれば、その参照ビット列を「11」に置換し、かつ、その参照ビット列よりも下位の各ビットを「*」に置換するパターンが実行される。参照ビット列が「11」であれば、置換がなされない。
以下、本実施例を図5及び図6を用いて更に詳細に説明する。
図5は、本実施例で用いられる空間充填曲線及インデックスキーを示す図である。
図6は、本実施例における対象インデックスキーからの検索点の特定を概念的に示す図である。図6では、問い合わせ区間Q、探索済み区間、未探索区間、対象インデックスキー及び検索点が示されている。探索済み区間は、グレー背景(ハッチング)で示されており、未探索区間は、太い破線で示されている。
ここでは、探索済み区間の最大点が対象インデックスキーに設定される例が示される。即ち、この例では、対象インデックスキー「011011」で示される点までが探索済みであり、この点をPと表記する。本実施例は、未探索区間で、かつ、問い合わせ区間Q内の最小となる点「100010」を検索点として特定する。この検索点が示すインデックスキーに対応するデータページが次に処理すべきヒットページとなる。
検索装置10は、点Pを示す対象インデックスキー「011011」を取得し、この点Pのビット列を下位から上位に向かって走査することにより、空間充填曲線上で点Pに近い順に、プレフィックスデータを抽出する。検索装置10は、1ビットずつ走査する置換ルールに基づいて、下位2ビットはいずれも1なので何もせず、下位3ビット目が0なので、下位3ビット目の0を1に置換し、それより下位の各ビットを「*」に置換する。これにより、検索装置10は、プレフィックスデータ「0111**」を抽出する。
検索装置10は、プレフィックスデータ「0111**」により示されるプレフィックス区間と問い合わせ区間Qとの重複を判定する。このプレフィックス区間は問い合わせ区間Qと重ならないので、検索装置10は、次に近いプレフィックス区間に対応するプレフィックスデータの抽出を試みる。検索装置10は、点Pのビット列の下位4ビット目及び下位5ビット目を順次参照し、共に1であるため何もせず、下位6ビット目(最上位ビット)を参照する。検索装置10は、下位6ビット目は0なので、それを0から1に置換し、それ以降の各ビットを「*」に置換する。これにより、検索装置10は、プレフィックスデータ「1*****」を抽出する。
プレフィックスデータ「1*****」により示されるプレフィックス区間と問い合わせ区間とは重なるため、検索装置10は、両区間の重複区間の最小点を検索点として特定する。このとき、検索装置10は、プレフィックス区間の最小点「100000」と問い合わせ区間Qの最小点「000011」とに関し、属性毎にビット列を比較する。プレフィックス区間の最小点「100000」は、属性xのビット列「000」及び属性yのビット列「100」から形成される。問い合わせ区間Qの最小点「000011」は、属性xのビット列「001」及び属性yのビット列「001」から形成される。属性xについては、問い合わせ区間のビット列「001」が選択され、属性yについては、プレフィックス区間のビット列「100」が選択される。検索装置10は、選択された各ビット列から、重複区間の最小点「100010」を特定する。
検索装置10は、特定された検索点「100010」を含むインデックスデータに対応するページ情報をインデックス格納部16から抽出し、このページ情報で特定されるデータページによりカバーされる区間の終了点までを探索済み区間とする。検索装置10は、このような処理を問い合わせ区間全体が探索済みとなるまで繰り返し実行する。
上記例では、問い合わせ区間Qの最小点から最大点に向かって探索されたが、逆方向に探索されてもよい。例えば、図6において、プレフィックスデータ「1*****」のプレフィックス区間が探索済みであり、探索済み区間の最小点が「100000」であると仮定する。この例では、検索装置10は、次のように、未探索区間で、かつ、問い合わせ区間Q内の最大となる点「010111」を検索点として特定する。この例では、検索装置10は、点P(対象インデックスキー)「100000」を取得し、このビット列を下位から上位に向かって走査することにより、空間充填曲線上で点Pに近い順に、プレフィックスデータを抽出する。検索装置10は、1ビットずつ走査する置換ルールに基づいて、下位5ビットはいずれも0なので何もせず、下位6ビット目が1なので、そのビット1を0に置換し、それより下位の各ビットを「*」に置換する。これにより、検索装置10は、プレフィックスデータ「0*****」を抽出する。
検索装置10は、プレフィックスデータ「0*****」により示されるプレフィックス区間と問い合わせ区間Qとが重なるため、両区間の重複区間の最大点を検索点として特定する。このとき、検索装置10は、プレフィックス区間の最大点「011111」と問い合わせ区間Qの最大点「110010」とに関し、属性毎にビット列を比較する。プレフィックス区間の最大点「011111」は、属性xのビット列「111」及び属性yのビット列「011」から形成される。問い合わせ区間Qの最大点「110010」は、属性xのビット列「101」及び属性yのビット列「100」から形成される。属性xについては、問い合わせ区間のビット列「101」が選択され、属性yについては、プレフィックス区間のビット列「011」が選択される。検索装置10は、選択された各ビット列から、重複区間の最大点「010111」を特定する。
上記例は、1ビットずつ走査する置換ルールが用いられたが、複数ビットずつ走査する置換ルールが用いられたとしても、上記例と同じプレフィックスデータを抽出することは可能である。
このように、本実施例によれば、クエリの問い合わせ区間内の検索点を、探索済み区間の境界点が表すビット列に対する簡単なビット演算により、効率的に検出することができ、ひいては、ヒットページを高速に検出することができる。
なお、上述の説明で用いたフローチャートでは、複数の工程(処理)が順番に記載されているが、本実施形態で実行される工程の実行順序は、その記載の順番に制限されない。本実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。
この出願は、2013年7月12日に出願された日本出願特願2013−146654号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (11)

  1. 複数の属性からなるデータセットがマッピングされる多次元空間の一次元化に用いられる空間充填曲線上の任意の点を表す対象インデックスキーを取得する取得部と、
    前記取得部により取得された対象インデックスキーのビット列に基づいて、前記空間充填曲線上の未探索区間に含まれるインデックスキーのビット列を表し得るプレフィックスデータを抽出する抽出部と、
    前記抽出部により抽出されたプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される前記空間充填曲線上のプレフィックス区間と、多次元範囲検索の問い合わせ区間との重複を判定する判定部と、
    前記判定部により前記問い合わせ区間と重複すると判定された、前記空間充填曲線上で前記対象インデックスキーに最も近い前記プレフィックス区間と、前記問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定する特定部と、
    前記特定部により検索点として特定されたインデックスキーに対応するページ情報をインデックス格納部から検索する検索部と、
    を備え、
    前記空間充填曲線は、前記プレフィックスデータと、前記プレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される前記プレフィックス区間とが一対一に対応し、前記プレフィックスデータのプレフィックスの長さと前記プレフィックス区間の大きさとが負の相関を持つ特性を有する、
    多次元範囲検索装置。
  2. 前記抽出部は、前記対象インデックスキーのビット列を下位から上位に向かって走査することにより、前記空間充填曲線上で前記対象インデックスキーに近い順に、前記プレフィックスデータを順次抽出する、
    請求項1に記載の多次元範囲検索装置。
  3. 前記空間充填曲線は、各属性のビット列の並び順を変えず、該各属性のビット列同士を任意の順序で混合することで、前記多次元空間を一次元化し、
    前記抽出部は、前記属性の数に依存しない所定ビット長で取り得る各ビットパターンについて、ビット反転及びワイルドカード文字への置換の少なくとも一方を含む置換ルールをそれぞれ持ち、前記対象インデックスキーのビット列を前記所定ビット長で区切ることで得られる部分ビット列のビットパターンに対応する該置換ルールを用いて、前記プレフィックスデータを抽出する、
    請求項1又は2に記載の多次元範囲検索装置。
  4. 前記抽出部は、前記対象インデックスキーのビット列の参照ビットが0の場合に、該参照ビットを1に変え、かつ、該参照ビットより下位のビットをワイルドカード文字に変える第1の置換ルール、及び、該参照ビットが1の場合に、該参照ビットを0に変え、かつ、該参照ビットより下位のビットをワイルドカード文字に変える第2の置換ルールの少なくとも一方を持つ、
    請求項3に記載の多次元範囲検索装置。
  5. 前記特定部は、前記プレフィックス区間の最小点を表すインデックスキーを形成する各属性のビット列と、前記問い合わせ区間の最小点を表すインデックスキーを形成する各属性のビット列とを属性毎に比較し、各属性の大きいほうのビット列から、前記重複区間の最小点を表すインデックスキーを特定する、又は、前記プレフィックス区間の最大点を表すインデックスキーを形成する各属性のビット列と、前記問い合わせ区間の最大点を表すインデックスキーを形成する各属性のビット列とを属性毎に比較し、各属性の小さいほうのビット列から、前記重複区間の最大点を表すインデックスキーを特定する、
    請求項1から4のいずれか1項に記載の多次元範囲検索装置。
  6. 複数の属性からなるデータセットがマッピングされる多次元空間の一次元化に用いられる空間充填曲線上の任意の点を表す対象インデックスキーを取得し、
    前記対象インデックスキーのビット列に基づいて、前記空間充填曲線上の未探索区間に含まれるインデックスキーのビット列を表し得るプレフィックスデータを抽出し、
    前記抽出されたプレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される前記空間充填曲線上のプレフィックス区間と、多次元範囲検索の問い合わせ区間との重複を判定し、
    前記問い合わせ区間と重複すると判定された、前記空間充填曲線上で前記対象インデックスキーに最も近い前記プレフィックス区間と、前記問い合わせ区間との重複区間の最小点又は最大点を表すインデックスキーを検索点として特定し、
    前記検索点として特定されたインデックスキーに対応するページ情報をインデックス格納部から検索する、
    ことを含み、
    前記空間充填曲線は、前記プレフィックスデータと、前記プレフィックスデータのプレフィックスを共通して有するインデックスキーの集合により形成される前記プレフィックス区間とが一対一に対応し、前記プレフィックスデータのプレフィックスの長さと前記プレフィックス区間の大きさとが負の相関を持つ特性を有する、
    多次元範囲検索方法。
  7. 前記プレフィックスデータの抽出は、前記対象インデックスキーのビット列を下位から上位に向かって走査することにより、前記空間充填曲線上で前記対象インデックスキーに近い順に、前記プレフィックスデータを順次抽出する、
    請求項6に記載の多次元範囲検索方法。
  8. 前記空間充填曲線は、各属性のビット列の並び順を変えず、該各属性のビット列同士を任意の順序で混合することで、前記多次元空間を一次元化し、
    前記プレフィックスデータの抽出は、前記属性の数に依存しない所定ビット長で取り得る各ビットパターンに対し設けられる、ビット反転及びワイルドカード文字への置換の少なくとも一方を含む複数の置換ルールの中の、前記対象インデックスキーのビット列を前記所定ビット長で区切ることで得られる部分ビット列のビットパターンに対応する該置換ルールを用いて、前記プレフィックスデータを抽出する、
    請求項6又は7に記載の多次元範囲検索方法。
  9. 前記複数の置換ルールは、前記対象インデックスキーのビット列の参照ビットが0の場合に、該参照ビットを1に変え、かつ、該参照ビットより下位のビットをワイルドカード文字に変える第1の置換ルール、及び、該参照ビットが1の場合に、該参照ビットを0に変え、かつ、該参照ビットより下位のビットをワイルドカード文字に変える第2の置換ルールの少なくとも一方を含む、
    請求項8に記載の多次元範囲検索方法。
  10. 前記検索点の特定は、前記プレフィックス区間の最小点を表すインデックスキーを形成する各属性のビット列と、前記問い合わせ区間の最小点を表すインデックスキーを形成する各属性のビット列とを属性毎に比較し、各属性の大きいほうのビット列から、前記重複区間の最小点を表すインデックスキーを特定する、又は、前記プレフィックス区間の最大点を表すインデックスキーを形成する各属性のビット列と、前記問い合わせ区間の最大点を表すインデックスキーを形成する各属性のビット列とを属性毎に比較し、各属性の小さいほうのビット列から、前記重複区間の最大点を表すインデックスキーを特定する、
    請求項6から9のいずれか1項に記載の多次元範囲検索方法。
  11. 請求項6から10のいずれか1項に記載の多次元範囲検索方法を少なくとも1つのコンピュータに実行させるプログラム。
JP2015526206A 2013-07-12 2014-06-02 多次元範囲検索装置及び多次元範囲検索方法 Active JP6428615B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013146654 2013-07-12
JP2013146654 2013-07-12
PCT/JP2014/064589 WO2015005017A1 (ja) 2013-07-12 2014-06-02 多次元範囲検索装置及び多次元範囲検索方法

Publications (2)

Publication Number Publication Date
JPWO2015005017A1 true JPWO2015005017A1 (ja) 2017-03-02
JP6428615B2 JP6428615B2 (ja) 2018-11-28

Family

ID=52279710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015526206A Active JP6428615B2 (ja) 2013-07-12 2014-06-02 多次元範囲検索装置及び多次元範囲検索方法

Country Status (3)

Country Link
US (1) US10049164B2 (ja)
JP (1) JP6428615B2 (ja)
WO (1) WO2015005017A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10866942B1 (en) * 2015-04-19 2020-12-15 Zeepabyte, Inc Cascaded indexing of multidimensional data
CN108345607B (zh) * 2017-01-22 2022-09-13 腾讯科技(深圳)有限公司 搜索方法和装置
CN111078806B (zh) * 2019-10-12 2024-02-02 平安科技(深圳)有限公司 位置查询方法、装置、计算机设备及存储介质
WO2021157092A1 (ja) * 2020-02-07 2021-08-12 株式会社エスペラントシステム 検索方法及び検索装置
US11461301B2 (en) * 2020-09-13 2022-10-04 International Business Machines Corporation Database index optimization
CN115913963A (zh) * 2022-10-28 2023-04-04 新华三半导体技术有限公司 一种规则中的范围展开方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010160591A (ja) * 2009-01-07 2010-07-22 Hitachi Ltd 空間データ管理装置、空間データ管理方法、および、空間データ管理プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6510435B2 (en) * 1996-09-02 2003-01-21 Rudolf Bayer Database system and method of organizing an n-dimensional data set
JP3607107B2 (ja) * 1998-03-13 2005-01-05 株式会社東芝 データ管理装置
EP1211610A1 (en) * 2000-11-29 2002-06-05 Lafayette Software Inc. Methods of organising data and processing queries in a database system
US11341202B2 (en) * 2006-10-04 2022-05-24 Craxel, Inc. Efficient method of location-based content management and delivery
EP2804115B1 (en) * 2012-01-13 2019-08-07 Nec Corporation Index scan device and index scan method
JP5863494B2 (ja) * 2012-02-13 2016-02-16 キヤノン株式会社 情報処理装置、及びその制御方法、プログラム
JP6187478B2 (ja) * 2013-01-11 2017-08-30 日本電気株式会社 インデックスキー生成装置及びインデックスキー生成方法並びに検索方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010160591A (ja) * 2009-01-07 2010-07-22 Hitachi Ltd 空間データ管理装置、空間データ管理方法、および、空間データ管理プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
水江 真登 外4名: ""資源管理機構を持つP2Pグリッド実行基盤の検討と試作"", 電子情報通信学会 第18回データ工学ワークショップ論文集 [ONLINE], JPN6014027927, 1 June 2007 (2007-06-01), JP, ISSN: 0003838406 *
西村 祥治 外1名: ""一般化されたZ−Orderを用いた多次元索引の提案"", 第5回データ工学と情報マネジメントに関するフォーラム (第11回日本データベース学会年次大会) [O, JPN6014027926, 31 May 2013 (2013-05-31), JP, ISSN: 0003838405 *

Also Published As

Publication number Publication date
JP6428615B2 (ja) 2018-11-28
US10049164B2 (en) 2018-08-14
US20160154890A1 (en) 2016-06-02
WO2015005017A1 (ja) 2015-01-15

Similar Documents

Publication Publication Date Title
JP6428615B2 (ja) 多次元範囲検索装置及び多次元範囲検索方法
US11620397B2 (en) Methods and apparatus to provide group-based row-level security for big data platforms
JP6065844B2 (ja) インデックス走査装置及びインデックス走査方法
JP6167767B2 (ja) インデックス生成装置及び検索装置
CN107305586B (zh) 索引生成方法、索引生成装置及搜索方法
US10949467B2 (en) Random draw forest index structure for searching large scale unstructured data
US11106708B2 (en) Layered locality sensitive hashing (LSH) partition indexing for big data applications
JP6434162B2 (ja) データ管理システム、データ管理方法およびプログラム
CN104881439A (zh) 一种空间高效的多模式串匹配方法和系统
CN106933824B (zh) 在多个文档中确定与目标文档相似的文档集合的方法和装置
Raza et al. Accelerating pattern-based time series classification: a linear time and space string mining approach
JP5844824B2 (ja) Sparqlクエリ最適化方法
US11373040B2 (en) Computer-readable recording medium, encoding device, index generating device, search device, encoding method, index generating method, and search method
WO2012049883A1 (ja) データ構造、インデックス作成装置、データ検索装置、インデックス作成方法、データ検索方法およびコンピュータ読み取り可能な記録媒体
JP6155920B2 (ja) 多次元範囲検索装置及び多次元範囲検索方法
KR102062139B1 (ko) 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치
Sanchez et al. A multi-resolution approximation for time series
JP5582358B2 (ja) 文書検索システム、文書検索方法、及びプログラム
JP4612469B2 (ja) 漏洩源業務調査システム及び漏洩源業務調査方法
Samet Location specification and representation in multimedia databases
KR100955189B1 (ko) 문서 검색을 위한 서명 데이터 집합 생성 방법 및 시스템
Kim et al. Fast, Flexible Text Search Using Genomic Short‐Read Mapping Model

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181015

R150 Certificate of patent or registration of utility model

Ref document number: 6428615

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150